【Rust日报】 2019-05-26:切片索引检查导致的3倍性能下降问题一例

2024-06-23 01:18

本文主要是介绍【Rust日报】 2019-05-26:切片索引检查导致的3倍性能下降问题一例,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

漫游 Tox-rs,第一部分

长文预警。Tox 是一个分布式的P2P,加密传输,易于使用的基于DHT的网络。

Tox 原来是个C项目,作者用Rust通过审视发现,实现里面有不少漏洞,易被攻击。所以他用Rust重写了它。就是上面那个项目地址。现在作者,开始整理这几年的工作,开始生成文档。

Read More

切片索引检查导致的3倍性能下降问题一例

作者发现下面这两片代码:

pub fn insertion_sort(data: &mut [i32]) {for sorted in 0..data.len() {let min = (sorted..data.len()).min_by_key(|&i| &data[i]).unwrap();data.swap(sorted, min);}
}pub fn insertion_sort_fast(data: &mut [i32]) {unsafe {for sorted in 0..data.len() {let min = (sorted..data.len()).min_by_key(|&i| data.get_unchecked(i)).unwrap();std::ptr::swap(data.get_unchecked_mut(sorted), data.get_unchecked_mut(min));}}
}

性能有3倍左右的差距

insertions sort          time:   [551.79 us 553.24 us 555.71 us]                               
insertions sort (fast)   time:   [187.75 us 188.15 us 188.84 us]

很奇怪。于是很多人给他建议。

换种写法,跟unsafe差不多快。

pub fn insertion_sort(data: &mut [i32]) {for sorted in 0..data.len() {let min = data.iter().enumerate().skip(sorted).min_by_key(|(i, e)| *e).unwrap().0;data.swap(sorted, min);}
}

打开 -C opt-level=z 编译标志,按下面方式写:

pub fn insertion_sort_fast(data: &mut [i32]) {let mut data = data;while data.len() > 1 {let (head, tail) = data.split_first_mut().unwrap();let tailmin = tail.iter_mut().min().unwrap();if head > tailmin {std::mem::swap(head, tailmin);}data = tail;}
}

还有一种写法:

pub fn insertion_sort_iter(data: &mut [i32]) {for sorted in 0..data.len() {let min = data[sorted..].iter().enumerate().min_by_key(|&(_, e)| e).unwrap().0;data.swap(sorted, min + sorted);}
}insertions sort (fast) time:  [187.05 us 187.37 us 187.84 us]
insertions sort (iter) time:  [186.87 us 187.30 us 188.00 us]

跟 unsafe 差不多。

Read More

ccl - 据说是目前为止性能最高的并发哈希库

ccl 目前包含一个并发hashmap和一个并发时限缓存,初步的评测很强力。

20k inserts + 20k mut lookups with replace 16C/32T Xeon 2.1Ghz Hetzner CXX51hashbrown_rwlock        time:   [64.199 ms 64.234 ms 64.266 ms]                              chashmap                time:   [15.190 ms 15.220 ms 15.251 ms]                      dhashmap_ccl            time:   [1.0199 ms 1.0244 ms 1.0303 ms]     concache                time:   [126.15 ms 126.61 ms 127.03 ms]   crossbeam-skiplist      time:   [10.648 ms 10.681 ms 10.713 ms]       

Read More
Repo

terminal-typeracer - 终端下的打字竞速游戏

什么,现在还有人喜欢打字比赛?确实有,这不,作者就做了一个打字竞速游戏。看看界面先:

img

代码在这里

Repo

calcify - 3D/4D 矩阵代数库

用于物理模拟。

Repo


From 日报小组 @Mike

日报订阅地址:

独立日报订阅地址:

  • Telgram Channel
  • 阿里云语雀订阅
  • Steemit
  • GitHub

社区学习交流平台订阅:

  • Rust.cc论坛: 支持rss
  • Rust Force: 支持rss
  • 微信公众号:Rust语言学习交流

这篇关于【Rust日报】 2019-05-26:切片索引检查导致的3倍性能下降问题一例的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1085923

相关文章

springboot循环依赖问题案例代码及解决办法

《springboot循环依赖问题案例代码及解决办法》在SpringBoot中,如果两个或多个Bean之间存在循环依赖(即BeanA依赖BeanB,而BeanB又依赖BeanA),会导致Spring的... 目录1. 什么是循环依赖?2. 循环依赖的场景案例3. 解决循环依赖的常见方法方法 1:使用 @La

Python如何使用__slots__实现节省内存和性能优化

《Python如何使用__slots__实现节省内存和性能优化》你有想过,一个小小的__slots__能让你的Python类内存消耗直接减半吗,没错,今天咱们要聊的就是这个让人眼前一亮的技巧,感兴趣的... 目录背景:内存吃得满满的类__slots__:你的内存管理小助手举个大概的例子:看看效果如何?1.

SpringBoot启动报错的11个高频问题排查与解决终极指南

《SpringBoot启动报错的11个高频问题排查与解决终极指南》这篇文章主要为大家详细介绍了SpringBoot启动报错的11个高频问题的排查与解决,文中的示例代码讲解详细,感兴趣的小伙伴可以了解一... 目录1. 依赖冲突:NoSuchMethodError 的终极解法2. Bean注入失败:No qu

MySQL新增字段后Java实体未更新的潜在问题与解决方案

《MySQL新增字段后Java实体未更新的潜在问题与解决方案》在Java+MySQL的开发中,我们通常使用ORM框架来映射数据库表与Java对象,但有时候,数据库表结构变更(如新增字段)后,开发人员可... 目录引言1. 问题背景:数据库与 Java 实体不同步1.1 常见场景1.2 示例代码2. 不同操作

如何解决mysql出现Incorrect string value for column ‘表项‘ at row 1错误问题

《如何解决mysql出现Incorrectstringvalueforcolumn‘表项‘atrow1错误问题》:本文主要介绍如何解决mysql出现Incorrectstringv... 目录mysql出现Incorrect string value for column ‘表项‘ at row 1错误报错

如何解决Spring MVC中响应乱码问题

《如何解决SpringMVC中响应乱码问题》:本文主要介绍如何解决SpringMVC中响应乱码问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Spring MVC最新响应中乱码解决方式以前的解决办法这是比较通用的一种方法总结Spring MVC最新响应中乱码解

pip无法安装osgeo失败的问题解决

《pip无法安装osgeo失败的问题解决》本文主要介绍了pip无法安装osgeo失败的问题解决,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一... 进入官方提供的扩展包下载网站寻找版本适配的whl文件注意:要选择cp(python版本)和你py

Redis中高并发读写性能的深度解析与优化

《Redis中高并发读写性能的深度解析与优化》Redis作为一款高性能的内存数据库,广泛应用于缓存、消息队列、实时统计等场景,本文将深入探讨Redis的读写并发能力,感兴趣的小伙伴可以了解下... 目录引言一、Redis 并发能力概述1.1 Redis 的读写性能1.2 影响 Redis 并发能力的因素二、

解决Java中基于GeoTools的Shapefile读取乱码的问题

《解决Java中基于GeoTools的Shapefile读取乱码的问题》本文主要讨论了在使用Java编程语言进行地理信息数据解析时遇到的Shapefile属性信息乱码问题,以及根据不同的编码设置进行属... 目录前言1、Shapefile属性字段编码的情况:一、Shp文件常见的字符集编码1、System编码

Spring MVC使用视图解析的问题解读

《SpringMVC使用视图解析的问题解读》:本文主要介绍SpringMVC使用视图解析的问题解读,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Spring MVC使用视图解析1. 会使用视图解析的情况2. 不会使用视图解析的情况总结Spring MVC使用视图