本文主要是介绍【Rust日报】 2019-05-26:切片索引检查导致的3倍性能下降问题一例,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
漫游 Tox-rs,第一部分
长文预警。Tox 是一个分布式的P2P,加密传输,易于使用的基于DHT的网络。
Tox 原来是个C项目,作者用Rust通过审视发现,实现里面有不少漏洞,易被攻击。所以他用Rust重写了它。就是上面那个项目地址。现在作者,开始整理这几年的工作,开始生成文档。
Read More
切片索引检查导致的3倍性能下降问题一例
作者发现下面这两片代码:
pub fn insertion_sort(data: &mut [i32]) {for sorted in 0..data.len() {let min = (sorted..data.len()).min_by_key(|&i| &data[i]).unwrap();data.swap(sorted, min);}
}pub fn insertion_sort_fast(data: &mut [i32]) {unsafe {for sorted in 0..data.len() {let min = (sorted..data.len()).min_by_key(|&i| data.get_unchecked(i)).unwrap();std::ptr::swap(data.get_unchecked_mut(sorted), data.get_unchecked_mut(min));}}
}
性能有3倍左右的差距
insertions sort time: [551.79 us 553.24 us 555.71 us]
insertions sort (fast) time: [187.75 us 188.15 us 188.84 us]
很奇怪。于是很多人给他建议。
换种写法,跟unsafe差不多快。
pub fn insertion_sort(data: &mut [i32]) {for sorted in 0..data.len() {let min = data.iter().enumerate().skip(sorted).min_by_key(|(i, e)| *e).unwrap().0;data.swap(sorted, min);}
}
打开 -C opt-level=z
编译标志,按下面方式写:
pub fn insertion_sort_fast(data: &mut [i32]) {let mut data = data;while data.len() > 1 {let (head, tail) = data.split_first_mut().unwrap();let tailmin = tail.iter_mut().min().unwrap();if head > tailmin {std::mem::swap(head, tailmin);}data = tail;}
}
还有一种写法:
pub fn insertion_sort_iter(data: &mut [i32]) {for sorted in 0..data.len() {let min = data[sorted..].iter().enumerate().min_by_key(|&(_, e)| e).unwrap().0;data.swap(sorted, min + sorted);}
}insertions sort (fast) time: [187.05 us 187.37 us 187.84 us]
insertions sort (iter) time: [186.87 us 187.30 us 188.00 us]
跟 unsafe 差不多。
Read More
ccl - 据说是目前为止性能最高的并发哈希库
ccl 目前包含一个并发hashmap和一个并发时限缓存,初步的评测很强力。
20k inserts + 20k mut lookups with replace 16C/32T Xeon 2.1Ghz Hetzner CXX51hashbrown_rwlock time: [64.199 ms 64.234 ms 64.266 ms] chashmap time: [15.190 ms 15.220 ms 15.251 ms] dhashmap_ccl time: [1.0199 ms 1.0244 ms 1.0303 ms] concache time: [126.15 ms 126.61 ms 127.03 ms] crossbeam-skiplist time: [10.648 ms 10.681 ms 10.713 ms]
Read More
Repo
terminal-typeracer - 终端下的打字竞速游戏
什么,现在还有人喜欢打字比赛?确实有,这不,作者就做了一个打字竞速游戏。看看界面先:
代码在这里
Repo
calcify - 3D/4D 矩阵代数库
用于物理模拟。
Repo
From 日报小组 @Mike
日报订阅地址:
独立日报订阅地址:
- Telgram Channel
- 阿里云语雀订阅
- Steemit
- GitHub
社区学习交流平台订阅:
- Rust.cc论坛: 支持rss
- Rust Force: 支持rss
- 微信公众号:Rust语言学习交流
这篇关于【Rust日报】 2019-05-26:切片索引检查导致的3倍性能下降问题一例的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!