【Rust日报】 2019-05-26:切片索引检查导致的3倍性能下降问题一例

2024-06-23 01:18

本文主要是介绍【Rust日报】 2019-05-26:切片索引检查导致的3倍性能下降问题一例,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

漫游 Tox-rs,第一部分

长文预警。Tox 是一个分布式的P2P,加密传输,易于使用的基于DHT的网络。

Tox 原来是个C项目,作者用Rust通过审视发现,实现里面有不少漏洞,易被攻击。所以他用Rust重写了它。就是上面那个项目地址。现在作者,开始整理这几年的工作,开始生成文档。

Read More

切片索引检查导致的3倍性能下降问题一例

作者发现下面这两片代码:

pub fn insertion_sort(data: &mut [i32]) {for sorted in 0..data.len() {let min = (sorted..data.len()).min_by_key(|&i| &data[i]).unwrap();data.swap(sorted, min);}
}pub fn insertion_sort_fast(data: &mut [i32]) {unsafe {for sorted in 0..data.len() {let min = (sorted..data.len()).min_by_key(|&i| data.get_unchecked(i)).unwrap();std::ptr::swap(data.get_unchecked_mut(sorted), data.get_unchecked_mut(min));}}
}

性能有3倍左右的差距

insertions sort          time:   [551.79 us 553.24 us 555.71 us]                               
insertions sort (fast)   time:   [187.75 us 188.15 us 188.84 us]

很奇怪。于是很多人给他建议。

换种写法,跟unsafe差不多快。

pub fn insertion_sort(data: &mut [i32]) {for sorted in 0..data.len() {let min = data.iter().enumerate().skip(sorted).min_by_key(|(i, e)| *e).unwrap().0;data.swap(sorted, min);}
}

打开 -C opt-level=z 编译标志,按下面方式写:

pub fn insertion_sort_fast(data: &mut [i32]) {let mut data = data;while data.len() > 1 {let (head, tail) = data.split_first_mut().unwrap();let tailmin = tail.iter_mut().min().unwrap();if head > tailmin {std::mem::swap(head, tailmin);}data = tail;}
}

还有一种写法:

pub fn insertion_sort_iter(data: &mut [i32]) {for sorted in 0..data.len() {let min = data[sorted..].iter().enumerate().min_by_key(|&(_, e)| e).unwrap().0;data.swap(sorted, min + sorted);}
}insertions sort (fast) time:  [187.05 us 187.37 us 187.84 us]
insertions sort (iter) time:  [186.87 us 187.30 us 188.00 us]

跟 unsafe 差不多。

Read More

ccl - 据说是目前为止性能最高的并发哈希库

ccl 目前包含一个并发hashmap和一个并发时限缓存,初步的评测很强力。

20k inserts + 20k mut lookups with replace 16C/32T Xeon 2.1Ghz Hetzner CXX51hashbrown_rwlock        time:   [64.199 ms 64.234 ms 64.266 ms]                              chashmap                time:   [15.190 ms 15.220 ms 15.251 ms]                      dhashmap_ccl            time:   [1.0199 ms 1.0244 ms 1.0303 ms]     concache                time:   [126.15 ms 126.61 ms 127.03 ms]   crossbeam-skiplist      time:   [10.648 ms 10.681 ms 10.713 ms]       

Read More
Repo

terminal-typeracer - 终端下的打字竞速游戏

什么,现在还有人喜欢打字比赛?确实有,这不,作者就做了一个打字竞速游戏。看看界面先:

img

代码在这里

Repo

calcify - 3D/4D 矩阵代数库

用于物理模拟。

Repo


From 日报小组 @Mike

日报订阅地址:

独立日报订阅地址:

  • Telgram Channel
  • 阿里云语雀订阅
  • Steemit
  • GitHub

社区学习交流平台订阅:

  • Rust.cc论坛: 支持rss
  • Rust Force: 支持rss
  • 微信公众号:Rust语言学习交流

这篇关于【Rust日报】 2019-05-26:切片索引检查导致的3倍性能下降问题一例的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1085923

相关文章

Java 线程安全与 volatile与单例模式问题及解决方案

《Java线程安全与volatile与单例模式问题及解决方案》文章主要讲解线程安全问题的五个成因(调度随机、变量修改、非原子操作、内存可见性、指令重排序)及解决方案,强调使用volatile关键字... 目录什么是线程安全线程安全问题的产生与解决方案线程的调度是随机的多个线程对同一个变量进行修改线程的修改操

Redis出现中文乱码的问题及解决

《Redis出现中文乱码的问题及解决》:本文主要介绍Redis出现中文乱码的问题及解决,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1. 问题的产生2China编程. 问题的解决redihttp://www.chinasem.cns数据进制问题的解决中文乱码问题解决总结

MySQL之InnoDB存储引擎中的索引用法及说明

《MySQL之InnoDB存储引擎中的索引用法及说明》:本文主要介绍MySQL之InnoDB存储引擎中的索引用法及说明,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐... 目录1、背景2、准备3、正篇【1】存储用户记录的数据页【2】存储目录项记录的数据页【3】聚簇索引【4】二

全面解析MySQL索引长度限制问题与解决方案

《全面解析MySQL索引长度限制问题与解决方案》MySQL对索引长度设限是为了保持高效的数据检索性能,这个限制不是MySQL的缺陷,而是数据库设计中的权衡结果,下面我们就来看看如何解决这一问题吧... 目录引言:为什么会有索引键长度问题?一、问题根源深度解析mysql索引长度限制原理实际场景示例二、五大解决

Springboot如何正确使用AOP问题

《Springboot如何正确使用AOP问题》:本文主要介绍Springboot如何正确使用AOP问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录​一、AOP概念二、切点表达式​execution表达式案例三、AOP通知四、springboot中使用AOP导出

Python中Tensorflow无法调用GPU问题的解决方法

《Python中Tensorflow无法调用GPU问题的解决方法》文章详解如何解决TensorFlow在Windows无法识别GPU的问题,需降级至2.10版本,安装匹配CUDA11.2和cuDNN... 当用以下代码查看GPU数量时,gpuspython返回的是一个空列表,说明tensorflow没有找到

解决未解析的依赖项:‘net.sf.json-lib:json-lib:jar:2.4‘问题

《解决未解析的依赖项:‘net.sf.json-lib:json-lib:jar:2.4‘问题》:本文主要介绍解决未解析的依赖项:‘net.sf.json-lib:json-lib:jar:2.4... 目录未解析的依赖项:‘net.sf.json-lib:json-lib:jar:2.4‘打开pom.XM

IDEA Maven提示:未解析的依赖项的问题及解决

《IDEAMaven提示:未解析的依赖项的问题及解决》:本文主要介绍IDEAMaven提示:未解析的依赖项的问题及解决,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝... 目录IDEA Maven提示:未解析的依编程赖项例如总结IDEA Maven提示:未解析的依赖项例如

MySQL中的索引结构和分类实战案例详解

《MySQL中的索引结构和分类实战案例详解》本文详解MySQL索引结构与分类,涵盖B树、B+树、哈希及全文索引,分析其原理与优劣势,并结合实战案例探讨创建、管理及优化技巧,助力提升查询性能,感兴趣的朋... 目录一、索引概述1.1 索引的定义与作用1.2 索引的基本原理二、索引结构详解2.1 B树索引2.2

Linux如何快速检查服务器的硬件配置和性能指标

《Linux如何快速检查服务器的硬件配置和性能指标》在运维和开发工作中,我们经常需要快速检查Linux服务器的硬件配置和性能指标,本文将以CentOS为例,介绍如何通过命令行快速获取这些关键信息,... 目录引言一、查询CPU核心数编程(几C?)1. 使用 nproc(最简单)2. 使用 lscpu(详细信