【Rust日报】 2019-05-26:切片索引检查导致的3倍性能下降问题一例

2024-06-23 01:18

本文主要是介绍【Rust日报】 2019-05-26:切片索引检查导致的3倍性能下降问题一例,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

漫游 Tox-rs,第一部分

长文预警。Tox 是一个分布式的P2P,加密传输,易于使用的基于DHT的网络。

Tox 原来是个C项目,作者用Rust通过审视发现,实现里面有不少漏洞,易被攻击。所以他用Rust重写了它。就是上面那个项目地址。现在作者,开始整理这几年的工作,开始生成文档。

Read More

切片索引检查导致的3倍性能下降问题一例

作者发现下面这两片代码:

pub fn insertion_sort(data: &mut [i32]) {for sorted in 0..data.len() {let min = (sorted..data.len()).min_by_key(|&i| &data[i]).unwrap();data.swap(sorted, min);}
}pub fn insertion_sort_fast(data: &mut [i32]) {unsafe {for sorted in 0..data.len() {let min = (sorted..data.len()).min_by_key(|&i| data.get_unchecked(i)).unwrap();std::ptr::swap(data.get_unchecked_mut(sorted), data.get_unchecked_mut(min));}}
}

性能有3倍左右的差距

insertions sort          time:   [551.79 us 553.24 us 555.71 us]                               
insertions sort (fast)   time:   [187.75 us 188.15 us 188.84 us]

很奇怪。于是很多人给他建议。

换种写法,跟unsafe差不多快。

pub fn insertion_sort(data: &mut [i32]) {for sorted in 0..data.len() {let min = data.iter().enumerate().skip(sorted).min_by_key(|(i, e)| *e).unwrap().0;data.swap(sorted, min);}
}

打开 -C opt-level=z 编译标志,按下面方式写:

pub fn insertion_sort_fast(data: &mut [i32]) {let mut data = data;while data.len() > 1 {let (head, tail) = data.split_first_mut().unwrap();let tailmin = tail.iter_mut().min().unwrap();if head > tailmin {std::mem::swap(head, tailmin);}data = tail;}
}

还有一种写法:

pub fn insertion_sort_iter(data: &mut [i32]) {for sorted in 0..data.len() {let min = data[sorted..].iter().enumerate().min_by_key(|&(_, e)| e).unwrap().0;data.swap(sorted, min + sorted);}
}insertions sort (fast) time:  [187.05 us 187.37 us 187.84 us]
insertions sort (iter) time:  [186.87 us 187.30 us 188.00 us]

跟 unsafe 差不多。

Read More

ccl - 据说是目前为止性能最高的并发哈希库

ccl 目前包含一个并发hashmap和一个并发时限缓存,初步的评测很强力。

20k inserts + 20k mut lookups with replace 16C/32T Xeon 2.1Ghz Hetzner CXX51hashbrown_rwlock        time:   [64.199 ms 64.234 ms 64.266 ms]                              chashmap                time:   [15.190 ms 15.220 ms 15.251 ms]                      dhashmap_ccl            time:   [1.0199 ms 1.0244 ms 1.0303 ms]     concache                time:   [126.15 ms 126.61 ms 127.03 ms]   crossbeam-skiplist      time:   [10.648 ms 10.681 ms 10.713 ms]       

Read More
Repo

terminal-typeracer - 终端下的打字竞速游戏

什么,现在还有人喜欢打字比赛?确实有,这不,作者就做了一个打字竞速游戏。看看界面先:

img

代码在这里

Repo

calcify - 3D/4D 矩阵代数库

用于物理模拟。

Repo


From 日报小组 @Mike

日报订阅地址:

独立日报订阅地址:

  • Telgram Channel
  • 阿里云语雀订阅
  • Steemit
  • GitHub

社区学习交流平台订阅:

  • Rust.cc论坛: 支持rss
  • Rust Force: 支持rss
  • 微信公众号:Rust语言学习交流

这篇关于【Rust日报】 2019-05-26:切片索引检查导致的3倍性能下降问题一例的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1085923

相关文章

Vue3 的 shallowRef 和 shallowReactive:优化性能

大家对 Vue3 的 ref 和 reactive 都很熟悉,那么对 shallowRef 和 shallowReactive 是否了解呢? 在编程和数据结构中,“shallow”(浅层)通常指对数据结构的最外层进行操作,而不递归地处理其内部或嵌套的数据。这种处理方式关注的是数据结构的第一层属性或元素,而忽略更深层次的嵌套内容。 1. 浅层与深层的对比 1.1 浅层(Shallow) 定义

性能测试介绍

性能测试是一种测试方法,旨在评估系统、应用程序或组件在现实场景中的性能表现和可靠性。它通常用于衡量系统在不同负载条件下的响应时间、吞吐量、资源利用率、稳定性和可扩展性等关键指标。 为什么要进行性能测试 通过性能测试,可以确定系统是否能够满足预期的性能要求,找出性能瓶颈和潜在的问题,并进行优化和调整。 发现性能瓶颈:性能测试可以帮助发现系统的性能瓶颈,即系统在高负载或高并发情况下可能出现的问题

好题——hdu2522(小数问题:求1/n的第一个循环节)

好喜欢这题,第一次做小数问题,一开始真心没思路,然后参考了网上的一些资料。 知识点***********************************无限不循环小数即无理数,不能写作两整数之比*****************************(一开始没想到,小学没学好) 此题1/n肯定是一个有限循环小数,了解这些后就能做此题了。 按照除法的机制,用一个函数表示出来就可以了,代码如下

hdu1043(八数码问题,广搜 + hash(实现状态压缩) )

利用康拓展开将一个排列映射成一个自然数,然后就变成了普通的广搜题。 #include<iostream>#include<algorithm>#include<string>#include<stack>#include<queue>#include<map>#include<stdio.h>#include<stdlib.h>#include<ctype.h>#inclu

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

安卓链接正常显示,ios#符被转义%23导致链接访问404

原因分析: url中含有特殊字符 中文未编码 都有可能导致URL转换失败,所以需要对url编码处理  如下: guard let allowUrl = webUrl.addingPercentEncoding(withAllowedCharacters: .urlQueryAllowed) else {return} 后面发现当url中有#号时,会被误伤转义为%23,导致链接无法访问

购买磨轮平衡机时应该注意什么问题和技巧

在购买磨轮平衡机时,您应该注意以下几个关键点: 平衡精度 平衡精度是衡量平衡机性能的核心指标,直接影响到不平衡量的检测与校准的准确性,从而决定磨轮的振动和噪声水平。高精度的平衡机能显著减少振动和噪声,提高磨削加工的精度。 转速范围 宽广的转速范围意味着平衡机能够处理更多种类的磨轮,适应不同的工作条件和规格要求。 振动监测能力 振动监测能力是评估平衡机性能的重要因素。通过传感器实时监

黑神话,XSKY 星飞全闪单卷性能突破310万

当下,云计算仍然是企业主要的基础架构,随着关键业务的逐步虚拟化和云化,对于块存储的性能要求也日益提高。企业对于低延迟、高稳定性的存储解决方案的需求日益迫切。为了满足这些日益增长的 IO 密集型应用场景,众多云服务提供商正在不断推陈出新,推出具有更低时延和更高 IOPS 性能的云硬盘产品。 8 月 22 日 2024 DTCC 大会上(第十五届中国数据库技术大会),XSKY星辰天合正式公布了基于星

缓存雪崩问题

缓存雪崩是缓存中大量key失效后当高并发到来时导致大量请求到数据库,瞬间耗尽数据库资源,导致数据库无法使用。 解决方案: 1、使用锁进行控制 2、对同一类型信息的key设置不同的过期时间 3、缓存预热 1. 什么是缓存雪崩 缓存雪崩是指在短时间内,大量缓存数据同时失效,导致所有请求直接涌向数据库,瞬间增加数据库的负载压力,可能导致数据库性能下降甚至崩溃。这种情况往往发生在缓存中大量 k

6.1.数据结构-c/c++堆详解下篇(堆排序,TopK问题)

上篇:6.1.数据结构-c/c++模拟实现堆上篇(向下,上调整算法,建堆,增删数据)-CSDN博客 本章重点 1.使用堆来完成堆排序 2.使用堆解决TopK问题 目录 一.堆排序 1.1 思路 1.2 代码 1.3 简单测试 二.TopK问题 2.1 思路(求最小): 2.2 C语言代码(手写堆) 2.3 C++代码(使用优先级队列 priority_queue)