为什么,越多的 Python 开发者,都开始学习 Rust 了!

2024-03-11 04:12

本文主要是介绍为什么,越多的 Python 开发者,都开始学习 Rust 了!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

大家好,我是渔夫。

今天分享主题,为什么越来越多的 Python 爱好者,开始逐步地学习 Rust 呢?

Python

Rust 正在逐渐成为高性能 Python 包的首选“后端”主力语言,取代传统的 C。造成这样趋势的原因,大概总结下面几个方面:

  • Python 速度瓶颈: Python 简便易用,上手容易,问题在高性能库和数据处理方面速度较慢,尤其在数据工程和机器学习领域,纯 Python 编写不再适用了,而且未来的AI大模型时代,更加吃不消。

  • AI大模型主导地位: Python 在人工智能和数据分析等领域广泛应用,要求开发者在Python 中编写API,但也需要高性能数据处理。传统上,这导致依赖C语言或其他库。

  • 不满足的解决方案: 以前的方法如将处理外包给 numpy 或 scipy,或学习C语言,但限制较多,特别是在需要向量化函数且无法使用for循环的情况下,受 GIL 限制。

  • C 语言挑战: 虽然很多开发者选择用C编写库并添加Python绑定,但掌握更低级的C编程技能,对于熟悉 Python 的开发者来说可能繁琐,涉及到空指针解引用、缓冲区溢出、内存泄漏等问题,头都大了,搞不了一点。

  • Rust 的登场: Rust 作为快速且内存高效的语言,成为理想的替代选择,天然的高性能、内存安全的,性能上与C/C++语言高性能一致,更重要的是提供现代编程语言的安全性和便利性,摆脱手动内存管理和垃圾收集的困扰。

那么,这样来看,具备 Python 开发者和充满活力的开发者社区,要解决这个痛点,瞄准 Rust 为高性能 Python 包提供更优秀的解决方案,是个不错的选择。

例如,虽然 numpy 用于处理数组,但通过 for 循环逐元素操作,由于GIL的存在,性能可能不如预期的。这个时候,不得不使用更底层的东西如C/C++或者更高性能的语言如 Rust可能会更为合适,因为它们能够更好地处理并行计算,而无需担心GIL的限制。

import numpy as np# 使用for循环逐元素操作
def elementwise_operation(arr):result = np.zeros_like(arr)for i in range(len(arr)):result[i] = arr[i] * 2return result# 创建一个大型数组
data = np.random.rand(1000000)# 进行逐元素操作
result = elementwise_operation(data)

Rust

Rust速度快、内存高效,简化了并行编程,有很出色包管理器 Cargo 工具、友好编译器和活跃的社区。对 Python 开发者来说,学习 Rust 比学C更容易,提供更好的“第一级”体验和平滑学习曲线。

近年来,高性能库纷纷选择 Rust 作为后端,展示了其与 Python 前端结合的卓越性能,很多机器学习库,都是 Rust 来开发。

(1)Polars:它是一个快速、高度并行、内存高效的库,用于处理 DataFrame。

Polars 作者选择Rust作为后端,原因是 Rust 提供最佳工具和正确性保证,特别适用于数据处理领域。 Rust的借用检查器、安全内存使用和并发性使其成为构建低级工具的首选语言,同时对新学习者友好。 Ritchie Vink 总结认为,Rust是一种现代系统语言,具有最好的正确性保证。

(2)Lance:也是一个高性能、低成本的矢量数据库。

选择 Rust 的原因,Lance 创始人 Chang She 和 Lei Xu 解释说,尽管团队有丰富的C开发经验,但选择Rust是为了提高工作效率,避免CMake的烦恼。他们在短短三周内将 Lance从C++重写为Rust,替代了四个月的工作,同时使用 Rus t发布新功能更加自信,避免出现段错误。

Rust 不仅仅用于数据处理,它对于许多其他具有高性能要求的 Python 包来说是一个有用的后端。

(3)**Ruff:**是一个非常快的 Python linter,用 Rust 编写。

Ruff 作者 Charlie Marsh 解释说,Rust 提高了他构建高性能软件的能力,允许在较低级别进行操作而不损失抽象。他认为Rust的成功来自于其工具(Cargo)以及语言和生态系统的可访问性,使得从事系统编程变得更加平易近人,对其作为 Python 和其他高级语言的补充充满期待。

(4)**Pydantic:是一个开发人员友好的Python验证库

Pydantic 团队用 Rust编写了他们的V2,性能提高了20倍。除了速度之外,Rust 还带来了其他好处。Pydantic创始人Samuel Colvin指出,Rust使得编写和维护坚实代码更加容易,特别是它强制捕获并处理每个可能的错误,相较于 Python 和 TypeScript 的类型系统会忽略错误。

参考:

  • https://baincapitalventures.com/insight/why-more-python-developers-are-using-rust-for-building-libraries/

  • https://github.com/pola-rs/polars

  • https://github.com/lancedb/lance

  • https://github.com/astral-sh/ruff

我是渔夫,现在在国内某某云程序员,业余独立开发者,探索副业,生活、技术、非科班转码经验等相关文章,欢迎关注,和渔夫一起成长。

这篇关于为什么,越多的 Python 开发者,都开始学习 Rust 了!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/796604

相关文章

Python中常用的四种取整方式分享

《Python中常用的四种取整方式分享》在数据处理和数值计算中,取整操作是非常常见的需求,Python提供了多种取整方式,本文为大家整理了四种常用的方法,希望对大家有所帮助... 目录引言向零取整(Truncate)向下取整(Floor)向上取整(Ceil)四舍五入(Round)四种取整方式的对比综合示例应

python 3.8 的anaconda下载方法

《python3.8的anaconda下载方法》本文详细介绍了如何下载和安装带有Python3.8的Anaconda发行版,包括Anaconda简介、下载步骤、安装指南以及验证安装结果,此外,还介... 目录python3.8 版本的 Anaconda 下载与安装指南一、Anaconda 简介二、下载 An

Python自动化处理手机验证码

《Python自动化处理手机验证码》手机验证码是一种常见的身份验证手段,广泛应用于用户注册、登录、交易确认等场景,下面我们来看看如何使用Python自动化处理手机验证码吧... 目录一、获取手机验证码1.1 通过短信接收验证码1.2 使用第三方短信接收服务1.3 使用ADB读取手机短信1.4 通过API获取

Rust中的注释使用解读

《Rust中的注释使用解读》本文介绍了Rust中的行注释、块注释和文档注释的使用方法,通过示例展示了如何在实际代码中应用这些注释,以提高代码的可读性和可维护性... 目录Rust 中的注释使用指南1. 行注释示例:行注释2. 块注释示例:块注释3. 文档注释示例:文档注释4. 综合示例总结Rust 中的注释

python安装whl包并解决依赖关系的实现

《python安装whl包并解决依赖关系的实现》本文主要介绍了python安装whl包并解决依赖关系的实现,文中通过图文示例介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面... 目录一、什么是whl文件?二、我们为什么需要使用whl文件来安装python库?三、我们应该去哪儿下

Python脚本实现图片文件批量命名

《Python脚本实现图片文件批量命名》这篇文章主要为大家详细介绍了一个用python第三方库pillow写的批量处理图片命名的脚本,文中的示例代码讲解详细,感兴趣的小伙伴可以了解下... 目录前言源码批量处理图片尺寸脚本源码GUI界面源码打包成.exe可执行文件前言本文介绍一个用python第三方库pi

Rust格式化输出方式总结

《Rust格式化输出方式总结》Rust提供了强大的格式化输出功能,通过std::fmt模块和相关的宏来实现,主要的输出宏包括println!和format!,它们支持多种格式化占位符,如{}、{:?}... 目录Rust格式化输出方式基本的格式化输出格式化占位符Format 特性总结Rust格式化输出方式

Python中多线程和多进程的基本用法详解

《Python中多线程和多进程的基本用法详解》这篇文章介绍了Python中多线程和多进程的相关知识,包括并发编程的优势,多线程和多进程的概念、适用场景、示例代码,线程池和进程池的使用,以及如何选择合适... 目录引言一、并发编程的主要优势二、python的多线程(Threading)1. 什么是多线程?2.

Rust中的Drop特性之解读自动化资源清理的魔法

《Rust中的Drop特性之解读自动化资源清理的魔法》Rust通过Drop特性实现了自动清理机制,确保资源在对象超出作用域时自动释放,避免了手动管理资源时可能出现的内存泄漏或双重释放问题,智能指针如B... 目录自动清理机制:Rust 的析构函数提前释放资源:std::mem::drop android的妙

Python爬虫selenium验证之中文识别点选+图片验证码案例(最新推荐)

《Python爬虫selenium验证之中文识别点选+图片验证码案例(最新推荐)》本文介绍了如何使用Python和Selenium结合ddddocr库实现图片验证码的识别和点击功能,感兴趣的朋友一起看... 目录1.获取图片2.目标识别3.背景坐标识别3.1 ddddocr3.2 打码平台4.坐标点击5.图