[bigdata-121] python科学计算

2024-06-11 09:32

本文主要是介绍[bigdata-121] python科学计算,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

python科学计算,目前用的比较多的库,列一下。用的人多,也就意味着坑少,该踩的坑都被踩完了


1. 数值计算

1.1 numpy

http://www.numpy.org/


1.2 scipy

https://www.scipy.org/


1.3 pandas

http://pandas.pydata.org/


2. 符号计算

sympy


3.绘图

matplot


--------

关于numpy

1.
numpy提供的东西:多维数组以及扩展功能,比如掩码数组和矩阵; 数组的快速操作,包括数据的,逻辑的,改变形状,排序,选择,IO,离散变换,线性代数,随机模拟等等。


1.1 numpy的ndaarray封装同质的数据类型,数据必须是同一类型的; 数据创建时大小固定,改变大小,其实就是创建了新数组。


[1,2,1]是一个数组,rank 1,只有一个axis,这个axis的长度是3,而[[1.,0.,0.],[0.,1.,2.]]是rank 2,第一个axis/dimentsion的长度是2,第二个axis/dimentsion的长度是3。


numpy的数组类是ndararry,也叫做array。numpy.array和python标准库的array.array不同。


ndarray.ndim,几个axis,也就是rank
ndarray.shape,dimensions of array,是一个tuple,比如(3,5),它的长度是rank,也就是ndarry.ndim。


ndarry.size, 数组里有多少个元素,等于shape所有值的乘积。


ndarry.dtype,numpy.int32, numpy.int16, numpy.float64,等等。


ndarray.itemsize, 比如faoat64的itemsize是8, 也就是64/8。


ndarray.data,存放数据的buffer,通常不需要直接使用。




1.2 创建数组
一个二维数据的定义,a = np.arange(15).reshape(3, 5)


一个一维数组的定义,a = np.array([6.,7.,8.])


b = np.array([(1.5,2,3), (4,5,6)])


b = np.array( [ [1,2], [3,4] ], dtype=complex )


b = np.ones( (2,3,4), dtype=np.int16 )np.zeros( (3,4) )


b = np.empty( (2,3) )


b = np.arange( 10, 30, 5 )




1.3 复杂一点的
from numpy import pi
np.linspace( 0, 2, 9 )
x = np.linspace( 0, 2*pi, 100 )
f = np.sin(x)


1.4 相关函数
array, zeros, zeros_like, ones, ones_like, empty, empty_like, arange, linspace, numpy.
random.rand, numpy.random.randn, fromfunction, fromfile


2. 计算
2.1 *和dot不一样,前者是两个数组的元素和元素乘积结果,后者是按照矩阵相乘计算。

2.3 诸多运算函数


3.numpy 基础

强制类型转换,x=np.float32(1.0)   x=np.int_([1.1, 2.2,3.3])


broadcasting: 这个表示,numpy如何处理计算时的shape问题。比如说,在计算中,小的数据要broadcast到更大的数据,以适配shape。比如说,a = np.array([1.,2.,3.]),b = np.array([2.,3.,4.]),那么a*b的结果就是np.array([2.,6.,12.])。对 a = np.array([1.,2.,3.]),b=2.,a*b就是np.array[2.,4.,6.],broadcast将b拉伸成跟a一样的尺寸然后进行计算。


byte-swapping,在存储上,可能会遇到不同的数,在python和c或者操作系统上的存储方式不同,比如大端法或者小端法。

结构数据类型,也就是创建一个包涵不同数据类型的数组,比如:

x=np.array([(1,2.,'hello'),(2,3.,'world') ], dtype=[('foo','i4'), ('bar','f4'), ('bza', 's10')])


更多的细节,可以参考num-ref

-----------------------------------------------------

关于 scipy

scipy的namespace只包含numpy里的函数。scipy是基于numpy的数学算法和便用函数库,比numpy的应用层面更高一些。主要包括,聚类,数学物理方法,快速复立叶变换,积分,插值,线代,图像处理,回归,优化,信号处理,稀疏矩阵,空间数据,统计等等。

-----------------------------------------------------

关于pandas

主要解决如下问题:有标记的数据,多种索引方式,数据集变换,输入数据,高效的内存稀疏数据,移动窗统计。


创建时序数据

s = pd.Series([1,3,5,np.nan,6,8])


创建DataFrame

dates = pd.date_range('20130101', periods=6)

df = pd.DataFrame(np.random.randn(6,4), index=dates, columns=list('ABCD'))

这就是创建了一个label是日期的6行4列的随机数矩阵。


在基于DataFrame上,出现了一大批算法操作函数。






这篇关于[bigdata-121] python科学计算的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1050789

相关文章

Python 字符串占位

在Python中,可以使用字符串的格式化方法来实现字符串的占位。常见的方法有百分号操作符 % 以及 str.format() 方法 百分号操作符 % name = "张三"age = 20message = "我叫%s,今年%d岁。" % (name, age)print(message) # 我叫张三,今年20岁。 str.format() 方法 name = "张三"age

一道经典Python程序样例带你飞速掌握Python的字典和列表

Python中的列表(list)和字典(dict)是两种常用的数据结构,它们在数据组织和存储方面有很大的不同。 列表(List) 列表是Python中的一种有序集合,可以随时添加和删除其中的元素。列表中的元素可以是任何数据类型,包括数字、字符串、其他列表等。列表使用方括号[]表示,元素之间用逗号,分隔。 定义和使用 # 定义一个列表 fruits = ['apple', 'banana

Python应用开发——30天学习Streamlit Python包进行APP的构建(9)

st.area_chart 显示区域图。 这是围绕 st.altair_chart 的语法糖。主要区别在于该命令使用数据自身的列和指数来计算图表的 Altair 规格。因此,在许多 "只需绘制此图 "的情况下,该命令更易于使用,但可定制性较差。 如果 st.area_chart 无法正确猜测数据规格,请尝试使用 st.altair_chart 指定所需的图表。 Function signa

python实现最简单循环神经网络(RNNs)

Recurrent Neural Networks(RNNs) 的模型: 上图中红色部分是输入向量。文本、单词、数据都是输入,在网络里都以向量的形式进行表示。 绿色部分是隐藏向量。是加工处理过程。 蓝色部分是输出向量。 python代码表示如下: rnn = RNN()y = rnn.step(x) # x为输入向量,y为输出向量 RNNs神经网络由神经元组成, python

python 喷泉码

因为要完成毕业设计,毕业设计做的是数据分发与传输的东西。在网络中数据容易丢失,所以我用fountain code做所发送数据包的数据恢复。fountain code属于有限域编码的一部分,有很广泛的应用。 我们日常生活中使用的二维码,就用到foutain code做数据恢复。你遮住二维码的四分之一,用手机的相机也照样能识别。你遮住的四分之一就相当于丢失的数据包。 为了实现并理解foutain

python 点滴学

1 python 里面tuple是无法改变的 tuple = (1,),计算tuple里面只有一个元素,也要加上逗号 2  1 毕业论文改 2 leetcode第一题做出来

Python爬虫-贝壳新房

前言 本文是该专栏的第32篇,后面会持续分享python爬虫干货知识,记得关注。 本文以某房网为例,如下图所示,采集对应城市的新房房源数据。具体实现思路和详细逻辑,笔者将在正文结合完整代码进行详细介绍。接下来,跟着笔者直接往下看正文详细内容。(附带完整代码) 正文 地址:aHR0cHM6Ly93aC5mYW5nLmtlLmNvbS9sb3VwYW4v 目标:采集对应城市的

python 在pycharm下能导入外面的模块,到terminal下就不能导入

项目结构如下,在ic2ctw.py 中导入util,在pycharm下不报错,但是到terminal下运行报错  File "deal_data/ic2ctw.py", line 3, in <module>     import util 解决方案: 暂时方案:在终端下:export PYTHONPATH=/Users/fujingling/PycharmProjects/PSENe

将一维机械振动信号构造为训练集和测试集(Python)

从如下链接中下载轴承数据集。 https://www.sciencedirect.com/science/article/pii/S2352340918314124 import numpy as npimport scipy.io as sioimport matplotlib.pyplot as pltimport statistics as statsimport pandas

Python利用qq邮箱发送通知邮件(已封装成model)

因为经常喜欢写一些脚本、爬虫之类的东西,有需要通知的时候,总是苦于没有太好的通知方式,虽然邮件相对于微信、短信来说,接收性差了一些,但毕竟免费,而且支持html直接渲染,所以,折腾了一个可以直接使用的sendemail模块。这里主要应用的是QQ发邮件,微信关注QQ邮箱后,也可以实时的接收到消息,肾好! 好了,废话不多说,直接上代码。 # encoding: utf-8import lo