一文教你如何利用免费接口在Python中获取并整理基金历史净值数据

2023-10-12 17:10

本文主要是介绍一文教你如何利用免费接口在Python中获取并整理基金历史净值数据,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一文教你如何利用免费接口在Python中获取并整理基金历史净值数据

  • 一、接口地址与格式
  • 二、获取数据与整理

这篇文章教大家如何在Python中使用免费的数据接口获取我们想要的各基金历史净值数据,以便我们进行后续的基金量化分析。

一、接口地址与格式

这里使用的接口地址是https://api.doctorxiong.club/v1/fund/detail?code=xxx,其中xxx为基金对应代号。

这里我们随便选一个例子,比如“公募一哥”张坤的易方达蓝筹精选混合,代号005827,对应的接口地址就是https://api.doctorxiong.club/v1/fund/detail?code=005827

我们用浏览器打开看看,是下面这样的数据格式:
在这里插入图片描述
分析结果,该接口返回的是一个字典,里面的key有"code",“message”,“data”。
其中"data"又是一个字典,里面包括该基金的各种信息和数据的key,比如"code",“name”,"manager"等等;
该基金的历史单位净值和历史累计净值数据就对应于其中的"netWorthData"和"totalNetWorthData"的key里。(大家可以自行观察一下)

二、获取数据与整理

使用到的库:

import urllib
from bs4 import BeautifulSoup
import json
import pandas as pd

先对接口地址发起请求,并利用beautifulsoup解析标签的功能来获取上面所示的文本信息。

>>> html=urllib.urlopen("https://api.doctorxiong.club/v1/fund/detail?code=005827")
>>> bsobj=BeautifulSoup(html.read())
>>> p_text = bsobj.p.get_text()

此时得到的p_text是unicode类型的文本,我们需要利用json将它转换成字典的数据类型。

>>> text_dict = json.loads(p_text)

现在我们来看一下这个字典里是不是有我们刚刚提到的各种key:

>>> print text_dict['data']['code']
005827
>>> print text_dict['data']['name']
易方达蓝筹精选混合
>>> print text_dict['data']['manager']
张坤

然后取出历史单位净值和历史累计净值,每天的数据都是以列表的形式保存,最后一个对象对应着今天的净值情况,我们输出看一看。

>>> Wdata1 = text_dict['data']['netWorthData']
>>> Wdata2 = text_dict['data']['totalNetWorthData']
>>> print Wdata1[-1]
[u'2021-09-10', u'2.5779', u'2.72', u'']
>>> print Wdata2[-1]
[u'2021-09-10', u'2.5779']

因为这个基金没有过分红派息,所以单位净值和累计净值是一样的,都是2.5779。值得注意的是单位净值里还有日涨幅率的数据,也就是上面的2.72。

最后我们把累计净值数据转换成float类型,并整体保存成DataFrame的数据类型。

>>> for i in Wdata2:i[1] = float(i[1])
>>> Wdf = pd.DataFrame(Wdata2,columns=['Date','Worth'],dtype=float)
>>> print WdfDate   Worth
0    2018-09-05  1.0000
1    2018-09-07  0.9986
2    2018-09-14  0.9985
3    2018-09-21  1.0143
4    2018-09-28  1.0192
5    2018-10-08  0.9972
6    2018-10-09  0.9970
7    2018-10-10  0.9885
8    2018-10-11  0.9731
9    2018-10-12  0.9872
10   2018-10-15  0.9820
11   2018-10-16  0.9793
12   2018-10-18  0.9706
13   2018-10-19  0.9855
14   2018-10-22  1.0084
15   2018-10-23  0.9830
16   2018-10-24  0.9748
17   2018-10-25  0.9623
18   2018-10-26  0.9529
19   2018-10-29  0.9246
20   2018-10-30  0.9201
21   2018-10-31  0.9374
22   2018-11-01  0.9503
23   2018-11-02  0.9893
24   2018-11-05  0.9727
25   2018-11-06  0.9686
26   2018-11-07  0.9667
27   2018-11-08  0.9688
28   2018-11-09  0.9602
29   2018-11-12  0.9593
..          ...     ...
680  2021-08-02  2.5664
681  2021-08-03  2.5785
682  2021-08-04  2.5596
683  2021-08-05  2.5337
684  2021-08-06  2.5355
685  2021-08-09  2.5653
686  2021-08-10  2.6544
687  2021-08-11  2.6350
688  2021-08-12  2.5897
689  2021-08-13  2.5887
690  2021-08-16  2.5718
691  2021-08-17  2.4887
692  2021-08-18  2.5224
693  2021-08-19  2.4838
694  2021-08-20  2.4039
695  2021-08-23  2.4548
696  2021-08-24  2.5038
697  2021-08-25  2.5281
698  2021-08-26  2.4635
699  2021-08-27  2.4561
700  2021-08-30  2.4472
701  2021-08-31  2.4386
702  2021-09-01  2.5119
703  2021-09-02  2.5006
704  2021-09-03  2.5057
705  2021-09-06  2.5506
706  2021-09-07  2.5704
707  2021-09-08  2.5484
708  2021-09-09  2.5097
709  2021-09-10  2.5779[710 rows x 2 columns]

最后的最后,,建议把"Date"转换成datetime的类型,这样方便日后放入各种量化框架中进行测试。

>>> Wdf['Date'] = pd.to_datetime(Wdf['Date'],format='%Y-%m-%d')

这篇关于一文教你如何利用免费接口在Python中获取并整理基金历史净值数据的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/197247

相关文章

Python将博客内容html导出为Markdown格式

《Python将博客内容html导出为Markdown格式》Python将博客内容html导出为Markdown格式,通过博客url地址抓取文章,分析并提取出文章标题和内容,将内容构建成html,再转... 目录一、为什么要搞?二、准备如何搞?三、说搞咱就搞!抓取文章提取内容构建html转存markdown

Python获取中国节假日数据记录入JSON文件

《Python获取中国节假日数据记录入JSON文件》项目系统内置的日历应用为了提升用户体验,特别设置了在调休日期显示“休”的UI图标功能,那么问题是这些调休数据从哪里来呢?我尝试一种更为智能的方法:P... 目录节假日数据获取存入jsON文件节假日数据读取封装完整代码项目系统内置的日历应用为了提升用户体验,

微信公众号脚本-获取热搜自动新建草稿并发布文章

《微信公众号脚本-获取热搜自动新建草稿并发布文章》本来想写一个自动化发布微信公众号的小绿书的脚本,但是微信公众号官网没有小绿书的接口,那就写一个获取热搜微信普通文章的脚本吧,:本文主要介绍微信公众... 目录介绍思路前期准备环境要求获取接口token获取热搜获取热搜数据下载热搜图片给图片加上标题文字上传图片

Python FastAPI+Celery+RabbitMQ实现分布式图片水印处理系统

《PythonFastAPI+Celery+RabbitMQ实现分布式图片水印处理系统》这篇文章主要为大家详细介绍了PythonFastAPI如何结合Celery以及RabbitMQ实现简单的分布式... 实现思路FastAPI 服务器Celery 任务队列RabbitMQ 作为消息代理定时任务处理完整

Python Websockets库的使用指南

《PythonWebsockets库的使用指南》pythonwebsockets库是一个用于创建WebSocket服务器和客户端的Python库,它提供了一种简单的方式来实现实时通信,支持异步和同步... 目录一、WebSocket 简介二、python 的 websockets 库安装三、完整代码示例1.

揭秘Python Socket网络编程的7种硬核用法

《揭秘PythonSocket网络编程的7种硬核用法》Socket不仅能做聊天室,还能干一大堆硬核操作,这篇文章就带大家看看Python网络编程的7种超实用玩法,感兴趣的小伙伴可以跟随小编一起... 目录1.端口扫描器:探测开放端口2.简易 HTTP 服务器:10 秒搭个网页3.局域网游戏:多人联机对战4.

使用Python实现快速搭建本地HTTP服务器

《使用Python实现快速搭建本地HTTP服务器》:本文主要介绍如何使用Python快速搭建本地HTTP服务器,轻松实现一键HTTP文件共享,同时结合二维码技术,让访问更简单,感兴趣的小伙伴可以了... 目录1. 概述2. 快速搭建 HTTP 文件共享服务2.1 核心思路2.2 代码实现2.3 代码解读3.

Python使用自带的base64库进行base64编码和解码

《Python使用自带的base64库进行base64编码和解码》在Python中,处理数据的编码和解码是数据传输和存储中非常普遍的需求,其中,Base64是一种常用的编码方案,本文我将详细介绍如何使... 目录引言使用python的base64库进行编码和解码编码函数解码函数Base64编码的应用场景注意

Python基于wxPython和FFmpeg开发一个视频标签工具

《Python基于wxPython和FFmpeg开发一个视频标签工具》在当今数字媒体时代,视频内容的管理和标记变得越来越重要,无论是研究人员需要对实验视频进行时间点标记,还是个人用户希望对家庭视频进行... 目录引言1. 应用概述2. 技术栈分析2.1 核心库和模块2.2 wxpython作为GUI选择的优

go中空接口的具体使用

《go中空接口的具体使用》空接口是一种特殊的接口类型,它不包含任何方法,本文主要介绍了go中空接口的具体使用,具有一定的参考价值,感兴趣的可以了解一下... 目录接口-空接口1. 什么是空接口?2. 如何使用空接口?第一,第二,第三,3. 空接口几个要注意的坑坑1:坑2:坑3:接口-空接口1. 什么是空接