每周一书《Python机器学习实践指南 附随书代码》分享!

2023-12-01 01:18

本文主要是介绍每周一书《Python机器学习实践指南 附随书代码》分享!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

机器学习是近年来渐趋热门的一个领域,同时Python 语言经过一段时间的发展也已逐渐成为主流的编程语言之一。Python机器学习实践指南结合了机器学习和Python 语言两个热门的领域,通过利用两种核心的机器学习算法来将Python 语言在数据分析方面的优势发挥到极致。

全书共有10 章。第1 章讲解了Python 机器学习的生态系统,剩余9 章介绍了众多与机器学习相关的算法,包括各类分类算法、数据可视化技术、推荐引擎等,主要包括机器学习在公寓、机票、IPO 市场、新闻源、内容推广、股票市场、图像、聊天机器人和推荐引擎等方面的应用。

本书适合Python 程序员、数据分析人员、对算法感兴趣的读者、机器学习领域的从业人员及科研人员阅读。

目录

第1 章Python 机器学习的生态系统······1

1.1 数据科学/机器学习的工作

流程 ··································2

1.1.1 获取··························2

1.1.2 检查和探索·················2

1.1.3 清理和准备·················3

1.1.4 建模··························3

1.1.5 评估··························3

1.1.6 部署··························3

1.2 Python 库和功能···················3

1.2.1 获取··························4

1.2.2 检查··························4

1.2.3 准备························20

1.2.4 建模和评估···············26

1.2.5 部署························34

1.3 设置机器学习的环境···········34

1.4 小结·································34

第2 章构建应用程序,发现低价的

公寓·············································35

2.1 获取公寓房源数据··············36

使用import.io 抓取房源

数据 ·································36

2.2 检查和准备数据·················38

2.2.1 分析数据···················46

2.2.2 可视化数据················50

2.3 对数据建模························51

2.3.1 预测·························54

2.3.2 扩展模型···················57

2.4 小结·································57

第3 章构建应用程序,发现低价的

机票··································58

3.1 获取机票价格数据···············59

3.2 使用高级的网络爬虫技术

检索票价数据·····················60

3.3 解析DOM 以提取定价数据····62

通过聚类技术识别

异常的票价·························66

3.4 使用IFTTT 发送实时提醒······75

3.5 整合在一起························78

3.6 小结·································82

第4 章使用逻辑回归预测IPO 市场·······83

4.1 IPO 市场····························84

4.1.1 什么是IPO ················84

4.1.2 近期IPO 市场表现·······84

4.1.3 基本的IPO 策略··········93

4.2 特征工程···························94

4.3 二元分类··························103

4.4 特征的重要性···················108

4.5 小结································111

第5 章创建自定义的新闻源··············112

5.1 使用Pocket 应用程序,创建一个

监督训练的集合················112

5.1.1 安装Pocket 的Chrome

扩展程序·················113

5.1.2 使用Pocket API 来检索

故事·······················114

5.2 使用embed.ly API 下载故事的

内容 ·······························119

5.3 自然语言处理基础·············120

5.4 支持向量机·······················123

5.5 IFTTT 与文章源、Google 表单

和电子邮件的集成·············125

通过IFTTT 设置新闻源

和 Google 表单···················125

5.6 设置你的每日个性化

新闻简报·························133

5.7 小结································137

第6 章预测你的内容是否会广为

流传································138

6.1 关于病毒性,研究告诉我们了

些什么 ····························139

6.2 获取分享的数量和内容·········140

6.3 探索传播性的特征·············149

6.3.1 探索图像数据···········149

6.3.2 探索标题·················152

6.3.3 探索故事的内容········156

6.4 构建内容评分的预测模型····157

6.5 小结································162

第7 章使用机器学习预测股票市场·······163

7.1 市场分析的类型················164

7.2 关于股票市场,研究告诉

我们些什么······················165

7.3 如何开发一个交易策略·······166

7.3.1 延长我们的分析

周期·······················172

7.3.2 使用支持向量回归,

构建我们的模型········175

7.3.3 建模与动态时间扭曲····182

7.4 小结·······························186

第8 章建立图像相似度的引擎···········187

8.1 图像的机器学习················188

8.2 处理图像·························189

8.3 查找相似的图像················191

8.4 了解深度学习···················195

8.5 构建图像相似度的引擎·······198

8.6 小结·······························206

第9 章打造聊天机器人····················207

9.1 图灵测试·························207

9.2 聊天机器人的历史················208

9.3 聊天机器人的设计·············212

9.4 打造一个聊天机器人··········217

9.5 小结·······························227

第10 章构建推荐引擎·····················228

10.1 协同过滤························229

10.1.1 基于用户的过滤······230

10.1.2 基于项目的过滤······233

10.2 基于内容的过滤···············236

10.3 混合系统························237

10.4 构建推荐引擎··················238

10.5 小结······························251

如果想得到下载地址,请微信搜索关注“中科院计算所培训中心”公众号,回复“机器学习”自动获取下载地址;或者添加中科院计算所培训中心助教微信号“tcict1987”,帮助进入中科院IT技术分享群,群里有地址分享。

这篇关于每周一书《Python机器学习实践指南 附随书代码》分享!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/439276

相关文章

Oracle查询优化之高效实现仅查询前10条记录的方法与实践

《Oracle查询优化之高效实现仅查询前10条记录的方法与实践》:本文主要介绍Oracle查询优化之高效实现仅查询前10条记录的相关资料,包括使用ROWNUM、ROW_NUMBER()函数、FET... 目录1. 使用 ROWNUM 查询2. 使用 ROW_NUMBER() 函数3. 使用 FETCH FI

Python脚本实现自动删除C盘临时文件夹

《Python脚本实现自动删除C盘临时文件夹》在日常使用电脑的过程中,临时文件夹往往会积累大量的无用数据,占用宝贵的磁盘空间,下面我们就来看看Python如何通过脚本实现自动删除C盘临时文件夹吧... 目录一、准备工作二、python脚本编写三、脚本解析四、运行脚本五、案例演示六、注意事项七、总结在日常使用

Python将大量遥感数据的值缩放指定倍数的方法(推荐)

《Python将大量遥感数据的值缩放指定倍数的方法(推荐)》本文介绍基于Python中的gdal模块,批量读取大量多波段遥感影像文件,分别对各波段数据加以数值处理,并将所得处理后数据保存为新的遥感影像... 本文介绍基于python中的gdal模块,批量读取大量多波段遥感影像文件,分别对各波段数据加以数值处

python管理工具之conda安装部署及使用详解

《python管理工具之conda安装部署及使用详解》这篇文章详细介绍了如何安装和使用conda来管理Python环境,它涵盖了从安装部署、镜像源配置到具体的conda使用方法,包括创建、激活、安装包... 目录pytpshheraerUhon管理工具:conda部署+使用一、安装部署1、 下载2、 安装3

Python进阶之Excel基本操作介绍

《Python进阶之Excel基本操作介绍》在现实中,很多工作都需要与数据打交道,Excel作为常用的数据处理工具,一直备受人们的青睐,本文主要为大家介绍了一些Python中Excel的基本操作,希望... 目录概述写入使用 xlwt使用 XlsxWriter读取修改概述在现实中,很多工作都需要与数据打交

在C#中获取端口号与系统信息的高效实践

《在C#中获取端口号与系统信息的高效实践》在现代软件开发中,尤其是系统管理、运维、监控和性能优化等场景中,了解计算机硬件和网络的状态至关重要,C#作为一种广泛应用的编程语言,提供了丰富的API来帮助开... 目录引言1. 获取端口号信息1.1 获取活动的 TCP 和 UDP 连接说明:应用场景:2. 获取硬

使用Python实现在Word中添加或删除超链接

《使用Python实现在Word中添加或删除超链接》在Word文档中,超链接是一种将文本或图像连接到其他文档、网页或同一文档中不同部分的功能,本文将为大家介绍一下Python如何实现在Word中添加或... 在Word文档中,超链接是一种将文本或图像连接到其他文档、网页或同一文档中不同部分的功能。通过添加超

Golang操作DuckDB实战案例分享

《Golang操作DuckDB实战案例分享》DuckDB是一个嵌入式SQL数据库引擎,它与众所周知的SQLite非常相似,但它是为olap风格的工作负载设计的,DuckDB支持各种数据类型和SQL特性... 目录DuckDB的主要优点环境准备初始化表和数据查询单行或多行错误处理和事务完整代码最后总结Duck

Java内存泄漏问题的排查、优化与最佳实践

《Java内存泄漏问题的排查、优化与最佳实践》在Java开发中,内存泄漏是一个常见且令人头疼的问题,内存泄漏指的是程序在运行过程中,已经不再使用的对象没有被及时释放,从而导致内存占用不断增加,最终... 目录引言1. 什么是内存泄漏?常见的内存泄漏情况2. 如何排查 Java 中的内存泄漏?2.1 使用 J

Python MySQL如何通过Binlog获取变更记录恢复数据

《PythonMySQL如何通过Binlog获取变更记录恢复数据》本文介绍了如何使用Python和pymysqlreplication库通过MySQL的二进制日志(Binlog)获取数据库的变更记录... 目录python mysql通过Binlog获取变更记录恢复数据1.安装pymysqlreplicat