每周一书《大数据时代的算法:机器学习、人工智能及其典型实例 》分享!

本文主要是介绍每周一书《大数据时代的算法:机器学习、人工智能及其典型实例 》分享!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

《大数据时代的算法:机器学习、人工智能及其典型实例》介绍在互联网行业中经常涉及的算法,包括排序算法、查找算法、资源分配算法、路径分析算法、相似度分析算法,以及与机器学习相关的算法,包括数据分类算法、聚类算法、预测与估算算法、决策算法、关联规则分析算法及推荐算法。《大数据时代的算法:机器学习、人工智能及其典型实例》涉及的相关算法均为解决实际问题中的主流算法,对于工作和学习都有实际参考意义。《大数据时代的算法:机器学习、人工智能及其典型实例》是一本算法领域内的技术参考书籍,涵盖数十种算法,通过由浅入深的介绍基础算法和机器学习算法相关理论和应用,阐述了各个算法的应用场景及算法复杂度,使读者对算法的理解不只是停留在表面,还从应用的角度提供了大量实例,使读者能够快速、高效进阶各类算法,并能够熟练应用到将来的工作实践中。

目录:

第1章算法基础...................................1

I.I 基础算法分析类型………..…………. I

1.1.l 分治法................................. I

1.1.2 动态规划法......................... 2

1.1.3 回溯法................................. 3

1.1.4 分支限界法…...……………….4

l.1.5 贪心法................................. 4

1.2 算法性能分析….......……………….5

1.3 概率论与数理统计基础………..….6

1.4 距离计算......................................... 8

1.4.1 欧氏距离............................. 8

1.4.2 马氏距离............................. 9

1.4.3 曼哈顿距离......................... 9

1.4.4 切比雪夫距离....…………….. 9

1.4.5 闵氏距离............................. 9

1.4.6 海明距离........................... 10

1.5 排序算法....................................... 10

1.5.1 快速排序........................... 11

1.5.2 归并排序........................... 11

1.5.3 堆排序............................... 13

l.5.4 基数排序........................... 15

1.5.5 外排序............................... 16

1.6 字符压缩编码............................... 17

1.6.1 哈夫曼编码....................... 17

1.6.2 香农-范诺编码…...…….21

1.7 本章小结....................................... 24

第2章数据查找与资源分配算法…....25

2.1 数值查找算法.....…..…..…......... 25

2.1.1 二分搜索算法···········25

2.1.2 分块查找算法…………….. 27

2.1.3 哈希查找算法...………...… 28

2.2 字符串查找算法…...…...……....….. 30

2.2.1 Knuth-Morris-Pratt 算法... 31

2.2.2 Boyer-Moore 算法…….34

2.2.3 Sunday 算法······················37

2.3 海址数据中的查找………...…….... 39

2.3.1 基于布隆过滤器查找…... 39

2.3.2 倒排索弓I查找..............….. 41

2.4 银行家算法................................... 43

2.5 背包问题······································· 44

2.5.1 0-1背包问题.................... 45

2.5.2 部分背包问题………………. 46

2.6 本章小结....................................... 47

第3章路径分析算法......……....…...... 49

3.1 基千Dijkstra算法的路径分析............49

3.1.1 应用示例:极地探险....... 49

3.1.2 基于Dijkstra的最短路径规划............... 50

3.2 基千Floyd算法的路径分析…..... 53

3.2. 1 应用示例:任意两个城

市之间的最短路径............……... 53

3.2.2 Floyd原理........................ 54

3.2.3 基于Floyd算法计算两

个城市最短距离……....….. 56

3.3 基于A*算法的路径搜索……...... 58

3.3.1 应用实例:绕过障碍区

到达目的地....................... 58

3.3.2 A*算法与最短距离计算… 59

3.4 基于维特比算法的概率路径...... 61

3.4.1 应用实例:推断天气状态... 61

3.4.2 维特比算法思想……… 62

3.4.3 计算天气状态..... 62

3.5 最长公共子序列问题…………….. 64

3.5.1 概要................................... 64

3.5.2 最长公共子串………...…… 64

3.5.3 最长公共子序列原理…... 66

3.5.4 实例:求两宇符串的最

长公共子序列……..…...….. 66

3.6 本章小结·······································68

第4章相似度分析算法…..........69

4.1 应用实例:海量网页相似度分析............ 69

4.2 基千Jaccard相似系数的相似

度计算........................................... 70

4.2.1 计算流程........................... 70

4.2.2 狭义Jaccard相似系数..... 71

4.2.3 广义Jaccard相似系数..... 71

4.3 基于MinHash的相似性符法….. 71

4.3.l 与Jaccard相似性关系..... 71

4.3.2 计算网页文本相似性过程............ 72

4.4 向撮空间模型............................... 73

4.4. l 词袋模型....................73

4.4.2 TF-IDF算法…..…...…....….74

4.5 基千余弦相似性算法的相似度

分析············································76

4.5.1 原理基础........................... 76

4.5.2 公式解析························… 77

4.5.3 计算网页文本相似性过程... 77

4.6 基千语义主题模型的相似度

算法............................................... 78

4.7 基于SimHash算法的指纹码....... 80

4.7.1 SimHash弓l入..............….. 81

4.7.2 SimH ash的计算流程…….81

4.7.3 计算重复信息…….....….. 83

4.8 相似度算法的差异性………..….84

4.9 本章小结........................ 85

第5章数据分类算法………………..….86

5.1 基于朴素贝叶斯分类器………..... 86

5.1.1 有监督分类与无监督

分类................................... 87

5.1.2 应用实例:识别车厘子

与樱桃............................... 88

5.1.3 分类流程归纳................... 91

5.1.4 应用扩展:垃圾邮件

识别···································92

5.1.5 常用评价指标................... 96

5.2 基千AdaBoost分类器…………... 100

5.2.1 AdaBoost概述………….. 100

5.2.2 AdaBoost算法具体流程...........101

5.2.3 AdaBoost算法的应用

实例................................. 102

5 .2.4 AdaBoost算法的优点…. 105

5.3 基千支持向扯机的分类器……… 105

5.3.1 线性可分与线性不可分.. 106

5.3.2 感知器·····························107

5.3.3 支持向量机………......…... 108

5.4 基于K邻近算法的分类器…..... 109

5.4.1 应用实例:电影观众

兴趣发现·························109

5.4.2 核心思想......................... 109

5.4.3 电影观众兴趣发现…….. 110

5.5 本章小结..................................... 1 I 3

第6章数据聚类算法…………....…. 115

6.1 基于系统聚类法…...………………. 115

6.1.1 概述................................. 116

6.1.2 最短距离法..................... 117

6.1.3 重心聚类法..................... 119

6.1.4 动态聚类法.................... 120

6.2 基千K-Means聚类算法…..….. 122

6.2.l 应用实例:新闻聚类...............…. 122

6.2.2 逻辑流程......................... 123

6.2.3 实现新闻聚类分析.....…124

6.2.4 K-Means++ ·················]28

6.2.5 K-中心点聚类算法....................…129

6.2.6 ISODATA聚类算法……. 130

6.3 基于密度的DBSCAN算法....... 131

6.4 基于BIRCH算法的聚类分析... 133

6.4.1 聚类特征......................... 133

6.4.2 聚类特征树…...………... 134

6.5 聚类与分类差异……....……….. 135

6.6 本章小结..................................... 136

第7章数据预测与估算算法……….... 137

7.1 产生式模型与判别式模型…..... 137

7.2 基于最大似然估计的预测……... 138

7.3 基千线性回归的估算……………. 140

7.3.1 概要................................. 140

7.3.2 最4、二乘法..................... 141

7.4 基千最大期望算法分析....…..… 143

7.5 基于隐马尔科夫模型预测.....… 144

7.5.J 应用实例:高温天气与

行为概率......................... 144

7.5.2 原理分析......................... 145

7.5.3 高温天气与行为概率….. 147

7.6 基于条件随机场的序列预测….. 151

7.6.1 应用实例......................... 151

7.6.2 原理分析…................ 15 I

7.6.3 条件随机场的优缺点….. 153

7.7 本章小结·····································154

第8章数据决策分析算法……..…….. 155

8.1 基千ID3算法的决策分析....….. 156

8.1.1 信息量............................. 156

8.1.2 信息嫡............................. 156

8.1.3 信息增益......................... 157

8.1.4 ID3算法流程…....…........ 157

8.1.5 ID3算法的应用………….. 157

8.2 基千C4.5算法的分类决策树.. 159

8.2.1 概要................................. 159

8.2.2 应用实例......................... 159

8.3 基于分类回归树的决策划分… 161

8.3.l 概要................................. 162

8.3.2 应用实例: 决策划分..... 163

8.3.3 剪枝................................. 164

8.4 基于随机森林的决策分类.…... 168

8.4.1 随机森林的特点……..….. 169

8.4.2 随机森林的构造方法.…. 169

8.4.3 应用实例: 决定车厘子

的售价层次………………… 170

8.5 本章小结..................................... 172

第9章数据关联规则分析算法…...... 174

9.1 基千Apriori算法的关联项

分析............................................. 174

9.1.1 应用实例:超市的货架

摆放问题......................... 175

9.1.2 基本概要......................... 175

9.1.3 算法原理·························176

9.1.4 有效摆放货架……………. 176

9.2 基于FP-Growth算法的关联性

分析............................................. 179

9.2.1 构建FP树....................... 179

9.2.2 频繁项分析......………….. 181

9.2.3 与Apripri算法比较…. 184

9.3 基于Eclat算法的频繁项集

挖掘............................................. 184

9.4 本章小结..................................... 185

第10章数据推荐算法……………..….. 187

10.1 概要........................................... 187

10.1.1 推荐算法发展…………... 188

10.1.2 协同过泥推荐…...… ·…. 189

10.2 基于Item-Based协同过滤推荐········190

I 0.2.1 Item-Based基本思想.… 190

I 0.2.2 Slope One实例:基于评分推荐······190

10.3 基千User-Based协同过滤推荐........ 193

10.3.1 应用实例:根据人群的推荐............. 194

10.3.2 User-Based与Item-Based对比..... 197

10.4 基于潜在因子算法的推荐... 198

I 0.4. l 应用实例:新闻推荐... 198

10.4.2 流行度与推荐….....…… 200

10.5 推荐算法与效果评价…..……….201

10.6 本章小结···································203

如果想得到下载地址,请访问中科院计算所培训中心官网 http://www.tcict.cn/ 添加官网上的客服微信索取!

这篇关于每周一书《大数据时代的算法:机器学习、人工智能及其典型实例 》分享!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/439277

相关文章

51单片机学习记录———定时器

文章目录 前言一、定时器介绍二、STC89C52定时器资源三、定时器框图四、定时器模式五、定时器相关寄存器六、定时器练习 前言 一个学习嵌入式的小白~ 有问题评论区或私信指出~ 提示:以下是本篇文章正文内容,下面案例可供参考 一、定时器介绍 定时器介绍:51单片机的定时器属于单片机的内部资源,其电路的连接和运转均在单片机内部完成。 定时器作用: 1.用于计数系统,可

问题:第一次世界大战的起止时间是 #其他#学习方法#微信

问题:第一次世界大战的起止时间是 A.1913 ~1918 年 B.1913 ~1918 年 C.1914 ~1918 年 D.1914 ~1919 年 参考答案如图所示

[职场] 护理专业简历怎么写 #经验分享#微信

护理专业简历怎么写   很多想成为一名护理方面的从业者,但是又不知道应该怎么制作一份简历,现在这里分享了一份护理方面的简历模板供大家参考。   蓝山山   年龄:24   号码:12345678910   地址:上海市 邮箱:jianli@jianli.com   教育背景   时间:2011-09到2015-06   学校:蓝山大学   专业:护理学   学历:本科

[word] word设置上标快捷键 #学习方法#其他#媒体

word设置上标快捷键 办公中,少不了使用word,这个是大家必备的软件,今天给大家分享word设置上标快捷键,希望在办公中能帮到您! 1、添加上标 在录入一些公式,或者是化学产品时,需要添加上标内容,按下快捷键Ctrl+shift++就能将需要的内容设置为上标符号。 word设置上标快捷键的方法就是以上内容了,需要的小伙伴都可以试一试呢!

AssetBundle学习笔记

AssetBundle是unity自定义的资源格式,通过调用引擎的资源打包接口对资源进行打包成.assetbundle格式的资源包。本文介绍了AssetBundle的生成,使用,加载,卸载以及Unity资源更新的一个基本步骤。 目录 1.定义: 2.AssetBundle的生成: 1)设置AssetBundle包的属性——通过编辑器界面 补充:分组策略 2)调用引擎接口API

Javascript高级程序设计(第四版)--学习记录之变量、内存

原始值与引用值 原始值:简单的数据即基础数据类型,按值访问。 引用值:由多个值构成的对象即复杂数据类型,按引用访问。 动态属性 对于引用值而言,可以随时添加、修改和删除其属性和方法。 let person = new Object();person.name = 'Jason';person.age = 42;console.log(person.name,person.age);//'J

大学湖北中医药大学法医学试题及答案,分享几个实用搜题和学习工具 #微信#学习方法#职场发展

今天分享拥有拍照搜题、文字搜题、语音搜题、多重搜题等搜题模式,可以快速查找问题解析,加深对题目答案的理解。 1.快练题 这是一个网站 找题的网站海量题库,在线搜题,快速刷题~为您提供百万优质题库,直接搜索题库名称,支持多种刷题模式:顺序练习、语音听题、本地搜题、顺序阅读、模拟考试、组卷考试、赶快下载吧! 2.彩虹搜题 这是个老公众号了 支持手写输入,截图搜题,详细步骤,解题必备

swiper实例

大家好,我是燐子,今天给大家带来swiper实例   微信小程序中的 swiper 组件是一种用于创建滑动视图的容器组件,常用于实现图片轮播、广告展示等效果。它通过一系列的子组件 swiper-item 来定义滑动视图的每一个页面。 基本用法   以下是一个简单的 swiper 示例代码:   WXML(页面结构) <swiper autoplay="true" interval="3

Java面试题:通过实例说明内连接、左外连接和右外连接的区别

在 SQL 中,连接(JOIN)用于在多个表之间组合行。最常用的连接类型是内连接(INNER JOIN)、左外连接(LEFT OUTER JOIN)和右外连接(RIGHT OUTER JOIN)。它们的主要区别在于它们如何处理表之间的匹配和不匹配行。下面是每种连接的详细说明和示例。 表示例 假设有两个表:Customers 和 Orders。 Customers CustomerIDCus

《offer来了》第二章学习笔记

1.集合 Java四种集合:List、Queue、Set和Map 1.1.List:可重复 有序的Collection ArrayList: 基于数组实现,增删慢,查询快,线程不安全 Vector: 基于数组实现,增删慢,查询快,线程安全 LinkedList: 基于双向链实现,增删快,查询慢,线程不安全 1.2.Queue:队列 ArrayBlockingQueue: