机械学习专题

机械学习—零基础学习日志(概率论总笔记5)

引言——“黑天鹅” 要获得95%以上置信度的统计结果,需要被统计的对象出现上千次,但是如果整个样本只有几千字,被统计的对象能出现几次就不错了。这样得到的数据可能和真实的概率相差很远。怎么避免“黑天鹅”? 古德-图灵折扣估计法 在词语统计中,有点词语虽然是出现0次,但是实际的出现概率并不是永远不可能的零。 那需要把一些概率转移给到这些词语。 古德的做法实际上就是把出现1次的单词的总量,给了

机械学习—零基础学习日志(概率论总笔记3)

“条件概率”和“本身概率” 对于几乎所有的随机事件来讲,条件概率由于条件的存在,它通常不等于本身的概率。前提条件会影响后续的概率,在一个前提条件下,某个时间发生的概率,我理解,这叫,条件概率。 写成P(事件|条件)的形式。 吴军老师给到的启发:很多人学习别人的经验,用到自己身上就不灵了,原因就是没有搞清楚条件。另一方面,有些原来大家认为不可能做成的事情,一旦条件具备,就成为了大概率事件。

机械学习—零基础学习日志(如何理解概率论12)

假设检验 假设检验是有一些参数,已知条件,让你检验某种假设是否成立。 我们通过具体的题目来说明: 这里我们需要确认使用什么公式: 使用下面的公式如下图: 题目中,以21作为分界线,所以我们将是21与不是21两种对应的数值进行计算。具体计算使用到图中的公式。 算出对应的数值,然后比较大小。 如果不在拒绝域,那么上述检验成立。 《概率论与数理统计期末不挂科|考研

机械学习—零基础学习日志(如何理解概率论10)

数理统计 这里X为总体。x1,x2,x3为样本。具体的取值为样本值。 抽样分布 来一道习题: 回答: 上一道题解析: 《概率论与数理统计期末不挂科|考研零基础入门4小时完整版(王志超)》学习笔记 王志超老师   (UP主)

机械学习—零基础学习日志(如何理解概率论8)

随机变量的协方差与相关系数 来一道练习题: 要先求出,a的数值: 要求联合分布律: 再求期望: 计算相关数值: 最后得到结果: 《概率论与数理统计期末不挂科|考研零基础入门4小时完整版(王志超)》学习笔记 王志超老师   (UP主)

机械学习—零基础学习日志(如何理解概率论7)

这里需要先理解伯努利试验。只有A与A逆,两种结果。 正态分布 再来一道习题~: 解析: 《概率论与数理统计期末不挂科|考研零基础入门4小时完整版(王志超)》学习笔记 王志超老师   (UP主)

机械学习—零基础学习日志(如何理解概率论4)

当已知一个概率,求解另外一个函数的概率。以下是离散型的概率计算方法。 这里是连续型的,已知概念密度,计算对应的另外一个函数的概率。 这里需要求解对应的原始函数。 这里我们做一道练习题。 《概率论与数理统计期末不挂科|考研零基础入门4小时完整版(王志超)》学习笔记 王志超老师   (UP主)

机械学习—零基础学习日志(如何理解概率论3)

随机变量的函数分布 一维随机变量分布,可以看到下图,X为不同情况的概率。而x如果是大于等于X,那么当x在40以内时,没有概率,为0。 当x变大,在40-80之间,那么x大于X的概率为,0.7,所以随着x增大,概率会越来越高。 同时概率是如下图所示,为离散型,间断性增加的。 对于不同类型的,比如离散型,连续型 其概率密度以及概率分布函数的概念 另外讲解分布函数性质:

线性回归例子, 学习笔记[机械学习]

参考书籍, [pythonによる機械学習入門] y = ax + b # 直线的线性回归import numpy as npimport matplotlib.pyplot as plt# 求最小二乘法的回归直线,用到的库from sklearn import linear_model# x 和 y的单点图x = np.random.rand(100, 1)x = x*4-2y

基于逻辑回归实现乳腺癌预测(机械学习与大数据)

基于逻辑回归实现乳腺癌预测 将乳腺癌数据集拆分成训练集和测试集,搭建一个逻辑回归模型,对训练集进行训练,然后分别对训练集和测试集进行预测。输出以下结果: 该模型在训练集上的准确率,在测试集上的准确率、召回率和精确率。 源码 from sklearn.datasets import load_breast_cancerfrom sklearn.linear_model import Logi