本文主要是介绍衡量变量之间的关系,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
2018/11/22
以往理解的变量之间的关系,都是在数理统计的那个里面,针对相关不相关而言的,这个概念有时候让我感觉有点模糊,我也说不出来为啥, 就是感觉有点模糊。
前段时间把连续性变量之间的这个关系看了一下,其中就提到了相关度(英文是correlation,或者相关系数,它的一个量化),这个概念仅仅使用于线性的关系,这是我很长一段时间都弄错了的概念。那么如果是非线性的线性,又将如何来评判这个关系;而且,可能我第一个问题需要考虑的就是,怎么样评判他们是不是线性的。
关于如何评判非线性的关系。
具体的网址: https://machinelearningmastery.com/statistical-hypothesis-tests-in-python-cheat-sheet/
不过,看完之后感觉意义并不大。 (不过这个东西倒是让我感觉到了这个机器学习中统计学的作用。)
我觉得非线性的关系,应该也算是一个比较重点的内容。他们的变化关系和评判标准,与线性的要有一定差距。另外,我突然想到的一个名词就是独立这个概念。
再反过来仔细想想,变量之间的关系,我还是没有弄明白,我本来希望的从这部分内容获取到的知识是,
上面这句话,说的不对。我可能理解到那个层次了,但是没表述对。我最开始的时候,想得到的东西,就是变量之间的关系。
啊,我想起来了,我当时的一个想法是,我想比较输入变量之间的关系。
2018/11/22
今天看了类别型(妈的,这种变量的名字想不起来了。),书里的内容并不是我想要的内容,不对不对, 要不就是我没理解对。
就是他主要描述的就是关联性,还是得理解理解。
而且这部分内容比较的是两个都是类别型变量之间的关系,可能我还需要一个方式来比较数值型变量和类别行变量之间的关系。
2018/11/24
上面的部分都搞错了,搞错了我一直以来想要的东西,而不是说上面的内容错了。我想要的是,输入变量之间的关系,想从这个角度来入手解决特征选择的问题。
不过,今天看了一个文章,虽然整体上这个文章说的也是输入与输出之间的关系,但也反过来也让我有一个想法,输入变量与输出变量之间的关系,同样适用于两个都是输入的变量。
上面图片下面的那个网址,可以提供给我很多思路。
这部分的话,看来需要系统的学习一下,然后整理好,但需要时间。
How to Use Correlation to Understand the Relationship Between Variables
这个网址其实是我通过搜索“relationship of input variables”而得到的,而且的确搜索结果里面很少出现跟我相关的,即使有,也的确是这么个关系,看来我刚刚对比的想法是对的。
2018/11/26
机器学习前期的数据预处理过程中,需要对变量进行一系列的操作,包括降维什么的,这些属于实际应用的过程。我需要将这些实际应用的过程与上述那些内容都关联起来。
2018/11/27
如果是两个输入变量相关的话,那么他们会不会对这个输入有影响;我记得好像是降维的部分对这个内容有过说法。那么如果不用降维的方法,整体上对算法的效果有什么影响。
2018/11/27
以前弄搞错方向了,总觉得有什么高深的东西在这个变量的关系身上,然后基础的东西也没仔细看。其实没那么麻烦,都是一点一点进阶的。
这篇关于衡量变量之间的关系的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!