本文主要是介绍毕设周记Ⅳ,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
-
高维数据源预处理,对其进行标准化,原始数据均转换为无量纲化指标测评值,消除量纲影响。
-
利用秩和检验对标准化后的基因进行筛选,寻找出较为显著的基因,即p值小于α的基因。筛选出的基因便于后期病患和正常人的分类。目前能够将12,000多个基因筛选出700多个显著性强的基因。
-
这两天在笼统地看分类的方法,类似决策树、贝叶斯分类器、支持向量机的概念和数学原理等等,准备实现分类器。
-
目前的想法是仅是做高斯随机投影矩阵的随机投影,先不考虑稀疏随机矩阵对高维数据进行降维的情况。过程中的其它可变量也先不予以考虑。先将一条路走通之后再去详细考虑每个模块中的可变因素。
-
后面优化提升打算利用ensemble的方法,也就是通过不同的随机投影矩阵(初定3个不同矩阵)对数据进行降维,利用某一确定的分类器对其进行分类标记,依据大数抉择,确定其最终类别。
by gromit
01/21/2016
这篇关于毕设周记Ⅳ的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!