基因表达微阵列数据分类的多目标启发式算法

2024-05-09 00:58

本文主要是介绍基因表达微阵列数据分类的多目标启发式算法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

#引用

##LaTex

@article{LV201613,
title = “A multi-objective heuristic algorithm for gene expression microarray data classification”,
journal = “Expert Systems with Applications”,
volume = “59”,
pages = “13 - 19”,
year = “2016”,
issn = “0957-4174”,
doi = “https://doi.org/10.1016/j.eswa.2016.04.020”,
url = “http://www.sciencedirect.com/science/article/pii/S0957417416301865”,
author = “Jia Lv and Qinke Peng and Xiao Chen and Zhi Sun”,
keywords = “Microarray, Gene selection, Small number of selected genes, Multi-objective, Heuristic algorithm”
}

##Normal

Jia Lv, Qinke Peng, Xiao Chen, Zhi Sun,
A multi-objective heuristic algorithm for gene expression microarray data classification,
Expert Systems with Applications,
Volume 59,
2016,
Pages 13-19,
ISSN 0957-4174,
https://doi.org/10.1016/j.eswa.2016.04.020.
(http://www.sciencedirect.com/science/article/pii/S0957417416301865)
Keywords: Microarray; Gene selection; Small number of selected genes; Multi-objective; Heuristic algorithm


#摘要

Microarray data 微阵列数据
analytic hierarchy process (AHP)
Univariate Marginal Distribution Algorithm

the fewer the selected genes are, the less cost the disease prognosis expert system is.


#主要内容


##1 特征预选择

a filter-based gene ranking algorithm — mRMR:
特征与类之间的相关性(max-relevance 最大相关)
特征之间的冗余度(min-redundancy 最小冗余)

这里写图片描述

单个特征的性能
为防止丢失在组中表现好的特征,选300个特征


##2 多目标模型

这里写图片描述


##3 MOEDA

多目标the estimation of distribution algorithm (EDA) — MOEDA

elite individuals ( EIs )
regenerated individuals ( RIs )

probabilistic model:

这里写图片描述

classification accuracy (ACC)
the number of selected features (NSF)

Higher and fewer rule. (HFR)
ACC绝对比NSF重要

  • 根据ACC对个体排序
  • 对于相同ACC,根据NSF排序

Forcibly decrease rule. (FDR)
随着演化的进行,计算NSF的上限 — U L l UL^l ULl(逐渐降低)
N L l = q 2 ⌊ l w ⌋ NL^l = \frac{q}{2^{\left\lfloor\frac{l}{w}\right\rfloor}} NLl=2wlq
l l l — 代数
q q q — 预选择的特征数目
w w w — 常数

每个特征对应一个选择概率

mutation rules — 防止落入局部最优
the elite reserved strategy — 防止最优个体丢失

SVM + the radial basis function (RBF)
SVM-RBF
参数: c c c γ \gamma γ

同时优化参数与特征

这里写图片描述

参数计算

这里写图片描述

p ∈ { c , γ } p \in \left\{ c, \gamma \right\} p{c,γ}
max ⁡ p \max_p maxp — 参数最大值
min ⁡ p \min_p minp — 参数最小值
d d d — 二进制字符串的十进制值
l p l_p lp — 二进制字符串的长度
l c = l γ = 25 l_c = l_\gamma = 25 lc=lγ=25
max ⁡ c = 256 \max_c = 256 maxc=256
max ⁡ γ = 16 \max_\gamma = 16 maxγ=16


#4 试验

这里写图片描述

10-fold cross validation

‘the N best features are always not the best N features’.

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

这篇关于基因表达微阵列数据分类的多目标启发式算法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/971944

相关文章

【服务器运维】MySQL数据存储至数据盘

查看磁盘及分区 [root@MySQL tmp]# fdisk -lDisk /dev/sda: 21.5 GB, 21474836480 bytes255 heads, 63 sectors/track, 2610 cylindersUnits = cylinders of 16065 * 512 = 8225280 bytesSector size (logical/physical)

代码随想录算法训练营:12/60

非科班学习算法day12 | LeetCode150:逆波兰表达式 ,Leetcode239: 滑动窗口最大值  目录 介绍 一、基础概念补充: 1.c++字符串转为数字 1. std::stoi, std::stol, std::stoll, std::stoul, std::stoull(最常用) 2. std::stringstream 3. std::atoi, std

人工智能机器学习算法总结神经网络算法(前向及反向传播)

1.定义,意义和优缺点 定义: 神经网络算法是一种模仿人类大脑神经元之间连接方式的机器学习算法。通过多层神经元的组合和激活函数的非线性转换,神经网络能够学习数据的特征和模式,实现对复杂数据的建模和预测。(我们可以借助人类的神经元模型来更好的帮助我们理解该算法的本质,不过这里需要说明的是,虽然名字是神经网络,并且结构等等也是借鉴了神经网络,但其原型以及算法本质上还和生物层面的神经网络运行原理存在

雨量传感器的分类和选型建议

物理原理分类 机械降雨量计(雨量桶):最早使用的降雨量传感器,通过漏斗收集雨水并记录。主要用于长期降雨统计,故障率较低。电容式降雨量传感器:基于两个电极之间的电容变化来计算降雨量。当降雨时,水滴堵住电极空间,改变电容值,从而计算降雨量。超声波式降雨量传感器:利用超声波的反射来计算降雨量。适用于大降雨量的场合。激光雷达式降雨量传感器:利用激光技术测量雨滴的速度、大小和形状等参数,并计算降雨量。主

SQL Server中,查询数据库中有多少个表,以及数据库其余类型数据统计查询

sqlserver查询数据库中有多少个表 sql server 数表:select count(1) from sysobjects where xtype='U'数视图:select count(1) from sysobjects where xtype='V'数存储过程select count(1) from sysobjects where xtype='P' SE

【第十三课】区域经济可视化表达——符号表达与标注

一、前言 地图最直接的表达就是使用符号表达。使用符号可以把简单的点线面要 素渲染成最直观的地理符号,提高地图的可读性。只要掌握了 ArcGIS 符号制 作的技巧,分析符号并总结出规则,就可以制作符合要求的地图+符号。 (一)符号的选择与修改 符号的选择在制图中至关重要,使用符号选择器对话框可从多个可用样式 中选择符号,并且每个符号都有一个标签用来描述其图形特征,如颜色或类型, 利用这些标签可

气象站的种类和应用范围可以根据不同的分类标准进行详细的划分和描述

气象站的种类和应用范围可以根据不同的分类标准进行详细的划分和描述。以下是从不同角度对气象站的种类和应用范围的介绍: 一、气象站的种类 根据用途和安装环境分类: 农业气象站:专为农业生产服务,监测土壤温度、湿度等参数,为农业生产提供科学依据。交通气象站:用于公路、铁路、机场等交通场所的气象监测,提供实时气象数据以支持交通运营和调度。林业气象站:监测林区风速、湿度、温度等气象要素,为林区保护和

数据时代的数字企业

1.写在前面 讨论数据治理在数字企业中的影响和必要性,并介绍数据治理的核心内容和实践方法。作者强调了数据质量、数据安全、数据隐私和数据合规等方面是数据治理的核心内容,并介绍了具体的实践措施和案例分析。企业需要重视这些方面以实现数字化转型和业务增长。 数字化转型行业小伙伴可以加入我的星球,初衷成为各位数字化转型参考库,星球内容每周更新 个人工作经验资料全部放在这里,包含数据治理、数据要

如何在Java中处理JSON数据?

如何在Java中处理JSON数据? 大家好,我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编,也是冬天不穿秋裤,天冷也要风度的程序猿!今天我们将探讨在Java中如何处理JSON数据。JSON(JavaScript Object Notation)作为一种轻量级的数据交换格式,在现代应用程序中被广泛使用。Java通过多种库和API提供了处理JSON的能力,我们将深入了解其用法和最佳

大林 PID 算法

Dahlin PID算法是一种用于控制和调节系统的比例积分延迟算法。以下是一个简单的C语言实现示例: #include <stdio.h>// DALIN PID 结构体定义typedef struct {float SetPoint; // 设定点float Proportion; // 比例float Integral; // 积分float Derivative; // 微分flo