马尔可夫毯式遗传算法在基因选择中的应用

2024-05-09 00:58

本文主要是介绍马尔可夫毯式遗传算法在基因选择中的应用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

#引用

##LaTex

@article{ZHU20073236,
title = “Markov blanket-embedded genetic algorithm for gene selection”,
journal = “Pattern Recognition”,
volume = “40”,
number = “11”,
pages = “3236 - 3248”,
year = “2007”,
issn = “0031-3203”,
doi = “https://doi.org/10.1016/j.patcog.2007.02.007”,
url = “http://www.sciencedirect.com/science/article/pii/S0031320307000945”,
author = “Zexuan Zhu and Yew-Soon Ong and Manoranjan Dash”,
keywords = “Microarray, Feature selection, Markov blanket, Genetic algorithm (GA), Memetic algorithm (MA)”
}

##Normal

Zexuan Zhu, Yew-Soon Ong, Manoranjan Dash,
Markov blanket-embedded genetic algorithm for gene selection,
Pattern Recognition,
Volume 40, Issue 11,
2007,
Pages 3236-3248,
ISSN 0031-3203,
https://doi.org/10.1016/j.patcog.2007.02.007.
(http://www.sciencedirect.com/science/article/pii/S0031320307000945)
Keywords: Microarray; Feature selection; Markov blanket; Genetic algorithm (GA); Memetic algorithm (MA)


#摘要

Microarray technologies
the smallest possible set of genes

Markov blanket-embedded genetic algorithm (MBEGA) for gene selection problem

Markov blanket and predictive power in classifier model

filter, wrapper, and standard GA

evaluation criteria:
classification accuracy, number of selected genes, computational cost, and robustness


#主要内容

这里写图片描述


##Markov Blanket(Markov毯)

F F F — 所有特征的集合
C C C — 类别

一个特征 F i F_i Fi的Markov毯 定义如下:

定义(Markov毯)
M M M — 一个特征子集(不包含 F i F_i Fi
即, M ∈ F M \in F MF F i ∉ M F_i \notin M Fi/M
M M M F i F_i Fi的一个Markov毯,若
给定 M M M F i F_i Fi是对于 ( F ∪ C ) − M − { F i } \left( F \cup C \right) - M - \left\{ F_i \right\} (FC)M{Fi}条件独立的,
即, P ( F − M − { F i } , C ∣ F i , M ) = P ( F − M − { F i } , C ∣ M ) P \left( F - M - \left\{ F_i \right\}, C | F_i, M \right) = P \left( F - M - \left\{ F_i \right\}, C | M \right) P(FM{Fi},CFi,M)=P(FM{Fi},CM)

给定X,两个属性A与B是条件独立的,若$P \left( A | X, B \right) = P \left( A | X \right) , 也 就 是 说 , B 并 不 能 在 X 之 外 提 供 关 于 A 的 信 息 。 若 一 个 特 征 ,也就是说,B并不能在X之外提供关于A的信息。若一个特征 BXAF_i 在 当 前 选 择 的 特 征 子 集 中 有 一 个 M a r k o v 毯 在当前选择的特征子集中有一个Markov毯 MarkovM , 那 么 ,那么 F_i 在 在 M 之 外 关 于 之外关于 C 不 能 提 供 其 他 选 择 的 特 征 的 信 息 , 因 此 , 不能提供其他选择的特征的信息,因此, F_i 能 够 安 全 移 除 。 然 而 , 决 定 特 征 的 条 件 独 立 的 计 算 复 杂 度 通 常 非 常 高 , 因 此 , 只 使 用 一 个 特 征 来 估 计 能够安全移除。然而,决定特征的条件独立的计算复杂度通常非常高,因此,只使用一个特征来估计 使F_i$的Markov毯。

定义(近似Markov毯)
对于两个特征 F i F_i Fi F j F_j Fj i ≠ j i\neq j i̸=j F j F_j Fj可看作为 F i F_i Fi的近似Markov毯,若 S U j , C ≥ S U i , C SU_{j,C} \geq SU_{i,C} SUj,CSUi,C S U i , j ≥ S U i , C SU_{i,j} \geq SU_{i,C} SUi,jSUi,C,其中,
对称不确定性(symmetrical uncertainty,SU)度量特征(包括类, C C C)间的相关性,定义为:

这里写图片描述

I G ( F i ∣ F j ) IG \left( F_i | F_j \right) IG(FiFj) — 特征 F i F_i Fi F j F_j Fj间的信息增益
H ( F i ) H \left( F_i \right) H(Fi) H ( F j ) H \left( F_j \right) H(Fj) — 特征 F i F_i Fi F j F_j Fj的熵
S U i , C SU_{i,C} SUi,C — 特征 F i F_i Fi与类 C C C间的相关性,称为C-correlation
一个特征被认为是相关的若其C-correlation高于用户给定的阈值 γ \gamma γ,即, S i , C > γ S_{i,C} > \gamma Si,C>γ
没有任何近似Markov毯的特征为predominant feature主导特征


##马尔可夫毯式嵌入式遗传算法

这里写图片描述

这里写图片描述

这里写图片描述

若适应值差异小于 ε \varepsilon ε,则特征数较少的个体较好

Lamarckian learning:
通过将局部改进的个体放回种群竞争繁殖的机会,来迫使基因型反映改进的效果

这里写图片描述

X X X — 选择的特征子集
Y Y Y — 排除的特征子集

这里写图片描述

C-correlation 只计算一次

搜索范围 L L L — 定义了 A d d Add Add D e l Del Del操作的最大数目 — L 2 L^2 L2个操作组合
随机顺序 — 直到得到改进提升效果

这里写图片描述

Lamarckian learning process

之后是
usual evolutionary operations:

  1. linear ranking selection
  2. uniform crossover
  3. mutation operators with elitism

##试验

MBEGA method

考虑了:

  1. the FCBF (fast correlation-based filter)
  2. BIRS (best incremental ranked subset)
  3. standard GA feature selection algorithms

FCBF —
a fast correlation based filter method

  1. selecting a subset of relevant features whose C-correlation are larger than a given threshold γ \gamma γ
  2. sorts the relevant features in descending order in terms of C-correlation
  3. redundant features are eliminated one-by-one in a descending order

A feature is redundant 仅当 it has an approximate Markov blanket

predominant features with zero redundant features in terms of C-correlation

BIRS — a similar scheme as the FCBF
evaluates the goodness of features using a classifier

  1. ranking the genes according to some measure of interest
  2. sequentially selects the ranked features one-by-one based on their incremental usefulness

calls to the classifier as many times as the number of features

B I R S F BIRS_F BIRSF or B I R S W BIRS_W BIRSW — 基于 — C-correlation (i.e., symmetrical uncertainty between feature F i F_i Fi and the class C C C) or individual predictive power

B I R S F BIRS_F BIRSF 耗时更少


###synthetic data 合成数据

这里写图片描述
ten 10-fold crossvalidations
with C4.5 classifier

10 independent runs

The maximum number of selected features in each chromosome, m, is set to 50.


###microarray data 微阵列数据

这里写图片描述

The .632+ bootstrap

这里写图片描述

K次重采样

the support vector machine (SVM) — microarray classification problems

one-versus-rest strategy — multi-class datasets

the linear kernel SVM

这里写图片描述
这里写图片描述

这篇关于马尔可夫毯式遗传算法在基因选择中的应用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/971940

相关文章

Python 中 requests 与 aiohttp 在实际项目中的选择策略详解

《Python中requests与aiohttp在实际项目中的选择策略详解》本文主要介绍了Python爬虫开发中常用的两个库requests和aiohttp的使用方法及其区别,通过实际项目案... 目录一、requests 库二、aiohttp 库三、requests 和 aiohttp 的比较四、requ

将Python应用部署到生产环境的小技巧分享

《将Python应用部署到生产环境的小技巧分享》文章主要讲述了在将Python应用程序部署到生产环境之前,需要进行的准备工作和最佳实践,包括心态调整、代码审查、测试覆盖率提升、配置文件优化、日志记录完... 目录部署前夜:从开发到生产的心理准备与检查清单环境搭建:打造稳固的应用运行平台自动化流水线:让部署像

Linux中Curl参数详解实践应用

《Linux中Curl参数详解实践应用》在现代网络开发和运维工作中,curl命令是一个不可或缺的工具,它是一个利用URL语法在命令行下工作的文件传输工具,支持多种协议,如HTTP、HTTPS、FTP等... 目录引言一、基础请求参数1. -X 或 --request2. -d 或 --data3. -H 或

在Ubuntu上部署SpringBoot应用的操作步骤

《在Ubuntu上部署SpringBoot应用的操作步骤》随着云计算和容器化技术的普及,Linux服务器已成为部署Web应用程序的主流平台之一,Java作为一种跨平台的编程语言,具有广泛的应用场景,本... 目录一、部署准备二、安装 Java 环境1. 安装 JDK2. 验证 Java 安装三、安装 mys

el-select下拉选择缓存的实现

《el-select下拉选择缓存的实现》本文主要介绍了在使用el-select实现下拉选择缓存时遇到的问题及解决方案,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的... 目录项目场景:问题描述解决方案:项目场景:从左侧列表中选取字段填入右侧下拉多选框,用户可以对右侧

Python中构建终端应用界面利器Blessed模块的使用

《Python中构建终端应用界面利器Blessed模块的使用》Blessed库作为一个轻量级且功能强大的解决方案,开始在开发者中赢得口碑,今天,我们就一起来探索一下它是如何让终端UI开发变得轻松而高... 目录一、安装与配置:简单、快速、无障碍二、基本功能:从彩色文本到动态交互1. 显示基本内容2. 创建链

Node.js 中 http 模块的深度剖析与实战应用小结

《Node.js中http模块的深度剖析与实战应用小结》本文详细介绍了Node.js中的http模块,从创建HTTP服务器、处理请求与响应,到获取请求参数,每个环节都通过代码示例进行解析,旨在帮... 目录Node.js 中 http 模块的深度剖析与实战应用一、引言二、创建 HTTP 服务器:基石搭建(一

java中VO PO DTO POJO BO DO对象的应用场景及使用方式

《java中VOPODTOPOJOBODO对象的应用场景及使用方式》文章介绍了Java开发中常用的几种对象类型及其应用场景,包括VO、PO、DTO、POJO、BO和DO等,并通过示例说明了它... 目录Java中VO PO DTO POJO BO DO对象的应用VO (View Object) - 视图对象

Go信号处理如何优雅地关闭你的应用

《Go信号处理如何优雅地关闭你的应用》Go中的优雅关闭机制使得在应用程序接收到终止信号时,能够进行平滑的资源清理,通过使用context来管理goroutine的生命周期,结合signal... 目录1. 什么是信号处理?2. 如何优雅地关闭 Go 应用?3. 代码实现3.1 基本的信号捕获和优雅关闭3.2

正则表达式高级应用与性能优化记录

《正则表达式高级应用与性能优化记录》本文介绍了正则表达式的高级应用和性能优化技巧,包括文本拆分、合并、XML/HTML解析、数据分析、以及性能优化方法,通过这些技巧,可以更高效地利用正则表达式进行复杂... 目录第6章:正则表达式的高级应用6.1 模式匹配与文本处理6.1.1 文本拆分6.1.2 文本合并6