本文主要是介绍【题目】2016年全国研究生数学建模竞赛B题 具有遗传性疾病和性状的遗传位点分析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
同学给我看了她参加竞赛的题目,我一看,这不巧了吗,我也就看看题目......
人体的每条染色体携带一个DNA分子。在这条双螺旋的长链中,共有约30亿个碱基对,而基因则是DNA长链中有遗传效应的一些片段。在组成DNA的数量浩瀚的碱基对(或对应的脱氧核苷酸)中,有一些特定位置的单个核苷酸经常发生变异引起DNA的多态性,我们称之为位点。
在DNA长链中,位点个数约为碱基对个数的1/1000。
近年来,研究人员大都采用全基因组的方法来确定致病位点或致病基因,具体做法是:招募大量志愿者(样本),包括具有某种遗传病的人和健康的人,通常用1表示病人,0表示健康者。对每个样本,采用碱基(A,T,C,G)的编码方式来获取每个位点的信息(因为染色体具有双螺旋结构,所以用两个碱基的组合表示一个位点的信息);如表1中,在位点rs100015位置,不同样本的编码都是T和C的组合,有三种不同编码方式TT,TC和CC。类似地其他的位点虽然碱基的组合不同,但也只有三种不同编码。研究人员可以通过对样本的健康状况和位点编码的对比分析来确定致病位点,从而发现遗传病或性状的遗传机理。
这些信息包括这1000个样本的疾病信息、样本的9445个位点编码信息,以及包含这些位点的基因信息。
事实上,可以把基因理解为若干个位点组成的集合。
问题三、同上题中的样本患有遗传疾病A的信息(phenotype.txt文件)。现有300个基因,每个基因所包含的位点名称见文件夹gene_info中的300个dat文件,每个dat文件列出了对应基因所包含的位点(位点信息见文件genotype.dat)。由于可以把基因理解为若干个位点组成的集合,遗传疾病与基因的关联性可以由基因中包含的位点的全集或其子集合表现出来请找出与疾病最有可能相关的一个或几个基因,
这篇关于【题目】2016年全国研究生数学建模竞赛B题 具有遗传性疾病和性状的遗传位点分析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!