本文主要是介绍对计算器中位点的Fst进行分析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
科普:Fst,群体间分化指数,用于群体间分化分析。
取值范围:[0, 1]
划分标准:
0~0.05:群体间遗传分化很小,可以不考虑;
0.05~0.15,群体间存在中等程度的遗传分化;
0.15~0.25,群体间遗传分化较大;
0.25以上,群体间有很大的遗传分化。
在这里,我们以三种计算器:K3,K12b,K47分别代表k数小、中、大的计算器来进行研究
计算方法:https://blog.csdn.net/q623928815/article/details/78627610?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522163905592216780357252120%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fall.%2522%257D&request_id=163905592216780357252120&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2allfirst_rank_ecpm_v1~rank_v31_ecpm-5-78627610.pc_search_result_cache&utm_term=%E7%BE%A4%E4%BD%93%E9%97%B4%E5%88%86%E5%8C%96%E6%8C%87%E6%95%B0&spm=1018.2226.3001.4187
Python代码实现:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as npplt.rcParams['font.sans-serif'] = ['Arial Unicode MS']
df1 = pd.read_csv('k12b_fst.csv', index_col = 0, header = 0)
df2 = pd.read_csv('k47_fst.csv', index_col = 0, header = 0)
df3 = pd.read_csv('k3_fst.csv', index_col = 0, header = 0)a1 = df1[df1.Fst <= 0.05].shape[0]
b1 = df1[(0.05 < df1.Fst) & (df1.Fst <= 0.15)].shape[0]
c1 = df1[(0.15 < df1.Fst) & (df1.Fst <= 0.25)].shape[0]
d1 = df1[df1.Fst > 0.25].shape[0]a2 = df2[df2.Fst <= 0.05].shape[0]
b2 = df2[(0.05 < df2.Fst) & (df2.Fst <= 0.15)].shape[0]
c2 = df2[(0.15 < df2.Fst) & (df2.Fst <= 0.25)].shape[0]
d2 = df2[df2.Fst > 0.25].shape[0]a3 = df3[df3.Fst <= 0.05].shape[0]
b3 = df3[(0.05 < df3.Fst) & (df3.Fst <= 0.15)].shape[0]
c3 = df3[(0.15 < df3.Fst) & (df3.Fst <= 0.25)].shape[0]
d3 = df3[df3.Fst > 0.25].shape[0]plt.plot([1, 2, 3, 4], [a1, b1, c1, d1], c = plt.cm.get_cmap('Set3')(0), marker = 'o', markersize = 3)
plt.plot([1, 2, 3, 4], [a2, b2, c2, d2], c = plt.cm.get_cmap('Set3')(2), marker = 'o', markersize = 3)
plt.plot([1, 2, 3, 4], [a3, b3, c3, d3], c = plt.cm.get_cmap('Set3')(3), marker = 'o', markersize = 3)
plt.legend(['K12b', 'K47', 'LM-K3'])
plt.xticks([1, 2, 3, 4], ['分化很小', '中等程度', '分化较大', '分化很大'])
plt.title('三种计算器Fst值大小位点数')
plt.rcParams['savefig.dpi'] = 600
plt.tight_layout()
plt.savefig(f'plot_Fst.jpg', bbox_inches = 'tight')
三种计算器按照分类标准分类后折线图:
得出结论:
- Fst中等及以上位点数越多计算器越准确,注意是位点数而不是占比。
- 而且说明计算器位点数对于稳定性的影响可能是大于Fst值各部分占比对稳定性的影响,所以说明筛选计算器位点的时候可以适当放宽Fst标准然后增加位点数。
这三个计算器单个位点Fst值对应情况在附件中,可供大家下载。
https://download.csdn.net/download/yhlhhhhh/76032290
这篇关于对计算器中位点的Fst进行分析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!