本文主要是介绍使用python正则表达式提取RG4,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
lin_20240204_extract_rg4.py
1.使用正则表达式从utr,cds区域提取rG4,输出结果包括序列名称,序列内容,初始位置,终止位置,序列类型;
2.生成的文件,用于下一步计算g4score:lin_20240321_calculating_rG4score.R
import redef read_fasta(file_path):"""读取FASTA文件并返回一个字典,键是序列名称,值是序列。"""sequences = {}with open(file_path, 'r') as file:sequence_name = Nonesequence_data = ''for line in file:line = line.strip()if line.startswith('>'):if sequence_name:sequences[sequence_name] = sequence_datasequence_data = ''sequence_name = line[1:]else
这篇关于使用python正则表达式提取RG4的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!