本文主要是介绍2021.04.12丨对测序样品统一命名,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
- 摘要
- 在公司已经待了几个月,项目也有条不紊地推进。RNA-seq流程是早就搭建好了的,奈何拿到的测序样品数据名称和后缀经常会有一些变化,比如R1.fq.gz, R1_001.fq.gz, R1_001.fastq.gz等等。导致每次都要到流程里面改一下后缀。为了尽早实现标准化,周末闲来无事,把这个统一命名的问题解决了一下
- 环境配置
- python:3.8.5
- 使用代码
#encoding=utf-8
import os
path = "./"
filelist = os.listdir(path) #该文件夹下所有的文件(包括文件夹)
for file in filelist:print(file)
for file in filelist: #遍历所有文件Olddir=os.path.join(path,file) #原来的文件路径#print(Olddir)'''if os.path.isdir(Olddir): #如果是文件夹则跳过continue'''filename=os.path.splitext(file)[0] #文件名filetype=os.path.splitext(file)[1] #文件扩展名if "_R1" in filename:filename=filename.split('_R1')print(filename[0])Newdir=os.path.join(path,filename[0]+"_R1.fastq"+filetype)print(Newdir)elif "_1" in filename:filename=filename.split('_1')print(filename[0])Newdir=os.path.join(path,filename[0]+"_R1.fastq"+filetype)print(Newdir)if "_R2" in filename:filename=filename.split('_R2')print(filename[0])Newdir=os.path.join(path,filename[0]+"_R2.fastq"+filetype)print(Newdir)elif "_2" in filename:filename=filename.split('_2')print(filename[0])Newdir=os.path.join(path,filename[0]+"_R2.fastq"+filetype)print(Newdir)else:continue#os.rename(Olddir,Newdir)#重命名
结果展示:
处理前
处理后
总结:慢慢地还要通过脚本去解决一些小问题,比如单/双端测序在snakemake工作流上的识别,一次性输入解决样品的差异分组等。完成这些小问题都有助于完善流程的标准化。
代码参考:(1条消息) python实现文件重命名_不负韶华,逐梦如初-CSDN博客_python重命名文件名
这篇关于2021.04.12丨对测序样品统一命名的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!