实验记录 | somatic.pl的运行3

2023-11-30 09:40
文章标签 运行 记录 实验 somatic pl

本文主要是介绍实验记录 | somatic.pl的运行3,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

接2的程序,又报了一系列的错误,我们再次整理。

ERROR MESSAGE: Unable to retrieve result

ERROR MESSAGE: Could not read file /home/zxx/QBRC/human/tumor/tumor_intervals.list because The interval file does not exist.

ERROR MESSAGE: Could not read file /home/zxx/QBRC/human/tumor/realigned.bam because java.io.FileNotFoundException: human/tumor/realigned.bam (No such file or directory)

ERROR MESSAGE: Could not read file /home/zxx/QBRC/human/tumor/tumor_bqsr because it does not exist

使用谷歌搜索解决方案。
有如下:
参考链接:https://www.jianshu.com/p/dd60506b06a2

这是因为设置的VQSR这一步,numBad这个参数设置太大了,调低一些就可以了

另外一点线索的是:

GATK的版本的问题。旧版GATK已经不再维护(据说是这样)。

所以,针对于这种情况,我好像又走不通了(主要原因觉得是提供给搜索引擎的信息太少了)。
每一个步骤的执行是进阶式的,只有上一步走通了,下一步才会不报错。所以究其原因,我觉得是我对于源代码的理解还不是很够。

我想首先弄明白它这里的VQSR是什么?

Variant Quality Score Recalibration 突变质量重新校准。是gatk的一个关键性的步骤。

现在有两个解决的思路:
(1)着手理解somatic.pl的处理过程(感觉这套流程主要用的还要属GATK,我想知道它在其中是怎样的位置,负责处理什么?有哪些关键性的程序被放进程序包里了,而且是怎么被调用的)。
(2)着手理解GATK。

插播&更新
这个网站可能帮助我找到联系人的邮箱:
https://blog.csdn.net/weixin_44424296/article/details/114460923
https://github.com/Edison19991109
如果我能够联系到这个同学将会是事半功倍的。
jianning.18@intl.zju.edu.cn
主要用的代码,如下(在这里记录一下):
git clone https://github.com/Edison19991109/DST_Group_Project.git
cd DST_Group_Project/
git log
非常好用。感谢。
这些内容是留存给自己看的,所以写的时候就稍微随意了一些。有时候是多个文件并行处理的,就会忘记某个内容是写在那个文件中了。而且我也很怕命名,我觉得命名很难不重复。
2021/5/15

我尝试联系原作者以及之前学过这部分内容的前辈,杳无音信。所以,还是要靠自己才是。
生活是美好的,生命是美好的,要用自己的生命创造美丽的事。
2021/5/16
继续啃这部分的内容。

这个代码比我想象中的要复杂,看来需要重新捡起perl的知识点了。
如果早一点的看到源代码,也许并不需要之前花很多功夫用在配置环境上,因为突然发现这里很多软件的运行的重要模块都在它的路径之中。
现在,看代码是必由之路了。

结合代码以及出错的记录,才恍然醒悟自己原来在比对的环节就出了问题。除了一开始的这个文件缺少,那个文件缺少。现在也存在,作者一开始在这个压缩包里的文件本身就不是很全。指令常常缺乏。可能我现在也比较菜,对于这个未知的事物,一片茫然。但好在每天都有学到一些东西了,希望老师给我时间。关于,这个方面,我觉得我还需要一些建议。

现在突然对自己的评价很低,觉得自己真的是只有“名声”而没有真正实力的人。希望有一天,自己的实力能够和所在的学校匹配。XXX学校的人不差的。而我也好惭愧,觉得自己没能给家人一点支持,而他们又是如此的尊敬我。越想越有些难过。

以后的路要靠自己了,不要把自己看的那么重要。风啊雨啊,就来找我吧,我准备好了。
我觉得自己一直以来都在追赶,从来没有照顾好自己的心情。把自己的心情照顾好之后,做起事情会事半功倍。
让自己平静下来。

========================================================
bwa mem -v 1 -t 32 -a -M /home/zxx/QBRC/geneome/hg19/hg19.fa fastq1.fastq fastq2.fastq
报错说:

[E::bwa_idx_load_from_disk] fail to locate the index files

也就是说,缺乏参考基因组的索引。
在网上查了一圈出错的原因,没怎么看明白。
后来,去查了bwa的使用方法,突然醒悟到,是不是本身就需要建立索引呢?而确实是,自己没有建立索引。
于是,着手建立索引(是啊,比对的时候怎么能不建立索引呢?)。
bwa index -a bwtsw hg19.fa

[bwt_gen] Finished constructing BWT in 695 iterations.
[bwa_index] 3218.70 seconds elapse.
[bwa_index] Update BWT… Killed

我的索引配置完成了,需要较长的时间。
ls

hg19.dict hg19.fa.amb hg19.fa.bwt hg19.fa.pac
hg19.fa hg19.fa.ann hg19.fa.fai

其中,.amb.bwt.pac.ann,就是新配置完成的索引。
我们重新运行,看是否报同样的错误。

fail to open file ‘/home/zxx/QBRC/geneome/hg19/hg19.fa.sa’ : No such file or directory

缺少文件,是没有建立完全索引吗?
好,重新建立索引(13:09-14:03)。也就是说,建立一个索引,需要时间为一个小时。

[bwt_gen] Finished constructing BWT in 695 iterations.
[bwa_index] 3103.69 seconds elapse.
[bwa_index] Update BWT… Killed

是同样的错误,生成的文件中仍然没.sa文件。
参考链接:https://blog.csdn.net/mjy1757355155/article/details/103658745
显示说是ubuntu的内存不够。
我想看一下,最近因为安装各种软件,使用了多少内存,现在还剩多少空间。
df -h

/dev/sda7 65G 45G 20G 75% /

的确磁盘空间不太充足。
刚好,新的移动硬盘到了。我将fasta文件,重新移动到硬盘上,在这样大的空间中去运行。重新运行代码,看是否会报错。

出现了新的错误?怎么会?

[BWTIncConstructFromPacked] 360 iterations done. 3600000000 characters processed.
[BWTIncConstructFromPacked] 370 iterations done. 3700000000 characters processed.
[BWTIncConstructFromPacked] 380 iterations done. 3800000000 characters processed.
BWTIncConstructFromPacked() : Can’t read from hg19.fa.pac : Input/output error

参考链接:https://www.biostars.org/p/405187/

输入的这个目录没有读写权限。因此读取失败?

通过对命令进行核实,我发现我是有存储空间的。

参考链接:https://www.biostars.org/p/338017/
当程序意外停止的时候,可以注意查看log文件。这个作者遇到的问题,和我一模一样。

主要出错的原因是时间或者空间的限制。
提高空间的分配我能够理解,但是提高时间的限制怎么说?

最后,折腾了半天,终于破案了。
主要的原因:将内存与存储空间搞混了。
我一直想着可能是存储空间的限制,但是英文中的memory的意思其实是“内存”的意思。
所以,我明白了我的问题在什么地方了。
在这里插入图片描述所以,我的电脑也太菜了。
这是,我第一次关注到这个问题。
所以,还是从本质上暴露了自己一些计算机的基础很薄弱。基础,永远是自己向上发展的渠道。明白了进一步学习的方向。

更新进度(2021.6.2/9:49)。
在服务器中,重新运行指令,建立索引完成,终于终于,向前推进了一步。
所以,最终出错的原因,就是bwa比对的过程中,电脑的运行内存的受限。

展示最后的结果:
在这里插入图片描述

这篇关于实验记录 | somatic.pl的运行3的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/436549

相关文章

如何用Docker运行Django项目

本章教程,介绍如何用Docker创建一个Django,并运行能够访问。 一、拉取镜像 这里我们使用python3.11版本的docker镜像 docker pull python:3.11 二、运行容器 这里我们将容器内部的8080端口,映射到宿主机的80端口上。 docker run -itd --name python311 -p

Node.js学习记录(二)

目录 一、express 1、初识express 2、安装express 3、创建并启动web服务器 4、监听 GET&POST 请求、响应内容给客户端 5、获取URL中携带的查询参数 6、获取URL中动态参数 7、静态资源托管 二、工具nodemon 三、express路由 1、express中路由 2、路由的匹配 3、路由模块化 4、路由模块添加前缀 四、中间件

跨系统环境下LabVIEW程序稳定运行

在LabVIEW开发中,不同电脑的配置和操作系统(如Win11与Win7)可能对程序的稳定运行产生影响。为了确保程序在不同平台上都能正常且稳定运行,需要从兼容性、驱动、以及性能优化等多个方面入手。本文将详细介绍如何在不同系统环境下,使LabVIEW开发的程序保持稳定运行的有效策略。 LabVIEW版本兼容性 LabVIEW各版本对不同操作系统的支持存在差异。因此,在开发程序时,尽量使用

记录每次更新到仓库 —— Git 学习笔记 10

记录每次更新到仓库 文章目录 文件的状态三个区域检查当前文件状态跟踪新文件取消跟踪(un-tracking)文件重新跟踪(re-tracking)文件暂存已修改文件忽略某些文件查看已暂存和未暂存的修改提交更新跳过暂存区删除文件移动文件参考资料 咱们接着很多天以前的 取得Git仓库 这篇文章继续说。 文件的状态 不管是通过哪种方法,现在我们已经有了一个仓库,并从这个仓

如何在运行时修改serialVersionUID

优质博文:IT-BLOG-CN 问题 我正在使用第三方库连接到外部系统,一切运行正常,但突然出现序列化错误 java.io.InvalidClassException: com.essbase.api.base.EssException; local class incompatible: stream classdesc serialVersionUID = 90314637791991

STM32(十一):ADC数模转换器实验

AD单通道: 1.RCC开启GPIO和ADC时钟。配置ADCCLK分频器。 2.配置GPIO,把GPIO配置成模拟输入的模式。 3.配置多路开关,把左面通道接入到右面规则组列表里。 4.配置ADC转换器, 包括AD转换器和AD数据寄存器。单次转换,连续转换;扫描、非扫描;有几个通道,触发源是什么,数据对齐是左对齐还是右对齐。 5.ADC_CMD 开启ADC。 void RCC_AD

学习记录:js算法(二十八):删除排序链表中的重复元素、删除排序链表中的重复元素II

文章目录 删除排序链表中的重复元素我的思路解法一:循环解法二:递归 网上思路 删除排序链表中的重复元素 II我的思路网上思路 总结 删除排序链表中的重复元素 给定一个已排序的链表的头 head , 删除所有重复的元素,使每个元素只出现一次 。返回 已排序的链表 。 图一 图二 示例 1:(图一)输入:head = [1,1,2]输出:[1,2]示例 2:(图

HNU-2023电路与电子学-实验3

写在前面: 一、实验目的 1.了解简易模型机的内部结构和工作原理。 2.分析模型机的功能,设计 8 重 3-1 多路复用器。 3.分析模型机的功能,设计 8 重 2-1 多路复用器。 4.分析模型机的工作原理,设计模型机控制信号产生逻辑。 二、实验内容 1.用 VERILOG 语言设计模型机的 8 重 3-1 多路复用器; 2.用 VERILOG 语言设计模型机的 8 重 2-1 多

perl的学习记录——仿真regression

1 记录的背景 之前只知道有这个强大语言的存在,但一直侥幸自己应该不会用到它,所以一直没有开始学习。然而人生这么长,怎就确定自己不会用到呢? 这次要搭建一个可以自动跑完所有case并且打印每个case的pass信息到指定的文件中。从而减轻手动跑仿真,手动查看log信息的重复无效低质量的操作。下面简单记录下自己的思路并贴出自己的代码,方便自己以后使用和修正。 2 思路整理 作为一个IC d

win7+ii7+tomcat7运行javaWeb开发的程序

转载请注明出处:陈科肇 1.前提准备: 操作系统:windows 7 旗舰版   x64 JDK:jdk1.7.0_79_x64(安装目录:D:\JAVA\jdk1.7.0_79_x64) tomcat:32-bit64-bit Windows Service Installer(安装目录:D:\0tomcat7SerV) tomcat-connectors:tomcat-connect