「杂谈」Nanopore组装的拟南芥基因组效果如何?

2024-06-23 20:48

本文主要是介绍「杂谈」Nanopore组装的拟南芥基因组效果如何?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

使用的数据来自于一篇发在NC的拟南芥的基因组文章,文章用了minimap/miniasm 进行组装,然后用racon和Pilon进行polish, 最后拼接处62 contigs 且N50 = 12.3 Mb。

wget ftp://ftp.sra.ebi.ac.uk/vol1/fastq/ERR217/003/ERR2173373/ERR2173373.fastq.gz
seqkit seqkit fq2fa ERR2173373.fastq.gz | gzip -c > ERR2173373.fasta

我用的是Canu进行组装,参数如下

canu \-p ath -d Athaliana\useGrid=true \gridOptions="-S /bin/sh -q wangjw" \gridEngineArrayMaxJobs=20 \gridEngineThreadsOption="-pe openmpi THREADS" gridEngineMemoryOption="-l mem_free=MEMORY" \minReadLength=2000 maxThreads=15 maxMemory=60G \genomeSize=100m \rawErrorRate=0.300 \correctedErrorRate=0.100 \-nanopore-raw ERR2173373.fasta.gz

Canu默认Pacbi的rawErroRate是0.300, Nanopore是0.500。但是根据我在自己建立的基因组学群里的讨论,目前nanopore的单条read的错误率大概是12%,所以两条read在overlap的时候,最差估计会有24%以上的序列差异,于是我尝试设置了0.300. 但是由于Nanopore的错误率不是完全随机(经群里的小伙伴告知),所以纠错后正确率低于Pacbio, 所以我设置了0.100. 其他参数没有修改, 最终我拼出了360条contig,N50=4.45M。

我检查了下最后输出的report文件. 第一部分表明,大部分的reads都是能够overlap。

2013053-1f4d53c4de0df1c5.png
Part I

Part II 关于多少数据用于纠错,以及预期留下多少数据。默认Canu只选择最长的40X进行纠错,可以用corOutCoverage=100调整成100X. : rescued 表示的是剩下的没有用于纠错的read,他们可能是质粒、线粒体等。Canu保留的目的是为了避免在组装时缺失序列信息。

2013053-8ec3c3d6a1184094.png
Part II

Part III: 省下的就是由于太短,不能用于纠错的部分。

2013053-926e119358e3a9c9.png
Part III

最终结果,我还用MUMMER分析了以下共线性,代码如下,

nucmer -t  20 --prefix ont2ath Athaliana.fa ath.contigs.fasta
mummerplot -p ont2ath ont2ath.delta --png --filter

基本上每条contig都主要和一条染色体存在很好的共线性,不存在contig的mis-assembly(错误组装)现象。

2013053-87020d6bcdbc2054.png
共线性

下一步的计划

  • 只Correction 不Trim 直接组装,比较组装效果
  • 提高纠错前的错误率,保持纠错后的0.1错误,比较组装效果
  • 保持纠错前的错误率,提高纠错后的错误率,比较组装效果

这篇关于「杂谈」Nanopore组装的拟南芥基因组效果如何?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1088236

相关文章

以canvas方式绘制粒子背景效果,感觉还可以

这个是看到项目中别人写好的,感觉这种写法效果还可以,就存留记录下 就是这种的背景效果。如果想改背景颜色可以通过canvas.js文件中的fillStyle值改。 附上demo下载地址。 https://download.csdn.net/download/u012138137/11249872

echarts省份标注加散点效果

这个是安徽的效果图,鼠标移到红色标注或者对应的市区位置都会显示对应的数值。 先直接上代码: import anhuiMapJson from './anhui.json'getCoords: function(city) {var res = [];if (city != null) {for (var c in this.cityMap.features) {if (this.cityMa

XMG 抽屉效果

1.比如说我创建了3个View -(void)viewDidLoad{  [ super viewDidLoad]; [self setUpChild] ;         UIPanGestureRecognizer *pan=[UIPanGestureRecognizer alloc]initWithTarget:self action:@selector(pan:)];

33个jQuery与CSS3实现的绚丽鼠标悬停效果

只要你有创意,完全可以使用CSS3来实现漂亮的动效,当然如果配合jQuery,这样会更加强大,实现更多高级绚丽的动画效果。鼠标hover效果是很常用的,虽然很细微的东西,但网站的细节注定的网站的体验,所以也不要忽视这些小细节。 今天设计达人网整理了33个使用jQuery与CSS3实现绚丽的鼠标悬停效果,有些是纯CSS3的,这些效果你完全可以用在你的网页上,让网站获得更好的体验。 Anim

自定义recyclerView实现时光轴效果

时光轴效果在很多app上都有出现,例如淘宝中快递的跟踪,本文将使用recyclerView实现时光轴效果,我们会到自定义控件,首先先看一下效果图: 接下来是步骤分析 1自定义属性 这个大家应该都了解了,根据我们之前的分析,直接在attrs.xml中进行声明 <declare-styleable name="TimeLine"><attr name="beginLine" f

Android滑动回弹效果

原理: addHeaderView里做的事: 1.测量出header的宽高,调用了measureView方法 2.设置LayoutParams,宽:MATCH_PARENT,高:10 3.设置topMargin的值为负的header的高度,即将header隐藏在屏幕最上方 onInterceptTouchEvent: 如果滑动距离为零,让onInterceptTouchEvent处理。屏

简化基因组的测序方法

RAD-Seq(restriction site-associated DNA sequencing)最开始指的是2008年发表在PLOS ONE上“Rapid SNP discovery and genetic mapping using sequenced RAD markers"提出的方法,目前该文章的引用已经达到1200+,现在指代的是一系列基于限制性内切酶的测序技术。同样在概念上被引申的

初步组装的杂合基因组如何去冗余

redundans的目标是辅助杂合基因组的组装,输入文件可以是组装的contig,测序文库以及额外的参考基因组,最后用于搭建出scaffold级别的纯合基因组组装结果。包括如下几个步骤: 从头组装: 它会调用Platanus、SSPACE3进行组装去冗余: 从最初组装中去除冗余的序列scaffolding: 利用双端测序将contig进行搭接gap closing: 即填补scaffold中的N

「BioNano系列」光学图谱混合组装应该怎么做?

评估从头组装结果 Bionano从头组装出光学图谱CMAP可以和参考序列的CMAP进行比对,通过Access上可视化检查参考基因组的组装质量,比较两者间的不同。 这里所用的CMAP图谱来自于一篇发表在NC的拟南芥的基因组文章(原本计划用他们的bnx文件介绍从头组装,但是通讯作者根本不搭理我), 光学图谱的下载方式为: wget https://submit.ncbi.nlm.nih.gov

「BioNano系列」如何从头组装出一个Bionano图谱

官方并没有一个很详细的文档描述Bionano的从头组装流程的具体过程,所以我只能根据自己实际项目进行介绍: 流程 AutoNoise + SplitBNX: 这一步会将bnx和参考的cmap文件进行比对,估算出噪声系数,然后把bnx进行拆分便与后续比对Pairwse: 这一步进行molecules之间的两两比较,寻找overlap, 结果存放在"align"文件夹下Asse