「基因组组装」三代组装多少深度比较合适

2024-06-23 19:58

本文主要是介绍「基因组组装」三代组装多少深度比较合适,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章

一句话总结,组装深度建议高于30X,N50建议高于11Kb,否则会出现严重的片段化。

最初参加三代组装培训的时候,课程老师建议Canu使用所有数据进行组装会比较好。因为我组装基因组比较小,计算成本低,所以大部分的时候我都是用100X左右的数据进行纠错加组装。但是最近组装的时候,却发现如果我使用所有数据,最后结果会有更多的错误组装。这种错误可以用一个成语进行概括,“三人成虎”,也就是原本不应该连接的两个contig,如果有一个错误的read提示这两个contig有可能连接,或许我们还不相信,但是如果出现了4条(但是原来的阈值还是2),那么你就会认为这两个地方应该连在一起。

最近区树俊博士发表在Nature Communication上文章从PacBio测序的深度和长度出发,测试了Canu、Falcon等软件的组装表现。

统计表

我比较关注是不同深度下的组装大小,从附录的表2里,我们不难发现,深度的增加会提高contig的总长度,例如Falcon从35X提高到44X之后,基因组增加了0.02G,也就是20M。

不同组装参数

这篇文章只是测试了PacBio数据的表现,计算力比较够的朋友还可以测评下Nanopore数据。

之前在写组装软件的使用教程时,也想过测试不同软件在不同物种上的表现,根据重复序列、基因组大小挑选不同物种,然后测试不同软件的几个不同参数的表现。只不过我只有一台服务器,算力不够,就暂时放弃了。

这篇关于「基因组组装」三代组装多少深度比较合适的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1088133

相关文章

比较学习难度:Adobe Illustrator、Photoshop和新兴在线设计平台

从入门设计开始,几乎没有人不知道 Adobe 公司两大设计软件:Adobe Illustrator和 Photoshop。虽然AI和PS很有名,有一定设计经验的设计师可以在早期探索和使用后大致了解AI和PS的区别,但似乎很少有人会系统地比较AI和PS。目前,设计软件功能多样,轻量级和网页设计软件已成为许多设计师的需求。对于初学者来说,一篇有针对性的AI和PS比较总结文章具有非常重要的指导意义。毕竟

好书推荐《深度学习入门 基于Python的理论与实现》

如果你对Python有一定的了解,想对深度学习的基本概念和工作原理有一个透彻的理解,想利用Python编写出简单的深度学习程序,那么这本书绝对是最佳的入门教程,理由如下:     (1)撰写者是一名日本普通的AI工作者,主要记录了他在深度学习中的笔记,这本书站在学习者的角度考虑,秉承“解剖”深度学习的底层技术,不使用任何现有的深度学习框架、尽可能仅使用基本的数学知识和Python库。从零创建一个

Python几种建表方法运行时间的比较

建立一个表[0,1,2,3.......10n],下面几种方法都能实现,但是运行时间却截然不同哦 import time#方法一def test1(n):list=[]for i in range(n*10):list=list+[i]return list#方法二def test2(n):list=[]for i in range(n*10):list.append(i)#方法三d

【图像识别系统】昆虫识别Python+卷积神经网络算法+人工智能+深度学习+机器学习+TensorFlow+ResNet50

一、介绍 昆虫识别系统,使用Python作为主要开发语言。通过TensorFlow搭建ResNet50卷积神经网络算法(CNN)模型。通过对10种常见的昆虫图片数据集(‘蜜蜂’, ‘甲虫’, ‘蝴蝶’, ‘蝉’, ‘蜻蜓’, ‘蚱蜢’, ‘蛾’, ‘蝎子’, ‘蜗牛’, ‘蜘蛛’)进行训练,得到一个识别精度较高的H5格式模型文件,然后使用Django搭建Web网页端可视化操作界面,实现用户上传一

基于深度学习的轮廓检测

基于深度学习的轮廓检测 轮廓检测是计算机视觉中的一项关键任务,旨在识别图像中物体的边界或轮廓。传统的轮廓检测方法如Canny边缘检测和Sobel算子依赖于梯度计算和阈值分割。而基于深度学习的方法通过训练神经网络来自动学习图像中的轮廓特征,能够在复杂背景和噪声条件下实现更精确和鲁棒的检测效果。 深度学习在轮廓检测中的优势 自动特征提取:深度学习模型能够自动从数据中学习多层次的特征表示,而不需要

Struts2与struts1与springmvc比较

最近做项目用到了struts2,之前一直是用struts1和springMVC。感觉到了struts2从很大程度上和这两个还是有很大区别的,所以今天搜集了些资料,给他们做一下对比。            Struts1官方已经停止更新,现在用的也比较少,这里主要讲一下struts2和struts1比较都有哪些不同和进步。Struts2可以说不是完全从struts1改进来的,因为

算法8—不通过比较,找出两个数的最大值

问题: 比如:给定两个值 5和10,不通过比较,直接找出最大值。 分析: 一旦涉及到不用比较找最大值,想都不用想,一般只能通过位运算来实现。  max = a - ((a-b)&((a-b)>>31)) 或者 max = ((a+b)+|a-b|)/2 如果找最小值,我们只需把两个值相加,减去max即可。

深度神经网络:解锁智能的密钥

深度神经网络:解锁智能的密钥 在人工智能的浩瀚星空中,深度神经网络(Deep Neural Networks, DNNs)无疑是最耀眼的那颗星。它以其强大的学习能力、高度的适应性和广泛的应用场景,成为了我们解锁智能世界的一把密钥。本文将带你走进深度神经网络的神秘世界,探讨其原理、应用以及实用操作技巧。 一、深度神经网络概述 深度神经网络,顾名思义,是一种具有多个隐藏层的神经网络。与传统的神经

刷题——比较版本号

比较版本号_牛客题霸_牛客网 int compare(string version1, string version2){int len1 = version1.size();int len2 = version2.size();int i=0,j=0;while(i<len1 || j <len2){long num1 =0 ;while(i <len1 && version1.charAt

深度学习入门篇(一)

首先明确什么是机器学习,换言之机器学习程序相较于其他计算机硬编码程序有哪些能力? 硬编码计算机程序试图以极其复杂的形势化规则描述这个世界,但是对于人类而言非常简单的语音和图像却好像不是那么容易以一种形式化的语言来描述的。在追逐计算机智能发展的进程中,人们为此做了大量的努力,比如“知识库方法(Cyc)”和大量的专家系统。最后都难以在业界取得成功,因为尽善尽美形式化描述本身就是难以实现的。 所以A