ngs专题

biostar handbook|如何模拟NGS测序结果

如何用软件模拟NGS数据 为了评价一个工具的性能,通常我们都需要先模拟一批数据。这样相当于有了参考答案,才能检查工具的实际表现情况。因此对于我们而言,面对一个新的功能,可以先用模拟的数据测试下不同工具的优缺点。有如下几个工具值得推荐一下: 'wgsim/dwgsim': 从全基因组中获取测序reads'msbar': EMBOSS其中一个工具,能够从单个序列中模拟随机突变'biosed': E

生信软件15 - 生信NGS数据分析强大的工具集ngs-bits

ngs-bits - Short-read sequencing tools - 短reasd测序工具 一个强大的工具集,安装后直接使用。 # conda安装指定版本, 安装高版本失败,故采用2021_09版本conda install ngs-bits=2021_09 -y# 测试安装是否成功,成功则显示下列内容ReadQC 软件说明文档markown # 参考githubh

NGS基因测序(panel)报告解读数据库汇总

今天我们来梳理一下肿瘤基因报告解读常见的数据库,大家有机会可以自己查询并且解读,涉及到的数据库有dbSNP数据库 、gnomAD数据库、ExAC数据库、1000 Genomes、HGMD 数据库、OMIM数据库、ClinVar数据库、InterVar数据库 、ClinGen数据库、GeneReviews数据库、HPO数据库、NCBI Gene数据库、UCSC Genome Browser、Onco

NGS项目六:R语言与Bioconductor分析affymetrix芯片

6.1 数据输入与预处理 从数据包CLL中载入芯片数据,完成预处理 在bioConductor使用RMA算法预处理基因芯片原始数据。首先,去http://www.affymetrix.com/support/technical/sample_data/demo_data.affx下载一些示例数据文件下来。这里,使用Arabidopsis-AGAGCC数据示例。我们先把下载下来的文件解压后拷贝A

NGS项目五:用R语言生成极端嗜盐古菌蛋白序列进化树

基因表达数据分析和实验设计密不可分,总体来说,实验设计有两大类思路:一类是时间序列分析,主要思想是测定基因多个时间点的表达值,通过聚类和主成分分析等分析手段寻找调控基因,进而研究其深层机制;第二类是基因表达差异的限制性分析。         所谓GO注释,就是将表示基因或其产物的ID映射到一组GO的ID上,用这组GOterm来描述这个基因。而实际应用中,人们更关心一组基因(比如差

NGS项目四:高通量测序在植物生物胁迫研究中的应用

在植物生物胁迫研究方面,本文通过作者所精密相关课题组的研究,比较传统研究方法和高通量测序方法的优劣。 Sun X, Tan Q, Nie Z,et al. Differential Expression of Proteins in Response to MolybdenumDeficiency in Winter Wheat Leaves Under Low-Temperature

NGS项目二:提高数据信息收集整合能力

高通量测序产生的庞大数据目前主要存储在三大数据库。普通事业单位、乃至个人需要使用vpn、ssh账户才能获得差强任意的获取速度(如图,时间是周五下午5点,链接ncbi的速度大约35kb/s)。引用了两个链接介绍了如何一些合理使用互联网的方法。它们对Linux操作系统的掌握程度有一定要求。         希望对你有帮助:将go阿根廷文件完全拷贝到window,环境下,打开go阿根廷

NGS项目一:RNA-Seq数据的Workflow

nature protocol Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks 从原始的数据开始,进行reads回帖,到拼接转录本,计算表达量,分析差异表达,最后可视化分析结果。   TopHat是一个把reads回帖到基因组上

HLAminer:根据NGS数据确定HLA分型结果

欢迎关注"生信修炼手册"! PCR-SBT方法是世界卫生组织WHO推崇的HLA 分型的金标准,其实就是指的直接测序,无论是WGS, WES, RNA_seq 数据都可以。近几年来涌现了很多的软件,支持从NGS测序数据直接确定HLA Allel, HLAminer 就是其中之一。 官网如下: https://github.com/warrenlr/HLAminer 安装过程如下: wget htt