关于Omisc Core WES 计算TMB的一点见解

2023-10-20 20:30

本文主要是介绍关于Omisc Core WES 计算TMB的一点见解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

上周FDA授予Nanthealth公司Omisc Core WES基因检测许可,这是FDA批准的首个使用全外显子测序方法来检测实体瘤的体外诊断产品。Omisc Core比先前FDA批准的MSK-IMPACT测序区域大了20倍。扩大目的是用来准确计算TMB,肿瘤体细胞突变还是在肿瘤相关的468个基因里找。’report somatic alterations in 468 genes and sequencing of 19,396 protein-coding genes to determine overall tumor mutation burden’。

现分析WES为啥比目前流行的大panel好。TMB定义是:每Mb区域里非同义突变的体细胞变异个数。下图是MSKCC发表的MSK-IMPACT跟WES对比得结果[1]。


最理想的情况是MSK-IMPACT TMB与Exome TMB值一致,但事实有不可忽视的差异,例如我们选择TMB>10为高TMB值,那么有很大一部分如图1区域在WES判定为低TMB但在MSK-IMPCAT中判定为高TMB。从相关指数R2=0.76值来看,虽然相关性高,但仍然有很大的改进空间。两者不一致的根源在于统计抽样的大小。Exome TMB相当于检测了样本总体,MSK-IMPACT panel仅检测了一小部分样本,标准误差会随样本数增大而减小。按理说MSK-IMPACT测了2M碱基,已经很大了,例如统计中国人平均身高,抽样200万人已经足够。TMB的问题在于体细胞突变somatic是极小概率事件,每Mb碱基中平均约8个,如图3[1]。如果肿瘤样本的TMB值很高,两者的一致性高,这也符合统计原理。同时也可以知道Foundation Medicine文章图为什么比MSK好看一些[2]。




Omisc Core方法是 tumor/normal成对样本WES测序,等于放大版的MSK-IMPCAT,实验方法及分析流程一样。Foundation Medicine不设正常组织作对照,他们并没有完全公开somatic的计算方法。笔者发现几篇文献公布的算法计算大panel单样本somatic结果跟设对照的很不一致。常见方法是用人群基因组数据库来过滤种系变异,但如果没有患者正常组织,这些突变将很难与罕见的遗传变异区分开[1],MSKCC说很难的事情应该也就是很难的。单样本计算somatic及TMB又很有吸引力,可以节省一半成本。笔者发现市场上有检测机构的报告是这样的。



肿瘤特有突变也就是Somatic,其组织丰度怎么都在50%左右?而且是6个。这份报告很有可能报的是种系变异germline。那我们看看MSK的结果是怎么样的。图5统计了1万多个样本变异频率分布图,大于50%是小概率事件,一个样本中有6个50%基本上是不可能的。有人的做法是过滤掉40%以上的变异,而这又可能过滤掉非常重要的体细胞变异。




Foundation Medicine 采用SGZ(somatic-germline-zygosity)算法来预测体细胞变异,该方法不需要患者匹配的正常对照,可广泛应用于临床研究。SGZ通过对突变的等位基因频率(AF)进行建模来预测每个突变的体细胞与种系状态,考虑到肿瘤含量,肿瘤倍性和局部拷贝数。预测的准确性取决于测序深度和拷贝数模型拟合[3]。这种仅仅靶向1.1 Mb编码区的SGZ算法能否用到40Mb的全外显子上还有待观察,甚至SGZ算法除了Foundation Medicine自己发表一篇文章外,目前也未见其他机构发表。

因此外显子测序用于肿瘤靶向测序计算TMB值,应该跟NantHealth一样设置正常组织作对照,检测全外显子区域somatic来计算TMB。

参考资料:
[1] Ahmet Zehir. Mutational Landscape of Metastatic Cancer Revealed from Prospective Clinical Sequencing of 10,000 Patients.Nat Med. 2017 Jun; 23(6): 703–713.
[2] Zachary R. Chalmers. Analysis of 100,000 humn cancer genomes reveals the landscape of tumor mutational burden.Genome Med. 2017; 9: 34.
[3] James X. Sun.A computational approach to distinguish somatic vs. germline origin of genomic alterations from deep sequencing of cancer specimens without a matched normal.PLoS Comput Biol. 2018 Feb
关于作者:

刘远东:广州克拉斯基因科技有限公司创始人,算法研发工程师,有多年生信算法开发经验。开发了一系列肿瘤NGS检测算法,包括可以检测超高深度测序数据的UMI分子标签算法。广州克拉斯基因科技有限公司专注肿瘤云计算,简洁的界面化操作,无需在复杂的命令行下面计算;国内首家提供在线计算UMI测序数据的平台!

这篇关于关于Omisc Core WES 计算TMB的一点见解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/249536

相关文章

poj 1113 凸包+简单几何计算

题意: 给N个平面上的点,现在要在离点外L米处建城墙,使得城墙把所有点都包含进去且城墙的长度最短。 解析: 韬哥出的某次训练赛上A出的第一道计算几何,算是大水题吧。 用convexhull算法把凸包求出来,然后加加减减就A了。 计算见下图: 好久没玩画图了啊好开心。 代码: #include <iostream>#include <cstdio>#inclu

uva 1342 欧拉定理(计算几何模板)

题意: 给几个点,把这几个点用直线连起来,求这些直线把平面分成了几个。 解析: 欧拉定理: 顶点数 + 面数 - 边数= 2。 代码: #include <iostream>#include <cstdio>#include <cstdlib>#include <algorithm>#include <cstring>#include <cmath>#inc

uva 11178 计算集合模板题

题意: 求三角形行三个角三等分点射线交出的内三角形坐标。 代码: #include <iostream>#include <cstdio>#include <cstdlib>#include <algorithm>#include <cstring>#include <cmath>#include <stack>#include <vector>#include <

XTU 1237 计算几何

题面: Magic Triangle Problem Description: Huangriq is a respectful acmer in ACM team of XTU because he brought the best place in regional contest in history of XTU. Huangriq works in a big compa

音视频入门基础:WAV专题(10)——FFmpeg源码中计算WAV音频文件每个packet的pts、dts的实现

一、引言 从文章《音视频入门基础:WAV专题(6)——通过FFprobe显示WAV音频文件每个数据包的信息》中我们可以知道,通过FFprobe命令可以打印WAV音频文件每个packet(也称为数据包或多媒体包)的信息,这些信息包含该packet的pts、dts: 打印出来的“pts”实际是AVPacket结构体中的成员变量pts,是以AVStream->time_base为单位的显

计算数组的斜率,偏移,R2

模拟Excel中的R2的计算。         public bool fnCheckRear_R2(List<double[]> lRear, int iMinRear, int iMaxRear, ref double dR2)         {             bool bResult = true;             int n = 0;             dou

GPU 计算 CMPS224 2021 学习笔记 02

并行类型 (1)任务并行 (2)数据并行 CPU & GPU CPU和GPU拥有相互独立的内存空间,需要在两者之间相互传输数据。 (1)分配GPU内存 (2)将CPU上的数据复制到GPU上 (3)在GPU上对数据进行计算操作 (4)将计算结果从GPU复制到CPU上 (5)释放GPU内存 CUDA内存管理API (1)分配内存 cudaErro

Java - BigDecimal 计算分位(百分位)

日常开发中,如果使用数据库来直接查询一组数据的分位数,就比较简单,直接使用对应的函数就可以了,例如:         PERCENT_RANK() OVER(PARTITION BY 分组列名 ORDER BY 目标列名) AS 目标列名_分位数         如果是需要在代码逻辑部分进行分位数的计算,就需要我们自己写一个工具类来支持计算了 import static ja

OpenStack离线Train版安装系列—2计算节点-环境准备

本系列文章包含从OpenStack离线源制作到完成OpenStack安装的全部过程。 在本系列教程中使用的OpenStack的安装版本为第20个版本Train(简称T版本),2020年5月13日,OpenStack社区发布了第21个版本Ussuri(简称U版本)。 OpenStack部署系列文章 OpenStack Victoria版 安装部署系列教程 OpenStack Ussuri版

新一代车载(E/E)架构下的中央计算载体---HPC软件架构简介

老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 屏蔽力是信息过载时代一个人的特殊竞争力,任何消耗你的人和事,多看一眼都是你的不对。非必要不费力证明自己,无利益不试图说服别人,是精神上的节能减排。 无人问津也好,技不如人也罢,你都要试着安静下来,去做自己该做的事.而不是让内心的烦躁、焦虑、毁掉你本就不多的热情和定力。 时间不知不觉中,快要来到夏末秋初。一年又过去了一大半,成