本文主要是介绍CIRDataset:用于临床可解释肺结节放射组学和恶性肿瘤预测的大规模数据集,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
文章目录
- CIRDataset: A Large-Scale Dataset for Clinically-Interpretable Lung Nodule Radiomics and Malignancy Prediction
- 摘要
- 详情
- 结果
CIRDataset: A Large-Scale Dataset for Clinically-Interpretable Lung Nodule Radiomics and Malignancy Prediction
摘要
肺结节表面的尖刺/分叶状突起、尖锐/弯曲的尖刺是癌症恶性程度的良好预测因素,因此,放射科医生会定期评估和报告,作为标准化的肺RADS临床评分标准的一部分。考虑到结节的3D几何形状和放射科医生的2D逐片评估,手动穿刺/分叶注释是一项乏味的任务,因此到目前为止,还没有公共数据集来探索这些临床报告的特征在SOTA恶性预测算法中的重要性。作为本文的一部分,我们发布了一个大规模的临床可解释放射组学数据集CIRDataset,其中包含来自两个公共数据集LIDC-IDRI(N=883)和LUNGx(N=73)的956个放射科医生对分割的肺结节进行的QA/QC标记/分叶注释。我们还提出了一种基于多类Voxel2Mesh扩展的端到端深度学习模型,用于分割结节(同时保留尖峰)、分类尖峰(尖锐/毛刺和弯曲/分叶),并进行恶性预测。先前的方法已经对LIDC和LUNGx数据集进行了恶性肿瘤预测,但没有对任何临床报告/可操作的特征进行可靠的归因(由于通用归因方案的已知超参数敏感性问题)。随着这一全面注释的CIRDataset和端到端深度学习基线的发布,我们希望恶性肿瘤预测方法能够验证它们的解释,对照我们的基线进行基准测试,并提供临床可操作的见解。
代码地址
详情
结节毛刺量化数据集样本;第一行输入的CT图像;输入CT图像上的第二行叠加区域失真图和每个分类的轮廓;第三行-具有顶点分类的三维网格模型;红色:毛刺,蓝色:小叶,白色:结节(在线彩色图)
过去已经提出了几种深度学习体素/像素分割算法,但其中大多数算法倾向于平滑构成毛刺和分叶特征的高频尖峰(Voxel2Mesh[16]是迄今为止唯一保留这些尖峰的例外)。通过UNet、FPN和Voxel2Mesh进行的随机LIDC训练/验证分割的结节分割的Jaccard指数为0.775/0.537、0.685/0.592和0.778/0.609,峰值分割的Jaccard指数为0.450/0.203、0.332/0.236和0.493/0.476。
描述了基于多类Voxel2Mesh扩展的端到端深度学习架构。基于UNet的标准体素编码器/解码器(顶部)从输入CT体积中提取特征,而网格解码器将初始球形网格变形为与目标形状匹配的越来越精细的分辨率网格。网格变形利用通过学习邻域(LN)采样技术从体素解码器采样的特征向量,并且还在高曲率区域中执行具有增加的顶点计数的自适应去极化。我们通过引入额外的网格解码器层来扩展该体系结构,用于毛刺和分叶分类。我们还对来自最终网格非冷却层的顶点(形状特征)进行采样,作为全连通恶性肿瘤预测网络的输入。我们可选地将来自最后一个体素编码器层的深层体素特征添加到恶性肿瘤预测网络
结果
这篇关于CIRDataset:用于临床可解释肺结节放射组学和恶性肿瘤预测的大规模数据集的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!