采用至强® + OpenVINO加速 助力改进肺癌检测

2024-02-09 03:50

本文主要是介绍采用至强® + OpenVINO加速 助力改进肺癌检测,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

“经证实,Predible Health 的深度学习解决方案可有效提升放射科医生诊断精度和效率,在癌症筛查方面尤为突出。通过与英特尔合作,我们能够在医院部署解决方案,确保了工作流程的无缝融合,以及研究中的实时推理。”
——Suthirth Vaidya, Predible Health 首席执行官

肺癌是一种致命癌症,年发病量达 334 万例。据估计,每年全球因肺癌死亡的人数多达
188 万1。早期检测是长期存活的关键:四期肺癌的 5 年存活率仅为 5%。但如果在一期时就能发现,患者的 5 年存活率可达到 56%。
这正是技术的用武之地。美国国家肺癌筛查试验 (National Lung Screening Trial, NLST) 显示,接受低剂量螺旋计算机断层扫描 (Computed Tomography, CT) 的受试者死于肺癌的风险比接受标准胸部 X 光的受试者低 20%。
能够改善患者治疗效果的技术
得益于多检测器 CT 扫描技术的发展,单次屏气高分辨率容积成像能够在可接受的辐射照射水平下实现。多项观察性研究表明,对肺部进行低剂量螺旋 CT 扫描能够检测到更多结节和肺癌,包括早期癌症。潜在恶性肺结节可通过胸部 CT 扫描识别,及早干预能够提高长期存活的几率。
解决检测挑战
一次典型的胸部 CT 扫描包含 300-500 个切片,而放射科医生必须通过逐个检查切片来检测肺结节。肺结节是肺部的微小组织块,在 CT 扫描中显示为圆形、白色阴影; 大多数肺结节是良性的,它们通常难以检测和记录。肺结节的检测需要特殊的专业知识。随着肺癌筛查计划的广泛实施,放射科医生的负担正迅速加重。计算机辅助检测(Computer-aided-detection, CAD) 在帮助放射科医生解读 CT 和 MRI 扫描等高维成像数据方面所起的作用日益凸显。CAD 算法也成功提高了放射科医生检测肺结节的能力。CAD 算法原来依靠的是需要自定义工程的手动设计特征,随着深度学习和卷积神经网络(Convolutional Neural Networks, CNN) 的出现,现已开始转向通过 CNN 从数据中学习特征。
Predible 与英特尔携手应对肺癌检测的挑战*
Predible Health 和英特尔公司强强联手,共同抗击肺癌。用于在 CT 扫描图中检测肺结节的 Predible Health 深度学习算法已采用英特尔® OpenVINO™ 工具套件分发版在强大的英特尔® 至强® 可扩展处理器上得到了优化。

算法、工作流程、要求
Predible 设计制作了一款软件工具,可从影像归档和通信系统(Picture Archiving and Communication System, PACS) 中自动查询胸部 CT DICOM 图像,对图像进行处理,并使用神经网络来检测肺结节。医学数字成像和通信 (Digital Imaging and Communications in Medicine, DICOM) 是处理、存储、打印和传输医学成像信息的行业标准方法。神经网络对 DICOM 系列进行处理后,结果会发送回 PACS,供放射科医生查看。

深度学习系统经过训练后,能够根据胸部 CT 扫描结果对肺结节进行检测和分割。该系统包含三个阶段,每个阶段都会使用神经网络组合来解决特定子任务。
计算要求
为预估计算要求,英特尔和 Predible Health 的研究人员假设从开始采集图像到放射科医生开始解读图像,中间的操作时间为1 小时。也就是说,深度学习算法有大约 30 分钟的时间来处理胸部 CT 扫描以及将产生的二次采集推送到 PACS,剩下 30 分钟时间进行图像采集。医院可使用专用或共享的计算资产进行基于深度学习的推理。专用计算资产成本较高,可能会限制性能,导致推理时间延长;至于共享计算资产,根据临床工作流程,计算资源共享可能会延长或缩短推理时间。
在该研究中,英特尔® OpenVINO™ 工具套件分发版针对工作流程阶段 1-3 中的图像识别优化的补丁在英特尔® 至强® 可扩展处理器上执行,并将性能与相同计算平台上未经优化的 PyTorch* 软件基准进行了比较。
在这里插入图片描述

其他预处理和后处理阶段未加入对比,因为这些阶段通常在已部署优化库的基于英特尔® 处理器的系统上执行。预处理和后处理阶段可能需要数分钟时间,这会根据所选的计算资产(专用或共享)而有所不同。这就为各个深度学习阶段争取到了数分钟的处理时间。
英特尔® OpenVINO™ 工具套件分发版实现的优化
在英特尔® OpenVINO™ 工具套件分发版等工具的支持下,英特尔® 至强® 可扩展处理器可为人工智能模型推理提供一个灵活的平台。
该工具套件的离线模型优化器 (Model Optimizer, MO) 可优化图形级的结构,如节点合并、批量归一化消除和常量折叠。输出结果是中间表示 (Intermediate Representation, IR) .xml 文件和包含模型权重的 .bin 文件。对于在线流程,该工具套件的推理引擎可根据目标硬件优化 MO 输出:英特尔® 至强® 处理器、英特尔® 酷睿™ 处理器、英特尔® 图形处理器、英特尔® 现场可编程门阵列 (FPGA) 或英特尔® Movidius™ Myriad™ 视觉处理器(VPU)。面向深度神经网络的英特尔® 数学核心函数库(英特尔® MKL-DNN)是开源性能库,可显著提高英特尔® CPU 上的深度神经网络的性能。
与在双路仅运行工具套件的一个实例相比,通过在 CPU 各路运行工具套件的多个实例,可进一步提高性能(参见图 2)。每个实例与一个或多个内核绑定,从而提升内核利用率。例如,如上所示,双路英特尔® 至强® 可扩展处理器上运行了工具套件的 8 个实例。
在这里插入图片描述
引擎可根据目标硬件优化 MO 输出:英特尔® 至强® 处理器、英特尔® 酷睿™ 处理器、英特尔® 图形处理器、英特尔® 现场可编程门阵列 (FPGA) 或英特尔® Movidius™ Myriad™ 视觉处理器(VPU)。面向深度神经网络的英特尔® 数学核心函数库(英特尔® MKL-DNN)是开源性能库,可显著提高英特尔® CPU 上的深度神经网络的性能。
与在双路仅运行工具套件的一个实例相比,通过在 CPU 各路运行工具套件的多个实例,可进一步提高性能(参见图 2)。每个实例与一个或多个内核绑定,从而提升内核利用率。例如,如上所示,双路英特尔® 至强® 可扩展处理器上运行了工具套件的 8 个实例。
性能比较
算法性能:肺叶分割模型显示肺部组织研究联盟 (Lung Tissue Research Consortium, LTRC) 数据集的平均 dice 系数为 0.95。结节检测显示,在 LIDC-IDRI 数据集中,每次 CT 扫描出现一例假阳性的敏感性和特异性比率为 89%。结节分割模型使用来自肺部图像数据库联盟 (Lung Image Database Consortium, LIDC) 和图像数据库资源计划 (Image Database Resource Initiative, IDRI) 的数据集进行了训练和验证。与参加 LIDC-IDRI 研究的放射科医生注释的轮廓交叉区域相比,该模型显示平均 dice 系数为 0.68。
计算性能:英特尔和 Predible Health 团队选择了 3 个不同的英特尔® 至强® 可扩展处理器 SKU 作为目标实施硬件。图 3 列出了每个处理器的峰值 TFLOPS(单精度,FP32)。所有推理模型均使用 FP32 处理。附录中提供了测试所用的软硬件完整配置。
如图 4 所示,在 Predible 肺部 CT 模型的不同阶段,各个模块显示性能大幅提升。图 5 描绘了优化前与优化后 Predible 模型中每个模块的层数, 清晰地展示了该工具套件的强大力量。
有助于改进性能的三个主要优化步骤:
1.基于英特尔® OpenVINO™ 工具套件分发版的推理模型优化
2.在多路 CPU上运行英特尔® OpenVINO™ 工具套件分发版的多个实例
3.定制推理模型优化

通过定制推理模型优化,有机会合并多层或开放更多处理通道, 继而从硬件利用率提升中获益。后续版本将支持这些定制优化, 惠及更广泛的人工智能模型社区。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
表 1 所示为肺部 CT 模型每个阶段的补丁数以及使用所选英特尔® 至强® 处理器完成每个阶段所花费的总时间。使用英特尔® 至强® 金牌和铂金 CPU 时,所有模块总耗时不到 1 分钟,使用英特尔® 至强® 银牌 CPU 时,总耗时不到 5 分钟,由此可见延迟与成本的权衡取舍。对于只执行一个推理模型的专用计算资产,比较合理的做法是选择一款符合吞吐量需求同时保持较低成本的入门级处理器。对于同时执行多个推理模型且吞吐量和延迟需求可能各有不同的共享计算资产,金牌和铂金处理器可提供所需的计算能力与敏捷性,处理具有不同性能需求的模型的并发调用。此外, 表 1 还说明了 Predible 肺部 CT 模型各阶段中每个模块所选的能在不同 CPU 上获得最佳性能的实例数和批次大小。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

关注英特尔边缘计算社区,表示您确认您已年满 18 岁,并同意向英特尔分享个人信息,以便通过电子邮件和电话随时了解最新英特尔技术和行业趋势。您可以随时取消订阅。英特尔网站和通信内容遵守我们的隐私声明和使用条款。

这篇关于采用至强® + OpenVINO加速 助力改进肺癌检测的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/693035

相关文章

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

烟火目标检测数据集 7800张 烟火检测 带标注 voc yolo

一个包含7800张带标注图像的数据集,专门用于烟火目标检测,是一个非常有价值的资源,尤其对于那些致力于公共安全、事件管理和烟花表演监控等领域的人士而言。下面是对此数据集的一个详细介绍: 数据集名称:烟火目标检测数据集 数据集规模: 图片数量:7800张类别:主要包含烟火类目标,可能还包括其他相关类别,如烟火发射装置、背景等。格式:图像文件通常为JPEG或PNG格式;标注文件可能为X

客户案例:安全海外中继助力知名家电企业化解海外通邮困境

1、客户背景 广东格兰仕集团有限公司(以下简称“格兰仕”),成立于1978年,是中国家电行业的领军企业之一。作为全球最大的微波炉生产基地,格兰仕拥有多项国际领先的家电制造技术,连续多年位列中国家电出口前列。格兰仕不仅注重业务的全球拓展,更重视业务流程的高效与顺畅,以确保在国际舞台上的竞争力。 2、需求痛点 随着格兰仕全球化战略的深入实施,其海外业务快速增长,电子邮件成为了关键的沟通工具。

基于 YOLOv5 的积水检测系统:打造高效智能的智慧城市应用

在城市发展中,积水问题日益严重,特别是在大雨过后,积水往往会影响交通甚至威胁人们的安全。通过现代计算机视觉技术,我们能够智能化地检测和识别积水区域,减少潜在危险。本文将介绍如何使用 YOLOv5 和 PyQt5 搭建一个积水检测系统,结合深度学习和直观的图形界面,为用户提供高效的解决方案。 源码地址: PyQt5+YoloV5 实现积水检测系统 预览: 项目背景

JavaFX应用更新检测功能(在线自动更新方案)

JavaFX开发的桌面应用属于C端,一般来说需要版本检测和自动更新功能,这里记录一下一种版本检测和自动更新的方法。 1. 整体方案 JavaFX.应用版本检测、自动更新主要涉及一下步骤: 读取本地应用版本拉取远程版本并比较两个版本如果需要升级,那么拉取更新历史弹出升级控制窗口用户选择升级时,拉取升级包解压,重启应用用户选择忽略时,本地版本标志为忽略版本用户选择取消时,隐藏升级控制窗口 2.

SigLIP——采用sigmoid损失的图文预训练方式

SigLIP——采用sigmoid损失的图文预训练方式 FesianXu 20240825 at Wechat Search Team 前言 CLIP中的infoNCE损失是一种对比性损失,在SigLIP这个工作中,作者提出采用非对比性的sigmoid损失,能够更高效地进行图文预训练,本文进行介绍。如有谬误请见谅并联系指出,本文遵守CC 4.0 BY-SA版权协议,转载请联系作者并注

一种改进的red5集群方案的应用、基于Red5服务器集群负载均衡调度算法研究

转自: 一种改进的red5集群方案的应用: http://wenku.baidu.com/link?url=jYQ1wNwHVBqJ-5XCYq0PRligp6Y5q6BYXyISUsF56My8DP8dc9CZ4pZvpPz1abxJn8fojMrL0IyfmMHStpvkotqC1RWlRMGnzVL1X4IPOa_  基于Red5服务器集群负载均衡调度算法研究 http://ww

生信圆桌x生信分析平台:助力生物信息学研究的综合工具

介绍 少走弯路,高效分析;了解生信云,访问 【生信圆桌x生信专用云服务器】 : www.tebteb.cc 生物信息学的迅速发展催生了众多生信分析平台,这些平台通过集成各种生物信息学工具和算法,极大地简化了数据处理和分析流程,使研究人员能够更高效地从海量生物数据中提取有价值的信息。这些平台通常具备友好的用户界面和强大的计算能力,支持不同类型的生物数据分析,如基因组、转录组、蛋白质组等。

[数据集][目标检测]血细胞检测数据集VOC+YOLO格式2757张4类别

数据集格式:Pascal VOC格式+YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):2757 标注数量(xml文件个数):2757 标注数量(txt文件个数):2757 标注类别数:4 标注类别名称:["Platelets","RBC","WBC","sickle cell"] 每个类别标注的框数:

sqlite不支持中文排序,采用java排序

方式一 不支持含有重复字段进行排序 /*** sqlite不支持中文排序,改用java排序* 根据指定的对象属性字段,排序对象集合,顺序* @param list* @param field* @return*/public static List sortListByField(List<?> list,String field){List temp = new ArrayList(