Pytorch项目,肺癌检测项目之一

2024-03-08 19:40
文章标签 项目 检测 pytorch 肺癌

本文主要是介绍Pytorch项目,肺癌检测项目之一,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

项目目的:输入人体躯干的三维CT扫描作为输入数据,如果存在肿瘤,希望输出疑似恶性肿瘤的位置。

项目背景:发现处于早期的肺癌对病人生存率有巨大影响,但很难大规模进行。审查CT数据的工作必须由训练有素的专家进行,需要对细节进行细致的关注,当然,绝大部分情况下医生看的片子都没有癌症。

CT的数据叫做:DICOM数据。CT扫描的每一个体素都对应一个数值,这个数值描述的是内部物质的平均质量密度。CT扫描的数据还允许我们通过隐藏我们不感兴趣的部分进行立体查看。

体素数据与CT值

对于一块体素数据,它不是一个立方体,而是1.125mm*1.125mm*2.5mm的一个立方体,如果按照立方体来对数据进行绘制的时候,人会看起来更胖一些,所以如果要按照真实的样貌进行展示还需要加入一个变换比例。CT值是测定人体某一局部或器官密度大小的一种计量单位,通常称为亨氏单位(HU),空气为 -1000 (0g/cm3),致密骨为 +1000(2-3g/cm3)。实际上CT值是CT图像中各组织与X线衰减系数相当的对应值。

观察数据

(1)CT数据是立体3D数据

(2)数据存在重复和错误

(3)数据的标注包括一份某个区域的结节是否为肿瘤以及某个肿瘤是否恶性的标准

理解业务

(1)拿到CT先逐行逐个查看图像

(2)找到其中存在异常的位置,然后用笔把这个位置圈出来留待分析

(3)对所有圈出来的位置进行仔细的研究,根据它的各种特性,比如光泽,形状,大小,位置等信息来决策是否真的是一个肿瘤

(4)做更多的检查,结合经验判断这个肿瘤是否是恶行肿瘤

(5)帮助病人指定治疗方案

解决方案

原始数据---》数据处理---》切割图象---》候选分组---》候选分类---》恶行判断

数据清洗、数据 在全像素空间中寻 对有问题的点位进行分组,加载、数据转换 找有问题的像素 确定一个结节的范围 ,对有结节的图像进行分类,确定是否是肿瘤,对判定为肿瘤的图像进一步分类判断是否为恶行肿瘤

解决方案描述

(1)加载原始数据,把它转化为PyTorch可以处理的数据,也就是我们的tensor数据

(2)使用PyTorch进行数据分割,把存在异常的点位确定出来

(3)把已经确定有问题的区域进行发呢组,这一块不太需要构建一个模型来处理,所以单独拿出来作为一个步骤

(4)构建模型对候选结节分类,区分出它是否是真的肿瘤

(5)对分类结果进行分析,然后根据影像判断肿瘤是良性的还是恶性的。

查看数据

一个CT数据实际上包含两个文件,‘.mhd’文件包含了元数据头部信息,‘.raw’则是存储的三维CT原始数据。前面的文件名称为它的uid,符合DICOM数据命名法。

annotations.csv文件里面给出了结节的位置信息,里面的数据共有5列,第一列是uid,中间三列是坐标位置,最后一列是结节的尺寸,直径信息。

查看数据

candidates.csv是对影响中小圆点的标注,数据也是五列,有区别的是最后一列,candidates.csv的最后一列标明了这个小圆点是否是结节。其中candidates.csv文件中包含了551063条数据,如果我们对分类标签统计一下,可以发现总共有1351条被标注是结节。这个时候数据的问题就来了,在annotation.csv文件里只给出了 1187条结节的信息。

数据比对

这几条数据,比对下,看是否是一个位置,对数据预处理

代码处理

CandidateInfoTuple = namedtuple(
'CandidateInfoTuple',
'isNodule_bool,diameter_mm,series_uid,center_xyz',
)

#放缓存里
@functools.lru_cache(1)
def getCandidateInfoList(requireOnDisk_bool=True):
    mhd_list=glob.glob('/lujing/subset*/*.mhd')
    persentOnDisk_set={os.path.split(p)[-1][:-4] for p in mhd_list}

这篇关于Pytorch项目,肺癌检测项目之一的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/788176

相关文章

Python如何实现PDF隐私信息检测

《Python如何实现PDF隐私信息检测》随着越来越多的个人信息以电子形式存储和传输,确保这些信息的安全至关重要,本文将介绍如何使用Python检测PDF文件中的隐私信息,需要的可以参考下... 目录项目背景技术栈代码解析功能说明运行结php果在当今,数据隐私保护变得尤为重要。随着越来越多的个人信息以电子形

golang内存对齐的项目实践

《golang内存对齐的项目实践》本文主要介绍了golang内存对齐的项目实践,内存对齐不仅有助于提高内存访问效率,还确保了与硬件接口的兼容性,是Go语言编程中不可忽视的重要优化手段,下面就来介绍一下... 目录一、结构体中的字段顺序与内存对齐二、内存对齐的原理与规则三、调整结构体字段顺序优化内存对齐四、内

配置springboot项目动静分离打包分离lib方式

《配置springboot项目动静分离打包分离lib方式》本文介绍了如何将SpringBoot工程中的静态资源和配置文件分离出来,以减少jar包大小,方便修改配置文件,通过在jar包同级目录创建co... 目录前言1、分离配置文件原理2、pom文件配置3、使用package命令打包4、总结前言默认情况下,

python实现简易SSL的项目实践

《python实现简易SSL的项目实践》本文主要介绍了python实现简易SSL的项目实践,包括CA.py、server.py和client.py三个模块,文中通过示例代码介绍的非常详细,对大家的学习... 目录运行环境运行前准备程序实现与流程说明运行截图代码CA.pyclient.pyserver.py参

IDEA运行spring项目时,控制台未出现的解决方案

《IDEA运行spring项目时,控制台未出现的解决方案》文章总结了在使用IDEA运行代码时,控制台未出现的问题和解决方案,问题可能是由于点击图标或重启IDEA后控制台仍未显示,解决方案提供了解决方法... 目录问题分析解决方案总结问题js使用IDEA,点击运行按钮,运行结束,但控制台未出现http://

解决IDEA使用springBoot创建项目,lombok标注实体类后编译无报错,但是运行时报错问题

《解决IDEA使用springBoot创建项目,lombok标注实体类后编译无报错,但是运行时报错问题》文章详细描述了在使用lombok的@Data注解标注实体类时遇到编译无误但运行时报错的问题,分析... 目录问题分析问题解决方案步骤一步骤二步骤三总结问题使用lombok注解@Data标注实体类,编译时

C语言小项目实战之通讯录功能

《C语言小项目实战之通讯录功能》:本文主要介绍如何设计和实现一个简单的通讯录管理系统,包括联系人信息的存储、增加、删除、查找、修改和排序等功能,文中通过代码介绍的非常详细,需要的朋友可以参考下... 目录功能介绍:添加联系人模块显示联系人模块删除联系人模块查找联系人模块修改联系人模块排序联系人模块源代码如下

SpringBoot项目中Maven剔除无用Jar引用的最佳实践

《SpringBoot项目中Maven剔除无用Jar引用的最佳实践》在SpringBoot项目开发中,Maven是最常用的构建工具之一,通过Maven,我们可以轻松地管理项目所需的依赖,而,... 目录1、引言2、Maven 依赖管理的基础概念2.1 什么是 Maven 依赖2.2 Maven 的依赖传递机

Vue项目中Element UI组件未注册的问题原因及解决方法

《Vue项目中ElementUI组件未注册的问题原因及解决方法》在Vue项目中使用ElementUI组件库时,开发者可能会遇到一些常见问题,例如组件未正确注册导致的警告或错误,本文将详细探讨这些问题... 目录引言一、问题背景1.1 错误信息分析1.2 问题原因二、解决方法2.1 全局引入 Element

SpringBoot使用Apache Tika检测敏感信息

《SpringBoot使用ApacheTika检测敏感信息》ApacheTika是一个功能强大的内容分析工具,它能够从多种文件格式中提取文本、元数据以及其他结构化信息,下面我们来看看如何使用Ap... 目录Tika 主要特性1. 多格式支持2. 自动文件类型检测3. 文本和元数据提取4. 支持 OCR(光学