本文主要是介绍医学影像的特征提取--python—pyradiomics库,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
医学影像的特征提取
在对医学影像进行处理时,很重要的一个方面就是对于图像的特征提取。这直接关系到后续对于图像的判读,分类等操作。那么今天就为大家介绍python中一个非常高效便捷的库——pyradiomics库。
1. pyradiomics库的安装
如果你使用的是anaconda的IDE,那么可以使用cmd进行安装:在anaconda的Script文件里打开命令行(shift+右键即可):直接conda(or pip) install pyradiomics
其他情况:
-
确保计算机已经安装python,并且版本在2.7或者3.4以上
-
在https://github.com/Radiomics/pyradiomics上把项目下载下来并解压
-
打开cmd,并进入解压后的目录
-
在cmd中运行:python -m pip install -r requirements.txt(用于安装pyradiomics所需的依赖)
-
在cmd中运行:python setup.py install
-
安装完成,打开python,import radiomics,如果不报错,则表示安装成功
2.pyradiomics的使用示例
首先我给出示例文件:
链接:https://pan.baidu.com/s/1yLymOYIZ11if1J5VVHzhQg
密码:deh4
示例文件是一个大脑的CT影像序列,你可以这样理解,我们平时看到的CT图片就是其中一张,而医生看的却是由这一帧一帧图片构成的“视频”——也就是CT影像序列。
现在我们先看代码(这不是我写的,后面我会注明出处,但是我亲自检验过,并发现一些问题):
import radiomics
import radiomics.featureextractor as FEE# 文件名
main_path = '...'
ori_name = r'\brain1_image.nrrd'
lab_name = r'\brain1_label.nrrd'
para_name = r'\Params.yaml'# 文件全部路径
ori_path = main_path + ori_name
lab_path = main_path + lab_name
para_path = main_path + para_name
print("originl path: " + ori_path)
print("label path: " + lab_path)
print("parameter path: " + para_path)# 使用配置文件初始化特征抽取器
extractor = FEE.RadiomicsFeaturesExtractor(para_path)
print ("Extraction parameters:\n\t", extractor.settings)
print ("Enabled filters:\n\t", extractor._enabledImagetypes)
print ("Enabled features:\n\t", extractor._enabledFeatures)# 运行
result = extractor.execute(ori_path,lab_path) #抽取特征
print ("Result type:", type(result)) # result is returned in a Python ordered dictionary
print ("")
print ("Calculated features")
for key, value in result.items(): #输出特征print ("\t", key, ":", value)
就以上程序说明几个问题:
- 就Params.yaml文件进行解释:下图是它的一部分,我们大可将其理解为一种字典结构的文件,它告诉了程序我们要输入怎样的图片,我们需要得到哪些特征。就比如如果你想就获取的特征进行自定义,完全可以在Params.yaml文件中进行修改,文件里有详细的注释,就不用我解释了:
2.之前在运行这个程序时,很多时候会报错:No label object with label 1,找遍整个程序我也没看见label 1在哪,而且这个库封装的相当完好,你根本看不出来哪里有问题。后来,在这里找到了症结所在:
原来他在Params.yaml中把label写死了,我解释一下他的含义:
我们常见的医疗图片像素值是从0~255,对于掩模,我们常用白色标记出目标位置,而黑色作为背景。白色的像素是255,而他这里却写的1,也就是说,他对医疗图片像素进行了二值化处理,白色不就是1了嘛。所以,在使用时,我们只需要把label改为我们掩模图中目标区域的像素值即可。
3.关于nrrd格式的解析。nrrd和dcm格式差不多,都是医疗图像格式,他们都是有病人信息,图像信息两部分构成。这里可以告诉大家的是,我们传入该库里的函数的图像格式都必须是nrrd的(我也对此表示很烦)。
在实际用的时候,我的数据是png格式的掩模,分开的dcm格式的CT原图。但是我们要将一个人的单个dcm转换为nrrd序列的话,他的病人信息中有一个名字大概叫做“序列信息”的家伙就至关重要了,他决定了我们dcm作为构建“视频”的前后顺序。因此,我找了一个常用的实例dcm(github上找的),进行了“换信息头”的操作,就是用别人的头,而用我的图像信息。(其实这里是因为我的dcm貌似格式和其他dcm不太一样,不能用pydicom库打开,我能说dcm这个文件标准已经改了四次了吗【手动苦笑】)
其实,有很多人问png,jpg等常见的图片形式能不能转换为dcm,nrrd格式,那么以上不失为一种好的方法。
以下是我的代码,仅供参考:
import numpy as np
import SimpleITK as itk
import cv2
import matplotlib.pyplot as plt
import os
base=r'C:/Users/……/Desktop/ct_transport/dcm_' #这一部分做好文件夹的准备
i=1
while(i<21):file_name=base+str(i)os.mkdir(file_name)i=i+1
for i in range(20): #以下是对每一个人进行循环,达到一人png全部转为dcm后再转为nrrd格式;in_path=r'C:/Users/……/Desktop/ABC/%d/png/'%(i+1109)x=0for s in os.listdir(in_path): #对每一个人的png进行循环,转换为dcm(换信息头)in_path_per = os.path.join(in_path,s)print(in_path_per)img = cv2.imread(in_path_per)# in_path_dcm=r'C:\Users\……\Desktop\CT\10080.dcm'data2=cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)ds = pydicom.dcmread(r"liver\image_%d"%x)ds.PixelData = data2.tostring()#ds.Rows, ds.Columns = data2.shape# data1 = ds.pixel_array# plt.imshow(data1, "gray")# plt.show()out_path='C:/Users/……/Desktop/ct_transport/dcm_%d/%d.dcm'%(i+1,x+1)#这个应该是每一个人的每一个图片,外面用i区别表示,里面用x区别表示;ds.save_as(out_path)x=x+1in_path_dcm = r'C:/Users/……/Desktop/ct_transport/dcm_%d'%(i+1)series_file_names = itk.ImageSeriesReader().GetGDCMSeriesFileNames(in_path_dcm)# series_file_names=sitk.ImageSeriesReader.GetGDCMSeriesFileNames(in_path,series_ids[1])#print(tuple(list(series_file_names)[::-1]))series_reader = itk.ImageSeriesReader()series_reader.SetFileNames(series_file_names)image3D = series_reader.Execute()itk.WriteImage(image3D, 'C:/Users/……/Desktop/ct_test_nrrd/mask_%d.nrrd'%(i+1))#以一个人为单位,进行了存储print('完成一个人')
4.输出格式
输出就是一个字典结构,但是,要注意有很多是无关信息,比如库的版本等,这是大家用的时候可以做一些筛选。其实他的特征也都是3D特征。
以下就是我使用其代码的兄弟的公众号,在此向他表示感谢,也欢迎大家关注!
这篇关于医学影像的特征提取--python—pyradiomics库的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!