本文主要是介绍空洞全卷积网络 论文阅读,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
基于空洞全卷积网络的病理性肺组织的语义分割
原文:Anthimopoulos M, Christodoulidis S, Ebner L, et al. Semantic Segmentation of Pathological Lung Tissue with Dilated Fully Convolutional Networks[J]. 2018.
简介
针对间质性肺病(Interstitial Lung Diseases,ILDs),本文提出一种空洞全卷积网络用于辅助诊断,其输入数据可为任意大小的CT图像,输出结果为相应的标签。
-
数据集:172个病例,其中109个病例来自Geneva University Hospital(HUG)的关于间质性肺病的公开数据集,63个病例来自Bern University Hospital-“Inselspital”(INSEL)。INSEL的数据为3D图像,而HUG的数据为2D图像且间距为10-15mm。两者的切片厚度均为1-2mm。数据集由两名经验丰富的医师标注,分类标签为6种:
- normal
- ground glass opacity
- micronodules
- consolidation
- reticulation
- honeycombing
注:医师标注未标记全部数据。
-
训练方式:端到端、半监督。
-
空洞卷积:在卷积核的非零值之间插入零值,从而扩大卷积核。
空洞卷积解决的问题:
- Up-sampling or pooling layer is deterministic;
- 内部数据结构丢失;
- 空间层级化信息丢失;
- 小物体无法重建。
注:关于空洞卷积可参考知乎回答
网络结构
网络共13层卷积层,感受野的大小为 287 ∗ 287 287*287 287∗287。其中,前十层的32个卷积核大小均为 3 ∗ 3 3*3 3∗3,其空洞率分别为1,1,2,3,5,8,13,21,34和55。其中,前十层的输出与网络的输入相结合,因此特征图谱共为321,并将其作为剩余网络的输入,dropout=0.5。
空洞率基于斐波那契数列,避免网格问题。
最后三层卷积核大小为 1 ∗ 1 1*1 1∗1,输出结果由softmax函数计算出分类类别的概率。在每一卷积层后都跟随一个BN层。损失函数为交叉熵,采用Adam优化器,学习率为0.0001。
对于注释区域相对应的所有像素赋予与特定集合中其类别的样本数成反比的权重。
该方法用于解决如下问题:
- 大部分数据未标注;
- 标签类别分布不均。
半监督采用半监督聚类算法,其损失函数为:
其中, y ^ \hat{y} y^为预测标签, y y y为采用独热编码(one-hot encoding)的正确标签, C C C为类别数, w s i w_s^i wsi为类别 i i i在监督学习中的权重, w u w_u wu为无监督学习中的权重, α \alpha α为scaler。
在验证集上迭代50次无明显变化(明显变化为至少变化0.5%)后停止。
为避免过拟合,采用图像增强。
结果
这篇关于空洞全卷积网络 论文阅读的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!