前列腺癌检测 AI 算法登上《柳叶刀》:分类性能超过人类专家,还能完成其他临床任务...

本文主要是介绍前列腺癌检测 AI 算法登上《柳叶刀》:分类性能超过人类专家,还能完成其他临床任务...,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

来源:AI科技评论

本文约2200字,建议阅读6分钟。

本文为你介绍一种基于人工智能的算法,其用来处理常规临床应用任务,具体而言是辅助前列腺疾病诊断。

近日,《柳叶刀-数字医疗》期刊刊登了一篇“用人工智能算法诊断前列腺癌”的论文,论文中,作者除了报告了一项盲法临床验证研究,还部署了一种基于人工智能的算法用来处理常规临床应用任务,具体而言是辅助前列腺疾病诊断。

在算法性能测试中,该 AI 算法用内部数据得到的AUC是0.997,在UPMC外部验证数据集上,其AUC是0.991。换句话说,性能指标超过了一般的AI算法。

论文地址:

https://www.thelancet.com/journals/landig/article/PIIS2589-7500(20)30159-X/fulltext

这篇论文的作者是来自UPMC和匹兹堡大学的研究员,他们提出的算法的核心技术是多层卷积神经网络,专门为图像分类任务而设计。整个算法工作的流程有三个连续的步骤:组织检测、分类和病理图片级别分析。 

算法和临床应用一览

具体而言,先使用数千个图块对梯度提升(Gradient Boosting)分类器进行训练,目的是为了区分图片中的组织区域和背景区域;然后用分离出的组织区域训练三个基于CNN的模型。

这些模型接受了1,357,480张贴有标签图块的训练,这些图块是从549张图片的“手工标注”中提取出来的,而这549张图片则是根据不同的标准,从65,000张图片中挑出来的。

值得一提的是,“手工标注”由三位资深病理学家完成,每位都从业20~40年。

模型训练好之后,作者又用了1,600张图片进行了测试,这1,600张图片取自100名在 UPMC 就诊的疑似前列腺癌患者。

测试结果是:AI在前列腺癌症检测方面表现出了98%的敏感性和97%的特异性,此外,不仅是癌症检测,在完成例如肿瘤分级等其他临床上重要的特征任务方面,也有比较高的性能。更值得注意的是,AI还“看”出了6张人类专家没检测出的前列腺癌图片。

同时,作者也提出,这并不一定意味着这台机器比人类更优秀。但对于经验较少的病理学家来说,该算法可以作为一个故障保险机制,帮助他们“漏检”错过的病例。

毕竟在评估这些病例的过程中,病理学家可能只是在病人的样本中看到了其他地方恶性肿瘤的足够证据,从而推荐治疗。不过,对于经验较少的病理学家来说,该算法可以作为一个故障保险机制,发现否则可能会错过的病例。

作者在论文中还表示,在训练人工智能算法和模型的时候,过拟合是一个非常常见的问题,尽管在训练数据中进行测试时表现良好。但在训练集之外的数据上进行测试时,性能会出现下降。虽然有多种策略可以避免过度拟合(例如,交叉验证),但真正的性能只能通过外部数据集的盲法研究来确定。

在这里,作者创新性地使用了外部的、不同地理、盲试验数据集( blinded dataset)来测试算法的性能和实用性。在论文中,作者称:“据我们所知,很少有医学研究尝试过这样的验证,尤其是对于应用范围较窄,性能明显较低的算法。”

网友评论:褒贬不一

此项研究的新闻也被网友贴在了Reddit的人工智能版块,引起了一波小讨论,有的网友持赞成态度,肯定了AI在癌症和心脏病发病几率预测方面的工作;也有的网友,对作者使用的算法产生了好奇,也提出了精度和召回率的疑问。


例如,上面这位网友:AI对于医疗行业来说不可或缺,特别是在预测癌症和心脏病发病几率方面。

这应该是属于专用的算法,没有数据和代码共享,这让复现成为了一个问题......我们应该如何解决这个问题。

还有网友说:“虽然有非常好的结果,但在精确度方面并不比专家高出多少。”在这条帖子下面,也有网友“交流”到:“普通患者不太可能从专家小组那里得到诊断,他们只是从普通的医生那里得到诊断。而人工智能可以让每个人都能得到“专家”诊断。”

AI会取代影像科医生么?

在今年一月份,关于前列腺癌AI辅助诊断研究就曾经发表在《柳叶刀肿瘤》杂志,当时作者在论文中得出的结论是:用AI系统来检测和分级前列腺穿刺活检样品中的癌症,在部分场景中其等级可与前列腺病理学专家相媲美。

另外,在1月2日,Google Health联合多个机构在《Nature》杂志上发表了一篇论文,介绍了一种新型的深度学习钼靶影像系统。根据Google的说法,这个系统与之前的模型相比,该模型有效减少了乳腺癌被错误识别或遗漏的情况,将乳腺癌检测的假阳性率降低了5.7%,假阴性率也降低了9.4%,并号称击败了6名受过“”全日制教育”的放射科医生。

当然,Google对该成果过于夸大的公关措辞,随之也引来了图灵奖得主Yann Lecun以及中美多位知名学者在社交媒体上的炮轰。

可以看到,当前的一些AI医学研究动不动就是“超越专家”、“打败人类”,尤其是在影像科这种计算机视觉“容易”攻克的领域,AI即将取代人类的声音最盛。

那么问题来了,AI在医学影像方面取代人类么?换句话说,当前影像学有哪些地方在短期离不开人类。

 

2018年,英国影像学AI大牛Hugh Harvey发布了一篇《Why AI will not replace radiologists》,称:“无论你已经有多么深信甚至痴迷AI和自动化的诸多可能性,要想在不久的将来完全替代人类影像科医生是完全不可能的。”

当时,他给出了三个理由:第一、医学影像科医生不是只会看片子,诊断推导仍然是最难啃的那块骨头,也是人类有最多存在感的地方;第二、人类始终要承担最终责任,几乎不可想象人工智能系统的所有者在人命关天时,会让机器负全部法律责任;第三、生产力进步将驱动需求,最明显的表现是:在影像科,只要你能安排多一个医生来检查患者,就总会有患者来补上这个空位。

这也正如《柳叶刀-数字医疗》那篇论文而言,AI算法或许很优秀,或许在很多方面准确度、精度比人类高,但是人类终究是不可或缺的。

https://scitechdaily.com/artificial-intelligence-identifies-prostate-cancer-with-near-perfect-accuracy/

https://zhuanlan.zhihu.com/p/33424522

https://www.thelancet.com/journals/landig/article/PIIS2589-7500(20)30159-X/fulltext

编辑:王菁

校对:林亦霖

这篇关于前列腺癌检测 AI 算法登上《柳叶刀》:分类性能超过人类专家,还能完成其他临床任务...的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/901345

相关文章

Vue3 的 shallowRef 和 shallowReactive:优化性能

大家对 Vue3 的 ref 和 reactive 都很熟悉,那么对 shallowRef 和 shallowReactive 是否了解呢? 在编程和数据结构中,“shallow”(浅层)通常指对数据结构的最外层进行操作,而不递归地处理其内部或嵌套的数据。这种处理方式关注的是数据结构的第一层属性或元素,而忽略更深层次的嵌套内容。 1. 浅层与深层的对比 1.1 浅层(Shallow) 定义

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

不懂推荐算法也能设计推荐系统

本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系

性能测试介绍

性能测试是一种测试方法,旨在评估系统、应用程序或组件在现实场景中的性能表现和可靠性。它通常用于衡量系统在不同负载条件下的响应时间、吞吐量、资源利用率、稳定性和可扩展性等关键指标。 为什么要进行性能测试 通过性能测试,可以确定系统是否能够满足预期的性能要求,找出性能瓶颈和潜在的问题,并进行优化和调整。 发现性能瓶颈:性能测试可以帮助发现系统的性能瓶颈,即系统在高负载或高并发情况下可能出现的问题

基于人工智能的图像分类系统

目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 图像分类是计算机视觉中的一个重要任务,目标是自动识别图像中的对象类别。通过卷积神经网络(CNN)等深度学习技术,我们可以构建高效的图像分类系统,广泛应用于自动驾驶、医疗影像诊断、监控分析等领域。本文将介绍如何构建一个基于人工智能的图像分类系统,包括环境

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

康拓展开(hash算法中会用到)

康拓展开是一个全排列到一个自然数的双射(也就是某个全排列与某个自然数一一对应) 公式: X=a[n]*(n-1)!+a[n-1]*(n-2)!+...+a[i]*(i-1)!+...+a[1]*0! 其中,a[i]为整数,并且0<=a[i]<i,1<=i<=n。(a[i]在不同应用中的含义不同); 典型应用: 计算当前排列在所有由小到大全排列中的顺序,也就是说求当前排列是第

认识、理解、分类——acm之搜索

普通搜索方法有两种:1、广度优先搜索;2、深度优先搜索; 更多搜索方法: 3、双向广度优先搜索; 4、启发式搜索(包括A*算法等); 搜索通常会用到的知识点:状态压缩(位压缩,利用hash思想压缩)。

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文