深度丨吴恩达团队最新论文:用CNN算法识别肺炎影像,准确率超过人类医生

简介:

吴恩达团队又有新动态!北京时间11月16日,吴恩达连发两条推文,称“放射科医生应该担心他们会丢掉工作了!最新突破——利用胸部X光片,我们可以用深度学习方法诊断肺炎,在这点上,算法做得比人类医生好。论文已发布在arXiv上。”

42f5962eb05b78f4fe4b938e09fe5c85c9b1e215

关注大数据文摘微信公众号,在后台对话框内回复“肺炎”,即可下载这篇论文拜读啦!

论文中用到了CheXNet算法,它可以诊断14种病症,在肺炎诊断方面,比放射科专家单独诊断的准确率更高。

73d44689859cdb327f7fea9722163ce3735d6ec5

图:放射科医生Matthew Lungren(左)与研究生Jeremy Irvin和Pranav Rajpurkar会面,讨论算法检测结果。 研究人员利用算法开发的工具生成了这些图像,这些图像与热图类似,并显示了X光片中可能为肺炎的区域。 (图片来源:L.A. Cicero)

斯坦福机器学习小组研究生,论文并列第一作者Pranav Rajpurkar说:“通过X光胸片来诊断肺炎等疾病极具挑战性,不同的放射科医师得到的结论都可能不一样。我们的兴趣在于开发机器学习算法,从数十万胸片诊断中学习,并做出准确的诊断。”

这项工作使用了2017年9月26日由美国国立卫生研究院临床中心首次公布的公开数据集。该数据集包含112,120个正面胸部X射线图像,标记有多达14种可能的病理诊断结果。 与它一起发布的还有一个算法,可以成功诊断这14种疾病中的一部分,旨在鼓励其他人推进这项工作。当斯坦福计算机系的联合教授吴恩达领导的机器学习小组看到这些资料——他们就知道这是他们的下一个研究方向。

研究人员与放射学助理教授马修·隆伦(Matthew Lungren)合作,让四位斯坦福大学的放射科医师独立评估了420幅图像,寻找可能的肺炎迹象。研究人员选择把重点放在这种疾病上,是因为根据疾病控制和预防中心的数据,每年100万美国人因肺炎而就医, 而肺炎特别难以根据X光来诊断。与此同时,机器学习小组团队开始研究可以自动诊断肺炎的算法。

研究人员在一个星期内就有了一个算法,可以更准确地诊断数据集中标记的10种病变。一个多月后,他们的算法在所有14个识别任务中都达到新高度。此时,CheXNet在诊断肺炎的准确率上也超过了四位斯坦福放射科医师。

为什么使用算法

通常,胸部常见但后果严重的疾病如肺炎,其治疗在很大程度上依赖于医生如何解读胸片。但是即使是最好的放射科医师也很容易误诊,因为要基于胸片鉴别诊断多种疾病实在是太难了。

这项工作背后的动机是通过一个深度学习模型,以协助克服人类的认知和偏倚的内在局限性,并减少错误,“该文章的作者之一隆伦解释说。 “更广泛地说,我们相信以此为目的的深度学习模型可以改善各种环境下的医疗保健服务。”

经过约一个月的连续迭代,该算法在肺炎诊断中胜过了四名斯坦福放射科医师。 这意味着CheXNet提供的诊断与放射科医师的大多数一致,比单个放射科医师的诊断更准确。该算法也达到了迄今为止NIH胸片数据集所有小组的最高性能。

未来人类的更多选择

研究人员还在他们的arXiv论文中详细介绍了他们开发的一种基于计算机的工具,可以生成看起来像是胸片的热图,但是这些图的颜色并不代表温度,而是代表算法判定可能为肺炎的区域 。这个工具可以帮助减少肺炎的漏诊,并显著加快放射科医师的工作流程,通过向他们展示重点可疑部位,从而加快重症患者的诊断。

ff81a965032aba3925c1537af99633a1ae7feada

研究人员希望CheXNet能够帮助世界上那些不容易接触到放射科医生的人们,同时该研究小组正在做其他的工作,包括心律不齐的诊断和电子病历数据分析。

该小组的研究生,论文的并列第一作者Jeremy Irvin表示:”我们计划继续建立和改进能够自动检测异常的医学算法,我们希望建立并公布高质量、匿名的医学数据集供所有人就类似问题开展工作。机器学习有很大的潜力来改善当前的医疗保健系统,我们希望继续在这一领域处于创新的领先地位。

大数据文摘观点:

@小石头-医疗影像创业者:

学术上的创新除了膜拜就只能膜拜了……应用意义上,一方面,目前胸片检查主要用于基层医院和体检早筛上,这两个场景面临最大的问题就是诊断医生水平的参差不齐,或者说高水平医生的极度稀缺。所以人工智能技术可以在胸片肺部疾病的筛查准确率上达到甚至超过放射科医生水平,确实给缓解医生稀缺现状的燃眉之急提供了可行方向。但另一个方面也需要注意到,胸片检查受制成像原理,分辨率有限,高辐射不能忽视,正面临被低剂量ct取代的问题。所以不那么严谨的想象,也许还没有等到人工智能解决胸片应用目前的问题,胸片检查本身就被大幅淘汰了。谈及取代放射科医生工作的问题,期待未来很多进展的佐证。

@Michelle-基因检测从业者:

胸片的成本与ct相比还是低很多,市场应该一段时间内还是存在的。斯坦福的文章倒也没说放射科医生失业,只是说提供更好的医疗服务。不过有了这个,很多基层医院对低层次放射科医生的需求从数量上来说真的要少很多了,一个放射科技师拍完片子,加上电脑的自动诊断,临床医生再看看也就可以了。不过在中国,放射科医生的诊断本来就仅供参考,他们不像美国的放射科医生那么有发言权。

作为一个医学院毕业的人,经常会遇到有亲戚朋友把病历发给我,让我帮忙“看看”。其实很多时候挺发怵的,没有把握的只好到处找同学老师问。有了这个,我这种人可以失业了。其实在美国,很多人在拿到医生的诊断后,如果是重大疾病或者不那么着急治疗的病,或者比较疑难的病,都会要再找其它医生看看,得到一个second opinion。吴大大的这种专家系统也可以满足这种需要。


原文发布时间为:2017-11-17

本文作者:文摘菌

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“大数据文摘”微信公众号

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
2月前
|
存储 机器学习/深度学习 编解码
双选择性信道下正交啁啾分复用(OCDM)的低复杂度均衡算法研究——论文阅读
本文提出统一相位正交啁啾分复用(UP-OCDM)方案,利用循环矩阵特性设计两种低复杂度均衡算法:基于带状近似的LDL^H分解和基于BEM的迭代LSQR,将复杂度由$O(N^3)$降至$O(NQ^2)$或$O(iNM\log N)$,在双选择性信道下显著提升高频谱效率与抗多普勒性能。
209 0
双选择性信道下正交啁啾分复用(OCDM)的低复杂度均衡算法研究——论文阅读
|
4月前
|
机器学习/深度学习 算法 数据挖掘
没发论文的注意啦!重磅更新!GWO-BP-AdaBoost预测!灰狼优化、人工神经网络与AdaBoost集成学习算法预测研究(Matlab代码实现)
没发论文的注意啦!重磅更新!GWO-BP-AdaBoost预测!灰狼优化、人工神经网络与AdaBoost集成学习算法预测研究(Matlab代码实现)
179 0
|
3月前
|
传感器 资源调度 算法
DDMA-MIMO雷达多子带相干累积目标检测算法——论文阅读
本文提出一种多子带相干累积(MSCA)算法,通过引入空带和子带相干处理,解决DDMA-MIMO雷达的多普勒模糊与能量分散问题。该方法在低信噪比下显著提升检测性能,实测验证可有效恢复目标速度,适用于车载雷达高精度感知。
541 4
DDMA-MIMO雷达多子带相干累积目标检测算法——论文阅读
|
3月前
|
机器学习/深度学习 算法 算法框架/工具
256KB内存约束下的设备端训练:算法与系统协同设计——论文解读
MIT与MIT-IBM Watson AI Lab团队提出一种创新方法,在仅256KB SRAM和1MB Flash的微控制器上实现深度神经网络训练。该研究通过量化感知缩放(QAS)、稀疏层/张量更新及算子重排序等技术,将内存占用降至141KB,较传统框架减少2300倍,首次突破设备端训练的内存瓶颈,推动边缘智能发展。
277 6
|
4月前
|
人工智能 算法 安全
【博士论文】基于局部中心量度的聚类算法研究(Matlab代码实现)
【博士论文】基于局部中心量度的聚类算法研究(Matlab代码实现)
163 0
|
8月前
|
机器学习/深度学习 人工智能 JSON
这个AI把arXiv变成代码工厂,快速复现顶会算法!Paper2Code:AI论文自动转代码神器,多智能体框架颠覆科研复现
Paper2Code是由韩国科学技术院与DeepAuto.ai联合开发的多智能体框架,通过规划、分析和代码生成三阶段流程,将机器学习论文自动转化为可执行代码仓库,显著提升科研复现效率。
1046 19
这个AI把arXiv变成代码工厂,快速复现顶会算法!Paper2Code:AI论文自动转代码神器,多智能体框架颠覆科研复现
|
9月前
|
机器学习/深度学习 数据采集 算法
基于PSO粒子群优化的CNN-LSTM-SAM网络时间序列回归预测算法matlab仿真
本项目展示了基于PSO优化的CNN-LSTM-SAM网络时间序列预测算法。使用Matlab2022a开发,完整代码含中文注释及操作视频。算法结合卷积层提取局部特征、LSTM处理长期依赖、自注意力机制捕捉全局特征,通过粒子群优化提升预测精度。适用于金融市场、气象预报等领域,提供高效准确的预测结果。
|
10月前
|
机器学习/深度学习 数据采集 算法
基于WOA鲸鱼优化的CNN-GRU-SAM网络时间序列回归预测算法matlab仿真
本项目基于MATLAB 2022a实现时间序列预测,采用CNN-GRU-SAM网络结构,结合鲸鱼优化算法(WOA)优化网络参数。核心代码含操作视频,运行效果无水印。算法通过卷积层提取局部特征,GRU层处理长期依赖,自注意力机制捕捉全局特征,全连接层整合输出。数据预处理后,使用WOA迭代优化,最终输出最优预测结果。
|
10月前
|
机器学习/深度学习 数据采集 算法
基于GA遗传优化的CNN-LSTM-SAM网络时间序列回归预测算法matlab仿真
本项目使用MATLAB 2022a实现时间序列预测算法,完整程序无水印。核心代码包含详细中文注释和操作视频。算法基于CNN-LSTM-SAM网络,融合卷积层、LSTM层与自注意力机制,适用于金融市场、气象预报等领域。通过数据归一化、种群初始化、适应度计算及参数优化等步骤,有效处理非线性时间序列,输出精准预测结果。
|
11月前
|
机器学习/深度学习 数据采集 算法
基于GA遗传优化的CNN-GRU-SAM网络时间序列回归预测算法matlab仿真
本项目基于MATLAB2022a实现时间序列预测,采用CNN-GRU-SAM网络结构。卷积层提取局部特征,GRU层处理长期依赖,自注意力机制捕捉全局特征。完整代码含中文注释和操作视频,运行效果无水印展示。算法通过数据归一化、种群初始化、适应度计算、个体更新等步骤优化网络参数,最终输出预测结果。适用于金融市场、气象预报等领域。
基于GA遗传优化的CNN-GRU-SAM网络时间序列回归预测算法matlab仿真

热门文章

最新文章