- · 中国医学计算机成像杂志[06/30]
- · 《中国医学计算机成像杂[06/30]
- · 《中国医学计算机成像杂[06/30]
Nature:为高维度医学成像设计可临床转化的人工(3)
作者:网站采编关键词:
摘要:以超声心动图为例,有一个预定义的扫描区域,在那里可以看到心脏。其他潜在的选择是基于机器学习的光学字符识别工具,以识别和屏蔽有印刷文本的区
以超声心动图为例,有一个预定义的扫描区域,在那里可以看到心脏。其他潜在的选择是基于机器学习的光学字符识别工具,以识别和屏蔽有印刷文本的区域。DICOM标签本身可用于提取扫描级信息和特定模式的标签。例如,在超声心动图和心脏磁共振成像 (MRI) 的情况下,可以轻松地从 DICOM 元数据中提取重要的扫描级别信息,例如采集帧速率和日期或 MRI 序列 (T1/T2)。
临床医生应该注意,仅靠热图不足以解释 AI 系统的功能。在尝试用如上图所示的可视化方法来识别故障模式时,必须谨慎。一个更精细的方法可能涉及到连续遮挡测试,即在有意掩盖临床医生用来进行诊断或预测的区域后,评估图像的性能。这个想法非常直观:在已知对诊断某种疾病很重要的区域被遮蔽的图像上运行算法,例如,在试图诊断心力衰竭时遮蔽左心室,应该可以看到性能的急剧下降。
a, Adebayo等人用MNIST数据集的真实标签训练的模型(上)和随机噪声训练的模型(下)进行的实验。当通过大多数可视化方法进行评估时,在随机噪声上训练的模型仍然产生圆形形状。b,超声心动图视图平面的检测:错误的分类(左上)和正确的分类(右上)都产生类似的显著性图(下)。
训练深度学习算法依靠图形处理单元(GPU)来执行大规模的并行矩阵乘法运算。云计算 "随用随付 "的GPU资源和具有高内存容量的消费级GPU的可用性,都有助于降低对开发医学成像机器学习系统感兴趣的研究人员的准入门槛。尽管有了这些进展,但在大型视频数据集上训练复杂的现代网络架构需要多个GPU连续运行数周。
Adebayo等人最近的研究表明,仅仅依靠显著性图的视觉外观可能会产生误导,即使乍一看它们与背景相关。在一系列广泛的测试中,他们发现,许多流行的生成事后显著性图的方法并没有从模型权重中获得真正的意义,而是与 "边缘检测器"(简单映射像素强度之间的尖锐过渡区域的算法)没有区别。此外,即使这些可视化方法奏效,除了机器学习算法正在寻找的 "位置 "之外,也几乎无法破译。在很多示例中,无论是正确还是错误的显著性图看起来几乎是一样的。当 "患病 "状态和 "正常 "状态之间的差异需要关注图像或视频的同一区域时,这些缺点就更加明显了。
这有助于确认人工智能系统正在关注相关领域。特别是在高维医学成像研究的背景下,激活图可能为视频类成像研究的某些时间阶段的相对重要性提供独特的见解。例如,某些疾病可能在心脏收缩时表现出病理特征,而对于其他疾病可能需要人们关注心脏放松时的情况。通常这样的实验可能表明,机器学习系统从临床医生传统上不会使用的图像区域中识别出潜在的信息特征。除了收集关于这些机器学习系统如何产生其输出的信息外,严格的可视化实验可能提供一个独特的机会,可以从被评估的机器学习系统中学习生物学的见解。
在最近的评论中,Chen等人深入概述了从问题选择到部署后阶段的潜在偏差来源。在这里,我们重点讨论机器学习系统开发早期的潜在解决方案。一些人主张用一些方法来解释现代机器学习系统的其他 "黑箱 "预测,而其他人则主张一开始就限制使用更可解释的模型。除了在训练整个 AI 系统时结合结构化数据的输入之外,中间方法还涉及使用黑盒模型训练医学成像神经网络。
图1:基于云的协作式注释工作流程。基于云的工具可用于生成专家注释数据集,并通过安全连接与临床专家进行评估。图为MD.ai的一个实施方案,其中临床专家进行各种 2D 检测以测评心脏功能。
与广泛的基于图像的预训练网络库不同,对视频算法的支持仍然有限。对部署新架构感兴趣的研究人员可能需要自己在大型公开的视频数据集(如Kinetics和UCF101(中佛罗里达大学101--动作识别数据集))上执行预训练步骤。此外,视频网络的训练计算成本可能要高几个数量级。虽然使用大型自然景物数据集进行预训练是开发临床成像机器学习系统的一个公认的策略,但不能保证性能的提升。关于预训练的性能改进的报告很常见,特别是在使用较小的数据集时,但随着训练数据集的增加,其优势会逐渐减少。
雷峰网
机器学习系统可能会无意中学会进一步延续和歧视少数民族和有色人种,因此在模型开发过程的早期了解这种偏见是至关重要的。
文章来源:《中国医学计算机成像杂志》 网址: http://www.zgyxjsjcxzzzzs.cn/zonghexinwen/2022/0809/662.html