Nature：为高维度医学成像设计可临床转化的人工(3)-中国医学计算机成像杂志

一、来稿必须是作者独立取得的原创性学术研究成果，来稿的文字复制比（相似度或重复率）必须低于用稿标准，引用部分文字的要在参考文献中注明；署名和作者单位无误，未曾以任何形式用任何文种在国内外公开发表过；未一稿多投。二、来稿除文中特别加以标注和致谢之外，不侵犯任何版权或损害第三方的任何其他权利。如果20天后未收到本刊的录用通知，可自行处理(双方另有约定的除外)。三、来稿经审阅通过，编辑部会将修改意见反馈给您，您应在收到通知7天内提交修改稿。作者享有引用和复制该文的权利及著作权法的其它权利。四、一般来说，4500字（电脑WORD统计，图表另计）以下的文章，不能说清问题，很难保证学术质量，本刊恕不受理。五、论文格式及要素：标题、作者、工作单位全称(院系处室)、摘要、关键词、正文、注释、参考文献(遵从国家标准：GB\T7714-2005，点击查看参考文献格式示例)、作者简介(100字内)、联系方式(通信地址、邮编、电话、电子信箱)。六、处理流程：（1）通过电子邮件将稿件发到我刊唯一投稿信箱（2）我刊初审周期为2－3个工作日，请在投稿3天后查看您的邮箱，收阅我们的审稿回复或用稿通知；若30天内没有收到我们的回复，稿件可自行处理。（3）按用稿通知上的要求办理相关手续后，稿件将进入出版程序。（4）杂志出刊后，我们会按照您提供的地址免费奉寄样刊。七、凡向文教资料杂志社投稿者均被视为接受如下声明：（1）稿件必须是作者本人独立完成的，属原创作品（包括翻译），杜绝抄袭行为，严禁学术腐败现象，严格学术不端检测，如发现系抄袭作品并由此引起的一切责任均由作者本人承担，本刊不承担任何民事连带责任。（2）本刊发表的所有文章，除另有说明外，只代表作者本人的观点，不代表本刊观点。由此引发的任何纠纷和争议本刊不受任何牵连。（3）本刊拥有自主编辑权，但仅限于不违背作者原意的技术性调整。如必须进行重大改动的，编辑部有义务告知作者，或由作者授权编辑修改，或提出意见由作者自己修改。（4）作品在《文教资料》发表后，作者同意其电子版同时发布在文教资料杂志社官方网上。（5）作者同意将其拥有的对其论文的汇编权、翻译权、印刷版和电子版的复制权、网络传播权、发行权等权利在世界范围内无限期转让给《文教资料》杂志社。本刊在与国内外文献数据库或检索系统进行交流合作时，不再征询作者意见，并且不再支付稿酬。九、特别欢迎用电子文档投稿，或邮寄编辑部,勿邮寄私人，以免延误稿件处理时间。

Nature：为高维度医学成像设计可临床转化的人工(3)

作者:

关键词:

摘要：

以超声心动图为例，有一个预定义的扫描区域，在那里可以看到心脏。其他潜在的选择是基于机器学习的光学字符识别工具，以识别和屏蔽有印刷文本的区域。DICOM标签本身可用于提取扫描级信息和特定模式的标签。例如，在超声心动图和心脏磁共振成像 (MRI) 的情况下，可以轻松地从 DICOM 元数据中提取重要的扫描级别信息，例如采集帧速率和日期或 MRI 序列 (T1/T2)。

临床医生应该注意，仅靠热图不足以解释 AI 系统的功能。在尝试用如上图所示的可视化方法来识别故障模式时，必须谨慎。一个更精细的方法可能涉及到连续遮挡测试，即在有意掩盖临床医生用来进行诊断或预测的区域后，评估图像的性能。这个想法非常直观：在已知对诊断某种疾病很重要的区域被遮蔽的图像上运行算法，例如，在试图诊断心力衰竭时遮蔽左心室，应该可以看到性能的急剧下降。

a, Adebayo等人用MNIST数据集的真实标签训练的模型（上）和随机噪声训练的模型（下）进行的实验。当通过大多数可视化方法进行评估时，在随机噪声上训练的模型仍然产生圆形形状。b，超声心动图视图平面的检测：错误的分类（左上）和正确的分类（右上）都产生类似的显著性图（下）。

训练深度学习算法依靠图形处理单元（GPU）来执行大规模的并行矩阵乘法运算。云计算 "随用随付 "的GPU资源和具有高内存容量的消费级GPU的可用性，都有助于降低对开发医学成像机器学习系统感兴趣的研究人员的准入门槛。尽管有了这些进展，但在大型视频数据集上训练复杂的现代网络架构需要多个GPU连续运行数周。

Adebayo等人最近的研究表明，仅仅依靠显著性图的视觉外观可能会产生误导，即使乍一看它们与背景相关。在一系列广泛的测试中，他们发现，许多流行的生成事后显著性图的方法并没有从模型权重中获得真正的意义，而是与 "边缘检测器"（简单映射像素强度之间的尖锐过渡区域的算法）没有区别。此外，即使这些可视化方法奏效，除了机器学习算法正在寻找的 "位置 "之外，也几乎无法破译。在很多示例中，无论是正确还是错误的显著性图看起来几乎是一样的。当 "患病 "状态和 "正常 "状态之间的差异需要关注图像或视频的同一区域时，这些缺点就更加明显了。

这有助于确认人工智能系统正在关注相关领域。特别是在高维医学成像研究的背景下，激活图可能为视频类成像研究的某些时间阶段的相对重要性提供独特的见解。例如，某些疾病可能在心脏收缩时表现出病理特征，而对于其他疾病可能需要人们关注心脏放松时的情况。通常这样的实验可能表明，机器学习系统从临床医生传统上不会使用的图像区域中识别出潜在的信息特征。除了收集关于这些机器学习系统如何产生其输出的信息外，严格的可视化实验可能提供一个独特的机会，可以从被评估的机器学习系统中学习生物学的见解。

在最近的评论中，Chen等人深入概述了从问题选择到部署后阶段的潜在偏差来源。在这里，我们重点讨论机器学习系统开发早期的潜在解决方案。一些人主张用一些方法来解释现代机器学习系统的其他 "黑箱 "预测，而其他人则主张一开始就限制使用更可解释的模型。除了在训练整个 AI 系统时结合结构化数据的输入之外，中间方法还涉及使用黑盒模型训练医学成像神经网络。

图1：基于云的协作式注释工作流程。基于云的工具可用于生成专家注释数据集，并通过安全连接与临床专家进行评估。图为MD.ai的一个实施方案，其中临床专家进行各种 2D 检测以测评心脏功能。

与广泛的基于图像的预训练网络库不同，对视频算法的支持仍然有限。对部署新架构感兴趣的研究人员可能需要自己在大型公开的视频数据集（如Kinetics和UCF101（中佛罗里达大学101--动作识别数据集））上执行预训练步骤。此外，视频网络的训练计算成本可能要高几个数量级。虽然使用大型自然景物数据集进行预训练是开发临床成像机器学习系统的一个公认的策略，但不能保证性能的提升。关于预训练的性能改进的报告很常见，特别是在使用较小的数据集时，但随着训练数据集的增加，其优势会逐渐减少。

雷峰网

机器学习系统可能会无意中学会进一步延续和歧视少数民族和有色人种，因此在模型开发过程的早期了解这种偏见是至关重要的。

文章来源：《中国医学计算机成像杂志》网址: http://www.zgyxjsjcxzzzzs.cn/zonghexinwen/2022/0809/662.html