- · 中国医学计算机成像杂志[06/30]
- · 《中国医学计算机成像杂[06/30]
- · 《中国医学计算机成像杂[06/30]
Nature:为高维度医学成像设计可临床转化的人工(4)
作者:网站采编关键词:
摘要:对机器学习系统的信任对于更广泛的采用至关重要,正如探索特定的特征或变量如何以及为什么会导致预测一样,通过结合显著性图和估计特征重要性的模
大规模的多中心成像数据集会产生许多隐私和责任问题,这些问题与文件中嵌入的潜在敏感数据有关。医学数字成像和通信(DICOM)标准普遍被用来捕获、存储和提供医学图像的工作流程管理。成像文件(以.dcm文件或嵌套文件夹结构的形式存储)包含像素数据和相关元数据。众多的开源和专有工具可以帮助对 DICOM 文件进行去识别化。后端医院信息学框架,如Google Healthcare API,是一种清除可能包含敏感信息的元数据域的方法,也通过 "安全列表 "支持DICOM去标识化。
时间的力量——1991 人工智能大辩论 30 周年纪念:主义不再,共融互生|GAIR 2021
未来已来,元宇宙比你想象中来得更早丨GAIR 2021
尽管在医学成像领域已经有了联合学习的成功示范,但在将这些方法用于常规临床使用时,仍然存在大量技术挑战。特别是在高维成像机器学习系统的背景下,从多个参与中心传输和更新训练的权重而引入的网络延迟,成为训练更大神经网络的基本速率限制步骤。研究人员还必须确保训练后的权重在参与机构之间的传输是安全和加密的,这进一步增加了网络延迟。此外,在设计研究时,如果不能访问源数据,策划数据集的质量和一致性可能极具挑战性。许多概念上类似的联合学习框架仍然假定对源数据有一定程度的访问。
最后,较新的机器学习训练范式,如联邦学习,可能有助于规避许多与数据共享相关的障碍。Kaissis等人审查了联邦学习的原则、安全风险和实施挑战。这种方法的主要特点是在每个机构都训练本地算法副本,唯一共享的信息是神经网络在训练过程中学习到的特征。在预定的时间间隔内,从每个机构的算法中学到的信息(训练的权重)被集中起来并重新分配,高效地从一个大型的多中心数据集中学习,而不需要传输或分享任何医学成像数据。这有助于快速训练算法,从胸部计算机断层扫描中检测COVID-19的特征。
现代临床机器学习中使用的神经网络架构,主要来自于那些针对大型照片或视频识别任务28进行优化的架构。即使在细粒度分类的其他挑战性任务中,这些架构也非常稳健,其中类具有微妙的类内差异(狗的品种),而不是具有高类间差异的明显不同对象(飞机与狗)。通过对大型数据集(例如ImageNet)进行充分的预训练,这些 "现成 "架构的性能优于为其量身定做的细粒度分类器。其中许多架构可用于流行的机器学习框架,如TensorFlow和Pytorch。最重要的是,这些框架通常为各种不同的神经网络架构提供ImageNet预训练权重,使研究人员能够迅速将它们重新用于专门的医学成像任务。
在他们关于深度学习中的不确定性量化的论文中,Sensoy等人用一系列的损失函数来解决这些问题,这些损失函数分配了一个 "不确定性分数",以此来避免错误的、但有把握的预测。在项目的转化阶段,当人工智能系统被部署在与人类用户一起工作的环境中时,不确定性量化的好处就出现了。信心度量是AlphaFold2的一个关键因素,该蛋白质折叠机器学习系统在第14届蛋白质结构预测关键评估(CASP14)挑战中取得了无与伦比的准确性,给DeepMind研究团队提供了一种方法来衡量他们应该对正在生成的预测给予多大的信任。许多不确定性量化方法的实现都是在许可的情况下进行的,并且与常用的机器学习框架兼容。纳入不确定性量化可能有助于提高高风险的医学成像机器学习系统的可解释性和可靠性,并减少自动化偏差的可能性。
2021-12-12
机器学习系统学习的特征可能取决于架构的设计。更重要的是,机器学习系统会根据提供给它的训练数据和目标来学习和延续系统性的不平等。随着医疗保健人工智能系统不断向未来的疾病预测发展,必须更加谨慎地考虑到这些群体在获得医疗保健和结果方面的巨大差异。
2021-12-12
如今,大多数医学成像 AI 系统专注于从正常背景下诊断少数疾病。典型的方法是在训练这些算法时分配一个数字标签(疾病:1;正常:0)。这与临床受训人员学习从成像扫描中诊断不同的疾病的方式有很大不同。为了提供更多的 "医学知识",而不是简单地对自然图像或视频进行预训练,Taleb等人提出了一系列使用大型无标签医学成像数据集的新型自我监督预训练技术,旨在协助开发基于3D医学成像的人工智能系统。
文章来源:《中国医学计算机成像杂志》 网址: http://www.zgyxjsjcxzzzzs.cn/zonghexinwen/2022/0809/662.html