1.4 版新特性 🎉🎉#

  • MAISI:最先进的 3D 潜在扩散模型

  • VISTA-3D:用于分割和标注人体解剖结构的交互式基础模型

  • VISTA-2D:细胞分割管线

  • 将 MONAI Generative 集成到 MONAI core 中

  • 通过 trt_compile 实现 TensorRT 惰性导出

  • 几何数据支持

MAISI:最先进的 3D 潜在扩散模型#

maisi

MAISI (Medical AI for Synthetic Imaging) 是一种最先进的三维 (3D) 潜在扩散模型,旨在生成带或不带解剖标注的高质量合成 CT 图像。该 AI 模型擅长数据增强和创建逼真的医学影像数据,以补充因隐私问题或罕见疾病导致的有限数据集。它还可以通过生成多样化和逼真的训练数据来显著提升其他医学影像 AI 模型的性能。

project-monai/tutorials 中提供了一个使用 MAISI 生成附带相应分割掩码的大型 CT 图像的教程。它包含以下特性:

  • 一个基础的变分自编码器 (VAE) 模型,用于潜在特征压缩,适用于 CT 和 MRI,支持灵活的体尺寸和体素尺寸

  • 一个基础的扩散模型,可生成最大 512 × 512 × 768 尺寸的大型 CT 体积,支持灵活的体尺寸和体素尺寸

  • 一个 ControlNet,用于生成可改进下游任务的图像/掩码对,支持可控的器官/肿瘤尺寸

VISTA-3D:用于分割和标注人体解剖结构的交互式基础模型#

vista-3d

VISTA-3D 是一个专用于 3D 医学影像的交互式基础模型。它在提供跨解剖结构和模态的准确且自适应的分割分析方面表现出色。VISTA-3D 采用多头架构,能够适应不同的条件和解剖区域,帮助指导用户的标注工作流程。

project-monai/tutorials 中提供了一个教程,展示了如何在脾脏数据集上微调 VISTA-3D。它支持三个核心工作流程:

  • 分割一切 (Segment everything):支持全身探索,这对于理解影响多个器官的复杂疾病和进行整体治疗规划至关重要。

  • 按类别分割 (Segment using class):根据特定类别提供详细的截面视图,这对于有针对性的疾病分析或器官映射(例如在关键器官中识别肿瘤)至关重要。

  • 点提示分割 (Segment point prompts):通过用户指导的点击式选择增强分割精度。这种交互式方法加速了准确地面真实数据的创建,这在医学影像分析中至关重要。

VISTA-2D:细胞分割管线#

vista-2d

VISTA-2D 是一个用于影像应用中细胞分割的综合训练和推理管线。更多信息请参考这篇博客

该模型的关键特性包括:

  • 利用 Transformer 的强大深度学习算法

  • 基础模型(相对于专用模型)

  • 支持多种数据集和文件格式

  • 能够处理多种影像模态

  • 支持多 GPU 和多节点训练

project-monai/tutorials 中可以找到一个教程,演示如何使用 MONAI 框架在 Cellpose 数据集上训练细胞分割模型。

将 MONAI Generative 集成到 MONAI Core 中#

最初在 MONAI GenerativeModels 仓库中开发的关键模块已集成到 MONAI 核心代码库中。这种集成确保了生成式 AI 基本组件的一致维护和精简发布。在此版本中,所有实用程序、网络、扩散调度器、推理器和引擎都已迁移到核心代码库中。特别注意确保使用 GenerativeModels 训练的模型保存的权重可以加载到现已集成到核心中的模型中。

此外,多个教程已移植并可在 project-monai/tutorials 中找到。

通过 trt_compile 实现 TensorRT 惰性导出#

此版本通过 trt_compile API 扩展了 MONAI bundle 的 TensorRT 优化选项。现有的 trt_export API 要求用户运行单独的导出脚本来准备基于 TensorRT 引擎的 TorchScript 模型。trt_compile 在 bundle 首次运行时构建并保存 TensorRT 引擎,并提供有限的依赖支持。它还允许进行部分 TensorRT 导出,即仅优化特定子模块,从而提高了可用性。MONAI 模型库中的一些 bundle,例如新的 VISTA-3DVISTA-2D bundle,已经附带使用 trt_compiletrt_inference.json 配置文件。

几何数据支持#

MONAI 引入了对几何数据转换的支持作为一个关键特性。作为起点,添加了 ApplyTransformToPoints 转换,以便于对点进行矩阵运算,从而实现灵活高效的几何转换处理。与此同时,该框架现在支持在框和点之间进行转换,在检测管线中提供无缝互操作性。这些更新已集成到现有管线中,例如检测教程3D 配准工作流程,利用最新的 API 改进了功能。