4M: 提供图像分类、目标检测、语义分割、实例分割、深度估计、表面法线估计等数十种功能

2024年7月7日 单位
4M: 提供图像分类、目标检测、语义分割、实例分割、深度估计、表面法线估计等数十种功能
郝彦飞


A framework for training any-to-any multimodal foundation models.

用于训练任意多模式基础模型的框架。

Scalable. Open-sourced. Across tens of modalities and tasks.

可扩展。开源。跨越数十种模式和任务。

Demo地址:https://huggingface.co/spaces/EPFL-VILAB/4M

源码地址:https://github.com/apple/ml-4m/