郝彦飞 4M: 提供图像分类、目标检测、语义分割、实例分割、深度估计、表面法线估计等数十种功能 A framework for training any-to-any multimodal foundation models. 用于训练任意多模式基础模型的框架。 Scalable. Open-sourced. Across tens of modalities and tasks. 可扩展。开源。跨越数十种模式和任务。 Demo地址: https://huggingface.co/space... 大模型学习 开源 视觉模型