郝彦飞 同济子豪兄-vlm_arm:机械臂+大模型+多模态=人机协作具身智能体 机械臂接入GPT4o大模型,秒变多模态AI贾维斯 通过语音指令,让机械臂指哪打哪。听人话、看图像、找坐标、排动作、定格式 智能体Agent编排动作,多模态视觉大模型理解图像 最后通过手眼标定和逆运动学解算,依次完成动作 具身智能体Agent,让机器能理解人类的复杂指令,实现人机协作 源代码: https://github.com/TommyZihao/vlm_arm 机械臂:大象机器人Mycobo... 开源 机器人