本报告导读:
智元发布首个通用具身基座模型智元启元大模型,GO-1 大模型将加速具身智能的普及,关注智元产业链的相关机会。
投资要点:
智元发布首个 通用具身基座模型Genie Operator-1。3 月10 日,智元发布首个通用具身基座大模型GO-1,开创性地提出了Vision-Language-Latent-Action (ViLLA) 架构,该架构由VLM(多模态大模型)+ MoE(混合专家)组成,其中VLM 借助海量互联网图文数据获得通用场景感知和语言理解能力,MoE 中的Latent Planner(隐式规划器)借助大量跨本体和人类操作视频数据获得通用的动作理解能力,MoE 中的Action Expert(动作专家)借助百万真机数据获得精细的动作执行能力,三者环环相扣,实现了可以利用人类视频学习,完成小样本快速泛化,降低了具身智能门槛,并成功部署到智元多款机器人本体,持续进化,将具身智能推上了一个新台阶。
GO-1:VLA 进化到ViLLA。为了有效利用高质量的AgiBot World数据集以及互联网大规模异构视频数据,增强策略的泛化能力,智元提出了ViLLA 这一架构。在推理时,VLM、Latent Planner 和ActionExpert 三者协同工作。其中LAM(隐式动作模型)主要用于获取当前帧和历史帧之间Latent Actions 的Groundtruth(真值),它由编码器和解码器组成。Latent Planner 负责预测这些离散的Latent ActionTokens,它与VLM 主干网络共享相同的 Transformer 结构,同时引入Action Expert。结果显示,相比已有的最优模型,GO-1 成功率大幅领先,平均成功率提高了32%(46%->78%)。
GO-1 的推出标志着具身智能向通用化、开放化、智能化加速迈进。
GO-1 大模型可泛化应用到各类的环境和物品中,快速适应新任务、学习新技能。同时,它还支持部署到不同的机器人本体,高效地完成落地,并在实际的使用中持续不断地快速进化,包括:1)从单一任务到多种任务;2)从封闭环境到开放世界;3)从预设程序到指令泛化。GO-1 大模型将加速具身智能的普及,在商业、工业、家庭等多领域发挥更大的作用,通向更加通用全能的智能未来。
投资建议:重点关注国产机器人整机厂和零部件公司,包括:1)整机厂:受益标的为赛力斯、东方精工;2)执行器和电机:推荐标的兆威机电,受益标的为三花智控、拓普集团、伟创电气、鸣志电器、步科股份;3)减速器:受益标的为中大力德、双环传动、豪能股份等;4)驱控类:受益标的为峰岹科技、拓斯达;5)传感器:推荐标的为东华测试,受益标的为柯力传感、奥比中光、天准科技;6)丝杠类:推荐标的为恒立液压、贝斯特和长盛轴承,受益标的为北特科技、五洲新春和丰立智能等;
风险提示:国产设备替代进度不及预期风险、人形机器人产业化不及预期风险、产业政策不及预期风险。



