近期,国内多家企业在“大模型+机器人”方面实现技术突破。截至12月13日收盘,步科股份、埃夫特、绿的谐波等多只机器人概念股涨幅超4%。
业内认为,随着技术不断进步和应用场景的扩大,多模态大模型与机器人的需求将不断增加,这为企业提供了广阔的市场空间。此外,与医疗(医疗用品行业分析报告)、制造等行业的合作也将为多模态大模型与机器人的发展带来新机遇,实现更广泛的应用场景和商业价值。
“多模态”AI是指能处理文本、音频、图像、视频和代码等多种形式内容的大模型。随着多模态大模型快速迭代,相关公司不断关注其在机器人领域的应用,并在机器人规划、控制、导航等主要任务上进行了探索。
多模态大模型融合视觉、语音和传感器数据处理技术,极大丰富了机器人认知和决策层面。该技术在机器人中的应用,有望使机器人在复杂交互、自然语言理解和环境适应等领域取得重大进步,激发其作为高度自主助手或劳动力的无限可能性。利用多种大模型的理解能力和视觉感知能力,生成空间语义信息,让机械臂理解、执行动作。在其同步披露的视频中,机械臂成功完成了一系列语音口令,包括“把绿色方块放到黄色框中”“请恢复最开始的状态”等。
公司希望通过工程化研究,使大模型机械臂在实际场景中落地,包括提升机械臂自动绕开复杂障碍物来完成人类指令的能力,解决大模型+机械臂的泛化性问题,最终实现通用场景落地。与此同时,中科创达、亿嘉和等上市公司也于近期相继披露了基于多模态大模型的机器人研发进展情况。
在国内市场,企业已积极投入关键技术环节的研发和生产,尤其是在传感器、精密机械部件、执行器以及创新材料和轻量化结构件领域,展示了蓬勃发展势头。