邮箱
云南网邮箱 云报邮箱
新闻动态
您当前的位置:云南网 >> 教育频道 >> 新闻动态 >> 正文
新模型提升机器人三维空间理解与操作能力
发布时间:2026年05月06日 07:06:44  来源: 科技日报

原标题:新模型提升机器人三维空间理解与操作能力

记者5日从浙江人形机器人创新中心获悉,该中心联合香港中文大学、浙江大学等团队在机器人空间智能领域取得重要突破,提出名为RAM的三维空间理解与操作模型,为提升机器人在复杂长程任务中的操作可靠性提供了新的技术路径。相关成果近日发表于国际学术期刊《科学·机器人》。

以视觉语言大模型为代表的人工智能(AI)技术,提升了机器人理解自然语言指令和分解复杂任务的能力。但从“听懂指令”到“完成动作”之间,仍存在关键鸿沟,机器人需要在三维空间中理解物体的位置、朝向、尺度、可操作区域及相互关系,并将这些信息转化为可执行的运动约束。

“针对这一挑战,我们提出了RAM模型,其借鉴检索增强生成的思想,为大模型配备可查询的外部三维知识库。机器人执行任务时,模型可以按需检索物体类别、几何属性、功能平面、抓取点等信息,从而弥补视觉语言模型自身三维空间理解不足的问题。”团队成员、浙江人形机器人创新中心首席技术官许学成介绍。

研究团队还专门构建了面向机器人操作场景的空间理解问答评测集,结果显示,在该评测集覆盖的多类空间推理任务中,RAM模型的整体表现优于多种代表性视觉语言大模型。除核心任务外,RAM展现出一定通用性与扩展性。(夏凡)

责任编辑:小云
关注云南发布
关注云南网微信
关注云南网微博
新闻爆料热线:0871-64160447 64156165 投稿邮箱:ynwbjzx@163.com
云南网简介 |  服务合作 |  广告报价 |  联系方式 |  中央厨房 |  网站声明
滇ICP备08000875号 互联网新闻信息服务许可证编号:53120170002 信息网络传播视听节目许可证号:2511600
互联网出版许可证:新出网证(滇)字 04号
广播电视节目制作经营许可证号:(云)字第00093号
增值电信业务经营许可证编号:滇B2-20090008 ® yunnan.cn All Rights Reserved since 2003.08
未经云南网书面特别授权,请勿转载或建立镜像,违者依法必究
24小时网站违法和不良信息举报电话:0871-64166935;举报邮箱: jubao@yunnan.cn