天津北方网讯:新春的天大校园喜气洋洋。在“春节不打烊”的忙碌中,一则好消息从天津大学深度强化学习实验室传出:由具身团队Cereb-Y自主研发的具身基座模型Embodied-R1.5,搭载于多种型号的机器人上正式亮相。

走进深度强化学习实验室,一群年轻人正围在几个机器人跟前忙活着。实验室青年骨干汤宏垚副研究员、马亿副教授、郑岩副教授正在现场指导团队调试系统、验证任务效果。
他们对着机器人发出一条指令:“把客厅收拾一下,再给客人做杯奶茶。”话音刚落,机器人便开始行动起来。它先识别出地上“需要清理的垃圾”,随后机械臂精准地抓起扫帚,沿着规划好的路径完成清扫;做奶茶时,机械臂轻轻捏起客人喜欢的纸杯,进行奶茶制作,完成加茶、加奶、搅拌等一系列精细操作,最后稳稳端到客人跟前。整个过程一气呵成,不需要人为干预。
“这看着简单,背后可费了大功夫。”汤宏垚向记者解释,传统的机器人只能在固定环境里按固定程序干活,无法随着环境变化自主调整。为了让机器人像人一样灵活应对,团队给它设计了一套“大脑+小脑”的分工架构。
他打了个比方:“大脑是一个多模态大模型,负责理解任务意图、感知环境、进行长时序的推理和规划。比如‘取水杯’这个指令,大脑要先把任务拆解成多个步骤,还要考虑每一步的顺序、判断哪个杯子是可用的、有没有障碍物等动态因素。小脑则是基于强化学习的决策控制模块,负责具体动作的精准执行。机械臂用多大力气拿杯子、怎么拿才能稳当又不捏碎、移动过程中如何保持平衡,这些精细工作都是小脑在实时计算和调整。”
“大脑做决策,小脑做控制,两者配合好了,机器人才能在真实的居家环境里自己琢磨着把活儿干好。”马亿补充说,这段时间团队就在攻关这个协同问题。搭载了新模型的机器人,能够按照指令擦花瓶、给手机充电、为客人冲咖啡、打包礼物等,面对没见过的场景,也能零样本适应。让机器人化身未来家庭管家的模样,这也是目前具身智能领域的前沿方向。
技术突破的同时,团队也在思考如何让成果走出实验室。记者在实验室看到,这里不光有理工科的“程序员”,还有新媒体专业的视频拍摄人员,这是实验室的独特之处——“文工交叉”。“酒香也怕巷子深。”实验室骨干郑岩笑着说。为了让科研成果被看见、被理解,团队充分发挥了天津大学新媒体与传播学院的学科优势,邀请了新媒体学院张守信老师团队协助,加班加点,将枯燥的代码和算法,通过场景化的视频生动地呈现出来。在他们的最新演示视频中,机器人整理凌乱的房间、递上一杯温热的奶茶、打包好送给朋友的礼盒……在具身基座模型Embodied-R1.5的驱动下,这些忙前忙后的机器人,渐渐描绘出我们对未来家庭生活最温柔的想象。
“这个春节的坚守,为的是把一年的算法研究成果集成在机器人身上,呈现出达到国内外领先水平的智能能力。”郑岩副教授说。此外,值得一提的是,这支年轻团队刚刚拿下一项重磅认可:深度强化学习实验室此前凭借《基于强化学习的智能决策关键技术及应用》项目,荣获2025年度中国图象图形学学会科技进步奖一等奖,实验室负责人郝建业教授为该项目的第一完成人。该项目成果已成功应用于国产芯片设计软件的研发,支撑国内企业实现关键工具的自主替代;在文娱领域,落地于大型商业游戏,成为国内首个实现自动化测试的强化学习技术;此外,还被应用于多项国防军事智能化重点任务,产生了数亿元的经济和社会效益。
“我们希望能让人工智能技术真正走进生活”,郑岩说到。未来,团队的研究成果将广泛应用于物流仓储、分拣运输、自动驾驶等工业场景,也将在家居收纳、公共区域卫生清扫等民生领域落地。从实验室走向千家万户,这群年轻人正用自己的方式,让人工智能长出烟火气。
(津云新闻记者段玮 通讯员梁绍楠)









