聚焦松山湖科学会议|李国杰院士:关于具身智能,这些“元问题”值得深入思考
东莞+ 2024-05-25 16:26:06

5月25日上午,由广东院士联合会、东莞市人民政府联合主办,以“大模型具身智能”为主题的2024松山湖科学会议在松山湖科学城正式举行。全体大会上,中国工程院院士、中国科学院计算技术研究所研究员李国杰带来题为“关于具身智能的元思考”的特邀报告。

李国杰院士把涉及到具身智能“做什么”“为什么做”这些基础性问题称为“元问题”,并从人工智能的发展历程进行精彩分享。

李国杰指出,根据学者们的估计,未来5-10年机器人大模型将处于加速爆发期。波士顿咨询公司(BCG)预测,到2030年,智能机器人系统可能给全球经济带来约4-6万亿美元的年增长价值。“具身智能成为新的热点。”

“具身智能是集成各种人工智能技术的综合性智能,还是所谓接近动物智能的‘行为主义智能’?”李国杰指出,这一问题引发了关于人工智能发展方向的深入讨论。对此目前学者们有三个观点,一是具身智能是人工智能多个学科的集成,是人工智能的高级发展阶段(终极目标);二是具身智能是人工智能的第三流派,是接近动物智能的“行为主义智能”;三是具身智能的重点是模拟人的小脑和基底神经节,让机器人学习人类鲁棒的“下意识”执行。

李国杰指出,尽管许多学者将图灵视为具身智能的先驱,但图灵在其奠基性论文中并未明确提及“具身智能”这一概念,只在文章结尾时提到一句:“应该给机器配备最好的传感器,然后教它听说英语”。实际上,具身智能的思想更多源于行为主义智能的开创者MIT的Brooks教授,以及琳达·史密斯(Linda Smith)提出的“具身假说”。

“具身智能与离身智能必须融合贯通。”李国杰院士指出,具身的含义不是身体本身,而是与环境交互以及在环境中做事的整体需求和功能。大模型(LLM)没有解决机器人如何从物理环境中持续学习和适应的问题。基础模型与进化学习机制必须密切结合,通过不断的试验和错误来优化行为策略。目前的具身智能领域没有与生物基因直接对应的遗传介质,与载体绑定的具身智能难以复制,可复制(遗传)的知识技能一定是与载体无关的离身智能。从经验中学到的策略需要编码为离身的“数字遗传信息”——算法或参数,传递到下一代智能系统,才能形成庞大的智能产业。

“具身智能是不是通用智能?要不要重点研究适应各种环境的通用具身智能?人工智能究竟是一种不解决具体问题的原始能力,还是针对明确任务和有环境边界的问题求解技术?”李国杰提出第二个“元问题”。具身智能作为与物理世界紧密联系的智能形式,其通用性、进化学习能力以及未来发展趋势成为业内专家热议的焦点。

李国杰表示,目前一种观点认为研究具身智能的目标就是发展通用智能。计算机的发展史证明通用胜过专用。最早的数字计算机是用于计算炮弹轨迹、破译密码的专用机,20世纪50年代以后,通用可编程的计算机成为主流计算架构。手机的发展史也是如此,现在电话、相机、录像机、录音机、播放器、导航器、电子书阅读器、游戏设备、手电筒、指南针等都集成在一部智能手机上。未来几年,机器人领域会看到同样的转变:机器人将从特定应用的专用机器,转向更通用、灵活、适应性强的通用平台。

李国杰提出,另一种观点认为,智能是知识不足时的适应能力。“通用”并不是万能的意思,而是能够应对设计者预料之外的情况,这才叫“通用”。人工智能是一种原始能力,并不是解决具体问题的能力。在有限的时间做更多的正确的事情,这是智能的关键之一。

“然而,也有观点认为,在追求通用性的同时,需要权衡一致性和完备性。一个复杂的系统如果要求具有一致性,即结果准确无误,那么它可能无法做到完备。因此,在选择通用具身智能时,需要根据应用场景的需求来决定是追求一致性还是完备性。”李国杰在演讲中表示。

李国杰分享,科技界和产业界对大模型的态度大致可分成“未来派(榔头派”)和“务实派(钉子派)”。“榔头派”是技术信仰派,信仰AGI、信仰 scale law,追求模型的通用性,认为大模型就是个“榔头”,什么钉子都可以敲。“钉子派”认为先要找到钉子,榔头才能起作用,更相信可以变现的商业场景。

“学术界、企业界对具身智能的认识不统一不是坏事,说明具身智能还未像新能源车一样已进入市场成熟阶段,所以它的发展空间很大,蕴藏着的机会更大。”李国杰表示。具身智能还处在探索阶段,要鼓励技术途径的多样性。大模型是提高具身智能环境适应性和进化学习能力的可行途径之一,要争取在大模型技术上迎头赶上,有所突破。中国一定要在这方面赶上去,结合中国国情走出自己的具身智能发展之路。

文字:杨梓跃 张华桥 图片:陈栋 编辑:张东昌