在2024世界机器人博览会现场,人形机器人“天工”一出场就吸引了众多观众围观,俨然是博览会上最亮眼的明星。作为具身智能应用到机器人上的代表,“天工”的亮相也让大家对于具身智能赋予机器人的能力有了具象化的了解。
具身智能可以理解为“具身+智能”,通过赋予AI“身体”,能够与现实产生交互,让AI从仅存于数字世界的软件算法走向真实的物理世界,在物理世界也能呈现模拟人类甚至超越人类的智能水平。具身智能强调不仅通过算法和计算实现智能,还通过具身本体与物理世界的交互来展现和发展智能。
具身智能发展至今经历了三个阶段,即早期萌芽阶段、技术积累阶段和技术突破阶段。2022年至今,以ChatGPT为代表的大模型的通用知识和智能涌现能力为机器人实现智能感知、自主决策乃至拟人化交互方面带来巨大潜力。
当前人们的关注点转向如何将AI应用于物理世界,并期望通过AI的“具身化”找到新的智能增长点。“具身智能是长了身体的智能,是技术上一个非常巨大的进步。”北京具身智能机器人创新中心总经理熊友军说,“我们认为具身智能是人工智能的一个新范式,它具有可以跟物理世界直接进行交互、能够自主学习的特点。这种自主的学习实际上可以更加主动和积极,也更加具有创造性。”
中国信通院发布的《具身智能发展报告(2024年)》显示,目前,具身智能技术尚处于多条路径探索发展阶段,并且在感知与认知、学习与泛化、计算能力、多任务处理、安全性、隐私保护以及人机关系等多个方面都面临挑战。
在算法层面,具身智能系统在实现通用智能时面临两大根本性挑战。一是系统需要人类智能的介入;二是尚未实现感知到行动间的认知映射。在数据层面,缺乏数据成为具身智能能力突破的重要壁垒。一方面,真实数据面临获取成本过高、广泛、高质量和多样化的挑战。另一方面,仿真合成数据面临“现实差距”,即模拟环境与现实世界之间的差异挑战。在软件层面,缺乏统一的操作系统和标准化软件开发工具链。在硬件层面,耐用性和能源效率以及与软件的深度集成需求构成了具身智能硬件发展的主要障碍。在标准与合规层面,具身智能技术、评测、安全伦理等标准缺失,面临信息安全、个人隐私等一系列伦理和社会学问题。
报告显示,具身智能将在技术涌现式创新和突破下,实现“一脑多形”“一机多用”,其相关应用有望快速扩展至社会经济的各个层面,推动生产力的跃升和生活方式的变革。未来具身智能将从工业协作生产到柔性制造,从家务助手到医疗护理,从灾难救援到太空探索,深度融入人类社会。可以预见的是,具身智能有望带来更高的应用价值和更广阔的市场空间。在工业制造领域,具身智能可以打破人机协作瓶颈,实现智能化柔性适配;在自动驾驶领域,具身智能可以适应开放环境,实现安全可靠驾驶;在家庭服务领域,具身智能可以解放人类双手,实现全场景智能家务服务;在医疗康养领域,针对老龄化问题,具身智能可以实现拟人交互服务等。