Self portrait, Image credit: Ruaridh Mon-Williams 咖啡师机器人:开启智能适应时代的先驱 在英国爱丁堡大学一个繁忙的厨房里,一只机械臂嗡嗡作响地运转起来,金属手指灵巧地舀起咖啡粉,而抽屉的碰撞声和杯子意外的移动声不时传来。这并非又是一个按预设程序循环制作浓缩咖啡的自动化小玩意——这是一个拥有七个关节的奇迹,正在改写机器人能力的规则。由博士生鲁里德·蒙-威廉姆斯(Ruaridh Mon-Williams)领导的团队开发的这款机器人咖啡师,不仅仅是遵循指令;它能够适应、学习,并巧妙地驾驭现实世界空间中不可预测的混乱,预示着智能机器新纪元的到来。想象一下:一个机器人响应简单的指令——”给我冲杯咖啡”——然后独立找到勺子,在桌子晃动时调整,并在没有人类指导的情况下倒入精确量的水。这不是科幻幻想;这是朝着机器人真正与我们共存迈出的实质性一步。 这款机器人的独特之处不仅在于其制作咖啡的能力,更在于它能在大多数机器人束手无策的地方——日常生活中混乱、动态的环境中运行。工业机器人在工厂车间表现出色,它们在固定的工具中进行精确、编排好的移动,但在杂乱的厨房里——抽屉半开、食材错位——它们往往步履维艰。但这款机器人不同。凭借先进的人工智能驱动的推理能力、敏锐的视觉感知和灵活的运动技能,它能解读随意的口头请求,扫描不熟悉的环境,并实时调整动作。它体现了一个未来——机器人不仅仅是服从,更能理解。 该项目发表在《自然·机器智能》(Nature Machine Intelligence)杂志上,标志着一个里程碑,它将两个以前分离的机器人领域结合起来:认知AI的类脑推理和感觉-运动控制的精确性。”人类智能来自于将推理、运动和感知编织在一起,”蒙-威廉姆斯解释道。”我们正在展示当你在机器中融合这些因素时会发生什么。”为了揭开这一突破背后的故事,我们与蒙-威廉姆斯进行了交谈,他从爱丁堡到伯克利再回来的旅程点燃了一个机器人不仅仅为我们工作,而是与我们一起工作的愿景。 Coffee scene, Image credit: Ruaridh Mon-Williams 心智的塑造:跨越地域与师承 好奇心和跨越大陆的经历启发了鲁里德·蒙-威廉姆斯研发机器人咖啡师。”我的学术生涯始于爱丁堡大学,大二时加入,”他回忆道。最初学习工程学,但在一次改变人生的海外学习年中,他的热情发生了转变。”在加州大学伯克利分校学习改变了一切。沉浸在湾区的科技氛围中,我深入研究了机器学习、机器人学和计算机科学。”伯克利的经历重塑了他的职业轨迹。”回到爱丁堡时,我知道我的未来在计算机科学,而非工程学。” 回到爱丁堡后,这份火花演变成一项使命。”我想制造能够感知环境、识别人类并动态完成任务的自适应机器人,”他说。这个愿景既个人化又实用:”我梦想着一个能根据请求能冲煮咖啡,而无需预设步骤的机器人。现有的机器人严重依赖固定轨迹。我想要能够独立解决问题。”由此产生的项目围绕着一个轻量级的Kinova机械臂,该臂具有七个自由度,由先进的软件驱动。 与早期僵化、预编程的机器人不同,这款机械臂能在未知环境中流畅运行。”我们的机器人可以在它从未遇到过的厨房里工作,”蒙-威廉姆斯解释说。”它不依赖熟悉的物体或编程路径——它能动态适应。”实现这一点需要最先进的技术:GPT-4处理自然语言指令,将口头请求转化为可执行步骤;同时,先进的视觉技术实时创建对其周围环境的三维理解。”视觉语言模型将图像——杯子、勺子、咖啡——与口头指令配对,”蒙-威廉姆斯解释道。”这相当于给了机器人眼睛和一个认知系统。” Door open, Image credit: Ruaridh Mon-Williams Scooping, Image credit: Ruaridh Mon-Williams Pouring, Image credit: Ruaridh Mon-Williams 征服混乱,一次一杯 为何选择咖啡?虽然对人类来说很简单,但制作咖啡对机器人而言却是一系列挑战。“这是一个‘长周期’任务,”蒙-威廉姆斯解释说。“一连串的动作,每个环节都充满不确定性。” 舀了太多咖啡粉?调整。抽屉卡住了?想办法解决。倒水中途杯子被移动了?重新校准。这款机器人并非简单执行,而是在持续解决问题,利用传感器反馈调整动作。“制作咖啡的过程反映了日常的不可预测性,使其成为测试自适应智能的完美试验场。” 这种适应性在混乱环境中表现尤为出色。“早期的机器人要求一切都完美摆放,”蒙-威廉姆斯说。“我们的机器人则在不确定性中茁壮成长,能处理从未见过的抽屉,或在桌子被碰撞时调整抓握。” 培养这种韧性需要专注投入。“光有智能视觉还不够。传感器和马达必须能即时解读力反馈——这是多种技术的协同演奏。” 它有多像人? 那么,这款机器人离人类智能有多近呢?”在推理和适应性方面,它正接近类人能力,”蒙-威廉姆斯评论道。”它能有效泛化并操控物体。然而,硬件仍有显著差距。人类手臂是极其复杂的生物工具。机器人还远未达到那个水平。” 这款机器人尚未完全准备好进入家庭。”它运行良好,但并非完美无瑕,”他承认。”视觉系统有时可能会将杯子误认。我们正在改进其鲁棒性。”尽管如此,其实时学习能力——区分偶然干扰和任务相关变化——令人印象深刻。”我们为其配备了一个动作知识库,使其无需重新编程即可动态适应。” 从咖啡到更广阔的应用 如果它能掌握咖啡,下一步是什么?“我更关注硬件的进步,而非像外科手术那样的戏剧性飞跃,”蒙-威廉姆斯说。“想象一下,拥有接近人手灵活度的机器人,由当前的人工智能驱动——那才是前沿。”他设想自适应机器人能协助老年人独立生活,并帮助医院员工优先处理人际互动。 该项目的全球合作——横跨爱丁堡大学、麻省理工学院(MIT)和普林斯顿大学——扩展了其潜力。“爱丁堡提供了感觉运动系统的专业知识,MIT贡献了人机协作的见解,普林斯顿则在认知建模方面提供了支持,”蒙-威廉姆斯反思道。“这些不同的视角共同创造了一种整体方法,促使我不仅设想机器人执行任务,更能真正地支持我们。” 挑战依然存在。“杂乱的空间仍然会干扰视觉系统。机器人需要更多的训练样本才能匹敌人类的适应性,”他承认。 一个需要谨慎冲煮的未来 二十年后,蒙-威廉姆斯预见自适应机器人将像智能手机一样普及。“我想象机器人帮助处理日常任务和医疗保健流程,让人类能专注于有意义的互动。”然而,担忧也存在。“不是科幻小说中的机器人接管世界——物理自主性仍然极具挑战。我担心的是权力的集中。拥有这些系统的大公司可能会获得巨大的影响力。” 他是否在其创作中察觉到自主意识?“当它回应我的声音时,我确实感到惊叹,”他笑着说。“但它是在执行映射好的任务,而非独立选择。意识是一个超越当前技术的哲学问题。”目前,它是一个复杂的工具,在模仿智能,但尚未跨入意识的门槛。 Pouring,