米兰体育MILAN SPORTS 复旦、CityUHK、SMU、UIUC等13家结伴发布「具身智能安全」综述

发布日期:2026-05-28 05:00    点击次数:118

米兰体育MILAN SPORTS 复旦、CityUHK、SMU、UIUC等13家结伴发布「具身智能安全」综述

具身智能(Embodied AI)正在快速从实验室走向真实天下。

自动驾驶汽车运行在城市谈路中穿梭,机械臂在工场里自主捏取和安装,管事机器东谈主逐步干涉病院、市集与家庭。与传统大模子不同,这些系统不再仅仅「在屏幕上话语」——它们正在径直勾通传感器、驱动实践器,并对物理天下产生真实影响。

但与此同期,一个更深层、也更危急的问题正在浮现:当大模子运行驱动物理天下,往时那些「说错话」的安全风险,将第一次演变成「干错事」的试验风险。

关于聊天机器东谈主,一段逃狱提醒词最坏可能仅仅生成无益文本;但关于机械臂、自动驾驶或机器东谈主系统,不异的攻击却可能径直摇荡为危急动作,以致对试验天下酿成不行逆遵循。

近日,来自复旦大学委果具身智能琢磨院、上海创智学院、香港城市大学、新加坡管束大学、伊利诺伊大学、墨尔本大学、约翰霍普金斯大学、南洋理工大学、中科院自动化所等 13 家机构的 38 位学者,结伴发布了迄今最系统的具身智能安全时候综述,全文 70+ 页,隐敝近 480+ 篇磋论说文。

论文标题:Safety in Embodied AI: A Survey of Risks, Attacks, and Defenses

综述将具身智能分辨为一个逐层递进的「五层智商圈」:感知、剖析、贪图、举止与交互,以及 Agentic 系统,并提议了一个联结全文的中枢瞻念察——

「智商—风险」二象性(Capability-Risk Duality)

每增多一层智商,就会新增一层攻击面;智商越强,风险面也越广。

感知

这也组成了整篇综述的中枢组织逻辑。沿着五层智商圈,具身智能系统的风险正在从「数字天下」逐步演化为「物理天下」:

在感知层(举例东谈主脸门禁系统),攻击者主要主宰传感器输入;

当系统具备剖析智商(举例博物馆导览机器东谈主),滚球app(中国)官网下载攻击面进一步扩张到语言会通与视觉推理;

当系统具备贪图与闭环有盘算智商(举例自动驾驶),攻击者以致不错干豫旅途有盘算、轨迹瞻望与及时完了;

当系统进一步具备复杂物理交互智商(举例机械臂、东谈主形机器东谈主),虚伪有盘算将径直摇荡为试验天下中的危急动作与物理伤害;

而当系统演化为具备追思、器用调用、自主贪图与继续进化智商的 Agentic 系统后,内层任性一个随意,都可能沿着智商栈逐层级联放大。

换句话说,往时那些被孤苦筹谋的「扞拒样本」「后门攻击」「逃狱攻击」,在具身智能时间将不再仅仅单点安全事件。

它们会沿着「感知—剖析—贪图—举止」的智商链条不休传递与放大,最终从一次模虚伪伪,演变为一次真实天下中的系统性事故。

图 1:「智商—风险」二象性。智商栈每多一层,攻击面扩大一圈。

五层威逼,米兰体育MILAN SPORTS一图看懂具身智能安全

综述进一步将分散的攻击与古老琢磨长入到团结套智商框架中,系统梳理了不同智商层对应的中枢攻击面与试验风险:

智商层

2026世界杯中国最新押注app

代表性攻击

真实天下遵循

感知层

扞拒样本、后门攻击、传感器乱来

挫折物漏检、罢手记号误判、雷达乱来

剖析层

想维链劫持、推理后门

空间会通虚伪、高低文误会、虚伪语义推理

贪图层

任务逃狱、轨迹中毒、有盘算主宰

不安全旅途贪图、违背完了指示、机器东谈主闯入禁区

举止与交互层

完了扞拒、东谈主机交互后门

机械臂撞东谈主、车辆失控、绕过安全公约

Agentic 系统层

器用 / 妙技浮滥、追思投毒、追思涌现、级联失效

历久不安全举止、狡饰涌现、跨任务耻辱、自进化对都坍弛

图 2:具身智能 5 层智商栈中的攻击面与威逼散布。

这篇综述与已有使命不同在那处?

具身安全这两年浮现了一批综述(VLA Safety, Trustworthy EAI, World-Model Safety, LLM Robotics Security 等)。但绝大大宗只看其中一层——

有的只琢磨 VLA 模子的扞拒鲁棒性;

有的只看导航场景下的庄重性;

有的只护理 LLM 完了机器东谈主时的提醒注入;

还有的把安全手脚「IoT 系统中的一个组件」。

而这篇综述扶助一个中枢态度:

必须端到端地看总共 embodied pipeline,因为攻击会跨层级联。

它不仅整合了 embodied-specific 的使命,还从 vision、language、multimodal 基础模子安全琢磨中筛选出与具身高度关系的使命,把「具身智能安全」放回更大的 AI 安全图景里。

被低估的几个琢磨空缺

读这篇综述最值得储藏的部分,是它指出的几条简直没东谈主系统琢磨的怒放问题:

多模态交融的脆弱性——交融越多模态,安全越复杂,但当今简直莫得针对交融层的攻防分析;

贪图层在逃狱攻击下的清醒性——LLM 当 planner,逃狱遵循不再是「输出无益文本」,而是「机器东谈主运行实践无益任务」;

怒放场景下的东谈主机交互委果度——传统 HRI 安全假定交互是闭合的,但真实天下里的对话是怒放的;

Agentic 系统的级联失效旅途——追思、器用、妙技、自进化之间若何相互耻辱,当今穷乏风景化框架。

这些每一条都足以撑起一个孤立的琢磨所在。

不仅仅综述,更是一套社区资源

团队同期珍摄了齐备的怒放资源生态,包括:

Awesome-Embodied-AI-Safety GitHub 仓库(已收录 480+ 篇著述,按层级 + 子类组织,继续更新);

面孔网站:提供分类浏览、琢磨统计与结构化阅读视图;

arXiv 双月更新机制:团队以双月节拍同步最新 arXiv 使命,当今已纳入 HazardArena、RedVLA、JailWAM、IPI-in-Wild、MCP Function Hijacking、Skill Safety 等最新琢磨。

关于护理具身智能安全的琢磨者而言,这篇综述不仅是一份文件整理,更像是一张干涉总共限制的「导航舆图」。

写在临了

具身智能正在再行界说 AI 与试验天下的勾通风景。

当一个模子不再仅仅「在屏幕上话语」,而运行确凿干涉物理天下——运行捏取、行走、操控、驾驶、交互、恒久追思,以致自主进化——安全问题也正在发生根人性变化。

往时,模子「说错一句话」,遵循常常仍停留在数字空间;

而在具身智能时间,一次感知偏差、一次贪图虚伪、一次逃狱攻击,都可能最终演化为真实天下中的危急动作与系统性事故。

这意味着,安全依然不再仅仅某一种攻击、某一个 Benchmark、某一篇论文能够单独处置的问题。

它正在成为联结感知、剖析、贪图、举止与 Agentic 系统的底层问题。

而这篇综述最进攻的小数,或者恰是它反复强调的那句话:

在具身智能时间,安全应当与智商同步假想,而不是过后打补丁。

淌若你也在护理机器东谈主、自动驾驶与智能体若何确凿走进试验天下米兰体育MILAN SPORTS,那么这篇综述,值得储藏。