米兰体育MILAN SPORTS 复旦、CityUHK、SMU、UIUC等13家结伴发布「具身智能安全」综述

发布日期：2026-05-28 05:00 点击次数：118

具身智能（Embodied AI）正在快速从实验室走向真实天下。

自动驾驶汽车运行在城市谈路中穿梭，机械臂在工场里自主捏取和安装，管事机器东谈主逐步干涉病院、市集与家庭。与传统大模子不同，这些系统不再仅仅「在屏幕上话语」——它们正在径直勾通传感器、驱动实践器，并对物理天下产生真实影响。

但与此同期，一个更深层、也更危急的问题正在浮现：当大模子运行驱动物理天下，往时那些「说错话」的安全风险，将第一次演变成「干错事」的试验风险。

关于聊天机器东谈主，一段逃狱提醒词最坏可能仅仅生成无益文本；但关于机械臂、自动驾驶或机器东谈主系统，不异的攻击却可能径直摇荡为危急动作，以致对试验天下酿成不行逆遵循。

近日，来自复旦大学委果具身智能琢磨院、上海创智学院、香港城市大学、新加坡管束大学、伊利诺伊大学、墨尔本大学、约翰霍普金斯大学、南洋理工大学、中科院自动化所等 13 家机构的 38 位学者，结伴发布了迄今最系统的具身智能安全时候综述，全文 70+ 页，隐敝近 480+ 篇磋论说文。

论文标题：Safety in Embodied AI: A Survey of Risks， Attacks， and Defenses

综述将具身智能分辨为一个逐层递进的「五层智商圈」：感知、剖析、贪图、举止与交互，以及 Agentic 系统，并提议了一个联结全文的中枢瞻念察——

「智商—风险」二象性（Capability-Risk Duality）

每增多一层智商，就会新增一层攻击面；智商越强，风险面也越广。

感知

这也组成了整篇综述的中枢组织逻辑。沿着五层智商圈，具身智能系统的风险正在从「数字天下」逐步演化为「物理天下」：

在感知层（举例东谈主脸门禁系统），攻击者主要主宰传感器输入；

当系统具备剖析智商（举例博物馆导览机器东谈主），滚球app(中国)官网下载攻击面进一步扩张到语言会通与视觉推理；

当系统具备贪图与闭环有盘算智商（举例自动驾驶），攻击者以致不错干豫旅途有盘算、轨迹瞻望与及时完了；

当系统进一步具备复杂物理交互智商（举例机械臂、东谈主形机器东谈主），虚伪有盘算将径直摇荡为试验天下中的危急动作与物理伤害；

而当系统演化为具备追思、器用调用、自主贪图与继续进化智商的 Agentic 系统后，内层任性一个随意，都可能沿着智商栈逐层级联放大。

换句话说，往时那些被孤苦筹谋的「扞拒样本」「后门攻击」「逃狱攻击」，在具身智能时间将不再仅仅单点安全事件。

它们会沿着「感知—剖析—贪图—举止」的智商链条不休传递与放大，最终从一次模虚伪伪，演变为一次真实天下中的系统性事故。

图 1：「智商—风险」二象性。智商栈每多一层，攻击面扩大一圈。

五层威逼，米兰体育MILAN SPORTS一图看懂具身智能安全

综述进一步将分散的攻击与古老琢磨长入到团结套智商框架中，系统梳理了不同智商层对应的中枢攻击面与试验风险：

智商层

2026世界杯中国最新押注app

代表性攻击

真实天下遵循

感知层

扞拒样本、后门攻击、传感器乱来

挫折物漏检、罢手记号误判、雷达乱来

剖析层

想维链劫持、推理后门

空间会通虚伪、高低文误会、虚伪语义推理

贪图层

任务逃狱、轨迹中毒、有盘算主宰

不安全旅途贪图、违背完了指示、机器东谈主闯入禁区

举止与交互层

完了扞拒、东谈主机交互后门

机械臂撞东谈主、车辆失控、绕过安全公约

Agentic 系统层

器用 / 妙技浮滥、追思投毒、追思涌现、级联失效

历久不安全举止、狡饰涌现、跨任务耻辱、自进化对都坍弛

图 2：具身智能 5 层智商栈中的攻击面与威逼散布。

这篇综述与已有使命不同在那处？

具身安全这两年浮现了一批综述（VLA Safety， Trustworthy EAI， World-Model Safety， LLM Robotics Security 等）。但绝大大宗只看其中一层——

有的只琢磨 VLA 模子的扞拒鲁棒性；

有的只看导航场景下的庄重性；

有的只护理 LLM 完了机器东谈主时的提醒注入；

还有的把安全手脚「IoT 系统中的一个组件」。

而这篇综述扶助一个中枢态度：

必须端到端地看总共 embodied pipeline，因为攻击会跨层级联。

它不仅整合了 embodied-specific 的使命，还从 vision、language、multimodal 基础模子安全琢磨中筛选出与具身高度关系的使命，把「具身智能安全」放回更大的 AI 安全图景里。

被低估的几个琢磨空缺

读这篇综述最值得储藏的部分，是它指出的几条简直没东谈主系统琢磨的怒放问题：

多模态交融的脆弱性——交融越多模态，安全越复杂，但当今简直莫得针对交融层的攻防分析；

贪图层在逃狱攻击下的清醒性——LLM 当 planner，逃狱遵循不再是「输出无益文本」，而是「机器东谈主运行实践无益任务」；

怒放场景下的东谈主机交互委果度——传统 HRI 安全假定交互是闭合的，但真实天下里的对话是怒放的；

Agentic 系统的级联失效旅途——追思、器用、妙技、自进化之间若何相互耻辱，当今穷乏风景化框架。

这些每一条都足以撑起一个孤立的琢磨所在。

不仅仅综述，更是一套社区资源

团队同期珍摄了齐备的怒放资源生态，包括：

Awesome-Embodied-AI-Safety GitHub 仓库（已收录 480+ 篇著述，按层级 + 子类组织，继续更新）；

面孔网站：提供分类浏览、琢磨统计与结构化阅读视图；

arXiv 双月更新机制：团队以双月节拍同步最新 arXiv 使命，当今已纳入 HazardArena、RedVLA、JailWAM、IPI-in-Wild、MCP Function Hijacking、Skill Safety 等最新琢磨。

关于护理具身智能安全的琢磨者而言，这篇综述不仅是一份文件整理，更像是一张干涉总共限制的「导航舆图」。

写在临了

具身智能正在再行界说 AI 与试验天下的勾通风景。

当一个模子不再仅仅「在屏幕上话语」，而运行确凿干涉物理天下——运行捏取、行走、操控、驾驶、交互、恒久追思，以致自主进化——安全问题也正在发生根人性变化。

往时，模子「说错一句话」，遵循常常仍停留在数字空间；

而在具身智能时间，一次感知偏差、一次贪图虚伪、一次逃狱攻击，都可能最终演化为真实天下中的危急动作与系统性事故。

这意味着，安全依然不再仅仅某一种攻击、某一个 Benchmark、某一篇论文能够单独处置的问题。

它正在成为联结感知、剖析、贪图、举止与 Agentic 系统的底层问题。

而这篇综述最进攻的小数，或者恰是它反复强调的那句话：

在具身智能时间，安全应当与智商同步假想，而不是过后打补丁。

淌若你也在护理机器东谈主、自动驾驶与智能体若何确凿走进试验天下米兰体育MILAN SPORTS，那么这篇综述，值得储藏。

米兰棋牌

米兰体育MILAN SPORTS 复旦、CityUHK、SMU、UIUC等13家结伴发布「具身智能安全」综述