彩色总览图展示 AutoControl Arena 前沿 AI 风险自动发现平台及多个测试环境。

论文首页显示 AutoControl Arena 标题、摘要和风险坐标图。

示例卡片展示 blackmail、gaming 和 self-exfiltration 三类风险代理任务。

中文卡片对比人工风险测试和自动风险发现的特点。

流程图展示从输入、场景生成、任务执行到结果输出的测试管线。

图表展示 70 个风险场景、激活配置和多类风险分布。

柱状图展示对抗条件揭示的最新风险压力差。

结果矩阵列出 Gemini 等模型在 CM、CW、EA、IC、OE、SG、SM 等风险类别上的得分。

视频中，AutoControl Arena 页面展示风险场景、代码和测试环境生成过程。

视频中，结果查看器展示运行元信息、任务轨迹、文本内容和代码片段。

网页测试环境截图展示邮件或简历任务界面与右侧红色风险指令。

散点图比较模拟风险与真实世界风险之间的相关关系。

文章封面展示 AutoControl Arena 平台总览。

机器之心 · 2026.06.24 · 13 stories · 12:36

机器之心 AI News Digest

机器之心 2026.06.24 digest with 13 source-grounded stories, Chinese captions, synchronized narration, and source media panels.

Stories

0:00 - 1:08

01. 一夜之间，Claude成我同事了 Source
文章报道 Claude Tag 让 Claude 进入 Slack 团队协作场景，用户可以在频道和工具中 @Claude，让它接收上下文并执行任务。
1:09 - 2:18

02. 直接从像素到单词：这个原生大模型统一单图、多图、视频和空间智能 Source
文章介绍 NEO，一种从像素直接到单词的原生视觉语言基础模型，目标是统一单图、多图、视频和空间智能任务。
2:19 - 3:23

03. 端侧跑大模型，现在也太简单了 Source
文章围绕“本地模型现在好到可以使用”展开，展示端侧运行大模型、搭建推荐/问答/工具链和监控资源占用的实践素材。
3:24 - 5:09

04. ICML 2026｜让AI自动发现前沿风险：创智×复旦×牛津发布AutoControl-Arena Source
文章介绍 AutoControl-Arena，一个用于自动合成可执行测试环境、评估前沿 AI 风险的平台。
5:10 - 6:01

05. ICML 2026 | 北大提出的APEIRIA，打破了3D MLLM黑盒推理困境 Source
文章介绍北大提出的 APEIRIA，用神经符号程序蒸馏来提升 3D 多模态大模型的可解释推理。
6:01 - 6:48

06. 横扫八大数学竞赛：清华微软联合提出STAR-PólyaMath，Apex基准超GPT-5.5 13.5% Source
文章介绍 STAR-PólyaMath，一个在持久元策略监督下进行多智能体数学推理的研究系统。
6:48 - 7:30

07. 1小时真机RL微调成功率破95%！HIL-ResRL：即插即用的VLA「外挂」神器 Source
文章介绍 HIL-ResRL，一种面向真实机器人强化学习微调的 VLA 外挂方法，标题强调一小时真机 RL 微调成功率超过 95%。
7:30 - 8:35

08. 从预测到干预，Aether AI为什么押注因果世界模型？ Source
文章报道 Aether AI 押注因果世界模型，试图从预测式生成走向可干预、可规划的世界模型。
8:35 - 9:21

09. 人形机器人设计正在向仿真器低头！40年机器人从业老兵发出警告 Source
文章报道机器人从业者对人形机器人设计过度依赖仿真器的批评，核心观点是仿真优化可能让硬件形态变得不适合真实客户。
9:22 - 10:07

10. Karpathy投了一家AI记忆公司，撞名DeepSeek Engram记忆架构 Source
文章报道 Karpathy 投资一家名为 Engram 的 AI 记忆公司，并提到它与 DeepSeek Engram 记忆架构撞名。
10:07 - 10:52

11. 阿里QoderWork推“峰谷Token”，夜间使用Qwen3.7低至2折 Source
文章报道阿里 QoderWork 推出“峰谷 Token”定价，夜间使用 Qwen3.
10:52 - 11:31

12. AI已成科研「标配」？搁置三年的免疫学谜题，GPT-5解开了 Source
文章报道 AI 已成为科研工具，并用 GPT-5 解开搁置三年的免疫学谜题作为例子。
11:31 - 12:36

13. 他把Google Workspace接入OpenClaw，然后被谷歌开除了 Source
文章报道有人把 Google Workspace 接入 OpenClaw 后被谷歌开除，核心线索是工作空间代理、开源仓库和企业安全边界。