机器之心 · 2026.07.01 · 9 stories · 6:13

机器之心 AI News Digest

机器之心 2026.07.01 digest with 9 source-grounded stories, Chinese captions, synchronized narration, and source media panels.

Stories

0:00 - 0:46

01. Anthropic 发布 Claude Sonnet 5，主打 Agent 能力和接近 Opus 的性能 Source
文章称 Anthropic 发布 Claude Sonnet 5，将其定位为更具 Agent 属性的 Sonnet 模型，性能接近 Opus 4.
0:47 - 1:41

02. Claude Code 用户检查争议暴露 AI 编程工具的访问治理问题 Source
文章称 Anthropic 在 Claude Code 风控中使用时区、中国 AI 实验室等信号判断账号风险，并把这一做法与中国用户封禁和访问恢复争议联系起来。
1:41 - 2:30

03. 快手 AgentX 把推荐系统研发变成可自我迭代的 Agent 闭环 Source
文章介绍快手 AgentX，称其面向工业推荐系统，把需求理解、代码开发、实验评估和上线反馈组织成多智能体闭环。
2:30 - 3:16

04. 飞书多维表格智能体把表格变成可进群的 AI 同事 Source
文章称飞书多维表格上线智能体能力，让表格里的 Agent 可以单聊、进群、在评论区被 @，并理解权限、团队上下文和业务数据。
3:16 - 3:47

05. LoopCoder v2 认为代码模型只需额外循环一次 Source
文章介绍 LoopCoder-v2 的 Only Loop Once 结论，称一个 7B 模型在 SWE-bench Verified 上通过额外循环一次把分数从 43.
3:47 - 4:17

06. GenEvolve 让图像生成 Agent 学会工具编排 Source
文章介绍 GenEvolve，一个面向开放图像生成的自我进化智能体框架，通过搜索、图像检索和生成知识工具把用户请求转成 prompt-reference program。
4:18 - 4:49

07. SciAgentGym 评测大模型能否完成多步科学工具工作流 Source
文章介绍复旦大学 NLP 实验室提出的 SciAgentGym，用于评估模型在科学工具环境中完成多步任务、处理反馈和恢复错误的能力。
4:49 - 5:38

08. 邢波团队批评当前 Agent 概念，要求区分复杂任务和真正自主性 Source
文章介绍邢波等人的 Critique of Agent Model，认为很多被称为 Agent 的系统只是复杂工具链，并不等于具备真正自主性。
5:39 - 6:13

09. 群核科技三项 ECCV 2026 成果覆盖物理 AI 的数据、仿真和评测 Source
文章称群核科技三篇论文入选 ECCV 2026，涵盖空间感知与推理、强化学习数据生成和高保真物理仿真等物理 AI 关键领域。