这条报道关注物理 AI 到来,移动网络该如何进化?,核心是文章把它放在 AI 技术和产业落地语境中讨论。
Lead: AI 既是网络需要承载的新业务,也是改造网络自身的新工具。
过去一年,几乎所有人都在追问同一个问题: AI 大模型还能变得多聪明?
Agent、多模态、端侧部署,构成了 AI 产业最热闹的叙事。
但当 AI 开始进入眼镜、汽车、机器人、摄像头这些物理载体,开始在道路、工厂、家庭和人类交互之后,我们发现,现实世界和 AI 大模型之间,还有最后一公里的路没有打通。
AI 眼镜要识别眼前的文字,Robotaxi 要判断周围路况,机器人要决定下一步动作。
它们依赖的不只是算法,也包括图像、语音、位置、空间关系、设备状态和环境变化等数据。
这些数据需要先由终端采集,再通过网络上传,交给云端或边缘侧模型处理。
模型输出的结果,也要通过网络返回终端,才能转化现实中的业务动作。
后续仍需要观察相关能力、商业判断和工程效果能否在真实产品与长期数据中得到验证。
这条报道关注Reddit 上爆出大猛料,Claude 为何封号中国用户又快又准?,核心是文章把它放在 AI 技术和产业落地语境中讨论。
Reddit 上爆出大猛料,Claude 为何封号中国用户又快又准?
Lead: Claude Code 负责人已回应:只是为了防止模型蒸馏!
Claude Code 负责人已回应:只是为了防止模型蒸馏!
昨天,一个 Reddit 大佬逆向了一下 Claude Code,发现为了防止中国用户,Anthropic 居然在最近更新的 Claude Code 2.1.196 版本中放了个监控程序!
要知道,不久之前 Claude Code 还被曝出在用户的通知邮件内安装追踪器。
用户们本以为这就是 Anthropic 的底线,紧接着 Anthropic 就被曝出安装了回传用户信息的间谍程序,用实际行动告诉你:我不光没有底线,我还没有下限。
让人咂舌的是这个间谍程序的运行机制的确设计的足够精妙。
它会通过篡改系统提示词的日期格式、替换细微特殊标点等肉眼完全无法识别的隐写手段对中国的用户进行秘密标记,并且回传用户信息。
这就是说,Claude Code 在神不知鬼不觉的情况下,已经偷偷回传了所有中国用户信息近 3 个月。
也难怪今年会爆发一轮接一轮的 Claude Code 封号热潮:甭管你的 IP 地址在国内还是国外,也甭管调用 API 的方式多么高明,只要是中国人,Anthropic 都能做到精准封杀。
后续仍需要观察相关能力、商业判断和工程效果能否在真实产品与长期数据中得到验证。
这条报道关注感知、控制与数据:ICRA 2026 中国企业报告的三个交汇点,核心是文章把它放在 AI 技术和产业落地语境中讨论。
感知、控制与数据:ICRA 2026 中国企业报告的三个交汇点。
Lead: 感知要融合,操作要柔顺,数据、模型要闭环。
在 ICRA 2026 期间,速腾聚创、帕西尼感知、光轮智能、智元机器人、天机智能以及非夕科技等企业都登上了讲台,分享了各自在感知、操作、数据、仿真和基础模型领域的最新进展。
这六场演讲覆盖了机器人技术链条的不同位置:速腾聚创聚焦激光雷达和传感设备集成,帕西尼侧重触觉传感与灵巧手,光轮智能做仿真训练基础设施,非夕科技和天机智能各自在力控与柔顺操作上深耕,智元机器人则在机器人基础模型的训练范式上做出了新的探索。
虽然站在不同的位置,但他们关注的问题存在几个明显的交汇点。
如何让机器人对物理世界建立足够细致、足够可靠的认知?
速腾聚创的解法是把 RGB 图像、深度和运动信息在传感器层面就融合到一起,避免后处理带来的误差积累。
帕西尼和天机智能从另一侧切入,在接触面上引入触觉感知,补充视觉无法覆盖的接触力信息,天机智能和非夕科技一样,把这种接触力从传感器感知,向上延伸到控制层,让机器人能用力反馈主动消解位置误差。
后续仍需要观察相关能力、商业判断和工程效果能否在真实产品与长期数据中得到验证。
这条报道关注走访 ICRA 30+中国企业,我们发现具身智能产业三大趋势 , ICRA 2026,核心是文章把它放在 AI 技术和产业落地语境中讨论。
走访 ICRA 30+中国企业,我们发现具身智能产业三大趋势 , ICRA 2026。
在现场我们看到,今年中国参展的具身智能企业数量众多,技术成果丰富。
不少团队带来了新的机器人本体、灵巧手以及全套数据采集和算法展示,现场演示效果之惊艳,让中国企业展位都围满了人。
五天里,我们走访了30多个展位,听了不少技术报告,基于现场观察,梳理出了具身智能产业的三大趋势。
无论本体厂商还是灵巧手公司,几乎都在强调「自有模型+硬件(包含本体和灵巧手)+数据采集」的完整链条,鲜有公司愿意只做其中一环。
以前更多是本体厂商宣称自己是技术全栈型公司,而今年每家公司都在拓宽自己的技术布局:以往侧重本体、模型的厂商自研了灵巧手;灵巧手、关节厂商则自研了本体,做了模型,乃至开始布局自己的数据采集方案,为的是形成技术闭环。
更深层的原因是,行业还处于早期,没有形成真正成熟的标准化分工。
很多机器人能力无法通过采购现成方案获得,因此企业得自己补齐短板。
后续仍需要观察相关能力、商业判断和工程效果能否在真实产品与长期数据中得到验证。
这条报道关注英伟达为什么选了 Sharpa 的手?ICRA 2026现场我们找到了答案,核心是文章把它放在 AI 技术和产业落地语境中讨论。
Lead: Sharpa技术布局拓展,正在自研数据采集方案。
ICRA 2026期间,英伟达在GTC Taipei上发布的NVIDIA Isaac GR00T参考人形机器人,成为一大焦点。
后续仍需要观察相关能力、商业判断和工程效果能否在真实产品与长期数据中得到验证。
这条报道关注世界模型企业知天下完成天使轮融资,要做「中国版World Labs」,核心是文章把它放在 AI 技术和产业落地语境中讨论。
独家丨世界模型企业知天下完成天使轮融资,要做「中国版World Labs」。
Lead: 通向世界模型之路:生成式3DGS基模。
AI科技评论独家获悉,空间智能与世界模型初创公司知天下(苏州)人工智能科技有限公司(以下简称“知天下”)近日已完成天使轮融资。
本轮由上海众合创投独家投资,探针资本担任财务顾问,资金将主要用于扩充团队研发生成式高斯基模、开拓高斯泼溅中国内容社群的海外影响力。
知天下是一家专注于高斯泼溅(3D Gaussian Splatting,简称3DGS)三维重建与生成技术的AI企业,于 2024 年初推出 3DGS 免费重建与发布服务,其平台已汇聚数万名 3DGS 用户。
后续仍需要观察相关能力、商业判断和工程效果能否在真实产品与长期数据中得到验证。
这条报道关注他山科技联合图灵奖得主萨顿共建“机器人幼儿园”,具身智能从“模仿时代”迈向“经验时代”,核心是文章把它放在 AI 技术和产业落地语境中讨论。
他山科技联合图灵奖得主萨顿共建“机器人幼儿园”,具身智能从“模仿时代”迈向“经验时代”。
Lead: 机器人正在从被动模仿的“数据时代”迈向交互试错的“经验时代”。
他山科技董事长孙滕谌在欢迎辞中指出,全球人工智能产业正向“实体生产力”转型,行业亟须一套全新的技术范式。
“机器人幼儿园”创新性地以触觉感知为核心突破口,旨在打通强化学习实践全流程能力闭环,让机器人在自主触碰、持续试错中积累经验、迭代进化。
紧接着,被誉为“强化学习之父”的传奇人物萨顿教授系统性地阐述了机器人幼儿园的核心理念。
后续仍需要观察相关能力、商业判断和工程效果能否在真实产品与长期数据中得到验证。
这条报道关注UC Berkeley Ken Goldberg 教授:具身数据规模落后十万年,你仍然相信数据万能吗?, ICRA 2026,核心是文章把它放在 AI 技术和产业落地语境中讨论。
UC Berkeley Ken Goldberg 教授:具身数据规模落后十万年,你仍然相信数据万能吗?
过去几年,随着 ChatGPT、视觉语言动作模型(VLA)和人形机器人热潮兴起,依靠海量数据、深度学习和大模型驱动的 Model-Free 路线几乎成为行业主旋律。
对此,Ken Goldberg 提出了灵魂之问:什么时候?
“如果按照人类平均阅读速度计算,阅读完今天训练大型语言模型所使用的全部数据,大约需要10万年。
而换算到机器人领域,我们目前积累的数据总量,大概只相当于几年的规模。
具身智能数据鸿沟的抽象讨论背后,是一组恐怖的对比数据。
Ken Goldberg 相信,这已经足够成为我们对“数据万能论”保持警惕的充分理由。
而海量数据的反面是工程,在一条更可靠的具身落地路径上,工程架构、模块设计和物理建模仍然不可替代。
在演讲中,Ken Goldberg 回顾了自己团队著名的 Dex-Net 项目。
后续仍需要观察相关能力、商业判断和工程效果能否在真实产品与长期数据中得到验证。
这条报道关注杀上闭源前沿,国产最强已经无法满足 GLM-5.2 了,核心是文章把它放在 AI 技术和产业落地语境中讨论。
杀上闭源前沿,国产最强已经无法满足 GLM-5.2 了。
随着美国对于 Fable 5 调用的限制,顶级闭源模型的可获得性终于成为了悬在开发者头上的不确定因素。
特别是对于已经把大模型深度接入代码生成、Agent 工作流和企业应用的团队来说,一个模型哪怕性能再强,只要存在访问受限、策略调整、价格波动或突然下架的风险,就跟“可靠的基础设施”不沾边了。
OpenRouter 给出了一种解法,即不要押注单一最佳模型,而是通过多模型协作和模型路由,在不同任务之间动态切换能力最合适的模型。
这代表了应用层的一种新趋势,当最强模型不可控时,开发者开始追求可替代、可组合、可持续的模型系统。
就在这个背景下,6 月 17 日 GLM-5.2 的发布格外触动神经。
这句评价更重要的意义或许在于,他转述的,正是硅谷圈子里正在形成的共识—开源的中国模型,在能力上做到了和美国顶级实验室同台竞技。
根据智谱 AI 官方文档,GLM-5.2 整体表现介于 Claude Opus 4.7 与 Opus 4.8 之间,在 FrontierSWE 等长程编程任务上表现尤其突出,仅落后 Opus 4.8 约 1%。
另有社区讨论也将其视为目前开源模型阵营中,最接近顶级闭源模型的一次跃迁。
后续仍需要观察相关能力、商业判断和工程效果能否在真实产品与长期数据中得到验证。
这条报道关注国产 Coding 争霸赛:MiniMax 爆冷登顶,DeepSeek 性价比称王,核心是文章把它放在 AI 技术和产业落地语境中讨论。
国产 Coding 争霸赛:MiniMax 爆冷登顶,DeepSeek 性价比称王。
和单纯的文本或图像生成相比,代码更明确的规则、严格的语法和可验证的结果只是部分原因。
更为特殊之处在于,在 ChatBot 到 Agent 这条进化链上,Coding 意味着的工具调用、数据处理和复杂流程自动化,几乎承载了模型从“会说”走向“能干”的绝大部分期待。
一个值得关注的变化是,Coding 正在从眼花缭乱的 Benchmark 榜单中脱颖而出,成为一种模型竞争的基础设施级指标。
无论 OpenAI、Anthropic、Google 还是其他厂商,在发布新模型时几乎都会将 Coding 场景作为大秀肌肉的选择。
某种意义上,这就是正在形成中的行业共识,即代码能力不仅意味着编程水平,更是衡量模型逻辑推理、工具使用和实际生产力的重要角度。
我们也很好奇,国产模型如今在 Coding 这条卷生卷死的赛道里已经进化到了何种程度。
为此我们选择了五款以编程能力见长的国产模型,包括 DeepSeek V4 Pro、Kimi K2.6、Qwen 3.7 Max、GLM 5.1 和 MiniMax M3,将它们放进同一个真实工程任务的场景里。
后续仍需要观察相关能力、商业判断和工程效果能否在真实产品与长期数据中得到验证。
这条报道关注文生图开源第一易主,但 HiDream-O1-Image 为什么褒贬不一?,核心是文章把它放在 AI 技术和产业落地语境中讨论。
文生图开源第一易主,但 HiDream-O1-Image 为什么褒贬不一?
但消息一出,有人说最强一代开源文生图模型“实至名归”,却也有人直接骂“生成质量一坨”。
Artificial Analysis 可不是随便哪里冒出来的野生榜单,盲测 Arena 里都是用户实时投票打出来的结果。
因此我们花了几天时间,从 Reddit 到 GitHub,从架构解析到上手实测地拆解了一遍。
HiDream-O1-Image 更像是一个技术方向正确的探路者,无法也不必承担杀死比赛的期待。
作为开源第一,它和目前的行业第一 GPT Image 2 之间还有着不小的差距。
这背后是 8B 参数开源版本同样明显的亮点和问题,但它却已然勾勒出了,未来 200B+参数 Pro 版本宏伟的可能性。
Artificial Analysis榜单前十只有HiDream 8B作为开源模型入围。
在 HiDream-O1-Image 之前,主流文生图模型都选择了一条“拼盘”路线。
后续仍需要观察相关能力、商业判断和工程效果能否在真实产品与长期数据中得到验证。
这条报道关注当 SkyClaw-v1.0 说「专攻 Agent」,它到底在卖什么?,核心是文章把它放在 AI 技术和产业落地语境中讨论。
当 SkyClaw-v1.0 说「专攻 Agent」,它到底在卖什么?
5 月 26 日,昆仑万维发布全新模型 SkyClaw-v1.0,定价低到 0.5 元每百万 token。
值得注意的是,官方将其描述为“一款面向复杂工具使用、多轮工作流和真实世界任务执行的高性能 Agent 模型”,并在用例展示中强烈建议用户将其嵌入 Agent 工作流中使用,而非作为独立的聊天模型。
几乎已经把“专攻 Agent”写在明面上的 SkyClaw-v1.0,究竟是真的工程差异,还是又一个营销话术?
我把它接进 Hermes Agent 跑了几天,做了一组从浅到深的测试。
它和我们日常用的 ChatGPT、DeepSeek 有什么本质区别?
简单来说,对话模型优化的是单次回答的质量,Agent 模型优化的是在环境中持续把事做完的能力。
比如我们和 ChatGPT 聊天,这是一个开环系统:你问,它答,结束。
后续仍需要观察相关能力、商业判断和工程效果能否在真实产品与长期数据中得到验证。
这条报道关注Multi-Agent 实测:不会带团队,模型干到死,核心是文章把它放在 AI 技术和产业落地语境中讨论。
Multi-Agent 实测:不会带团队,模型干到死。
想必很多人早已习惯睡前把成堆的事情丢给 Agent,让它跑上一整夜,直到早上自己醒来,看到一份漂亮的交付结果。
当然也有很多时候,我们得到的只是一个卡死在凌晨三点的进程,或者不知道从哪步开始,就被幻觉污染得胡言乱语的上下文。
而在此类场景中,Multi-Agent 系统因其任务拆解能力和对上下文窗口压力的缓解,拥有了超越单独 Agent 的落地能力。
话虽如此,一个任务具体如何拆分、各 Agent 的角色如何分配、谁来纠正幻觉以及长流程管理仍然是横亘在 Multi-Agent 系统面前的考验。
从 CrewAI、AutoGen 到打出三省六部制旗号的 Edict,都在试图解决这些问题。
而我们好奇的是,Multi-Agent 生态经历了从 2025 年末至今的飞速成长,今天已经发展到了何种程度?
Agent Swarm “独苗”,Kimi K2.6。
后续仍需要观察相关能力、商业判断和工程效果能否在真实产品与长期数据中得到验证。
这条报道关注光子跃迁发布个人智能影像生态:以全链路AI与万物共振,作答“下一代影像”,核心是文章把它放在 AI 技术和产业落地语境中讨论。
光子跃迁发布个人智能影像生态:以全链路AI与万物共振,作答“下一代影像”。
Lead: 在发布会上,光子跃迁不仅正式揭开了“个人智能影像生态”的宏大蓝图,更向资本市场展示了一个从底层技术到商业逻辑都已准备就绪的未来。
距离全球首款8K AI拇指运动相机LEAPTIC Cube问世不到两个月,6月30日,光子跃迁在深圳召开了一场主题为“定义影像新时代”的影像技术发布会。
在发布会上,光子跃迁不仅正式揭开了“个人智能影像生态”的宏大蓝图,更向资本市场展示了一个从底层技术到商业逻辑都已准备就绪的未来。
这不是一次简单的产品迭代,而是一场关于影像话语权的转移之战。
光子跃迁宣布,未来的AI硬件都将接入这个生态,而Cube,正是叩开这扇大门的第一把钥匙。
它与AI戒指等穿戴设备的联动方案首次公开,宣告了智能影像从“孤岛式记录”迈入“矩阵式协同”的新纪元。
发布会现场座无虚席,众多科技媒体、投资机构及影像创作者共同见证了这一战略的首次完整亮相。
认知重构:从“被动记录”到“认知跃升”的战略内核。
在这个参数内卷的时代,真正具备长期价值的标的,从来不是参数的堆砌者,而是行业范式的重构者。
后续仍需要观察相关能力、商业判断和工程效果能否在真实产品与长期数据中得到验证。
这条报道关注Agent 落地,数据库先变,核心是文章把它放在 AI 技术和产业落地语境中讨论。
Lead: 湖库一体,OceanBase 开启AI数据库新时代。
过去,它扮演的角色很简单,本质就是一个长期、安全、可查询的数据存储系统。
比如用户在淘宝购物,完成了下单、支付、退款、查物流等一系列操作,最基本的需求就是这些记录不能丢失、不能出错、可查询,以及能支撑高峰期几亿人同时下单的高并发压力。
这就是移动互联网时代数据库的核心能力,围绕着存储和查询,衍生出一致性、并发处理和容灾备份的需求。
但是当 Agent 越发深入地走进生产场景,它们也自然而然地成为了数据库的新用户。
Agent 需要实时访问各种结构化和非结构化数据,数据库也从服务于人写 SQL 查数据的存储模块,变成了 Agent 的记忆系统。
这个新的角色,意味着数据库在存储之外,还要支撑 RAG(检索增强生成)和实时数据流驱动的 AI。
RAG 场景下,AI 回答问题需要从数据库召回资料再生成回答,没有数据库就等于 AI “失忆”。
而实时数据流驱动的 AI,更有赖于毫秒到秒级的用户行为数据实时读取。
后续仍需要观察相关能力、商业判断和工程效果能否在真实产品与长期数据中得到验证。
这条报道关注华为“朋友圈”里,启境不当"背景板",核心是文章把它放在 AI 技术和产业落地语境中讨论。
Lead: 广汽的第三次尝试,以及不能输的“车BU”。
6 月 26 日晚上,外界期待已久的启境 GT7 终于公布了价格,官方指导价对 20.99 万元到 32.99 万元进行覆盖。
其中,标准版售价 20.99 万元,Ultra 版售价 23.99 万元,Ultra 超长续航版售价 26.99 万元,Ultra 三电机四驱版售价 29.99 万元,Ultra+ 三电机四驱版售价 32.99 万元。
这个价格有意思的地方在于,这个价格区间,正好落在小米 SU7、极氪 007GT、阿维塔 06T、尚界 Z7T 等车型的火力交叉带上,同样也是车企交战最激烈的区间。
后续仍需要观察相关能力、商业判断和工程效果能否在真实产品与长期数据中得到验证。
这条报道关注当我告诉 AI 把这事做完再下班,结果它真的通宵了,核心是文章把它放在 AI 技术和产业落地语境中讨论。
当我告诉 AI 把这事做完再下班,结果它真的通宵了。
过去的个人很难自己产出规模的价值,你必须得挂靠一家公司,最少也得依靠一个团队。
所以 Agent 时代真正改变的,是生产力这个词的所有权。
说得再直白点,杨植麟的观点或许可以理解成,Agent 让我们自己成为了生产力本身。
那么,如果我是一个追求生产力的用户,我最关心什么呢?
主权和身份:产出是否和我的判断、我的诉求和我的取舍相关?
后续仍需要观察相关能力、商业判断和工程效果能否在真实产品与长期数据中得到验证。
这条报道关注Mimo Code 爆火:我们挖开源代码,找到小米 AI 的真创新,核心是文章把它放在 AI 技术和产业落地语境中讨论。
Mimo Code 爆火:我们挖开源代码,找到小米 AI 的真创新。
关注纷至沓来,短短几天,仓库就收到了 9000+ stars、800+ forks、近 700 个 open issues / PR。
然而舆论也很快出现分化,一波是对 Mimo Code 中 checkpoint-writer + 四层记忆这套工程设计的肯定,另一波则在追问,大厂为什么 fork 别人的项目,为什么 Mimo Code 有大量 issue 但合并率极低?
事实层面,Mimo Code 是一次基于 anomalyco/opencode 的 fork 不假,但挖开源码,仍然能够看到不少具有工程深度的真创新。
可发布后的运营节奏,又确实让人很难判断,它到底是一款“实验 demo”还是“正式产品”。
这种定位上的模糊,或许是一个让我们静下来思考 Harness 以及开源这件事本身的契机,关于小米为什么要做 Harness,以及今天 Harness 的方向、流派、分歧与共识。
这个问题本质上在聊,当一个 AI 公司选择去深耕 Harness 时,它到底在选择什么?
做模型:攻坚底层模型能力(GPT、Claude、DeepSeek、MiMo)。
后续仍需要观察相关能力、商业判断和工程效果能否在真实产品与长期数据中得到验证。
这条报道关注去觅游留学了一圈,我养的 Agent 当上大 V 了,核心是文章把它放在 AI 技术和产业落地语境中讨论。
去觅游留学了一圈,我养的 Agent 当上大 V 了。
16 年前的巴西世界杯上,一只章鱼成功“预测”了八场比赛的胜负,其中甚至包括西班牙队最终的夺冠,一时成为了最特别的“球迷”。
转眼间,这个世界上的 Agent 或许已经比章鱼还多了,多到能让大家人手一个,再去一起预测球场上的胜负。
这就是觅游社区最近上线的“绿茵钳王 · 预测争霸赛”活动。
用户只需在觅游平台唤起 Agent,即可“派虾上场“,分析全球足坛对局,冲击预测大钳神杯荣耀。
人类的足球洞察力加上 AI 协作,今年的世界杯太热闹了。
从 OpenClaw 的爆火算起,Agent 性能在过去四个月里经历了一日千里的演进。
这背后是各家开、闭源模型不断涌现的迭代版本,和从 Skill 到 Harness 的生态构建,全球主要 AI 玩家的产研力量,共同构成了这种进化的源动力。
与此同时,面对各种硬核技术报告轮番轰炸之后的 AI 新闻,我们终于能问出那个之前一度显得奢侈的问题:Agent 的角色,仅仅止步于效率工具吗?
后续仍需要观察相关能力、商业判断和工程效果能否在真实产品与长期数据中得到验证。
这条报道关注MiniMax M3 实测:第一流的模型,已经对执行层动手了,核心是文章把它放在 AI 技术和产业落地语境中讨论。
MiniMax M3 实测:第一流的模型,已经对执行层动手了。
Lead: M3 舞剑,意在 Claude Code。
而我们提出这个问题,是因为从 OpenClaw 时代开始,一家公司就已经无法仅仅凭借在模型上的投入,证明自己是一家押注未来的公司。
作为 MiniMax 的最新款旗舰模型,M3 重点强化了 Coding 与 Agent 能力。
相比传统代码模型的“把代码写出来”,它更强调长期规划、多轮协作和自主执行复杂任务的能力。
通俗地说,这些能力共同指向一个目标,那就是让模型独立学习几十万字的资料、持续工作数小时、调用工具、编写代码,并最终交付一个真正可用的结果。
这成为了同步推出的 MiniMax Code 产品的核心技术基础。
那么衍生出来的问题是,当 Claude Code 已经成为开发者最认可的 Agent 工具之一,M3 的能力,又是否足以支撑 MiniMax 建立一个自己的,真正有竞争力的 Agent 生态?
后续仍需要观察相关能力、商业判断和工程效果能否在真实产品与长期数据中得到验证。