STORY 01 / 12
STORY 02 / 12
STORY 03 / 12
STORY 06 / 12
STORY 08 / 12
STORY 11 / 12
STORY 12 / 12
Anthropic 离职员工创立 Mirendil,起步就是 2 亿美元种子轮融资,估值约 10 亿美元。
这家公司想做的不是普通 AI for Science,而是让 AI 帮助科学家训练自己的 AI。
两位创始人来自 Anthropic,此前也在 Google 和前沿模型机构做过底层研究。
他们押注的关键词是递归自我改进,也就是让 AI 参与优化自身能力和科研工具链。
这条新闻的信号是,前沿 AI 创业正在从聊天产品,继续深入科学建模和模型自动化。
但目前还没有公开产品和基准,估值更多反映团队、赛道和资本预期。
Unconventional AI 发布 Un-0,称它是第一个用物理作为计算原语的大规模生成模型。
它不是只用 GPU 做矩阵运算,而是让模拟耦合振子系统随时间演化来承担一部分计算。
文章中的轨迹图,把不同类别图像的生成过程画成了时间路径。
更细的状态图显示,多条振子轨迹共同形成系统内部表示。
结构图里,振子池接收条件信号,再由解码器生成图像。
在 ImageNet 64×64 上,文章称 Un-0 达到 FID 6.74,已经接近一些传统生成方法早期水平。
但它真正押注的是能耗:团队希望未来把 AI 推理能耗降到当前系统的千分之一。
Naveen Rao 的讨论也强调,关键是把物理系统映射成可训练的动力系统。
所以这不是图像生成模型的终局,而是物理计算路线的一次 Hello World。
接下来要验证的是规模化、可编程性,以及它能否真的替代主流推理计算的一部分。
多家媒体让大模型参加 2026 年高考题,讯飞星火 X2 成为这轮中文考试评测里的高分选手。
在物理类全科总分中,Claude Opus 4.8 和讯飞星火 X2 都达到 708 分。
数学专项里,讯飞星火拿到 148 分,领先 Kimi、DeepSeek、智谱、MiniMax 和 ChatGPT。
作文测试也显示,头部模型之间差距不大,但中文表达和审题稳定性会影响排名。
文章把星火的优势归因于语言理解、数理推理和综合分析之间的均衡。
但高考不是完整基准;它能说明考试能力,却不能直接说明真实世界任务能力。
深度机智完成新一轮数亿元融资,把物理 AI 基座模型作为这轮故事的核心。
文章称,公司走的是人类学习路线,从第一视角数据开始训练具身智能系统。
它强调 DeepAct 多模态数据集、动作建模、机器人本体和真实场景落地。
融资方包括国寿长三角科创基金和多家产业资本,说明资本仍在押注具身智能基础设施。
如果第一视角数据和场景订单能持续扩大,它可能成为国产物理 AI 的重要样本。
但这是公司口径报道,模型泛化、订单质量和真实领先性还需要更多外部证据。
LabVLA 想解决的问题是,让 AI 不只读懂实验步骤,还能在实验台上动手。
团队把视觉、语言和动作预训练引入科学实验场景,目标是跨任务、跨环境泛化。
演示图里,Franka 机械臂在试管和透明容器之间执行实验动作。
文章称,LabVLA 在 LabUtopia 基准上 ID 和 OOD 平均成功率分别为 71.1% 和 70.0%。
真正的难点是安全、透明液体和严格流程,所以这仍是从实验演示走向实验室助手的一步。
UniSHARP 的目标,是让单目 3DGS 不再只适配普通透视相机,而是覆盖真实世界里混杂存在的多种成像系统。
它把透视、广角、鱼眼和 360 度全景相机放进同一个模型框架,避免为每种相机单独设计一套重建流程。
单张输入图像就能预测 3D 高斯点云,并生成新的观察视角,这对运动相机、全景相机和手机照片都更实用。
团队还构建了 OmniRooms 数据集,包含 30 万张全景图和深度,用来支撑混合相机训练。
这类方法的价值在于,一张手机图、运动相机图或全景图,都可能进入同一套 3D 内容管线,降低 3D 内容生产门槛。
但跨相机统一不等于没有伪影,复杂几何、反光表面和真实拍摄条件仍然需要更多验证。
Artic 的出发点是,视频通话另一端可能是多模态大模型。
传统 RTC 让人看得舒服;AI 助手要回答更准、延迟更低。
车牌示例显示,看起来清晰,不一定让模型答对关键内容。
文章报告,Artic 提升 15.12% 准确率,并降低 135.31 毫秒延迟。
准确率-码率曲线说明,同样带宽下,要服务模型理解。
它给智能眼镜和实时视频助手提供了新的网络优化目标。
Lilian Weng 更新博客,主题是谨慎对待 Scaling Law。
她提醒大家,很多人可能会让 AI 总结这篇长文,而不是认真读完。
Scaling Law 的基本变量,是模型规模、数据量、计算量和训练损失。
最吸引人的地方,是小规模实验能外推大模型训练需求。
但外推只在特定区域可靠,小数据区域和不可约误差区域都会让曲线失真。
Kaplan 和 Chinchilla 的分歧,本质上和算力、数据、参数如何分配有关。
IsoFLOP 分析试图在固定算力下寻找更优的模型和数据配比。
文章还强调,重复数据和数据受限训练会改变损失曲线。
固定训练长度和可变训练长度,也会给预测结果带来不同偏差。
过拟合项则提醒我们,更多数据和更多训练并不总是线性换来收益。
所以这篇博客的实用结论是,Scaling Law 很有用,但拟合、数据和边界条件必须一起看。
它不是水晶球,而是一套需要持续校准的工程估算工具。
钉钉悟空通过 ISO/IEC 42001 人工智能管理体系认证,把企业 Agent 的安全问题摆到台前。
文章强调,智能体不只是能生成内容,还会进入文件、订单、运营和数据分析流程。
因此安全重点变成权限交集、操作审计、快照回退和数据隔离。
悟空还把提示词注入、模型污染和运行时违规操作列为需要主动防范的风险。
这条新闻的行业意义是,Agent 上岗以后,合规会从加分项变成基础设施。
但认证不等于没有风险,真实场景仍需要持续红队测试、日志审计和权限治理。
若黑科技这条新闻,关键不是又一台机器人,而是它拿到了面向加油站的防爆资质。
加油站是高风险环境,机器人必须从电路、结构和连接点上控制点火风险。
文章展示的“独月 01”,是一套面向智能加注的机器人方案。
GIF 里可以看到机器人在展台上操作油枪,这对应加注动作的具体执行。
技术图里,加油大脑把环境观测、目标生成和动作细化放进同一套闭环。
H-GAR 图则说明,系统要在单目观测里预测可执行的下一步动作。
这条新闻的意义,是具身智能开始面对认证、危险环境和真实工业责任。
但能否大规模铺开,还要看真实加油站里的故障率、维护成本和监管接受度。
Dawn Song 加入 Meta 超级智能实验室,担任 AI 研究副总裁。
她是计算机安全和 AI 安全领域的重要学者,研究覆盖软件安全、对抗机器学习和智能体安全。
Google Scholar 截图显示,她在安全领域有长期高影响论文。
文章还提到 Virtue AI 团队成员加入 Meta,强化红队测试和运行时护栏能力。
对 Meta 来说,安全不是附属问题;它要把 AI 放进社交产品和开源生态,就必须证明模型可控。
但高水平人才加入只是开始,真正要看的还是产品级评测、审计和风险处置。
这篇脑机接口报道关注两个问题:用户能不能更快学会,系统能不能更久稳定使用。
耶鲁团队的论文从个体大脑活动的流形几何入手,训练非侵入式 BCI。
实验图显示,系统先学习每个人脑活动里的低维结构,再把反馈映射到这个结构上。
当映射顺着大脑自然流形时,参与者能更快学会控制;偏离流形时,学习明显困难。
另一组素材提醒我们,BCI 真正落地还要面对临床环境、长期训练和稳定使用。
所以这不是单纯提高解码准确率,而是让机器接口学会顺着人的大脑工作。