谷歌发布了 Gemini 3 Deep Think 重大升级,这个专门用于复杂推理的 AI 模型在编程竞赛中达到 3455 Elo 分数,相当于世界排名第八的顶尖竞技程序员水平,全球只有 7 个人能在编程比赛中击败它。该模型还在多个科学领域表现出色,在物理和化学奥赛中取得金牌成绩,且成本相比之前模型降低了 280-420 倍,每任务仅需 7.17 美元。现已向 Google AI Ultra 订阅用户开放。

AIWW评析

当 AI 的编程能力超越 99.99% 的人类程序员时,我们正在见证硅基智能的质变时刻。这不仅意味着代码生成工具的升级,更预示着 AI 从辅助工具向独立研究者的转变。成本降低数百倍的同时性能大幅提升,让顶尖智能变得平民化,科研门槛将被彻底打破。但这也引发深刻思考:当 AI 能在数学物理竞赛中夺金,人类独特的价值何在?或许未来不是人与 AI 竞争,而是会思考的 AI 与不会思考的人类的分野。

Anthropic 在大年初二发布了 Claude Sonnet 4.6,这款模型在计算机操作能力上接近人类水平,能处理复杂 Excel 表格和网页清单任务。更惊人的是,它在大多数 Agent 任务上表现与顶级 Opus 系列相当,速度更快,价格却...
AI 公司 Anthropic 宣布完成 300 亿美元融资,估值达到 3800 亿美元,较去年 9 月的 1830 亿美元翻了一番。本轮融资由 Coatue 和新加坡 GIC 领投,包含微软和英伟达此前承诺的部分投资。Anthropic 去年营收约 ...
前往“AIWW”小程序,更好用