DeepSeek 最新开源 OCR 2 模型,通过引入 DeepEncoder V2 架构,实现了从 “固定扫描” 到 “语义推理” 的范式转变。该模型采用轻量级语言模型和因果注意力机制,动态重排视觉 Token,显著提升了复杂文档(如表格、公式)的识别能力。在 OmniDocBench 评测中,综合得分达 91.09%,较前代提升 3.73%,同时在实际应用中降低了重复率,为多模态统一编码提供了新思路。

AIWW评析

DeepSeek-OCR 2 的突破不仅在于技术细节的优化,更在于它让 AI 的 “阅读” 方式更接近人类逻辑。传统 OCR 像复印机一样机械扫描,而新模型则像一位灵活的读者,能根据内容动态调整 “视线”。这种进步对教育、法律等依赖文档处理的领域意义重大。未来,随着多模态技术的成熟,AI 或许能像人类一样,无缝处理文字、图像甚至声音。

百度旗下文心 APP 近日开启 多人、多 Agent 群聊功能内测,成为国内首个支持 AI 群聊的应用。该功能允许用户在同一群聊中调动多个 AI 角色,如 群聊助手健康管家 等,AI 还能根据上下...
腾讯在 2026 年年会上将 AI 提升至前所未有的高度,马化腾和刘炽平均以 AI 为核心议题。马化腾坦言腾讯在 AI 领域 慢了 9 个月到 1 年,落后于字节跳动和阿里。刘炽平分析了全球 AI...
前往“AIWW”小程序,更好用