2026-01-27 14:00
0
DeepSeek发布OCR2,能够以人类相同逻辑顺序识图
摘要
神经日报 消息,1 月 27 日,DeepSeek 发布全新 DeepSeek-OCR 2 模型,采用创新的 DeepEncoder V2 方法,让 AI 能够根据图像的含义动态重排图像的各个部分,而不再只是机械地从左到右扫描。这种方式模拟了人类在观看场景时所遵循的逻辑流程。最终,该模型在处理布局复杂的图片时,表现优于传统的视觉-语言模型,实现了更智能、更具因果推理能力的视觉理解。
神经日报 消息,1 月 27 日,DEEPSeek 发布全新 DeepSeek-OCR 2 模型,采用创新的 DeepEncoder V2 方法,让 AI 能够根据图像的含义动态重排图像的各个部分,而不再只是机械地从左到右扫描。这种方式模拟了人类在观看场景时所遵循的逻辑流程。最终,该模型在处理布局复杂的图片时,表现优于传统的视觉-语言模型,实现了更智能、更具因果推理能力的视觉理解。
声明:文章不代表神经日报观点及立场,不构成本平台任何投资建议。投资决策需建立在独立思考之上,本文内容仅供参考,风险自担!当前页面地址:https://www.nervedaily.com/kuaixun/170182.html