【新智元导读】百度开源Unlimited OCR!3B参数500M激活,一口气读完40页不失忆。作者疑似DeepSeek出走的OCR核心大神。

就在刚刚,百度闷声干了票大的!

最新开源的Unlimited OCR,总参数3B,实际激活仅500M——放在大模型时代几乎是个零头。

但就是这个小到离谱的模型,在OmniDocBench v1.5上拿下93.23%的综合分,v1.6更是达到93.92%,直接刷新了端到端SOTA。

什么概念?v1.5同台竞技的选手里,235B的Qwen3-VL拿了89.15,72B的Qwen2.5-VL拿了87.02,不公布参数量的Gemini-2.5 Pro也只有88.03。激活参数不到它们零头的选手,反手把它们全甩了。

更离谱的是,它还干了件之前没有OCR模型干成过的事:一口气解析40多页文档,不失忆、不降速,一次推理从第一页读到最后一页。

目前,模型和代码都已同步上线GitHub和HuggingFace。

本文转自:凤凰网科技

原文地址: https://tech.ifeng.com/c/8u9KEpsHLSH