(2025-10-21热点)-DeepSeek团队开源OCR新模型:少量视觉token完成海量文本压缩

zydadmin  48

今天上午,DeepSeek-AI 团队发布《DeepSeek-OCR:Contexts Optical Compression》论文,提出利用视觉模态压缩长文本上下文的新方法。Hugging Face 页面显示,该模型的参数量为 3B。

根据介绍,此次开源的 DeepSeek-OCR 由两个部分组成:核心编码器 DeepEncoder 和解码器 DeepSeek3B-MoE-A570M。DeepEncoder 专为在高分辨率输入下保持低计算激活而设计,同时实现高压缩比,以控制视觉 token 数量在可管理的范围内。实验显示,当文本 token 数量不超过视觉 token 的 10 倍(压缩比低于 10×)时,模型的 OCR 精度可达 97%;即便压缩比提高到 20×,准确率仍保持约 60%,展现出在历史文档长上下文压缩和大语言模型记忆机制研究中的巨大潜力。DeepSeek-OCR 同时具备较高的实际应用价值。

在 OmniDocBench 测试中,DeepSeek-OCR 使用 100 个视觉 token 就超过了 GOT-OCR2.0(每页 256 个 token),而使用不到 800 个视觉 token 便优于 MinerU2.0(平均每页超过 6000 个 token)。

在实际生产中,DeepSeek-OCR 可在单块 A100-40G 显卡上每天生成超过 20 万页的大语言模型 / 视觉语言模型训练数据。

转载请注明原文地址:https://www.suobianbian.com/read-206040.html

随机主题
出国的感慨句子简短(异国他乡的励志句子)出发去旅行的心情短句(旅行发圈简短句子)充实愉快的周末发圈句子说说(今天心情美美的句子)出国发朋友圈的说说(出国的感慨句子简短)成长的路上的经典句子长篇摘抄(孩子慢慢长大唯美句子)成长蜕变的励志的句子要有出处(励志名言作者及出处)承蒙你的出现够我余生的说说(承蒙你出现经典句子)城墙的古风句子(我的世界古风城墙)充满能量的经典句子(正能量金句)充满正能量的励志语录早安短句(励志的句子经典语句)充满少女心甜甜的句子简短(表达少女心爆棚的句子)吃喜酒开心的句子简短(沾喜气的经典句子)成长的路上的经典句子朗读(成长的路上感悟短句)成长的路上的经典句子男声(儿子成长的道路上的句子)成都游玩文案朋友圈(成都游玩后适合发朋友圈的句子)成功的名言励志句子(简单的名言名句有哪些)成婚的古风句子(唯美句子摘抄古风)陈的古风句子(古风美陈效果)陈醋的古风句子(古风霸气潇洒的句子)沉淀自己的励志句子(形容人积累沉淀的词)超拽押韵句子(特别押韵的句子)超拽高冷句子八个字(高冷无情超拽霸气说说)超拽高冷句子集锦(霸气高冷的短句)超拽高冷句子文案(霸气最拽最狠的文案)尘埃宇宙古风句子(我是宇宙间的尘埃是什么歌)超拽高冷句子女短句(霸气高冷到爆的句子短句女)尘埃宇宙古风句子(关于宇宙星辰的古诗句)古风凄美句子凄凉(淡雅唯美古风意境句子)古风女追男文案句子(女追男古风小说推荐)古风逆天句子(等一人归来的句子古风)
最新回复(0)