AI 快讯列表关于 信息压缩
| 时间 | 详情 | 
|---|---|
| 
                                        2025-10-20 22:13  | 
                            
                                 
                                    
                                        DeepSeek-OCR论文:基于视觉的输入提升大模型效率与信息压缩
                                    
                                     
                            据Andrej Karpathy(@karpathy)指出,DeepSeek-OCR新论文提出将像素级图像作为大语言模型(LLM)输入,相较于传统文本分词输入方式,有助于提升信息压缩效率、缩短上下文窗口并增强计算效率(来源:Karpathy推特)。这种视觉输入不仅能处理更广泛的内容(如加粗、彩色文本及任意图片),还天然支持双向注意力机制,打破文本分词带来的架构限制。同时,去除分词器可降低安全风险,简化Unicode与编码处理流程,提升整体AI系统的流畅性。该方法为企业文档处理、安全与无障碍应用等多模态AI业务场景带来新的市场机会(来源:DeepSeek-OCR论文,Karpathy推特)。  |