AI 快讯列表关于 令牌压缩
| 时间 | 详情 |
|---|---|
|
2026-04-24 03:24 |
DeepSeek推行100万上下文新标准:新型注意力与DSA实现超高效长上下文(深度解析)
据@deepseek_ai在X平台披露,DeepSeek将逐点压缩与DeepSeek稀疏注意力(DSA)结合,显著降低计算与显存开销,并把100万上下文作为官方服务默认配置。根据DeepSeek官方公告,此结构性创新面向长上下文场景,如多文档RAG、海量代码库和企业文档归档,旨在在保证质量的同时降低时延与总拥有成本。该举措据同一来源所述,为企业将检索、总结与合规审计合并为单次推理创造条件,有望减少推理费用与硬件占用,释放长文本应用的商业化落地空间。 |