关于 AI推理成本 的快讯列表
| 时间 | 详情 | 
|---|---|
| 2025-10-22 04:00 | 
                                        
                                            DeepSeek v3.2 685B MoE 将AI推理成本降至V3.1的1/6–1/7、长上下文加速2–3倍:MIT许可且适配华为芯片,交易要点
                                        
                                         据 @DeepLearningAI,DeepSeek 新的 685B MoE v3.2 仅关注最相关的tokens,使长上下文推理速度较 v3.1 提升 2–3 倍。来源:@DeepLearningAI,2025年10月22日。 据 @DeepLearningAI,处理成本较 v3.1 降低 6–7 倍,API 定价为每百万 input/cached/output tokens 分别为 0.28/0.028/0.42 美元。来源:@DeepLearningAI,2025年10月22日。 据 @DeepLearningAI,模型权重采用 MIT 许可,并对华为及中国芯片进行了优化,有利于在中国本地算力环境中部署。来源:@DeepLearningAI,2025年10月22日。 据 @DeepLearningAI,整体性能与 v3.1 相近,在编程与智能体任务上有小幅提升,在部分科学与数学任务上略有回落。来源:@DeepLearningAI,2025年10月22日。 据 @DeepLearningAI,这些明确的成本与时延数据为交易者提供了可量化的基准,用于跟踪AI基础设施、去中心化算力与链上AI智能体工具赛道的价格压力与效率趋势。来源:@DeepLearningAI,2025年10月22日。 | 
| 2025-08-15 17:28 | 
                                        
                                            尼克·卡特:AI推理成本快速通缩,200美元/月或6个月减半——对AI SaaS与加密代币的交易影响
                                        
                                         根据@nic__carter的说法,AI推理成本每年下降10至1000倍,这意味着在风投补贴的桥接作用下,200美元/月的AI订阅费用约在6个月内可下降约一半(来源:@nic__carter,X,2025-08-15)。对交易者而言,这指向AI SaaS与模型API的价格压缩风险,需在短期内下调营收与ARPU假设(来源:@nic__carter)。该降价趋势亦有厂商侧证:OpenAI于2024-05-13推出GPT-4o,定价为输入100万tokens 5美元、输出100万tokens 15美元,低于此前GPT-4 Turbo水平,印证成本快速下行(来源:OpenAI)。在加密市场,更低推理成本可能提升链上AI代理与数据需求,同时对与算力相关项目的收入模型形成压力,基于卡特的成本路径需将估值重心转向以使用量驱动的增长而非纯粹的高价逻辑(来源:@nic__carter)。短期交易倾向:在价格快速通缩阶段,优先布局受益于用户渗透与使用量提升的标的,等待价格趋稳(来源:@nic__carter)。 |