Karpathy发布nanochat缩放定律结果:8张H100约100美元实现计算最优训练,CORE分数对标GPT-2/3
据@karpathy,nanochat首个miniseries v1在固定FLOPs下跨模型规模实现计算最优训练,端到端流程与脚本已开源可复现。来源:@karpathy在X 2026年1月7日;nanochat GitHub讨论#420 他称nanochat复现了类似Chinchilla的缩放规律,参数与数据的指数均接近0.5,并给出计算无关的常数约为8个token/参数,而Chinchilla报告为20。来源:@karpathy在X 2026年1月7日;Hoffmann等人2022年Chinchilla 该系列从d10到d20,在单个8卡H100节点、无需梯度累积的条件下实现了约2^19(约50万)的批量,训练曲线互不相交。来源:@karpathy在X 2026年1月7日 他使用CORE分数将nanochat与GPT-2和估算的GPT-3进行客观对齐对标。来源:@karpathy在X 2026年1月7日;DCLM论文(CORE分数) 整套实验成本约100美元,约4小时8张H100完成,全部调参与代码已推送至master,可用scaling_laws.sh与miniseries.sh复现。来源:@karpathy在X 2026年1月7日;nanochat GitHub讨论#420 据此可推算出本次运行的H100单卡小时成本约3.1美元,为AI工作负载的算力定价提供参考。来源:基于@karpathy在X 2026年1月7日的计算 对加密市场而言,去中心化GPU网络以算力/GPU时长为核心定价或撮合,使上述成本与缩放基准对其工作负载定价和基准评测直接相关,例如Render Network(RNDR)与Akash Network(AKT)。来源:Render Network官方文档;Akash Network官方文档
原文链接详细分析
安德烈·卡帕西的最新见解通过nanochat miniseries v1揭示了大型语言模型(LLM)的扩展法则,这对加密货币市场产生了潜在影响。作为AI和金融分析师,我认为这一发展可能推动AI相关代币的表现,因为它强调了高效计算使用和模型优化。卡帕西在2026年1月7日的帖子中指出,优化LLM不是针对单一模型,而是针对由计算支出控制的模型家族,这允许可预测的扩展并为更大投资提供信心。这可能影响FET和RNDR等AI加密代币的交易策略,这些代币受益于AI基础设施的进步。
AI扩展法则:加密交易机会的提升
在帖子中,卡帕西解释了nanochat如何重现Chinchilla论文的扩展法则,在固定FLOPs预算下训练模型,显示模型大小和训练令牌之间的最佳平衡。他指出参数(N)和令牌(D)的指数约为0.5,导致nanochat的计算独立常数为8,与Chinchilla的20相比。这对交易者至关重要,因为它标志着高性能AI模型的成本降低——在8x H100 GPU上进行miniseries只需约100美元。从加密角度,这直接与RNDR等代币相关,后者促进去中心化GPU渲染,随着AI项目经济扩展,可能需求增加。交易者应监控RNDR的价格动态,后者历史上与AI硬件公告相关,在关键支撑位4.50美元以下提供入场点。
AI加密的市场情绪和机构资金流动
训练计算最优模型并通过CORE分数与GPT-2和GPT-3基准相关联,将nanochat定位为AI开发的成本有效替代。卡帕西的miniseries成本仅100美元,可在可访问硬件上运行,这民主化了AI训练,可能推动机构对区块链AI解决方案的兴趣。例如,FET(Fetch.ai)和AGIX(SingularityNET)等代币可能从中受益,它们专注于AI代理经济和去中心化智能。更大市场情绪显示AI加密代币在加密牛市中获得牵引,AI代币总市值在2025年底数据超过200亿美元。投资者可关注FET在2.80美元的阻力位,那里的突破潜力与积极AI新闻流一致,由链上指标如上升交易量支持。
将此与股市联系,卡帕西提到H100 GPU强调了NVIDIA在AI计算中的主导地位,NVDA股票常影响加密情绪。随着AI扩展更高效,对NVIDIA硬件的需求可能激增,通过共享计算生态间接提升BTC和ETH等加密挖掘代币。ETH交易量显示与AI进步的相关性,24小时量达150亿美元峰值。对于跨市场机会,考虑ETH/USD对,在3200美元支撑位提供低风险入场,如果AI炒作持续。风险包括AI能源使用的监管审查,但总体而言,这一新闻强化了AI集成加密的看涨趋势。
AI创新中的交易策略
为利用卡帕西的nanochat进步,交易者应关注技术指标。对于BTC,常引领科技创新推动的加密反弹,观察65,000美元左右的50日移动平均线买入信号。TAO(Bittensor)等AI代币如果扩展法则导致更广泛采用,可能看到20-30%涨幅,当前情绪指标显示RSI低于40的超卖状况。根据Chainalysis报告等来源跟踪的机构流动,显示AI-区块链混合投资增长,可能驱动流动性。总之,这一AI进步提供具体交易优势,强调高效计算作为未来加密估值的关键驱动。
Andrej Karpathy
@karpathyFormer Tesla AI Director and OpenAI founding member, Stanford PhD graduate now leading innovation at Eureka Labs.