快讯列表

关于 GPT2 的快讯列表

时间 详情
2026-01-31
20:55
Karpathy称nanochat在8卡H100上3小时训练GPT2级LLM仅需73美元

据@karpathy称,nanochat现可在单台配备8张H100的节点上约3小时完成GPT2级大语言模型训练,成本约73美元,为紧凑型LLM训练提供了明确的成本与时间基准(来源:@karpathy)。据@karpathy表示,GPT2被其视为现代LLM技术栈首次成型的里程碑,此次更新强调在现代表卡上可复现的低成本GPT2级训练(来源:@karpathy)。

来源