关于 GPT2 的快讯列表
| 时间 | 详情 |
|---|---|
|
2026-01-31 20:55 |
Karpathy称nanochat在8卡H100上3小时训练GPT2级LLM仅需73美元
据@karpathy称,nanochat现可在单台配备8张H100的节点上约3小时完成GPT2级大语言模型训练,成本约73美元,为紧凑型LLM训练提供了明确的成本与时间基准(来源:@karpathy)。据@karpathy表示,GPT2被其视为现代LLM技术栈首次成型的里程碑,此次更新强调在现代表卡上可复现的低成本GPT2级训练(来源:@karpathy)。 |