ChatGPT克隆 AI快讯列表 | Blockchain.News
AI 快讯列表

AI 快讯列表关于 ChatGPT克隆

时间 详情
2025-10-13
15:16
nanochat发布:Andrej Karpathy推出极简全栈ChatGPT克隆与端到端大语言模型训练管道

根据Andrej Karpathy(@karpathy)在推特上的信息,nanochat是一个全新开源项目,提供极简、从零开始的全栈训练和推理管道,用于构建类似ChatGPT的大语言模型(LLM)。与只支持预训练的nanoGPT不同,nanochat实现了从预训练、监督微调(SFT)到强化学习(RL)的完整流程,并且代码依赖极少。该管道包括基于Rust的分词器、FineWeb数据预训练、SmolTalk对话中期训练,并覆盖ARC-Easy、MMLU、GSM8K、HumanEval等基准测试。用户只需4小时云GPU训练,即可通过Web UI或命令行界面部署和交互自己的LLM,大幅降低了定制LLM开发门槛。这为AI行业中的快速原型开发、教育和研究工具创造了新的商业机会(来源:@karpathy)。