快讯列表

关于 黑客新闻 的快讯列表

时间 详情
2025-12-10
17:15
安德烈·卡帕西用 GPT-5.1 思考 API 自动评估 930 条 HN 讨论:开发 3 小时、运行 1 小时、成本 60 美元

据 @karpathy 称,他使用 GPT-5.1 思考 API 对 2015 年 12 月的 930 条 Hacker News 头版文章与讨论进行回溯自动评估,找出最具前瞻性与最不准确的评论,编写代码约 3 小时、运行约 1 小时、成本约 60 美元,来源:twitter.com/karpathy/status/1998803709468487877 与 karpathy.bearblog.dev/auto-grade-hn。 据 @karpathy 称,项目代码开源于 github.com/karpathy/hn-time-capsule,完整结果可在 karpathy.ai/hncapsule 浏览,来源:twitter.com/karpathy/status/1998803709468487877。 据 @karpathy 称,他强调回溯分析是训练前瞻预测模型的实用路径,并指出未来的大模型会以更低成本、更高速度、更高质量完成此类工作,来源:twitter.com/karpathy/status/1998803709468487877。 据 @karpathy 称,当月最具前瞻性的 HN 账号前十为 pcwalton、tptacek、paulmd、cstross、greglindahl、moxie、hannob、0xcde4c3db、Manishearth 和 johncolanduoni,来源:twitter.com/karpathy/status/1998803709468487877。 据 @karpathy 称,这些用时与成本数据为基于 GPT-5.1 思考的多文档 LLM 评估工作流提供了真实的成本-吞吐量基准,约 60 美元在约 1 小时内完成 930 线程的评估,供关注 AI 基础设施效率的交易者参考,来源:twitter.com/karpathy/status/1998803709468487877 与 karpathy.bearblog.dev/auto-grade-hn。

来源