关于 安德烈·卡帕西 的快讯列表
| 时间 | 详情 |
|---|---|
|
2025-12-10 17:15 |
安德烈·卡帕西用 GPT-5.1 思考 API 自动评估 930 条 HN 讨论:开发 3 小时、运行 1 小时、成本 60 美元
据 @karpathy 称,他使用 GPT-5.1 思考 API 对 2015 年 12 月的 930 条 Hacker News 头版文章与讨论进行回溯自动评估,找出最具前瞻性与最不准确的评论,编写代码约 3 小时、运行约 1 小时、成本约 60 美元,来源:twitter.com/karpathy/status/1998803709468487877 与 karpathy.bearblog.dev/auto-grade-hn。 据 @karpathy 称,项目代码开源于 github.com/karpathy/hn-time-capsule,完整结果可在 karpathy.ai/hncapsule 浏览,来源:twitter.com/karpathy/status/1998803709468487877。 据 @karpathy 称,他强调回溯分析是训练前瞻预测模型的实用路径,并指出未来的大模型会以更低成本、更高速度、更高质量完成此类工作,来源:twitter.com/karpathy/status/1998803709468487877。 据 @karpathy 称,当月最具前瞻性的 HN 账号前十为 pcwalton、tptacek、paulmd、cstross、greglindahl、moxie、hannob、0xcde4c3db、Manishearth 和 johncolanduoni,来源:twitter.com/karpathy/status/1998803709468487877。 据 @karpathy 称,这些用时与成本数据为基于 GPT-5.1 思考的多文档 LLM 评估工作流提供了真实的成本-吞吐量基准,约 60 美元在约 1 小时内完成 930 线程的评估,供关注 AI 基础设施效率的交易者参考,来源:twitter.com/karpathy/status/1998803709468487877 与 karpathy.bearblog.dev/auto-grade-hn。 |
|
2025-12-07 18:13 |
Andrej Karpathy:大模型是模拟器而非主体 用于BTC和ETH的加密交易研究提示词方法
据Andrej Karpathy称,大语言模型应被视为能模拟多种视角的模拟器,而不是拥有自我观点的主体,来源:Andrej Karpathy 在 X。其建议是将以你为中心的提问改为询问不同群体会怎么说,这一方法可直接用于加密市场研究的提示词设计,来源:Andrej Karpathy 在 X。用于交易流程时,可以提示模型分别模拟多头、空头与做市商,以生成针对BTC与ETH的情景叙事,而不假设模型有个人立场,来源:Andrej Karpathy 在 X。他还指出,强行使用你只会让模型采用由微调数据统计所隐含的人格,因此基于角色的模拟才是进行AI辅助分析的正确心智模型,来源:Andrej Karpathy 在 X。 |
|
2025-11-24 17:35 |
Andrej Karpathy:作业中AI无法检测——交易者现在需要知道的要点
据@karpathy在X平台2025年11月24日发文称,作业中的AI使用无法被检测,现有AI检测器并不工作,显示学校对生成式AI的采用不可避免(来源:@karpathy,X平台,2025年11月24日)。 据@karpathy在X平台2025年11月24日发文称,他向学校董事会进行简报并分享应对要点,建议教育侧应适应AI而不是依赖检测工具(来源:@karpathy,X平台,2025年11月24日)。 据@karpathy在X平台2025年11月24日发文显示,帖子未提及加密货币或交易,因此未给出任何直接的加密市场影响(来源:@karpathy,X平台,2025年11月24日)。 |
|
2025-11-22 02:11 |
安德烈·卡帕西寻求AI“slop”量化定义与可测“slop指数”,并考虑用LLM小剧集与思考代币预算评估
据@karpathy称,他正在寻求AI“slop”的量化、可测定义,并表示目前只有直觉上的“slop指数”而缺乏正式指标。来源:@karpathy 在X,2025年11月22日。据@karpathy称,他考虑用LLM小剧集与“思考”代币预算来度量输出质量与成本。来源:@karpathy 在X,2025年11月22日。对AI与加密相关市场的交易者而言,该帖强调当前缺乏标准化LLM质量指标,这与模型评估与成本控制直接相关,是AI产品定价与基准的重要输入。来源:@karpathy 在X,2025年11月22日。 |
|
2025-10-21 15:59 |
Andrej Karpathy发布nanochat d32:$800合成数据定制LLM身份与脚本开源,AI智能体赛道交易关键信号
据@karpathy称,nanochat现已具备明确身份并可说明自身能力,包括其为由他构建的nanochat d32、成本约$800且在非英语方面较弱,这些均通过合成数据定制实现,来源: x.com/karpathy/status/1980508380860150038。 他发布了一个示例脚本,展示如何生成多样化合成对话并在中期训练或SFT阶段混入,强调保持数据熵以避免重复性,来源: x.com/karpathy/status/1980508380860150038。 他指出基础LLM本无固有个性或自我认知,需通过精心策划的合成数据显式“加装”,来源: x.com/karpathy/status/1980508380860150038。 对交易者而言,$800的定制成本基准与开源流程,为评估开源AI智能体开发与AI相关代币和AI概念股的采用路径提供具体参照,来源: twitter.com/karpathy/status/1980665134415802554。 |
|
2025-10-20 22:13 |
安德烈·卡帕西:DeepSeek-OCR展示像素输入优于文本分词的4大理由—更高效率、更短上下文窗口、双向注意力、取消分词器
据安德烈·卡帕西介绍,DeepSeek-OCR 论文不仅展现出强劲的 OCR 能力,更重要的是凸显将像素而非文本分词作为大模型输入在效率与信息保真上的优势,来源:Andrej Karpathy 于 X,2025年10月20日。 他表示,将纯文本渲染为图片后再输入模型可实现更高的信息压缩,从而缩短上下文窗口并提升效率,来源:Andrej Karpathy 于 X,2025年10月20日。 他补充称,像素输入能保留加粗、颜色等文本格式并同时容纳任意图像,构成更通用的信息流,来源:Andrej Karpathy 于 X,2025年10月20日。 他认为,与自回归注意力相比,输入侧采用图像可默认启用双向注意力,从而更有利于处理能力,来源:Andrej Karpathy 于 X,2025年10月20日。 他主张在输入端删除分词器,原因在于 Unicode 与字节编码的复杂性与安全或越狱风险(如续字节)以及表情符号的语义错配等问题,来源:Andrej Karpathy 于 X,2025年10月20日。 他将 OCR 视为众多“视觉转文本”任务之一,并指出许多“文本转文本”任务可重构为“视觉转文本”,但反向并不普遍成立,来源:Andrej Karpathy 于 X,2025年10月20日。 他提出实用路径为用户消息使用图像而助手回复保持文本,并指出像素级输出并不直观,同时提到想开发仅图像输入版的 nanochat 并引用 vLLM 项目,来源:Andrej Karpathy 于 X,2025年10月20日。 |
|
2025-10-09 00:10 |
安德烈·卡帕西批评RLHF:LLM畏惧异常,呼吁在RL训练中重设奖励机制
根据安德烈·卡帕西在2025年10月9日于Twitter发布的信息,他指出当前强化学习实践让LLM对异常产生过度恐惧,并强调异常是健康开发流程的正常组成部分。卡帕西号召签署其“LLM福利请愿”,以在出现异常时给予更合理的奖励设计。该帖未提及任何加密资产、代币或市场数据,来源未提供直接的市场更新。 |
|
2025-09-05 17:38 |
安德烈·卡帕西力赞 OpenAI GPT-5 Pro 代码生成表现:AI 与加密市场的交易信号
根据 @karpathy,OpenAI 的 GPT-5 Pro 在他用“CC”断断续续尝试约一小时未果后,仅用约10分钟就产出可直接运行的代码,显示其在复杂问题上的强劲定性表现。来源:@karpathy(X,2025年9月5日)。 他补充称让“CC”阅读了 GPT-5 Pro 的结果后,对方写了两段文字表示赞赏,进一步强化了其对 GPT-5 Pro 代码生成质量的正面评价。来源:@karpathy(X,2025年9月5日)。 该帖提供了对 GPT-5 Pro 编码能力的开发者级背书,但未包含任何市场反应、价格表现或产品发布信息,因此交易者应将其视作情绪信号而非量化催化。来源:@karpathy(X,2025年9月5日)。 |
|
2025-05-11 00:55 |
系统提示学习:大型语言模型训练新范式及其对加密市场的影响
根据Andrej Karpathy在推特上的观点,系统提示学习作为大型语言模型(LLM)训练中的新范式,区别于传统的预训练和微调方法(来源:@karpathy,2025年5月11日)。预训练用于知识积累,微调塑造习惯性行为,而系统提示学习则无需更改参数即可实现行为动态调整。对于加密货币交易者来说,这一突破有望加速AI交易机器人的适应能力,提高交易执行效率,进而对市场短期波动产生影响(来源:@karpathy,2025年5月11日)。 |