关于 内在动机 的快讯列表
时间 | 详情 |
---|---|
2025-10-01 17:09 |
安德烈·卡尔帕提解读萨顿“苦涩教训”:LLM扩展潜在受限与RL优先智能体崛起,值得交易者关注的AI叙事
据@karpathy称,理查德·萨顿质疑LLM是否真正符合“苦涩教训”,因为其依赖有限且带有人类偏见的人类数据,这对“数据与算力堆叠即可无限扩展”的假设提出挑战,来源:@karpathy。 萨顿主张以强化学习为核心的经典架构,通过与世界交互学习,不进行大规模监督式预训练或人类“遥操作”,并强调以“乐趣、好奇心、世界模型预测质量”等内在动机作为奖励信号,来源:@karpathy。 他强调智能体应默认在测试阶段持续学习,而非“一次训练、永久部署”的静态范式,来源:@karpathy。 卡尔帕提指出,尽管AlphaZero展示了纯RL可超越以人类棋谱初始化的系统(AlphaGo),但围棋是封闭简化环境;前沿LLM通过人类文本初始化数十亿参数,并普遍用RL微调,预训练更像为解决冷启动的“简陋版进化”,来源:@karpathy。 他补充称,当今LLM在预训练、数据策展与RL环境等环节都深受人类工程影响,该领域或仍不足够“苦涩教训化”,来源:@karpathy。 在可操作方向上,他点名内在动机、好奇心、赋能、自博弈与文化等路线,以推动超越“刷榜与堆板子”的研究,凸显AI智能体叙事的活跃度,来源:@karpathy。 |
2025-02-19 22:30 |
杰西·波拉克谈长期持有是智能币的标志
据杰西·波拉克(@jessepollak)称,当用户自发地倾向于参与并默认长期持有时,我们就知道已经创造了“智能币”。这一声明意味着可以通过持有者的内在动机程度来衡量一种加密货币的成功,从而导致稳定的投资模式。这种趋势可能会减少波动性,并随着时间的推移增加这些资产的市场价值,使其对寻求长期收益的交易者更具吸引力。然而,交易者在做出交易决策之前,必须通过市场数据和行为分析来验证这些因素。 |