字节跳动 AI快讯列表 | Blockchain.News
AI 快讯列表

AI 快讯列表关于 字节跳动

时间 详情
2026-04-12
09:58
Claude Mythos 环路语言模型突破:在 GraphWalks 与 SWE-bench 大胜 Opus 4.6 与 GPT 5.4——2026 深度分析

根据 X 上的 @godofprompt(引用 Chris Hayduk 的分析与字节跳动论文《通过环路语言模型扩展潜在推理》)的说法,Claude Mythos 或采用环路式重复使用同一 Transformer 模块进行内部推理,从而在输出前反复精炼思路,这与其在图搜索任务上的显著领先相吻合。根据 @godofprompt 的数据,Mythos 在 GraphWalks BFS 取得 80%,而 Opus 4.6 为 38.7%,GPT 5.4 为 21.4%,正是字节跳动论文预测环路方法占优的基准。据 @godofprompt 报道,Mythos 在 SWE-bench Pro 达到 77.8%(对比 53.4%),USAMO 97.6%(对比 42.3%),SWE-bench 多模态 59%(对比 27.1%),SWE-bench 多语言 87.3%(对比 77.8%),显示其在软件推理与多模态代码任务上全面提升。另据 @godofprompt,总结的令牌效率对比显示 Mythos 在 BrowseComp 以 300 万令牌达到 86.9%,而 Opus 4.6 需超 1000 万令牌才达 74%,暗示内部潜在推理优于显式思维链、可显著降低推理成本。以上结论均来自 X 平台帖文与对字节跳动研究的引用,商业层面意味着以更少令牌获得更高准确率,推动企业代码自动化、搜索和多模态研发效率,并以“环路”架构而非参数规模形成差异化竞争。

2026-03-06
10:24
北航与字节跳动新研究:采样而非训练致推理模型过度思考,令牌降44%且更准

据推特账号God of Prompt称,北航与字节跳动的新论文表明,DeepSeek R1与Qwen3等推理模型的“过度思考”来自采样机制而非训练缺陷;据该推文报道,引入带停止意识的解码策略可在提升准确率的同时将生成令牌减少44%,这为企业通过优化采样策略在无需再训练的情况下降低推理成本与时延提供了可行路径。

2026-03-04
11:18
重磅分析:北航与字节提出采样改进 让DeepSeek R1与Qwen3推理降44%令牌并提准

据推特用户God of Prompt表示,北航与字节跳动的新论文指出DeepSeek R1与Qwen3等推理模型的“过度思考”并非训练问题,而是采样问题;改进的停止策略在模型自知已解出答案时及时终止,令牌开销降低44%且准确率提升。根据该推文转述,方法可显著降低推理成本、缩短延迟并提升长链推理基准表现,对企业LLM推理服务与RAG工作流具有直接商业价值。

2025-11-26
16:00
字节跳动在AI Dev 25发布TRAE AI开发环境和TRAE SOLO智能编程代理,加速自动化软件开发

根据@DeepLearningAI报道,字节跳动在AI Dev 25大会上展示了其AI集成开发环境TRAE,并发布了全新编程智能代理TRAE SOLO。TRAE SOLO主打高度自动化和高效的软件开发方式,显著提升开发者编程效率,减少人工干预环节。现场演示吸引了众多开发者体验,显示出AI驱动自动化编程在企业软件开发效率提升和成本优化方面的广阔应用前景(来源:@DeepLearningAI,2025年11月26日)。