AI 快讯列表关于 RULER
| 时间 | 详情 |
|---|---|
|
2026-05-21 08:38 |
RULER用自然语言重塑奖励函数
据@_avichawla称,RULER以英文准则由LLM评估轨迹,替代手写评分。 |