AI 快讯列表关于 大语言模型评测
| 时间 | 详情 |
|---|---|
|
2025-12-10 19:04 |
FACTS基准套件:Google DeepMind与Google Research联合发布首个LLM事实性全面评测工具
根据@GoogleDeepMind消息,Google DeepMind与Google Research联合开发了FACTS基准套件,这是业界首个针对大语言模型(LLM)事实性进行四大维度评测的综合工具,包括模型内部知识、网络搜索能力、事实依据和多模态输入(来源:Google DeepMind Twitter)。这一基准将帮助AI开发者和企业提升LLM的事实准确性,推动高可信度AI应用的发展,为需要高事实性的行业带来新的商业机会。 |