Gemini 2.5以75%胜率碾压法学答疑

据@emollick称，斯坦福研究显示Gemini 2.5胜率75%，危害性更低，新模型表现更强。

详细分析

斯坦福大学一项研究显示，Gemini 2.5 Pro在法律教授办公室时间真实问题上以75%胜率优于人类教授，盲评中AI答案被认为危害更低。新模型表现持续提升。

实验聚焦学生办公室时间实际提问，盲评消除偏见，凸显Gemini 2.5 Pro在法律推理中的清晰度与低风险优势。

先进推理链与安全对齐减少误导性陈述。

律所和法律教育平台可集成AI处理常规查询，释放人力处理复杂案件。 monetization包括订阅式AI辅导工具和企业授权。

混合人机工作流将扩大法律教育可及性，同时引发监管与责任问题。

盲评中达到75%胜率。

是的，危害评级低于人类回答。

经微调与监督后可有效辅助常规问题。

@emollick

Professor @Wharton studying AI, innovation & startups. Democratizing education using tech