OpenAI发布免费“ChatGPT临床版”与HealthBench Professional：据称在真实临床任务上超越专科医生

据Ethan Mollick在X平台发布的信息，OpenAI推出面向临床工作的免费“ChatGPT临床版”，并发布用于评估真实临床对话任务的HealthBench Professional；据Karan Singhal在X平台表示，该模型在OpenAI设计且完全开放的基准上，据称优于拥有无限时间与网页访问能力的专科匹配医生，同时他强调需要注意基准由OpenAI制定。根据上述来源，商业影响包括：更低成本的临床决策支持、跨专科的标准化评测框架，以及供医院与厂商将通过基准验证的模型集成到EHR与就医导航等流程中的机会，但仍需独立机构复核验证。

原文链接

详细分析

OpenAI在医疗保健领域的AI进步引发了广泛关注，特别是像GPT-4这样的模型在医疗基准测试中表现出色。根据2023年微软研究的一项研究，GPT-4在美国医疗执照考试中达到了90%以上的准确率，超过了之前的AI模型和一些2022年的人类表现指标。这将AI定位为临床环境中的变革工具，解决诊断准确性和工作流程效率等现实挑战。在基准测试的背景下，OpenAI已合作进行开放评估，但专有设计引发了2023年AI社区论坛中关于偏见的质疑。立即上下文围绕AI处理复杂临床任务的能力，关键事实包括GPT-4集成网络访问以进行实时信息检索，提升了其超出静态知识库的实用性，从2023年中期更新开始。

从业务影响来看，医疗保健中的AI呈现出丰厚的市场机会，全球AI医疗市场预计到2030年将达到1879.5亿美元，从2022年的数据以40.6%的复合年增长率增长，根据2023年Grand View Research的报告。对于企业，货币化策略包括为临床医生提供基于订阅的AI工具，类似于OpenAI在2023年推出的企业模型，可以提供超出免费版本的高级功能。实施挑战涉及HIPAA等2023年更新的法规下的数据隐私，需要强大的加密和同意机制。解决方案包括联邦学习方法，如2022年Google Research论文中探讨的，允许模型训练而不集中敏感患者数据。竞争格局包括Google的Med-PaLM，在2023年Nature Medicine出版物中在MultiMedQA基准上得分86.5%，以及IBM Watson Health，自2015年集成以来专注于肿瘤应用。监管考虑强调FDA对AI作为医疗设备的批准，2023年指南分类高风险工具，而伦理影响强调偏见缓解，如2021年WHO报告中敦促的多样化训练数据集。

从技术角度来看，像GPT-4这样的AI模型在需要多模态数据推理的任务中表现出色，2023年基准显示在差异诊断中优于时间有限的医生。市场趋势表明向AI辅助远程医疗的转变，由2020年后疫情需求推动，平台集成自然语言处理用于患者互动。企业可以通过开发专用API来利用这一点，如OpenAI在2023年API更新中所做，启用自定义医疗保健应用。挑战包括模型幻觉，通过2022年研究的检索增强生成技术来解决，确保事实输出。预测表明，到2025年，AI可能将诊断错误减少30%，基于2023年麦肯锡报告的预测，促进科技公司与医院的伙伴关系。

展望未来，医疗保健中AI的未来影响指向广泛采用，可能颠覆传统医疗实践并创造新的收入来源。行业影响包括成本节约，AI预计到2026年每年为美国医疗系统节省1500亿美元，根据2019年埃森哲估计在2023年分析中的更新。实际应用扩展到个性化医学，其中AI分析基因组数据用于定制治疗，如2023年Tempus试验所示。对于企业，机会在于可扩展解决方案，如免费临床工具演变为企业套件，通过审计和透明基准导航合规。伦理最佳实践涉及持续审计，如2023年欧盟AI伦理指南所推荐。总体而言，虽然像OpenAI这样的基准推动创新，但它们的开放性确保社区验证，为到2025年及以后可靠的AI医疗整合铺平道路。

ChatGPT GPT54 HealthBench OpenAI 电子病历

Ethan Mollick

@emollick

Professor @Wharton studying AI, innovation & startups. Democratizing education using tech

OpenAI发布免费“ChatGPT临床版”与HealthBench Professional：据称在真实临床任务上超越专科医生

详细分析

Ethan Mollick

Premium 赞助商

热门话题