0%

OpenAI开源HealthBench,60个国家合力开发5000段真实对话

交易所注册链接, ~40%折扣 insight加密货币套利会员群

分享: 微博 推特 脸书

【OpenAI开源HealthBench,60个国家合力开发5000段真实对话】Insight财经报道,OpenAI开源了一个专门面向医疗大模型的测试评估集——HealthBench。与以往测试集不同的是,该测试集的5000段核心测试对话,全部由来自60个国家/地区的26个专业262名医生打造,极大增强了该测试集的难度、真实性以及丰富度。并且采用了多轮对话测试,而不是简单的答题或选择题模式。根据测试数据显示,大模型在医疗保健领域的表现有了显著提升。例如,从之前的GPT-3.5Turbo的16%到GPT-4o的32%,再到o3的60%,整体性能有了显著进步。尤其是小型模型的进步更为突出,GPT-4.1nano不仅在性能上超越了GPT-4o,而且成本降低了25倍。

日期: 2025-05-13 07:56

返回

上一页:区块链云计算公司Nirvana Labs完成600万美元种子扩展轮融资,Jump Crypto等领投

下一篇:美检方建议判SEC黑客Council入狱两年

空投分类,推荐基于稳定币的空投,空投收益巨高,大资本背书项目安全,分散投入,形成复利效应,复利让我们更有钱