仅靠 AI 就比独立医生好 4 倍?OpenAI HealthBench 数据震撼,o3 太强了!
OpenAI发布HealthBench医疗AI评估新基准,通过全球60国262名医生合作创建庞大数据库,旨在推动医疗AI发展。最新模型o3表现优异,接近人类医生水平;同时揭示AI在某些任务上超越了部分医生的表现。
OpenAI发布HealthBench医疗AI评估新基准,通过全球60国262名医生合作创建庞大数据库,旨在推动医疗AI发展。最新模型o3表现优异,接近人类医生水平;同时揭示AI在某些任务上超越了部分医生的表现。
Epoch AI指出,若推理模型保持每3-5个月以10倍速度增长,则训练所需的算力可能大幅收敛。当前最前沿的推理模型如o1和o3的推理训练规模还未见顶,但有可能在一到两年内达到上限。
OpenAI为ChatGPT新增了‘下载为PDF’选项,不仅解决了用户在复制粘贴过程中出现的格式混乱问题,还打破了传统文档编辑软件线性逻辑的限制,使得AI生成的内容首次获得了独立的物理形态,提升了权威性和可信度。
今天凌晨,OpenAI开源了面向医疗大模型测试的HealthBench。该测试集由262名医生打造,包含5000段对话,采用多轮对话形式,显著提升了大模型在医疗领域的表现。HealthBench展示了7个主题和5个轴来评估模型性能,包括准确性、完整性等。
ChatGPT o3能通过一张照片精准定位拍摄地点,甚至还能根据图片细节分析用户职业等个人信息。但这也带来了隐私泄露的风险,需设立安全边界防止滥用。