深度|海豚智能发布超声多模态大模型,百度百舸为“看懂超声”注入核心算力引擎


一、从牛津博士到AI医生:一场以技术回应医疗不平等的创业尝试

在医学影像领域,AI的革命性进展已不稀奇——CT有了自动阅片系统,X光报告可由模型生成。但当聚光灯转向超声时,这一“最日常”的影像手段,却始终没有迎来真正的智能时代。为什么?

“因为它不像CT那样一拍即得,而是靠医生一手一眼‘扫出来’的。”——这是海豚智声医疗科技(嘉兴)有限公司(下文简称为“海豚智能”)创始人勒安捷最常讲的一句话。

她曾是一个标准的科研人才,数学出身,牛津大学攻读超声AI方向博士,本可以继续学术之路。但在一次返乡探亲中,她在县医院听到医生的一句无奈:“我会扫简单的,复杂的你还是得去大医院。”那一刻让她意识到,AI不能只留在论文里。它得“落到探头上”,帮到那些“有设备但没人敢用”的地方。

二、超声的AI困局,为何一直没有被解决?

在过去十年中,AI在医疗影像领域取得了飞跃性进展。CT、核磁、X光等影像模态纷纷迎来了“AI读片”时代:有标准、有数据、有规范流程。然而,当AI试图走进超声领域时,却迟迟无法跨越那道门槛。超声,这个被称为“最平民化”的影像工具,反而成为最难被智能化的部分。

中国是全球最大的超声使用国家。每年20亿人次的检查量,超过CT十倍,成为基层医院最常用的影像手段。但在实际诊疗过程中,超声医生往往面临这样的困境:没有统一的检查方案、没有标准的切面定义、也没有规范的操作路径。一位经验丰富的老医生和一位刚入职的年轻医生,对于“标准扫查”常常有完全不同的理解。

“这不是你按了哪一个按钮的问题,而是你有没有‘看懂’那个画面、有没有‘扫对’那个角度。”创始人勒安捷在一次采访中这样形容超声的临床特殊性。不同于CT的“拍完即得”,超声的画面需要医生在操作中“实时创造”,这也让超声的智能化变得前所未有的复杂。

更难的是训练AI的“材料”——超声数据。本身极为异构,质量参差不齐,图像风格因医院、设备、医生而异,缺乏统一标准和大规模可用的数据集。这意味着,大多数“端到端”的图像诊断模型,在超声场景下可能作用较为有限。。更不用说在深度学习阶段,模型极度依赖图像一致性与标签标准化的训练过程。

即便勉强训练出模型,可解释性和信任度也成了另一道高墙。传统AI模型往往以黑箱形式输出诊断建议,不提供推理路径,医生难以判断其“依据是否可靠”。这在严谨的医疗场景中,是一个致命的问题。

三、Dolphin V1.0:让AI走入医生视线、手势与决策之间

相比传统“读片式”AI,海豚智能推出的Dolphin V1.0 从医生握起探头那一刻起即介入流程,实现“扫查中实时引导 + 检查后自动报告”的一体化闭环,重塑了超声的操作方式。

在扫查阶段,Dolphin V1.0 可以实时识别图像中是否为标准切面,并对医生发出操作提示,例如“请向右旋转探头”“当前角度无法观察包膜边界”等指令,帮助医生快速获得合格视图。与此同时,模型会进行图像质量控制,辅助排除模糊、无效的图像数据。

在后处理阶段,模型会自动识别疑似病灶、生成结构化诊断建议,并完成报告撰写流程。例如在乳腺检查中,模型可以对不同病灶进行分类标注,提出良恶性分型建议,并根据常规指南生成符合医疗标准的报告草案,显著节省医生文书时间。

这一系统性产品设计背后,是一系列真实可验证的数据支撑。根据海豚智能团队提供的内部测试结果,Dolphin V1.0 在胎儿标准切面识别上的准确率超过90%,在乳腺病灶分型任务中准确率达到86%。与上一代仅能执行单任务的专用模型相比,Dolphin 实现了“一模多能”的通用能力,模型复用效率显著提升。

产品已启动“MUSE-UA”计划,与全国110家三甲医院合作落地,覆盖多器官场景,基于真实数据持续迭代。正如创始人勒安捷所说:“AI不仅要能看图,更要理解医生的手势与判断。” Dolphin 正在成为真正可用、可信、可落地的超声AI助手。


四、没有算力,就没有今天的Dolphin:百度智能云是背后的技术地基

要打造一个懂超声的多模态大模型,远远不只是把图像喂给算法、调好参数就能完成的。在超声这样复杂、异构、非标准的场景中,每一次训练都是一场系统工程:图像质量高低、数据读取效率、显卡通信稳定性、任务调度灵活度……这些“工程细节”决定了模型成败的边界。对一家初创公司而言,要解决这一整套问题,并不容易。

正是在这种背景下,海豚智能与百度智能云达成了深度合作,选择其旗下的百舸平台作为 Dolphin V1.0 的训练与部署底座。百舸不仅是百度核心业务背后的算力支撑平台,也已经开放给中国本土的AI创业者,以更高效、稳定的方式提供训练、推理与资源调度能力。

稳定,是大模型训练最基本的前提。 在合作初期,海豚智能曾尝试使用其他平台,但频繁遇到显卡间通信中断、任务崩溃等问题,导致一夜训练白费、第二天重跑。切换至百舸后,整个训练过程几乎零中断,显著提高了开发效率。“对我们来说,一个训练任务不中断地跑完,比什么都重要。”

灵活,是初创企业最核心的诉求。 百舸提供包括显卡调度、带宽计费、并行读取方式等多项配置权限,开发者可按需自定义训练策略。比如海豚团队最初需要100张显卡同时训练一个模型,在百舸平台上,通过任务压缩与调度优化,显卡使用量最终缩减至48张,大幅降低资源成本。

技术支持,是平台背后真正的“软实力”。 海豚智能多次提及百度工程团队在架构优化、调度策略上的深入协助,让他们从“任务跑通”进一步走向“资源极致利用”。从模型部署、推理服务到后续微调,百舸都成为海豚团队可持续依赖的技术中枢。

更重要的是,随着 Dolphin 进入三甲医院的真实部署,其模型也进入了细分垂域微调及行为对齐阶段,需要更大、更坚实的算力支撑

“百度提供的是一块坚实的地基,我们才有底气去建这座‘高塔’。”勒安捷说。而对百度而言,这种从基础设施延伸到行业落地的合作方式,也正是其战略的关键一环。

五、从医院到家庭:Dolphin的普惠路径刚刚开始

Dolphin V1.0 的诞生,标志着中国医疗AI在超声领域的一次关键性突破。但在海豚智能的构想中,这场技术革命远不止于三甲医院的医生工位,更将走向更广袤的土地——基层医院、社区门诊、甚至每一个普通家庭。

Dolphin 的出现,恰恰补上了这个“最后一公里”的缺口。在完成一线医院的模型微调后,海豚智能正计划将Dolphin 快速部署至具备基本设备但缺乏专业人员的中小型医疗机构,以“AI医生”的形式参与日常诊疗,辅助完成常见病筛查任务,推动优质医疗资源向下沉流动。

更具想象力的,是 Dolphin 在家庭端的潜力。团队已启动多项家用场景探索,包括乳腺自查、孕期筛查等高频、标准化、可远程支持的轻量级超声检查服务。比如乳腺癌筛查,根据世界卫生组织建议,女性每三个月应进行一次定期检测。但在现实中,女性频繁前往医院进行检查不仅会给生活带来诸多不便,也会给医疗系统带来较大的资源压力。若未来 Dolphin 融入可视化、可引导的家用超声设备,女性将可在家中定期自查,由AI进行初筛,远程同步医生二次复核。这一模式不仅极大减轻医疗系统负担,也将深刻改变个体健康管理的方式。

正如中华医学会超声分会主委梁萍教授在中华医学会第三届超声青年医师学术会议上所言:“中国的超声技术曾长期处于追随者的位置,而 Dolphin 的出现,则有可能开启中国从‘跟跑’到‘领跑’的转变。”

在这条路上,百度智能云仍将是海豚智能最重要的伙伴之一。随着未来多地区模型微调、边缘部署与家用设备集成需求的提升,对算力资源的弹性、分布式调度与推理优化能力也将提出更高要求。双方计划继续深化合作,在百度百舸平台上完成 Dolphin 的持续进化。

医疗,是一个极度复杂、耐心驱动的赛道。但也正因如此,每一项技术的落地,带来的都是成千上万人真实可感的福祉。海豚智能选择了一条最难但也最有价值的路——让每一位医生背后,都能多一个可靠的 AI 合伙人。

——-

(文:Z Potentials)

发表评论