4 月 2025 - 第224页共242页

清华大学推出Dolphin语音识别模型！专攻40种东方语言，方言识别准确率提升54%！

2025年4月3日8时作者开源星探

清华大学和海天瑞声联合开源的Dolphin语音识别模型专为东方语言设计，支持40种东方语言和22种汉语方言，其small版本仅为Whisper large v3大小的一半，却提高了54.1%的平均字错率。

2025年4月3日8时作者量子位

达闼机器人因财务问题陷入困境，公司和创始人回应称情况良好，并表示已解决欠薪问题。尽管市场火热，但具身智能领域仍面临应用和盈利难题。

2025年4月3日8时作者 AIGC开放社区

北京理工大学等4大名校联合发布Mini DALL·E 3，无需额外训练即可为多数主流大模型添加文成图多模态输出能力。该系统由语言模型、路由器、适配器和图像生成模型四大模块组成，实现了用文本生成图像。

2025年4月3日8时作者 AIGC开放社区

今天凌晨
1点，
OpenAI开源了一个全新的
AI Agent评测基准——
PaperBench。
该基准主要考核智能体的搜索、整合、执行等能力。

2025年4月2日23时作者开源AI项目落地

一个名为Second Me的开源项目能克隆数字人以延续人类精神和经历。它通过AI技术捕捉用户记忆，支持角色切换适应不同场景，并学习用户的偏好和行为模式。

2025年4月2日23时作者极市干货

据集，超过 SD-XL 的 T2I 模型。
>>
加入极市CV技术交流群，走在计算机视觉的最前沿
太

2025年4月2日23时作者 AI前线

全统计已有 50% 的央企完成了 DeepSeek 模型的部署，约 98 家央企接入了 DeepSe