5 月 2025 - 第152页共241页

字节放出了：DreamO，统一图像定制框架

2025年5月14日8时作者 NLP工程化

字节发布DreamO图像定制框架，支持换装、换脸、虚拟试穿等功能，适用于多种场景应用。

2025年5月14日8时作者 NLP工程化

阿里的MNN移动端多模态大模型APP更新支持Qwen-2.5-omni-3b和7b，可以实现文本到文本、图像到文本等多种生成任务，提供速度优化的开发参考。

2025年5月14日8时作者 NLP工程化

实时摄像头AI识别演示使用Huggingface SmolVLM和gglm llama.cpp，参考文献详述。

2025年5月14日8时作者 NLP工程化

Seed1.5-VL是专为通用多模态理解和推理设计的视觉-语言基础模型，仅用5.32亿视觉编码器和200亿参数的MoE LLM实现顶尖性能，在60个公共基准测试中有38项达到最佳水平。

2025年5月14日8时作者 NLP工程化

Cactus是一款让移动设备和可穿戴设备运行AI模型的框架，支持多种开发平台，具有硬件感知的后端和低内存占用特点。

2025年5月14日8时作者 NLP工程化

IndexTTS-vLLM通过vLLM加速语音合成过程，单个请求RTF从0.3降至0.1，GPT模型decode速度提升至280 token/s，支持多角色音频混合。

2025年5月14日8时作者开源星探

AI Agent 生态中AG-UI协议简化了Agent与前端交互，支持事件驱动设计、流式通信和状态同步等功能。

2025年5月14日8时作者 AIGC开放社区

微软宣布将裁员约6000人，占全球员工总数3%，这是自去年以来的最大规模裁员。

2025年5月14日8时作者 AIGC开放社区

美国加强海外AI芯片出口管制，并撤销拜登政府时期的AI扩散规则，强调保护美国在AI领域的领导地位。

2025年5月14日8时作者 AIGC开放社区

全球大模型创业进入关键期，百度第三届文心杯创业大赛正面向全球招募创新团队。已有数百支团队报名角逐，奖金高达7000万元。通过文心大模型和智能云平台，参赛者可获得免费算力支持，加速从技术验证到商业落地的全周期需求。