字节跳动归档 - 第5页共15页

字节开源视觉-语言多模态大模型，AI理解现实世界的能力越来越强了。

2025年5月23日23时作者开源AI项目落地

字节开源的Seed1.5-VL是视觉-语言多模态大模型，支持多种复杂任务如盲人判断红绿灯和智能导盲。其包含5.32亿参数视觉编码器和200亿激活参数混合专家大语言模型，已在多个公开基准中表现出色。

2025年5月23日8时作者开源星探

字节跳动发布的BAGEL是首个支持多模态输入输出、思维链推理和MOT架构优化的跨模态超级AI模型，性能超越Qwen2.5-VL、InternVL-2.5。它能理解图像更准确，生成图像媲美Stable Diffusion 3，并在10+基准测试中表现优异。

2025年5月14日16时作者量子位

字节发布轻量级多模态推理模型Seed1.5-VL，在60个主流基准测试中拿下38项第一，仅用532M视觉编码器+200亿活跃参数即能与大型顶尖模型抗衡。该模型通过多层次架构和训练细节实现了高效处理多种多模态数据的能力。

2025年5月14日8时作者 NLP工程化

字节发布DreamO图像定制框架，支持换装、换脸、虚拟试穿等功能，适用于多种场景应用。

2025年5月12日23时作者甲子光年

深刻的洗牌。
曾在2023-2024年疯狂融资、高调亮相的“六小虎”们有些逐渐淡出主流视野，而以字节

2025年5月12日16时作者新智元

经变成了「基模五强」——字节、阿里、阶跃星辰、智谱和DeepSeek。接下来的巅峰之战，关键制胜点又

2025年5月11日16时作者量子位

d-Coder
，8B规模，超越Qwen3，拿下多个SOTA。
它证明
“只需极少人工参与，LLM就

2025年5月10日14时作者老刘说NLP

否思考方案，从基本逻辑出发看看Qwen3的混合推理的根本实现机制以及如何通过外挂分类器来实现自我决断

2025年5月10日8时作者开源星探

字节跳动开源流程构建引擎FlowGram，支持固定布局和自由布局，结合AI增强功能简化工作流开发。其特点包括丰富的交互体验、节点控制灵活性、强大的扩展能力和低代码能力。

2025年5月9日11时作者每日AI新工具

文章介绍了五种创新技术与工具，包括ZeroSearch、DeerFlow、News Agents、n8n Autoscaling System和SmartPDF。它们专注于提升LLM的搜索能力、自动化研究流程、智能新闻聚合与摘要、工作流自动扩容以及利用AI快速总结PDF内容等方向。