Apache 2.0 归档

阿里开源Qwen-Image，AI会写汉字了！

2025年8月6日12时作者路过银河AI

阿里开源Qwen-Image模型，拥有20B参数的MMDiT多模态扩散变换器，支持多种语言文本渲染和多样化艺术风格图像生成。该模型在复杂文本渲染和精确图像编辑方面取得显著进展，已在HuggingFace上排名首位。

2025年7月19日16时作者路过银河AI

最近开源大模型Kimi k2占据首位；Voxtral Small作为声音模型在huggingface上表现突出。它能够进行长格式转录和理解，支持多种语言，并能直接通过语音调用功能。此外，Voxtral还提供了两种版本：24B变体用于生产规模应用，3B变体适用于本地和边缘部署。

2025年6月30日16时作者 AI前线

百度正式开源文心大模型 4.5 系列，涵盖多种参数的混合专家（MoE）和稠密型模型，系列权重按照 Apache 2.0 协议开源。

2025年6月30日16时作者量子位

百度发布文心大模型4.5系列正式开源，涵盖多种参数和任务需求的10款模型，并提供API服务与Apache 2.0协议支持。

2025年6月26日11时作者量子位

谷歌发布Gemini CLI开源工具，提供免费的AI编程辅助功能。支持100万上下文窗口和60次/分钟请求限额，允许用户通过命令行自然语言控制Gemini模型写代码、调试等。

2025年6月26日8时作者 AI寒武纪

谷歌发布 Gemini CLI，一个开源的终端 AI 代理。免费提供强大模型，包括100万 token 上下文窗口、60次/分钟请求额度，并支持命令行任务处理、编码调试及内容创作等。