Qwen2.5 归档 - 每时AI

Hugging Face开源顶级模型：双模式推理+128K上下文，最强3B

2025年7月9日8时作者 AIGC开放社区

展和
应用
落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！
今天凌晨，全球著名大模型开放

7B小模型超越DeepSeek-R1：模仿人类教师，弱模型也能教出强推理LLM Transformer作者团队

2025年6月24日23时作者量子位

Sanaka AI提出的新方法通过让教师模型输出清晰解释来改进教学效果，其7B小模型在传授推理技能方面超越了671B的DeepSeek-R1。这种方法不仅有效还经济高效，并且能与传统强化学习技术结合使用。

字节跳动发了个新模型：BAGEL-7B-MoT

2025年5月22日8时作者 NLP工程化

这是一个混合专家多模态模型，基于Qwen2.5-7B-Instruct和siglip-so400m-14-980-flash-attn2-navit模型微调，并使用FLUX.1-schnell VAE模型，支持视觉理解、文本到图像生成及图像编辑。

破解合规难题，AI高质量数据集建设正当时

2025年4月21日14时作者 AI探索时代

阿里开源的Qwen2.5系列训练数据规模达18万亿 token，推动AI大模型发展。但大规模训练带来幻象问题，RAG技术及工业场景应用以数据为中心成为趋势。国家和行业正积极推进数据标注产业发展规范，提升数据标注行业的合规能力。

速递｜印度初创公司Ziroh Labs，推出无需高端芯片即可运行大型AI模型

2025年4月11日16时作者 Z Potentials

印度初创公司Ziroh Labs开发了一套名为Kompact AI的新系统，该系统无需使用昂贵的GPU芯片就能运行大型AI模型。

零样本复刻任意人声!中英文混合生成丝滑无界!

2025年4月10日11时作者 GitHubStore

Spark-TTS 是一个先进的文本到语音系统，利用大型语言模型实现高度准确和自然的声音合成。它简洁高效，支持零样本语音克隆及双语支持，具备可控语音生成功能。

R1–Zero强化学习路线新发现及R1思路用于GUI Agent动作预测方案

2025年4月2日14时作者老刘说NLP

2025年4月1日，北京天气晴。文章介绍了R1进展中的两个工作，一是研究多种基础模型预训练特性的影响；二是将GRPO-RL强化用于Agent的UI动作预测，数据和奖励函数设计有趣。研究发现Qwen2.5模型在不使用模板的情况下有强大的推理能力，但模板会破坏数学解题能力。此外，文章还讨论了强化学习在图形用户界面（GUI）动作预测中的应用。

50条数据解锁空间智能，RL视觉语言模型3D空间推理框架MetaSpatial ｜西北大学

2025年3月22日16时作者量子位

模型（VLM）生成结构合理、物理一致的场景布局仍是一项挑战。以“请将这些家具合理摆放在房间中”为例，

2026 年 1 月
一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31