微软亚洲研究院归档

「0污染」LLM理解基准来了！20000道题14个学科全覆盖，来自微软

2025年7月18日23时作者新智元

MMLU-CF是微软亚洲研究院推出的一个新的多任务语言理解基准测试，旨在消除数据污染并提供更为公平、可靠的评估。该基准包含20,000道题目，涵盖14个学科领域，验证集公开透明，测试集闭源防泄露。研究人员通过去污染规则防止恶意数据泄露，并在Huggingface上开放了该数据集。

2025年7月10日16时作者新智元

中国人民大学等机构的研究者提出MoCa框架，通过双阶段方法将预训练因果VLM转化为双向多模态编码模型。该框架利用持续预训练和异构对比微调提升表示能力和泛化性能，在多种任务上优于现有模型。

2025年6月16日23时作者机器之心

近日提出的一种两阶段训练框架ReasonGen-R1结合监督微调与强化学习提升自回归图像生成模型的推理和创作能力。

2025年6月11日23时作者量子位

微软亚洲研究院联合清华大学、北京大学提出RPT预训练范式，将强化学习深度融入预训练阶段，通过生成思维链推理序列和使用前缀匹配奖励来提升模型预测准确度。

2025年1月23日12时作者新智元

2024 ACM Fellows名单公布，多位华人学者上榜。入选者来自香港科技大学、微软亚洲研究院等机构，涵盖计算机科学多个领域，包括数据管理、机器学习和量子计算等。

2025年1月10日12时作者 AIGC开放社区

Microsoft亚洲研究院发布的rStar-Math通过代码增强CoT、蒙特卡洛树搜索等方法提升小模型数学推理能力，平均在AIME 2024测试中解决了53.3%的难题，并显著提升了多个数学基准测试的表现。

2024年12月26日20时作者 PaperWeekly

微软亚洲研究院推出MMLU-CF，一个基于公开数据源且去污染设计的大语言模型理解基准，旨在提供更为准确、公平的评估。