学术归档 - 第178页共283页

微软Phi-4家族新增两位成员，5.6B多模态单任务超GPT-4o，3.8B小模型媲美千问7B

2025年2月27日16时作者机器之心

光。
2024 年底，微软正式发布了 Phi-4—— 在同类产品中表现卓越的小型语言模型（SLM）。

2025年2月27日16时作者机器之心

首个商业级扩散大型语言模型Mercury发布，每秒生成超过1000个token，性能和效率显著提升。相比现有自回归LLM，其速度提高了5到10倍，同时保持了高精度。

2025年2月27日16时作者机器之心

多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，

2025年2月27日16时作者 PaperWeekly

腾讯 Hunyuan 团队提出 MM-IQ 基准测试框架，旨在评估多模态模型的抽象推理和逻辑思维能力。该基准包含 8 种不同推理范式，涵盖 2,710 个精心策划的测试项目，涉及逻辑运算、数学推理等多样化的题目配置。

2025年2月27日16时作者机器之心

CVPR 2025 共收到 13008 篇有效论文，最终录取 2878 篇（接收率 22.1%），创历史新低。部分审稿人被发现不负责任并拒收 19 篇论文，引发讨论。

2025年2月27日14时作者 GiantPandaCV

cale-playbook
作者：nanotron
校正：pprp
GPU 深度挖掘——融合、线程化

2025年2月26日23时作者极市干货

文章介绍了极视角科技的内容合作和市场合作渠道，包括内容发布的合作伙伴需求、算法开发与应用、大模型比赛及培训等合作机会，并详细描述了如何对接这些合作机会。

2025年2月26日16时作者 PaperWeekly

可信人工智能
如果你对大语言模型（LLM）的
强化学习（RLHF）
感兴趣，又想从最基础的策略梯度优

2025年2月26日16时作者机器之心

OpenAI 发布了对 Deep Research 模型的最新准备度框架评估，将其评级为中等风险。模型在网络安全方面被评为中等风险，并展示了缓解后的 Deep Research 模型在多种任务上的表现。

2025年2月26日16时作者机器之心

MIT团队提出的新算法Diffusion Forcing Transformer（DFoT）让视频扩散模型生成了比之前长近50倍、上千帧的长视频，论文介绍了历史引导算法及其在不同数据集上的效果。