推理能力归档 - 第3页共7页

强化学习被高估！清华上交：RL不能提升推理能力，新知识得靠蒸馏

2025年4月26日16时作者新智元

奖励强化学习（RLVR）的认知。RLVR被认为是打造自我进化大模型的关键，但实验表明，它可能只是提高

2025年4月19日11时作者硅星人Pro

Vicarious的公司在硅谷成立，它的早期投资人包括伊隆·马斯克，马克·扎克伯格和杰夫·贝索斯等人

2025年4月18日14时作者 AI先锋官

近日，字节跳动发布豆包1.5深度思考模型，该模型在推理能力、速度和多模态方面实现了突破性升级。其参数量为200B，激活参数仅为20B，具有低延迟（<20ms）的优势。通过多项权威基准测试，该模型在数学推理和编程竞赛方面表现出色，并展示了其对图片的视觉推理能力。

2025年4月14日16时作者机器之心

化学习）、异常检测。在TAI、TASE、ICCV等期刊和顶会发表论文。
近年来，随着大型语言模型（L

MLNLP学术Talk邀请西湖大学鲍光胜博士分享AI与人类的差异，包括AI推理过程的表面模仿和生成文本的分布差异。报告聚焦大语言模型内在因果图结构、白盒方法检测LLM生成文本等方面。

2025年4月1日16时作者财联社AI daily

北京时间4月1日，OpenAI宣布将在未来几个月内发布一个‘强大且具备推理能力的新开放权重模型’，这是GPT-2发布以来的首次新模型计划。尽管OpenAI曾以’开放’命名，但其模型近年来大多采用了封闭策略。此次开放模型旨在为开发者、企业和政府提供更好的部署和使用体验，但仍会保留部分关键组件。

2025年3月29日23时作者 APPSO

多个新发布的模型如Qwen、Gemini在推理能力上有所增强，能够处理多模态理解。文章通过打游戏的方式测试了Qwen和Gemini的性能，并讨论了它们在不同场景下的表现及其对未来应用的意义。