当英伟达都开始“抱大腿”:Qwen3 凭什么成开源新霸主?

Llama 曾经是全球开源大模型的代表。而 Qwen 现在正成为越来越多顶级玩家的标准答案,并且其开源生态正在吸引英伟达、李飞飞团队等众多合作伙伴。Qwen-3 在性能上表现优异,混合推理能力突出,具有自定义思考预算等功能,已成为全球最受欢迎和影响力最大的开源大模型之一。

GUI智能体“大脑”升级!浙大&港理工等提出InfiGUI-R1,用强化学习实现深度推理

文章介绍了InfiGUI-R1,一个基于Actor2Reasoner框架训练的GUI智能体。该模型旨在提升AI在多步骤操作任务中的能力和可靠性,并能像人类一样先思考后行动。通过推理注入和深思熟虑增强两阶段训练方法,30亿参数的InfiGUI-R1-3B模型在多个基准测试中表现出色。

ICLR 2025 告别Token丢弃:更适合CoT和多轮对话的长文本推理加速方法

OmniKV 提出了一种创新性的动态上下文选择方法,用于高效处理长上下文 LLM 推理。它无需丢弃任何 Token,通过动态选择实现计算稀疏,显著提升推理速度和吞吐量,且在各种预算下均优于丢弃 Token 的方法。

腾讯的Cursor–CodeBuddy深度评测-从代码生成到多文件协作生成的AI开发工具评测

编码智能体Craft通过「需求-拆解-执行-验证」流程实现复杂工程任务,支持从需求到多文件代码生成、重构的全流程自主化开发,并提供MCP生态整合能力及Plan模式辅助用户完成任务。对比Cursor Agent,Craft在多个方面表现出色,支持多文件系统级改造,具备更好的用户体验和计划功能,是开发者值得考虑的选择。

即将截止!AI应用产业全景图谱申报倒计时

2025年AI技术将深入千行百业。北京智合标准中心发布全国首个AI应用产业全景图谱,涵盖基础技术、产业融合等五大层,并提供政策、资本等支持。欢迎更多单位申报,包括案例展示、形象塑造、资源链接及标准编制机会。