日期: 2025 年 8 月 4 日
谷歌深夜放出 IMO 金牌模型,多项测试力压 Grok 4、OpenAI o3!网友评论两极分化
谷歌推出 Gemini 2.5 Deep Think 模型,在 IMO 竞赛中夺金牌。该模型能够在短时间内完成复杂问题的推理,并且能够通过并行处理多个想法来提高效率。
马斯克挖不动的清华学霸,一年造出 “反内卷 AI”!0.027B参数硬刚思维链模型,推理完爆o3-mini-high
智能模型,名为 HRM。其参数规模仅为 2700 万,但能够解决那些让当今先进大型语言模型都束手无策
国常会:深入实施“人工智能+”行动,大力推进人工智能规模化商业化应用
国务院常务会议强调巩固经济回升势头,并审议通过《关于深入实施“人工智能+”行动的意见》、个人消费贷款及服务业经营主体贷款贴息政策等相关文件。
速递|OpenAI的“红色警报”成真?智谱AI上半年营收增长四倍
智谱AI CEO表示公司上半年收入增长四倍,主要归因于R1模型发布引发的兴趣。该公司正试图抓住中国国内AI应用加速的机遇,尽管面临美国贸易限制。
监督学习未死,一题训练五小时起飞!华人学者新方法20倍训练效率释放大模型推理能力
加拿大滑铁卢大学TIGER Lab华人学者团队提出One-Shot Critique Fine-Tuning (One-Shot CFT) 新方法,通过生成多个不同版本的解答和多个点评者模型进行点评,让目标模型从“批判答案”中学习推理规律。该方法在计算资源消耗、效果稳定性方面表现优异,比传统的监督式微调和强化学习有明显优势。