马斯克挖不动的清华学霸,一年造出 “反内卷 AI”!0.027B参数硬刚思维链模型,推理完爆o3-mini-high
智能模型,名为 HRM。其参数规模仅为 2700 万,但能够解决那些让当今先进大型语言模型都束手无策
智能模型,名为 HRM。其参数规模仅为 2700 万,但能够解决那些让当今先进大型语言模型都束手无策
国务院常务会议强调巩固经济回升势头,并审议通过《关于深入实施“人工智能+”行动的意见》、个人消费贷款及服务业经营主体贷款贴息政策等相关文件。
智谱AI CEO表示公司上半年收入增长四倍,主要归因于R1模型发布引发的兴趣。该公司正试图抓住中国国内AI应用加速的机遇,尽管面临美国贸易限制。
加拿大滑铁卢大学TIGER Lab华人学者团队提出One-Shot Critique Fine-Tuning (One-Shot CFT) 新方法,通过生成多个不同版本的解答和多个点评者模型进行点评,让目标模型从“批判答案”中学习推理规律。该方法在计算资源消耗、效果稳定性方面表现优异,比传统的监督式微调和强化学习有明显优势。
微软、亚马逊等科技巨头今年计划支出超过3440亿美元,主要用于AI模型所需的数据中心建设。尽管如此,Meta因在AI上的投资带来股价上涨8%,而亚马逊因云服务销售疲软导致股价下跌。
Joseph Suarez 通过对强化学习历史的回顾指出,尽管近年来强化学习相关论文数量增加,但领域并未取得持续性的突破。主要原因是学术界的短视行为和过度优化评价体系导致研究进展缓慢。他提倡从头开始构建新的强化学习基础设施,并强调性能工程的重要性。
浙江大学发布全球最大的类脑计算机“悟空”,采用第三代神经拟态芯片Darwin 3,拥有20亿个脉冲神经元和1000亿级突触连接。该系统支持低功耗、事件驱动架构,并在模拟秀丽线虫到猕猴的大脑模型方面取得进展。