月度归档: 2025 年 6 月
Claude时代终结?LMArena实测DeepSeek R1编程得分超Opus 4,但月暗称其新模型更胜一筹
尖产品实属罕见。
然而,DeepSeek 前段时间更新的最新版本 DeepSeek-R1(0528)
机器人企业「艨码科技」完成种子轮融资
艨码科技宣布完成种子轮融资,融资资金将用于加速通用机器人技术研发与升级。公司致力于打造通用机器人技术和高可靠本体,涵盖移动机器人及作业、复合机器人,并已与多个行业头部机构合作。联合创始人兼CEO孙猛表示将继续坚持’通用、可靠’的机器人发展理念。
大模型“拼好题”,45K数据撬动18%提升,数学问题拒绝死记硬背 MathFusion
MathFusion团队提出了一种新的方法,通过指令融合增强大语言模型解决数学问题的能力。仅使用45K的合成指令,在多个基准测试中平均准确率提升了18.0个百分点。MathFusion通过顺序、并列和条件三种融合策略将不同数学问题巧妙结合生成新问题,显著提升模型性能与数据效率,并在in-domain和out-of-domain基准测试中均表现出优越表现。
速递|Meta 140亿美元交易暗藏杀机:Scale AI创始人Alexandr Wang的跳槽代价
lexandr Wang)并获得了 Scale AI 的股份。
• 谈判开始时
Meta
与
Sc
不用千亿参数也能合成高质量数据!这个开源框架让小模型“组团逆袭”,7B性能直追72B
上海人工智能实验室与中国人民大学提出GRA框架,通过多人协作机制让小模型协同生成高质量训练数据,其生成的数据质量媲美甚至优于单个大型语言模型。
DeepSeek-R1编程问鼎,媲美Claude 4!2025 AI上半场战报来袭
编程新王DeepSeek-R1成功晋级,与Gemini 2.5 Pro、Claude Opus 4并列第一。AI领域进展迅速,OpenAI仍占主导地位,谷歌和Meta也有增长机会。