开启端侧长文本时代!面壁全新架构,让小钢炮最快提升220倍 下午11时 2025/06/09 作者 机器之心 周五,2025 智源大会上,国内知名 AI 创业公司面壁智能正式发布了旗下最新一代「小钢炮」模型 M
看好了,这才是7家大模型做高考数学题的真实分数。 下午2时 2025/06/09 作者 数字生命卡兹克 通过测试四款推理模型解答2025年全国一卷数学试题,揭示了各模型的真实表现,强调了考试规则的公平性。
拆解AI编程顶流Cursor:我们从它的架构、提示词和产品哲学中学到了什么? 下午2时 2025/06/08 作者 子非AI 门道。文章将为你揭示一个顶尖AI应用成功的 三大技术与产品支柱 : 1. 分层AI架构 :一个由“大
6大模型决战高考数学新一卷:豆包、元宝并列第一,OpenAI o3竟惨败垫底 上午8时 2025/06/08 作者 机器之心 上午刚经历了抽象作文的洗礼,下午又被数学无情创飞。考试一结束,「高考数学」、「新一卷数学大题 难」等
SFT+RL双阶训练突破LLM自我监督!人大DeepCritic实现AI批判自主进化 上午8时 2025/06/08 作者 PaperWeekly nguage Models 论文链接: https://arxiv.org/abs/2505.006
你永远叫不醒装睡的大模型!多轮对话全军覆没,性能暴跌39% 下午4时 2025/06/07 作者 新智元 研究人员进行了一项超过20万次的模拟实验,评估了多个大语言模型在单轮和多轮对话中的性能差异。结果显示大多数模型在多轮对话中表现下降,这被称为‘对话迷失’现象。
SQL语句生成智能体——vanna项目介绍 下午2时 2025/06/07 作者 AI探索时代 Vanna项目是一个基于大模型的SQL语句生成开源项目,用户可通过自然语言输入获取SQL查询结果,适用于复杂数据分析场景。
干货满满!图灵奖学术大牛和宇树、智谱等明星AI企业齐聚,探讨AI产业新风向 下午11时 2025/06/06 作者 头部科技 回顾今年上半年,AI大潮可谓浩浩荡荡。 大模型领域,科技巨头与前沿实验室迭代频率创下历史纪录, 深
智源全新悟界系列大模型亮相!剑指AI加速数字世界、物理世界融合 下午11时 2025/06/06 作者 智东西 悟界系列4款大模型发布,涵盖多模态世界模型、脑科学基础模型、跨本体具身智能框架及全原子微观生命模型,推动AI从数字世界迈向物理世界。