大模型公司们“犹抱琵琶式”的融资和幸存者游戏

近期智谱和阶跃的两起融资新闻展示了大模型公司们‘犹抱琵琶半遮面’的披露策略。智谱虽公布了30亿人民币D轮融资但未公开参投方名单;阶跃则仅披露B轮数亿美元融资,估值不明。这种策略背后反映了大模型公司在融资上的双重需求:急需持续融资支撑高昂投入同时保留一定神秘感以保护竞争优势。

现在的搜索引擎,快被 AI 垃圾淹成赛博粪坑了

AI 生成的内容已经渗透到互联网的各个角落,让日常搜索变得一团糟。从动漫风格的蛇图到牡丹和龙的图片,几乎全是 AI 生成的垃圾内容,这引发了作者对背后原因的好奇。最终发现这些低质量的 AI 内容主要来源于短视频平台和内容平台,而背后的逻辑则是「流量逐利」。

斯坦福打脸大模型数学水平:题干一改就集体降智,强如o1也失准,能力涌现怕不是检索题库

斯坦福大学研究表明,在更换数学题变量名称后,大模型的准确率直线下降。即使是表现最好的o1-preview模型,其准确率也从50%降至33.96%,表明它们可能更多依赖已存储的答案而非推理能力。团队提出Putnam-AXIOM。该基准解决了现有评估基准数据污染和饱和的问题,为自动化评估提供方法并生成变体数据集。