罗永浩没有缺席,他发布了一款AI产品

由罗永浩创立的 Jarvis 推出的新款 AI 助手 J1 Assistant 已经支持三星 Galaxy 和 Pixel 系列设备,并且能够通过语音进行多种操作。这款产品集成了自家 AI 模型,提供实用答案和备忘录功能。相比市面上其他 AI 助手,J1 Assistant 更加注重隐私保护。

大模型公司们“犹抱琵琶式”的融资和幸存者游戏

近期智谱和阶跃的两起融资新闻展示了大模型公司们‘犹抱琵琶半遮面’的披露策略。智谱虽公布了30亿人民币D轮融资但未公开参投方名单;阶跃则仅披露B轮数亿美元融资,估值不明。这种策略背后反映了大模型公司在融资上的双重需求:急需持续融资支撑高昂投入同时保留一定神秘感以保护竞争优势。

斯坦福打脸大模型数学水平:题干一改就集体降智,强如o1也失准,能力涌现怕不是检索题库

斯坦福大学研究表明,在更换数学题变量名称后,大模型的准确率直线下降。即使是表现最好的o1-preview模型,其准确率也从50%降至33.96%,表明它们可能更多依赖已存储的答案而非推理能力。团队提出Putnam-AXIOM。该基准解决了现有评估基准数据污染和饱和的问题,为自动化评估提供方法并生成变体数据集。