刚刚,GPT-4.5发布!OpenAI最大最贵模型,主打情商高,奥特曼带娃缺席发布会

OpenAI发布了GPT-4.5模型,强调其情商和实用性。通过两个演示展示了其能力:一是帮助识别并处理用户情绪;二是提供自然且丰富的知识解释方式。此外还介绍了模型开发过程中的细节与技术内幕。

任意Prompt就能给大模型实时排名!竞技场新玩法,还能自动找最佳AI来作答

竞技场(lmarena.ai)推出的Prompt-to-leaderboard(P2L)功能,根据输入的Prompt实时排名大模型。通过实验证明其在预测人类偏好方面优于传统的全局排行榜方法,并能更准确评估模型表现。

大模型训练或无需“纯净数据”!北大团队新研究:随机噪声影响有限,新方法让模型更抗噪

北大团队研究发现,在训练数据中加入随机噪音并不会严重影响语言模型的性能。即使高达20%的数据被污染,模型的预测损失仅上升约1%,并提出局部梯度匹配方法进一步提升其鲁棒性。

曝GPT-4.5本周空降!1T激活参数,120T训练数据,会吐出阶段性思考成果然后继续思考

本周GPT-4.5即将发布的消息在网络上传开。OpenAI表示,GPT-4.5是Orion模型,也是其新旗舰GPT-4的下一代,并确认GPT-4.5将是最后一个非推理模型。据爆料,GPT-4.5拥有1T激活参数和256K上下文窗口长度,能够制作动画SVG文件并生成音乐。然而,也有测试者表示,在某些任务上其表现不如Claude 3.7 Sonnet。尽管如此,OpenAI计划只向Pro用户开放首批体验GPT-4.5的权限。

英伟达创纪录财报回应DeepSeek:全年营收9500亿,Blackwell刚开卖就贡献800亿

英伟达发布2025财年Q4财报:季度营业收入393亿美元,数据中心收入创纪录。全年营业收入1305亿美元,同比增长114%。新产品Blackwell的销售收入达到110亿美元。毛利率为73%,略低于预期。

DeepSeek今日连开3源!针对优化的并行策略,梁文锋本人参与开发

DeepSeek开源周第四天发布三项优化并行策略的技术成果,包括DualPipe、EPLB和Profiling Data。DualPipe是一种双向流水线并行算法,旨在减少计算与通信阶段的气泡;EPLB是MoE模型负载均衡器,确保计算资源平衡利用;Profiling Data提供了实际应用中的效果数据可视化支持。