OpenAI推出的AI基准测试,却让Claude拿了第一名?!
OpenAI 推出 SWE-Lancer 基准测试,评估 AI 模型在真实软件工程任务中的表现,涵盖独立开发和管理任务,涉及多种类型和复杂度的软件开发任务。
OpenAI 推出 SWE-Lancer 基准测试,评估 AI 模型在真实软件工程任务中的表现,涵盖独立开发和管理任务,涉及多种类型和复杂度的软件开发任务。
Figure发布最新AI人形机器人模型Helix,具备识别和操作数千种家用物品的能力,并能执行复杂任务,如整理冰箱、与另一台机器人协作完成家务等。
苹果发布新款入门级iPhone 16e,搭载自研5G芯片和A18仿生芯片,支持Apple Intelligence功能。价格为4499元起,将于2月21日开启预购,2月28日正式发货。
xAI上线免费API积分计划,每月提供价值150美元的免费API余额。加入数据共享计划可收集并使用API请求数据改进模型。此活动有助于获取高质量数据,适用于大规模AI模型应用需求。
腾讯文档官宣已为旗下的AI文档助手接入DeepSeek-R1模型,标志着腾讯在商业生态内多个版块全面拥抱DeepSeek-R1。该模型支持文档问答和AI写作等功能,并与自家混元大模型相比,在性能上存在卡顿和延迟问题。总体而言,腾讯文档版本的DeepSeek-R1表现有待提升。
马斯克旗下xAI公司发布新模型Grok 3,其算力强大、性能卓越。Grok 3在计算量上较前代提升10倍,并在各种基准测试中表现优异。该模型分为通用版本和推理模式两种形态,且包含一个智能体Deep Search。目前仅对X平台Premium+订阅用户开放。
DeepSeek-R1 开源且功能强大,MiniMax 官方已将其接入自家 AI 助手平台 MiniMax Chat 并提供限时免费服务。用户可通过选择 ‘模型选择’ 下拉列表中的 ‘DeepSeek-R1’ 来使用该模型,支持回答各种问题和评论 OpenAI。但目前仅限基于训练数据的问答功能,未来将增加联网搜索能力。
清华大学博士生木易介绍如何使用KTransformers库在RTX 4090 GPU上运行DeepSeek-R1/V3模型,包括环境搭建、模型加载及推理参数设置等步骤。
腾讯给微信接入了DeepSeek-R1,目前只有少数用户通过灰度推送优先体验新功能。使用方法是检查微信版本是否为最新版并确认搜索框中是否有AI搜索选项。微信的AI搜索支持联网搜索且不可关闭,默认模式为快速回答,深度思考模式提供更详细的信息。该功能现处于实验阶段,未来可能进一步完善。
联网搜索,AI 回答更精准!
2️⃣
🎵 QQ音乐 x
DeepSeek-R1
:AI助手升级,音乐