百度搜索×DeepSeek,我替你们试了,满血+联网版真香!
百度搜索接入DeepSeek-R1满血版进行实测,表现不错,准确理解语义并能进行创意写作和诗作等任务。支持联网功能,实现1+1>2的效果。
百度搜索接入DeepSeek-R1满血版进行实测,表现不错,准确理解语义并能进行创意写作和诗作等任务。支持联网功能,实现1+1>2的效果。
腾讯推出了深度推理模型混元T1,并宣布面向所有用户开放免费使用。它能多维度理解问题并进行高效推理,还整合了腾讯生态系统的信息,包括引用微信公众号、视频号和腾讯网的内容。实测显示其在推理能力和联网功能上表现出色。
OpenAI 推出 SWE-Lancer 基准测试,评估 AI 模型在真实软件工程任务中的表现,涵盖独立开发和管理任务,涉及多种类型和复杂度的软件开发任务。
Figure发布最新AI人形机器人模型Helix,具备识别和操作数千种家用物品的能力,并能执行复杂任务,如整理冰箱、与另一台机器人协作完成家务等。
Datawhale发布《大语言模型》中文书籍,系统介绍大语言模型技术。作者团队包括赵鑫、李军毅、周昆等专家,引用次数已突破4000次。该书注重为读者提供系统性的知识讲解,内容涵盖预训练、微调、对齐等多种基础内容。
微软发布OmniParser V2,一款开源屏幕解析工具,能够将任何LLM变成能操作计算机的Agent,并包含改进后的数据集和模型,实现更低延迟和更高准确率。