AI也能当情感大师?腾讯发布最新AI社交智能榜单,最新版GPT-4o拿下第一
腾讯混元AI数字人团队发布全新自动化评估框架SAGE,通过模拟人类心理的感知智能体来评价大模型的共情能力及陪伴效果。研究发现GPT-4o表现最佳,而GEMINI-2.5系列紧随其后。
腾讯混元AI数字人团队发布全新自动化评估框架SAGE,通过模拟人类心理的感知智能体来评价大模型的共情能力及陪伴效果。研究发现GPT-4o表现最佳,而GEMINI-2.5系列紧随其后。
Mistral发布开源编程模型Devstral,在软件工程任务上超过DeepSeek全家桶和Qwen3 235B。参数仅24B,可在单卡RTX4090甚至32G内存的Mac上运行。
榜单上又一家中国公司登顶!
天工超级智能体(Skywork Super Agents)
,出自昆仑万
谷歌推出Gemini Diffusion,通过扩散技术将语言模型文本生成速度提升至2000token/秒,甚至超越了较大的模型Gemini 2.0 Flash-Lite。这种技术能够快速迭代并纠正错误,提高生成连贯性和一致性。
英伟达的DreamGen项目通过梦境学习技术,仅凭少量现实视频数据就能让机器人学会执行多种新任务。该技术利用AI视频世界模型生成神经轨迹,显著提升了复杂任务的成功率,并首次实现了从0开始的泛化能力。
研究团队提出基于强化学习的视觉规划(VPRL)新范式,实现图像直接驱动推理,显著优于文本规划方法,未来有望推动多模态推理向更直观方向发展。
OpenAI CPO Kevin Weil表示,未来ChatGPT将从回答问题转变为解决问题。模型成本已降至GPT-4的500倍,OpenAI计划降低API价格以吸引更多公司参与。AI Agent能够整合多种工具进行高效操作。
报告指出,AI智能助手正在替代传统的搜索引擎模式,并导致SEO策略发生变革。80%的消费者依赖AI回答问题,在专业知识领域中,内容社区引用频率最高,知乎在所有内容社区中被引频率最高,占比29.9%。面向AI助手的SEO策略应转向SPO(专业社区优化)以提升影响力和信息质量。