量子位，作者每时AI - 第59页共151页

字节最新大模型秘籍：只挑能有推理潜力的数据训练！1.3B模型无需标签自动挑选

2025年5月15日16时作者量子位

字节Seed团队提出AttentionInfluence方法，利用小型预训练模型选择对大语言模型推理能力有显著提升的数据。通过屏蔽关键头部并计算损失差异来评估数据重要性，最终在多个基准测试中提高了模型性能。

阿里开源全能视频模型！生成编辑都精通，1.3B版本消费级显卡可跑

2025年5月15日16时作者量子位

阿里开源的通义万相Wan2.1-VACE模型展示了强大的视频生成与编辑功能，包括基础的文生视频、图生视频和视频生视频等初级玩法；加入编辑功能如局部抹除或替换、视频重绘、时长或背景延展等中阶玩法；高阶玩法则能将各种能力花式组合。

今天起全员免费！GPT-4.1上线ChatGPT，首波实测：又快又听话，油腻感没了

2025年5月15日11时作者量子位

GPT-4.1已正式加入ChatGPT，用户可免费使用。该模型专为编码任务设计，推理效率高，速度比其他模型快。此外，GPT-4.1在验证SWE-bench任务上得分为54.6%，较前一代有显著提升。不过，免费用户仍无法手动切换模型，对此OpenAI表示将考虑用户建议。

陶哲轩DeepMind梦幻联动，最强通用科学Agent来了！一口气解决芯片设计、矩阵乘法和300年几何难题

2025年5月15日11时作者量子位

谷歌DeepMind的AlphaEvolve通过优化算法和设计新的矩阵乘法方法，显著提高了数据中心和芯片设计效率，并解决了多个数学问题。

ICML25 让耳朵「看见」方向！仅依靠360°全景视频，就能生成3D空间音频

2025年5月14日23时作者量子位

OmniAudio团队发布了一项研究，能够直接从360°视频生成空间音频。该技术解决了现有视频到音频转换中的方向信息缺失问题，为虚拟现实和沉浸式娱乐提供了新的可能性。

百万规模数据集打造人形机器人通用大模型，实现精细动作跨平台、跨形态动作迁移丨北大人大联合发布

2025年5月14日23时作者量子位

北大卢宗青团队在通用人形机器人动作生成领域取得突破，提出Being-M0框架和MotionLib数据集，实现了大规模且多样化的复杂人类动作生成，并验证了大数据+大模型的可行性。

奥特曼最新访谈暗示：OpenAI终极目标是打造订阅制AI服务

2025年5月14日23时作者量子位

OpenAI CEO奥特曼在’AI Ascent 2025’活动中透露，未来AI模型将覆盖用户一生的数据，实现个性化推理，并设想开发核心AI订阅服务。他称这为柏拉图式理想，并提到目前处于‘PPT’阶段。

数据中心不必建在地球！中国企业已经把算力设施送到了太空

2025年5月14日23时作者量子位

12颗计算卫星成功发射，标志着全球首个太空计算星座的开启。国星宇航牵头发起‘星算’计划，目标是将算力部署至太空，以解决地面数据中心能源消耗大、冷却成本高及传输延迟等问题。

讯飞AI耳机新品1499开卖，三年成绩单公布：用户破百万，AI调用破千亿

2025年5月14日23时作者量子位

未来智能发布两款AI会议耳机iFLYBUDS Pro 3和iFLYBUDS Air 2，覆盖自动生成记录标题与概览、个性化摘要、待办管理模块等功能。同时推出viaim大脑，融合AI通话降噪算法、翻译技术、语音嘴替功能以及搜索检测等应用。公司强调硬件感知拓展软件理解维度，并通过零信任架构保障数据安全。

所有AI工具共享记忆！MCP协议杀疯了：100%本地运行，Cursor、Claude都能用

2025年5月14日16时作者量子位

一款名为OpenMemory MCP的开源工具解决了AI工具记忆痛点，并实现了不同工具之间的上下文信息共享，支持本地运行、跨平台和多种实用功能。

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31