字节最新大模型秘籍:只挑能有推理潜力的数据训练!1.3B模型无需标签自动挑选
字节Seed团队提出AttentionInfluence方法,利用小型预训练模型选择对大语言模型推理能力有显著提升的数据。通过屏蔽关键头部并计算损失差异来评估数据重要性,最终在多个基准测试中提高了模型性能。
字节Seed团队提出AttentionInfluence方法,利用小型预训练模型选择对大语言模型推理能力有显著提升的数据。通过屏蔽关键头部并计算损失差异来评估数据重要性,最终在多个基准测试中提高了模型性能。
阿里开源的通义万相Wan2.1-VACE模型展示了强大的视频生成与编辑功能,包括基础的文生视频、图生视频和视频生视频等初级玩法;加入编辑功能如局部抹除或替换、视频重绘、时长或背景延展等中阶玩法;高阶玩法则能将各种能力花式组合。
GPT-4.1已正式加入ChatGPT,用户可免费使用。该模型专为编码任务设计,推理效率高,速度比其他模型快。此外,GPT-4.1在验证SWE-bench任务上得分为54.6%,较前一代有显著提升。不过,免费用户仍无法手动切换模型,对此OpenAI表示将考虑用户建议。
谷歌DeepMind的AlphaEvolve通过优化算法和设计新的矩阵乘法方法,显著提高了数据中心和芯片设计效率,并解决了多个数学问题。
OmniAudio团队发布了一项研究,能够直接从360°视频生成空间音频。该技术解决了现有视频到音频转换中的方向信息缺失问题,为虚拟现实和沉浸式娱乐提供了新的可能性。
北大卢宗青团队在通用人形机器人动作生成领域取得突破,提出Being-M0框架和MotionLib数据集,实现了大规模且多样化的复杂人类动作生成,并验证了大数据+大模型的可行性。
OpenAI CEO奥特曼在’AI Ascent 2025’活动中透露,未来AI模型将覆盖用户一生的数据,实现个性化推理,并设想开发核心AI订阅服务。他称这为柏拉图式理想,并提到目前处于‘PPT’阶段。
12颗计算卫星成功发射,标志着全球首个太空计算星座的开启。国星宇航牵头发起‘星算’计划,目标是将算力部署至太空,以解决地面数据中心能源消耗大、冷却成本高及传输延迟等问题。
未来智能发布两款AI会议耳机iFLYBUDS Pro 3和iFLYBUDS Air 2,覆盖自动生成记录标题与概览、个性化摘要、待办管理模块等功能。同时推出viaim大脑,融合AI通话降噪算法、翻译技术、语音嘴替功能以及搜索检测等应用。公司强调硬件感知拓展软件理解维度,并通过零信任架构保障数据安全。
一款名为OpenMemory MCP的开源工具解决了AI工具记忆痛点,并实现了不同工具之间的上下文信息共享,支持本地运行、跨平台和多种实用功能。