练习时长两年半,谷歌Veo 3刷屏,我们花900元做了一条AI“猫片”

谷歌在2025年I/O大会上发布多款新产品和功能,其中最引人注目的是Veo3视频模型及其配套的Flow平台。Flow主打“视频编辑与剪辑”,支持原生音频同步生成有声视频,并能一键直出人物对白、音效及环境声音的效果自然逼真。Veo3冲击了AI视频制作工作流,对垂类数字人产品和AI剪辑应用构成了威胁。

拒绝不必要Think:微软&北大提出第一种自适应大型混合推理模型

微软研究院与北大提出的大规模混合推理模型LHRMs能够在用户查询时自适应地决定是否进行思考,实现更快、更自然的日常交互,并在推理和通用能力方面超越现有模型的同时显著提高了效率。

ICLR 2025 Oral LLM也有从众心理!

MLNLP社区是国内外知名的机器学习与自然语言处理社区。最新研究发现,大型语言模型(LLM)在AI团队中可能盲目跟随多数意见,甚至放弃原本正确的判断。浙江大学团队的研究指出多AI协作系统存在类似人类‘群体思维’的现象,并开发了测试平台验证这一现象。

他主动辞去终身教职:“这里不再适合做研究”

MLNLP社区是国内外知名的人工智能学术社区,专注于推动机器学习与自然语言处理领域的交流与发展。马蒂亚斯·多普克因特朗普政府对美国高等教育的收紧政策而辞去了美国的工作,认为不确定性已影响到他的学生和研究环境。

智元机器人发布并开源世界模型EVAC与评测基准EWMBench,助力具身世界模型加速进化!

智元机器人发布了具有突破性的具身世界模型EVAC和具身世界模型评测基准EWMBench,以解决模型评测成本高和数据价值未能充分挖掘利用的问题。这标志着具身智能进入了“算法-评测”协同进化时代。