AI封神了!无剪辑一次直出60秒《猫和老鼠》片段,全网百万人围观
加州大学伯克利分校、斯坦福大学和英伟达联合制作的《猫和老鼠》短片背后的研究者介绍了测试时间训练层(TTT)的有效替代方法,用于生成复杂动态故事的长视频。
加州大学伯克利分校、斯坦福大学和英伟达联合制作的《猫和老鼠》短片背后的研究者介绍了测试时间训练层(TTT)的有效替代方法,用于生成复杂动态故事的长视频。
南洋理工大学 S-Lab 与普渡大学提出 CFG-Zero* 方法,改进 Flow Matching 模型的 Classifier-Free Guidance,提升生成图像/视频的质量和一致性。
ICLR 2025 论文分享会将于4月20日在北京举办,主题包括训练推理、多模态和Agent等。顶尖专家李崇轩将介绍扩散模型在大语言模型范式中的应用,陈键飞则介绍高效训练推理的理论及算法。
alphaXiv 推出的新功能「Deep Research for arXiv」协助研究人员更高效地检索和阅读学术论文,显著提升文献研究效率。
本身不够好
。
尤其在专业搜索场景(如文献、数据库查询)中,用户往往无法用精确、完整的表达描述他们
中科院自动化研究所与中科紫东太初团队提出了一种结合高质量指令对齐数据与类 R1 的强化学习方法,用于提升目标检测性能。该方法包括召回奖励、精度奖励和渐进式规则调整策略等机制,在多个数据集上实现了显著性能提升。
本文介绍了一种基于规则的强化学习(RL/RFT)在GUI智能体领域的应用,UI-R1模型通过精心设计的奖励函数和高效的数据筛选策略提升了跨领域的任务表现。
RoboVerse 提出一个统一平台、数据集与评测体系,解决机器人仿真碎片化问题。MetaSim 解决跨仿真器兼容性;大规模合成数据集与标准化评测系统提升性能评估;混合仿真增强真实性;Real2Sim 支持从现实到仿真的资产重建;AI-Generate Tasks 创造新任务;支持 GPU 并行训练加速研究。
Meta 新发布的Llama 4模型在实战中表现不佳,引发了广泛质疑。尽管其在大模型竞技场上的排名不错,但在实际应用中的效果却不如人意。部分用户反馈称该模型存在多方面的问题,如生成代码、抽象推理等能力不足。为了澄清疑虑,Meta 发布了Llama 4的相关测试数据,并承认之前的宣传策略可能存在问题。