单卡3090纯视觉玩MineCraft!LS-Imagine在开放世界中基于长短期想象进行强化学习
究方向
|
强化学习、世界模型
LS-Imagine 通过纯视觉观测来玩 Minecraft,仿照人
大语言模型
究方向
|
强化学习、世界模型
LS-Imagine 通过纯视觉观测来玩 Minecraft,仿照人
本文提出TechSinger,一种支持五种语言与七种歌唱技巧精细控制的歌声合成系统,克服传统方法在可控性和艺术表达上的局限。
17 日发布 R2 模型为不实消息,公司尚未公布具体发布时间和技术细节。市场预期或在 5 月发布。
2025年3月15日北京下雪。文章介绍了视频多模态RAG记忆增强检索和GDELT事件知识图谱构建及与RAG效果评估,讨论了不同方法的优缺点及其在问答任务中的应用。
谷歌 Gemini AI 最近动作频频。发布了参数量仅为 DeepSeek-V3 1/25 的 Gemma 3,以及支持生图功能的 Gemini 2.0 Flash-Exp 模型,并开放了 Gemini 的 Deep Research 使用权限,升级为自家推理模型 Gemini 2.0 Flash Thinking。新增个性化模式和 Gems 智能体平台等功能。
全球领先的研究与教育出版机构威立发布报告揭示了人工智能在科研工作中的应用现状及挑战,并提供了AI如何节省科研人员时间的信息,以及科研人员对出版机构的期待。
今天是2025年3月14日,星期五,北京天气晴。Light-R1-32B复现了R1的效果,但限定于数学领域AIME24、AIME25、GPQA Diamond等数据集;同时指出R1蒸馏模型所用800K数据是否来自训练还是由R1生成尚存争议。