学术
全日程公布|谷歌Veo 3惊艳发布后,这场CVPR分享会值得每个AI人「听个声」
CVPR 2025 论文分享会将在北京举办,主题包括多模态和视频生成。邀请顶级专家、论文作者参加Keynote演讲和圆桌对话,同时发布部分论文的摘要。
一键式训练端到端Agent,Qwen3+MCP工具集高效集成!
本文介绍了一种名为RLFactory的开源框架,旨在通过简单且高效的端到端训练方法解决现有深度学习框架在奖励设计和工具配置上的复杂问题。
ACL2025 LLM的“记忆”与“推理”该分家了吗?一种全新的训练范式,彻底厘清思考流程
MLNLP社区致力于促进国内外机器学习与自然语言处理的交流合作。最新研究论文探讨了如何解耦语言模型的记忆和推理能力,以实现更可控的大模型。
英伟达开源语音识别模型,ParaKeet-tdt-0.6b-v2仅需1秒可转录1小时音频,精准识别劈柴哥演讲
英伟达开源语音识别模型ParaKeet-tdt-0.6b-v2,实现60分钟音频仅1秒处理,适用于实时英语语音转文本。HyperAI超神经官网提供一键部署教程,新用户可获免费资源。