月度归档: 2025 年 4 月
合成数据也能通吃真实世界?首个融合重建-预测-规划的生成式世界模型AETHER开源
上海人工智能实验室开源生成式世界模型AETHER,首次实现大模型在真实世界中的3D空间决策与规划能力。通过「重建-预测-规划」一体化框架和几何空间建模,大幅提升模型空间推理的准确性与一致性,并成功实现在合成数据上零样本泛化至真实场景。
也看图结构增强的GraphRAG方案:NodeRAG实现思路解读
今天是2025年4月20日,星期日,北京,晴。文章介绍了NodeRAG优化方案在图维度上的应用及其具体实现细节,包括异构图的定义、节点类型和增强方法,展示了其如何提高检索和理解的精确性和层次化能力,并分析了实际部署时的数据占用情况。
bge-base-en-v1.5微调实战!手把手教你打造垂直领域“最强大脑”,让Embedding模型秒变行业专家!
文章介绍了嵌入微调在RAG系统中的重要性,强调其对于特定领域专业知识的提升作用,并详细说明了数据集构建、损失函数选择和模型训练的方法。
MoCha:对话角色视频生成神器,开启虚拟创作新时代!
最近Meta与滑铁卢大学联合开发的MoCha模型在对话角色视频生成方面取得了重大突破,能够根据文本或语音输入生成带有同步语音和自然动作的完整角色动画。其创新的技术架构和训练策略使得角色的嘴型能够更加精准地匹配语音内容,增强了动画的真实感和自然度。