ACM MM 2025 ISDrama让剧本“动”起来!多模态生成沉浸式空间戏剧 2025年7月25日23时 作者 PaperWeekly 于多模态提示,创建具有戏剧韵律的连续多说话人双耳语音,在增强现实(AR)、虚拟现实(VR)等领域具有
Nvidia携H20重返中国!黄仁勋:禁令建立在错误假设上 2025年7月17日23时 作者 机器人大讲堂 idia 首次亮相链博会。 在前不久, Nvidia 称美国批准其开始向中国市场销售 H20 芯片,
语料一变就崩?EraRAG首创“增量语义图”,动态语料场景下也能稳准快 2025年7月16日12时 作者 PaperWeekly 多跳推理与深层理解的关键路径。 然而,现有的 Graph-RAG 方法普遍建立在静态语料假设之上,一
华科校友在港冲刺AI infra第一股!已是中国最能赚的独立边缘云服务商,王小川天使轮就投了 2025年6月25日23时 作者 量子位 。 PPIO派欧云 ,独立分布式云计算服务商,也是提供AI云计算服务的先行者,最近在港交所递交了招股
天工不止造物,也能修bug:Skywork-SWE给代码智能体补上软件工程课 2025年6月20日11时 作者 机器之心 的书。它让人相信:技术不是死物,而是人与世界持续互动的方式。 如果说「天工」代表了中国古代对「工程」
Image Caption复兴宣言!南大港大CapArena重塑「详细图像描述」评测体系 2025年6月12日16时 作者 PaperWeekly 发展,现代的视觉语言模型可以生成详细而全面的描述。然而,由于评测的主观性和困难,当前的视觉语言评测往
函数向量对齐技术,让大模型持续学习不“失忆”丨ICLR 2025 2025年5月30日16时 作者 量子位 怪。 最近来自中国科学技术大学、香港城市大学和浙江大学的联合研究团队,通过对多个语言模型、任务序列和
基准测试揭秘大模型“字数危机”:26个模型长文本生成普遍拉胯,最大输出长度过度宣传 2025年5月29日16时 作者 量子位 过明确的 “长度指令” ? 比如,“写一篇10,000字的长文,详细分析某个议题。”看似简单的要求,
开源即屠榜!UniME多模态框架登顶MMEB全球训练榜,刷新多项SOTA纪录 2025年5月8日11时 作者 量子位 SOTA来了! 格灵深瞳、阿里ModelScope团队,以及通义实验室机器智能团队联合发布通用多模态
DeepSeek新数学模型刷爆记录!7B小模型自主发现671B模型不会的新技能 2025年5月1日16时 作者 量子位 理证明,大幅刷新多项高难基准测试。 在普特南测试上, 新模型 DeepSeek-Prover-V2