清华&哈佛4D语言场建模新方法,动态场景精准识别|CVPR2025

清华大学和哈佛大学的研究团队提出了一种新的方法4D LangSplat,利用视频分割模型生成物体级语言描述,并通过大语言模型提取高质量的句子特征来重建动态语义场。该方法解决了现有静态语义场重建在动态场景中的应用难题,显著提升了时间敏感查询的准确性。

一张图,快速生成可拆分3D角色!腾讯清华新SOTA CVPR 2025

腾讯AI Lab和清华大学提出的新模型StdGEN能够在3分钟内生成具有精细细节的可分拆3D角色,质量超过现有方法。StdGEN使用语义感知的大规模重建模型从多视角图像中联合重建几何、颜色和语义信息,并通过迭代优化提高质量。

单张照片实现三维重建,单视角室外复杂场景首次攻克| 西湖大学&港科大&Everlyn AI

西湖大学、香港科技大学等团队提出Niagara框架,首次有效解决单视角复杂室外场景三维重建问题。该方法结合深度与法线信息,采用几何仿射场和3D自注意力机制,显著提升细节捕捉精度及几何一致性。在RealEstate10K数据集上验证效果,优于当前最先进的Flash3D方法。

OpenAI加码写作赛道?阿里最新大模型通用写作能力基准WritingBench,揭秘深度思考能否增进文学表达

阿里联合人大交大开源WritingBench评估基准,覆盖6大领域100个细分场景。通过四阶段人机协同流程构建评测集,基于写作意图动态生成评测指标,实现87%的人类一致性得分。团队发现带思维链模型在创意写作中表现更优,但长文本生成仍面临挑战。

宇树机器人侧空翻惊呆网友:“我**想要一个!”

宇树的Unitree G1机器人成功完成站立侧空翻,引起网友热议。这款身高1米3、售价9.9万元起的机器人展示了强大运动能力,并已完成原地起跳侧空翻等动作。对比之下,波士顿动力在前年发布的Atlas也展现了类似的复杂动作,但宇树的视频更具视觉冲击力。