清华大学归档 - 第10页共18页

视频生成的测试时Scaling时刻！清华开源Video-T1，无需重新训练让性能飙升

2025年3月26日16时作者机器之心

研究团队首次提出Video-T1方法，通过Test-Time Scaling显著提升视频生成性能，提出Tree-of-Frames方法优化搜索效率和生成质量。

2025年3月22日16时作者新智元

向DeepSeek等中国AI公司疯狂投简历了！与此同时，美国众议院则被曝出直接质问斯坦福、CMU等六

2025年3月21日16时作者量子位

清华大学和哈佛大学的研究团队提出了一种新的方法4D LangSplat，利用视频分割模型生成物体级语言描述，并通过大语言模型提取高质量的句子特征来重建动态语义场。该方法解决了现有静态语义场重建在动态场景中的应用难题，显著提升了时间敏感查询的准确性。

2025年3月21日11时作者量子位

腾讯AI Lab和清华大学提出的新模型StdGEN能够在3分钟内生成具有精细细节的可分拆3D角色，质量超过现有方法。StdGEN使用语义感知的大规模重建模型从多视角图像中联合重建几何、颜色和语义信息，并通过迭代优化提高质量。

2025年3月20日23时作者机器之心

本文介绍了一种新的神经网络方法GridMix，用于解决偏微分方程建模中的空间调控问题。GridMix通过网格表征实现了局部细节和全局结构的有效结合，显著提升了PDE建模的性能，在动态系统建模和几何感知预测任务中尤其表现优异。

2025年3月15日12时作者 AIGC开放社区

专注AIGC领域的专业社区，聚焦微软&OpenAI、百度文心一言等大语言模型的发展与应用。清华大学高性能计算研究所团队开源了名为‘赤兔Chitu’的大模型推理引擎，首次实现在非英伟达H系列GPU及国产芯片上原生运行FP8精度模型，有效突破部署限制。

2025年3月14日12时作者机器之心

本文介绍了一篇关于 MIDI 模型的研究论文，MIDI 能够从单张图像生成高几何质量的组合式 3D 场景。该模型在多个数据集上的表现超越现有方法，并有望应用于建筑设计、虚拟现实等多个领域。

2025年3月12日12时作者机器之心

线被拉升，以此为基础所构建的长 CoT 推理、多 Agent 协作等类型的高级应用也逐渐增多。
随之