何恺明带队驯服AI更懂物理!去噪方法+哈密顿网络,清华校友一作
何恺明团队提出一种结合哈密顿神经网络的去噪方法,旨在让AI更懂物理。该方法采用Block-wise哈密顿量和掩码建模策略来改进传统HNN,并通过实验展示了其在正向模拟、表征学习和轨迹插值任务中的优势。
何恺明团队提出一种结合哈密顿神经网络的去噪方法,旨在让AI更懂物理。该方法采用Block-wise哈密顿量和掩码建模策略来改进传统HNN,并通过实验展示了其在正向模拟、表征学习和轨迹插值任务中的优势。
大语言模型生成10万Token文本,TOKENSWIFT框架将时间缩短至90分钟。该框架通过多Token并行生成、动态KV缓存管理及树结构的多候选Token验证等创新技术,实现了无损加速和文本多样性提升,并在多个规模和架构上进行了测试。
上海交大团队通过实验发现多模态数据对语言质量的影响有限,提出OmniAlign-V数据构建Pipeline,包含高质量的多模态数据,并在多个基准测试中验证了其有效性。
谷歌持有Anthropic约14%的股份,并计划通过可转换债券形式额外投资7.5亿美元,但无控制权。Anthropic估值已超过615亿美元,主要依靠外部融资。
阿里通义实验室薄列峰团队首次将RLVR应用于包含音频、动态视觉内容的全模态LLM,聚焦情感识别任务。研究发现模型在分布内和分布外数据集上均有显著提升,并能清晰分析不同模态的作用,目前这些模型已开源。