何恺明带队驯服AI更懂物理!去噪方法+哈密顿网络,清华校友一作

何恺明团队提出一种结合哈密顿神经网络的去噪方法,旨在让AI更懂物理。该方法采用Block-wise哈密顿量和掩码建模策略来改进传统HNN,并通过实验展示了其在正向模拟、表征学习和轨迹插值任务中的优势。

90分钟生成10万Token,新框架实现3倍无损加速超长文本生成,支持DeepSeek-R1和QwQ!

大语言模型生成10万Token文本,TOKENSWIFT框架将时间缩短至90分钟。该框架通过多Token并行生成、动态KV缓存管理及树结构的多候选Token验证等创新技术,实现了无损加速和文本多样性提升,并在多个规模和架构上进行了测试。

阿里开源R1-Omni,DeepSeek同款RLVR首度结合全模态情感识别,网友:可解释性+多模态学习=下一代AI

阿里通义实验室薄列峰团队首次将RLVR应用于包含音频、动态视觉内容的全模态LLM,聚焦情感识别任务。研究发现模型在分布内和分布外数据集上均有显著提升,并能清晰分析不同模态的作用,目前这些模型已开源。