学术
首个无编码器的3D多模态大语言模型ENEL,7B参数即可媲美13B!
首次在3D多模态大语言模型中移除了编码器,让LLM直接处理3D编码任务。通过提出混合语义损失和分层几何聚合策略,首个无编码器的3D LMM ENEL表现出色,7B模型与ShapeLLM-13B相当,在多个任务上超过现有方法。
大规模实用化量子化学计算曙光显现,ByteDance Research开源工具集ByteQC
字节跳动 ByteDance Research 团队开发并开源了 ByteQC,一款基于 GPU 加速的大规模量子化学计算工具集,显著加速了量子化学算法,并实现了更大规模的模拟。
上海AI Lab最新推出Mixture-of-Memories:线性注意力也有稀疏记忆了
AIxiv专栏介绍及新模型MoM发布。MoM通过混合记忆机制实现大规模内存扩展,显著提升长序列建模能力,在in-context recall-intensive任务上超越Transformer。
DeepSeek R1与OpenAI模型文风相似度高达74.2%?新研究质疑DeepSeek训练数据
研究发现DeepSeek生成的74.2%文本风格与OpenAI模型相似,Copyleaks开发集成系统识别具体AI模型。结果显示DeepSeek与OpenAI模型有显著风格相似性。