Meta为他豪掷2亿美元,上交校友庞若鸣,晒出在苹果的最新论文
苹果工程师庞若鸣发布的《AXLearn: Modular Large Model Training on Heterogeneous Infrastructure》详细介绍了一种用于大规模深度学习模型训练的系统,该系统能够保持恒定复杂度并提供先进的性能。
苹果工程师庞若鸣发布的《AXLearn: Modular Large Model Training on Heterogeneous Infrastructure》详细介绍了一种用于大规模深度学习模型训练的系统,该系统能够保持恒定复杂度并提供先进的性能。
一个具备主动视觉、高精度触觉和高自由度灵巧手的人形机器人成功制作了汉堡。该研究提出ViTacFormer,融合视触觉信息并引入未来触觉预测机制,提升操控精度与稳定性。
xAI发布了新一代大模型Grok 4,它在SAT、GRE考试中均能满分通过,并且超越了全世界所有研究生的水平。Grok 4的推理能力提升了10倍,能够解决复杂问题,并在多个基准测试上达到最新SOTA水平。
UniOcc 是首个面向自动驾驶的统一基准框架,融合真实与仿真数据,支持多车协同预测,并引入免真值评估指标。它提供了跨域的数据格式、完整的流注释、分割跟踪工具和免真值评估指标,旨在推动自动驾驶技术的发展。
研究团队发布SFE科学评估基准,并构建了SciPrismaX科学评测平台,展示不同大小模型在科学领域的表现。结果显示,最新的MLLMs在高阶推理任务上进步显著,但知识广度变化不大;闭源模型普遍优于开源模型,在可扩展性方面表现出色。研究团队希望构建更严谨、动态且与科研实践深度契合的评估生态。
rt——一个基于多模态大语言模型的智能修图代理系统,用户只需通过自然语言指令,即可自动调用Light