学术归档 - 第277页共283页 - 每时AI

从啥也不会到DeepSpeed——一篇大模型分布式训练的学习过程总结

2024年12月15日14时2024年11月22日23时作者极市干货

↑ 点击
蓝字
关注极市平台
作者丨elihe@知乎（已授权）
来源丨https://zhuanla

MMRel：多模态大模型时代的评测物体间关系理解新基准

2024年12月15日14时2024年11月22日23时作者极市干货

MMRel是首个大规模、高质量的物体间关系理解数据集，用于评估和提升多模态大模型能力。包含超过22K问答对，覆盖三个领域与三种关系类型，通过半自动流程生成并提供高难度子集测试极限性能。

如今的智能体，已经像人一样「浏览」视频了，国内就有

2024年12月15日20时2024年11月22日13时作者机器之心

英伟达的NVIDIA AI Blueprint和OmAgent项目展示了AI技术如何帮助用户更好地理解和分析视频内容，OmAgent提供了原生多模态智能体框架，支持设备开发和使用。

全球十亿级轨迹点驱动，首个轨迹基础大模型来了

2024年12月15日20时2024年11月22日13时作者机器之心

研究团队提出了首个世界轨迹基础大模型 UniTraj，克服了现有方法的局限性，实现了跨任务、跨区域的泛化能力，并在不同数据质量下保持鲁棒性。

大模型不会推理，为什么也能有思路？有人把原理搞明白了

2024年12月15日20时2024年11月22日13时作者机器之心

机器之心报道
编辑：泽南、杜伟
大模型不会照搬训练数据中的数学推理，回答事实问题和推理问题的「思路」

上交大o1复现新突破：蒸馏超越原版，警示AI研发”捷径陷阱”

2024年12月15日20时2024年11月22日13时作者机器之心

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000

仅仅一天，Gemini就夺回了GPT-4o拿走的头名

2024年12月15日20时2024年11月22日13时作者机器之心

谷歌和OpenAI在大模型领域竞争激烈，近期Google的Gemini-Exp-1114和Gemini-Exp-1121模型迅速更迭Top榜单。有人担忧当前的人工智能基准测试方法可能简化了模型评估，引发对安全性和可靠性等问题的关注。

凑个热闹，测试一波DeepSeek新上的o1推理模型

2024年12月15日20时2024年11月22日10时作者机器学习算法与自然语言处理

MLNLP社区介绍了国内涌现的o1模型，并分享了一些测试结果。kimi的k0-math模型在数学和代码方面表现出色，但逻辑推理能力有待提高。社区呼吁开发者积极贡献开源模型，以超越OpenAI的技术水平。

NeurIPS 2024｜收敛速度最高8倍，准确率提升超30%！华科发布MoE Jetpack框架

2024年12月15日20时2024年11月21日23时作者新智元

华中科技大学提出MoE Jetpack框架，利用密集模型预训练权重微调为混合专家模型，显著提升精度和收敛速度。

支持20+视觉任务，多项SOTA！可扩展多任务视觉基础模型LaVin-DiT：融合时空VAE与DiT

2024年12月15日20时2024年11月21日23时作者极市干货

↑ 点击
蓝字
关注极市平台
作者丨AI生成未来
来源丨AI生成未来
编辑丨极市平台
极市导读
模型