学术归档 - 第211页共283页 - 每时AI

年末惊喜！ByteDance Research视频理解大模型「眼镜猴」正式发布

2025年1月25日23时作者机器之心

ByteDance Research 的视频理解大模型眼镜猴(Tarsier)发布了第二代模型 Tarsier2 及相关技术报告。Tarsier2 在影视名场面分析和视频描述任务上表现突出，展示了强大的视频理解和生成能力。

英伟达RTX 5090评测解禁，天赋都点在了 AI 上

2025年1月25日16时作者机器之心

选自The Verge
作者：Tom Warren
机器之心编译
久等了。
本周三，各路媒体对英伟达

物理测试暴击AI圈，DeepSeek R1稳超o1、Claude，我们已进入RL黄金时代

2025年1月25日16时作者机器之心

机器之心报道
编辑：泽南、杨文
我们都没预料到，AI 领域的 2025 年是这样开始的。
DeepS

年末重磅！ByteDance Research视频理解大模型「眼镜猴」正式发布

2025年1月25日16时作者机器之心

ByteDance Research 的视频理解大模型眼镜猴（Tarsier）迎来了重大更新，发布了第二代模型 Tarsier2 及相关技术报告。Tarsier2 能够分析复杂的影视名场面，并对真人和动画、横屏和竖屏、多场景和多镜头的视频进行描述，其性能超越了 GPT-4o 和 Gemini-1.5-Pro 等闭源模型，在多个公开基准上表现出色。

浙大通义联手推出慢思考长文本生成框架OmniThink，让AI写作突破知识边界

2025年1月25日16时作者机器之心

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000

陶仁帅@北京交通大学：浅谈高质量学术论文的Rebuttal撰写体会

2025年1月25日14时作者机器学习算法与自然语言处理

MLNLP社区举办学术Talk活动，特邀北京交通大学陶仁帅分享高质量学术论文Rebuttal撰写体会，涵盖技巧、策略和常见误区，帮助学生提高投稿成功率。

Kimi发布最新模型k1.5，技术报告也干货满满

2025年1月25日14时作者机器学习算法与自然语言处理

MLNLP社区发布了最新模型Kimi k1.5，其在数学推理方面表现突出，并分享了强化学习数据收集和基础设施部署框架等内容。

中国AI太强，Meta工程师吓疯？自曝疯狂熬夜复制DeepSeek，天价高管心虚了

2025年1月24日23时作者极市干货

Meta员工在TeamBlind上爆料，DeepSeek公司训练成本仅550万美元就推出了性能堪比OpenAI的AI模型。这令Meta高管们感到尴尬和紧张，Meta工程师也正在争分夺秒地分析DeepSeek的技术细节。

ICLR 2025 Ross: 多模态大模型的 MAE 时刻？

2025年1月24日23时作者极市干货

本文介绍了一篇关于Reconstructive Visual Instruction Tuning (Ross)的工作，该方法通过引入视觉监督来提升多模态大模型的细粒度理解能力，并显著减少幻觉现象。该方法已成功应用于多个基准测试中，与现有技术相比表现出色。

大模型轻量化系列解读 (六)：SpinQuant：采用可学习旋转矩阵的 LLM 量化

2025年1月24日23时作者极市干货

↑ 点击
蓝字
关注极市平台
作者丨科技猛兽
编辑丨极市平台
极市导读
SpinQuant 结合了可