学术归档 - 第158页共283页

「压缩即智能」得到实验验证，无需预训练和大量数据就能解决ARC-AGI问题

2025年3月15日12时作者机器之心

AI 与 SSI 联合创始人 Ilya Sutskever 就曾表达过类似的观点。甚至早在 1998

2025年3月15日12时作者极市干货

本文提出了一种轻量化多模态语言模型LLaVA-MoD，通过稀疏专家混合架构和渐进式蒸馏策略，在2B规模下使其性能超过7B大模型8.8%，并在幻觉检测任务中超越教师模型。

2025年3月15日12时作者机器之心

译
近段时间，推理模型 DeepSeek R1 可说是 AI 领域的头号话题。用过的都知道，该模型在

2025年3月15日12时作者极市干货

0 blocks) 缩放到 4.8B (60 blocks)，重用小模型的知识。不用从头开始训练模型

2025年3月14日23时作者机器之心

本文提出VLM²-Bench评测基准，旨在系统探究视觉语言模型在人类级基础视觉线索关联能力上的表现。通过全面考察通用线索、物体线索和人物线索三个大类的基础关联能力，共涵盖9个子任务及3060个测试案例。

2025年3月14日23时作者机器之心

作。
这项研究的主题是没有归一化层的 Transformer（Transformers withou

2025年3月14日16时作者 PaperWeekly

使大语言模型掌握了一定的跨领域、跨任务的知识。
近两年，越来越多的研究工作利用预训练的大语言模型来构

2025年3月14日16时作者 PaperWeekly

全球领先的研究与教育出版机构威立发布报告揭示了人工智能在科研工作中的应用现状及挑战，并提供了AI如何节省科研人员时间的信息，以及科研人员对出版机构的期待。

2025年3月14日14时作者 GiantPandaCV

dation Classification
论文地址：
https://openreview.net

2025年3月14日12时作者 HyperAI超神经

崂山实验室研发团队通过物理海洋学与人工智能融合，推出全球高分辨率1/12°海洋环境智能预报大模型「问海」。其预测中尺度涡旋性能优于现有数值预报系统，并在计算效率上提升了3000倍。