PaperWeekly，作者每时AI

端侧模型卷王诞生！MiniCPM4长文本推理提速5倍，0.5B模型屠榜同级

2025年6月10日16时作者 PaperWeekly

，带来端侧性能创新式大跃升；一款 0.5B 实力演绎以小博大，适配广泛终端场景。
MiniCPM4.

2025年6月9日16时作者 PaperWeekly

本次研讨会聚焦于认知导向的多模态情感计算，旨在推动AI从感知走向理解，共吸引来自全球不同高校的研究者和开发者参与。

2025年6月9日16时作者 PaperWeekly

研究揭示越擅长数学推理的模型反而更难完全遵守指令。这项发现强调了AI在处理复杂任务时的’聪明’与’听话’之间的权衡关系，未来有望构建既能深入思考又能严格守规矩的大模型。

2025年6月9日16时作者 PaperWeekly

北京大学提出VGP方法，通过语义低秩分解增强图结构图像模型的参数高效迁移能力，在多种下游任务中实现媲美全量微调的性能。

2025年6月9日16时作者 PaperWeekly

万物皆卷的时代，越来越多的人通过高质量论文来增强竞争力。咕泡科技提供一站式科研辅导服务，包括选题、实验设计验证、创新点设计等环节，助力学生在短时间内提升学术能力，确保论文顺利发表。

2025年6月8日8时作者 PaperWeekly

多模态大模型在文档理解领域的性能显著，但现有基准存在真实场景挑战。字节跳动联合华中科技大学发布首个真实世界文档理解基准数据集WildDoc，揭示了当前模型的不足，并提出改进策略。

2025年6月8日8时作者 PaperWeekly

nguage Models
论文链接：
https://arxiv.org/abs/2505.006

2025年6月6日16时作者 PaperWeekly

近期研究表明，线性序列建模（如 Lightning Attention、Mamba2）与混合专家模型架构（MoE）的结合在高效大模型领域引起了广泛关注。上海人工智能实验室团队的最新研究首次系统地实现了这两种技术的结合，并开源了完整的技术框架。

2025年6月6日16时作者 PaperWeekly

北京大学等机构提出GAPrompt，一种面向三维视觉预训练模型的几何感知高效微调方法，通过引入点云结构化提示提升下游任务中的几何适应能力。该研究已被人工智能顶会ICML 2025接收，并已开源相关代码与模型。

2025年6月6日16时作者 PaperWeekly

务中屡创佳绩，但真正推动它们迈入智能进化新阶段的，是一种更具层次性的推理方式：
长思维链（Long