大模型归档 - 第33页共147页

35%准确率蒸发！字节&华科WildDoc揭示多模态文档理解鲁棒性短板

2025年6月8日8时作者 PaperWeekly

多模态大模型在文档理解领域的性能显著，但现有基准存在真实场景挑战。字节跳动联合华中科技大学发布首个真实世界文档理解基准数据集WildDoc，揭示了当前模型的不足，并提出改进策略。

2025年6月8日8时作者 PaperWeekly

nguage Models
论文链接：
https://arxiv.org/abs/2505.006

2025年6月7日14时作者老刘说NLP

今天是2025年6月7日，星期六，北京晴。介绍了两个关于知识图谱本体的工作，一是RAG用于MySQL数据生成知识图谱本体的方法，二是基于非结构化知识库进行本体生成的方法。

2025年6月7日14时作者 AI探索时代

Vanna项目是一个基于大模型的SQL语句生成开源项目，用户可通过自然语言输入获取SQL查询结果，适用于复杂数据分析场景。

2025年6月7日14时作者 AI信息Gap

Cursor 推出1.0正式版，新增BugBot、Background Agent、Memories等新功能，支持Jupyter Notebook和MCP模型协议优化，提升用户体验。

2025年6月7日11时作者路过银河AI

黑森林发布了Flux Kontext，分为Max版和Pro版付费版本。通过API进行调用，价格分别为0.04美元/0.08美元不等。ComfyUI提供统一通道支持这些付费API，用户只需一次性充值即可使用，节省时间和成本。

2025年6月6日16时作者 PaperWeekly

近期研究表明，线性序列建模（如 Lightning Attention、Mamba2）与混合专家模型架构（MoE）的结合在高效大模型领域引起了广泛关注。上海人工智能实验室团队的最新研究首次系统地实现了这两种技术的结合，并开源了完整的技术框架。

2025年6月6日16时作者 PaperWeekly

北京大学等机构提出GAPrompt，一种面向三维视觉预训练模型的几何感知高效微调方法，通过引入点云结构化提示提升下游任务中的几何适应能力。该研究已被人工智能顶会ICML 2025接收，并已开源相关代码与模型。

2025年6月6日16时作者 PaperWeekly

务中屡创佳绩，但真正推动它们迈入智能进化新阶段的，是一种更具层次性的推理方式：
长思维链（Long

2025年6月6日14时作者老刘说NLP

今天是2025年6月6日，星期五，北京晴。文章回顾了大模型相关技术进展，包括针对性学习、推理数据收集、多模态应用及强化学习评估偏差等内容。关键点在于明确问题并针对性学习，学会提问和理论与实践结合，以提升大模型性能。