三种主流文本嵌入编码范式及KG-Infused RAG做问题扩展新思路

今天是2025年6月13日,星期五,北京晴天。文章介绍了三种embedding编码范式(Bi-encoders、Cross-encoder、ColBERT)及其对比,并探讨了知识图谱与RAG结合在问答系统中的应用,重点介绍《KG-Infused RAG: Augmenting Corpus-Based RAG with External Knowledge Graphs》的研究工作及其步骤。

视频理解“隐秘的角落”:多任务视频文本理解评测新基准VidText发布

VidText 提出了一套全面的视频文本理解基准,覆盖 27 个真实场景和多种语言。它包含从视觉感知到跨模态推理的多个任务,评估模型在不同粒度上的表现,并揭示了影响性能的关键因素。

ICML 2025 Agentic时代唤醒NAS”第二春”!智能体超网动态组队,推理成本暴降55%

大语言模型驱动的多智能体系统在构建时面临手动设计和调试的瓶颈。新加坡国立大学等团队推出MaAS框架,利用智能体超网技术实现按需定制的动态智能体服务,提高效率并降低成本。

如何用大模型自动生成PPT?AutoPresent及SlideCoder方案

今天是2025年6月12日,星期四,北京晴。文章介绍了两种PPT生成方案AutoPresent和SlideCoder,前者通过微调LLAMA模型生成Python代码,后者使用布局感知的检索增强生成框架,包含层次化检索增强生成、图像分割等技术。

关于基于人工智能做数据分析的两种方式——SQL和Pandas的区别

最近研究基于人工智能进行数据分析,发现大模型主要通过生成SQL或Pandas代码来完成任务,而不是直接操作大量数据。对比两种方式优缺点时,SQL擅长处理大批量数据但存在复杂场景问题,Pandas适用于格式化数据且可跨不同数据库使用。