如何用大模型自动生成PPT?AutoPresent及SlideCoder方案
今天是2025年6月12日,星期四,北京晴。文章介绍了两种PPT生成方案AutoPresent和SlideCoder,前者通过微调LLAMA模型生成Python代码,后者使用布局感知的检索增强生成框架,包含层次化检索增强生成、图像分割等技术。
大语言模型
今天是2025年6月12日,星期四,北京晴。文章介绍了两种PPT生成方案AutoPresent和SlideCoder,前者通过微调LLAMA模型生成Python代码,后者使用布局感知的检索增强生成框架,包含层次化检索增强生成、图像分割等技术。
最近研究基于人工智能进行数据分析,发现大模型主要通过生成SQL或Pandas代码来完成任务,而不是直接操作大量数据。对比两种方式优缺点时,SQL擅长处理大批量数据但存在复杂场景问题,Pandas适用于格式化数据且可跨不同数据库使用。
VRAG-RL 是一种基于强化学习的视觉检索增强生成方法,通过引入多模态智能体训练,实现了视觉语言模型在检索、推理和理解复杂视觉信息方面的显著提升。
研究构建首个面向MLLM的细粒度AES基准EssayJudge,采用10项细粒度评分维度,涵盖词汇、句子和文章三个层级,评价作文质量。
文章介绍了如何通过掌握正确的科研方法和导师指导快速发表顶会顶刊论文。强调了执行能力和实战经验的重要性,并推荐了一堂由顶级期刊主席主讲的系统课程,涵盖了论文选题、写作与投稿全流程的知识点和方法论。
2025年6月11日,北京晴。文章介绍了MCP的9个代表项目流程和开源大模型进展,包括DeepSeek-R1的蒸馏Qwen3-32B和MiniCPM4系列端侧大模型。
在2025年6月11日的文章中,探讨了《Infinity Parser》结合强化学习和文档解析数据集的构建,并介绍了《When to use GraphRAG: A Comprehensive Analysis for Graph Retrieval-Augmented Generation》,分析了GraphRAG在不同场景下的有效性。
文章介绍了智能体的复杂性和不可控性,并提出了多智能体架构来解决这些问题。但同时也指出多智能体之间的通讯问题以及业务流程中可能需要其它业务处理或人工参与的情况。