PaperAgent
字节跳动Seed1.5-VL复杂图表精准抽取,Deep Think是多模态未来的主流
Seed1.5-VL 是一个由 ByteDance 开发的多模态语言模型,在处理复杂表格、模糊图片和几何题目等方面表现出色。其架构包含视觉编码器和MoE LLM。预训练数据包括3万亿高质量token,遵循幂律和对数线性关系。Seed1.5-VL 在Hugging Face上可用体验,并通过强化学习后处理提升性能。
火爆全网!《LLM书》.PDF
本书介绍生成式人工智能项目生命周期,涵盖模型选择、微调和部署等内容。通过直观示例和技术库指导读者掌握Transformer和Diffusers等工具。同时介绍了大模型前沿课程、顶会论文idea以及学术辅导服务。
14B检索能力超过Google Search,阿里ZeroSearch通过RL激发LLM检索推理能力~
阿里通义Lab提出的ZEROSEARCH是首个无需与真实搜索引擎交互的强化学习框架,旨在激励语言模型提升搜索能力。
一篇Multi-Agent具身智能技术最新综述
具身AI研究涵盖了单智能体和多智能体系统,并介绍了不同方法在控制、学习和生成模型中的应用。重点讨论了MAS的控制与规划、学习以及基于生成模型的交互机制。
给MCP加上RAG,工具准确率提升200%,起飞~
大型语言模型在利用外部工具方面遇到提示膨胀和选择复杂性的挑战,引入了RAG-MCP框架通过检索增强生成技术解决这些问题,显著提高工具选择准确性并减少提示大小和token数量。