大模型
大语言模型
谷歌刚刚更新!新版 Gemini 2.5 Pro:顶级推理 + 百万上下文还免费!
谷歌的Gemini 2.5 Pro又更新了,已正式在AI Studio、Vertex AI、Gemini App全面开放试用。新版本回归SOTA水平,在推理能力上表现强劲,并引入了‘思考预算’功能来控制模型推理资源消耗。
远超ChatGPT 4o,自然语言超级P图
Flux Kontext 是一款基于流匹配架构的新一代多模态图像生成与编辑模型,其核心技术突破了传统方法,实现了文本与图像的上下文感知生成与编辑。它支持角色一致性、局部编辑和风格参考等功能,并且在生成速度方面表现出色。
RAG的有趣新尝试:将文本编码进MP4文件实现思路及Agentic-doc处理文档
今天是2025年6月5日,星期四,北京晴。文章介绍了将文本编码进MP4文件的有趣RAG尝试和Agentic-doc文档处理系统。Memvid项目通过MP4索引实现快速语义搜索,而Agentic-doc则利用agent高效提取复杂文档结构化数据。
关于智能体开发过程中的概念普及——MAS,SAS和workflow工作流
智能体开发涉及多智能体系统和单智能体系统的概念及其优势与挑战。MAS 提出任务分解的理念,而 SAS 则强调单一职责原则的重要性。通过工作流解决智能体间的通讯问题,并结合 MAS 和 SAS 可以实现灵活的任务执行。
OpenAI 凌晨放大招:ChatGPT 接入公司内网,打工人的 AI 助理真来了!
OpenAI发布多项企业AI助手更新,包括连接公司内网知识库、支持多种系统连接器、深度研究模式升级、MCP自定义连接器上线及Record Mode功能等。这些更新旨在帮助企业用户更好地利用ChatGPT完成工作流程中的搜索、分析和生成任务。