月度归档: 2025 年 5 月
避坑!一不留神你的RAG系统中的向量数据库每年就要烧掉几十万RMB!
文章描述了管理十亿条向量数据的成本问题,通过欠量化和使用KX的qHNSW磁盘引擎等方法降低成本。推荐从小维度开始、积极进行量化、使用两阶段检索以及严格进行基准测试以优化成本。
一个超牛的智能体框架项目:Pocket Flow
通过一个简单的100行代码框架,文章介绍了9种智能体结构图(单节点、工作流、共享、批量、异步、分支、并行、循环和嵌套),这些图帮助实现复杂任务,为理解智能体的本质提供了重要洞察。
字节开源了一款多模态神器!BAGEL上线,超越Qwen2.5-VL,媲美SD3!
字节跳动发布的BAGEL是首个支持多模态输入输出、思维链推理和MOT架构优化的跨模态超级AI模型,性能超越Qwen2.5-VL、InternVL-2.5。它能理解图像更准确,生成图像媲美Stable Diffusion 3,并在10+基准测试中表现优异。
最强编码模型Claude 4来了!Mcp集成无需Client,扩展提示缓存增强Agent长上下文保持能力
Anthropic 推出的新一代 Claude 模型包括 Claude Opus 4 和 Claude Sonnet 4,在编码、推理和 AI Agent 方面达到新标准,并提供混合模型的两种模式:近乎即时响应和用于深度推理的扩展思维功能。
Claude 4发布!世界最强编程模型来了
Anthropic发布Claude 4家族,包含Claude Opus 4和Claude Sonnet 4两个版本。Opus 4在编程基准测试SWE-bench上得分72.5%,Sonnet 4则在SWE-bench上得72.7%。两款模型均采用混合架构,并提供两种工作模式:近即时响应和深度思考推理。Claude Opus 4还具备调用工具的能力,带来一系列新功能和突破性的能力。
全球最强编码模型 Claude 4 震撼发布:自主编码7小时、给出一句指令30秒内搞定任务,丝滑无Bug
ic 的首届开发者大会上,Anthropic CEO Dario Amodei 宣布 Claude