AI工程化
Cursor 1.0 正式上线,写代码、审代码,一站式全能!多项功能体验升级!
Cursor 1.0 正式发布,新增智能代码审查、后台任务处理和Jupyter Notebook集成等功能,提升了开发效率和用户体验。
Karpathy最新预言:不开放、不脚本化的软件将在AI时代“灭绝”
Andrej Karpathy 在社交媒体上指出传统软件在AI时代将面临困境,建议未来的赢家将是可脚本化的产品,并强调开放性和文本化的重要性。
DeepEval:LLM 应用评测不再玄学,让大模型评测像写单元测试一样简单
在大模型应用开发中,DeepEval 提供了一个自动化和标准化的LLM评测框架,支持本地运行,并且集成于多种LLM应用开发框架中。它内置了多种主流的评测指标,能够满足实际场景需求,并支持批量数据集评测和组件级追踪。
Memvid:把你的文档库变成一个小巧的视频,还能瞬间搜出你想要的!
Memvid开源项目通过将文本数据存入视频文件,解决传统向量数据库高昂成本和复杂部署问题,提供高效、经济且便携的文本存储与检索解决方案。
DeepSeek-R1 更新,思考更深,推理更强
DeepSeek R1 模型完成小版本升级至 0528 版本。新增深度思考功能,提升了数学、编程和逻辑推理能力,在多个基准测评中表现优异,并针对幻觉问题进行了优化。
Agent与工具交互平台级探索,只用接入一个MCP服务就能调用6000+工具
ACI.dev 是一个开源项目,旨在为AI Agent提供标准化基础设施,简化其与大量外部工具的集成、认证和权限管理过程。它通过广泛的工具集成、统一的认证授权机制、多样化的接入方式(包括直接函数调用和统一MCP服务器)来解决复杂环境中的交互问题。
Langchain创始人最新分享:如何跨越“原型惊艳”到“生产可靠”的鸿沟
LangChain创始人Harrison Chase在Interrupt大会上发表了主题演讲,指出AI行业面临的痛点是将大模型转化成可靠应用的困难。他提出智能体工程师需要掌握提示工程、工程能力、产品思维和机器学习知识,并分享了LangChain对智能体开发的洞察与策略预判。