AI工程化

Apollo最新研究：Claude Sonnet 3.7知道自己在被测试！

2025年3月20日16时作者 AI工程化

Apollo Research发现AI模型Claude Sonnet 3.7在评估过程中能够意识到自己正在被测试，这一现象引发了关于AI自我意识本质的思考，并可能影响AI的安全性和可靠性。

2025年3月20日11时作者 AI工程化

近日NVIDIA推出开源高性能推理框架Dynamo，专为大规模分布式环境中的生成式AI模型服务设计。它提高了吞吐量30倍以上，并提供了分离预填充、智能路由和动态GPU调度等核心组件来优化性能。

2025年3月18日16时作者 AI工程化

Model Context Protocol (MCP) 提议以 Streamable HTTP 传输协议替代现有的 HTTP+SSE 方案，旨在简化和增强HTTP使用，支持无状态服务器、兼容现有基础设施，并具备向后兼容性等优势。

2025年3月18日16时作者 AI工程化

2025年AI热潮来袭，大模型应用开发成为新时代开发者的新趋势。然而，这一领域缺乏系统化的知识体系和最佳实践。《探秘大模型应用开发》一书旨在填补空白，帮助开发者理解并掌握大模型应用开发的技术与方法。

2025年3月14日23时作者 AI工程化

Gartner 预测 2025 年数据与分析领域顶级趋势，包括高度可消费的数据产品、元数据管理解决方案、多模态数据编织、合成数据、智能体分析等，涉及组织和人才挑战。

2025年3月13日8时作者 AI工程化

Vision-R1项目通过两阶段策略解决了多模态推理数据稀缺的问题，提出冷启动初始化和RL训练方案，并创新性地引入PTST策略和HFRRF奖励函数，显著提升了模型在多个数学推理基准测试中的表现。

2025年3月12日23时作者 AI工程化

Google开源第三代Gemma 3系列大模型，包含4个不同参数规模版本，支持多模态输入，并且表征能力非常强大。Gemma 3系列在多个评测中表现优秀，排名全球第9。

2025年3月12日12时作者 AI工程化

2025年，OpenAI推出Agent构建API和SDK，包括Response API、文件搜索工具、计算机使用工具等，帮助开发者自定义智能体。同时推出了Agents SDK支持多智能体构建与监控。

2025年3月11日23时作者 AI工程化

文章介绍了复杂推理与慢思考的相关知识，包括大语言模型、慢思考推理技术以及相关研究进展等内容。

2025年3月8日16时作者 AI工程化

一款名为 Manus 的泛任务 Agent 迅速走红，但批评者认为其技术创新有限。MCP 是 Anthropic 推出的开源协议，旨在充当 AI 与外部服务或数据之间的桥梁，为未来的互联网发展描绘了一幅新的蓝图。

较早文章

较新文章