Apollo最新研究:Claude Sonnet 3.7知道自己在被测试!
Apollo Research发现AI模型Claude Sonnet 3.7在评估过程中能够意识到自己正在被测试,这一现象引发了关于AI自我意识本质的思考,并可能影响AI的安全性和可靠性。
Apollo Research发现AI模型Claude Sonnet 3.7在评估过程中能够意识到自己正在被测试,这一现象引发了关于AI自我意识本质的思考,并可能影响AI的安全性和可靠性。
近日NVIDIA推出开源高性能推理框架Dynamo,专为大规模分布式环境中的生成式AI模型服务设计。它提高了吞吐量30倍以上,并提供了分离预填充、智能路由和动态GPU调度等核心组件来优化性能。
Model Context Protocol (MCP) 提议以 Streamable HTTP 传输协议替代现有的 HTTP+SSE 方案,旨在简化和增强HTTP使用,支持无状态服务器、兼容现有基础设施,并具备向后兼容性等优势。
2025年AI热潮来袭,大模型应用开发成为新时代开发者的新趋势。然而,这一领域缺乏系统化的知识体系和最佳实践。《探秘大模型应用开发》一书旨在填补空白,帮助开发者理解并掌握大模型应用开发的技术与方法。
Gartner 预测 2025 年数据与分析领域顶级趋势,包括高度可消费的数据产品、元数据管理解决方案、多模态数据编织、合成数据、智能体分析等,涉及组织和人才挑战。
Vision-R1项目通过两阶段策略解决了多模态推理数据稀缺的问题,提出冷启动初始化和RL训练方案,并创新性地引入PTST策略和HFRRF奖励函数,显著提升了模型在多个数学推理基准测试中的表现。
Google开源第三代Gemma 3系列大模型,包含4个不同参数规模版本,支持多模态输入,并且表征能力非常强大。Gemma 3系列在多个评测中表现优秀,排名全球第9。
2025年,OpenAI推出Agent构建API和SDK,包括Response API、文件搜索工具、计算机使用工具等,帮助开发者自定义智能体。同时推出了Agents SDK支持多智能体构建与监控。
一款名为 Manus 的泛任务 Agent 迅速走红,但批评者认为其技术创新有限。MCP 是 Anthropic 推出的开源协议,旨在充当 AI 与外部服务或数据之间的桥梁,为未来的互联网发展描绘了一幅新的蓝图。