刚刚,DeepSeek-GRM模型发布,全新推理时Scaling,为R2打前站!

DeepSeek联合清华发布研究成果,提出DeepSeek-GRM模型通过点式生成奖励建模提高通用查询的性能,利用自我原则批评调整等方法实现推理时扩展。该模型在多个基准测试中表现出色,在推理时的性能随着采样数量增加而显著提升。

微软诞生50周年,比尔盖茨亲自公开微软起家的源代码:Altair Basic!

比尔・盖茨回忆了微软公司成立的故事及其第一笔业务。1975年,保罗・艾伦和他在新墨西哥州阿尔伯克基市创立微软公司,并编写了Altair BASIC的源代码。微软从一本杂志上的一款个人电脑套件开始,最终成为全球最大的科技巨头之一。

Cohere:如何应对Agent落地的5大挑战

AI Agent在自动化处理工作流、辅助决策方面表现出色,但其可靠性、性能和准确性仍面临挑战。Cohere团队总结了开发者面临的五大挑战,并提供了应对策略,包括管好工具箱、掌控推理与决策、处理多步骤流程与上下文、控制幻觉与确保准确性,以及规模化之路的优化策略。