一篇142页全面复盘DeepSeek R1思考推理技术综述
通过分类体系分析DeepSeek-R1的推理模块及其在不同任务中的表现,揭示了推理链条的结构一致性、反刍行为和长度对性能的影响,并发现存在一个“最佳点”来优化模型性能,同时探讨了长文本处理与人类认知负荷的关系。
通过分类体系分析DeepSeek-R1的推理模块及其在不同任务中的表现,揭示了推理链条的结构一致性、反刍行为和长度对性能的影响,并发现存在一个“最佳点”来优化模型性能,同时探讨了长文本处理与人类认知负荷的关系。
微软发布MarkItDown Python工具用于将文件和文档转换为Markdown格式,提供MCP服务器支持与LLM应用程序集成。
ICLR 2025杰出论文奖揭晓。包括普林斯顿大学、Google DeepMind等机构的论文在内,共评选出3篇杰出论文和3篇荣誉提名论文,涵盖安全对齐、学习动态及模型编辑等多个方向的研究成果。
ICLR 2025杰岀论文奖揭晓!3篇杰出论文涵盖安全对齐、语言模型学习动态和编辑等方面的研究成果,强调了当前大型语言模型存在的问题及潜在解决方案。
Model Context Protocol (MCP) is a standardized interface aimed at achieving seamless interaction between AI models and external tools and resources, breaking down data silos and enhancing interoperability across different systems. MCP’s core components include the MCP host, client, and server, working together to enable secure and efficient communication with AI applications and external data sources. It covers lifecycle stages like creation, operation, and updates of MCP servers, along with an ecosystem including key adopters such as Anthropic, OpenAI, and community-driven platforms. This protocol also discusses security threats at each stage and proposed mitigation strategies.
微软发布MAI-DS-R1模型,通过35万个敏感主题示例后训练提高了其在该类主题上的响应能力及风险配置优化,使其能够成功响应99.3%相关提示,满意度指标也高于DeepSeek R1和R1-1776。同时,在减少有害内容方面表现优于其他模型,推理能力和一般知识保持不变。
DUIX是硅基智能的AI数字人交互平台,已获5.5k星,支持多方大模型接入及语音识别、合成技术,适用于智能客服等场景,提供一站式多模态实时交互SDK集成方案。
OpenAI发布o3和o4-mini,并开源Codex CLI终端工具。Codex CLI专为习惯使用终端的开发者提供ChatGPT级别推理能力及代码执行功能。该工具现已上线免费体验。