OpenAI发布迄今最智能AI模型GPT-5了
GPT-5发布会引爆科技圈,山姆·奥特曼将其比作iPhone发布。它能生成复杂的网站、降低事实错误率至1.6%并提供专家建议。多模块协同机制保证了安全性,并引入四重人格原型以优化用户体验。这是AI认知标准的变革,预示着知识民主化和权力重构的到来。
GPT-5发布会引爆科技圈,山姆·奥特曼将其比作iPhone发布。它能生成复杂的网站、降低事实错误率至1.6%并提供专家建议。多模块协同机制保证了安全性,并引入四重人格原型以优化用户体验。这是AI认知标准的变革,预示着知识民主化和权力重构的到来。
阿里巴巴开源超强AI Agent模型Qwen3-Coder,在OpenAI基准测试中得分69.6%,参数量4800亿。它在代码领域表现突出,并且支持256K上下文窗口和大规模强化学习,还提供命令行工具方便使用。
Kimi-Dev 是一款强大的开源编程LLM,性能超越其他开源模型,在SWE-bench Verified上达到60.4%;支持本地部署和Hugging Face使用,并通过大规模强化学习优化解决方案的准确性和鲁棒性。
Kimi发布开源代码模型Kimi-Dev,在SWE-bench Verified上取得60.4%成绩,参数量只有72B。该模型采用BugFixer和TestWriter两种角色的结合进行训练,目前权重和代码均已发布。
美国AI公司Anthropic发布新一代编码模型Claude Opus 4和Sonnet 4,性能提升高达10%,在SWE-bench上达到业内最先进水平。模型支持多种模式并能通过扩展接口连接到数据库、API等工具,引发了开发者们的广泛好评。
Mistral发布开源编程模型Devstral,在软件工程任务上超过DeepSeek全家桶和Qwen3 235B。参数仅24B,可在单卡RTX4090甚至32G内存的Mac上运行。
Anthropic 宣布完成35亿美元E轮融资,投后估值达615亿美元。该资金将用于开发下一代AI系统、增强计算能力及深化研究。
Anthropic发布Claude 3.7 Sonnet和配套工具Claude Code,首个集成混合推理能力的AI模型提升了编码效率。Claude Code让开发者能直接在终端完成复杂的编码任务,提升开发速度。
Anthropic 推出 Claude 3.7 Sonnet 混合推理模型,不仅可即时回答问题,还能进行逐步思考。它在编码方面表现出色,并推出代理编程工具 Claude Code。Claude 3.7 Sonnet 的价格与前代相同,适用于免费至企业多个计划。