全网实测案例大全:GPT-5 上线,所有用户免费可用
万众期待的GPT-5终于发布,它是迄今为止最强的模型,在多个维度都达到了顶尖水准。最大亮点是统一智能系统和四种预设性格,OpenAI也将作为ChatGPT的默认模型逐步开放给所有人。GPT-5在编程测试、幻觉问题等方面表现优异,并推出Pro和Plus两种付费版本。
news
万众期待的GPT-5终于发布,它是迄今为止最强的模型,在多个维度都达到了顶尖水准。最大亮点是统一智能系统和四种预设性格,OpenAI也将作为ChatGPT的默认模型逐步开放给所有人。GPT-5在编程测试、幻觉问题等方面表现优异,并推出Pro和Plus两种付费版本。
日注定会成为AI技术和商业竞争格局演变里重要的一个时刻。
同一天,Google先扔出了Genie 3
谷歌DeepMind发布Genie 3通用世界模型,能实时生成720p画面且一致性高。支持即时交互、物理模拟及自然系统生成等能力。
谷歌DeepMind发布新一代通用世界模型Genie 3,支持720P画质、每秒24帧实时导航和分钟级一致性保持。Tejas Kulkarni体验后评价其通用性强且能学习物理特性。Genie 3现已以研究预览形式发布,并展示在雅典风格建筑中漫步的场景画面中物体能够保持一致。
谷歌DeepMind发布的Genie 3是首个支持实时交互的通用世界模型,能生成逼真、一致的720p分辨率3D环境,支持天气变化和新角色操作,并用于测试未来Agent训练兼容性。但目前仍存在行动空间有限、与其他Agent交互复杂、无法精确模拟真实位置等局限性。
硅谷三巨头同日发布新模型,OpenAI开源两款参数量接近o4-mini的GPT-oss模型;DeepMind推出Genie3世界模型实现实时交互和高一致性场景;Anthropic发布Claude Opus 4.1,提升智能体任务及编程能力。
Anthropic发布Claude Opus 4.1,编程性能提升74.5%,在SWE-bench上超越Gemini 2.5 Pro和o3。客户反馈表示Opus 4.1能精准定位修复代码bug,模型无害回复回应率达到99.06%。
北大团队发表综述《Towards Efficient Privacy-Preserving Machine Learning》,系统梳理隐私保护机器学习领域的协议、模型和系统优化,提出跨层次协同设计与优化的重要性。
新智元报道,OpenAI、谷歌和Anthropic发布不同模型。Anthropic发布Claude Opus 4.1,在编码性能和功能上有所提升。对比测试中Claude Opus 4.1表现优于Gemini-2.5-pro等模型,但需谨慎使用较弱的OpenAI-OSS-120B。