全网实测案例大全:GPT-5 上线,所有用户免费可用
万众期待的GPT-5终于发布,它是迄今为止最强的模型,在多个维度都达到了顶尖水准。最大亮点是统一智能系统和四种预设性格,OpenAI也将作为ChatGPT的默认模型逐步开放给所有人。GPT-5在编程测试、幻觉问题等方面表现优异,并推出Pro和Plus两种付费版本。
万众期待的GPT-5终于发布,它是迄今为止最强的模型,在多个维度都达到了顶尖水准。最大亮点是统一智能系统和四种预设性格,OpenAI也将作为ChatGPT的默认模型逐步开放给所有人。GPT-5在编程测试、幻觉问题等方面表现优异,并推出Pro和Plus两种付费版本。
OpenAI发布GPT-4.1系列新模型,包含多模态能力并提升多项性能指标。相比GPT-4o,GPT-4.1在指令跟随、编码和图像理解方面表现更优,并且价格更具竞争力。
Kimi团队发布开源的Kimi-VL和Kimi-VL-Thinking多模态模型,参数量分别为28亿激活参数和2.8B。模型在多个基准测试中表现出色,并采用MoE架构提高效率。
百度发布文心大模型4.5和X1,价格分别为0.004/0.016元/千tokens和0.002/0.008元/千tokens。文心4.5在多模态任务上表现优异,而文心X1能自主运用工具并具备更强的理解、规划、反思能力。
作者发布了一篇关于QwQ-Max-Preview推理模型的文章,这是继QwQ-32B-Preview之后通义千问团队推出的又一新模型。文章介绍了该模型的基础模型为Qwen2.5-Max,并展示了其在编程、数学等任务中的强大表现。
芜湖!机器人开始走出实验室,走进家庭,能做家务了。Figure的最新研究成果——视觉-语言-动作(VLA)模型Helix,让两台搭载该模型的机器人共享同一智能大脑,通过自然语言指令进行分工合作。
谷歌三位CEO联合宣布Gemini 2.0 Flash发布,性能超越Gemini 1.5 Pro,并在多模态能力上表现出色。但在经典题目的推理和编程能力测试中表现一般,实测结果引人思考。