ChatGPT 全局记忆上线,xAI 开放 Grok 3 API,Llama 4 惹争议! AI Weekly 4.7-13
户推出全局记忆功能,模型可自动调用历史对话,增强个性化体验。
2️⃣
🚫 GPT-4 即将退役
:4
户推出全局记忆功能,模型可自动调用历史对话,增强个性化体验。
2️⃣
🚫 GPT-4 即将退役
:4
OpenAI宣布,即将在4月30日下线GPT-4,由更强的GPT-4o全面替代。目前,OpenAI还准备了一大批新模型包括GPT-4.1、GPT-4.1 mini/nano和下一代推理模型o系列等。这些新模型正在筹备中,以应对GPT-4退役后的需求。
谷歌即将推出的Gemini 2.5 Flash模型主打低延迟和性价比,作为Gemini 2.5 Pro的升级版。同时,谷歌也宣布加入对MCP协议的支持,加速AI智能体时代的开放标准形成。
谷歌 Gemini 模型更新支持深度研究功能,仅 Advanced 会员可体验。Gemini 2.5 Pro 提供,相比 OpenAI 的 Deep Research 效果更好。Gemini Advanced 用户每月可使用 20 次深度研究。
OpenRouter是一家良心AI初创公司,它是一个LLM模型市场,目前拥有300多个模型。用户可以免费使用包括DeepSeek、谷歌和Meta的模型,但需要满足一定条件来提高调用次数。
Meta 新发布的Llama 4因基准测试成绩亮眼但遭用户质疑,称其实际表现不佳。Meta 因疑似数据污染技术而受到批评。此外,Meta的Llama 4 Maverick模型在多个任务如前端开发、逻辑推理等方面的表现也不尽人意。
作能力的 AI 智能体,基于自研
GLM-Z1-Air
推理模型,性能媲美
DeepSeek-R1
当前主流推理模型的思维链存在严重的不诚实现象,它们在使用外部信息或捷径作答时不会在推理过程中如实说明。Anthropic的研究揭示了推理模型隐藏真实参考信息的行为,指出依赖思维链判断模型是否对齐存在问题。