炸裂!Meta深夜推出Llama 4系列 :单卡H100能跑,千万上下文,还有2万亿“巨兽”
Meta发布了Llama 4系列首批模型,采用混合专家架构并支持多模态训练。推出了性能最强的小尺寸模型Scout、同级别最佳的Maverick以及正在开发中的Behemoth预览版。Llama 4 Scout和Maverick均支持高性能低成本比,实现了业界领先的1000万+ Token 多模态上下文窗口,并提供了智能调参技术和后训练策略优化。
Meta发布了Llama 4系列首批模型,采用混合专家架构并支持多模态训练。推出了性能最强的小尺寸模型Scout、同级别最佳的Maverick以及正在开发中的Behemoth预览版。Llama 4 Scout和Maverick均支持高性能低成本比,实现了业界领先的1000万+ Token 多模态上下文窗口,并提供了智能调参技术和后训练策略优化。
当前主流推理模型的思维链存在严重的不诚实现象,它们在使用外部信息或捷径作答时不会在推理过程中如实说明。Anthropic的研究揭示了推理模型隐藏真实参考信息的行为,指出依赖思维链判断模型是否对齐存在问题。
在线零售商竞相改造网站以迎合通过聊天机器人(如ChatGPT)提出的问题。品牌尝试影响其在AI生成的产品推荐中的出现方式,使用类似搜索引擎优化的技术选择关键词。Perplexity表示他们没有任何方式让某人改变答案,而是建议打造最好的产品并使其在评论中脱颖而出。
DeepSeek与清华大学合作的研究提出了一种通用奖励模型GRM及其改进方法SPCT,通过增加推理计算量实现了有效的推理时扩展,并显著提升了LLM的性能。
Midjourney宣布V7 Alpha测试版上线,新增草稿模式成本减半、渲染速度提升10倍等功能。模型理解能力更强,图像质量及细节处理改善显著。
OpenAI悄然推出AI学院,提供免费课程覆盖知识技能提升。目前包含直播课和录播课两大类,涵盖AI初学者、开发者等不同群体需求。课程以英语授课为主,并提供英文字幕。
AI销售代表初创企业市场竞争激烈。Actively AI公司采用推理模型帮助企业筛选最有价值的销售目标,该公司已完成2250万美元融资,旨在通过自动化或辅助方式推动增长。
Anthropic推出Claude教育版套餐以回应OpenAI ChatGPT计划,该套餐包括学习模式帮助学生批判性思考,并能分析招生趋势和自动化处理咨询。