OpenAI深夜发布满血o3和o4mini: 两个没想到
OpenAI发布o3和o4-mini模型,具备连续调用超过600次工具的能力,超越人类工程师。主要特点包括全面工具访问与推理能力、图像推理能力的突破以及主动式工具使用。
OpenAI发布o3和o4-mini模型,具备连续调用超过600次工具的能力,超越人类工程师。主要特点包括全面工具访问与推理能力、图像推理能力的突破以及主动式工具使用。
OpenAI内部已研发出信息流原型,并计划整合图像生成能力。他们希望通过建立自己的社交网络获取海量用户数据,以提升AI模型训练效果。
OpenAI发布GPT-4.1系列新模型,包括Nano、Mini和GPT-4.1。该系列具有更快、更便宜的处理能力,尤其是GPT-4.1 Nano成为最快的最便宜模型之一。更新的核心是代码能力和指令遵循改进,以及强大的视觉理解能力。
Google DeepMind 为了阻止员工跳槽到竞争对手公司,提出了一年‘花园假期’的政策。员工在此期间可以继续领取工资,但必须同意不得加入任何对手企业。这一举措让不少员工感到不便,尤其是在快速发展的 AI 行业中。
著名 AI 大牛安德烈·卡帕西的文章指出大语言模型(LLM)颠覆了技术普及的传统模式,普通人成为最早受益者。他分析了“万金油”与“专家团”、简单粗暴与精耕细作、灵活小船与笨重大船的不同,解释了为何 LLM 在企业和政府中的应用相对缓慢。
一篇来自‘一亩三分地’论坛的帖子爆料称Meta的新大模型Llama 4训练效果未达开源SOTA基准,公司采取混入测试集数据以满足目标的做法引发争议。此外,TechCrunch质疑Meta在LM Arena排行榜上提交的版本可能与公开版不同,并认为这种行为可能误导开发者。
Meta发布了Llama 4系列首批模型,采用混合专家架构并支持多模态训练。推出了性能最强的小尺寸模型Scout、同级别最佳的Maverick以及正在开发中的Behemoth预览版。Llama 4 Scout和Maverick均支持高性能低成本比,实现了业界领先的1000万+ Token 多模态上下文窗口,并提供了智能调参技术和后训练策略优化。