深度网页探索+自主写作:WebThinker让大模型像人类一样完成研究报告
WebThinker 是一个开源框架,由中国人民大学自然语言处理实验室推出。它使大型推理模型能够自主进行科研,解决传统模型局限性,支持复杂问题解决和科研写作。
WebThinker 是一个开源框架,由中国人民大学自然语言处理实验室推出。它使大型推理模型能够自主进行科研,解决传统模型局限性,支持复杂问题解决和科研写作。
GPT-4.1已正式加入ChatGPT,用户可免费使用。该模型专为编码任务设计,推理效率高,速度比其他模型快。此外,GPT-4.1在验证SWE-bench任务上得分为54.6%,较前一代有显著提升。不过,免费用户仍无法手动切换模型,对此OpenAI表示将考虑用户建议。
OpenAI宣布GPT-4.1现在可在ChatGPT中直接使用,它在编码任务和指令遵循方面表现优秀。不过,许多用户对缺少1M上下文版本表示失望。
今天凌晨
1点30,
OpenAI宣布开放GPT-4.1,在ChatGPT中使用。最大亮点是支持100万tokens上下文。
在编码能力测试中,GPT-4.1系列准确率达到55%,较GPT-4o提升一倍。
价格方面,相比GPT-4o降低26%,最小、最快且最便宜的模型每百万token成本仅为12美分。
OpenAI CEO奥特曼在’AI Ascent 2025’活动中透露,未来AI模型将覆盖用户一生的数据,实现个性化推理,并设想开发核心AI订阅服务。他称这为柏拉图式理想,并提到目前处于‘PPT’阶段。
最近的大语言模型在数学和编程等领域展示了强大的推理能力,通过强化学习使用思维链逐步分析问题。本文介绍了一种新的方法将这种策略应用于图片生成任务中,提出了两种不同的层次的思维链(CoT):Semantic-CoT负责设计图像的整体结构,而Token-CoT则专注于逐块生成细节。通过使用强化学习优化这两个层次的CoT,并引入多个视觉专家模型作为奖励模型来评估生成的图片质量,最终提出了一种新的文生图模型T2I-R1,显著提高了模型生成符合人类期望的结果的能力。
Harvey 成为 OpenAI 后备,宣布将采用 Anthropic 和谷歌的基础模型。此举显示 Harvey 内部基准测试结果显示不同基础模型在法律任务上表现各异。
2025年春季AI模型使用趋势报告显示,DeepSeek R1的使用率大幅下降超过50%,OpenAI在新功能推出后迅速增长。文本领域中,GPT-4.1和Gemini 2.5 Pro表现优异;视频生成方面,Kling-2.0-Master迅速崛起;推理模型方面,Poe订阅者使用Gemini 2.5 Pro比例增加;图像生成市场激烈竞争;音频转文本(TTS)领域ElevenLabs保持主导地位。
文章介绍了不同年龄层的人使用ChatGPT的不同方式,指出大学生将其视为生活操作系统的背后反映的AI与人类交互模式的重大转变。作者引用了OpenAI CEO的观点,并探讨了这种趋势引发的隐私和安全问题。
美国AI搜索引擎初创公司Perplexity接近完成一轮5亿美元融资,估值达140亿美元。该轮融资由风险投资机构Accel领投,展示了强劲的发展势头和对谷歌的潜在挑战。