OpenAI紧急加播:ChatGPT上新深度搜索,刷榜“人类最后的考试”!
OpenAI发布Deep Research功能,利用强化学习和深度搜索技术为用户提供复杂研究任务辅助。该功能在金融、科学及工程等领域具有强大能力,支持用户上传文件并生成多页研究报告。OpenAI表示Deep Research旨在促进AGI的科研探索,并强调其在特定领域的详细信息处理优势及局限性。
OpenAI发布Deep Research功能,利用强化学习和深度搜索技术为用户提供复杂研究任务辅助。该功能在金融、科学及工程等领域具有强大能力,支持用户上传文件并生成多页研究报告。OpenAI表示Deep Research旨在促进AGI的科研探索,并强调其在特定领域的详细信息处理优势及局限性。
英伟达新硬件优化论文《DeepSeek-V3》绕过CUDA直接使用PTX编程语言进行优化,大幅提升硬件效率。专家指出这不代表完全脱离CUDA生态,而是展示出优化其他GPU的能力,并引发了对AI是否能编写底层代码的讨论。
杭州阿里云发布新春节礼大模型Qwen2.5-Max,其在多个基准测试中表现优于DeepSeek V3等模型。Qwen2.5-Max具备超大规模MoE模型特性和多模态能力展示功能。
文章介绍了百度文心一言的大模型RAG技术,通过检索增强生成方式让AI在作答时更准确、丰富且有态度。实测显示其能精准回答复杂问题,并保持客观性。文章强调了RAG技术对大模型输出结果的影响及其重要性。
OpenAI的新研究展示了通过增加推理时的计算量来提升模型对抗性稳健性的潜力,这一发现可能缓解外界对Agent能力增强后面临安全风险的担忧。
DeepSeek-R1模型引发广泛关注,成本从数十万到几百元不等。其表现超越多种榜单和测试任务,包括LiveBench和PlanBench,在公开数据上甚至超过GPT-4和Gemini Flash。同时引发了关于构建新平台强化微调的兴趣。
Anysphere公司最新完成1.05亿美元B轮融资,Cursor编辑器使用量巨大。Cursor通过接入Claude 3.5 Sonnet模型和推出专用于编辑代码的Apply Model等措施,成功吸引用户并改变了程序员编程方式。AI Coding创业热潮兴起,多位字节前员工参与相关创业活动。