日期: 2025 年 2 月 8 日
OpenAI Deep Research“被开源”:24小时成功复现,揭秘背后技术细节
用代码表示Agent行动显著提升OpenAI Deep Research系统性能,Hugging Face团队复现时采用代码Agent框架,使验证集准确率从46%提升至55.15%,未来可扩展更多文件格式和处理建议。
图像生成迎来CoT时刻!港中文首次提出文生图的o1推理和Inference Scaling新范式!
论文提出通过CoT推理策略提高图像生成质量的研究,提出了PARM和PARM++两种奖励模型,实验结果显示其在GenEval指标上性能显著提升。
新增AI Agent,GitHub Copilot重大更新,超强自动化编程
GitHub发布了两款新Agent——Copilot Agent模式和Project Padawan预览版,前者能自动检查并修复代码问题,后者则帮助开发者完成从生成到审查的开发流程。同时介绍Copilot Edits的新功能使多文件修改更为方便快捷。
Pika新功能发布,一秒钟把你丢进任何电影。
Pika新上线的Pikadditions功能强大,用户可以将自己或喜欢的内容轻松融入到电影场景中。该功能易于使用,并且具有多种应用场景。虽然存在一些技术限制,但其作为社交媒体工具的表现已经非常出色。
落地角度看think推理类大模型的技术优缺点及潜在风险:老刘说NLP技术社区第37讲精彩回顾
今天是2025年02月08日,星期六。老刘在NLP技术社区分享了关于Deepseek R1类推理大模型的习得过程、认知误区、场景机会及技术风险等内容,强调需从落地角度看问题,并提醒避免空谈和偏见。
KG+LLM+RAG+文档智能技术及落地:老刘说NLP技术社区对外纳新
老刘说NLP技术社区自建立以来围绕大模型、知识图谱、RAG和文档智能等主题发布每日早报、线上交流活动分享、专题报告等内容,欢迎加入。