自然语言+数值双反馈碾压传统RL!Critique-GRPO给模型“写批注”提效300%

MLNLP社区是国内外知名的人工智能和技术交流平台,旨在促进机器学习和自然语言处理领域内的学术与产业界的交流合作。近日发布的论文探讨了改进语言模型推理能力的方法,并提出了一种名为Critique-GRPO的技术方案。

16年磨一剑!三位图灵奖大咖力荐的深度学习书有中文版了!

一本好的教材兼具体量恢弘与思想深邃,《深度学习:基础与概念》就是这样的一本经典入门书籍,作者Christopher M.Bishop长期深耕人工智能领域,并获得多位AI领域的重量级专家推荐。

开源智能助手II-Agent,字节跳动开源的多模态基础模型BAGEL

II-Agent是开源智能助手,旨在简化跨领域工作流程。BAGEL是字节跳动的多模态基础模型,擅长图像理解、生成和编辑任务。Gmail AutoAuth MCP Server简化了Claude与Gmail的交互方式。AingDesk是一款简单易用的AI助手,支持知识库、模型API和智能代理等功能。Crawl4AI RAG MCP Server提供网页抓取和RAG能力,为AI代理和编码助手提供了高级功能。

57.6万代码撕碎AI编程神话,20%「幽灵包」暗藏漏洞!苹果、微软已中招

最新研究发现,超过20%的AI生成代码依赖不存在的软件包。扎克伯格和微软首席技术官都预估未来大部分AI代码将由智能体生成,但实际使用中可能引发安全问题,如供应链攻击。研究人员利用16种主流大型语言模型生成57.6万个样本发现有44万个依赖项是幻觉产物,对软件供应链构成威胁。