自然语言+数值双反馈碾压传统RL!Critique-GRPO给模型“写批注”提效300%

MLNLP社区是国内外知名的人工智能和技术交流平台,旨在促进机器学习和自然语言处理领域内的学术与产业界的交流合作。近日发布的论文探讨了改进语言模型推理能力的方法,并提出了一种名为Critique-GRPO的技术方案。

苹果重磅论文翻车!被指测试方法有大问题……网友:Cook 该裁员了!

苹果近期发布的关于AI研究的论文因测试方法问题引发吐槽。研究人员发现模型并非因为推理能力不足而失败,而是受限于输出token数量。汉诺塔问题需要大量token才能完成全部解答,导致模型在处理盘子数超过13个时准确率变为0,无法完整输出所有步骤。其他研究者指出,这并非AI本身的问题,而在于实验方法的缺陷。

小红书开源142B参数MoE大模型dots.llm1,AI赋能的Paperless-ngx文档管理工具

本文介绍了五项最新技术项目,包括大规模MoE模型dots.llm1、Paperless-gpt文档管理工具、深度研究报告生成器Open Deep Research MCP Server、多智能体金融交易框架TradingAgents以及零监督多智能体系统设计MAS-Zero。这些项目涵盖了人工智能在不同领域的应用,如语言建模、数据处理、报告生成和智能体协作等。

卧安机器人赴港IPO,目前仍处于亏损状态

卧安机器人成立于2015年,致力于构建智能家庭机器人生态系统。2025年6月8日,该公司向港交所递交上市申请,拟主板挂牌上市。根据弗若斯特沙利文报告,公司是全球最大的AI具身家庭机器人系统提供商之一,并拥有超过269项专利。截至2024年底,公司收入增长49%,毛利率提升至51.7%。然而,高研发支出和对亚马逊渠道的依赖可能影响短期盈利能力。