首例!苹果竟被AI大模型Claude写论文驳斥:思考幻觉的幻觉!

上周苹果因发布关于推理大模型的研究观点而引起巨大讨论:尽管LRMs具备复杂自我反思机制,但在问题复杂性超过一定阈值时会完全崩溃。苹果反驳称实验设计选择而非模型本身局限性导致失败。

12.6k,谷歌这个开源项目炸了,全栈AI Agent

Gemini Fullstack LangGraph Quickstart项目两周内获得12.6k star。该项目使用React前端和LangGraph代理的全栈应用程序进行高级研究和会话式AI支持,通过动态生成搜索词、Google Gemini模型及网络研究发现知识差距,并改进搜索直至提供包含引文的答案。

ACL’25 多智能体叛变进行中?首个多智能体安全守卫G-Safeguard亮相!

论文提出了一种名为G-Safeguard的安全防护框架,旨在保护基于大型语言模型的多智能体系统免受攻击。该框架利用图神经网络实时监控和识别异常行为,并通过拓扑干预阻断恶意信息传播。

集齐Agent、KG、多模态的AFAC金融智能创新大赛来袭

AFAC2025金融智能创新大赛由上海市科学技术委员会指导,联合20多家顶尖高校、学术机构和企业举办。赛事涵盖算法、创意开发及应用两个赛题方向,提供百万奖金池和行业扶持。大赛聚焦人工智能和大模型技术在金融领域的应用,并设有挑战组和初创组两个赛道。