MLLM集体翻车,缺乏婴儿级常识!业界首个核心认知基准发布,LeCun转赞

新智元报道
编辑:LRST
ICML 2025研究显示大模型在核心常识测试中表现不佳,呼吁建立坚实基础后再谈高级智能。联合团队开源首个CoreCognition基准评测框架,揭示模型缺乏人类婴幼儿就具备的核心知识问题。

沉迷贪吃蛇,7B小模型竟变身「数学天才」!几何推理碾压GPT-4o

新智元报道
莱斯大学、约翰霍普金斯大学以及英伟达的研究人员提出了一种新的AI训练范式ViGaL,通过让7B参数的多模态模型玩简单街机游戏来培养其跨领域的推理能力。研究发现,这种模型不仅在复杂的数学和几何任务上超过了GPT-4o等顶级闭源大模型,还保持了较强的通用视觉能力。

医疗AI Agent独角兽Hippocratic,获10亿元融资

专注于AIGC领域,聚焦大语言模型(LLM)的发展和应用落地。AI Agent平台Hippocratic AI获1.41亿美元B轮融资,估值达16.4亿美元。产品涵盖医疗保健任务,提供定制化解决方案,并通过严格的安全测试认证。