MLLM集体翻车,缺乏婴儿级常识!业界首个核心认知基准发布,LeCun转赞
新智元报道
编辑:LRST
ICML 2025研究显示大模型在核心常识测试中表现不佳,呼吁建立坚实基础后再谈高级智能。联合团队开源首个CoreCognition基准评测框架,揭示模型缺乏人类婴幼儿就具备的核心知识问题。
新智元报道
编辑:LRST
ICML 2025研究显示大模型在核心常识测试中表现不佳,呼吁建立坚实基础后再谈高级智能。联合团队开源首个CoreCognition基准评测框架,揭示模型缺乏人类婴幼儿就具备的核心知识问题。
传统心脏MRI可能遗漏风险信号,AI模型MAARS首次实现高精度预测心源性猝死风险,准确率高达89%,有望提高诊断准确性。
新智元报道
莱斯大学、约翰霍普金斯大学以及英伟达的研究人员提出了一种新的AI训练范式ViGaL,通过让7B参数的多模态模型玩简单街机游戏来培养其跨领域的推理能力。研究发现,这种模型不仅在复杂的数学和几何任务上超过了GPT-4o等顶级闭源大模型,还保持了较强的通用视觉能力。
本文介绍了一篇CVPR 2025 Highlight论文《CrossFlow》及其相关工作,该研究提出了一个新的跨模态生成框架,并在多个任务上取得了媲美甚至超越最优算法的性能。
专注于AIGC领域,聚焦大语言模型(LLM)的发展和应用落地。AI Agent平台Hippocratic AI获1.41亿美元B轮融资,估值达16.4亿美元。产品涵盖医疗保健任务,提供定制化解决方案,并通过严格的安全测试认证。
ACL发布了2024年度Fellow名单,包括高剑峰、张民等四位华人学者。其他入选者来自约翰霍普金斯大学、布兰迪斯大学和伦敦玛丽女王大学等机构。