新纪录!小米又抛出一个开源模型,在22个公开评测集上实现SOTA,主打声音理解

小米发布MiDashengLM-7B音频模型,通过统一理解语音、环境声与音乐的跨领域能力提高用户场景理解的泛化性。该模型基于公开数据集进行预训练和有监督微调,展示了在多项关键任务上的优势,并支持在边缘设备上部署。

【具身智能】2025长三角(昆山)具身智能产业发展暨开发者大会在昆山成功举办

长三角(昆山)具身智能产业发展暨开发者大会成功举办,400多位专家、企业代表参会。活动包含1场开发者大会、1个应用场景展区、1场研讨会和4场供需对接会,发布了场景应用大赛优胜团队及创新成果,并推动产业从技术研发迈向实践落地。

机器人视觉企业「环视智能」完成千万级天使轮融资

成都环视智能科技有限公司宣布完成千万级天使轮融资,由天润嘉诚和成都高投投资,帕累托森林担任独家融资财务顾问。公司专注于机器人视觉与AI感知技术,致力于为机器人及无人系统提供创新的视觉解决方案。

MLLM集体翻车,缺乏婴儿级常识!业界首个核心认知基准发布,LeCun转赞

新智元报道
编辑:LRST
ICML 2025研究显示大模型在核心常识测试中表现不佳,呼吁建立坚实基础后再谈高级智能。联合团队开源首个CoreCognition基准评测框架,揭示模型缺乏人类婴幼儿就具备的核心知识问题。