洛图科技:预计2025年智能眼镜销量将突破100万台,同比增长约130%

智能眼镜中国市场2024年销量同比增长36.5%,预计2025年突破100万大关。增长因素包括AI技术、品牌产品推新和国补政策。主要细分市场为音频眼镜、拍摄眼镜、分体式AR眼镜和一体式AR眼镜,不同类型的智能眼镜有不同定位。

多模态模型学会“按需搜索”,少搜30%还更准!字节&NTU新研究优化多模态模型搜索策略

字节及南洋理工大学联合研究,提出一种基于强化学习的多模态模型自主搜索训练方法,在视觉问答任务中显著提升性能,减少约30%的搜索次数。

Google线下AI工作坊、AI硬件开发大赛,7月不可错过的AI活动!

2025年活动推荐,包括Google联合举办的AI工作坊、人工智能硬件科创大赛等。其中「从模型到行动」系列AI工作坊将在深圳、上海、北京三地举办;外滩大会组委会与将门创投发起的人工智能硬件科创大赛提供30万奖金吸引优秀团队参赛。

突破全模态AI理解边界:引入上下文强化学习,赋能全模态模型“意图”推理新高度

阿里巴巴通义实验室团队推出的HumanOmniV2,强调模型必须对多模态输入有全局上下文理解的基础上进行推理,解决了现有模型存在的全局理解不足和捷径问题。通过引入强化学习方法、多维度奖励机制等手段提升模型的复杂逻辑推理能力,并构建了高质量数据集与评测基准,最终在多个全模态基准测试中取得了最佳性能。

阿里多模态推理模型开源!精准捕捉视频隐藏信息,三大杀手锏让AI更懂“人情世故”

阿里通义实验室开源多模态推理模型HumanOmniV2,通过引入强制上下文总结机制、大模型驱动的多维度奖励体系以及基于GRPO的优化训练方法,实现对多模态信息全面理解。HumanOmniV2在633个视频和2689个问题的评测基准IntentBench上准确率达到69.33%。