阿里正式推出 AI 旗舰应用:新夸克告别搜索,成为一个无边界的“AI 超级框”
阿里巴巴推出AI旗舰应用新夸克,基于阿里通义领先的推理及多模态大模型,提供包括AI搜索、写作、生图等在内的All in One的‘AI超级框’服务。
阿里巴巴推出AI旗舰应用新夸克,基于阿里通义领先的推理及多模态大模型,提供包括AI搜索、写作、生图等在内的All in One的‘AI超级框’服务。
今天是2025年02月24日,星期一。文章讨论了mobile agent的思考和开源进展,包括MoE小模型Moonlight-16B-A3B、Qwen2.5-VL及deepseek开源周day1开源FlashMLA等项目。此外还介绍了RAG在写作场景中的应用进展。
VLM-R1 是一个将 DeepSeek R1 方法应用于视觉语言模型的新开源项目,展示了其在稳定性、泛化能力等方面的优越性能,并提供简单易用的训练流程。
划重点:
❶
中国AI团队强势崛起
!
Qwen2.5系列
实现
多模态理解
、
百万字长文本处理
Qwen2.5-VL系列模型已开源,包含3B、7B和72B三个尺寸,支持更长视频理解与实时视频交互能力,表格解析效果显著;数学能力及信息抽取计算功能优秀,社区致力于促进机器学习与自然语言处理学术界、产业界和爱好者之间的交流。
DeepSeek发布新模型Janus-Pro-7B,击败DALL-E 3和Stable Diffusion,在GenEval和DPG-Bench基准测试中表现优异。该模型基于自回归框架设计,采用SigLIP-L视觉编码器进行多模态理解和生成。
阿里巴巴发布新视觉多模态模型Qwen2.5-VL,支持AI Agent功能并能自动化操作电脑、手机。Qwen2.5-VL具备强大的图像识别能力及超长视频理解能力,已在Hugging Face和GitHub开源,并提供在线体验。