接棒DeepSeek!阿里千问宣布开源百万Token上下文模型:主打闪电般的推理「附送详细技术报告」
阿里通义千问团队推出Qwen2.5-1M开源模型,支持百万Token上下文长度,并带来闪电般快速的推理框架。
阿里通义千问团队推出Qwen2.5-1M开源模型,支持百万Token上下文长度,并带来闪电般快速的推理框架。
AI视频生成模型通义万相2.1成功制作出多个复杂汉字、英文单词以及包括‘摸鱼一天 快乐无边’、中世纪真人写实风动画等在内的多种风格的视频内容。通过采用VAE与DiT架构协同发力、超长序列训练上的突破和数据与评估双轮驱动的技术创新,实现了对无限长1080P视频的高效编解码,并在视觉质量和运动质量方面提升模型性能。
零一万物因现金流压力和核心人员出走被迫退出预训练团队,转而将业务重心转向C端应用。阿里云收购了零一万物的预训练团队,零一万物则将更多精力投入AI产品的落地。对于大模型公司而言,被大厂收购或成为其最好的结局。
阿里云、字节跳动等纷纷推出视觉理解模型降价策略,其中阿里云Qwen-VL-Plus降价81%,一元钱可处理600张720P图片,意在推动应用生态发展及吸引客户使用云计算服务。
阿里云与零一万物达成战略合作,共同加速产业大模型落地。双方将在技术、业务和人才等多个领域展开合作,推动从下一代基座模型技术探索到产业落地的大模型服务组合。
大模型多模态发展加速,阿里云通义千问发布首个开源多模态推理模型QVQ-72B-Preview。QVQ展示出色视觉理解和推理能力,在视觉推理领域达到前沿水平。
AI Coding赛道迎来新风向,TikTok算法负责人陈志杰计划离职创业聚焦于此。目前该领域已有多个创业项目,包括Devin、Cursor和OpenAI o1等产品在海外取得成功。国内企业如阿里云和字节跳动也推出了相关产品,并有大量投资人看好其出海前景。