分享
DeepSeek又开源Janus-Pro,7B多模态强势登顶,OpenAI彻底慌了
DeepSeek开源新一代统一多模态模型Janus-Pro,包含两个尺寸:Janus-Pro-1B和Janus-Pro-7B。该模型在多模态理解和生成方面超越了Meta、Google等知名机构的模型,并改进了训练策略、扩展数据集和扩大模型规模。
组团开源,Qwen2.5-VL转角遇见DeepSeek Janus-Pro!
今天除夕,阿里千问开源了Qwen2.5-VL模型,包含3B、7B和72B三个尺寸,并具有感知丰富世界、作为视觉Agent、理解长视频和捕捉事件、精准的视觉定位及结构化输出等新特性。
炸裂!DeepSeek 的新春礼物——多模态模型Janus-Pro 详解
DeepSeek发布Janus-Pro模型,实现图文理解和图像生成的双面杀手。该模型通过解耦视觉编码路径实现了真正的”一心二用”,并采用统一架构设计、精心训练策略和MIT开源协议。其在理解任务得分0.8和生成质量上碾压DALL-E 3等主流模型。
刚刚!DeepSeek 再发新模型Janus-Pro 7B,统一多模态理解与生成
DeepSeek团队发布创新型多模态框架Janus-Pro,支持384×384图像输入,表现超越现有统一模型,在GenEval和DPG-Bench测试中胜过DALL-E 3和Stable Diffusion。
获奖名单公布!动手学AI辅助编程方向!
AI冬令营第二期获奖名单公布,《动手学AI辅助编程》学习活动圆满结束。Top3奖项、最佳创意奖及应用奖等5项大奖揭晓,涵盖多种创新作品,如老年回忆录撰写助手、教学报告生成方案和情绪支持系统等。
DeepSeek-R1解读:纯强化学习,模型推理能力提升的新范式?
LLM模型通过纯强化学习提升推理能力,并提出无需监督数据的新方法。端侧模型性能提升主要依赖蒸馏而非强化学习,DeepSeek-R1-Zero展示了自我进化能力及语言一致性奖励的应用。