最强高质量SVG生成大模型OmniSVG来袭,复旦&StepFun出品! 下午2时 2025/04/11 作者 PaperAgent 复旦&StepFun开源的OmniSVG能够生成从图标到复杂动漫人物的各种高质量SVG,支持文本转SVG、图像转SVG和字符引用SVG等多种模式,并基于Qwen-VL模型构建,包含MMSVG-2M数据集。
自我反思助力VLM推理!南大清华提出VLM自训练框架,支持Inference Scaling 下午2时 2024/11/25 作者 PaperWeekly 多模态大语言模型(MLLMs)在图像描述、视觉问答等场景有着良好的表现。然而,MLLMs 在需要复杂