ICCV 2025|FreeMorph:无需训练、30 秒完成高质量图像 morphing 2025年7月18日23时 作者 极市干货 出 FreeMorph:无需训练、30 秒完成高质量图像 morphing,仅靠改进 Stable
蚂蚁集团开源的Ming-Lite-Omni:多模态大模型的“全能王”,你不可不知! 2025年6月10日14时 作者 小兵的AI视界 -Omni 模型以其强大的多模态感知和生成能力,为 AI 领域带来了新的突破。本文将详细介绍 Min
MiniCPM 4.0 技术报告:端侧速度的奔涌,是模型的自我Rag 2025年6月10日14时 作者 赛博禅心 thub.com/OpenBMB/MiniCPM 作为开源产品,附带了 翔实的技术报告,共 43 页
CVPR 25 全面提升视觉感知鲁棒性,生成模型快速赋能三维检测 2025年5月23日16时 作者 机器之心 院,导师为李镇老师。目前实验室的研究方向包括:自动驾驶、医学成像和分子理解的多模态数据分析和生成等。
ICML 2025 大模型深度思考新范式:交替「推理-擦除」解决所有可计算问题 2025年5月15日23时 作者 机器之心 在 ICML,NeurIPS,ICLR 等顶级会议上发表过论文。 本文提出一个 交替 「推理 – 擦
ICLR 2025 Oral|差分注意力机制引领变革,DIFF Transformer攻克长序列建模难题 2025年4月28日23时 作者 机器之心 建模能力为语言理解与生成带来了前所未有的突破。 然而,随着模型规模的不断扩大和应用场景的日益复杂,传
大模型微调数据生成工具Easy Dataset及KBLaM知识注入框架评析 2025年3月21日14时 作者 老刘说NLP 知识图谱融合大模型的思路。 也就是Easy Dataset大模型微调数据生成工具的三个问题以及大模型
DiffRhythm:10秒生成超燃歌曲,这款AI音乐模型凭啥让音乐创作门槛降为零? 2025年3月11日14时 作者 小兵的AI视界 问世,宛如一把神奇钥匙,打开了音乐创作高效与便捷的全新大门。今天, 我们将深度聚焦一款在业内备受瞩目
CVPR 2025|MambaOut:在视觉任务中,我们真的需要 Mamba 吗? 2025年3月10日23时 作者 极市干货 类中有效地超过了视觉 Mamba 模型 >> 加入极市CV技术交流群,走在计算机视觉的最前沿 本文目
带你从零开始实现一个稀疏专家混合语言模型(MoE模型) 2025年2月25日8时 作者 NLP工程化 Hugging Face博客介绍了如何从零实现稀疏专家混合语言模型(MoE),通过解析代码详解自注意力机制、专家模块等组件。