ICLR 2025 Oral|差分注意力机制引领变革,DIFF Transformer攻克长序列建模难题 下午11时 2025/04/28 作者 机器之心 建模能力为语言理解与生成带来了前所未有的突破。 然而,随着模型规模的不断扩大和应用场景的日益复杂,传
只需 0.5B 参数,全面覆盖预训练+SFT + RL!极简自回归视觉生成框架SimpleAR 下午11时 2025/04/28 作者 极市干货 的极简自回归视觉生成框架。 >> 加入极市CV技术交流群,走在计算机视觉的最前沿 本文目录 1 Si
提示工程101第五课:少样本学习与上下文学习 上午11时 2025/03/29 作者 PyTorch研习社 本文探讨少样本学习和上下文学习技术,使AI模型仅需少量示例就能完成复杂任务,特别适用于标注数据稀缺场景。
Roblox发布3D智能基础模型Cube,一句话生成游戏资产 下午11时 2025/03/21 作者 机器之心 AI 技术,进一步革新游戏的创作体验。 据了解,曾获选「儿童票选奖最受欢迎游戏」的 Roblox
ICLR 2025 小型AI也能懂人类?中山大学全新方法ADPA让小模型对齐实现大突破! 下午4时 2025/03/19 作者 PaperWeekly 型偏好对齐 背景 在 AI 的世界里,大型语言模型( LLMs )凭借强大的参数量和计算能力,已经能
深度学习的平衡之道:港科大、港城大等团队联合发布多目标优化最新综述 下午4时 2025/03/18 作者 机器之心 生陈巍昱、港城大在读博士生张霄远和港科广在读博士生林百炅为共同第一作者;林熙博士目前担任港城大博士后
ICLR 2025 TUM、北大联合提出ConFIG:迈向无冲突训练的逆梯度方法 下午4时 2025/03/17 作者 PaperWeekly 多个应用场景中,联合优化多个损失项是一个普遍的问题。典型的例子包括物理信息神经网络(Physics-
零基础入门:DeepSeek微调教程来了! 下午2时 2025/02/25 作者 Datawhale 的效果。 微调前: 微调后: 在此处可以看到很明显大模型进行微调后口吻已经发生了更改。据笔者使用下来
社区供稿 | 阶跃星辰开源系列 SOTA 多模态模型,技术详解 下午2时 2025/02/19 作者 Hugging Face 我们深知 AGI 的实现离不开全球开发者的共同努力。 因此开源的初心,是希望跟大家分享最新的技术成
卡内基梅隆大学机器人研究所开发Hamba新模型 实现单视角手部3D形状重建 下午4时 2025/01/25 作者 机器人大讲堂 近年来,随着计算机视觉和图形学领域的快速发展,单视角3D手部重建任务逐渐成为研究热点。该技术在机器人