跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

自注意力机制

ICCV 2025|FreeMorph:无需训练、30 秒完成高质量图像 morphing

2025年7月18日23时 作者 极市干货

出 FreeMorph:无需训练、30 秒完成高质量图像 morphing,仅靠改进 Stable

分类 学术 标签 FreeMorph、 PSNR、 SSIM、 医疗图像分析、 自注意力机制、 鲁棒性 发表评论

蚂蚁集团开源的Ming-Lite-Omni:多模态大模型的“全能王”,你不可不知!

2025年6月10日14时 作者 小兵的AI视界

-Omni
模型以其强大的多模态感知和生成能力,为
AI
领域带来了新的突破。本文将详细介绍
Min

分类 开源 标签 Hugging Face、 Ming-Lite-Omni、 ModelScope、 Transformer、 交叉注意机制、 自注意力机制 发表评论

MiniCPM 4.0 技术报告:端侧速度的奔涌,是模型的自我Rag

2025年6月10日14时 作者 赛博禅心

thub.com/OpenBMB/MiniCPM
作为开源产品,附带了
翔实的技术报告,共 43 页

分类 分享 标签 CPM.cu、 MiniCPM4、 参数量化、 稀疏性、 自注意力机制、 草稿模型 发表评论

CVPR 25 全面提升视觉感知鲁棒性,生成模型快速赋能三维检测

2025年5月23日16时 作者 机器之心

院,导师为李镇老师。目前实验室的研究方向包括:自动驾驶、医学成像和分子理解的多模态数据分析和生成等。

分类 学术、 资讯 标签 DriveGEN、 优化项、 泛化性能、 自动驾驶、 自注意力机制、 视觉三维检测 发表评论

ICML 2025 大模型深度思考新范式:交替「推理-擦除」解决所有可计算问题

2025年5月15日23时 作者 机器之心

在 ICML,NeurIPS,ICLR 等顶级会议上发表过论文。
本文提出一个
交替
「推理 – 擦

分类 学术、 资讯 标签 PENCIL模型、 上下文长度、 图灵完备、 思考-总结、 状态转移模拟、 自注意力机制 发表评论

ICLR 2025 Oral|差分注意力机制引领变革,DIFF Transformer攻克长序列建模难题

2025年4月28日23时 作者 机器之心

建模能力为语言理解与生成带来了前所未有的突破。
然而,随着模型规模的不断扩大和应用场景的日益复杂,传

分类 学术、 资讯 标签 DIFF Transformer、 噪声抵抗、 多任务学习、 差分注意力、 文本处理、 自注意力机制 发表评论

大模型微调数据生成工具Easy Dataset及KBLaM知识注入框架评析

2025年3月21日14时 作者 老刘说NLP

知识图谱融合大模型的思路。
也就是Easy Dataset大模型微调数据生成工具的三个问题以及大模型

分类 大模型 标签 Easy Dataset、 KBLaM、 大模型、 微调、 知识库、 自注意力机制 发表评论

DiffRhythm:10秒生成超燃歌曲,这款AI音乐模型凭啥让音乐创作门槛降为零?

2025年3月11日14时 作者 小兵的AI视界

问世,宛如一把神奇钥匙,打开了音乐创作高效与便捷的全新大门。今天,
我们将深度聚焦一款在业内备受瞩目

分类 开源 标签 DiffRhythm、 Hugging Face库、 个性化定制、 分块解码技术、 自注意力机制、 预训练模型 发表评论

CVPR 2025|MambaOut:在视觉任务中,我们真的需要 Mamba 吗?

2025年3月10日23时 作者 极市干货

类中有效地超过了视觉 Mamba 模型
>>
加入极市CV技术交流群,走在计算机视觉的最前沿
本文目

分类 学术 标签 Vision Transformer、 双向循环神经网络、 并行化操作、 线性复杂度自注意力、 自注意力机制、 长文档处理能力 发表评论

带你从零开始实现一个稀疏专家混合语言模型(MoE模型)

2025年2月25日8时 作者 NLP工程化

Hugging Face博客介绍了如何从零实现稀疏专家混合语言模型(MoE),通过解析代码详解自注意力机制、专家模块等组件。

分类 开源 标签 Hugging Face、 Top-k 门控、 专家模块、 深度学习、 自注意力机制、 自然语言处理(NLP) 发表评论
较早文章
页面1 页面2 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Replit CEO访谈:裁掉一半员工,豪赌AI,9个月收入翻10倍
  • ICCV2025破解安防行为识别困局:从“找谁”到“在干嘛”,带来智能守护新可能
  • DeepMind率先拿下IMO金牌,却被OpenAI 抢先发布了……
  • 从 n8n 到 Claude Code:我试了 10 类爆火 AI 工具,发现不用融资也能干正事
  • 大模型再爆弱点!旧记忆忘不掉,新记忆分不出,准确率暴降 ICML’25

2025 年 7 月
一 二 三 四 五 六 日
 123456
78910111213
14151617181920
21222324252627
28293031  
« 6 月    

归档

  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×