跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

计算效率

无需CUDA代码给H100加速33%-50%,Flash Attention作者新作火了

2025年7月11日16时 作者 量子位

!
Flash Attention、Mamba作者之一
Tr
i Da
o
的新作火了。
他和两位

分类 资讯 标签 CuTe内核、 GPU内存性能、 Transformer操作、 灵活性、 自动化流程、 计算效率 发表评论

ICML 2025 打破残差连接瓶颈,彩云科技&北邮提出MUDDFormer架构让Transformer再进化!

2025年6月27日23时 作者 机器之心

,彩云科技CEO袁行远。
残差连接(residual connections)自何恺明在 2015

分类 学术、 资讯 标签 MUDDFormer、 Transformer架构、 上下文学习能力、 注意力激活比例、 自然语言处理、 计算效率 发表评论

算力终结者来了!华人天团「降维打击」注意力瓶颈,AI狂飙进对数时代

2025年6月8日23时 作者 新智元

enwick树分段,用掩码矩阵,让注意力焕发对数级效率。更厉害的是,它无缝对接线性注意力家族,Mam

分类 资讯 标签 Able-2025、 块间计算、 多任务验证、 线性注意力模型、 自适应λ项参数化、 计算效率 发表评论

专治AI生图「人脸崩坏」,8倍速碾压GPT!新版FLUX.1多方位刷新SOTA

2025年5月30日16时 作者 新智元

到图像生成的新一代模型,支持文本与图像提示,角色一致性强,速度快达GPT-Image-1的8倍。
用

分类 资讯 标签 Flux.1、 KontextBench、 多轮编辑、 统一架构、 计算效率、 风格参考 发表评论

GPT-4o图像生成的「核燃料」找到了!万字长文拆解潜在变量,网友:原来AI在另一个维度作画

2025年5月6日16时 作者 机器之心

成功能爆火,掀起了以吉卜力风为代表的广泛讨论,生成式 AI 的热潮再次席卷网络。
而在这股浪潮背后,

分类 学术、 资讯 标签 似然值、 潜在空间、 生成模型、 端到端学习、 计算效率、 高分辨率 发表评论

深入分析 Llama 4 最新架构

2025年4月22日14时 作者 机器学习算法与自然语言处理

业研究人员。
社区的愿景
是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进

分类 学术 标签 Meta、 MoE架构、 多模态、 文本摘要、 计算效率、 高质量数据 发表评论

Attention is NOT all you need!这个「去Transformer」的玩意直接把我整懵了!

2025年3月25日16时 作者 AGI Hunt

就训练出
一个
完全不用Transformer注意力
的
72B大模型,性能竟超越GPT 3.5?!

分类 分享 标签 FFN/MLP架构、 Qwerky-72B、 RWKV架构、 多语言处理、 数据独立性、 计算效率 发表评论

英伟达全力发展AI Agent!开源专属大模型,最强AI工厂

2025年3月19日8时 作者 AIGC开放社区

英伟达在GTC 2025大会上发布专用于AI Agent的Llama Nemotron模型,并推出了性能更强的Blackwell Ultra AI工厂。

分类 资讯 标签 agent、 Llama Nemotron、 甲骨文、 英伟达、 计算效率、 黑尔韦尔Ultra 发表评论

可视化图解MOE大模型的7个核心问题:专家、路由、负载均衡及其用于视觉模态

2025年3月2日19时 作者 老刘说NLP

,可视化图解moe讲的挺不错,转载过来并做翻译,当作记录,值得收藏慢慢看。
原文在:https://

分类 大模型 标签 MoE、 文本、 稀疏参数、 老刘、 视觉、 计算效率 发表评论

刚刚,GPT-4.5震撼上线情商逆天!OpenAI最大最贵模型最像人类,奥特曼带娃缺席

2025年2月28日8时 作者 新智元

上线了!它并不是推理模型,但是规模最大、知识最丰富,最鲜明的特点就是情商高、很类人。Pro版用户和付

分类 资讯 标签 GPT-4.5、 物理模拟、 社交应用、 视觉处理、 计算效率、 音乐推荐 发表评论
较早文章
页面1 页面2 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Kiro:从原型到生产的智能开发助理
  • Agentic-R1 推理新范式,融合多策略蒸馏,实现高效工具链长链推理
  • Amazon Bedrock AgentCore:加速 AI 代理商用部署的企业级基础设施
  • 一款新出的多智能体构建系统:CommonGround
  • 刚刚,Sam Altman宣布:GPT-5即将发布

2025 年 7 月
一 二 三 四 五 六 日
 123456
78910111213
14151617181920
21222324252627
28293031  
« 6 月    

归档

  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×