跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

上下文长度扩展

AI Agent 发展史:从 RL 驱动到大模型驱动 |AIR 2025

2025年3月19日23时 作者 极市干货

沿研究中一窥复制 Manus 的启示。
>>
加入极市CV技术交流群,走在计算机视觉的最前沿
Man

分类 学术 标签 Qwen、 Trunk Attention、 上下文长度扩展、 林俊旸、 生成能力、 通义千问 发表评论

全新注意力机制!华为诺亚提出ESA:高效选择注意力架构

2025年2月25日23时 作者 极市干货

活高效地选择关键 token 进行注意力计算,大幅度降低了 LLMs 在处理长文本时的计算负担,且在

分类 学术 标签 ESA、 上下文长度扩展、 低维表征、 灵活token选择、 软硬件协同优化、 高效选择性注意力 发表评论

AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Replit CEO访谈:裁掉一半员工,豪赌AI,9个月收入翻10倍
  • ICCV2025破解安防行为识别困局:从“找谁”到“在干嘛”,带来智能守护新可能
  • DeepMind率先拿下IMO金牌,却被OpenAI 抢先发布了……
  • 从 n8n 到 Claude Code:我试了 10 类爆火 AI 工具,发现不用融资也能干正事
  • 大模型再爆弱点!旧记忆忘不掉,新记忆分不出,准确率暴降 ICML’25

2025 年 7 月
一 二 三 四 五 六 日
 123456
78910111213
14151617181920
21222324252627
28293031  
« 6 月    

归档

  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×