跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

PaperWeekly

RoPE是长度外推之光,还是频谱灾难?真相埋在傅里叶里

2025年8月4日23时 作者 PaperWeekly

com/p/14369935885
现在开源社区对 RoPE 的评价是两种一边倒,要么只褒,要么只贬

分类 大模型、 学术 标签 AI领域、 PaperWeekly、 分享、 前沿动态、 点赞、 社区 发表评论

ICML 2025 Transformer还有救?魔改残差连接,MUDDFormer硬刚超深网络

2025年7月21日16时 作者 PaperWeekly

不太可能了。
但是总有人愿意打破常规,最近一篇 ICML 2025 的论文,又让 Transform

分类 大模型、 学术 标签 PaperWeekly、 学术交流、 深度学习、 研究成果分享、 自然语言处理、 计算机视觉 发表评论

面壁“小钢炮”登上Nature子刊,8B多模态综合性能超越GPT-4V、Gemini Pro

2025年7月18日16时 作者 PaperWeekly

》正式刊登了来自清华、面壁等研究团队联合研发的高效端侧多模态大模型 MiniCPM-V 核心研究成果

分类 大模型、 学术 标签 markdown、 PaperWeekly、 原创作品、 投稿专栏、 未发表过、 清晰图片 发表评论

语料一变就崩?EraRAG首创“增量语义图”,动态语料场景下也能稳准快

2025年7月16日12时 作者 PaperWeekly

多跳推理与深层理解的关键路径。
然而,现有的 Graph-RAG 方法普遍建立在静态语料假设之上,一

分类 大模型、 学术 标签 PaperWeekly、 技术种类、 点赞、 观点、 转发、 阅读 发表评论

SFT+RL双阶训练突破LLM自我监督!人大DeepCritic实现AI批判自主进化

2025年6月8日8时 作者 PaperWeekly

nguage Models
论文链接:
https://arxiv.org/abs/2505.006

分类 大模型、 学术 标签 PaperWeekly、 助理微信、 大模型、 批判能力、 数学领域、 科研翻译小组 发表评论

近千篇文献淬炼!哈工大领衔发布首篇长思维链综述:重构大模型推理能力边界

2025年6月6日16时 作者 PaperWeekly

务中屡创佳绩,但真正推动它们迈入智能进化新阶段的,是一种更具层次性的推理方式:
长思维链(Long

分类 大模型、 学术 标签 PaperWeekly、 学术热点剖析、 最新论文解读、 王教授、 科研心得分享、 稿酬结算 发表评论

越用越聪明or越学越崩?首个终身学习Agent基准来了,全面评估智能体进化潜能

2025年6月5日11时 作者 PaperWeekly

说,在面对环境中的持续新任务与知识时,是否能够有效学习、适应、保留过去经验、并防止遗忘?
本文介绍了

分类 大模型、 学术 标签 PaperWeekly、 学术会议、 技术讨论群组、 研讨会、 社交媒体、 顶级期刊 发表评论

社交直男逆袭!通义AMPO炼成“多面脑回路”智能体,自适应推理秒切4种人格

2025年5月26日16时 作者 PaperWeekly

是如何炼成的?
最近,通义实验室的最新研究工作让 AI 智能体掌握了人类高深的社交艺术:四种思考模式

分类 大模型、 学术 标签 AML框架、 PaperWeekly、 应用实例、 投稿计划、 研究链接、 自适应模式学习 发表评论

告别生成偏差!快手Any2Caption智能解耦意图理解,实现可控视频生成

2025年5月21日16时 作者 PaperWeekly

的视频?这个梦想,已经成为现实!
快手与新加坡国立大学联合推出的 Any2Caption,打破了多模

分类 大模型、 学术 标签 markdown、 PaperWeekly、 原创文章、 图片附件、 稿件投稿、 稿酬 发表评论

ICLR 2025 差分注意力机制爆火!DIFF Transformer击穿长文本建模天花板

2025年4月30日16时 作者 PaperWeekly

建模能力为语言理解与生成带来了前所未有的突破。
然而,随着模型规模的不断扩大和应用场景的日益复杂,传

分类 大模型、 学术 标签 PaperWeekly、 实用建议、 收藏、 点赞、 研究技巧、 转发 发表评论
较早文章
页面1 页面2 … 页面4 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Cursor 中最受欢迎的 5 个 MCP Server!
  • 从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
  • “AI购物代理”——电商下一个必争之地
  • 无账号&特殊网络,如何畅跑 Claude Code|附智谱「特别折扣」
  • 文档多模态RAG方案哪个更好?9类Embedding+3类MLLM+4类框架对比及古籍文档数据合成工具

2025 年 9 月
一 二 三 四 五 六 日
1234567
891011121314
15161718192021
22232425262728
2930  
« 8 月    

归档

  • 2025 年 9 月
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×