跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

强化学习

粉碎摩尔定律后,黄仁勋又要打破 Scaling Law 的墙

下午4时 2025/03/19 作者 APPSO

认为的。即便你不同意,也不能怪他们,毕竟在英特尔的身上,大家刚刚目睹了摩尔定律似乎「失效」了。
在最

分类 资讯 标签 人类作用、 伦理问题、 大模型、 强化学习、 数据多样性、 自我训练 发表评论

近日前沿进展回顾及再看多模态R1推理如何做?两类、五个代表工作实现思路总结

下午2时 2025/03/19 作者 老刘说NLP

大多未探索的挑战。与文本推理不同,
多模态推理要求模型迭代地从图像中提取、构建和验证信息
。
关于多

分类 大模型 标签 FRE-Multi、 LMM-R1、 R1-OneVision、 多模态模型、 强化学习、 文本描述 发表评论

RAG碰上RL,超越RAG?推理与搜索结合,用强化学习打破LLMs推理知识局限!

下午4时 2025/03/18 作者 AI科技大本营

文《R1-Searcher: 通过强化学习激励大模型的检索能力》。该论文提出了一种全新框架 R1-S

分类 分享 标签 48.2%、 Qwen-2.5-7B-Base、 R1-Searcher、 多跳问答任务、 强化学习、 性能提升 发表评论

深度学习的平衡之道:港科大、港城大等团队联合发布多目标优化最新综述

下午4时 2025/03/18 作者 机器之心

生陈巍昱、港城大在读博士生张霄远和港科广在读博士生林百炅为共同第一作者;林熙博士目前担任港城大博士后

分类 学术、 资讯 标签 多任务学习、 大语言模型、 强化学习、 推荐系统、 神经架构搜索、 计算机视觉 发表评论

院士领衔、IEEE Fellow 坐镇,清华、上交大、复旦、同济等专家齐聚 2025 全球机器学习技术大会!

下午4时 2025/03/17 作者 AI科技大本营

AI 生态正经历新一轮智能体革命。大模型如何协同学习?大模型如何自我进化?新型强化学习技术如何赋能

分类 分享 标签 AI解决方案、 ML Summit 2025、 大模型、 张俊林、 强化学习、 黎科峰 发表评论

迁移DeepSeek-R1同款算法,小米让7B模型登顶音频理解推断MMAU榜单

上午11时 2025/03/17 作者 量子位

小米大模型团队通过微调阿里Qwen2-Audio-7B模型,结合DeepSeek-R1的GRPO算法,在MMAU评测集上实现了64.5%的准确率,显著提升31%,接近人类专家水平。

分类 资讯 标签 7B参数模型、 GRPO算法、 MMAU评测基准、 小米、 强化学习、 音频理解 发表评论

统一自监督预训练!视觉模型权重无缝迁移下游任务,SiT收敛提速近47倍

上午8时 2025/03/17 作者 机器之心

表征能够提升扩散模型的收敛速度和生成质量。
然而,由于输入不匹配和 VAE 潜在空间的使用,将视觉模

分类 学术、 资讯 标签 USP、 VAE、 分类任务、 图像生成、 强化学习、 表征对齐 发表评论

「压缩即智能」得到实验验证,无需预训练和大量数据就能解决ARC-AGI问题

下午12时 2025/03/15 作者 机器之心

AI 与 SSI 联合创始人 Ilya Sutskever 就曾表达过类似的观点。甚至早在 1998

分类 学术、 资讯 标签 压缩即智能、 可解释性增强、 图像处理任务、 多张量结构、 强化学习、 自然语言处理 发表评论

手机操作革命!西湖大学发布自主进化智能体AppAgentX,执行效率提升300%

下午2时 2025/03/13 作者 小兵的AI视界

智能的同时提升执行效率,一直是困扰研究人员的难题
。近日,
西湖大学
AGI
实验室张驰团队推出了一

分类 开源 标签 AppAgentX、 强化学习、 智能助手、 深度学习、 自动任务执行系统、 西华大学人工智能实验室 发表评论

阿里开源全模态模型!能识别喜怒哀乐,还给出详细推理过程

下午4时 2025/03/12 作者 智东西

缘
智东西3月12日报道,昨日,阿里通义实验室开源R1-Omni模型——
业界首个将具有可验证奖励的

分类 资讯 标签 EMER、 HumanOmni、 RLVR、 奖励优化、 强化学习、 情绪识别 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面12 页面13 页面14 … 页面30 下一页 →

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

近期文章

  • 不看这藏师傅篇深度拆解,你永远不知道Lovart AI有多可怕(有邀请码)
  • ContextGem文档结构化数据提取框架剖析及UniversalRAG路由多模态检索思路
  • 仅靠 AI 就比独立医生好 4 倍?OpenAI HealthBench 数据震撼,o3 太强了!
  • 知行科技:全资子公司拟收购小工匠机器人大部分股份|每日并购
  • 美团战投领投、美团龙珠跟投自变量机器人|投资速递

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
2025 年 5 月
一 二 三 四 五 六 日
 1234
567891011
12131415161718
19202122232425
262728293031  
« 4 月    

归档

  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×