跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

投稿通道

GRPO=高级版拒绝采样?强化学习祛魅时刻:负样本“去芜存菁”才是关键!

2025年5月20日16时 作者 PaperWeekly

PO 这样的算法虽然主流,但它需要额外的网络(critic network),搞得比较复杂和麻烦。

分类 大模型、 学术 标签 公开渠道、 原创作品、 学术热点、 投稿通道、 科研心得、 论文解读 发表评论

NeurIPS 2024 交互式聚类:探索以较小的交互成本,突破聚类性能瓶颈

2025年3月27日23时 作者 PaperWeekly

ue Mining”
提出在聚类过程中引入用户交互,通过询问少量高价值样本的类别从属关系,有效缓解了

分类 大模型、 学术 标签 IDC、 实验结果、 投稿通道、 深度聚类、 用户交互、 高价值样本 发表评论

​爱诗科技与悉尼大学联合发布大视觉模型LaVin-DiT,统一多项视觉任务

2024年12月3日14时 作者 PaperWeekly

研究问题
当前的 Large Vision Models 多为直接从自然语言处理架构改编,但这些模型

分类 大模型、 学术 标签 LaVin-DiT、 分享到社交、 投稿通道、 支持方式、 模型潜力、 添加公众号 发表评论

AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • ART:构建可靠智能体的强化学习新框架
  • 开发者必看!这个AI工具让“读懂代码”变成“复制优秀”
  • 创造历史!加速进化包揽机器人世界杯冠亚军
  • Figure推出人形机器人防火电池,续航飙升94%,成本降78%
  • Franka Robotics 机器人全新升级 从全球1400 篇论文看科研 “顶流” 如何坐稳机器人研究 “首选载体”

2025 年 7 月
一 二 三 四 五 六 日
 123456
78910111213
14151617181920
21222324252627
28293031  
« 6 月    

归档

  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×