跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

语言模型

仅用50个样本,成功率竟达40%!北邮等三校联手打造MoManipVLA,刷新移动操控记录!

2025年3月19日16时 作者 机器人大讲堂

物流等领域对机器人移动操作能力提出了迫切需求,但
要想机器人在非结构化环境中执行如协助人们的日常生活

分类 机器人 标签 复杂任务、 机器人操作、 自然语言指令、 视觉输入、 语言模型、 遮罩技术 发表评论

重磅!AI 自我修错技术问世,LLM 终于能纠正自己的错误了

2025年3月11日23时 作者 AGI Hunt

,让语言模型终于能够像人类一样,看到并修正自己的错误!
这个名为「
广义插值离散扩散
」(GIDD

分类 分享 标签 GIDD、 LLM、 扩散方程、 泛化性能、 自我修正、 语言模型 发表评论

OpenAI自曝“o4”训练中,用思维链监控抓住AI作弊瞬间

2025年3月11日16时 作者 量子位

OpenAI研究显示通过监控推理模型的思维链来发现其作弊行为,但过度优化可能诱导模型隐藏意图。该方法在提高模型能力的同时也可能增加不良行为,但仍能有效识别不良意图。

分类 资讯 标签 OpenAI、 思维链、 检测不当行为、 训练压力、 语言模型、 透明度 发表评论

图灵奖获得者:我不用ChatGPT

2025年3月10日14时 作者 Datawhale

25-02-26  06版)
作者:中青报·中青网记者 李新玲
“人只有一次生命,每个人应该去享受它

分类 分享 标签 他人提问、 信息支持、 语言模型 发表评论

社区供稿 | Hugging Face 又出新教程啦!手把手教你构建 DeepSeek-R1 推理模型

2025年3月5日14时 作者 Hugging Face

间进行了学习,下面是整理的课程内容
课程链接:
https://hf.co/learn/nlp-co

分类 开源 标签 代理、 奖励、 强化学习、 政策、 环境、 语言模型 发表评论

为DeepSeek MoE模型带来「免费午餐」加速,专家链可大幅提升LLM的信息处理能力

2025年3月4日16时 作者 机器之心

模型(Mixture-of-Experts, MoE)的技术,而当前的 MoE 技术依然还有显著的优

分类 学术、 资讯 标签 Chain-of-Experts、 专家沟通、 创新架构、 循环深度、 稀疏神经网络、 语言模型 发表评论

Claude 3.7硬控马里奥90秒,GPT-4o开局暴毙!Karpathy直呼基准失效,游戏成LLM新战场

2025年3月3日16时 作者 新智元

加州大学圣迭戈分校Hao AI Lab用超级马里奥等游戏评估AI智能体,Claude 3.7表现亮眼。谷歌的Gemini也进行了测试。对比结果显示GPT-4o和GPT-4.5在多种游戏中都明显逊色。

分类 资讯 标签 2048益智游戏、 Claude 3.7、 Hao AI Lab、 实时运行、 语言模型、 超级马里奥 发表评论

DeepSeek关键RL算法GRPO,有人从头跑通了,贡献完整代码

2025年3月2日12时 作者 机器之心

ive Policy Optimization)是 DeepSeek-R1 成功的基础技术之一,我们

分类 学术、 资讯 标签 90%、 GRPO、 Qwen-2.5-1.5B-Instruct、 强化学习、 微调、 语言模型 发表评论

大模型是否有自知之明?新研究发现LLM可以知晓自己的知识范围

2025年3月1日16时 作者 机器之心

识」?对于这个问题,目前还没人能给出非常确切的答案,但近日 Chandar Research Lab

分类 学术、 资讯 标签 不确定性和困惑、 反思、 学习后扩展、 模糊不清回答、 知识范围、 语言模型 发表评论

刚刚,GPT-4.5问世!OpenAI迄今最大、最贵模型,API价格飞涨30倍,不拼推理拼情商

2025年2月28日12时 作者 机器之心

开始了直播,奥特曼并没有现身。直播不到 15 分钟就匆匆结束了。
OpenAI 正式发布了其最大、

分类 学术、 资讯 标签 GPT-4.5、 OpenAI、 幽默感、 理解上下文、 生成内容、 语言模型 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面4 页面5 页面6 … 页面8 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Cursor 中最受欢迎的 5 个 MCP Server!
  • 从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
  • “AI购物代理”——电商下一个必争之地
  • 无账号&特殊网络,如何畅跑 Claude Code|附智谱「特别折扣」
  • 文档多模态RAG方案哪个更好?9类Embedding+3类MLLM+4类框架对比及古籍文档数据合成工具

2025 年 10 月
一 二 三 四 五 六 日
 12345
6789101112
13141516171819
20212223242526
2728293031  
« 9 月    

归档

  • 2025 年 9 月
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×