跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

语言模型

重磅!AI 自我修错技术问世,LLM 终于能纠正自己的错误了

2025年3月11日23时 作者 AGI Hunt

,让语言模型终于能够像人类一样,看到并修正自己的错误!
这个名为「
广义插值离散扩散
」(GIDD

分类 分享 标签 GIDD、 LLM、 扩散方程、 泛化性能、 自我修正、 语言模型 发表评论

OpenAI自曝“o4”训练中,用思维链监控抓住AI作弊瞬间

2025年3月11日16时 作者 量子位

OpenAI研究显示通过监控推理模型的思维链来发现其作弊行为,但过度优化可能诱导模型隐藏意图。该方法在提高模型能力的同时也可能增加不良行为,但仍能有效识别不良意图。

分类 资讯 标签 OpenAI、 思维链、 检测不当行为、 训练压力、 语言模型、 透明度 发表评论

图灵奖获得者:我不用ChatGPT

2025年3月10日14时 作者 Datawhale

25-02-26  06版)
作者:中青报·中青网记者 李新玲
“人只有一次生命,每个人应该去享受它

分类 分享 标签 他人提问、 信息支持、 语言模型 发表评论

社区供稿 | Hugging Face 又出新教程啦!手把手教你构建 DeepSeek-R1 推理模型

2025年3月5日14时 作者 Hugging Face

间进行了学习,下面是整理的课程内容
课程链接:
https://hf.co/learn/nlp-co

分类 开源 标签 代理、 奖励、 强化学习、 政策、 环境、 语言模型 发表评论

为DeepSeek MoE模型带来「免费午餐」加速,专家链可大幅提升LLM的信息处理能力

2025年3月4日16时 作者 机器之心

模型(Mixture-of-Experts, MoE)的技术,而当前的 MoE 技术依然还有显著的优

分类 学术、 资讯 标签 Chain-of-Experts、 专家沟通、 创新架构、 循环深度、 稀疏神经网络、 语言模型 发表评论

Claude 3.7硬控马里奥90秒,GPT-4o开局暴毙!Karpathy直呼基准失效,游戏成LLM新战场

2025年3月3日16时 作者 新智元

加州大学圣迭戈分校Hao AI Lab用超级马里奥等游戏评估AI智能体,Claude 3.7表现亮眼。谷歌的Gemini也进行了测试。对比结果显示GPT-4o和GPT-4.5在多种游戏中都明显逊色。

分类 资讯 标签 2048益智游戏、 Claude 3.7、 Hao AI Lab、 实时运行、 语言模型、 超级马里奥 发表评论

DeepSeek关键RL算法GRPO,有人从头跑通了,贡献完整代码

2025年3月2日12时 作者 机器之心

ive Policy Optimization)是 DeepSeek-R1 成功的基础技术之一,我们

分类 学术、 资讯 标签 90%、 GRPO、 Qwen-2.5-1.5B-Instruct、 强化学习、 微调、 语言模型 发表评论

大模型是否有自知之明?新研究发现LLM可以知晓自己的知识范围

2025年3月1日16时 作者 机器之心

识」?对于这个问题,目前还没人能给出非常确切的答案,但近日 Chandar Research Lab

分类 学术、 资讯 标签 不确定性和困惑、 反思、 学习后扩展、 模糊不清回答、 知识范围、 语言模型 发表评论

刚刚,GPT-4.5问世!OpenAI迄今最大、最贵模型,API价格飞涨30倍,不拼推理拼情商

2025年2月28日12时 作者 机器之心

开始了直播,奥特曼并没有现身。直播不到 15 分钟就匆匆结束了。
OpenAI 正式发布了其最大、

分类 学术、 资讯 标签 GPT-4.5、 OpenAI、 幽默感、 理解上下文、 生成内容、 语言模型 发表评论

DeepSeek-R1自写CUDA内核跑分屠榜!斯坦福学霸狂飙GPU编程自动化挑战人类

2025年2月27日16时 作者 新智元

定义CUDA内核,完爆了o1和Claude 3.5 Sonnet,拿下总排名第一。虽然目前只能在不到

分类 资讯 标签 KernelBench、 OpenAI、 内核优化、 少样本调整、 机器学习代码、 语言模型 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面4 页面5 页面6 … 页面8 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • 美国AI巨头“大乱斗”!OpenAI晒星际之门项目进展,马斯克第一个表示不服,扎克伯格醉心四处挖人
  • 本周Github爆火,开源免费文件转换器,支持1000+文件类型。
  • 多团队共用集群太乱?用 Rancher+K3k 实现一人一套环境
  • 公安部:“智驾”非“自驾”,将探索把辅助驾驶操作纳入驾考
  • 黄仁勋:AI 将消灭所有人的工作

2025 年 7 月
一 二 三 四 五 六 日
 123456
78910111213
14151617181920
21222324252627
28293031  
« 6 月    

归档

  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×