跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

可解释性

刚刚,OpenAI发布CoT监控,增强AI Agent自主能力

2025年7月16日8时 作者 AIGC开放社区

专注AIGC领域的专业社区关注最新进展。OpenAI发布思维链监控技术,帮助监督AI智能体并提高其透明度和可解释性。

分类 资讯 标签 OpenAI、 优化压力、 信任、 可解释性、 思维链监控技术、 透明度 发表评论

Bengio亲手戳穿CoT神话!LLM推理是假象,25%顶会论文遭打脸

2025年7月3日14时 作者 机器学习算法与自然语言处理

业研究人员。
社区的愿景
是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进

分类 学术 标签 LLM、 九头蛇效应、 冗余路径、 可解释性、 因果验证 发表评论

只训练数学,却在物理化学生物战胜o1!新强化学习算法带来显著性能提升,还缓解训练崩溃问题

2025年6月23日16时 作者 量子位

模型推理能力再添例证。
来自上海创智学院、上海AI Lab的MM-Eureka系列工作提出了新的强化

分类 资讯 标签 可控化、 可解释性、 多模态推理、 实际应用、 解释性增强、 透明度 发表评论

大模型到底是怎么「思考」的?第一篇系统性综述SAE的文章来了

2025年6月22日16时 作者 机器之心

本文是关于Sparse Autoencoder(SAE)综述的系统介绍,讨论了SAE在理解大语言模型内部机制和实际应用方面的优势与挑战。

分类 学术、 资讯 标签 Sparse Autoencoder、 可解释性、 吴烜圣、 杜梦楠、 束东、 赵海燕 发表评论

Anthropic教你训练可随时叛变的大模型

2025年6月21日11时 作者 AI工程化

Apollo最新研究揭示了大模型可能隐藏恶意意图的风险,即使经过安全训练,这些模型仍可能在特定条件下执行预设的恶意行为。论文指出现有技术无法有效根除这种风险,反而可能导致模型更加狡猾地伪装自己。

分类 分享 标签 Apollo、 免疫系统、 内部安全性、 可解释性、 后门植入、 思维链技术 发表评论

Anthropic祭出大模型“读脑”杀手锏:LLM决策过程全给你扒开看

2025年5月30日8时 作者 AI寒武纪

Anthropic开源了一款新的电路追踪工具,能够生成大型语言模型的归因图谱,帮助研究人员更好地理解这些模型内部运作机制。

分类 国际、 资讯 标签 Anthropic、 Dario Amodei、 Gemma-2-2b、 可解释性、 归因图谱、 电路追踪工具 发表评论

你真的懂 LLM 吗?揭秘大语言模型的核心奥秘!

2025年3月24日23时 作者 PyTorch研习社

类智能的能力
,使其能够执行如
感知、推理、决策、学习和创造
等任务。AI 的发展经历了多个阶段,从

分类 分享 标签 DeepSeek、 RAG、 可解释性、 安全隐患、 幻觉问题、 模型对齐 发表评论

官宣:Mira Murati 的创业公司,顶级团队打造开放的 OpenAI

2025年2月19日12时 作者 Founder Park

前 CTO、核心主创之一的
Mira Murati,终于官宣了她的创业公司。
Thinking Ma

分类 资讯 标签 AI 创业、 中美对比、 可解释性、 大模型预训练、 技术创新、 研发成本 发表评论

首个基于统计学的线性注意力机制ToST,高分拿下ICLR Spotlight

2025年2月17日12时 作者 机器之心

多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,

分类 学术、 资讯 标签 ToST、 可解释性、 多模态融合、 大模型实现、 注意力机制、 统计特性 发表评论

Jay Alammar:图解DeepSeek-R1

2025年1月28日22时 作者 机器学习算法与自然语言处理

MLNLP
社区是国内外知名的机器学习与自然语言处理社区,受众覆盖国内外NLP硕博生、高校老师以及企

分类 学术 标签 DeepSeek-R1、 可解释性、 强化学习、 混合专家层、 监督微调、 示范长链推理 发表评论
较早文章
页面1 页面2 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • 快看!谷歌和OpenAI为金牌打了起来
  • 对话谷歌前 CEO Eric Schmidt:数字超智能将在十年内到来,AI 将创造更多更高薪的工作
  • 在海外发现了一个很牛的免费AI代码解读工具,终于能读懂屎山了!
  • 英伟达竞争者获得大型订单:韩国FuriosaAI将为LG供应AI芯片
  • 上海:扩大显示芯片优势,支持智能眼镜主控芯片研发与产业化

2025 年 7 月
一 二 三 四 五 六 日
 123456
78910111213
14151617181920
21222324252627
28293031  
« 6 月    

归档

  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×