跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

GPT-3

几乎解决所有大模型问题!外网已传疯!

2025年6月27日14时 作者 PaperAgent

本书将引领读者深入了解Transformer技术,并详细介绍从头预训练RoBERTa模型、微调GPT-3等预训练模型的方法,涵盖NLP任务的解决技巧。

分类 分享 标签 GPT-3、 RoBERTa、 Transformer、 大模型、 自然语言处理、 计算机视觉 发表评论

AIInfra和传统Infra断代了吗?聊聊Infra“三大难题”,以及其中的关联

2025年6月19日14时 作者 机器学习算法与自然语言处理

业研究人员。
社区的愿景
是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进

分类 学术 标签 GPT-3、 Llama、 NCCL/RDMA、 动态批次调整、 日志记录、 高带宽通信 发表评论

信息过载时代,如何真正「懂」LLM?从MIT分享的50个面试题开始

2025年6月19日8时 作者 机器之心

LLM
仅出现不到十年,就已将曾经遥不可及的人工智能能力普及给大众,让全球数亿人能够通过自然语言进

分类 学术、 资讯 标签 GPT-3、 Transformer、 大语言模型、 微调、 注意力机制、 预训练 发表评论

OpenAI帝国的真相与幻象——496页「Empire of AI」中文版电子书分享!

2025年5月23日23时 作者 AGI Hunt

OpenAI由理想主义转向商业帝国的故事被深入剖析,揭示其背后的资本-算力-数据三角关系及全球南方国家的隐形成本。Karen Hao的新书《Empire of AI》揭示了AGI时代的技术霸权和数字殖民史。

分类 分享 标签 GPT-3、 Karen Hao、 OpenAI、 大模型训练、 肯尼亚工人、 资本主导 1 条评论

为什么明明很准,奖励模型就是不work?新研究:准确度 is not all you need

2025年3月24日16时 作者 机器之心

设计 RLHF 的奖励模型时也是一样。
我们知道,一个 RLHF 算法是否成功的一大关键在于其奖励模

分类 学术、 资讯 标签 GPT-3、 RLHF、 T5、 个性化、 多模态、 奖励模型 发表评论

首个大模型后训练方法综述

2025年3月14日8时 作者 NLP工程化

国内外研究者综述了LLM的后训练方法进展及五种范式(微调、对齐、推理、效率和集成适应),并介绍了相关数据集与应用场景,同时讨论了当前面临的伦理问题及未来方向。

分类 开源 标签 DeepSeek-R1、 GPT-3、 国内外、 微调、 研究人员、 预训练 发表评论

最新「大模型简史」整理!从Transformer(2017)到DeepSeek-R1(2025)

2025年3月2日14时 作者 Datawhale

性且高性价比的「大型语言模型」(Large Language Model, LLM) — — Dee

分类 分享 标签 ChatGPT、 DeepSeek-R1、 GPT-3、 MoE、 Transformer架构、 开源特性 发表评论

2024年度AI报告(五):中国信通院《人工智能发展报告(2024)》深度解读

2025年1月1日14时 作者 子非AI

回首2024,我们共同见证了人工智能领域的蓬勃发展,也一同探索了大模型时代的无限可能。感谢每一位读者

分类 分享 标签 BERT、 GPT-3、 国产框架、 大模型、 工程化工具链、 深度学习 发表评论

用Python实现RLHF奖励模型构建,全方位提升模型表现!

2024年12月29日22时 作者 AI技术研习社

从 0 到 1:用 RLHF 和 Python 构建奖励模型,全面提升语言模型能力!

分类 大模型 标签 Argilla、 GPT-3、 Python、 RLHF、 奖励模型、 表现力 发表评论

刚刚,OpenAI元老级研究员Alec Radford离职,他主导了GPT-1、GPT-2的研发

2024年12月20日12时 作者 机器之心

OpenAI元老级人物Alec Radford即将离职进行独立研究,他在初代GPT、GPT-2及GPT-3等项目中均发挥重要作用。

分类 学术、 资讯 标签 Alec Radford、 GPT-1、 GPT-2、 GPT-3、 OpenAI、 半监督学习 发表评论
较早文章
页面1 页面2 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • 造梦师手记,群山深处的巨人:Colossus Project
  • 大模型训练的不稳定性有望彻底解决,MIT新研究用谱正则化替代层归一化
  • 秒杀传统机型50倍!东京大学研发 “攀爬高手”,突破四足机器人地形瓶颈!
  • 近亿元B轮融资!这家六维力传感器企业连续三年收入翻倍!产品市占率达70%
  • 12306购票查询 MCP 服务

2025 年 7 月
一 二 三 四 五 六 日
 123456
78910111213
14151617181920
21222324252627
28293031  
« 6 月    

归档

  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×