跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

深度学习

带你从零开始实现一个稀疏专家混合语言模型(MoE模型)

2025年2月25日8时 作者 NLP工程化

Hugging Face博客介绍了如何从零实现稀疏专家混合语言模型(MoE),通过解析代码详解自注意力机制、专家模块等组件。

分类 开源 标签 Hugging Face、 Top-k 门控、 专家模块、 深度学习、 自注意力机制、 自然语言处理(NLP) 发表评论

14岁出道编程天才:新一代码农不会写代码了,AI正培养「文盲程序员」!

2025年2月23日12时 作者 新智元

一篇博客指出现代AI工具使程序员过度依赖快速解决方案而忽视了深度理解,引发了广泛讨论。

分类 资讯 标签 Namanyay、 StackOverflow、 交流、 技术理解、 深度学习、 项目构建 发表评论

谷歌Fellow级大佬出走!17年老将吴永辉加盟字节,亲自操刀大模型研发

2025年2月22日23时 作者 新智元

Google Fellow吴永辉博士离职谷歌加入字节跳动,负责AI基础研究。他曾主导神经机器翻译、RankBrain等项目,目前担任字节大模型团队Seed基础研究负责人。

分类 资讯 标签 AI基础研究、 吴永辉、 字节跳动、 排序工程师、 深度学习、 谷歌 发表评论

实测医疗APP好伴AI:数字版三甲专家人人可用,AI医疗落地之路终于走通了?

2025年2月22日8时 作者 量子位

k正在重塑全球AI竞争格局。
微信、飞书、百度等上百家企业一个赛一个地宣布接入DeepSeek,表面

分类 资讯 标签 个性化服务、 全科医学、 动态知识库、 好伴AI、 智诊科技、 深度学习 发表评论

AAAI 2025 北航团队提出GTG:具备跨城市迁移性的人类移动轨迹生成模型

2025年2月21日23时 作者 PaperWeekly

neration Model for Urban Mobility
。本文提出了一种
具备跨城市迁移

分类 大模型、 学术 标签 Transformer、 城市大脑、 智慧能源、 智能导航、 深度学习、 自动驾驶 发表评论

两万字长文深度解密DeepSeek-R1、Kimi 1.5,强推理模型凭什么火出圈?

2025年2月21日12时 作者 机器之心

多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,

分类 学术、 资讯 标签 Transformer、 刘杨、 强推理、 感知器、 深度学习、 跨模态 发表评论

深度|黄仁勋CES演讲:全球开发者正在构建下一代物理AI,具备实体的机器人——人形机器人

2025年2月20日8时 作者 Z Potentials

关,GeForce为AI走向大众铺平了道路,而现在,
AI正回归GeForce。
这是我们的全新Ge

分类 国际、 资讯 标签 GPU、 NVIDIA、 Transformer、 深度学习、 物联网、 神经网络 发表评论

问小白接入 DeepSeek,亲测全网最快!

2025年2月18日23时 作者 特工宇宙

最近在盘点测评各个 DeepSeek 使用渠道,发现一款初创产品速度最快;问小白凭借极速联网搜索能力、丰富的功能和流畅的用户体验,成为最佳选择。

分类 分享 标签 32篇相关文章、 MOE模型架构、 七个月、 深度学习、 特工宇宙、 问小白 发表评论

刚刚,马斯克发布Grok-3,反击DeepSeek、OpenAI

2025年2月18日16时 作者 AIGC开放社区

专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言等大模型的发展和应用落地。马斯克旗下xAI发布最新大模型Gork3,性能远超OpenAI的LLM,展示了深度学习与强化学习结合的应用。

分类 资讯 标签 GAIR、 Gork3、 xAI、 强化学习、 深度学习、 马斯克 发表评论

电子书《深度学习:基础与概念》

2025年2月18日8时 作者 NLP工程化

《深度学习:基础与概念》是一本Springer Nature畅销书,全面介绍深度学习的核心思想,涵盖当代架构和技术关键概念。本书适合本科生和研究生阅读,强调实际应用价值而非抽象理论,并包含一个概率论入门部分。

分类 开源 标签 2、 Chris Bishop、 Springer Nature's、 新手指南、 深度学习、 经受考验 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面12 页面13 页面14 … 页面21 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Cursor 中最受欢迎的 5 个 MCP Server!
  • 从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
  • “AI购物代理”——电商下一个必争之地
  • 无账号&特殊网络,如何畅跑 Claude Code|附智谱「特别折扣」
  • 文档多模态RAG方案哪个更好?9类Embedding+3类MLLM+4类框架对比及古籍文档数据合成工具

2025 年 10 月
一 二 三 四 五 六 日
 12345
6789101112
13141516171819
20212223242526
2728293031  
« 9 月    

归档

  • 2025 年 9 月
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×