跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

超大规模模型

继Qwen3、DeepSeek之后微软重磅开源Phi4推理大模型:新一轮百模大战开始了

下午11时 2025/05/02 作者 PyTorch研习社

微软发布轻量级推理模型Phi-4,仅14B参数却在数学推理测试中超越Qwen3、DeepSeek R1等大模型。

分类 分享 标签 14B、 开源权重推理模型 Phi-4、 微软、 微软研究团队、 数学推理测试、 超大规模模型 发表评论

社区供稿 | 3700 次预训练总结超参规律,开源海量实验,告别盲猜

下午2时 2025/04/17 作者 Hugging Face

参数优化至关重要。为了探究最佳超参数的规律,我们开展了大规模的实证研究,通过在不同配置上进行网格搜索

分类 开源 标签 Step Law、 学习率、 批量大小、 数据集规模、 模型规模、 超大规模模型 发表评论

硅谷对中国AI公司的焦虑越来越重,不只是因为DeepSeek:2025这些赛道更值得关注

下午11时 2025/02/01 作者 机器之心

机器之心报道
机器之心编辑部
谁将跨越下一个里程碑?下一步会是什么?
大部分人可能想不到,2025

分类 学术、 资讯 标签 产业融合、 多模态融合、 开源社区、 技术创新、 自适应优化、 超大规模模型 发表评论

CES老黄放大招:RTX5090、个人AI计算机Project Digits,还开源了世界模型Cosmos

下午4时 2025/01/08 作者 Founder Park

老黄穿上了新皮衣,拿来了新 GPU。
今天上午,全世界的目光都集中在了拉斯维加斯。
北京时间 1 月

分类 资讯 标签 NVIDIA、 Project DIGITS、 促进创新、 图像处理、 超大规模模型、 超级计算 发表评论

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

近期文章

  • 走进杭州“六小龙”等AI先锋企业,解码AI商业新动能|2025杭州AI创变营来啦
  • 国产AI智能体竞逐海外!Manus推出数据分析师、思维导图,Genspark上线AI表格、幻灯片
  • “由 AI 生成的代码,从诞生那一刻起就是「遗留代码」!”
  • 王兴兴放话“人形机器人订单爆了” 受制于产能
  • 王兴兴:很多人形机器人企业爆单了,宇树科技非常缺人!

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
2025 年 5 月
一 二 三 四 五 六 日
 1234
567891011
12131415161718
19202122232425
262728293031  
« 4 月    

归档

  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×