跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

超大规模模型

面壁MiniCPM4端侧模型发布:长文本推理 5 倍提速,0.5B 模型拿下新SOTA

2025年6月10日23时 作者 AI科技大本营

,带来端侧性能创新式大跃升;一款 0.5B 实力演绎以小博大,适配广泛终端场景。
MiniCPM4.

分类 分享 标签 FP8训练、 UltraChat-v2、 数据筛选机制、 超大规模模型、 面壁智能、 高质量数据合成 发表评论

继Qwen3、DeepSeek之后微软重磅开源Phi4推理大模型:新一轮百模大战开始了

2025年5月2日23时 作者 PyTorch研习社

微软发布轻量级推理模型Phi-4,仅14B参数却在数学推理测试中超越Qwen3、DeepSeek R1等大模型。

分类 分享 标签 14B、 开源权重推理模型 Phi-4、 微软、 微软研究团队、 数学推理测试、 超大规模模型 发表评论

社区供稿 | 3700 次预训练总结超参规律,开源海量实验,告别盲猜

2025年4月17日14时 作者 Hugging Face

参数优化至关重要。为了探究最佳超参数的规律,我们开展了大规模的实证研究,通过在不同配置上进行网格搜索

分类 开源 标签 Step Law、 学习率、 批量大小、 数据集规模、 模型规模、 超大规模模型 发表评论

硅谷对中国AI公司的焦虑越来越重,不只是因为DeepSeek:2025这些赛道更值得关注

2025年2月1日23时 作者 机器之心

机器之心报道
机器之心编辑部
谁将跨越下一个里程碑?下一步会是什么?
大部分人可能想不到,2025

分类 学术、 资讯 标签 产业融合、 多模态融合、 开源社区、 技术创新、 自适应优化、 超大规模模型 发表评论

CES老黄放大招:RTX5090、个人AI计算机Project Digits,还开源了世界模型Cosmos

2025年1月8日16时 作者 Founder Park

老黄穿上了新皮衣,拿来了新 GPU。
今天上午,全世界的目光都集中在了拉斯维加斯。
北京时间 1 月

分类 资讯 标签 NVIDIA、 Project DIGITS、 促进创新、 图像处理、 超大规模模型、 超级计算 发表评论

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • commands.py中的函数解析5:clear_orphaned_file_records等
  • commands.py中的函数解析3:fix_app_site_missing等
  • commands.py中的函数解析2:convert_to_agent_apps等
  • commands.py中的函数解析1:reset_password等
  • 赶超DeepSeek、阿里Qwen!百度文心4.5系列模型正式开源,性能出色但领跑有点难

2025 年 7 月
一 二 三 四 五 六 日
 123456
78910111213
14151617181920
21222324252627
28293031  
« 6 月    

归档

  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×