跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

深度学习

阿里32B新模型比肩满血DeepSeek-R1!苹果Mac本地可跑,网友已玩疯

下午12时 2025/03/06 作者 智东西

阿里云发布QwQ-32B推理模型,参数量为32B,性能媲美DeepSeek-R1,在数学和编程能力上与之相当,并可在消费级显卡上部署。该模型开源用于商业和研究用途,已吸引大量关注。

分类 资讯 标签 32B、 QwQ-32B、 增强型强化学习、 开源、 深度学习、 阿里云 发表评论

用 Excel 手搓各种 AI 算法和模型:ai-by-hand-excel

上午8时 2025/03/05 作者 NLP工程化

用 Excel 实现并演示人工智能与深度学习的核心算法和概念,降低 AI 学习门槛,包括矩阵乘法、MLP、RNN、Transformer、ResNet 等。

分类 开源 标签 ai-by-hand-excel、 Excel、 ImagineAILab、 人工智能、 核心算法、 深度学习 发表评论

大模型上周回顾及Deepseek开源周总结:兼看面向多任务的模型融合思路

下午2时 2025/03/03 作者 老刘说NLP

,发现一些有趣的问题,比如模型参数融合的玩法,会有更多收获。
围绕模型参数融合,MOE可视化图解,d

分类 大模型 标签 LORA、 Mergekit、 Mixture of Experts、 深度学习、 量化、 马巴米模型 发表评论

微软原WizardLM团队:代码大模型WarriorCoder,性能新SOTA

下午12时 2025/03/02 作者 机器之心

多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,

分类 学术、 资讯 标签 机器学习、 极客之选、 深度学习、 留言交流、 编程技巧、 获取资讯 发表评论

火山引擎AI一体机DeepSeek版来了!开箱即用,小时级部署,还有大模型应用经验加持

下午11时 2025/02/27 作者 量子位

火山引擎发布AI一体机,提供一站式解决方案支持DeepSeek应用落地,解决算力优化、模型部署及安全防护等问题。

分类 资讯 标签 AI一体机、 优化模型、 安全保障、 深度学习、 火山引擎、 高效服务 发表评论

全年营收暴增114%,但股价不涨反跌,市场不相信黄仁勋还能造“英伟达泡沫”|

下午4时 2025/02/27 作者 钛媒体AGI

午,全球市值最高的 AI 芯片巨头英伟达(NVIDIA)发布截至今年1月26日的2025财年第四季度

分类 资讯 标签 中美芯片、 主权AI、 企业级应用、 深度学习、 物理AI、 英伟达H200 发表评论

DeepSeek能代替三甲医院专家?

下午12时 2025/02/26 作者 AI前哨站

近日,DeepSeek被用于测试并给出了患者病情的治疗建议。多位专家认为,公众可以利用DeepSeek了解医疗科普知识,在做治疗、用药决策时仍要听取医生建议。AI只能在部分环节发挥作用,且无法替代医生的专业思维能力。

分类 资讯 标签 AI辅助、 DeepSeek、 三甲医院、 患者就诊、 深度学习、 神经外科 发表评论

制糖工厂以旧换新,空降 LET’S VISION 现场!

下午12时 2025/02/26 作者 APPSO

阿里云推出新服务,旨在简化AI开发和部署流程,提高效率与成本效益。

分类 资讯 标签 Qwen、 法律文档、 深度学习、 自然语言处理、 金融分析、 阿里巴巴云 发表评论

DeepSeek开源周第三天:DeepGEMM,通用矩阵乘法库,仅300行代码

下午12时 2025/02/26 作者 Founder Park

epGEMM。这一库支持标准矩阵计算和混合专家模型(MoE)计算,为 DeepSeek-V3/R1

分类 资讯 标签 DeepGEMM、 FP8、 GPU、 Hopper架构、 深度学习、 矩阵乘法 发表评论

GPU效率暴涨!DeepSeek开源DeepGEMM,仅300行代码

下午12时 2025/02/26 作者 AIGC开放社区

DeepSeek开源高效FP8精度矩阵乘法库DeepGEMM,支持NVIDIA Hopper架构,在密集和分组矩阵乘法下性能提升显著,使用方便,支持广泛应用场景。

分类 资讯 标签 AIGC、 DeepSeek团队、 FP8精度、 深度学习、 矩阵乘法、 阿里巴巴 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面5 页面6 页面7 … 页面15 下一页 →

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

近期文章

  • 完全开源的7B模型,性能比肩主流LLM,训练成本仅16万美元,复现DeepSeek的强化学习!
  • 全球用户更爱用哪个AI模型?OpenAI和谷歌领跑,Anthropic下滑,多个国产模型表现突出
  • Ruby on Rails 之父 DHH 预言:未来“写代码”会变成不合时宜的念头!
  • 7k星星爆火!用微信聊天记录训练一个自己的数字分身回信息,还能克隆声音回复语音消息。
  • 全国人大常委会和国务院公布立法计划,AI立法有何变化?

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
2025 年 5 月
一 二 三 四 五 六 日
 1234
567891011
12131415161718
19202122232425
262728293031  
« 4 月    

归档

  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×