跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

大模型

大语言模型

一文图解大模型量化:量化的目的、内涵及若干实现策略

2025年3月4日14时 作者 老刘说NLP

个模型在GPU上运行),GGUF(可能将层卸载到CPU上)又是啥?本质是啥?这些都是困扰已久的问题。

分类 大模型 标签 大型语言模型、 权重量化、 激活值量化、 训练后量化、 量化、 量化感知训练 发表评论

还在用腾讯元宝?你需要注意这个细节!

2025年3月4日14时 作者 AI信息Gap

的流量渠道,再加上疯狂砸钱投广告,腾讯元宝app目前已经超越字节的“豆包”冲到了苹果 App Sto

分类 国际、 大模型 标签 DeepSeek、 元宝、 服务协议、 用户权益、 腾讯、 霸王条款 发表评论

神经网络的每一层都是干嘛的?这才是神经网络结构的核心

2025年3月4日14时 作者 AI探索时代

文章介绍了神经网络的核心——神经网络层及其在不同模型中的作用和类型,并强调了学习简单结构的重要性来理解各层功能。

分类 大模型 标签 全连接层、 复杂模型、 多头注意力层、 神经网络、 编码器、 解码器 发表评论

​ICLR 2025 无需训练!大幅增强多模态大模型对微小视觉细节的感知

2025年3月3日16时 作者 PaperWeekly

外训练的“可视化干预”方法,巧妙地挖掘并利用模型自身的内部知识(注意力与梯度信息),从而提升模型对小

分类 大模型、 学术 发表评论

Springer知识蒸馏专著解读:面向图像识别的知识蒸馏综述

2025年3月3日16时 作者 PaperWeekly

dge Distillation: Towards New Horizons of Intellig

分类 大模型、 学术 标签 关系层面、 响应层面、 在线知识蒸馏、 特征层面、 知识蒸馏、 跨模态 发表评论

DeepSeek:挑战OpenAI的新AI神!手把手教你微调 DeepSeek-R1!

2025年3月3日14时 作者 AI技术研习社

DeepSeek发布免费开源模型DeepSeek-R1,性能媲美OpenAI o1。通过Kaggle平台进行微调训练,使AI更懂特定任务需求。

分类 大模型 标签 DeepSeek、 DeepSeek-R1、 Kaggle、 强化学习、 微调技术、 运行效率 发表评论

大模型上周回顾及Deepseek开源周总结:兼看面向多任务的模型融合思路

2025年3月3日14时 作者 老刘说NLP

,发现一些有趣的问题,比如模型参数融合的玩法,会有更多收获。
围绕模型参数融合,MOE可视化图解,d

分类 大模型 标签 LORA、 Mergekit、 Mixture of Experts、 深度学习、 量化、 马巴米模型 发表评论

【北京大学】DeepSeek 讲座精华:提示词工程实战与落地指南!

2025年3月3日14时 作者 AI技术研习社

《北京大学》精彩讲座分享DeepSeek核心价值与应用技巧

分类 大模型 标签 AI技术、 DeepSeek、 北京大学、 应用前景、 提示词技巧优化、 未来发展期望 发表评论

神级提示词:瞬间解锁DeepSeek-R1、o1、Grok 3满血模式!

2025年3月3日14时 作者 AI信息Gap

文章介绍了OpenAI发布的满血版o1以及其对应的Pro套餐,强调了提示词在提升模型回答质量上的作用,并通过具体例子展示了如何利用神级提示词让推理模型Grok 3 – Think提供更深入、有深度的答案。

分类 国际、 大模型 标签 ChatGPT Pro、 DeepSeek-R1、 Grok 3 - Think、 o1、 OpenAI、 木易 发表评论

Flux一键真人转漫画风格工作流

2025年3月3日12时 作者 路过银河AI

使用Janus Pro反推模型和bento动漫大模型结合Anime Style LoRa与插画LoRa,实现真人向漫画风格的转换。

分类 分享、 大模型 标签 Anime Style LoRa、 bento动漫大模型、 DeepSeek公司、 Flux、 Janus Pro模型开发者、 绘本 LoRa 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面91 页面92 页面93 … 页面147 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Cursor 中最受欢迎的 5 个 MCP Server!
  • 从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
  • “AI购物代理”——电商下一个必争之地
  • 无账号&特殊网络,如何畅跑 Claude Code|附智谱「特别折扣」
  • 文档多模态RAG方案哪个更好?9类Embedding+3类MLLM+4类框架对比及古籍文档数据合成工具

2025 年 10 月
一 二 三 四 五 六 日
 12345
6789101112
13141516171819
20212223242526
2728293031  
« 9 月    

归档

  • 2025 年 9 月
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×