跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

量化

Mistral 发了个小模型—— Magistral-Small-2506 这是他们的首个推理模型

2025年6月12日8时 作者 NLP工程化

Mistral发布Magistral-Small-2506小模型,与Qwen3-4B类似大小且推理能力强,适合单卡32G运行,分数略高于Qwen3-4B。

分类 开源 标签 32G、 GPQA、 Mistral、 微调、 推理模型、 量化 发表评论

llama.cpp 内置的 llama-server 终于支持视觉模型

2025年5月12日8时 作者 NLP工程化

llama.cpp 推出视觉模型支持,多模态模型开发者可利用最新更新。

分类 开源 标签 ggml-org、 llama-server、 Llama.cpp团队、 多模态模型、 视觉模型、 量化 发表评论

1比特KV量化,10倍吞吐提升无损性能:多模态适用的KV cache量化策略来了,即插即用无需改原模型

2025年4月9日23时 作者 极市干货

读
在InternVL-2.5上实现10倍吞吐量提升,模型性能几乎无损失。
>>
加入极市CV技术交

分类 学术 标签 1比特、 CalibQuant、 KV Cache、 多模态语言模型、 性能、 量化 发表评论

新手必看!用 DeepSeek-R1 数据训练出你的专属中文推理模型

2025年4月4日14时 作者 小兵的AI视界

进行
SFT
(
Supervised Fine-Tuning
)的小模型也展现出了强大的效果
。前

分类 开源 标签 交叉验证、 数据集加载、 模型微调、 版本控制系统、 超参数优化、 量化 发表评论

一文图解大模型量化:量化的目的、内涵及若干实现策略

2025年3月4日14时 作者 老刘说NLP

个模型在GPU上运行),GGUF(可能将层卸载到CPU上)又是啥?本质是啥?这些都是困扰已久的问题。

分类 大模型 标签 大型语言模型、 权重量化、 激活值量化、 训练后量化、 量化、 量化感知训练 发表评论

大模型上周回顾及Deepseek开源周总结:兼看面向多任务的模型融合思路

2025年3月3日14时 作者 老刘说NLP

,发现一些有趣的问题,比如模型参数融合的玩法,会有更多收获。
围绕模型参数融合,MOE可视化图解,d

分类 大模型 标签 LORA、 Mergekit、 Mixture of Experts、 深度学习、 量化、 马巴米模型 发表评论

只需几步!用 vLLM 快速上手 DeepSeek 大模型部署

2025年2月26日14时 作者 小兵的AI视界

将带你深入探索如何使用
vLLM
框架部署
DeepSeek-R1-Distill-Qwen
大语言

分类 开源 标签 24G显卡、 异步推理、 显存配置、 模型剪枝、 温度参数、 量化 发表评论

DeepSeek的“服务器繁忙”让所有人抓狂,背后究竟是怎么回事

2025年2月13日12时 作者 硅星人Pro

服务器繁忙,请稍后再试”,正在让各地用户抓狂。
此前不太被大众所知的DeepSeek,因2024年1

分类 资讯 标签 DeepSeek、 剪枝、 异构计算、 混合精度、 知识蒸馏、 量化 发表评论

DeepSeek-V3 FP8量化浅析

2025年2月6日19时 作者 GiantPandaCV

水塔花桥·琉森 摄于2024.4.30
DeepSeek-V3 横空出世,训练和推理成本极低,一个重

分类 学术 标签 block、 CuTe、 CUTLASS、 EVT、 FP8、 量化 发表评论

LoRA 微调 Qwen2-VL-2B:轻松提升性能,解锁 GPU 极限!

2025年1月30日14时 作者 AI技术研习社

上一篇文章我们探讨了如何使用自定义数据集进行模型训练,这次我将重点介绍如何使用
LoRA 微调
Qw

分类 大模型 标签 GPU内存、 Qwen2-VL、 全连接层、 推理速度、 模型剪枝、 量化 发表评论
较早文章
页面1 页面2 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Cursor 中最受欢迎的 5 个 MCP Server!
  • 从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
  • “AI购物代理”——电商下一个必争之地
  • 无账号&特殊网络,如何畅跑 Claude Code|附智谱「特别折扣」
  • 文档多模态RAG方案哪个更好?9类Embedding+3类MLLM+4类框架对比及古籍文档数据合成工具

2025 年 9 月
一 二 三 四 五 六 日
1234567
891011121314
15161718192021
22232425262728
2930  
« 8 月    

归档

  • 2025 年 9 月
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×