GraphRAG遇见事件图谱及llama、Qwen、DeepSeek等主流大模型架构对比总结 2025年7月21日14时 作者 老刘说NLP .2,Qwen3-4B,SmolLM3-3B,DeepSeek-V3,Qwen3-235B-A22B
ICLR’25|MambaQuant:首个Mamba系列模型量化方案,精度近乎无损还适用于标准LLM! 2025年2月17日23时 作者 极市干货 an.zhihu.com/p/23430297491 编辑丨极市平台 极市导读 首个针对Mamba系