比R1快8倍,智谱开源GLM-Z1系列,实测 Agentic AI 也能极速深度推理!

智谱发布GLM-4-32B-0414系列模型,包含基座、推理和沉思模型,支持MIT License,并上线MaaS开放平台。其中推理模型GLM-Z1-32B为国内最快的模型之一,适用于不同场景。通过实测及示例展示了其在问答和功能调用应用中的优势。

开源推理大模型全面开花的一周:多模态、RAG、Agent、编码

热门模型排行榜Top10中出现多款推理大模型,包括代码推理、混合专家视觉-语言模型等。DeepCoder-14B-Preview在LiveCodeBench v5上的准确率提升了8%,仅用140亿参数实现相似性能;Llama-3.1-Nemotron-Ultra-253B-v1基于Meta Llama-3.1-405B-Instruct训练,支持长达128K标记上下文长度。OpenCodeReasoning是最大推理编程合成数据集,用于监督式微调;Kimi-VL-A3B-Thinking在多模态推理和视觉理解方面表现出色;Seed-Thinking-v1.5采用强化学习算法提升模型训练效率。

开源本地部署的GraphRAG chatwiki,支持DeepSeek接入微信里的聊天机器人

ChatWiki 是一款国产开源的知识库 AI 问答系统,结合 GraphRAG 知识图谱技术增强查询效率和答案准确性。支持接入多种大模型,并提供多部署方式、文档发布、格式导入等功能,可嵌入业务系统并与第三方数据打通,支持企业级权限管理与生态对接。