智谱深夜开源新一代GLM模型,推理速度快DeepSeek-R1八倍,还启用了全新域名Z.ai
智谱宣布其核心技术链路完全开源,包括基座模型、推理模型和沉思模型等。新发布的GLM-4-32B-0414与GLM-Z1-32B-0414均以32亿参数量媲美更大规模的主流模型,并在工具调用、联网搜索、代码智能体任务等方面表现优异。同时,小尺寸的9B系列模型也开源了。智谱持续推动AI生态建设,为企业提供模型即服务(MaaS)解决方案。
智谱宣布其核心技术链路完全开源,包括基座模型、推理模型和沉思模型等。新发布的GLM-4-32B-0414与GLM-Z1-32B-0414均以32亿参数量媲美更大规模的主流模型,并在工具调用、联网搜索、代码智能体任务等方面表现优异。同时,小尺寸的9B系列模型也开源了。智谱持续推动AI生态建设,为企业提供模型即服务(MaaS)解决方案。
含了三个模型,分别是
GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano,它们仅
本文提出了一种高效蒸馏方法AccVideo,通过合成数据集加速视频扩散模型生成速度,相比教师模型(HunyuanVideo)提升了8.5倍的生成速度,并显著减少了推理步骤。
DeepSeek 发布文档宣布将开源自己的内部推理引擎,并与开源社区建立更广泛的合作。文档提到将与现有的开源项目合作,包括 SGLang 和 vLLM 项目。网友猜测 OpenAI 可能会发布多种模型和智能体产品。
OceanBase 通过 AI 原生数据库重新定义分布式数据库,利用 SQL + AI 一体化技术打破 TP 和 AP 的次元壁。OceanBase 将举办首届 AI 黑客松大赛,邀请开发者使用 OceanBase 数据库构建具有实际应用价值的产品或解决方案。
清华大学刘润泽等人提出生成式过程奖励模型GenPRM,通过思维链推理和代码验证增强大语言模型的推理能力。仅23K训练样本就取得了优异性能,展示了测试时扩展在提升小模型表现上的潜力。