7B小模型超越DeepSeek-R1:模仿人类教师,弱模型也能教出强推理LLMTransformer作者团队

MLNLP社区是国内外知名的人工智能社区,专注于推动自然语言处理与机器学习的学术交流和技术进步。Sakana AI提出的新方法通过教师模型输出清晰解释来训练学生模型,显著提高了效率。

OpenAI发布o3满血版+o4 mini:10倍算力堆出满分视觉推理,AI看图思考新时代

就在今天凌晨,OpenAI发布了满血版o3和o4-mini模型,实现了图像思考能力。两款新模型在数学竞赛及编程任务中表现优异,视觉推理功能增强,支持Python分析、网络搜索等工具协同工作,有望改写专业岗位角色。

智谱深夜开源新一代GLM模型,推理速度快DeepSeek-R1八倍,还启用了全新域名Z.ai

智谱宣布其核心技术链路完全开源,包括基座模型、推理模型和沉思模型等。新发布的GLM-4-32B-0414与GLM-Z1-32B-0414均以32亿参数量媲美更大规模的主流模型,并在工具调用、联网搜索、代码智能体任务等方面表现优异。同时,小尺寸的9B系列模型也开源了。智谱持续推动AI生态建设,为企业提供模型即服务(MaaS)解决方案。