微软 Phi-4 震撼发布:14B 参数模型性能超越 一众大模型,数学推理性能提升显著

微软发布的Phi-4大语言模型在数学推理方面表现出色,准确率达到91.8%。该模型通过高质量合成数据集、精心策划的数据以及先进的后训练技术实现了这一成就,并已在Azure AI Foundry平台发布。

完整视频! Ilya Sutskever最新论断,预训练时代将终结,新方向将会是…

前OpenAI联合创始人、SSI创始人Ilya Sutskever近日在神经信息处理系统会议上表示,大语言模型预训练规模扩展已达瓶颈,未来AI发展将转向构建代理和工具。他预测2025年将成为AI Agent元年,推动AI领域进入新阶段。

重磅!OpenAI发布满血o1、无限使用,最强大模型来了

专注AIGC领域的专业社区报道了微软&OpenAI等大语言模型的发展和应用。近日OpenAI发布了ChatGPT Pro,并宣布12天技术分享直播已启动。o1模型数据及训练涉及多样化的公开与非公开数据集,且具备自我改进能力。

精度与通用性不可兼得,北大、华为理论证明低精度下Scaling Law难以实现

大模型量化通过降低精度来提高推理速度,但研究发现不同精度下大语言模型在基本数学任务上的表现显著下降。研究证明足够的精度是解决这些任务的重要前提,而量化会严重损害大模型的数学推理能力。