继Qwen3、DeepSeek之后微软重磅开源Phi4推理大模型:新一轮百模大战开始了 下午11时 2025/05/02 作者 PyTorch研习社 微软发布轻量级推理模型Phi-4,仅14B参数却在数学推理测试中超越Qwen3、DeepSeek R1等大模型。
社区供稿 | 3700 次预训练总结超参规律,开源海量实验,告别盲猜 下午2时 2025/04/17 作者 Hugging Face 参数优化至关重要。为了探究最佳超参数的规律,我们开展了大规模的实证研究,通过在不同配置上进行网格搜索
硅谷对中国AI公司的焦虑越来越重,不只是因为DeepSeek:2025这些赛道更值得关注 下午11时 2025/02/01 作者 机器之心 机器之心报道 机器之心编辑部 谁将跨越下一个里程碑?下一步会是什么? 大部分人可能想不到,2025
CES老黄放大招:RTX5090、个人AI计算机Project Digits,还开源了世界模型Cosmos 下午4时 2025/01/08 作者 Founder Park 老黄穿上了新皮衣,拿来了新 GPU。 今天上午,全世界的目光都集中在了拉斯维加斯。 北京时间 1 月