AI实力榜大洗牌!OpenAI谷歌强势领跑,Anthropic节节败退 2025年5月17日8时 作者 新智元 4o称霸文本生成,谷歌的Gemini 2.5 Pro领跑推理,Kling在视频领域异军突起,企业如何
欢迎来到AI的下半场:一个从“卷”模型到“出”价值的新时代! 2025年4月20日14时 作者 子非AI ,在预设基准上比拼分数,如同竞技体育,催生了Transformer、GPT-4等强大“运动员”。但
14B 小模型逆袭翻译赛道,论文财报实测超Claude,不信试试“我命由我不由天” 2025年3月12日16时 作者 量子位 来自网易有道的14B翻译小模型,测试达行业第一,翻译质量超越一众国内外主流通用大模型。 它就是子曰
MLGym:推进人工智能研究Agent的新框架和基准 2025年2月26日8时 作者 NLP工程化 本文提出MLGym框架和基准,评估前沿LLM在AI研究任务上的表现,并强调构建和完善评估体系的重要性。