2024年12月LLM最新排名:o1、Gemini双雄争霸,DeepSeek黑马杀入!
在2024年12月,OpenAI发布了满血版o1,谷歌发布多个重要模型,DeepSeek发布升级版本。LMSYS和LiveBench排行显示,OpenAI o1、谷歌Gemini-Exp-1206、谷歌 Gemini-2.0-Flash-Thinking、DeepSeek V3分别位列排行榜前几名。
在2024年12月,OpenAI发布了满血版o1,谷歌发布多个重要模型,DeepSeek发布升级版本。LMSYS和LiveBench排行显示,OpenAI o1、谷歌Gemini-Exp-1206、谷歌 Gemini-2.0-Flash-Thinking、DeepSeek V3分别位列排行榜前几名。
木易盘点2024年度国外AI领域表现领先者,《ChatGPT》《New Bing》等获最佳流量奖;谷歌Gemini、Anthropic Claude等因进步显著获最大进步奖;Perplexity AI、Notion AI、Poe等新锐AI公司获最佳新人奖。Meta和Mistral AI则在开源模型领域贡献突出,2024年AI竞赛激烈异常。
木易总结2024年国内AI领域发展:360AI搜索获web端最佳流量奖、百度文库和Kimi分列app端前两名;阿里通义、DeepSeek、零一万物获奖模型;Kimi在UI设计上表现优秀;腾讯作为大厂默默无闻,百度和360因用户体验问题受挫。
木易分享了关于微软推出的开源项目AI Dev Gallery的详细信息,该工具包专注于帮助Windows开发者集成最前沿的人工智能模型,涵盖文本处理、图像生成和音视频分析等领域。它以直观示例呈现,并支持本地运行,解决了数据隐私和响应速度问题。
本周最受关注的进展包括DeepSeek发布6710亿参数模型DeepSeek-V3、智谱开源GLM-PC基座模型CogAgent-9B、阶跃星辰推出增强型AI图像模型Step-1X-Medium、阿里通义千问开源视觉推理模型QVQ-72B-Preview、马斯克xAI完成60亿美元C轮融资以及Cursor融资1亿美元。这些进展涵盖了AI领域的算法优化、模型性能提升及投资动态,体现了技术进步和行业发展的前沿方向。
木易分享了OpenAI公司结构的重大变革,旨在通过将营利性子公司转变为特拉华州公共利益公司(PBC)来吸引传统投资,并确保其使命——确保通用人工智能造福全人类的实现。
木易介绍了自己的公众号“AI信息Gap”,专注于分享AI知识,并介绍了国产AI公司DeepSeek的技术和产品。DeepSeek发布了一系列模型,包括V3,并且在性能上表现出色,如参数量大、训练高效等。同时提供了多种使用方式。