Kimi 刚登顶,阿里连发两模型反击!国产大模型,卷疯了
最近国产大模型竞争激烈,阿里Qwen发布新版本Qwen3-235B-A22B-Instruct-2507及Qwen3-Coder。Qwen3-235B-A22B-Instruct-2507为纯非推理模型,性能优于Kimi K2和Claude 4 Opus;Qwen3-Coder采用MoE架构,支持代理式编程任务,并提供命令行工具以接入开发环境。
最近国产大模型竞争激烈,阿里Qwen发布新版本Qwen3-235B-A22B-Instruct-2507及Qwen3-Coder。Qwen3-235B-A22B-Instruct-2507为纯非推理模型,性能优于Kimi K2和Claude 4 Opus;Qwen3-Coder采用MoE架构,支持代理式编程任务,并提供命令行工具以接入开发环境。
这个夏天,有多个新模型(如Grok 4、DeepSeek-R2等)备受期待。近期,关于疑似Grok 4 / Grok 4 Code的基准测试截图引发了广泛关注。这些数据虽然没有被官方认证,但表现出色,尤其是HLE和GPQA测试中表现突出。
谷歌新推出Gemini 2.5 Flash,兼具性价比与性能。支持可控思考、多模态能力,并在多个基准测试中表现优异。尽管不如旗舰Pro版本,但为开发者提供了灵活选择的模型。
一款名为Manus的AI代理应用在3月进入中国市场,引发广泛关注。该应用已收到超过260万用户邀请码申请,计划通过积分制进行收费,运行复杂任务需消耗一定数量的积分。
最近,OpenAI 推出的新模型 GPT-4o 价格高昂且性能升级显著。相比之下,DeepSeek 和谷歌的模型则更加实惠。更新后的 GPT-4o 在性价比、直觉和创造力等方面表现突出,但仍存在编程能力方面的不足。
阿里 Qwen(千问)团队发布并开源了一个32B参数的推理模型QwQ-32B,该模型在消费级显卡上可运行,并且性能媲美大模型。部署方法与之前DeepSeek-R1类似。
xAI上线免费API积分计划,每月提供价值150美元的免费API余额。加入数据共享计划可收集并使用API请求数据改进模型。此活动有助于获取高质量数据,适用于大规模AI模型应用需求。
木易在公众号’AI信息Gap’分享关于AI全维度知识,近期美国封禁TikTok导致网红转向使用小红书作为替代平台,小红书海外用户激增。木易分析了小红书需改变品牌定位、技术储备、用户增长等以适应国际市场,并收集了GPT-4o、Claude、Gemini-Exp-1206、通义千问和DeepSeek等AI工具的建议。
木易介绍自己为AI领域产品经理,并创建了专注于分享AI知识的公众号。最近Anthropic推出Claude新功能自定义回复风格(Custom Styles),让用户根据需求选择特定风格进行回答。该功能支持内置预设风格和自定义上传或描述风格两种方式。