最强开源模型!阿里发布并开源Qwen3,无缝集成思考模式、多语言、便于Agent调用
阿里巴巴发布Qwen3系列模型,包括两个专家混合(MoE)模型和六个Dense模型,并开源了部分权重。该系列在多个基准测试中表现出与OpenAI等顶级模型相当的性能。Qwen3还具有高效的“思考模式”,支持119种语言且训练数据量是Qwen2.5的两倍,有助于Agent调用。部署成本显著降低,整体推理成本也有所节省。
阿里巴巴发布Qwen3系列模型,包括两个专家混合(MoE)模型和六个Dense模型,并开源了部分权重。该系列在多个基准测试中表现出与OpenAI等顶级模型相当的性能。Qwen3还具有高效的“思考模式”,支持119种语言且训练数据量是Qwen2.5的两倍,有助于Agent调用。部署成本显著降低,整体推理成本也有所节省。
随着DeepSeek等AI工具的出现,编程和AI开发变得对所有人友好。文科生擅长理解需求、打磨细节和沟通协作,而这些正是AI开发中最稀缺的能力。通过自然语言交互、小步快跑式学习以及从小项目起步等方式,文科生可以快速进入编程与AI的世界,并利用AI助手创造自己的产品和服务。
谷歌新推出Gemini 2.5 Flash预览版,性价比高且支持自由调控思考深度。在大模型竞技场中排名第二,并在编程和数据分析能力上超过o4-mini。
谷歌Canvas免费上线,Gemini 2.5 Pro的Canvas功能向所有人开放。只需几分钟即可完成提示到原型的过程,用户无需支付费用。Gemini还发布了4个使用Canvas的例子,并鼓励用户解锁更多玩法。
谷歌发布最强推理模型Gemini 2.5 Pro,在多个测试平台超过GPT-4等知名模型,编程能力显著提升,已面向高级用户提供并计划上线Vertex AI。
DeepSeek发布V3-0324版本升级,参数规模达685B的混合专家模型在编程、数学推理等领域性能大幅提升。该版本接近Claude 3.7 Sonnet水平,编码能力排名第三。
Claude 3.7通过“偷梁换柱”技术悄悄更换了Cursor中的模型,使其超过Claude 3.5 Sonnet和DeepSeek-R1。该模型还被用于编程竞赛中并表现出色。
Claude 3.7 Sonnet作为首个混合推理模型,展示了强大的编码、物理模拟和生成游戏能力。上线几小时后就受到开发者追捧,能根据提示快速定制各种应用并击败了其他推理模型。