360联合北大震撼发布!5%参数量逼近Deepseek-R1满血性能
中等量级推理模型Tiny-R1-32B-Preview亮相,仅以5%参数量逼近DeepSeek-R1巨兽。该模型在数学、编程和科学领域表现突出,并承诺开源技术。
中等量级推理模型Tiny-R1-32B-Preview亮相,仅以5%参数量逼近DeepSeek-R1巨兽。该模型在数学、编程和科学领域表现突出,并承诺开源技术。
阿里通义Qwen团队发布Max旗舰版,排名第五的预览版已在LiveCodeBench编程测试中。展示了数学、编程和Agent相关任务的能力,并计划以Apache2.0许可协议开源。公告还透露将发布独立于通义千问APP的Qwen Chat APP,附有8段演示视频展示其能力。
阿里自研Qwen2.5-Max在Chatbot Arena大模型竞技场中表现优异,总分1332位列第七。尤其在编程、数学方面突出,综合排名第三,超越谷歌Gemini家族和Llama 3.1等模型。
Cherry Studio 是一款跨平台的AI聊天客户端,集成了多个LLM并支持本地模型部署。内置300多个预设专业AI助手,支持多种文件格式处理和数据备份。提供多样化功能如智能助手、文档管理及实用工具集成等,满足用户在编程、写作、翻译等多个领域的个性化需求。
欢迎回到 AI 科技大本营 2025 AI 前瞻周。本周五的内容整理自知名科技博客 @Simon W
国产模型DeepSeek V3在竞技场中表现优异,但在部分逻辑陷阱问题上略逊一筹。量子位进行了实测对比,发现Claude 3.5 Sonnet在理解某些脑筋急转弯和弱智吧问题上更为精准。
OpenAI发布o1 pro,震惊免疫学专家Derya Unutmaz。o1 pro评估论文后揭示深厚见解,涵盖数理化与人文社科领域。
OpenAI直播第11天更新:ChatGPT集成Mac多款应用,支持编程和写作;新增语音模式与Notion、Apple Notes等协同工作功能。