微软:GPT-4o-mini只有8B,o1-mini仅100B
微软在MEDEC研究中意外公布了其部分主要闭源大型语言模型的参数规模,包括Claude 3.5 Sonnet (175B),GPT-4 (~1.76T),Claude 3.5 Claude 3.5 (8B)和o1-preview (~300B)。
微软在MEDEC研究中意外公布了其部分主要闭源大型语言模型的参数规模,包括Claude 3.5 Sonnet (175B),GPT-4 (~1.76T),Claude 3.5 Claude 3.5 (8B)和o1-preview (~300B)。
这个集合包含多个功能的Agent,如AI客服、法律团队和招聘团队等。它利用开源资源实现这些高级应用,并提供详细的功能特点介绍。
DeepSeek AI 发布全新开源大模型 DeepSeek-V3-Base,完成率提升48.4%,在多语言编程领域超越Claude 3.5 Sonnet。该模型拥有256位顶尖专家的智库架构,通过MoE混合专家实现「专才专用」,支持上下文长度最高可达8K。
一位研究人员利用周末时间将谷歌PaliGemma2-3B-448px模型性能提升了18%,展示了小型化AI模型的强大潜力。该研究通过使用Gemini 2.0 Flash Thinking的能力,增强了基础模型在识别和推理任务中的表现。
Google DeepMind联合研究者发现不同模型组的智能体在游戏中表现出不同的合作倾向。Claude与Sonnet偏好合作,而GPT-4o则倾向于自私。实验通过引入惩罚机制来探索模型的合作行为影响。
木易分享了GitHub Copilot免费升级的消息,包括每月2000次代码建议、50条Copilot聊天消息等内容,并介绍了如何使用GitHub Copilot,同时提及了多个可供选择的AI模型和付费选项。
AI提出的想法被人类写成论文。一篇关于神经网络中的最小描述长度与’grokking’现象关系的研究,揭示了训练过程中模型复杂性的动态变化,并提出了基于失真压缩的新方法来衡量神经网络的复杂性。
通过双模型编程工作流,利用o1 Pro和Claude 3.5 Sonnet处理代码小修小补及新功能开发。Sonnet犯难时由o1 Pro解决,创新功能需反复讨论生成伪代码再转为实际代码。
本文综述了LLM驱动的GUI智能体的发展和进步,讨论了它们的历史演变、核心组件和技术,并展示了智能体如何通过自然语言处理技术执行多种任务,包括Word、Photos、浏览器、Adobe Acrobat和PowerPoint操作等。