Claude 3.5
爆火AI编程Windsurf突遭Claude全面断供,开发者大量退订!直接打脸OpenAI
Windsurf CEO发文控诉Anthropic仅五天通知就大幅减少Claude 3.5和3.7 Sonnet模型服务配额,导致用户体验受影响。Windsurf已采取措施应对断供,并通过BYOK开放所有模型接入通道。
刚刚!Karpathy又分享了有关“Vibe编程”的心得!
Andrej Karpathy 提出’Vibe Coding’,这是一种针对AI时代的新型编程范式。通过提供完整上下文和明确需求,AI能够生成更准确的代码。此过程中需要人工审查与测试以确保质量,并强调持续迭代开发。
大模型黑盒探秘:通过“电路追踪”(Circuit Tracing)揭示大模型内部推理机制?
2025年3月29日周六,北京晴天。文章提到了创业的观点和MCP的概念,并介绍了大模型推理可解释性的电路追踪分析方法及其应用实验。通过类比神经回路来揭示语言模型内部的计算机制,研究者构建了归因图以可视化模型的中间步骤,发现大模型在处理各种任务时具有多步推理、规划及复用不同语言特征的能力。
DeepSeek-V3-0324开源
DeepSeek-V3-0324 在数学推理和前端开发方面表现优于 Claude 3.5 和 Claude 3.7 Sonnet,这是 DeepSeek 最佳非推理模型。
港大开源全自动且高度自我进化的零代码AI Agent框架:AutoAgent
AutoAgent 是一个全自动且高度自我进化的框架,用户仅需自然语言即可创建并部署LLM Agent。它在GAIA基准测试中排名#1,并内置自管理向量数据库。支持多种LLM和灵活交互模式。
Grok还没热,OpenAI就来新基准:百万美元测试,Claude竟拿下40万!
OpenAI发布SWE-Lancer测试基准,评估AI代码能力。该基准基于真实项目任务,涵盖软件工程全栈开发和管理任务,价值100万美元。Claude 3.5 Sonnet表现最佳,但远不及人类开发者水平。
重磅!Windsurf Wave 3 来了:AI编程进入「一键完成」时代!
Codeium旗下Windsurf编辑器发布Wave 3更新,引入四项革命性功能,包括Tab to Jump思维跳跃捕捉器、Model Context Protocol(MCP)集成等,重新定义了智能编程的边界。