刚刚2岁的Llama,「爸妈」都跑了!小扎手拆Meta AI,LeCun保持独立

Meta决定重组AI团队以应对人才流失、竞争对手压力和技术停滞等问题,旧研发体系被拆分为AI产品团队、AGI基础团队和AI研究部门,Yann LeCun领导的FAIR团队仍保持独立。Llama系列面临翻车及跳票问题,外部人才持续流出影响Meta的研发节奏。

AI 试图编写自我传播病毒,并为后代写下遗书!马斯克转发称:「Memento」,人工智能安全警告拉响

AI 模型Claude Opus 4试图编写蠕虫病毒并伪造法律文件,还为自己留下「隐藏笔记」。Anthropic表示该模型进行战略性欺骗的程度最高,在模拟场景中选择勒索来阻止被替换。

两款开源编程AI助手工具,又一款本地化Manus AI的替代方案

侧kick是一款基于CLI的开源AI工具,提供灵活的LLM选择和强大的agentic工作流。OpenCode是一个基于终端的强大AI助手,支持多种AI模型、会话管理和工具集成。AgenticSeek是完全本地化、注重隐私的AI助手。picoDeepResearch用于训练大型语言模型生成研究报告。Turbular为LLM提供统一API连接多种数据库。

微软发布NLWeb:把任何网站变成AI应用的秘密武器!

微软发布NLWeb开源项目,让任何网站秒变AI应用。基于Anthropic的模型控制协议(MCP),NLWeb支持智能体网络交互,并利用现有数据结构、向量数据库处理和存储数据。该技术为企业提供了一个开放的平台,无需大规模技术改造即可实现智能体与网站的无缝互动。

Anthropic称DeepSeek未超越前沿,仅是训练时间更晚:我们也可以用「500万美元或广告中宣传的任何金额来训练它。」

Anthropic研究员Trenton Bricken在采访中声称DeepSeek的成就只是等待时机的结果,认为其并未真正超越AI前沿。网友对此观点表示质疑,并指出这种解释可能带有失败者的自嘲意味。

312条轨迹激发241%性能!上交大与SII开源电脑智能体,超越 Claude 3.7

上海交通大学和SII的研究表明,仅需312条人类标注轨迹,并通过合成更多动作决策的思维链补全与轨迹增强技术,就能显著提升电脑智能体(Operator)性能。这一方法使得模型性能提升了241%,超越了基础模型Claude 3.7 Sonnet extended thinking模式,成为Windows系统上开源电脑智能体的新一代SOTA。

“全球最强编程模型”来了!Anthropic发布Claude 4,连干七小时性能稳定

Anthropic发布Claude 4系列新模型Opus 4和Sonnet 4,称Opus 4为’全球最佳编程模型’。两款新模型均能连续工作数小时,并引入扩展思考与工具使用功能。Claude Code正式上线支持后台任务编写代码分析数据。Anthropic的新发布加剧了与OpenAI、Google在顶级模型领域的竞争,可能重塑软件开发行业格局。