量子位
推理模型规划任务成功率从5%到95%,DeepMind遗传算法新研究火了
DeepMind提出的新进化搜索策略’Mind Evolution’显著提升了大语言模型的推理性能。它结合了遗传算法和LLMs的自然语言能力,无需任务形式化即可处理复杂问题,并且能在规划和推理中实现响应更好、成本更低的效果。
OpenAI微软关系现裂痕,奥特曼紧急公关,导火索竟是DeepMind联创
微软聘请Mustafa Suleyman领导AI研发,与OpenAI关系紧张。马斯克批评微软算力不足。谷歌向OpenAI最大竞争对手Anthropic投资10亿美元。
OpenAI新研究:o1增加推理时间就能防攻击,网友:DeepSeek也受益
OpenAI的新研究展示了通过增加推理时的计算量来提升模型对抗性稳健性的潜力,这一发现可能缓解外界对Agent能力增强后面临安全风险的担忧。
最壕DeepSeek玩家8台Mac跑R1,10万+元凑496GB显存才能跑4bit量化版
DeepSeek-R1模型引发广泛关注,成本从数十万到几百元不等。其表现超越多种榜单和测试任务,包括LiveBench和PlanBench,在公开数据上甚至超过GPT-4和Gemini Flash。同时引发了关于构建新平台强化微调的兴趣。
Claude创始人:AI全面超越人类,只剩2-3年
Claude厂家Anthropic的CEO Dario Amodei表示,未来2-3年内各领域将出现比人类强的AI系统,并强调了将AI作为人的互补而非替代的重要性。他还认为AGI是一个营销术语,暗示在所有任务上都会超越人类。