月度归档: 2025 年 1 月
最壕DeepSeek玩家8台Mac跑R1,10万+元凑496GB显存才能跑4bit量化版
DeepSeek-R1模型引发广泛关注,成本从数十万到几百元不等。其表现超越多种榜单和测试任务,包括LiveBench和PlanBench,在公开数据上甚至超过GPT-4和Gemini Flash。同时引发了关于构建新平台强化微调的兴趣。
正面硬刚OpenAI现役最强模型,国产AI一夜卷到硅谷
中国双子星DeepSeek和Kimi发布全新推理模型R1和k1.5,性能接近OpenAI o1,引发业界关注。Long2Short训练方案成为亮点,提升了短推理路径模型的性能。
在可以 RL 的地方,将迎来更多「李世石时刻」
Kimi 和 DeepSeek 通过 RL 技术分别在 short-CoT 和 long-CoT 模式下取得了出色表现,并提出了一些关键技术,如 Partial rollouts 来提升训练效率和长 CoT 数据涌现机制。该领域的发展显示了 AI 在复杂任务中的潜在能力。
Claude创始人:AI全面超越人类,只剩2-3年
Claude厂家Anthropic的CEO Dario Amodei表示,未来2-3年内各领域将出现比人类强的AI系统,并强调了将AI作为人的互补而非替代的重要性。他还认为AGI是一个营销术语,暗示在所有任务上都会超越人类。
酷!字节开源的一个非常智能的论文搜索代理:pasa
酷的PASA系统是一个智能的论文搜索代理,能自主调用搜索工具、阅读论文并选择合适的参考文献。PaSa-7B在多项指标上超越了其他基线,尤其在召回率和精确率上有显著提升,并且其架构由LLM代理、爬虫和选择器组成。