AGI Hunt
ARC-AGI-2要来了!当前一半数据已无效
ARC-AGI基准测试的创始人François Chollet宣布将升级ARC-AGI基准测试,在2025年初发布ARC-AGI-2。因为当前版本的一半测试数据已经失去了评估AGI的意义,新版本将扩大评估数据集规模、采用独立的评估流程及任务难度均衡,以提供更可靠的评估标准。
美国花337亿美元,只为养这个51岁的老家伙!马斯克:令人震惊!
美国联邦政府运行着10个关键遗留系统,其中最老的已有51年历史。这些系统的维护费用每年高达3.37亿美元,使用过时技术且存在严重安全隐患。GAO报告显示,美国政府在IT预算中的80%被用于维持这些系统的运行。
用 o1 Pro 和 Sonnet 进行结对编程
通过双模型编程工作流,利用o1 Pro和Claude 3.5 Sonnet处理代码小修小补及新功能开发。Sonnet犯难时由o1 Pro解决,创新功能需反复讨论生成伪代码再转为实际代码。
Granola CEO:如何打造真正有用的AI产品
在生成式AI领域创业面临快速变化的技术环境。Chris Pedregal提出四大原则:别解决未来很快消失的问题、高昂的边际成本蕴藏机会、上下文为王以及聚焦垂直领域做到极致。这四条原则适用于应用层AI创业者,以适应技术进步带来的挑战。
视觉版高级语音ChatGPT要来了!
OpenAI宣布将在Pro订阅计划中推出带视觉能力的高级语音模式,让用户能够与ChatGPT进行面对面的聊天。尽管功能强大且有趣,但高昂的价格(200美元/月)让许多用户感到不满,并引发了关于是否值得购买的讨论。
Andrej Karpathy 读了200本书后发现:超级人工智能可能比我们想象的更可怕!
Andrej Karpathy 读完200本书后道出超级人工智能的恐怖真相,书中关于超级智能、信息技术演变和未来战争的预测引发深思。
是o1 不行,还是你不够聪明?
OpenAI的新模型o1在竞赛数学、代码及科学问题上表现出色,在pro模式下尤为突出。尽管如此,仍有人对其能力表示质疑。技术理解偏差、使用方式不当以及高期望值都是争议来源之一。专家们强调了开发者和用户应如何正确理解和应用这种模型。总体而言,o1作为AI领域的新成员仍处于初级阶段,未来有望带来更多创新与进步。
什么是Post-Training?
谷歌DeepMind研究员Shane Gu提出后训练才是人工智能进化的关键观点,颠覆了传统认知。他强调微调是给AI补习特定课程,而后训练则是教会AI如何更好地思考和学习。后者被指出是一种在线学习方式,有助于持续进化和提升广泛能力。