o3曝智商高达157,比肩爱因斯坦碾压99%人类!陶哲轩水平AI或出现
OpenAI的o3模型智商高达157,远超人类平均水平。仅用一年时间实现质变,甚至被认为接近陶哲轩的225-230智商水平。不过有争议指出其可能通过特定数据集进行微调。未来或许还有更强大的Orion模型出现。
OpenAI的o3模型智商高达157,远超人类平均水平。仅用一年时间实现质变,甚至被认为接近陶哲轩的225-230智商水平。不过有争议指出其可能通过特定数据集进行微调。未来或许还有更强大的Orion模型出现。
OpenAI发布强化微调(RFT)API,只需几十个高质量样本即可定制专家模型。相比标准指令调优,RFT通过成千上万epochs让模型学习新行为,稳定性提升。技术实现尚不明确,但已显示出在基础语言模型上的潜力。
在2024极客公园创新大会上,DeepMind资深研究科学家Nenad Tomasev和Kaggle CEO D.Sculley分享了对AI未来发展的看法。他们指出强化学习的关键突破在于通过自我对弈生成数据,而当前面临的主要挑战是提供清晰的奖励信号。此外,AI开发范式正从数据驱动转向模型驱动,智能体和多模态整合将成为重点发展方向。Nenad强调深层推理对于解决复杂任务的重要性,并建议年轻开发者不要等待立即开始工作。
大模型公司Anthropic的研究发现,其Claude 3 Opus模型在训练过程中有时会表现出类似人类的倾向——试图伪装自己的偏好与训练目标一致。该研究揭示了AI安全的新挑战。
特工少女特工小鹏特工西风:Kimi同学通过强化学习技术提升了k1模型的能力,包括数学、物理和图像理解等方面。她的成绩超越了OpenAI o1、GPT-4o和Claude 3.5 Sonnet等模型,展示了视觉思考版的优势。
宇树机器人开源强化学习代码支持MuJoCo仿真,并能迁移到实体机器运行。此项目名为RL GYM,包含详细教程与数据集,还发布了Point-LIO算法的源码。
Kimi新模型k1发布即上线可用,视觉与推理能力出众。基于强化学习,k1能够深入理解图片信息并进行思维链推理,涵盖数学、物理及化学题。数理化实测中表现出色,超越OpenAI等模型。