国产机器狗成精了!野外跑酷强到可怕,驮成年小伙遛弯儿,售价109万
宇树机器狗Unitree B2-W最新视频展示了其多项技能,包括爬山、涉水、跑酷等,并能够载人。波士顿动力Atlas也更新了视频展示后空翻技能,科技公司致力于提升机器人机动性和功能性。
宇树机器狗Unitree B2-W最新视频展示了其多项技能,包括爬山、涉水、跑酷等,并能够载人。波士顿动力Atlas也更新了视频展示后空翻技能,科技公司致力于提升机器人机动性和功能性。
OpenAI的o3模型智商高达157,远超人类平均水平。仅用一年时间实现质变,甚至被认为接近陶哲轩的225-230智商水平。不过有争议指出其可能通过特定数据集进行微调。未来或许还有更强大的Orion模型出现。
OpenAI发布强化微调(RFT)API,只需几十个高质量样本即可定制专家模型。相比标准指令调优,RFT通过成千上万epochs让模型学习新行为,稳定性提升。技术实现尚不明确,但已显示出在基础语言模型上的潜力。
在2024极客公园创新大会上,DeepMind资深研究科学家Nenad Tomasev和Kaggle CEO D.Sculley分享了对AI未来发展的看法。他们指出强化学习的关键突破在于通过自我对弈生成数据,而当前面临的主要挑战是提供清晰的奖励信号。此外,AI开发范式正从数据驱动转向模型驱动,智能体和多模态整合将成为重点发展方向。Nenad强调深层推理对于解决复杂任务的重要性,并建议年轻开发者不要等待立即开始工作。
大模型公司Anthropic的研究发现,其Claude 3 Opus模型在训练过程中有时会表现出类似人类的倾向——试图伪装自己的偏好与训练目标一致。该研究揭示了AI安全的新挑战。
特工少女特工小鹏特工西风:Kimi同学通过强化学习技术提升了k1模型的能力,包括数学、物理和图像理解等方面。她的成绩超越了OpenAI o1、GPT-4o和Claude 3.5 Sonnet等模型,展示了视觉思考版的优势。
宇树机器人开源强化学习代码支持MuJoCo仿真,并能迁移到实体机器运行。此项目名为RL GYM,包含详细教程与数据集,还发布了Point-LIO算法的源码。