李彦宏谈DeepSeek:我们到处都能看到创新,因此必须适应这种快速变化|

百度创始人李彦宏在迪拜2025世界政府峰会上谈及DeepSeek热潮的影响,并强调创新的重要性。他表示大模型成本大幅下降,中国公司需营造有利环境促进创新。同时提到百度文心一言成为首个推出类ChatGPT应用的中国上市公司,并认为AI技术进步快但需要谨慎处理事故风险。李彦宏还提到了Robotaxi和智能体的发展趋势及算力投资的重要性。

AI意识更进一步!谷歌DeepMind等:LLM不仅能感受痛苦,还能趋利避害

谷歌团队和LSE的研究表明,大语言模型在面对选择时能够权衡痛苦与快乐,这可能是实现’有意识AI’的第一步。该研究通过游戏测试发现,LLM能够在不同疼痛程度下做出权衡选择,类似于人类的本能行为。

SFT并非必需!推理模型仅靠RL就能获得长思维链能力,清华CMU团队破解黑盒

研究团队通过对比SFT和RL两种方法发现,长CoT的生成需要大量的计算资源。他们提出了四个关键发现:SFT并非必需但能简化训练并提高效率;推理能力随着训练计算增加而出现,但并非总是如此;可验证奖励函数对增长CoT至关重要;基模型中的错误修正等技能需要通过RL有效地激励。