大模型归档 - 第42页共58页

AI意识更进一步！谷歌DeepMind等：LLM不仅能感受痛苦，还能趋利避害

2025年2月10日12时作者新智元

谷歌团队和LSE的研究表明，大语言模型在面对选择时能够权衡痛苦与快乐，这可能是实现’有意识AI’的第一步。该研究通过游戏测试发现，LLM能够在不同疼痛程度下做出权衡选择，类似于人类的本能行为。

2025年2月9日23时作者机器之心

AIxiv专栏介绍及其最新发布成果FireRedASR模型。该模型在公开测试集中取得卓越性能，相比现有SOTA模型错误率降低8.4%，参数量更小。

2025年2月9日12时作者量子位

研究团队通过对比SFT和RL两种方法发现，长CoT的生成需要大量的计算资源。他们提出了四个关键发现：SFT并非必需但能简化训练并提高效率；推理能力随着训练计算增加而出现，但并非总是如此；可验证奖励函数对增长CoT至关重要；基模型中的错误修正等技能需要通过RL有效地激励。

2025年2月8日14时作者老刘说NLP

老刘说NLP技术社区自建立以来围绕大模型、知识图谱、RAG和文档智能等主题发布每日早报、线上交流活动分享、专题报告等内容，欢迎加入。

2025年2月7日16时作者 AI前线

功训练出了一个名为 s1 的人工智能推理模型”的消息引起了很多人关注。该模型名为 s1，该模型在数学

2025年2月6日23时作者钛媒体AGI

▎
作为国内首个正式点亮的自研万卡集群，昆仑芯三代万卡集群不仅解决了百度自身大模型发展的算力问题，也

2025年2月6日16时作者 AI前线

作者 | DWARKESH PATEL
译者 | 刘雅梦
策划 | 褚杏娟
如果我们能够继续扩大大型

2025年2月6日12时作者机器之心

谷歌发布Gemini 2.0系列模型，包括Pro、Flash和Lite版本，可生成代码实现复杂任务，并且性能领先。Gemini 2.0 Pro在编码和复杂指令任务中表现最强，已在Google AI Studio和Vertex AI向开发人员提供试用。

2025年2月6日8时作者 AIGC开放社区

专注于大语言模型（LLM）的发展和应用的社区报道。英特尔实验室开源了RAG Foundry框架，支持灵活设计多种RAG用例，并详细介绍其数据创建与处理、训练、推理和性能评估模块。