从PPO到GRPO,DeepSeek-R1做对了什么?
本周通讯解读了三个值得关注的技术与行业动态。DeepSeek-R1 在强化学习中采用GRPO替代PPO,减少人类标注数据并设计精妙奖励机制;ARK展望AI对经济的影响;Kimi 1.5和DeepSeek-R1均使用Rule-based Reward提升模型推理能力。
news
本周通讯解读了三个值得关注的技术与行业动态。DeepSeek-R1 在强化学习中采用GRPO替代PPO,减少人类标注数据并设计精妙奖励机制;ARK展望AI对经济的影响;Kimi 1.5和DeepSeek-R1均使用Rule-based Reward提升模型推理能力。
微信灰度测试接入DeepSeek R1的AI搜索功能,用户可点开顶部搜索框尝试新的AI搜索体验。功能采用公众号推文 + 网页搜索策略,但存在精准度问题,目前仍在灰度测试阶段。
EMO2 是阿里巴巴通义实验室提出的一个音频驱动人像 AI 视频生成的升级版本,通过一张人物肖像图片和任意长度音频生成流畅自然的手部动作、面部表情及身体姿态。
CoCoMix 是一种预训练框架,结合连续概念与稀疏自编码器学习的语义概念,通过交叉熵损失预测选定的概念,并将其混合到模型隐藏状态中,显著提升大型语言模型性能。
微信灰测接入DeepSeek R1推出AI搜索功能,能快速回答和提供深度思考,并支持继续提问。小红书崛起导致百度日均搜索量降至86.99%,而微信入局有望蚕食其市场份额。
北京曲一线图书策划有限公司推出基于DeepSeek大模型的53伴学App深度思考AI解析功能,用户可免费使用。该功能通过逻辑推演与多维度解析能力,提升学生复杂题型理解效率约40%。
粉笔预计2024年收入不少于27.7亿元,与上年同期相比减少不多于8.3%。净利润预期将不少于2.25亿元,同比增长不少19.3%,主要由于员工开支减少。粉笔已完成多款AI产品矩阵的商业化部署,并推出多个智能化学习工具和服务。
xAI正就10亿美元融资进行谈判,估值约为750亿美元。该公司是OpenAI的竞争对手,XAI已筹集数十亿美元,主要产品是一款名为Grok的聊天机器人。