强化学习
ChatGPT 全局记忆上线,xAI 开放 Grok 3 API,Llama 4 惹争议! AI Weekly 4.7-13
户推出全局记忆功能,模型可自动调用历史对话,增强个性化体验。
2️⃣
🚫 GPT-4 即将退役
:4
RL for LLMs,强化学习的 Scaling Law 才刚刚起步?
近期研究者通过奖励模型增强通用奖励模型在推理阶段的可扩展性,同时使用强化学习提升LLM性能。然而,当前强化学习算法仍有改进空间,奖励稀疏性是主要难点之一。
字节跳动刚发布 Seed-Thinking-v1.5 的技术细节报告
字节跳动发布Seed-Thinking-v1.5技术细节报告,其性能接近Gemini-2.5-Pro和O3-mini-high水平。
多模态RAG及多模态R1推理中如何为不同的视觉数据生成描述Caption?OMNICAPTIONER实现思路
度依赖开源,开源大多数只能赶凑合,能快速上线,但是带来的风险是会黑盒化,不可控。我们如果要开发自己的