RL训练归档 - 每时AI

RAG中的表格数据序列化思路及R1类推理大模型训练实证分析

2025年4月14日14时作者老刘说NLP

是“是不是，图灵测试本质上是行为主义的，它只看AI表现出来的对话行为像不像人，并不关心它内部是怎么

2025年4月1日14时作者 AI技术研习社

ntivizing Reasoning Capability in LLMs via Reinfor

2025年2月10日12时作者新智元

规模格式调优和大规模自我优化，开发出了Satori，一个在数学推理和跨领域任务中均表现优异的7B参数