2025年2月8日12时 - 第7页共8页

速递｜离开Anthropic，OpenAI联合创始人加入OpenAI前CTO的创业公司，疯狂挖角OpenAI

2025年2月8日12时作者 Z Potentials

OpenAI联合创始人John Schulman离开Anthropic，加入Mira Murati的新初创公司，后者曾在10月秘密筹集超过1亿美元。

2025年2月8日12时作者机器之心

文章介绍了一个名为”人类的最后考试”（HLE）的新AI基准，旨在评估大规模语言模型的能力。该基准包含3000多个问题，涉及上百个学科领域，要求模型不仅给出正确答案，还需提供合理的推理过程。目前最先进的SOTA模型在HLE上的准确率仍低于10%。

2025年2月8日12时作者 Z Potentials

DeepSeek-R1 的推出标志着开源模型与闭源模型之间的竞争平衡，同时提升了AI基础设施的质量和易用性。它在推理能力方面表现出色，并开启了新的应用领域，如自主AI代理、专业规划系统以及优化的企业人工智能助手等。

2025年2月8日12时作者新智元

MVoT。新方法可以边推理，边「想象」，同时利用文本和图像信息学习，在实验中比CoT拥有更好的可解释

2025年2月8日12时作者机器之心

神秘的 Ilya又杀回来了！SSI 拟融资 200亿美元，引发关注。该公司专注于开发与人类利益对齐的安全人工智能。

2025年2月8日12时作者机器之心

AIxiv专栏介绍及其新成果HugWBC控制器，支持机器人同时掌握多种步态及精细调整行为指令，提高运动控制能力。该研究成果在模拟环境中训练，并通过评估验证其有效性。

2025年2月8日8时作者 NLP工程化

Oat-Zero项目深入剖析AI模型的自我反思行为，并通过强化学习优化其推理能力，提供完整的实验复现步骤。

2025年2月8日8时作者 NLP工程化

R1-Computer-Use利用Deepseek R1的强化学习技术优化计算机使用场景中的AI行为，支持文件操作、命令行交互等多种任务。

2025年2月8日8时作者 NLP工程化

RAG-FiT框架通过微调提升LLM使用外部资料能力，使其在特定领域提供更准确的回答，支持医疗、法律等领域。

2025年2月8日8时作者 NLP工程化

ScrapeServ：一个自托管的API，能通过输入网址获取网页数据及浏览器截图，支持滚动页面并截取不同区域。它运行在Docker容器中，部署简单，并自动处理302重定向以保证内容完整性。