机器之心，作者每时AI - 第86页共134页

探索跳跃式思维链：DeepSeek创造力垫底，Qwen系列接近人类顶尖水平

2025年2月28日23时作者机器之心

多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，

2025年2月28日16时作者机器之心

Andrej Karpathy发布了一个长达2个多小时的学习视频，介绍了如何使用大型语言模型（LLM），涵盖从基础交互到高级数据分析等多方面内容。

2025年2月28日16时作者机器之心

AIxiv专栏探讨了DataMan数据管理器在优化大语言模型预训练中的应用。该研究提出了一个全面的质量评分体系，用于15个常见应用领域的预训练数据质量评估和领域识别，显著提升了模型性能。

2025年2月28日16时作者机器之心

近日，谷歌发布了一项高难度基准BIG-Bench Extra Hard（BBEH），旨在评估AI模型的高阶推理能力。该基准包含了23个任务，并将每个任务替换为更难的任务，覆盖更多方面的技能需求。如o3-mini (high)得分为44.8分不及格，而其它模型得分不超过10分。

2025年2月28日16时作者机器之心

的爆火震撼 AI 行业后，也带动相关行业余震不断。其中，达摩院玄铁在春节期间宣布适配 DeepSe

2025年2月28日12时作者机器之心

开始了直播，奥特曼并没有现身。直播不到 15 分钟就匆匆结束了。
OpenAI 正式发布了其最大、

2025年2月28日12时作者机器之心

多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，

2025年2月28日12时作者机器之心

DeepSeek 开源了高性能并行文件系统3FS，实现了高吞吐量和强一致性，支持AI训练和推理工作负载。它利用现代SSD和RDMA网络提供共享存储层，具有分离式架构、强一致性和无状态元数据服务等优势。

2025年2月27日16时作者机器之心

论文提出了一种基于强化学习的两阶段训练框架，成功让G1人形机器人在现实世界中自主起身，并适应多种复杂地形。

2025年2月27日16时作者机器之心

UT Austin 和 Meta AI 推出的 APOLLO 方法首次实现了在类 SGD 内存成本下训练大模型，显著降低内存需求并提升性能。