学术归档 - 第193页共283页

刚刚，DeepSeek官方发布R1模型推荐设置，这才是正确用法

2025年2月14日23时作者机器之心

自春节以来，DeepSeek 成为 AI 领域最热门话题。近日，官方推荐部署 DeepSeek-R1 的设置，包括不使用系统提示词、温度参数设为0.6等建议。

2025年2月14日16时作者 HyperAI超神经

之前版本，计算效率显著优化，API 设计更加稳定，充分释放硬件潜力，推理速度提升 1.7 倍！为百亿

2025年2月14日16时作者机器之心

人像视频生成领域的一个新进展，X-Dyna 使用轻量跨视频帧的注意力模块、人脸局部控制模块和人物肢体运动控制模块来实现精准的人物肢体动作及面部表情迁移，并保持自然背景的真实性。

2025年2月14日14时作者 GiantPandaCV

lgorithm-in-cuda 。
这里简要解析了一下SGLang v0.4版本中针对DeepSe

业研究人员。
社区的愿景
是促进国内外自然语言处理，机器学习学术界、产业界和广大爱好者之间的交流和进

2025年2月14日12时作者机器之心

微软研究院团队提出Transformer递归式自我提升方法，可在不修改基础架构的情况下解决长度泛化问题。通过多数投票和长度过滤，在10位数以内的乘法上实现近乎完美表现。

2025年2月14日12时作者机器之心

在大家纷纷将目光投向智能体的同时，另一个 AI 领域也可能迎来它的「ChatGPT 时刻」。
这个春

2025年2月14日12时作者机器之心

苹果研究人员提出蒸馏扩展定律，基于计算预算及其在学生和教师之间的分配，能够预测蒸馏模型的性能。该发现降低了大规模使用蒸馏的风险，并指导了优化教师和学生模型的计算资源以最大化学生模型性能的方法。

2025年2月14日12时作者机器之心

多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，

2025年2月13日23时作者极市干货

专门用于评估多模态大模型（MLLMs）在真实世界场景中全模态理解能力的基准测试集。研究发现现有的开源