DeepSeek 归档 - 第32页共62页

AI聊天应用支持DeepSeek等先进模型HiveChat，实用人体视频抠像框架MatAnyone，HealthGPT医学大模型

2025年2月20日12时作者每日AI新工具

本期内容包括HiveChat、MatAnyone、HealthGPT、Minima和Local GRPO Training五个项目，涵盖了AI聊天应用、人体视频抠像框架、医疗大规模视觉语言模型、本地RAG容器以及GRPO策略训练工具。

2025年2月20日8时作者智东西

传阿里巴巴、国有基金表示有兴趣投资DeepSeek。DeepSeek爆火后考虑外部筹款，包括阿里巴巴在内的多家投资者有意为其下一阶段增长提供资金。

2025年2月19日23时作者开源AI项目落地

这段时间DeepSeek确实火爆，但服务器压力大导致问题频出。推荐两种免费方式：一是通过KTransformers本地部署DeepSeek R1模型；二是直接使用问小白平台，其速度快且功能完善。

2025年2月19日19时作者智能涌现

腾讯近期内部完成产品及团队调整，包括QQ浏览器、搜狗输入法等转入CSIG（云与智慧产业事业群）。此举意在加强AI产品的布局，尤其是针对办公工具和搜索市场。

2025年2月19日16时作者 AI前线

NSA。值得注意的是，创始人梁文锋参与编写并亲自上传了该论文。
根据论文介绍，DeepSeek 团队

2025年2月19日16时作者量子位

DeepSeek提出NSA稀疏注意力机制，显著降低大模型训练成本。实验表明，在64k上下文时，NSA前向传播速度最高提升9倍，反向传播速度提升6倍，解码速度提升11.6倍。论文已在arXiv上发布，梁文锋等DeepSeek原班人马参与。

2025年2月19日16时作者智东西

智东西2月19日报道，在DeepSeek公布最新稀疏注意力框架NSA论文的5小时后，“大模型六小虎”

2025年2月19日14时作者老刘说NLP

家一起参考。
围绕Ktransformer认知误区，长文本新策略工作，投标文件写作项目，RAG输入去