AGI Hunt

OpenAI 称有证据证明DeepSeek违规使用其模型！

2025年1月30日8时作者 AGI Hunt

OpenAI指控中国初创公司DeepSeek使用其专有模型训练开源竞品，并引发英伟达股价暴跌5890亿美元。DeepSeek使用仅2048块GPU显卡和560万美元训练出性能卓越的V3模型，但违反了OpenAI的服务条款。

2025年1月29日16时作者 AGI Hunt

DeepSeek公司发布紧急公告，指有多名假冒账号冒充其官方。文章还介绍了DeepSeek的技术特点、适用人群及最新发布的模型性能。

2025年1月29日12时作者 AGI Hunt

在家无需昂贵显卡即可运行670B参数超大规模AI模型DeepSeek R1，Hugging Face工程师Matthew Carrigan提供了详细配置指南。

2025年1月29日8时作者 AGI Hunt

Meta因DeepSeek开源模型陷入被动，后者在性能、商业自由、训练成本等方面均超越Llama系列。然而Meta内部表现不佳，开发社区出现分裂，开发者们既有人转向DeepSeek，也有人坚守Llama等待反击。英伟达股价受此影响大跌，但支持者认为这将进一步扩大AI的舞台和能力边界。

2025年1月29日8时作者 AGI Hunt

OpenAI 推出专为美国政府定制的 ChatGPT Gov，引发数据主权担忧。该工具声称可以保存和共享对话、上传文件及使用高级模型，但引发了隐私问题。各国纷纷质疑OpenAI是否利用ChatGPT Gov来巩固数字霸权。

2025年1月28日16时作者 AGI Hunt

OpenAI掌门人Sam Altman首次正面回应中国大模型挑战者DeepSeek！
当DeepSe

2025年1月28日16时作者 AGI Hunt

671B参数的DeepSeek R1在UnslothAI团队的技术优化下成功压缩至131GB，仅需160GB显存即可运行。该模型在多项基准测试中表现出色，为开发者和用户提供了一种新的量化压缩思路。

2025年1月28日16时作者 AGI Hunt

开源界的「冰与火之歌」正式打响！
Image
当扎克伯格还在为Llama系列的开源策略沾沾自喜时，中

2025年1月28日12时作者 AGI Hunt

DeepSeek发布Janus-Pro模型，实现图文理解和图像生成的双面杀手。该模型通过解耦视觉编码路径实现了真正的”一心二用”，并采用统一架构设计、精心训练策略和MIT开源协议。其在理解任务得分0.8和生成质量上碾压DALL-E 3等主流模型。

2025年1月26日23时作者 AGI Hunt

Scale AI CEO 指责中国AI创新速度慢并呼吁加强对出口管制。引发争议及反击，强调AI竞争应合作而非对抗。

较早文章

较新文章