OpenAI 称有证据证明DeepSeek违规使用其模型!
OpenAI指控中国初创公司DeepSeek使用其专有模型训练开源竞品,并引发英伟达股价暴跌5890亿美元。DeepSeek使用仅2048块GPU显卡和560万美元训练出性能卓越的V3模型,但违反了OpenAI的服务条款。
 AGI Hunt
AGI Hunt			OpenAI指控中国初创公司DeepSeek使用其专有模型训练开源竞品,并引发英伟达股价暴跌5890亿美元。DeepSeek使用仅2048块GPU显卡和560万美元训练出性能卓越的V3模型,但违反了OpenAI的服务条款。
在家无需昂贵显卡即可运行670B参数超大规模AI模型DeepSeek R1,Hugging Face工程师Matthew Carrigan提供了详细配置指南。
Meta因DeepSeek开源模型陷入被动,后者在性能、商业自由、训练成本等方面均超越Llama系列。然而Meta内部表现不佳,开发社区出现分裂,开发者们既有人转向DeepSeek,也有人坚守Llama等待反击。英伟达股价受此影响大跌,但支持者认为这将进一步扩大AI的舞台和能力边界。
OpenAI 推出专为美国政府定制的 ChatGPT Gov,引发数据主权担忧。该工具声称可以保存和共享对话、上传文件及使用高级模型,但引发了隐私问题。各国纷纷质疑OpenAI是否利用ChatGPT Gov来巩固数字霸权。
671B参数的DeepSeek R1在UnslothAI团队的技术优化下成功压缩至131GB,仅需160GB显存即可运行。该模型在多项基准测试中表现出色,为开发者和用户提供了一种新的量化压缩思路。
DeepSeek发布Janus-Pro模型,实现图文理解和图像生成的双面杀手。该模型通过解耦视觉编码路径实现了真正的”一心二用”,并采用统一架构设计、精心训练策略和MIT开源协议。其在理解任务得分0.8和生成质量上碾压DALL-E 3等主流模型。
Scale AI CEO 指责中国AI创新速度慢并呼吁加强对出口管制。引发争议及反击,强调AI竞争应合作而非对抗。