月度归档: 2025 年 1 月
DeepSeek绕开CUDA垄断,V3论文细节再挖出!英伟达护城河不存在了?
新智元报道
DeepSeek团队通过优化英伟达GPU的PTX指令集,绕过了CUDA实现了高效训练超大规模语言模型。这一突破引发了业界对CUDA护城河的质疑。
中国不只有DeepSeek,阿里除夕夜抛出重磅新模型,是时候整体重估中国AI资产了吗?
阿里云发布Qwen2.5-Max大模型,在多个权威基准测试中表现出与全球顶级模型比肩的性能。该模型采用超大规模MoE架构,支持高达100万token的上下文窗口,并在低成本高性能方面具有潜力,引发市场对中国AI资产重估的讨论。
一个神器,提取、解析和优化从文档到多媒体的任何数据格式
OmniParse是一款开源工具,能够高效地将多种非结构化数据(如文档、表格、图像、视频、音频等)转化为高度结构化的Markdown格式。它支持超过20种文件格式,并通过强大的多模态数据处理能力简化了复杂的数据转换过程。