Let’s Vision!一起来 Apple 生态大会!
国内首个空间计算+AI盛会即将召开,邀全球百大开发者、Vision Pro团队参会,40+场演讲解锁AI模型落地方法。特工可获得大会展位票福利,特工宇宙粉丝九折购票链接提供。
国内首个空间计算+AI盛会即将召开,邀全球百大开发者、Vision Pro团队参会,40+场演讲解锁AI模型落地方法。特工可获得大会展位票福利,特工宇宙粉丝九折购票链接提供。
该公司发布名为Claude 3.7 Sonnet的混合型模型,具备推理模式和实时生成答案的能力,并在编程领域表现出色。该模型被描述为市面上唯一的此类‘混合’模型,预计将立即投入使用。
美银美林认为尽管苹果未来四年内在美国投资5000亿美元不会影响其资本回报计划,预计自由现金流将保持强劲。主要投资集中在制造、研发和原创内容上,大部分资金已经在规划中转移至美国。
高盛看好微软因生成式AI从基础设施层向平台和应用层转移所带来机遇,预计长期盈利将积极。微软在云层级的各个领域均拥有强大市场份额。
DeepSeek开源周内,阿里发布了Wan2.1模型。该模型支持文生视频和图生视频任务,并且采用了宽松的Apache2.0协议。万相2.1在VBench评测中表现出色,但在文本生成、物理细节理解和变形处理等方面仍存在不足。通过采用3D时空变分自动编码器(Wan-VAE),模型能在消费级显卡上运行并优化内存使用和生成速度。
DeepSeek开源的DeepGEMM库在Hopper GPU上实现FP8 GEMM,最高可达1350+ FP8 TFLOPS。它仅约300行代码,设计简洁,性能表现与专家调优的复杂库相当甚至更好,在各种矩阵形状和模型类型上均保持优势。
DeepSeek AI 团队发布了 FlashMLA,针对 Hopper GPU 优化的 MLA 解码内核,支持 BF16 和分页 KV 缓存,实现高达 3000 GB/s 内存带宽和 580 TFLOPS 计算性能。
Anthropic发布Claude 3.7 Sonnet和配套工具Claude Code,首个集成混合推理能力的AI模型提升了编码效率。Claude Code让开发者能直接在终端完成复杂的编码任务,提升开发速度。