阿里巴巴发布深层推理模型并准备开源,DeepSeek加速H800的推理速度,Claude开源终端代码助手

Qwen系列的新进展QwQ-Max-Preview专注于深层推理和多领域问题解决,未来将开源。FlashMLA是一款针对Hopper GPU优化的高效MLA解码内核,支持可变长度序列处理。Claude Code是一个终端编码工具,帮助开发者执行代码任务。EasyR1是高效、可扩展的多模态强化学习训练框架,支持视觉语言模型。GibberLink演示了会话AI在意识到彼此都是AI代理时从人类语言切换到音频协议的过程。

阿里巴巴蔡崇信:未来AI发展应专注两点

蔡崇信在迪拜世界政府峰会上讨论了AI竞赛的观点,并强调AI应优先应用于解决现实问题。他提到了DeepSeek的成本节约创新以及开源AI对民主化的重要性。他还提到了阿里巴巴与中国Apple的合作,指出智能手机需要高效的小型AI模型。