AMD跑DeepSeek性能超H200!128并发Token间延迟不超50ms,吞吐量达H200五倍
AMD MI300X在FP8下全面超越英伟达H200,吞吐量最高可达H200的5倍。得益于SGLang框架和优化的AI内核库AITER,MI300X在延迟相似的情况下实现了更高的吞吐量,并且在固定并发情况下性能提升75%。
AMD MI300X在FP8下全面超越英伟达H200,吞吐量最高可达H200的5倍。得益于SGLang框架和优化的AI内核库AITER,MI300X在延迟相似的情况下实现了更高的吞吐量,并且在固定并发情况下性能提升75%。
Meta GenAI团队提出的新框架VideoJAM显著提升了视频生成中的运动一致性,其效果超越了Sora等模型。VideoJAM能够处理复杂且迅速的动作,并与现有DiT模型无缝集成,提升运动质量达19.67%至4.88%。
阿里自研Qwen2.5-Max在Chatbot Arena大模型竞技场中表现优异,总分1332位列第七。尤其在编程、数学方面突出,综合排名第三,超越谷歌Gemini家族和Llama 3.1等模型。
欧洲版OpenAI Mistral 的CodeStral 2501版本发布,上下文窗口达到256k,并且在多个编程语言的代码补全能力上取得SOTA成绩。
超级小布助手通过多模态能力,包括视觉识别、语音理解与执行指令等功能,使手机交互方式发生改变。它支持用户使用电源键唤起小布助手,并具备强大的视觉理解和响应能力,如识屏问答和导航功能。
微软与OpenAI秘密协定要求OpenAI研发出带来1000亿美元收益的AI系统才能被视为实现AGI。双方围绕此定义展开谈判,同时存在其他方面的分歧,如产品使用权、云服务独占权等。
微软推出小模型Phi-4,参数量仅14B,在数学和编程能力上超过了大模型。其数学成绩超过GPT-4o等,还能处理长达16K的长文本,被称作midtraining训练范式的新成果。
中国电信人工智能研究院发布的新模型TeleAI-VAST,在16项子指标中有9项排名第一,包括物体分类、人体动作等。该模型展示了四位女主角的不同场景下的前后一致性和人物动作精准控制能力,并且实现了声音与画面的同步效果。此外,它采用了独特的两阶段生成架构,使得视频生成更加精确和可控。