一秒十图!英伟达MIT联手刷新SOTA,一步扩散解锁实时高质量可控图像生成
新智元报道编辑:LRS 好困。研究提出SANA-Sprint,一种高效的蒸馏扩散模型用于超快速文本到图像生成,仅需1-4步即可在H100上实现7.59 FID和0.74 GenEval的先进性能,并支持实时交互式生成。
新智元报道编辑:LRS 好困。研究提出SANA-Sprint,一种高效的蒸馏扩散模型用于超快速文本到图像生成,仅需1-4步即可在H100上实现7.59 FID和0.74 GenEval的先进性能,并支持实时交互式生成。
谷歌开源低成本大模型Gemma-3,参数从270B到10B不等。采用自注意力架构优化长上下文处理能力,并集成视觉编码器和图像嵌入压缩技术。
斯坦福大学和华盛顿大学的研究人员提出了一个新的测试时间扩展方法s1,仅使用1000个样本就实现了与OpenAI o1级别的预览性能。该方法通过预算强制来控制解码时间,并在数学问题上提升了27%的表现。
构建高稳定性的GPU集群,是AI企业出海实现降本增效的必由之路。
12月5-6日,由智猩猩与智东西联
马斯克的Aurora图像模型突然下线引发热议,Grok 2+Aurora选项仅一天后消失。网友对逼真生成的人像表示惊叹,认为效果超FLUX Pro 1.1 Ultra。xAI研究员Chris Park透露Grok 3即将推出。
介绍了一个用于测量GPU上矩阵乘法最大FLOPS的工具mamf-finder.py,支持多种数据类型和不同GPU型号(如A100、MI300X和H100),提供了FP16和FP8使用示例。