ICML 2025 何恺明团队提出:高度压缩的Tokenizer可直接用于图像生成

本文提出仅用32个一维离散 token 的高度压缩 TiTok tokenizer,无需训练额外生成模型,通过测试时梯度优化即可完成图像生成、编辑和修复任务。发现极致压缩提高了生成质量,挑战了传统“先压缩后生成”范式。

在线教程丨Mistral AI首个开源音频模型Voxtral,24B与3B版本兼顾多场景语音深度理解

Mistral AI 发布首个先进音频模型Voxtral,提供低成本高性能的24B和3B版本,支持多语言、长文本上下文处理等。该模型已在HyperAI超神经官网上线Demo,满足语音智能市场多元需求。