英伟达、港大等发布创新KV缓存,实现扩散模型无训练加速

专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态。扩散语言模型通过存储和重用先前计算的注意力状态来提升生成速度,但并行解码时往往导致生成质量下降。Fast-dLLM提出基于置信度的平行解码策略来改善这一问题。

史上最快,英伟达Sana模型安装和使用

英伟达联合清华大学和麻省理工开发的Sana AI绘画大模型,在4090显卡上可实现不到一秒出高清图的效果。它在中国开发者中表现出色,有望降低大规模应用的成本。文章介绍了如何安装和使用该模型,并附有工作流下载链接。

数万人在X上围观的Genesis,把「世界模型」造出来了?

来自多个知名大学和公司的团队推出了Genesis平台,它结合生成式AI与真实世界物理的准确性,提供通用物理引擎、机器人仿真平台等多样的功能。其目标是减少人类在数据生成中的投入,并实现自动化和自给自足的数据生态系统。