Transformer架构归档 - 第3页共5页

谷歌提出Transformer架构中，表示崩塌、过度压缩的5个解决方法

2025年4月17日8时作者 AIGC开放社区

专注AIGC领域的专业社区分享了Transformer架构在生成式AI中的应用及存在的问题，并提出了5个解决方案。

2025年3月28日23时作者开源AI项目落地

阿里开源的LHM项目基于Transformer架构，能够在几秒内从单张图像重建高保真、可动画的3D人体模型，提升重建准确性、泛化能力和动画一致性。

2025年2月27日16时作者量子位

Llasa团队分享了他们基于Transformer的语音合成模型的研究成果，该模型展示了通过扩展计算资源来提高语音合成效果的能力。研究揭示了训练时间和推理时间扩展对性能的影响，并开源了代码和权重以供其他研究人员参考。

2025年2月26日23时作者量子位

能创始人彭博正专注于一个更宏大的愿景。
在他看来，某个模型的爆火只是AI进化的一个普通节点，真正的技

业研究人员。
社区的愿景
是促进国内外自然语言处理，机器学习学术界、产业界和广大爱好者之间的交流和进

2025年1月23日12时作者路过银河AI

大模型已成为中国AI研究主流。DeepSeek在中文语义处理方面表现出色，成功翻译了俄罗斯教授的经济学导论。DeepSeek还提供了文本生成、分类与情感分析、问答系统等多样的功能。

2025年1月22日23时作者 NLP工程化

GitHub上的一个深度学习论文实现项目，包含多种架构和算法的代码实现与详细注释，基于PyTorch框架。