Transformer 归档 - 第6页共11页

LLM如何高效理解用户？淘天发布首个基于用户表征的问答基准UQABench

2025年4月1日16时作者新智元

了高效推荐新路径。在此趋势下，淘天团队发布了首个基于用户表征的个性化问答基准UQABench，系统评

AI「癌症神探」降临：准确度近100%，医生也自叹不如！

2025年3月30日11时作者新智元

细胞和组织微观图像里精准揪出癌症踪迹，诊断子宫内膜癌准确率近100%，远超医生平均水平。
逆天！新型

AI就是所有人疯狂竞争，最后Google赢得比赛的游戏？

2025年3月25日11时作者硅星人Pro

2022年底ChatGPT推出后，Google被打了个措手不及。经过数月努力，Google推出了Gemini，并不断进行功能更新，使其与竞争对手OpenAI竞争。Gemini在图像编辑、开源模型、搜索融合及机器人技术方面取得进展，展示了Google在人工智能领域的潜力和决心。

ThinkLLM：大语言模型算法与组件实现

2025年3月25日8时作者 NLP工程化

ThinkLLM是一个开源项目，包含了Transformer核心算法、模型训练与优化算法、高效推理与部署算法、长序列处理算法等，帮助开发者和研究者深入理解大模型的底层机制。

腾讯混元、英伟达都发混合架构模型，Mamba-Transformer要崛起吗？

2025年3月24日16时作者机器之心

架构的挑战。
在众多非 Transformer 架构中，Mamba 无疑是声量较大且后续发展较好的一

谷歌对齐大模型与人脑信号！语言理解生成机制高度一致，成果登Nature子刊

2025年3月23日23时作者量子位

谷歌发现大模型与人脑语言处理机制惊人一致，二者内部嵌入能预测大脑神经活动。

AI语音合成新标杆！开源10小时斩获8K Star！1B参数实现电影级人声!

2025年3月15日16时作者开源星探

一款名为CSM的新开源TTS模型由Sesame最新发布，能够生成带有上下文情感、自然语气和音调变化的人工智能语音。它具有高保真效果、端到端Transformer生成能力、上下文理解以及实时语音生成等功能。

重磅论文！何恺明、Yann LeCun等改造Transformer，CVPR 2025已收录

2025年3月14日23时作者头部科技

Transformer模型可能迎来新变化。一篇最新论文提出无需归一化的Transformer模型能够达到甚至超过带有归一化层的性能，通过动态双曲正切函数（DyT）替代传统归一化层，有望进一步改进AI模型性能。

精度效率双冠王！时序预测新范式TimeDistill：跨架构知识蒸馏，全面超越SOTA

2025年3月9日23时作者新智元

新智元报道
编辑：LRST
近期，来自美国埃默里大学、澳大利亚格里菲斯大学等多地的华人科研团队提出了一种跨架构知识蒸馏框架TimeDistill，将MLP作为学生模型，其他复杂先进架构（如Transformer和CNN）作为教师模型，通过蒸馏复杂模型的优势至轻量级模型，实现计算负担大幅降低的同时显著提升预测精度。

一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31