预训练模型归档

大模型微调实践｜Prompt tuning、PET、Prefix tuning、P-tuning的原理、区别与代码解析(一)

2025年7月15日23时作者极市干货

本文针对易混淆的Prompt learning、PET做详细原理阐释，并列出其区别，最后附简易版实现

2025年7月1日8时作者 NLP工程化

Protein-LLM-Survey综述了蛋白质领域的大型语言模型研究，涵盖序列、结构和功能预测等多领域应用，并提供了丰富的预训练模型和数据集资源链接。

2025年6月20日16时作者量子位

研究人员提出了一种‘嫁接’新思路——直接将预训练好的模型作为‘底座’，通过修改组件来研究新架构。这种方法在不增加大量计算资源的情况下提高了文生图模型的生成速度，并且保持了较好的图像质量。

2025年6月10日8时作者 NLP工程化

Kokoro TTS是一款强大的CLI工具，支持多种语言和声音格式，可将文本转换为语音，并提供EPUB、PDF和TXT等多种输入选项。

2025年6月6日23时作者机器之心

字节跳动提出预训练模型平均（PMA）技术，在不增加计算成本的情况下显著提升大模型性能。通过合并稳定期检查点，PMA能预测衰减阶段表现，节省资源并加速训练进程。

2025年5月27日16时作者机器之心

理能力。然而，RL 在推理任务之外的应用，尤其是在目标检测和目标定位等感知密集型任务中的应用，仍有

2025年5月25日11时作者 NLP工程化

阶段是联合训练下游任务模型和预训练模型，来实现中文命名实体识别任务。
一.任务和数据集介绍
1.命名

2025年5月21日16时作者 PaperWeekly

（例如 RLHF 和 DPO）通过微调模型参数来实现偏好优化。然而，这种“训练时对齐”模式不仅耗时耗

2025年4月29日8时作者新智元

！它的性能全面超越DeepSeek-R1和OpenAI o1，采用MoE架构，总参数235B，横扫各