AI技术研习社，作者每时AI

一文详解！大模型性能测试全指标、计算方法及优化指南

2025年1月21日14时作者 AI技术研习社

最近一周，我参与了一些第三方大模型的性能测试。发现对于实时性和稳定性要求较高的应用场景，模型的时延、并发性能、稳定性和生成准确性等指标成为衡量优劣的关键。

2025年1月18日22时作者 AI技术研习社

近年来检索增强生成技术的发展使得语言模型能够高效利用外部知识。然而小语言模型在RAG中的使用受限，MiniRAG通过语义感知异构图索引和轻量级拓扑增强检索解决了这个问题。

2025年1月14日14时作者 AI技术研习社

文章介绍了开源本地大语言模型LLaMA2如何在本地环境中实现文本转SQL功能，强调了其在数据隐私保护中的重要性。

2025年1月12日14时作者 AI技术研习社

基于向量数据库的智能图像搜索技术有望提高脑肿瘤诊断效率，通过语义搜索功能快速检索相似图像，提升医生的工作流程。

2025年1月6日14时作者 AI技术研习社

随着检索增强生成（RAG）的快速发展，单纯依赖文本的 RAG 已经难以满足日益复杂的需求，多模态 R

2025年1月2日14时作者 AI技术研习社

在人工智能领域，多模态技术正迅速崛起，成为推动下一次重大进步的关键力量。回顾 2024 年生成式人工

2024年12月31日14时作者 AI技术研习社

作为一名对前沿技术充满热情的研究者，我深刻感受到检索增强生成（Retrieval-Augmented

2024年12月29日22时作者 AI技术研习社

从 0 到 1：用 RLHF 和 Python 构建奖励模型，全面提升语言模型能力！

2024年12月27日14时作者 AI技术研习社

文章介绍了在现有预训练模型基础上进行微调的方法，包括监督式微调、偏好对齐方法（如基于人类反馈的强化学习和直接偏好优化）、单体偏好优化等，强调了其在提升模型实用性和适应特定任务中的优势。

2024年12月23日14时作者 AI技术研习社

RAG三元组由三个关键指标组成：答案相关性、忠实度和上下文相关性。通过合理调整这些超参数，可以优化每个评估指标，实现更高效和准确的问答系统。使用deepeval库中的评估方法简单易行。