公开数据集归档

小米模型实现声音理解新SOTA！数据吞吐效率暴增20倍，推理速度快4倍全量开源

2025年8月5日23时作者量子位

iDashengLM-7B
，基于Xiaomi Dasheng作为音频编码器和Qwen2.5-Omn

2025年8月4日16时作者智东西

小米公司正式开源声音理解大模型MiDashengLM-7B，其在22个公开评测集上刷新多模态大模型最好成绩，并在推理效率和数据利用率方面表现突出。该模型基于Xiaomi Dasheng作为音频编码器和Qwen2.5-Omni-7B作为自回归解码器训练而成。

2025年6月23日23时作者极市干货

华中科技大学开发的MonkeyOCR文档解析模型在OmniDocBench数据集上取得显著成果，相比MinerU、Qwen2.5-VL等开源和闭源大模型，在中文内容识别方面表现出色。该模型采用结构-识别-关系(SRR)三元组方法，并基于大规模标注数据集MonkeyDoc进行训练。

2025年4月2日23时作者机器之心

pSeek R1，用强大的推理能力再次点燃 AI 智力增长的火箭。
在上个星期，OpenAI 给 G

2025年1月17日14时作者 AI探索时代

训练数据集的质量对模型性能至关重要。为了准备高质量的数据集，需要明确任务、采集多样化的数据、清洗和预处理数据，并根据需求进行标注和拆分。

2024年12月10日8时作者 PaperWeekly