破解合规难题,AI高质量数据集建设正当时

阿里开源的Qwen2.5系列训练数据规模达18万亿 token,推动AI大模型发展。但大规模训练带来幻象问题,RAG技术及工业场景应用以数据为中心成为趋势。国家和行业正积极推进数据标注产业发展规范,提升数据标注行业的合规能力。

重磅!国家科学技术奖励:鼓励主要论著优先在国内学术刊物上发表

MLNLP社区致力于促进国内外机器学习与自然语言处理的交流合作。科技部发布了修订后的《国家科学技术奖励条例实施细则》,明确每年评审改为每两年一次,新增了提名评审机制、诚信监督和保密要求等内容。