不是 R2,不是 V4,DeepSeek 却悄悄放了个 6710 亿参数的狠活

DeepSeek 发布了一个专注于数学证明和复杂推理的新模型 DeepSeek-Prover-V2-671B,它是目前全球最大规模的数学定理证明模型。该模型在多个数学评测数据集上表现出色,可应用于数学论文验证、教材开发及数学研究助理等场景。

经验分享!从0开始做一篇Benchmark

MLNLP社区致力于推动自然语言处理领域的学术交流与进步,涵盖硕博生、高校老师及企业研究人员等多个群体。文章详细介绍了如何构建高质量的Benchmark,包括数据准备、清洗、审核、模型评估等步骤及其重要性。

第五届中国情感计算大会邀您共襄盛举

第五届中国情感计算大会(CCAC 2025)将于7月18-20日在四川成都举办,邀请多位知名学者作特邀报告,并汇聚青年才俊展示最新成果与动态。会议涵盖特邀报告、前沿趋势论坛等多环节,同时提供学生研讨会和闭幕式等活动。