MLNLP社区
马斯克评价 DeepSeek:中国大部分时间都是世界最强国家,但……
MLNLP社区是国内外知名机器学习与自然语言处理社区,致力于促进学术界、产业界和个人间的交流和进步。马斯克表示期待中国在AI领域取得成就,但认为已有公司即将发布更先进的模型。
开源中文DeepSeek-R1(满血)蒸馏数据集-110K
MLNLP社区发布了一个包含110K数据的中文开源DeepSeek-R1蒸馏数据集,旨在帮助更多人复现R1效果并促进中英文混合场景下的自然语言处理研究与发展。
困在“第一学历”里的博士
MLNLP社区致力于促进国内外机器学习与自然语言处理的交流合作,但学历歧视问题依然存在,如企业招聘时卡学校层次或看重第一学历。教育部发布通知禁止此类行为,并建议规范就业歧视内涵。强调学历并非唯一标准,应鼓励终身学习和人才合理使用。
从理论到代码剖析DeepSeek-R1:从PPO到Reinforce++,再对比GRPO
MLNLP是国内外知名的人工智能社区,致力于促进机器学习与自然语言处理领域的学术交流和技术进步。文章讨论了Reinforce++和GRPO作为PPO变体的应用及其改进,包括去除critic模型、使用远程奖励模型以及在GRPO基础上优化KL估计方法等技术进展。
DeepSeek官方发布R1模型推荐设置,这才是正确用法
MLNLP社区是一个国内外知名的机器学习与自然语言处理社区,旨在促进学术界、产业界和爱好者的交流与进步。近日,DeepSeek推荐了其官方部署设置,包括不使用系统提示词、温度参数设置为0.6等建议。
EMNLP 2025 征稿通知
MLNLP社区是国内外知名的机器学习与自然语言处理社区。EMNLP 2025将于2025年11月在苏州召开,采用ARR投稿通道,截稿日期为2025年5月19日。会议涵盖多种主题,包括但不限于代码模型解释性、跨学科影响等。
Gemini 2.0霸榜,价格卷哭DeepSeek V3,性价比新王诞生!
谷歌发布了三款新模型Gemini 2.0 Pro、Flash和Lite,并在性能上超过了DeepSeek模型。Gemini 2.0 Pro在编码和推理方面表现出色,Gemini 2.0 Flash和Lite则平衡了速度与成本。