Qwen3 凭什么封神?这 8 个关键点告诉你答案!

五一前夕,阿里通义千问发布的Qwen3系列模型在开源领域再次取得突破,支持多种语言、高性能计算和混合专家架构。该模型包括Qwen3-235B-A22B和Qwen3-30B-A3B两个核心模型,覆盖119种语言,并提供丰富的训练数据以降低部署成本。

谷歌发现LLM是Greedy Agent,提出用RL调教出理性决策

MLNLP社区是国内外知名的机器学习与自然语言处理社区,旨在促进学术界、产业界和爱好者的交流与进步。最新论文揭示了大模型决策中的三大缺陷,并通过强化学习微调结合思维链技术提升其决策能力。

Synthetic-Data-Zero-RL:让 RL 左脚踩右脚

MLNLP社区致力于促进自然语言处理领域的学术与产业交流合作。通过PromptCoT等方法生成高质量数据集,提高模型性能。近期实验表明基于PromptCoT合成的数据可用于零样本强化学习训练,提升效果接近官方预训练模型。

95岁屠呦呦,当选美国科学院外籍院士

诺贝尔奖得主屠呦呦当选美国科学院外籍院士引起热议,她未获两院院士称号引发争议。颜宁称‘士’含金量提升,多位中国学者在国际上获得认可。尽管存在年龄和推荐机制的不同,屠教授表示青蒿素项目是一个团队成果。更多人认为应改革科研评价体系以激励原创性贡献。

我国仅有4所“纯211”,被称为“984.5”大学,综合实力强悍,超越寻常985!

MLNLP社区介绍其愿景是促进国内外NLP学术、产业界的交流与进步,重点关注初学者成长。文章提及了四所211工程高校:南京理工大学、上海财经大学、西安电子科技大学和北京邮电大学,详细描述了它们的优势学科及学生就业前景。最后邀请关注者加入MLNLP社区技术交流群。

AI泡沫要破?微软和Meta:继续奏乐继续舞!

微软和Meta在同一天公布了最新季度财报,尽管宏观经济前景不明,两家科技巨头的财报数据均给出了超出分析师预期的营收和利润,带动各自股价上涨。Meta盘后涨超6%,微软涨幅近9%。硅星人梳理了两家公司关键业务表现及AI相关进展。