月度归档: 2025 年 5 月
Qwen3 凭什么封神?这 8 个关键点告诉你答案!
五一前夕,阿里通义千问发布的Qwen3系列模型在开源领域再次取得突破,支持多种语言、高性能计算和混合专家架构。该模型包括Qwen3-235B-A22B和Qwen3-30B-A3B两个核心模型,覆盖119种语言,并提供丰富的训练数据以降低部署成本。
谷歌发现LLM是Greedy Agent,提出用RL调教出理性决策
MLNLP社区是国内外知名的机器学习与自然语言处理社区,旨在促进学术界、产业界和爱好者的交流与进步。最新论文揭示了大模型决策中的三大缺陷,并通过强化学习微调结合思维链技术提升其决策能力。
Synthetic-Data-Zero-RL:让 RL 左脚踩右脚
MLNLP社区致力于促进自然语言处理领域的学术与产业交流合作。通过PromptCoT等方法生成高质量数据集,提高模型性能。近期实验表明基于PromptCoT合成的数据可用于零样本强化学习训练,提升效果接近官方预训练模型。
95岁屠呦呦,当选美国科学院外籍院士
诺贝尔奖得主屠呦呦当选美国科学院外籍院士引起热议,她未获两院院士称号引发争议。颜宁称‘士’含金量提升,多位中国学者在国际上获得认可。尽管存在年龄和推荐机制的不同,屠教授表示青蒿素项目是一个团队成果。更多人认为应改革科研评价体系以激励原创性贡献。
我国仅有4所“纯211”,被称为“984.5”大学,综合实力强悍,超越寻常985!
MLNLP社区介绍其愿景是促进国内外NLP学术、产业界的交流与进步,重点关注初学者成长。文章提及了四所211工程高校:南京理工大学、上海财经大学、西安电子科技大学和北京邮电大学,详细描述了它们的优势学科及学生就业前景。最后邀请关注者加入MLNLP社区技术交流群。
AI泡沫要破?微软和Meta:继续奏乐继续舞!
微软和Meta在同一天公布了最新季度财报,尽管宏观经济前景不明,两家科技巨头的财报数据均给出了超出分析师预期的营收和利润,带动各自股价上涨。Meta盘后涨超6%,微软涨幅近9%。硅星人梳理了两家公司关键业务表现及AI相关进展。
新型轻量级音频模型问世!1.5B参数挑战 Whisper 与 Qwen2-Audio!
一款名为Aero-1-Audio的新型音频模型发布,参数仅有1.5B但性能出色,支持长音频处理、语音识别和音频理解任务。训练时间短且资源占用低,适用于语音助手、实时转写等场景。
Claude深夜更新!DeepResearch+MCP入侵你的私人数据,威力很大!
Anthropic宣布Claude新增Integrations和Advanced Research功能,让AI能够连接用户的工作环境并进行深入研究。通过这些更新,Claude将作为工作伙伴而非单纯的对话助手出现。