大型语言模型归档 - 第5页共13页

来了，阿里巴巴开源最强大模型Qwen3，一开源就收获超17k星，效果超越顶级大模型

2025年4月29日11时作者每日AI新工具

，提供多种尺寸和专家模型，具备优秀推理、对话和工具使用能力。
Qwen3 是由阿里云 Qwen 团队

MLNLP是国内外知名的机器学习与自然语言处理社区。旨在促进学术界、产业界和爱好者的交流合作。近期提出DEER技术来解决大型语言模型冗长推理的问题，通过监测思考转折词和置信度评估实现。

2025年4月23日23时作者 AI寒武纪

斯坦福推出免费在线课程CS25: Transformers United V5，涵盖Transformer架构及其应用，包括语言模型、强化学习、AGI等前沿话题。

2025年4月22日14时作者小兵的AI视界

MedReason项目通过知识图谱和链式推理显著提升了大型语言模型在医学领域的推理能力和准确性。它涵盖了生成高质量推理数据、提升模型性能及确保医学准确性的功能，并已在多个医学基准测试中表现出色。

2025年4月21日16时作者新智元

基于采样的搜索不仅能在并行处理中大展身手，还通过隐式扩展让验证更精准。
先让模型生成多个候选答案，再

2025年4月19日16时作者机器之心

通过增加推理时的计算量提升性能时，加州大学伯克利分校与艾伦人工智能研究所突然扔出了一颗深水炸弹：
别

2025年4月16日11时作者 GitHubStore

本项目基于browser-use构建WebUI，支持多种LLM并提供自定义浏览器和持久会话功能。通过Python环境安装或Docker安装方式简单上手。