大模型
阿里 Qwen3 正式发布,一口气开源8款模型!这个五一注定不太平!
阿里云发布Qwen3系列大模型,包含8个不同规模的模型,涵盖235B参数的大模型对标顶级模型。亮点包括双模式思考能力、超大规模预训练数据、创新后训练方法及开箱即用部署方式等。
文心大模型又双叒叕进化了!
最新发布的文心大模型X1 Turbo和文心4.5 Turbo性能更优、价格更低,分别在工具调用、行程规划、逻辑推理、写作&问答等多个领域表现出色,并归功于多模态基础模型优化、自反馈增强的后训练框架等核心技术。
潘文博@香港城市大学:揭示大模型安全对齐的隐藏维度:从多维特征空间看对齐机制与脆弱性
MLNLP社区举办学术Talk,邀请香港城市大学潘文博分享大模型安全对齐的研究成果,揭示其内部机制由多个维度控制,主持人王鹏介绍相关背景知识。
大模型评估排障指南 | 关于推理
大模型评估排障指南系列文章的第一篇。介绍了调整 batch size、数据并行、精度调整、估算内存需求、量化、模型并行和用 CPU 减负等方法优化推理速度和减少内存占用的策略。