过去四周,AI推理爆了,GPU在燃烧,英伟达依旧供不应求

大摩报告指出,英伟达GPU因主要大型语言模型对推理芯片的巨大需求而面临供不应求局面。尽管如此,供应限制和毛利率压力影响了市场情绪,但摩根士丹利仍上调了2026财年的收入和每股收益预测,并认为英伟达长期增长潜力强劲。

中科院提出DEER:让Reasoning提前退出,推理提速50% 准确率涨10%

MLNLP是国内外知名的机器学习与自然语言处理社区。旨在促进学术界、产业界和爱好者的交流合作。近期提出DEER技术来解决大型语言模型冗长推理的问题,通过监测思考转折词和置信度评估实现。

MedReason:大规模医学推理数据集、借用知识图谱将大模型打造成“医术”专家!

MedReason项目通过知识图谱和链式推理显著提升了大型语言模型在医学领域的推理能力和准确性。它涵盖了生成高质量推理数据、提升模型性能及确保医学准确性的功能,并已在多个医学基准测试中表现出色。