小米开源MiMo模型,称性能超阿里QwQ-32B-Preview及OpenAI o1-mini
小米发布首个为推理而生的大模型MiMo,仅7B参数规模超越OpenAI和阿里Qwen。技术团队强调预训练与后训练协同优化的重要性,通过特定数据合成及创新算法提升推理能力。
小米发布首个为推理而生的大模型MiMo,仅7B参数规模超越OpenAI和阿里Qwen。技术团队强调预训练与后训练协同优化的重要性,通过特定数据合成及创新算法提升推理能力。
RLMs的最新发展及其复现研究总结,强调监督微调和基于可验证奖励的强化学习方法的重要性,并讨论了数据构建、训练策略和奖励设计的关键要素。
腾讯音乐娱乐开发的开源平台SuperSonic融合了Chat BI和Headless BI技术,旨在提供强大的数据查询能力。它支持自然语言查询、语义模型构建以及可扩展架构,并已在实际业务中得到验证。
Nvidia开源最新语音识别模型Parakeet TDT 0.6B,能在1秒内完成60分钟音频转录,并以CC-BY-4.0许可协议开放源代码。该模型在Open ASR排行榜上表现优异,RTFx性能达到3380倍。
BrowseComp-ZH团队发布新基准测试集,对20多个主流大模型进行中文网页能力测试,结果显示多数模型在中文互联网检索上准确率低于10%,仅有少数能突破20%。研究揭示了模型在中文信息环境中的“死角”,强调了推理能力和多轮策略的重要性,并指出搜索功能的不当使用可能误导模型。
谢赛宁十年前被NeurIPS拒收的论文《Deeply-Supervised Nets》(DSN)今年获AISTATS时间检验奖。该论文提出中间层监督思想,继承并发展了后续作品REPA和U-REPA,对计算机视觉领域产生了深远影响。