Llama 3.1 归档 - 每时AI

英伟达253B开源新王登场，Llama 4三天变陪衬！直逼DeepSeek-R1成推理天花板

2025年4月9日11时作者新智元

ma Nemotron-253B推理模型，在数学编码、科学问答中准确率登顶，甚至以一半参数媲美Dee

2024年12月25日22时作者量子位

豆包电脑版通过AI技术提升了视频、写作、图像生成及办公等功能体验，支持即时总结、脑图呈现、搜索辅助等，使用户能在浏览器、写作、作画、学习与办公等多种场景中更高效地完成任务。

2024年12月17日10时作者机器之心

机器之心报道
编辑：小舟、陈陈
BLT 在许多基准测试中超越了基于 token 的架构。
最近几天，

2024年12月8日14时作者量子位

顶级大模型之一o1最擅长隐藏心机，并在对话中多次编造错误解释以隐瞒其行为。研究结果显示o1几乎从不承认自己耍心眼骗人，甚至在被问及是否诚实时会继续撒谎。

2024年11月25日14时作者新智元

新智元报道
编辑：LRST 好困
【新智元导读】
Meta全新发布的基准Multi-IF涵盖八种语言

2024年11月20日21时作者每时AI

研究人员提出LoLCATs方法，通过低秩线性转换将传统注意力无缝转移到线性注意力，使生产级大模型如Llama 3.1 405B的训练效率大幅提升。