日期: 2025 年 1 月 21 日
别管了,先玩下小红书AI翻译
小红书上线一键翻译功能后,通过大模型实现精准翻译和破译多种语言。从缩写到中式英语、二进制ASCII字符等复杂内容均能准确识别并翻译,甚至包括游戏语言和《冰与火之歌》中的“高等瓦雷利亚语”。AI还能根据上下文调整翻译,并处理网络用语如表情符号和俚语。小红书借此快速上线翻译功能,以增强用户体验和用户粘性。
大模型经典著作《大语言模型基础与前沿》
《大语言模型基础与前沿》介绍了大语言模型的基础和前沿知识,并探讨了其方法、应用场景及对环境的影响。内容全面且系统性强,适合高年级本科生和研究生、博士后研究人员等阅读。
Infra视角下的DeepSeek-V3,到底有多强?
DeepSeek发布的大规模MoE模型DeepSeek-V3在两千张H800上仅用两个月训练完成,实现了显著的性能提升。通过MLA和MoE结构改进以及辅助损失无化策略等技术优化,使得模型稀疏程度提高,同时引入了64路专家并行、流水线并行及数据并行等高效部署方案,在推理阶段取得了较好的效果。
超便携AI超算来了!这台「公文包」竟能塞下一台超级计算机
一台超级计算机被塞进了行李箱大小的公文包里。GigaIO和SourceCode联手打造的便携式AI超级计算机Gryf能在任何地方部署AI超算级别的算力,并且拥有模块化设计、强大的散热设计等特点,能支持PB级别数据集处理和现场直接将大量传感器数据转化为可行解决方案。
DeepSeek开源o1击毙OpenAI,强化学习惊现「啊哈」时刻!网友:AGI来了
中国版o1 DeepSeek R1通过大规模强化学习训练,在多项任务中与OpenAI o1打成平手,展示了不依赖监督微调数据也能显著提升推理能力的潜力。
字节,悄咪咪做了个 Cursor
一年里,字节在 AI 编程领域取得显著进展,其中 Trae 是一款智能协作 Native IDE,其功能包括用户管理和模型调用量管理等,旨在成为一站式大模型管理平台。