日期: 2025 年 1 月 20 日
豆包App灰度最新语音模式,实现了GPT-4o不会的唱歌
语音通话功能的提升,让AI落地的场景从教培和客服扩展到情感陪伴、心理咨询等更多领域。豆包更新了端到端的语音大模型,提高了对话流畅度、情感表达能力和角色扮演能力。
实测,小红书正式上线翻译功能
小红书宣布翻译功能正式上线,支持多语言和网络用语一键翻译。新增的搜索结果图片翻译和优先英文筛选能力方便非中国内地用户。用户点赞效率提升和即时获取日本网友对新番吐槽的功能。不过,中英文混合笔记或图文结合图片外文情况无法直接翻译。
2025 年 Next Token Prediction 范式会统一多模态吗?
本文介绍了多模态领域基于Next Token Prediction的最新进展,包括Tokenization技术、模型架构设计、训练方法与推理策略等,并提出了四个亟待解决的挑战。
DeepSeek-R1技术突破:基础模型强化学习+蒸馏小模型超越o1-mini
DeepSeek-R1正式发布,API上线、技术报告公开、开源8个模型,涵盖从小至32B的多种规模。报告亮点包括后训练RL和流水线开发技术,并证明了小模型也能达到强大性能。