语音识别归档 - 第2页共3页

RAG用于视频文章生成及东方语种及汉语方言识别Dolphin实现思路解析

2025年4月3日14时作者老刘说NLP

今天是2025年4月3日，星期四，北京天气晴朗。文章介绍了关于大模型测试《Large Language Models Pass the Turing Test》，以及RAG用于视频文章生成的方案WIKIVIDEO和面向东方语言的语音识别开源方案Dolphin。

2025年3月21日8时作者 NLP工程化

本课程介绍深度神经网络及其在人工智能任务中的应用，提升学生对该主题的熟悉度，并扩展其知识。

2025年2月24日16时作者量子位

百度回归 ‘百度一下你就知道’ 概念，结合AI技术提升了搜索结果的个性化和多模态内容。升级后的百度APP不仅提供了更精准的答案，还整合了语音、绘图等功能，并接入了DeepSeek-R1模型。这些变化反映了百度在向“内容化”转变的同时也在提升用户服务体验。

2025年2月18日16时作者量子位

字节跳动大模型团队再添强将。Google Fellow吴永辉加盟，加入Seed基础研究负责人职位。他曾是谷歌神经机器翻译项目及Rank Brain项目的贡献者，并参与了谷歌大模型Gemini的研发工作。

2025年2月9日23时作者机器之心

AIxiv专栏介绍及其最新发布成果FireRedASR模型。该模型在公开测试集中取得卓越性能，相比现有SOTA模型错误率降低8.4%，参数量更小。