3.1K Star!超酷的STT语音转文字神器!支持实时转录、唤醒词激活!
RealtimeSTT是一款开源工具,专注于实时将语音转录为文字。它提供智能体验如语音活动检测和唤醒词激活功能,简化录音控制,并支持多种用法场景。
英伟达用1.5M模型让人形机器人动如真人!
一个只有150万参数的神经网络模型HOVER,让机器人的运动像极了人类。它能在英伟达Isaac模拟套件中以50分钟完成相当于一年高强度训练的速度进行精准控制。
最大肺活量的音频模型来了!SpeechSSM 能一口气生成16分钟音频,人都分不出来!
SpeechSSM 新模型可一口气生成16分钟语音故事,无需文字辅助。相比传统AI「业余选手」,它采用分割处理内容方法,使模型在任何时刻只需处理固定长度的内容,并保持声音特征稳定,实现流畅连贯的即兴演讲效果。
斯坦福研究:ChatGPT性能,曾出现下降趋势
专注于AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地。斯坦福大学与加州伯克利大学发布的《ChatGPT行为随时间变化》论文详细分析了GPT-3.5和GPT-4的性能波动及其原因,包括指令遵循度的变化、内容过滤能力的下降等问题。
阶跃星辰推理模型 Step R-mini 上线: smart与元戎启行达成战略合作,布局智能驾驶AI大模型 | AI 头条
整理 | 陶志远
出品 | AI 科技大本营(ID:rgznai100)
一分钟速览新闻点!
北爱尔