Adobe新的AI Translate Audio and Video 语音翻译功能 将视频人物语言直接改变
新的 Firefly Web 应用程序提供了一套由 Firefly 系列模型支持的工具,直接集成到 Adobe 应用程序中,新增了语音和视频翻译功能。
新的 Firefly Web 应用程序提供了一套由 Firefly 系列模型支持的工具,直接集成到 Adobe 应用程序中,新增了语音和视频翻译功能。
在2025年CES上亮相的新方案结合了Apollo510MCU和neuralSPOTAI开发平台,旨在为智能听戴设备和OTC助听器提供技术支持。通过先进的音频处理技术,实现实时、响应迅速的语音功能和始终在线聆听体验。
AudioSourceRE 发布了DeMIX Pro v6.1更新,引入了强大的语音分离模块和增强的残余音轨处理,为音乐、广播和电影制作带来了新的可能性,包括从歌曲中移除说唱。
Zyphra 发布了具有高保真语音克隆功能的新文本转语音(TTS)模型 Zonos-v0.1 beta,该模型基于 Transformer 和混合架构进行训练,并提供对语速、情感和音频质量的灵活控制。
YuJa公司推出AI生成增强音频描述功能,帮助受监管行业高效满足《美国残疾人法案》(ADA)要求,大幅降低时间和成本,实现流程自动化和体验优化。该技术通过智能暂停播放机制、多语言配音适配、交互式编辑等功能,识别关键视觉元素并生成自然流畅的语音解说,已在美国多所高校试点应用。
GN推出了新款AI驱动的助听器ReSound Vivia和ReSound Savi,具备蓝牙LE Audio和Auracast广播音频功能,旨在提升用户在嘈杂环境中的听觉体验,并简化连接过程。新产品的核心在于人机工程学设计、AI技术以及低功耗特性,以提高言语理解能力和用户体验。
Nvidia发布的新版NVIDIA Broadcast应用程序增加了‘Studio Voice’和‘虚拟主光’功能,使得RTX 3070显卡上的Logitech C922网络摄像头麦克风效果提升显著,但同时存在隐私和伦理争议。
2月7日,蕾哈娜对使用人工智能生成的音频模仿其声音的行为提出质疑,并批评未经授权使用的名人声音侵犯了名誉权和个人形象。同时指出,存在被恶意利用的风险,引发关于身份认同和真实性的思考。