NUGEN Audio AI对白检查语音清晰度插件发布


NUGEN Audio宣布推出DialogCheck——一款单声道、立体声和多声道对白清晰度测量工具,能够客观衡量语音音频的可理解性。


该插件由双人工智能神经网络驱动,与Netflix共同开发,特别适用于电影、电视、广播、播客和游戏音频制作以及后期制作环境。



听众理解一段对白的能力受到许多因素的影响,包括语言、方言、发音、混响和效果、语音和背景噪音的响度,以及听众的听力能力、听音环境、扬声器的摆放位置和辅助视觉效果等其他元素。



DialogCheck具备多种工具,旨在支持工程师的对白编辑过程,例如集成的实时条形图和历史图表。此外,分布视图和数值统计提供了整个节目语音可理解性的概览。这些信息可用于指导工程师在重新测试之前修正问题。此外,跟踪功能可将视图与DAW中的音频播放同步,而“宏观视图”则在更广泛的历史视图中突出显示当前音频部分。DialogCheck还配备了多种出厂设置和预设,用户可以创建并保存个人预设,以便日后在特色“预设栏”中选择。



DialogCheck在前期制作中也有优势,可用于评估不同的麦克风配置、表演风格、房间设置等,以确保原始制作音频已经接近理想的清晰度水平。


DialogCheck采用了Fraunhofer IDMT开发的听力测量仪(LE-Meter),使音频工程师能够在混音过程中可视化听力,并进行混音后的检查以优化音频质量。LE-Meter旨在客观评估广播材料中对白的听力努力度,利用自动语音识别和心理声学建模以及指标来评估对白的可理解性。



“我们的LE-Meter能够实现语音可理解性和听力努力的客观测量与显示。”Fraunhofer IDMT听力、语音和音频技术分部个人听力系统团队负责人Jan Rennies-Hochmuth教授博士表示,“通过使用正式听力测试进行验证和优化,这为媒体制作人提供了一个精确的工具,用于分析和实施音频内容。例如,可以自动识别困难部分,以便在听力享受和可访问性方面进行改进。”


关于此次发布,NUGEN Audio首席执行官Paul Tapper博士表示:“语音清晰度差常被认为是电视观众投诉的主要原因之一,这使得对白可理解性对于音频专业人士来说越来越重要。由于工程师通常在声学专业环境中听音,而最终混音可能会在其他环境中播放,因此他们很难判断是否需要进一步修改以提高清晰度。NUGEN Audio DialogCheck能够提供音频文件的某一部分或整个项目中语音的客观测量。”


特性

  • 支持多达7.1.4声道

  • 实时条形图

  • 时间码锁定的历史图表

  • 实时瞬间清晰度读数

  • 中位数清晰度读数

  • 用户可定义的上下百分位读数


什么影响对白的可理解性?

许多对对白可理解性产生负面影响的因素是音频工程师无法控制的。语音可能使用了听众不理解的语言或方言,或者发音不够清晰,听众可能有听力障碍,或者处于不佳的听音环境中。


但还有一些因素是我们通常可以控制的,例如对白的响度、其他音频(例如音乐或背景噪音)的响度、音频信号的质量,以及混响和其他效果的使用等。如果尽可能地减轻这些因素的负面影响,那么那些我们无法控制的因素很可能就会引发较少的问题。


所有这些因素,无论是音频后期制作工程师无法控制的,还是我们可以控制的,都属于Netflix的TechBlog所提到的“对白完整性管道”(Dialog Integrity Pipeline)。


如何提高可理解性?

DialogCheck是一种测量工具,它不会对音频信号进行任何处理。但它确实提供了一个客观的数值,作为可能需要改进的指示。这可能意味着调整混音中对白、音乐和效果之间的平衡,也可能意味着调整音频处理,或者使用降噪和音频清理技术来调整源音频。在某些情况下,甚至可能需要求助于后期配音(ADR)!


DialogCheck还可以整合到前期制作流程中,以确保源音频已经达到了所需的清晰度水平。


价格与购买


NUGEN Audio DialogCheck现已推出,售价为279英镑。还可以下载免费的15天试用版。


(文:AI音频时代)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往