Back to 技术文章
首頁 > 技术文章

音频测试解析:DXOMARK音频素材

去年10月,适逢我们推出全新的音频质量基准测试之际,我们也发表了几篇文章,概述了DXOMARK如何测试智能手机的音频播放录制。在本文中,我们将探索在测试中用于评鉴每个手机的录制质量的音频素材,以便让您更深入地了解我们严格的测试基准。

让我们从一个重要的问题开始:为什么需要音频素材?为什么不简单地拍摄音乐会、录制会议、打电话给朋友就好了呢?

在定义上,现实生活中的情况是不可复制的。

尽管这些情况确实都代表了智能手机的典型用例,但它们并不能被当作有效的测试环境。为了以不偏不倚的公正方式评鉴每个手机,我们的音频团队必须营造一个完全受控的环境,在完全相同的声音场景中测试每个智能手机,以便获得可靠而一致的测试结果。

因此,我们决定创建自己专有的音频素材,以响应我们的测试基准的高度特定需求。除了“户外”和“电子音乐会”环境外,我们的团队还构思了三个声音场景:“城市”、“办公室”“家庭”,每个场景的设计都旨在评鉴每个手机在特定场景下明确的特定属性。

“办公室”音频素材是存在于一般开放空间中的各种声音元素的混合体。

“办公室”音频素材专用于会议场景,它包含了小型开放空间中的交谈声、单击鼠标和键盘的声音,以及人们走动的声音。它着眼于信噪比和声音包络、背景音损、客观响度和感知响度,以及诸多音色、空间感和音损属性。我们可以在几种情境下使用每个音频素材:例如,我们使用“城市”录制来测试“生活视频”(用后置摄像头拍摄的视频)和“自拍视频”的录制质量。

每个素材都是背景声音的混合。我们在巴黎的许多地点(在塞纳河畔,在里弗里大街上川流不息的繁忙交通中,在余谢特大街的众多游客和音乐家之间,在蒙特盖尔大街上无数的商店和饭店之中,以及DXOMARK办公室里)用HEAD acoustics的八麦克风阵列录制,并在著名的IRCAM研究中心的消声室内用测量麦克风录制的语音片段 。

在IRCAM的消声室中录制

人声是评鉴语音清晰度的关键因素,因此我们的团队仔细考虑了这一因素,提出了四种不同音色(两个男性音色、两个女性音色),将不同的口音在不同的角度上以不同的响度交织在一起,另外还有两个制造捣乱的人声,专门用于制造干扰。所用的单词来自Harvard sentences(哈佛句子),由22个列表组成,每个列表包含10个语音平衡的句子。在其中,44个英语音素中的每个音素的出现频率均与其在英语中出现的频率相同。

讨论了这些音频素材的创建方式后,现在让我们深入探讨音频问题的核心,了解我们如何使用它们来评鉴智能手机的录制质量。请跟着我们步入DXOMARK的办公室:这是一幢现代化的建筑,里面有一个宽敞的大厅、一部电梯、一个走廊,然后我们步入了另一扇门、另一个走廊、另一扇门、一间实验室、一扇隔音门——最后,我们就进入了试听室里。

经过测试的手机放在试听室的中央

怎么了?进来,别害羞!在这里,我们以非常精确而可复制的方式播放手机麦克风的音频素材:我们将智能手机小心翼翼地放置在观众席中央,然后以360°在8个校准过的扬声器上播放背景声音,同时通过其他8个专用扬声器同步播放语音。

然后,我们将录制的文件与其他智能手机在完全相同的条件下录制的音频文件进行比较。为了让您听到其中的差异,我们准备了三部智能手机录制的相同音频片段的摘录,这三款手机分别为:当前在录制方面得分最高的手机、得分居中的手机,以及我们迄今测试过表现最差的手机。

DXOMARK音频素材

您可以根据评测所提供的音频文件认出这些手机吗?您也许想知道在这些摘录中需要听些什么东西。在其中,您可以在哈佛句子的第20个列表里找到第一句话(“The fruit of a fig tree is apple-shaped!无花果树的果实形状是苹果的形状!)” ):

在此“家庭”素材摘录中,声音应保持清晰自然,听起来不应该像是罐头里的闷响,也不应该有鼻音。声音强度的变化不应造成音量突然下降(这是由诸如过度压缩等暂时性音损所引起的),并且应该精确地为信号源定位。最后,背景声音的强度不应压过语音,以便让语音完全清晰可辨。在仅仅几秒钟的时间内需要听出许多音频元素!

您可以在留言部分中猜测我们在比较的语音素材中使用了哪些智能手机,并告诉我们您希望我们详加说明音频测试基准的哪个特定部分。