DXOMARK Speaker 测试基准

无线音箱是相当受欢迎的产品,无需电线(而是经由蓝牙、Wi-Fi或专有协议,与所连接的设备相互传输数据)即可连接到智能手机、电脑、电视和其他设备,再通过这些设备来控制音箱。许多无线音箱,也就是所谓的智能音箱,都配有集成虚拟助理,不需要手动即可激活互动功能,而且通常通过「热词」以及语音命令就能进行控制(语音控制未包含在我们第一版测试基准中的评测项目内)。DXOMARK已研发出新的Speaker 音箱测试基准,以评估和比较市场上不同价位中的无线音箱各自具有的音频播放质量。

被测设备

我们的DXOMARK Speaker测试旨在评测和评估各式各样的无线音箱,从规格及功能都相当基本的入门级产品,到对音频要求严苛的众多品牌发烧友都能满意的高端机种。

我们评测的音箱种类包含电池音箱和主电源音箱,以及具有或不具有语音助理功能的音箱。我们都是通过苹果 Airplay、谷歌Cast、专有协议或蓝牙的无线连接来进行测试。目前,我们仅测试单机;不过,将来可能会测试双/立体声组合音箱。

音箱测试基准

DXOMARK Speaker音箱测试基准是为了评测消费者在使用音箱的播放功能时所感受到的体验,通过一系列具代表性的用例场景来评估音频质量的相关属性。如同我们的「摄像头」、「自拍摄像头」与「音频」测试基准,音箱的测试也以双管齐下的方式,结合了可控的实验室中所进行的客观测试以及感知评估,同时以各种各样的音频片段进行测试,包括我们制订的音乐曲目、语音内容和其他多媒体内容。DXOMARK Speaker 的总体分数是从测试过程中获得的所有分数和评测结果计算得来。

实验室客观测试
在户外环境下进行感知测试。测试者交替将智能手机连接到被测音箱和参考设备上。

测试设置

通过智能手机连接并控制智能音箱以进行DXOMARK Speaker的测试;我们会依据其兼容性,择一使用苹果iPhone或Android 的手机。在进行我们的电视用例测试时,我们也会将音箱连接到智能电视,因此,如果有必要,我们会使用苹果电视、Android 电视以及其他的智能电视。

音箱会通过苹果的AirPlay或谷歌的Cast做连接;如果两者都无法使用,在万不得已的情况下,我们才会使用音箱制造商的专有协议或蓝牙进行连接。

客观测试和感知评估

DXOMARK会以客观测试和感知评估的方式评测智能音箱,两种方式均使用专有的基准进行量化。客观测试在DXOMARK音频实验室中进行,我们也在此评测智能手机的音频性能。我们在全新的半消音室内,以专业的设备(例如声级计和已校准的麦克风)记录音箱的输出;半消音室是一处可以吸收声音反射的空间。

消音室隔绝了外部的噪音,整个天花板和墙壁都铺设着楔形玻璃纤维棉,能消散声波的所有能量,进而完全消除回声。消音室可说是地球上最安静的地方。

当我们谈到感知评估时,我们说的是以人耳和大脑作为主要的测量工具。由于我们的音频专家已接受过DXOMARK音频基准所定义的「聆听特定提示」的培训,因此,他们能够分辨出音频质量属性中最细微的差别。

在专门设计的公寓中进行感知测试。

除此之外,我们已经制定了明确的基准,以确保与时俱进下的任何感知评估都是一致的。因此,同一款音箱在几个月后进行相同的测试会得到相同的结果。同时,所做的测试也要重复数次,以确保测试结果准确公正。这也意味着,我们的感知评估与客观测试一样合乎科学。

感知评估是在模拟真实生活的情境中进行,例如,专用于测试的公寓中所设置的客厅、浴室或厨房。

实验室设置中的精密麦克风
实验室的控制设置

DXOMARK对大多数音频属性的测试采用了客观和感知评估的综合方式。

音箱用户场景

音箱有各式各样的用途。我们设计了许多用例,用来测试所有音箱的所有音频质量属性,以确保我们的测试涵盖了各种最常见的场景。而为了找出目前消费者会在家中和其他地方的何处及如何使用音箱,我们在搜集全面性的数据和分析之后,筛选且设计出这些用例。

2020年消费者使用智能音箱的地方,来源:Voicebot.ai

构成用例的元素五花八门,举例来说,音箱在房内的摆放位置(中央、角落、靠近墙壁……),屋内地点(客厅、厨房、浴室、户外…),环境噪声 (安静的、喧哗的…),播放的内容类型(不同风格的音乐、播客、电影…),播放的音量(安静音量、轻柔、标称音量、大音量、最大音量)以及聆听者与音箱的相对位置(在前面,在旁边…)。

例如,在我们的「烹饪」用例中,我们收录了厨房内的声响,像是真实生活中以锅子煎炸或用刀子切割的各个声音。进行感知评估时,聆听者会位在厨房里的工作台旁;数个音箱播放出预先录制的厨房噪声,每个音箱只播放一种声音,且该音箱会放置在真实情境下的厨房里会发出该声音的位置,以呈现出身临其境的声音体验。此测试设置和测试条件不会随着时间改变,也就是说,结果是可重复的。

DXOMARK Speaker用户场景定义

我们以下列的这些标准,设置了我们的用户场景:

  • 浴室 – 在浴室听音乐:对于任何音箱来说,浴室是一处极具挑战性的环境,因为磁砖、玻璃和镜子往往会让残响和反射更加严重。在此用例中,我们大多会播放重低音音乐,使测试条件更为严苛。有些音箱能因应这些条件而自动调节,有些则不能。此用例旨在测试出那一款音箱能调节的最好。
  • 厨房 – 在厨房聆听食谱做法:在厨房以音箱播放播客和食谱做法的此用例非常适合用来评估语音清晰度。测试人员站在厨房工作台的旁边,音箱就放在测试人员后方的桌子上。厨房内还摆放了其他几个音箱,用来播放模拟的厨房噪声,让整个情境尽可能贴近真实。
  • 就寝时间 – 入睡前以小音量收听音乐或轻松的播客:在此用例中,音箱放置在床头柜上,以靠近聆听者。收听令人放松的音乐(例如古典音乐或爵士乐)和轻松的播客都是为了帮助入睡,因此,所有内容都是以小音量播放。
  • 聚会 – 和朋友或家人一同聆听音乐:此用例旨在模拟社交聚会的场合,在这种情况下,音乐不是重点,是为了衬托气氛而播放。音箱摆放在桌子的中央,这样能有效评估音箱的方向性,且音量的大小也不会干扰到聊天。
  • 派对 – 在客厅以大音量聆听音乐:在此场景中,电子音乐、嘻哈或电子舞曲这类风格的音乐在播放时声音都很大;但把音箱摆放在靠近墙壁(很多人会固定的摆放在此处)和房间中央(可能只是为了派对而暂时摆放于此)的声音都不会是最大声,因此,聆听者可以站在音箱的前面或周围。此为最重要的用例之一,因为音量过大会让软硬件都发挥到即限,因而暴露出音量较小时可能没那么明显的弱点。
  • 放松时刻 – 坐在沙发上听音乐或听播客:这是一项很重要的用例,仅仅是因为此用例重现出消费者在家中使用音箱的方式。我们以一般音量播放各种流行音乐、摇滚音乐或驰放音乐,并在音箱和聆听者间几个不同距离处评估其性能。我们也使用了主要是语音内容的播客用例。聆听者一直都面对着音箱。
  • 户外 – 在户外听音乐:在此用例中,会在像是阳台或花园的户外空间播放音乐,人们则聚集在音箱的周围。此场景与其他场景的不同之处在于音箱摆在户外播放声音时,反射和残响大大的减少,与放在室内时的声学效果大不相同。我们还利用此用例来检测以电池供电时和以主电源供电时的音箱性能是否有所差异。
  • 电影 – 在电视上观看电影时连接音箱以输出声音:在此场景中,音箱被用来替代条形音箱,在观看电影时播放出电视或智能手机的音频。在电视场景的用例中,音箱会放置在靠近电视的位置,就像条形音箱一样。检测延迟是此用例的重点之一,因为任何明显的延迟都会使得观看电影的体验不佳。
卧室用户场景设置
浴室用户场景设置
厨房用户场景设置。台面的扬声器播放典型的厨房背景噪音,如煮饭或切割。
放松时刻用户场景设置

DXOMARK定制音乐曲目

为了进行客观测试和感知评估,我们使用了各种各样的音频片段,包括专为此评测而制订的一系列音乐曲目。这些曲目包含了最受欢迎的音乐类别,包括古典、嘻哈、雷鬼,电子舞曲、流行、电子音乐、环境音乐和爵士乐。

选择这些风格的音乐是为了确保我们的测试与绝大多数智能音箱用户的体验有关。此外,每种类型的音乐在声音设计、响度、乐器、音色及其他特征方面都有自己的风格。通过不同类型的音乐,让音箱在测试过程中接受各种考验。

在DXOMARK音频团队精确的定义了每首曲目必须包含哪些确切的音乐元素之后,再由专业音乐人员进行制作、混音和处理所有的曲目。这一切是为了制作出包含特定音频提示的各类型曲目,以便进行感知评估时,让受测的音箱播放。在我们的测试中,这些制订的曲目主要用于感知评估,但也用于某些客观测试,例如最大响度的评测。

您可以点击此处聆听一些曲目的摘录

音频质量属性

DXOMARK Speaker测试基准中用来进行音频感知评估的标准属性是由国际电信联盟(ITU-R BS.2399-0)所定义。我们选择了与智能音箱最相关的属性:音色、空间感、力度、音量和音损。 根据用例的不同,其中有些属性占较高的比重。

音频质量属性[来源:Report ITU R BS.2399 0 (03/2017)]

音色

音色可展现出音箱依据和用户期望而正确输出频率的能力,要检测其低音、中频和高音频率以及它们之间的平衡。良好的音调平衡通常包括均匀分布的频率。 此外,我们也会检测每个频率区域中的共振、陷波频率和延展频率。

空间感

空间感可评估音箱能将音频元素适当放置在二维声场中的能力。能够准确地安置乐团或管弦乐团中的乐器声,或是电影声场中爆炸声的位置,就能让聆听的体验更美好。

空间音频具备几项子属性,包括定位能力、平衡感、距离、宽度和方向性。定位能力是音箱能营造出特定声音来自整个声场中特定位置的效果。平衡感是评测同个音箱内多个扬声器之间的平衡能力。距离则是指在整个混音中保持音频元素间相互距离的能力。 宽度是音箱能够从感觉到声音之处营造出宽广的外围区域。方向性是音箱在任何方向重现的声音都能始终如一的能力。

力度

力度是评测音箱呈现冲击力、清晰的起音和低音精确度的能力。在力度的评测项目中,我们也测试整体的音量依赖度,换句话说,也就是根据用户在调整音量格数时,评测起音、冲击力以及低音精确度的变化状况。

音量

音量测试是用来评估音箱在每种用例下是否具有足够的音量。我们客观的量测音箱在各种音量设置下的声压级(SPL),以测定最大音量以及音量的一致性。

音损

我们在进行音损评测时,会检测任何可能干扰到聆听者的声音,像是噪声或削波。音损也可能是因用户与音箱互动时所引起的,例如,变换音量、暂停、按播放或单纯的操作音箱。

音损有可能是时域音损或频谱音损。时域音损会随着时间有所变化,举例来说,突然将音量增大或减小时,或是「抽吸效果」。抽吸效果在流行音乐和电子音乐中最常出现,有些是预期中的效果,有些则不是。DXOMARK 在乎的是那些不该存在的抽吸效果。频谱音损和不属于输入音频信号所增加的频率有关。声音可能会失真且产生不必要的频率。音量较大时常发生这样的情况。

此外,我们也评测音频/视频延迟;在播放有声音的电影和其他视频时,延迟的问题会破坏用户的体验。

分数

在我们的测试过程中,我们取得所有用例中各个子属性的感知评估和/或客观评测得分。 子分数经由复杂的算法进行加权并汇整成属性分数(例如力度或音损)和用例分数(例如浴室、派对或户外)。然后,再由这些子分数组成总体的音箱得分。


Videos