视频会议全双工音频:笔记本电脑是否能符合预期?

A DXOMARK audio laboratory showing a laptop being evaluated for audio conference sound quality, surrounded by numerous speakers reproducing the ambient noise of a conference call.

视频会议的普及与广泛使用促使DXOMARK 开始探究有哪些笔记本电脑能在视听通信方面提供最终用户最佳的体验。我们对笔记本电脑视频会议功能的初步评估有助于我们鉴定音频体验中一个非常重要的挑战:全双工音频性能。全双工是设备让双向通信时可能不产生回声,也不过度滤除声音的能力。

在这篇技术文章中,我们就全双工体验测试了几款市场上具代表性的笔记本电脑。Surface Pro 8 的性能会优于 MacBook Pro吗?商用笔记本电脑是否能符合远程办公者的需求?是否有必要购买高级笔记本电脑才能与朋友和家人有良好的双向对话?我们将会在以下的段落中回答这些问题。

全双工音频的挑战

在视频传播的内容中,音频声道必须以半双工或全双工的模式来处理。第一种模式是指无线对讲机中的其中一台:一次一个人说话。之后说话的人就像是通过电话交谈,在此对话期间,一方可以在另一方完成谈话前中断对方。

双向对话是视频会议的核心与灵魂,DXOMARK的「全双工音频测试」评测了笔记本电脑在传入和传出声音以及在两端的背景与环境噪声上的处理能力。当有人打断说话的人时,参与会议者会听到什么?当一种声音被消减时,是否还是听得到两种声音?或是两种声音都消失了?当您在说话时会听到回声吗?在群组讨论的模式下,离笔记本电脑麦克风较远的人所说的话可以被听得清楚吗?降噪的效果如何?软件足以抵消嘈杂的环境音吗?

全双工模式的音频缺失

在全双工对话中最常见的一些音频缺陷:

  • 声漏
  • 时域音损
  • 空间感的问题
  • 音调平衡不佳

本文中,我们将着重在介绍两个最关键的部份:声漏和时域音损。

声漏

全双工音频很难实现,因为播放传入的语音声道时可能会再次发送到传出的声道中,造成音频循环,有时甚至会出现拉森效应。声漏发生在播放笔记本电脑最终捕获的音频及往回传输的音频时。因此,有必要实现对话两端的环境声音过滤以及回声消除,使其能有类似电话的性能。

Illustration of the phenomenon of full duplex audio leakage in a conference call
在电话会议中全双工音频声漏现象的图示,音频的声漏会让人在双向对话中听到自己的声音。

时域音损

任何用户不需要或者觉得干扰的音量或者力度随时间的变化都可归纳为时域音损。如上所述,所有笔记本电脑都经过调校以滤除一定响度临界值以下的声音,让「主信号」能不受外部噪音的干扰而通过。此外,降噪取决于噪声过滤算法,这也会造成时域音损的发生。

Audio Temporal artifact, fluctuations in volume

音频时域音损,音量波动

Audio Temporal artifact, consistent volume levels

音频时域音损,音量一致

时域音损会导致人在说话时有部分的声音被消除,这种现象称为声音的门控。

缺陷所造成的后果

回声

听到参会者的回声是声漏缺陷的直接后果。它有可能会因设备本身之外的因素而变得更明显,例如互联网连接的延迟或传输过程中丢失了数据包。为了维持在设备水平的测量,DXOMARK 优先评测笔记本电脑本身的声漏状况。

因环境噪音而形成的声音门控

.影响对话清晰度的另一大阻碍是一种称为声音门控的现象。它是时域音损造成的结果,当设备未调校成能适当区分主要信号和不需要的噪音时,就会发生这种状况。不需要的噪音可能是笔记本电脑的键盘声、背景中一些人的说话声或从窗户外传来的街道声。严重的声音门控可能造成在消减被认为是噪音的声音时也同时除去了说话者的声音。

最近在最先进的芯片组中所引入 的AI 基础降噪技术有助于改善这种情况,有时会完全消除声音门控,不过,这些算法仍仅限于高端的解决方案。

由于人声优先而造成声音门控

在双向通话的情况下,两个用户会同时讲话,这时很难准确的处理,最后往往是通话中有一人比另一人更具「人声优先」。谁没有经历过在参会人员众多的会议上,因为一位参会者不停地讲话而使得其他人的意见没有被听到的情况?

这种现象可能会让人有挫败感,特别是因为我们期望能有和我们在使用电话设备时相同的体验。但在电话会议中,笔记本电脑处理多个声道,有时还会超过十个,而手机只需处理两个声道。对于 DSP 制造商和笔记本电脑供货商来说,如此极为困难的算法是一大挑战。

A man disgruntled by a poor full duplex audio experience on a laptop.
另一位在重要的视频会议中对双向通话的人声优先感到沮丧的用户!

我们的测试设置

我们研发了一套完整的视频会议测试协议,涵盖了视频质量、音频播放和收录,同时还有全双工音频。在全双工方面,360° 声音录制模拟会议环境和双工场景,而设备在录制的同时播放内容。 我们也在各种场所进行真实生活测试,还使用常见的 V/C 软件,例如: Microsoft Teams、Google Meet 或 Zoom。

我们的其中一项测试设置是在我们的听力工作室重现了一个非常困难的使用场景。我们使用哈佛语句的录音,此为业界标准的语音质量测量方法[1]。该场景是由一个输入声道(为笔记本电脑的麦克风必须收录的内容)以及一个输出声道(为笔记本电脑的扬声器正播放的内容)所组成。输入声道包含背景声和一位男性的声音,而输出声道则是女性的声音。

在良好的视频会议体验中,男性说话者能够确实的听到女性的声音。一款具有优秀全双工技术的设备会只收录男性声音同时忽略女性声音。此外,收录男性说话者的声音时应降低背景说话者的音量,以便让女性能清楚的听到谈话内容。双向对话实验室设置的示意图:它重现出一名男性说话者身处在周围背景的人也在谈话的场景中。他的笔记本电脑播放着一名女性的声音,他正在和她交谈中。

A schematic representation of double talk lab setup: it reproduces a male speaker surrounded by people talking in the background. His laptop plays the voice of a woman, with whom he is having a conversation.
主要用户的内容:「The tongs lay beside the ice pail. Sell your gift to a buyer at a good gain. Farmers came in to thresh the oat crop.
DXOMARK 双工情境能够评测声漏、声音门控以及人声优先的问题。
上面的原声带呈现出测试时笔记本电脑前的完整氛围。

全双工音频测试结果

在我们第一轮的测试中,评测了来自三个细分市场 [2] 中的 10 台笔记本电脑以及各式各款的 CPUs [3]

条形图显示出各款笔记本电脑在DXOMARK 全双工音频评测中的排名。在视频会议双工音频方面,宏碁Aspire 5 是最出色的笔记本电脑。

宏碁Aspire 5 的性能在我们的评测中得到第一名:您不会听到自己说话的声音,不过,当两个人同时说话时,偶尔会出现声音门控的情况。我们的测试显示,出现声漏的设备通常没有声音门控,反之亦然。

内容:「The tongs lay beside the ice pail. Sell your gift to a buyer at a good gain. Farmers came in to thresh the oat crop.
宏碁 Aspire 5 的全双工录音。无声漏且声音门控控制良好。 主要语音清晰易懂。

当通话的双方同时讲话时,惠普ProBook 和联想 IdeaPad 5会出现严重的声音门控且音频会中断。

内容:「The tongs lay beside the ice pail. Sell your gift to a buyer at a good gain. Farmers came in to thresh the oat crop.
惠普 Probook 430 G8的全双工录音。严重的声音门控使得声音有时会完全消失; 听得到声音时却又显得十分失真。

苹果 MacBook Pro 有轻微的双工声漏,但对方说话的声音质量保持的不错,之后也能由 V/C 平台轻松过滤。声漏部份表现不理想的其中一例是华为MateBook 14s,它呈现的女性声音严重失真,使得声音难以区隔。

内容:「The tongs lay beside the ice pail. Sell your gift to a buyer at a good gain. Farmers came in to thresh the oat crop.
华为MateBook 14s的全双工录音。 声音失真且声漏大声。
苹果MacBook 14 M1 Pro 的全双工录音。 有声漏问题,不过,声音仍然非常自然。

同一品牌的测试结果也可能有所不同:我们非常惊讶地发现,IdeaPad 5 的双工性能是评测中表现最不理想的一款,而其Chromebook兄弟款IdeaPad Flex 5则名列第四名。商用设备的主要用途之一是用于参加在线电话会议,而商用笔记本电脑惠普ProBook 430 8G 在双工性能上表现不佳,这是另一件令我们感到讶异的事。

双工音频的另一个要点是设备的价格高低并非总是性能优劣的指标。在我们选择了不多但具代表性的几款设备中,可以看到表现最好的笔记本电脑是价格优惠的机种,而表现最不理想的则是高端笔记本电脑中居于中价位的机种。

最后,请记住,双工音频只是整个音频体验的一部分,包括录音和播放。虽然双工对于电话会议的圆满成功至关重要,不过,笔记本电脑具有丰富且强大的音频播放能力,以及精确的录音性能,有时候是可以弥补双工技术下因为声漏或声音门控所造成的缺失。敬请继续关注未来关于这些主题的DXOMARK技术文章!


[1] 「国际电气电子工程师学会(IEEE)语音质量测量推荐方法」,IEEE No 297-1969,第 1-24 卷,第 1-24 页,1969 年 6 月 11 日,https://doi.org/10.1109/IEEESTD.1969.7405210

[2] 为了在包含其他参与者的情境下比较笔记本电脑视频会议的性能,DXOMARK 就三个面向 — 性能、设计与价格 — 为笔记本电脑行业定义了一个区分系统。性能与半导体组件、屏幕技术和存储等元素有关;设计则考虑了设备的外型曲线、材料与结构的独创性;价格则是指评估进入该细分市场的切入点。我们在此评测保留了三个部分:经济型,主要受价格驱动; 商业型,主要由设计驱动;高端型则是由性能和设计所驱动。

[3] 除了使用第 10 代的 IdeaPad Flex 5 Chromebook 和使用第 8 代英特尔核心、较旧型的华硕 ExpertBook外,我们所测试大多数用于视频会议的英特尔笔记本电脑都是第 11 代。另外,我们测试的联想 Ideapad 5则是搭载 AMD Ryzen 5000,而 MacBook 是配备2021 版本的 M1 Pro。