Back to 技术文章
首頁 > 技术文章

DXOMARK探讨视频会议的挑战

DXOMARK是图像质量测试以及音频、屏幕和电池评估领域的领导者,它将其摄像头和音频团队聚集在一起,评估视频会议,以努力改善整体体验。这些团队将运用各自的专业知识,科学地评估不同设备–笔记本电脑、网络摄像头和平板电脑–在视频会议中的图像和音频表现。

如今,我们将用智能手机通话,并且看到电话那头的人视作理所当然。但是,当我们在家工作,通过台式电脑或笔记本电脑参加会议时,有多少次我们会说:”你能听到我吗?” “你能看到我吗?” “你的图像不动了。” “你的话筒处于静音状态。”

在过去的两年里,世界各地因新冠疫情封城,迫使许多人在家里办公,突出了我们是多么依赖视频通话来与同事、家人和朋友沟通。

根据不同的通话场景,音频和图像的质量会有很大的不同。有时,在繁忙的开放式办公室里,一台笔记本电脑不能够提供足够流畅的视频和清晰的音频,而在喧闹的街道上,一部智能手机却可以传递更好的效果。虽然硬件的质量,如屏幕、摄像头、麦克风和扬声器,在视频会议体验中起着很大的作用,但也不能忽略软件。

研究表明,55%的信息是通过肢体语言和面部表情传达的,37%来自语音语调,只有7%来自所使用的语言(来源:福布斯)。像视频不流畅或音频不佳的问题不仅令人不快,而且会阻碍有效的沟通。糟糕的视频会议体验也会给企业带来更加严重的后果。

在2020年对美国2025名全职职工进行的关于远程工作状况的调查中,57%的人认为视频会议的视频质量使在家工作成为挑战,而56%的人认为音频质量使在家工作成为挑战(来源:OwlLabs)。 因此,难怪终端用户和制造商都在更密切地关注视频会议的不同方面。

最近一项非正式的DXOMARK调查发现,近四分之三的受访者每天都在使用视频会议。迄今为止,笔记本电脑和智能手机是视频通话中使用最多的设备(相对于平板电脑和智能显示器而言)。 然而,三分之一的受访者表示,他们在体验过程中经常面临视频不佳或音频质量差的问题。提到的主要问题是频繁的音频/视频滞后。

无论是从家里还是在路上,现在需要在任何地方都能稳定地进行视频会议。

挑战和限制

视频会议使用设备的摄像头、扬声器和麦克风系统,让个人或群体可以从不同地点相互沟通。这些元素的整合以及调校决定了视频会议体验是好还是坏。

笔记本电脑、平板电脑和网络摄像头的制造商在设计其产品时往往面临着尺寸和成本的限制,因此,摄像头往往只有狭窄的光圈、低质量的镜头系统和小传感器。例如,过于简单的镜头系统会在图像质量中引入像差,如强烈的色差或失真。镜头的微型光圈为小型传感器提供很少的光线,限制了其信息容量,从而影响了动态范围、纹理-噪点平衡以及色彩深度和准确性。

通信问题会导致视频质量问题。

图片来源:Ann Rodchua/Shutterstock

在音频方面,麦克风的数量、它们的位置和灵敏度以及各种播放配置,都要求音频能与各种设置和应用兼容。视频电话会议期间的音频处理可能会受到双重通话(当两个人同时说话时)、回声消除(一方用户的录音在对方扬声器的输出中被取消)、环境噪音降低(当用户在键盘上打字时,或环境很嘈杂时)的影响。

硬件的限制往往因与视频录制软件的兼容问题而变得更加复杂。不同的操作系统可能会以不同的方式处理摄像头驱动程序和API,从而导致不同的色彩配置文件。每个应用程序的视频和音频编解码器(编码和解码)也会影响端到端用户的性能,因为它可以使整个最终质量最大化,即使是带宽网络质量低的时候。

在某些情况下,安卓和iOS等操作系统对设备的摄像头和麦克风有推荐设置,但这些设置可能不是某个会议应用程序的开发者所喜欢的。这就是为什么这些应用程序会以不同方式解释和处理摄像头输入,产生不同的视频和音频输出。

当硬件、信号处理和软件设计在一起时,它们可以弥补彼此的缺陷,并消除许多限制。手机就是如此,大型厂商设法用只有几毫米厚的系统获得令人印象深刻的图像和音频性能。

但是,即使是同一制造商的产品,如果经过优化,与相同的软件一起使用,也会有大不相同的效果。

视频和音频质量

视频会议期间的图像质量主要取决于三个来源:光学/摄像头系统、图像信号处理(ISP)和软件。这些来源的整合和调校是很重要的。

在下面的例子中,用MacBook Pro(笔记本电脑,MacOS)、罗技Brio Ultra 4K(网络摄像头,Windows)和联想IdeaPad Flex 5(笔记本电脑,Chrome OS)在一个典型的室内场景中拍摄了三个视频。

MacBook Pro,肤色和白平衡自然

罗技Brio Ultra,高细节水平,白平衡问题

联想IdeaPad Flex 5,色彩、对比度和曝光问题

这些照片是在每个操作系统的自带应用程序上以最大分辨率拍摄的。MacBook Pro的QuickTime,罗技Brio的Windows相机应用,以及联想IdeaPad的Chrome OS相机应用。这三张图片的差别非常明显。MacBook是唯一产生最自然的肤色和白平衡的设备;罗技Brio有准确的曝光和高细节,但它的白平衡不在线;最后,联想IdeaPad在色彩、对比度和目标曝光方面都不尽如人意。

在另一个视频例子中,笔记本电脑被用在一个具有挑战性但又常见的背光场景中。

MacBook Pro,背光;肤色不准确

罗技Brio Ultra,背光,肤色不准确

联想IdeaPad Flex 5,背光;肤色不准确

所有这三台设备背景剪切明显,联想的目标曝光也不够准确。这三台设备的肤色都有些偏差,所有的设备都在主体上出现了噪点,联想IdeaPad Flex 5的噪点最多。

我们的专家在音频测试中发现,Macbook Pro音频渲染自然,但它音量不足,而且它只适度衰减了背景噪音。罗技Brio拥有较高的录音音量,但受到失真假象,以及以中频和中高频为中心的音调平衡(这是人类声音的频率范围)的影响。联想IdeaPad Flex 5的音频在音量和音调平衡方面与Macbook Pro相似,但在整个录音过程中受到非常明显的粉红噪音影响。

在技术方面,视频会议软件开发人员面临的最困难的事情之一是硬件和信号处理之间的巨大差异。两个人在不同的设备和不同的网络上使用同一个会议应用程序,会得到非常不同的结果,正如上面的例子中所看到的。

部分原因是每个设备制造商在设计产品时对外形、成本和性能做出了不同的选择。

但是,即使在设备共享相同的生态系统时,也有一些有趣的现象。下面的一系列视频截图是一个具有挑战性的背光情况:这些设备都在同一个生态系统内–它们都是由苹果公司设计和调校的。在这里,苹果iPhone 12 Pro Max(2020年)、iPad Pro(2021年)和MacBook Pro(2021年)的规格有很大不同。iPhone有一个可支持4K的前置摄像头,iPad有一个1080p的前置摄像头,而MacBook Pro有一个720p的摄像头。

苹果iPhone 12 Pro Max, 宽动态范围

苹果iPad Pro(第五代),色彩饱和度高

MacBook Pro,曝光不足

比较显示,iPhone的视频具有更宽的动态范围和更高的细节度,但面部曝光较低,而iPad Pro显示出更饱和的色彩和更明亮的主体,这也许是对使用情况的最佳取舍。同时,MacBook Pro明显显示出更多的噪点和更低的对比度,并且对主体的曝光略显不足。

在音频方面,MacBook Pro有很好的背景噪音衰减和真实的感知距离;iPhone录音的结果是声音被认为更遥远;而iPad Pro听起来更遥远,并有一个相当明显的咝咝声问题(”s “音被不自然地放大和饱和)。所有这些录音的音量都很低。

虽然这些设备是在同一个生态系统中工作的,但我们的专家在这些设备和其他设备上感受到的质量差距,会导致两个用户使用不同设备的体验大不相同,更不要说任何潜在的连接或软件问题。

结论

对产品制造商来说,整个视频会议系统的整合和调校可能是一项非常耗费资源的任务,一些制造商在发布产品时比其他制造商做更多的测试,正是为了捕捉潜在的问题。

但是,随着专业和个人使用的发展,视频通话成为人们日常生活中更加不可或缺的一部分,制造商必须提供正确的硬件和软件,以便为消费者提供高质量的体验。

通过对笔记本电脑、网络摄像头和平板电脑进行专门设计的测试,DXOMARK将继续仔细研究用于视频会议的设备,以评估图像和音频质量以及消费者体验。敬请关注DXOMARK关于视频会议的更多文章和见解。