深入探究DXOMARK Display 协议

在2020年10月 ,我们推出了DXOMARK屏幕基准和第一版。在本篇介绍性文章中,我们将更细致地介绍如何测试手机屏幕,帮助你更好地了解DXOMARK用于科学评估屏幕属性的各类工具,来体现手机最常见的使用场景的具体案例:网页浏览、夜间阅读、车载导航、拍照、查看照片、游戏和观看电影,以及屏幕的自动亮度功能对光线条件变化的反应是否流畅和有效。

在我们进入正题之前,需要提醒各位的是,智能手机的屏幕表现并不仅仅关乎显示面板的质量。智能手机使用程序或算法来控制许多显示功能,而制造商选择由哪些设置来运用这些算法(其过程称为「调校」)。当然,某些算法可能会比其他算法更好,而且该算法实现在智能手机上还能大大的影响手机的性能表现,就像这些例子一样:

  • 软件决定了智能手机如何权衡帧率和电池使用量之间的平衡;根据所使用的应用程序,一些手机会自动调整帧率,以延长电池充电时间(即续航)。这意味着,(比如说)刷新率为120赫兹的智能手机并不总是以120赫兹的速度刷新屏幕。
  • 许多智能手机都包含一个环境光传感器,这是一个光电探测器,可以测量周围的照明条件;调校决定了自动亮度功能对来自光传感器的输入的反应有多快、多恰当,此外还决定了显示屏对所看内容的适应程度。
  • 当人们在手机上观看视频时,运动插值算法会在 “真实”(现有)帧之间生成帧,目的是让动画或移动动作看起来更流畅,同样,电池与帧率的权衡在这里也会产生影响。(我们将在特定屏幕属性的相关文章中再次探讨算法)

DXOMARK在许多不同的(有时是变化的)光照条件下进行测试,以尽可能地再现智能手机用户的真实体验,而不仅仅是简单地将显示器的性能与标准/规范中定义的 “理想 “观看条件进行比较。

最后,在了解我们的工具箱之前,首先要提醒的是我们在完全相同的条件下测试每个屏幕,以确保我们的结果是公平、科学严谨且可重复。

其次,除了某些明确的例外情况(例如:色彩准确性),我们都是以该设备的默认设置来进行测试。第三,与其他测试网站不同的是,DXOMARK的评测不仅包括以实验室为基准的客观测试,同时还涵盖了感知的评测。

客观测试工具

下图为我们的评估专家在测试智能手机屏幕时所使用的一系列工具。 我们使用下面的工具来测量颜色、光线(亮度)和对比度,并计算掉帧次数。

DXOMARK用于测量显示质量的测试设备,从左到右分别是光谱辐射仪、视频测色仪、带锥光镜的视频测色仪和小型摄像机。

我们使用这些工具来测量反射率、光泽度、闪烁和亮度。

其他测试装置,由左至右:光谱仪、光泽计、闪烁计、照度计,以及色度计。

我们使用以下工具来测量触控响应度、准确度和流畅度。

用于测量显示器触控属性的超高速摄像机和机器人

我们在DXOMARK Display Bench 中进行许多客观测试,Bench是一个特殊的测试箱,可进行自动化测试,并确保我们的工程师能在完全相同的条件下评测所有的设备。它包括被测设备和测试工具的支架(主要是光谱辐射仪和视频色度计),计算机控制的LED照明阵列,能够模拟各种光源和各级亮度,以及照度计。

DXOMARK Display工作台内的被测设备和视频测色仪。
DXOMARK Display工作台内的被测设备和光谱辐射仪

在上面的DXOMARK Display Bench内装照片中,您可以看到左侧安装了受测设备(DUT),右侧则是装有轨道的测试仪器;测试工程师使用计算机控制的伺服马达将仪器移至与DUT不同距离的各个位置。测试过程中,首先会将Bench密封起来以防止泄入任何外部光源,接着再由工程师控制计算机进行测试。

除了显示台,我们还开发了一个完全由计算机控制的穹顶系统,可再现更强烈的户外照明条件。穹顶的形状使非常强烈的光线得以扩散,使其从各个方向照射到智能手机的屏幕上,就像我们在户外体验照明条件一样,例如在太阳下。但是,穹顶达到极端亮度的能力使我们能够真正挑战设备屏幕能力的极限。

 

除了 Display Bench 之外,我们还研发出全面由计算器控制的穹顶系统,可重现比户外光照条件更强的50,000 勒克斯亮光。穹顶的形状可以使非常强烈的光线扩散,如此一来就能从各个方向照射到智能手机的屏幕,就如同我们在户外所感受到的光照条件一样。而穹顶能够达到极高的亮度水平,使我们能够真正的挑战设备屏幕性能的极限。

The Dome System in display testing

在上面的照片中,被测机型被连接到一个室内的轨道上,屏幕面向测试仪器。在被测设备旁边有一个勒克斯仪传感器,用于监测光的强度。测试仪器,即辐射成像色度计,安装在穹顶另一侧的外部轨道上(未画出),当被测设备的屏幕显示测试图案进行测量时,通过穹顶顶部的一个孔获得对比度和亮度测量。

该系统的每个元素–被测设备、控制光照度的电机(或模块)和仪器–都由计算机控制。

 

在客观测试方面,我们通过手机屏幕呈现校准的视频与照片图样来评测色彩、对比度、亮度、反射率,以及EOTF 曲线等等。我们进行的感知测试则包含播放我们所制作处理的一系列视频,通过真实内容的SDR 和 HDR 格式来进行可重复的评估。

屏幕测试中所使用的 DXOMARK 图表、图样和视觉效果的小样本。

感知测试工具

DXOMARK在感知测试中最重要的工具之一就是人眼。我们的感知测试核实并补充了我们的客观测试,因为我们要确保我们能在现实生活中看到客观测试时得出的结论。此外,客观测试只测量严格意义上的测量目标。考虑到驱动屏幕软件的复杂性以及人眼的复杂性,感知测试是评估显示质量的一个重要因素。

我们的屏幕工程师在进行任何感知测试之前,都会接受细致且全面的培训,其中还包括依据专业监视器上所显现的参考图像来仔细评估多款设备(受测设备与两个或三个设备进行比较)。专业监视器上每幅精挑细选的图像所呈现的色彩和亮度值都已经过精确的校准和量测。工程师会遵循非常严谨且符合科学的准则来进行比较,而此准则规定每次要由不同的工程师进行多次测试,以确保不会有所偏颇。

除了我们最重要的感知工具(人眼),我们的屏幕工程师还使用专门设计的手持设备,可以同时容纳多个智能手机、专业级显示器和照度计。

我们的工程师通过直接观察设备的显示屏来进行所有的感知评估。我们拍摄的照片仅用于说明,但绝不会将其作为任何形式的测试或评估的基础。但绝不作为任何形式的测试或评估的基础。

屏幕基准测试

下列各分项涵盖了目前DXOMARK Display 测试基准的所有属性,同时包括了我们所使用的设备、某些测试条件以及一些参数结果和定义的相关信息。

易读性

在我们的评测中我们常提醒读者,对最终用户来说,在不同的现实生活条件下能否轻松舒适地览阅屏幕才是最重要的考虑因素。DXOMARK运用Display Bench以及穹顶系统来重现完全漆黑到明亮日光(0、25、250、830、20 000、50 000 勒克斯)的光照条件。

实验室中所进行的客观测试与感知评测是相辅相成的,让我们能够评估设备在现实生活中的表现。

以下是三款手机亮度与对比度的测试结果比较图:

[Missing IDs in shortcode] [Missing IDs in shortcode]

从上面的图例中可以看到,在日光下的阴暗环境(< 0.01 lux)中进行测试时,所测得的对比度是无法达到所声称的对比值1:1,000,000(或无穷大)。我们的测试反映了用户的体验 —在阳光下很难看清屏幕。

屏幕可读性的另一项测试项目为量测亮度输出的均质性或均匀度,如下图所示:

Uniformity
亮度均匀度测试,侧; 伪色亮度图量测,对.
图片来源:DXOMARK;仅作图示

我们的易读性测试还包括找出影响易读性与用户体验的因素,像是伪像、大部份的闪烁和反射率。

闪烁是一种与光线的时间调制相关的现象,这是屏幕的光线输出在开和关之间的快速振荡。由于屏幕刷新率(无论是 60 Hz、90 Hz 还是 120 Hz)和脉冲宽度调制(电源在一定时间内打开和关闭灯光)之间的相互作用,在所有屏幕上,光线在时间中都会产生一定程度的时间调制。时间调制频率低于 90 Hz 时,就会产生闪烁。

目前已知的是,闪烁会引起不适、眼睛疲劳,在最严重的情况下还会引起癫痫。闪烁对每个人的影响也非常不同;有些人甚至能够感知到这种调制。由于屏幕和我们的眼睛都会根据较暗的光线而进行调节,因此在昏暗的环境下,闪烁的影响往往会更强烈。

因此这个测量对于评鉴屏幕舒适度很重要。

DXOMARK 测量智能手机的闪烁情况,以评鉴闪烁的感知经验。就我们的舒眼屏幕标志而言,在默认模式下或激活防闪烁模式(如果可用)的情况下,闪烁的检测率应低于 50%。

例如, 闪烁测试显示出即使设备的刷新率高,脉冲宽度调制(PWM)慢也会影响视觉的舒适度。(在下图中,第一个尖峰对应刷新率,最高尖峰则对应PWM。)

[Missing IDs in shortcode]

反射率是会影响易读性的伪像。智能手机的屏幕原本就是反光的,但反射光线的程度攸关到用户的体验。反射率会影响屏幕所显现内容的对比度。

举例来说,普通的玻璃板反射率约为 4%,塑料板的反射率约为 6%。虽然智能手机的第一层表面是由玻璃制成(折迭手机则为塑料),但由于复杂的光学堆迭(有时会加上具抗反射效果的涂层)产生了多重反射,因此,智能手机的总反射率(无涂层)通常约为 5%(或更高)。

为了测定设备的反射率,我们评测了可见光谱(400 nm 至 700 nm)内波长函数的反射光强度。我们使用 SCI(包含镜面反射光量测)模式中的光谱仪测试智能手机屏幕关闭时的反射率。SCI 模式可量测漫反射与镜面反射。

然后,我们根据可见色谱内的测量值计算平均值。

我们也使用 SCI(包含镜面反射光量测)模式中的光谱仪测试智能手机屏幕关闭时的反射率。以下的测量结果为可见光谱范围(400 nm 至 700 nm)内每10 nm 间隔波长的反射率。

[Missing IDs in shortcode]
可读性

除非另有说明,否则所有测试均在0至50,000 勒克斯的照度范围内进行,并使用白色色温/光谱钨灯、白色LED灯,D65彩色光源等等。

Sub-attribute Equipment Remarks
Vs. 环境光源 Bench + 光谱辐射仪(亮度,以cd / m2表示)+ 视频色度计(对比度,以:1表示)亮度级别:0、25、250、830 勒克斯
video colorimeter (brightness, contrast, given as :1) 亮度级别:0、25、250、830 勒克斯
亮度应适应观看条件,屏幕内容在任何条件下都应具有可读性,并尽可能接近原意。
Vs. 平均像素级别 Bench + spectroradiometer (brightness) + video colorimeter (contrast) at 20,000 luxDome + spectroradiometer (brightness) + video colorimeter (contrast) at 20,000 lux and 50,000 lux 亮度和对比度都不会随平均像素级别(APL)改变。
亮度  vs. 时间 能变化灯光和亮度级别的照明棚架. 亮度级别:0, 830 勒克斯 我们检测反应时间、顺畅度及变换时间。
EOTF* Bench + 光谱辐射仪 在20% APL的各种光照条件下进行测试 (0, 830, 20,000 lux) ; 越接近目标值伽玛,效果越好。
均匀度 视频色度计 + 标准镜头 在0 勒克斯下进行测试; 结果以百分比表示(越高越好)
Vs. 角度 视频色度计 + 锥光镜 在0 勒克斯下进行测试; 亮度损失越少越好
屏幕反射率 光谱仪 (+ 光泽计、关闭屏幕) 低于 4% 的反射率都算是良好的。
闪烁 闪烁计 闪烁速率对应图表上的最高峰。频率越高越好

* EOTF代表电光传递函数,它将电子信号转换为屏幕上特定的亮度。

所有在实验室进行的客观测试都会搭配一系列的感知评估。

 

色彩

以最终用户的角度来说,色彩逼真度(即屏幕能忠实重现眼睛所见到相同色调和阴影的程度)的重要性仅次于可读性。

我们在下面的设置中使用锥光镜来评估当用户在轴线上查看显示内容与在离轴线的屏幕上查看内容(倾斜度高达70°)时的颜色变化。

具有锥光镜的视频色度计装置(仅用于说明;实际测试是在0 勒克斯下进行)。

我们在不同照明条件进行色彩保真度测量,以了解设备在不同环境照明条件下的色彩管理能力。以下是我们在830勒克斯的D65光源下测量的色彩保真度结果之一。

[Missing IDs in shortcode]

大多数智能手机制造商都包含一项我们称之为蓝光滤镜(BLF)的功能;DXOMARK可以测量手机减少蓝光的效果,以及其对整体显示色彩渲染的影响。

[Missing IDs in shortcode]
色彩

除非另有说明,否则所有测试均在0至20,000 勒克斯的照度范围内进行,并使用白色色温/光谱钨灯、白色LED灯,D65彩色光源等等。

子属性

设备

备注

白点 vs. 环境光源(忠实模式下的得分)

Bench + 光谱辐射仪

结果为设备的白点色温(以克耳文为单位)。

白点 vs. 时间 (默认模式下的得分)

照明棚架

结果为色域覆盖率的百分比(越高越好)。

色域 vs. 环境光源 (忠实模式下的得分)

Bench + 光谱辐射仪

结果为色域覆盖率的百分比(越高越好)。

色彩逼真度(忠实模式下的得分)

Bench + 光谱辐射仪

结果为目标值与测量值之间的色差,以JNCD(可视色差)表示。

Vs. 角度(默认模式下的得分)

视频色度计 + 锥光镜

在0 勒克斯下进行测试,结果为色彩差异,以JNCD表示; 色偏越不明显越好。

均匀度(默认模式下的得分)

视频色度计 + 标准镜头

在0 勒克斯下进行测试;屏幕上的色差越少越好。

蓝光滤镜的影响(夜间模式下的得分 / 开启蓝光滤镜模式下的得分)

Bench + 光谱辐射仪

在0 勒克斯下进行测试; 蓝色分量的波长应减少而色域不变

 

视频

有的设备可能将静态图像的内容处理的比视频来得好,有的则相反。 DXOMARK 是使用设备的默认视频应用程序来进行测试。在下列用于说明视频测试结果的图像中可以看到,左侧设备所呈现的亮度低但仍看得见;中间设备的图像亮度佳;右侧设备所呈现的亮度相当暗。至于色彩,左边设备的色彩呈现良好;中间设备显得偏黄;右边设备的色彩则太蓝了

设备的亮度低,但色彩佳

图片来源:DXOMARK

仅作图示

设备的亮度良好,但略显黄色

图片来源:DXOMARK

仅作图示

设备的输出呈现显得太暗且太蓝

图片来源:DXOMARK

仅作图示

 

视频

在5 cd / m2的标准条件与自然的室内照明环境下进行测试 (0 and 830 lux) lighting conditions.

子属性

设备

备注

亮度

Bench + 光谱辐射仪

在低光和室内条件下,设备应呈现出舒适的视觉亮度

EOTF

Bench + 光谱辐射仪

深色调、中间色调和高光中的细节呈现应尽可能接近目标参考屏幕,室内条件下亦然

色彩

Bench + 光谱辐射仪

深色调、中间色调和高光中的细节呈现应尽可能接近目标参考屏幕,室内条件下亦然.

平均像素级别 (APL)

Bench + 光谱辐射仪

亮度不应随着 APL 改变

影像掉帧

小型相机

在0勒克斯下进行测试,32秒片段中画面窒格(白色)和影像掉帧(黑色)的绝对数在0到100之间

运动模糊

图像越顺畅越好

抖动 精巧型相机

以 24、30 和 60 fps 进行视频内容的评测

进行感知评测时,我们使用索尼屏幕作为参考。

此视频呈现的是我们测试的一部份,我们也会评测运动以及屏幕处理移动内容的效果。 下列左图是我们用于测试运动模糊的装置,中间和右图则是测试输出图像的范例。

我们通过观察帧重复来评估运动模糊。下面左边图片显示了我们用来拍摄设置。拍下了下面中间和右边的图像。从而说明我们在感知上的评估。(我们并没有根据这些图片来评估我们的任何测试结果。)

测试运动模糊的装置
设备输出的图像出现重复影像的范例
设备输出的图像将模糊控制得较好的范例

图片来源:DXOMARK

仅作图示

我们还会测试的其他运动现象,像是画面窒格和影像掉帧。左图是我们测试画面窒格 / 影像掉帧的装置;右边的GIF图则说明测试视频输出时,白色矩形出现在连续帧中。

测试画面窒格和影像掉帧的装置
GIF说明测试视频的画面窒格和影像掉帧

在下面的说明图示中,黑色或深灰色矩形表示影像掉帧(也就是说,当屏幕尚未显现出确切的帧之前直接跳到下一帧);白色矩形则表示画面窒格(表示屏幕连续显现同一帧后才接续下一帧)。

几乎没有测量到的画面窒格和影像掉帧的设备范例
测量到许多画面窒格和影像掉帧的设备范例
图片来源:DXOMARK,仅作图示

触控

如下图所示,我们有一套用来进行触控分析的高端测量仪器,包括一个精度为0.05 mm、速度为1.5米/每秒、可在触摸屏上模拟人类手势(点击、缩放和滑动)的机器人。除此之外,我们还使用高速的Phantom相机,每秒可拍摄1440张图像,以捕捉智能手机屏幕上每一帧的慢动作。

触控机器人
高速数码单反相机拍摄触控机器人所进行的测试
[Missing IDs in shortcode] [Missing IDs in shortcode]

 

从下面的视频中,您可以看到的范例是我们从测试触控反应时间的设定中获取到具有意义的结果。在我们的游戏用例中,左边设备的反应速度比右边设备快三倍,响应时间分别为3毫秒和10毫秒。

两款设备进行机器人触控测试(DXOMARK游戏用例)

 

关于顺畅度的下一个示例中, 在测试时我们观察到,当水平滑动智能手机的图库应用程序时,左边的设备不太顺,右边的设备则非常滑顺。下面的静态图像正是可代表此结果的范例。我们看到左边的图像有些零星散开的影像,左边的图像则大量均匀的散开,适切的说明了这种现象。

滑动不顺畅的测试输出范例
图片来源:DXOMARK; 仅作图示
滑动顺畅的测试输出范例
图片来源:DXOMARK; 仅作图示
触控在室内条件(300 – 830 勒克斯)下进行测试
子属性 设备 备注
响应时间 触控机器人和高速相机 以游戏用例中量测触控响应时间
准确性 触控机器人和高速相机 量测准确度误差和重复性

屏幕边缘触控不准确

顺畅度 在照片图库应用程序和网页上进行感知测试 越滑顺越好

 

舒眼屏幕标志

DXOMARK 屏幕基准中周详的测评有助于测定设备是否能够提供舒适的观看体验。为了创建 DXOMARK 舒眼屏幕标志,我们选出了基准中的一些关键的指标,也是我们认为评定观看屏幕时眼睛是否舒适的重要指标。

基于可靠的评测以及明确指出需要通过哪些要求,我们的舒眼屏幕标志旨在以用户的立场为考虑,并协助制造商改进其产品。

通过四项标准的智能手机就有资格获得 DXOMARK 舒眼屏幕标志,此标志会显示在该手机的产品页中,也会显现在dxomark.com 详细的测试结果中。

让我们来逐一的详细了解,能让手机获取标志资格的这四项标准,以及背后与其息息相关的 DXOMARK 评测。

  •  瞬时光伪像

我们之前曾说明过我们是如何测试闪烁的状况,闪烁可能是影响观看舒适度的一个因素。

我们的测试着眼于随时间变化的光输出振荡频率以及限制在 90 Hz 频率以下的调制程度。我们感兴趣的是调制峰值的频率点。该峰值显示着脉冲宽度调制。

我们量测智能手机的闪烁状况,然后将收集到的量测结果应用于闪烁感知指标,该指标目前用作评定闪烁相对敏感度的标准。1

为了让设备通过我们舒眼屏幕标志中的这项标准,设备在防闪烁模式或默认模式下,所测得的闪烁感知指标必须小于 1,也就是说感知机率小于 50%。

  • 亮度水平

为了通过这项标准,设备首先必须具备自动亮度功能。我们希望确保在黑暗环境或低光下开启屏幕时,设备能够严谨的处理其所呈现的亮度,避免用户什么都看不见。

此项评测是在黑暗环境(0 勒克斯)中进行「各种照明条件下的亮度」测试。

通过测试的设备,其屏幕的亮度应该能够在默认模式和手动模式下调整至 2 尼特(或每平方米 2烛光)或更低的亮度。

  • 过滤蓝光

我们的研究显示,消费者越来越意识到并担心手机或计算机屏幕发出的蓝光会影响他们的视力和睡眠周期。研究中也显示出人造光,尤其是夜间曝露在蓝光下,会抑制褪黑激素(一种能帮助我们入睡的激素)的产生,进而扰乱人类的昼夜节律。尽管针对影响昼夜节律的因素已进行了大量的研究,但对于多少程度的蓝光可能扰乱睡眠周期,科学或医学间仍没有共识。

在舒眼屏幕标志方面,我们提取了协议中在开启与关闭夜间模式下进行的蓝光过滤测试,并基于最新科学研究的指标11Oh, J., Yoo, H., Park, H. et al. Analysis of circadian properties and healthy levels of blue light from smartphones at night. Sci Rep 5, 11325 (2015). https://doi.org/10.1038/srep11325 来测定对人类睡眠周期可能产生的影响。

透过测量光源对昼夜节律和视觉的影响,我们可以计算设备的昼夜节律因子,以评定其对我们生理时钟的影响。

为了符合我们标志的标准,智能手机的屏幕在默认开启蓝光模式下,昼夜节律因子必须等于或小于 0.65,0.65 等级相当于中性白色 LED 灯(您可能在家中使用的那种)所发出的光。我们的立场是,智能手机屏幕的亮度不应该比您家中的灯光更加干扰您的生理时钟。

  • 色彩一致性

色彩一致性特别着重在蓝光过滤模式对色彩呈现的影响。当开启蓝光滤镜时,色彩会有所变化,屏幕的白点也会改变。经过适当调校的设备可以大幅度的减少色彩偏移的影响。

为了符合我们标志的标准,在朝着 D65(布拉福德变换)白点校正后,当启动蓝光滤镜时,设备的P3色域覆盖率必须保持 95% 或更高。

结论

在我们测试的过程中,我们进行了600多次的评测和35个小时的感知分析。为了模拟最终用户的体验,这些测试都是在黑暗的环境里以及充满挑战性的室内和户外照明条件下实行的。

尽管在智能手机上装置了最新的高质量面板是让屏幕质量能有亮眼表现的第一步,但这样还是不够的。如前所述,屏幕性能的质量不仅取决于硬件规格,也取决于软件以及软件与电池间的策略选择;制造商会以试着让最终用户在不同的用例中能有最舒适的体验而做出选择。

我们希望本文能让您对我们用于测试智能手机屏幕最重要的特性所使用的一些科学设备和方法有更详尽的了解。