深入探究DXOMARK屏幕测试

当我们在十月份发布DXOMARK Display 测试基准和第一篇屏幕评测时,我们曾在介绍屏幕测试的文章中承诺将会详细剖析我们的屏幕测试内容。我们正计划推出一系列深入探究我们是如何测试各项属性(可读性、色彩、视频、运动、触控和伪像)的文章,以及针对屏幕相关问题(如闪烁、SDR与HDR等等)的其他文章。而在本文,我们想带您更进一步的了解DXOMARK 在进行屏幕质量属性的科学评测时所使用的各种工具,这些工具是基于用户在使用手机时最常体验的特定用户场景:网页浏览、夜间阅读、行车导航、拍照、查看照片、玩游戏以及看电影,还有屏幕的自动亮度功能在光照条件变化时的响应度和顺畅度

在进入主题之前,我们先记住这一点:智能手机的屏幕性能不光只是硬件的性能表现。智能手机使用程序或算法来控制许多显示功能,而制造商选择由哪些设置来运用这些算法(其过程称为「调试」)。当然,某些算法可能会比其他算法更好,而且该算法实现在智能手机上还能大大的影响手机的性能表现,就像这些例子一样:

  • 软件决定了智能手机如何平衡帧率和电池使用量之间的平衡;根据所使用的应用程序,一些手机会自动调整帧率,以延长电池充电时间(即续航)。这意味着,(比如说)刷新率为120赫兹的智能手机并不总是以120赫兹的速度刷新屏幕。
  • 许多智能手机都包含一个环境光传感器,这是一个光电探测器,可以测量周围的照明条件;调校决定了自动亮度功能对来自光传感器的输入的反应有多快、多恰当,此外还决定了显示屏对所看内容的适应程度。
  • 当人们在手机上观看视频时,运动插值算法会在 「真实」(现有)帧之间生成帧,目的是让动画或移动动作看起来更流畅,同样,电池与帧率的权衡在这里也会产生影响。(我们将在特定屏幕属性的相关文章中再次探讨算法)

DXOMARK在许多不同的(有时是变化的)光照条件下进行测试,以尽可能地再现智能手机用户的真实体验,而不仅仅是简单地将显示器的性能与标准/规范中定义的 「理想 「观看条件进行比较。

最后,在了解我们的工具箱之前,首先要提醒的是我们在完全相同的条件下测试每个屏幕,以确保我们的结果是公平、科学严谨且可重复。其次,除了某些明确定义的例外情况,我们都是以设备的默认设置来进行测试。另外,与其他测试网站不同的是,DXOMARK的评测不仅包括以实验室为基准的客观测试,同时还涵盖了感知测估。

DXOMARK如何测试屏幕质量

客观测试工具

下图为我们的评估专家在测试智能手机屏幕时所使用的一系列工具。 我们使用下面的工具来测量颜色、光线(亮度)和对比度,并计算掉帧次数。

DXOMARK用于测量显示质量的测试设备,从左到右分别是光谱辐射仪、视频测色仪、带锥光镜的视频测色仪和小型摄像机。

我们使用这些工具来测量反射率、光泽度、闪烁和亮度。

其他测试设备,从左到右:分光光度计、光泽度计、闪烁度计、照度计。

我们使用以下工具来测量触摸响应度、准确度和流畅度。

用于测量显示器触控属性的超高速摄像机和机器人

我们的许多客观测试都是在DXOMARK Display 测试台中进行的,我们在发布会上公布了该测试台;该测试台是一个特殊的测试室,可以进行测试自动化测试,并确保我们的工程师在完全相同的条件下测试所有设备。它包括被测设备和测试工具的支架(主要是光谱辐射仪和视频色度计),计算机控制的LED照明阵列,能够模拟各种光源和各级亮度,以及照度计。

DXOMARK Display工作台内的被测设备和视频测色仪。
DXOMARK Display工作台内的被测设备和光谱辐射仪

在上面的DXOMARK Display Bench内装照片中,您可以看到左侧安装了受测设备(DUT),右侧则是装有轨道的测试仪器;测试工程师使用计算机控制的伺服马达将仪器移至与DUT不同距离的各个位置。测试过程中,首先会将Bench密封起来以防止泄入任何外部光源,接着再由工程师控制计算机进行测试。

感知测试工具

DXOMARK在感知测试中最重要的工具之一就是人眼。我们的感知测试核实并补充了我们的客观测试,因为我们要确保我们能在现实生活中看到客观测试时得出的结论。此外,客观测试只测量严格意义上的测量目标。考虑到驱动屏幕软件的复杂性以及人眼的复杂性,感知测试是评估显示质量的一个重要因素。

我们的屏幕工程师在进行任何感知测试之前,都会接受细致且全面的培训,其中还包括依据专业监视器上所显现的参考图像来仔细评估多款设备(受测设备与两个或三个设备进行比较)。专业监视器上每幅精挑细选的图像所呈现的色彩和亮度值都已经过精确的校准和量测。工程师会遵循非常严谨且符合科学的准则来进行比较,而此准则规定每次要由不同的工程师进行多次测试,以确保不会有所偏颇。

除了我们最重要的感知工具(人眼),我们的屏幕工程师还使用专门设计的手持设备,可以同时容纳多个智能手机、专业级显示器和照度计。

我们的工程师通过直接观察设备的显示屏来进行所有的感知评估。我们拍摄的照片仅用于说明,但绝不会将其作为任何形式的测试或评估的基础。但绝不作为任何形式的测试或评估的基础。

屏幕基准测试

下列各分项涵盖了目前DXOMARK Display 测试基准的所有属性,同时包括了我们所使用的设备、某些测试条件以及一些参数结果和定义的相关信息。

可读性

在我们的评测中我们常提醒读者,对最终用户来说,在不同的现实生活条件下能否轻松舒适地览阅屏幕,才是最重要的考虑因素。DXOMARK运用Display Bench来重现完全漆黑到明亮日光间的照明条件。以下是比较数据的示例图,显示三种设备的亮度与对比度的测试情况:

Brightness vs Contrast comparison (30 000 Lux)

从上面的图例中可以看到,在日光下的阴暗环境(< 0.01 lux)中进行测试时,所测得的对比度是无法达到所声称的对比值1:1,000,000(或无穷大)。我们的测试反映了用户的体验 —在阳光下很难看清屏幕。

屏幕可读性的另一项测试项目为量测亮度输出的均质性或均匀度,如下图所示:

亮度均匀度测试

图片来源:DXOMARK;仅作图示

伪色亮度图量测

可读性 除非另有说明,否则所有测试均在0至30,000 勒克斯的照度范围内进行,并使用白色色温/光谱钨灯、白色LED灯,D65彩色光源等等。
子属性 设备 备注
Vs. 环境光源 Bench + 光谱辐射仪(亮度,以cd / m2表示)+ 视频色度计(对比度,以:1表示) 亮度应适应观看条件,屏幕内容在任何条件下都应具有可读性,并尽可能接近原意。
Vs. 平均像素级别 Bench + 光谱辐射仪(亮度)+ 视频色度计(对比度) 亮度和对比度都不会随平均像素级别(APL)改变。
亮度  vs. 时间 能变化灯光和亮度级别的照明棚架 我们检测反应时间、顺畅度及变换时间。
EOTF* Bench + 光谱辐射仪 在20% APL的各种光照条件下进行测试;越接近目标值伽玛,效果越好。
均匀度 视频色度计 + 标准镜头 在0 勒克斯下进行测试; 结果以百分比表示(越高越好)
Vs. 角度 视频色度计 + 锥光镜 在0 勒克斯下进行测试; 亮度损失越少越好
蓝光滤镜的影响 Bench + 光谱辐射仪 亮度不应有明显变化; cd / m2(每平方米烛光)下降小于20%是可以接受的。

* EOTF代表电光传递函数,它将电子信号转换为屏幕上特定的亮度。

色彩

以最终用户的角度来说,色彩逼真度(即屏幕能忠实重现眼睛所见到相同色调和阴影的程度)的重要性仅次于可读性。

我们在下面的设置中使用锥光镜来评估当用户在轴线上查看显示内容与在离轴线的屏幕上查看内容(倾斜度高达70°)时的颜色变化。

具有锥光镜的视频色度计装置(仅用于说明;实际测试是在0 勒克斯下进行)。

我们在不同照明条件进行色彩保真度测量,以了解设备在不同环境照明条件下的色彩管理能力。以下是我们在1000勒克斯的D65光源下测量的色彩保真度结果之一。

在DCI-P3 色彩空间中以1000 lux进行的色彩保真度测量。

大多数智能手机制造商都包含一项我们称之为蓝光滤镜(BLF)的功能;DXOMARK可以测量手机减少蓝光的效果,以及其对整体显示色彩渲染的影响。

白色光谱,关闭B LF

白色光谱,开启BLF

色彩

除非另有说明,否则所有测试均在0至30,000 勒克斯的照度范围内进行,并使用白色色温/光谱钨灯、白色LED灯,D65彩色光源等等。

子属性

设备

备注

白点 vs. 环境光源

Bench + 光谱辐射仪 结果为设备的白点色温(以克耳文为单位)。
白点 vs. 时间 照明棚架 我们检测白点是否能适应环境亮度的变化,以及这种适应是否顺畅。
色域 vs. 环境光源 Bench + 光谱辐射仪 结果为色域覆盖率的百分比(越高越好)。
色彩逼真度 Bench + 光谱辐射仪 结果为目标值与测量值之间的色差,以JNCD(可视色差)表示。
Vs. 角度 视频色度计 + 锥光镜 在0 勒克斯下进行测试,结果为色彩差异,以JNCD表示; 色偏越不明显越好。
均匀度 视频色度计 + 标准镜头 在0 勒克斯下进行测试;屏幕上的色差越少越好。
蓝光滤镜的影响 Bench + 光谱辐射仪

在0 勒克斯下进行测试; 蓝色分量的波长应减少而色域不变

视频

一款设备可能擅长处理静态图像内容,但却拙于处理视频,反之亦然。DXOMARK 是使用设备的默认视频应用程序来进行测试。在下列用于说明视频测试结果的图像中可以看到,左侧设备所呈现的亮度低但仍看得见;中间设备的图像亮度佳;右侧设备所呈现的亮度相当暗。至于色彩,左边设备的色彩呈现良好;中间设备显得偏黄;右边设备的色彩则太蓝了。

设备的亮度低,但色彩佳

图片来源:DXOMARK

仅作图示

设备的亮度良好,但略显黄色

图片来源:DXOMARK

仅作图示

设备的输出呈现显得太暗且太蓝

图片来源:DXOMARK

仅作图示

视频

在5 cd / m2的标准条件与自然的室内照明环境下进行测试。

子属性

设备

备注

亮度

Bench + 光谱辐射仪 在低光和室内条件下,设备应呈现出舒适的视觉亮度
对比度 Bench + 视频色度计 设备对比度应一直高于目标值

EOTF

Bench + 光谱辐射仪

深色调、中间色调和高光中的细节呈现应尽可能接近目标参考屏幕,室内条件下亦然

色彩

Bench + 光谱辐射仪 色彩必须尽可能靠近目标参考屏幕,室内条件下亦然。

运动

DXOMARK能测试屏幕处理运动内容的性能。下列左图是我们用于测试运动模糊的装置,中间和右图则是测试输出图像的范例。

我们通过观察帧重复来评估运动模糊。下面左边图片显示了我们用来拍摄设置。拍下了下面中间和右边的图像。从而说明我们在感知上的评估。(我们并没有根据这些图片来评估我们的任何测试结果。)

测试运动模糊的装置

设备输出的图像出现重复影像的范例

图片来源:DXOMARK

仅作图示

设备输出的图像将模糊控制得较好的范例

图片来源:DXOMARK

仅作图示

我们还会测试的其他运动现象,像是画面窒格和影像掉帧。左图是我们测试画面窒格 / 影像掉帧的装置;右边的GIF图则说明测试视频输出时,白色矩形出现在连续帧中。

测试画面窒格和影像掉帧的装置

GIF说明测试视频的画面窒格和影像掉帧

在下面的说明图示中,黑色或深灰色矩形表示影像掉帧(也就是说,当屏幕尚未显现出确切的帧之前直接跳到下一帧);白色矩形则表示画面窒格(表示屏幕连续显现同一帧后才接续下一帧)。

几乎没有测量到的画面窒格和影像掉帧的设备范例

图片来源:DXOMARK,仅作图示

测量到许多画面窒格和影像掉帧的设备范例

图片来源:DXOMARK,仅作图示
运动

在室内条件(300 – 1000 勒克斯)下进行测试

子属性

设备

备注

影像掉帧 小型相机 在0勒克斯下进行测试,32秒片段中画面窒格(白色)和影像掉帧(黑色)的绝对数在0到100之间
运动模糊 图像越顺畅越好
视频播放反应度 当往前和往回跳播视频时,设备应立即有所反应,且没有延迟播放。

触控

如下图所示,我们有一套用来进行触控分析的高端测量仪器,包括一个精度为0.05 mm、速度为1.5米/每秒、可在触摸屏上模拟人类手势(点击、缩放和滑动)的机器人。除此之外,我们还使用高速的Phantom相机,每秒可拍摄1440张图像,以捕捉智能手机屏幕上每一帧的慢动作。

触控机器人

高速数码单反相机拍摄触控机器人所进行的测试

从下面具有意义的视频范例中,您可以看到的是我们通过测量触控响应时间的装置所获得的结果。在我们的游戏用例中,左边设备的反应速度比右边设备快三倍,响应时间分别为3毫秒和10毫秒。

两款设备进行机器人触控测试(DXOMARK游戏用例)

下面的静态图像确切地说明了在我们的触控精度测试下,当水平滑动智能手机的图库应用程序时,会显现出的图像形态。我们看到左图设备的输出不是很顺畅,而右图设备的输出却相当平顺,视觉体验也更为舒适。

关于顺畅度的下一个示例中, 在测试时我们观察到,当水平滑动智能手机的图库应用程序时,左边的设备不太顺,右边的设备则非常滑顺。下面的静态图像正是可代表此结果的范例。我们看到左边的图像有些零星散开的影像,左边的图像则大量均匀的散开,适切的说明了这种现象。

滑动不顺畅的测试输出范例

图片来源:DXOMARK; 仅作图示

滑动顺畅的测试输出范例

图片来源:DXOMARK; 仅作图示
触控在室内条件(300 – 1000 勒克斯)下进行测试
子属性 设备 备注
响应时间 触控机器人和高速相机 以游戏用例中量测触控响应时间
准确性 触控机器人和高速相机 量测准确度误差和重复性

屏幕边缘触控不准确

平滑度 越滑顺越好

伪像

DXOMARK的评测基准包含检测设备的性能、设计和图像呈现的缺失,这些都会影响到最终用户的体验。例如, 闪烁测试显示出即使设备的刷新率高,脉冲宽度调制(PWM)慢也会影响视觉的舒适度。(在下图中,第一个尖峰对应刷新率,最高尖峰则对应PWM。)

Flicker comparison

对所有屏幕来说,弯曲线条的呈现是个挑战;评测设备如何避免出现梯状伪像(称为混迭)的性能,也是我们测试基准的一部分。

多功能设备,出现明显的混迭

图片来源:DXOMARK
仅作图示

多功能设备,混迭状况控制的较好

图片来源:DXOMARK
仅作图示

游戏手机,混迭状况控制的相当不错

图片来源:DXOMARK
仅作图示

我们还使用我们的分光光度计在SCI(Specular Component Included)模式下对关闭的智能手机显示屏进行反射率水平测量。以下是显示可见光谱范围内(400nm至700nm)每10nm间隔波长的反射率水平的测量结果。

反射率水平测量结果

伪像

类型

设备

备注

凹口干扰 DSLR DXOMARK以客观评测量测屏幕与机身的比例。凹口的大小和在屏幕上的位置所造成干扰程度的多寡则是由感知来评估。

S屏幕反射率

光谱仪(+ 关闭屏幕的光泽度计) 反射率低于4%的结果是良好的。

闪烁

闪烁计 闪烁速率对应图表上的最高峰。频率越高越好。
混迭 DSLR 曲线越滑顺且梯状效果越不明显越好
抖动 小型相机 以24、30和60 fps评测视频内容

结论

在我们测试的过程中,我们进行了400多次的评测和20个小时的感知分析。为了模拟最终用户的体验,这些测试都是在黑暗的环境里以及充满挑战性的室内和户外照明条件下实行的。

尽管在智能手机上装置了最新的高质量面板是让屏幕质量能有亮眼表现的第一步,但这样还是不够的。如前所述,屏幕性能的质量不仅取决于硬件规格,也取决于软件以及软件与电池间的策略选择;制造商会以试着让最终用户在不同的用例中能有最舒适的体验而做出选择。

我们希望本文能让您对我们用于测试智能手机屏幕最重要的特性所使用的一些科学设备和方法有更详尽的了解。敬请继续关注我们即将推出的深入探究系列文章,在此之前,请您注意安全、保重身体!


Videos