智能手机的人像摄影和肤色呈现:我们如何估量用户的偏好?

Methodology

人像是最为重要且最受欢迎的摄影类型,不过,对于智能手机的摄像头来说,要拍摄出精彩的人像在技术上仍然是个挑战。举例来说,要实现肤色准确性的这个课题已经受到研究人员和制造商的极大关注。

将以往所有关于此议题的工作都列入考虑后,DXOMARK 的图像质量专家进行了他们自有的全面性质量研究,其目的如下:

● 辨别出用户对人像(个人照及团体照)的偏好倾向
● 辨别出满意与不满意的因素
● 探索技术上的挑战

为了实现此目标,我们设计了一套独特的方法,使我们能够从最常见的用例、环境和条件中搜集到详细的观点。此科学方法首先用于我们在巴黎的欧洲研究,而它也可以轻松的应用在全球的其他地区、其他研究领域以及其他电子产品(例如笔记本 计算机)。

我们在此向您说明。

感知问题

对人像质量评估来说,感知是一项挑战。事实上,人们对照片的偏好往往与他们的记忆以及对主题的熟悉程度有关。 因此,我们对自己的人像和对他人的人像会有不同的标准。

这也引申出一个问题:大多数人认为的「好看的人像照」应该具备的质量为何?

为了得到答案,DXOMARK 的图像质量专家进行了这项新的质量研究,旨在辨别出在智能手机的人像摄影中令人不满意的原因以及关键的痛点。

理解并估量用户的偏好

我们的专家所建立的这个研究方法能让他们达成这两个主要目的。

理解用户偏好

这需要进行广泛的分析,涵盖所有智能手机摄像头的用途(此处指的是人像的类型),以及拍摄时的各种情境条件。当然,每种用法都各有技术方面的挑战。

只有充分理解这些用法及其所面临的技术难题,我们才能模拟出高度准确的测试条件。

估量用户偏好

这是本分析至关重要的构成要素。此量表应体现出个人或测试群体对每种人像类型的感知质量。

与一大群人一起进行分析并创建一个与现实世界情境相当接近的测试场景是本研究成功的关键。

分析与肤色呈现有关的人像偏好

我们研究了智能手机在人像摄影中肤色呈现的感知质量问题。

这需要:

● 组合一群代表所有肤色、同时也包含不同文化背景、年龄层和性别的人
● 制定切题的拍摄方案

拍摄方案包括一套不同的照片,用于识别用户的人像偏好。 我们设计这样的拍摄方案已经很多年了。 定量调查对于了解每个地区的用例偏好非常有用。在本研究中,「切题的」方案是涵盖了大多数的用例。

拍摄计划:是一项着眼于现实生活中用户观点的关键要素

技术框架

拍摄者

这些照片必须由专业摄影师拍摄。为什么?因为我们需要有完美的对比画面。而最大的挑战在于如何以不同的手机准确的拍摄出相同的场景。

设备

我们的目的不是要比较设备或评估其效能,而是想要深入了解用户对市场上高端机种的偏好。

因此,我们在研究分析时采用了最先进的智能手机、旗舰机种,以及专业的数码相机,让我们能够了解智能手机在摄影方面的未来前景。

⚠️使用了四种不同的设备拍摄了每个场景和人像类型:三部智能手机和一部专业相机。
如此一来能使我们辨别出偏好的主要倾向,然后可以针对各个倾向进行更深入的研究。

场景和舞台

地点

拍摄方案是根据所研究的特定地理区域来量身定制。就我们而言地点是巴黎。我们的专业摄影师策划了一个方案,能体现出欧式生活的样貌、感觉和精髓。我们的最终目标是所捕捉的影像能引起欧洲小组的共鸣。

💡此类型的研究可以在世界任何地方重现,由当地摄影师拍摄并展示他们各地区独特的习俗和传统。

舞台

舞台是由下列各项所组合:
● 地点
● 照明条件
● 画面(场景构图)
● 受访者的数量和位置

总共有180 个拍摄舞台,每个舞台各有一位、两位、三位和四位模特。

场景

场景是由舞台与身处其中的模特所组成。模特的人数在同一舞台的不同场景中是可变动的。

Skin Tone Set 1
Skin Tone Set 1
Skin Tone Set 1

 

Skin Tone Set 2
Skin Tone Set 2
Skin Tone Set 2

 

Skin Tone Set 3
Skin Tone Set 3
Skin Tone Set 3

我们的拍摄方案很全面,包括所有类型的场景。 以下为区分场景的条件(该数字代表在每种条件下所拍摄的场景数):


 

“「我们理解某些测试条件,尤其是夜间场景,可能比其他条件更具挑战性。 这就是为什么我们在测试过程中涵盖了各种各样的条件。
我们还加上了实验室的场景让拍摄方案更臻完善,在此场景中模特位于中性且一致的灯光下的白色背景前。在这种受控的环境下,让我们能够只专注于人像的呈现及小组的响应,而场景、光线或其他情况都不会影响结果。”

Hervé Macudzinski, Image Science Director, DXOMARK

 

光照条件

我们在HDR、SDR和背光条件下总共拍摄了1,620张照片,如下图所示:

● 背光(非常具有挑战性的光照条件)
● SDR 或标准动态范围(亮度和色彩呈现范围有限)
● HDR 或高动态范围(亮度和色彩呈现范围高)

调查受访者

受访者

我们组成了一个代表所有肤色以及各种文化背景、性别和年龄层的欧洲小组。此次调查共有 123 人参与,包括83名模特/受访者、30 名专业摄影师以及10 名 DXOMARK 的影像质量专家,在 405 个场景中进行拍摄,是这类型研究中规模最大的研究之一。

两性代表人数几乎相当,小组成员包括:

● 52% 的女性
● 48% 的男性

包含的成人年龄层别为:

● 18至30岁(25%)
● 30岁至40岁(29%)
● 40至50岁(19%)
● 50岁至60岁(15%)
● 60岁以上(12%)

为了依肤色对受访者进行选择和分类,我们使用了菲茨派屈克量表(Fitzpatrick scale),此量表是用于测定不同类型的肤色对阳光反应的工具,将肤色类型分为 6 个不同的类别,所有类别均包含在我们的研究中:

● I 型,「最白」(12%)
● II 类,「白色」(30%)
● III 型,「一般」(23%)
● IV 型,「橄榄色」(2 %)
● V 型,「棕色」(8%)
● VI 型,「深色」(4%)

关于菲茨派屈克量表
菲茨派屈克量表最初是为了医疗用途而开发,通常用于各个行业的肤色分类。它是一项强大且广泛使用的工具,但许多科学刊物都指出它的局限性。例如,它没有将皮肤类型和肤色之间的差异列入考虑。 举例来说,论文《超越肤色:表观肤色的多维测量(Beyond Skin Tone: A Multidimensional Measure of Apparent Skin Color)》就强调了多方量测肤色的必要性。 菲茨派屈克量表也依赖本身的报告,这可能会造成无心的偏差。」
Fitzpatrick Scale
「我们采用菲茨派屈克量表,因为在肤色分类方面,它被广泛的运用。不过,它可能无法为一般肤色到深色肤色提供足够的粒度,导致会有潜在性的分类不准确。因此,我们正探索在未来几轮中使用替代量表的可能性,例如 Monk 量表或个体类型学角度(Individual Typology Angle;ITA)。
Benoît Pochon, Image Science Director,  DXOMARK

公布满意度指数

DXOMARK 满意度指数以数值来表示用户偏好。 在此研究中我们所评估的是两个不同面向的组合:一个是评估偏好度,另一个是评估不接受度。透过结合这两个结果,我们不仅能够收集有关用户偏好的观点,还能够将其量化。

参与者在受控的观看条件下进行所有测试,而他们并不知道用来拍摄影像的装置为何。

以下为我们如何建立 DXOMARK 满意度指数的详细信息。

用户调查两步骤

步骤1:最佳照片

首先,参与者会看到两张并排的图像,接着我们会请参与者依据整体图像质量选择他们喜欢的图像。

成对比较

为了量化对质量的感知差异,我们的专家使用了「临界差异( Just Objectionable Difference ; JOD)」量表。

成对比较与JOD量表
这种方法让我们的专家能够透过多次的交叉对比结果来对图像进行排名。例如,如果 75% 的参与者觉得一幅图像的质量优于另一幅,那么就可将这两幅图像认定为相距 1 JOD。
根据 JOD 量表评比图像需要运用到先进的统计技术,以确保所进行的对比数足以搜集到具可信度的评估量。
这些技术也能让专家获取更多的信息。例如,可以使用一种称为自助抽样法(Bootstrapping)的统计方法来测定特定群组的JOD 分数中的信赖区间(Confidence Interval),此方法依靠的是对一组数据的重复采样,以便能准确估测特定群组的结果。
当调查结束时,每位参与者及我们设置的四组相机所拍摄的每张图像都会有一个偏好分数。
然后我们会总结这些结果来量计参与者群组的偏好分数。

步骤2:适合社群媒体的照片

在第二步骤中,我们会向参与者展示用不同相机所拍摄同一场景的四张图像(一张用专业相机,三张用智能手机),然后询问他们不想在社群媒体上发布的图像,哪张或哪几张图像是他们不能接受的。这个问题是为了让我们的偏好分析更完善。

相对不满意

 

为什么是社群媒体?
我们想要估量可接受度。 我们的问题是:「受访者认为可接受的最低质量水平为何?」。 就这点来说,社群媒体提供了一个对每个人都适用且重要的标准。如果我们只是单纯的问人们他们会保留哪张照片,他们可能会因为对照片有感情上的依附而选择质量较低的照片。
「我们需要一个评估照片质量的标准。而社群媒体确实是最合适且理想的。」

Hervé Macudzinski, Image Science Director,  DXOMARK

 

计算满意度指数

经过两步骤调查后,我们搜集了每个场景的信息,如下:

●所有受访者的整体不接受率
● 研究群组的不接受率
● JOD量表

根据收集到的数据,我们使用下面的公式计算每张照片的满意度指数得分并评量结果,使其落在 0 到 100 的范围内。
METHODOLOGY_Satisfaction Index formula

考虑指数中的信赖区间,我们也测定整体满意度指数的信赖区间。

满意度指数低于 70/100 表示照片可能不符合用户的期望。

相反地,评估照片的特性得到高于 70分时,则有助于我们辨别出特定用例中热门的偏好。
此理解使我们能够查实在令人满意的图像与其技术特性间的共通性。

为什么要使用满意度指数?

满意度指数是一个同质且可比较的分数,可用于对比参与者、参与者群组或场景。

藉由评估每个人的满意度指数,我们可以深入获取宝贵的观点,包括他们识别图像质量方面的能力、他们与其他参与者或群体相比的偏好,以及他们的偏好倾向。

结论:想法与考虑

这项研究分析了拍摄的条件和相机的选择对图像感知质量的影响,同时也为我们提供了消费者的观点,进而解答了其他相关问题:

● 目前智能手机的用户对他们的人像质量满意吗?
● 所有高端智手机在这方面的满意度都相同吗?
● 相较于智能手机,专业摄影师拍摄的整体图像是否更令人满意?
● 如果是这样,非摄影师的用户能够察觉到哪些质量差距?
● 年龄会影响质量感知吗?
● 性别会影响质量感知吗?
● 无论模特的肤色为何,照片的感知质量是否保持不变?
● 还有哪些因素会影响受访者的选择及其对图像质量的看法?

DXOMARK Insights 的完整研究着眼于确保高质量人像和用户满意度的关键技术参数,对制造商来说,这是至关重要的信息。

请持续关注第一份结果,即将发布!