Back to 技术文章
首頁 > 技术文章

2000到2021:智能手机音频播放发展史

一百年来,音效一直是视听内容的软肋。如今我们的手机更大更亮,跟之前的电脑、电视和电影院的发展轨迹一样,但声音却没有更大更动听。但音频迟早要迎头赶上。在过去几年,扬声器的质量对于分享社交媒体内容、听音乐、玩游戏和打视频电话至关重要。2020年,新冠疫情期间,对于功放音频内容的需求更是达到新高,因为人们花更多的时间在家,这也就给每日生活添加了一个多任务的可能性,同时无需为保持社交礼貌使用耳机。本篇文章追溯了智能手机音频的演变史,从过去单薄、失真和单轨道的声音,到今天愈加浸入式和美妙的视听体验,再到未来的发展趋势。

2010年前: 手机音频黎明前的黑暗

2010年以前,手机业主要关注电池,这被称为能效结构。很少有手机提供立体声播放:一台常见设备的配置是用于通话的单耳耳机和一个功放扬声器。整体音量比较低,会因电量不同而变化,并且毫无低音可言。

信息图表来自Cirrus Logic

之后数字音乐市场迎来春天,有了新的移动音频使用场景,让人们意识到手机音频表现的重要性:因为人们会抛弃CD,下载合法或非法的音乐存在手机里。2008年,iTunes正式成为美国首屈一指的音乐提供商,有最大的曲库,卖出多达五百万首歌曲。在这样的大背景下,Nokia N95于2007年三月上市,Apple iPhone 3GS于2009七月问世。

诺基亚 N95 (左)和 iPhone 3GS

当时人们还满足于固定电话,但诺基亚在手机发布的当年年末仅在英国就售出超过一百万台,总共售出一千万台。N95是最早一批有立体声的手机,竖屏时广度惊人,直到现在也极为罕见。

N95的立体扬声器之一

但所有扬声器大部分时间都很容易被手遮挡,整体音效单薄且鼻音重。换句话说,播放频率集中在人声范围,说明手机仍被认为是交流工具,而非随行的个人娱乐中心。

频谱响应:iPhone 3GS (粉线) vs 诺基亚N95 (绿线)
总谐波失真:iPhone 3GS (粉色) vs诺基亚N95 (绿色)

而且失真很严重,尖锐的频域音损遍布整个频谱。iPhone 3GS频域更宽,可听失真较少,但也是十年之后才真正变成立体声。

iPhone 7 是第一批真正可立体声播放的iPhone手机(与 Apple iPhone 3GS一起)

在那段时间,功率输出要求低至AB类放大器,这也是智能手机的常规配置。实际操作是在A类和B类之间取中间值,比B类功放音质更好,比A类功放效率更高。但放大音频信号仍会影响续航:所以手机制造商开始考虑D类放大器。但是因为对所谓牺牲音质的强烈担心,D类放大器还要等几年才会在全球推广。

在iPhone 3GS 上播放音乐
Apple iPhone 3GS
Nokia N95
Nokia N95 Stereo Widening

而且手机对扬声器没有隔热或者超振幅保护。换句话说,一定时间内大声播放一首很多低音和正弦波的歌曲会移位,烧坏甚至融化扬声器。现实中,为了保护扬声器,同时也保护用户受伤,手机制造商不会增加马力,所以播放的音量很低。这也就出现了用大功放安全的超速运转小扬声器的想法。

2010年早期: 更响,更小……更高效 

在2010年早期,全面的扬声器保护成为基本音频信号链的一部分,让制造商在避免热或过热伤害的前提下突破功放的边界。音量增大的同时,扬声器设计也更紧凑,并且随着D类放大器的推广也更加省电,尺寸和能效一直是手机产业中竞争最激烈的领域。这段时间还出现了多磁铁的创新使用和新材料,让扬声器可忍受更高温度和更大振幅。对用户而言,这意外着音量更大,更广的频率响应意味着并非所有歌手都有浓重的鼻音。

信息图表来自 Cirrus Logic

立体声播放越来越被看作是旗舰手机的标配,如主打音频的 HTC One,价格最低廉的手机也有音频加强算法。失真处理更好,力度范围更广。除了立体声的推广,近年来最突出的变化是”低音明朗化“:小扬声器无法呈现低频,办法是加入失真引起泛音,这样用户就可听到,或自认为自己能听到100赫兹以下的频率。

2010年末以来: 当前形势

从2010年末以来,社交媒体迅速发展,出现了流媒体APP和手机游戏,带来了对沉浸式音频的爆发式需求,给播放质量的提高形成了助推。硬件来看,扬声器声学更敏感,达到更高振幅,所有高端手机都有立体声配置。D类放大器过渡到了H类放大器,同时保证低失真。

信息图表来自Cirrus Logic

软件上,一系列音频算法的出现减少了音频的用电量。而音频加强算法,如诺基亚 OZO 技术,杜比全景声,  Xperi DTS 或 Dirac,有更好的音色平衡,下潜更好的低音,更高的力度范围和更沉浸式的空间感重现。比如最近在我们音频排行榜上最顶尖的手机苹果 iPhone 12 Pro Max 和 黑鲨 4 Pro.  让我们将他们的频谱响应和失真和诺基亚 N95 及 iPhone 3GS做对比。

频谱响应: iPhone 12 Pro Max (粉色) 和 iPhone 3GS (绿色)
频谱响应: 黑鲨 4 Pro (粉色) 和 诺基亚 N95 (绿色)

上图告诉我们从诺基亚 N95 和 iPhone 3GS上市以来低音响应和音色平衡有了多么大的进步。 绿色曲线强调中频,并且在300赫兹以下降至  -60 分贝,而粉色曲线有更强的低音,更深的低音端扩展和更和谐的音色平衡。 特别是黑鲨 4 Pro所有频段都有很好的响应,拥有我们到目前为止测试过的最好的音色平衡,在所有使用场景下都有杰出的低音端扩展。

总谐波失真:iPhone 12 Pro Max (粉色) 和 iPhone 3GS (绿色)
总谐波失真: 黑鲨 4 Pro (粉色) 和 诺基亚 N95 (绿色)

在音损方面的进步更为惊人:和今天的指标相比,之前的总谐波失真非常失调,百分比接近甚至达到100%,这意味着在那个频段,声音100%失真。

Apple iPhone 3GS 方向性
Apple iPhone 12 Pro Max 方向性

方向性图测试手机周围一个圆圈上所有点的声压水平。左边的iPhone 3GS提供几乎单方向的声音(曲线基本形成了圆圈),这是典型的单向传声,右边iPhone 12 Pro Max的立体声配置依照聆听角度差别一目了然。但我们注意到深粉色曲线比较圆,这说明了低频的性质,它们的长波长本来就是单向的。理论就先讲到这儿,让我们听一段吧!

总体来说,频率响应、失真、空间感和音量都大大提高,之前的手机和现在的机型不可同日而语。虽然过去十五年音频成长不少,但还是落后。如果手机摄像头越来越多,HDR又在改变着我们随时随地的视觉体验,双频道音频虽历史悠久,但仍未被超越,音频专家未被找到真正的办法在狭窄的空间里重现低音。

在未来,我们的手机会带来更多沉浸式聆听体验。本着这样的精神,小米Mix Fold竖屏和横屏都有立体声,这是到目前为止都为探索过的可能性。但让我们更进一步,想象一下用我们的手机扬声器看电影会有重低音,3D声音,声场更广,智能音频处理和传感器技术,可无缝适应用户喜好。我期待再次在此专栏与大家见面,聊一聊全新的创新式音频体验、应用和服务,革新我们随时随地消费音频的方式。所有的这些技术在数字时代可能真的唾手可得!


Cirrus Logic和Nokia Technologies 对本文编写亦有贡献。