数字声频与音频为消费者提供了立体声且高清晰度的声频体验,而相关测试则从传统的静态、单帧像分析,转换为动态测试、图像质量分析。 虽然单帧像分析可提供信号定时、色深、线条同步化,以及更多有用信息,但压缩/解压缩算法与缓冲错误的数字影像也常造成瑕疵,且无法通过单帧像所察觉。常见错误则包含宏区块、帧像停滞、声频遗失与截断,或像素化。此篇教学指南概述了图像质量分析,并说明NI Picture Quality Analysis软件应如何搭配NI Digital Video Analyzer使用,侦测数字声频与视频的瑕疵或假影。
HDMI串流的常见瑕疵
首先应了解图像质量分析,从而知道数字视频系统可能产生的瑕疵类型。 而用户自己就能发觉最常见、最重要的瑕疵,如宏区块、像素化、帧像模糊、停滞、遗失、声频截断和LipSync。
宏区块——数字影像往往是通过MPEG 4或H.264压缩成多个8x8色块。 若压缩/解压缩算法之间并无高度相关,则可能产生多个定义边缘的区域。 这就是宏区块。
图1. 若原始图像的解压缩效果不佳,宏区块就可能在解压缩后的像素之间形成定义边缘。
若传输期间遗失数据,则解码器将无法正确读取数据区块从而检索原始的像素数据,这样会造成明显的掉色区块错误。与宏色块相比,虽然这些错误均较为少见,但仍极为明显。
图2. 因数据遗失与错误解码而产生的像素化错误。
在解码或调整期间,可能遗失高频率的组件,进而在边缘之间遗失定义,或出现模糊的情况。 视频信号将因此丢失清晰度或鲜明度。
图3. 模糊将使视频信号产生不清晰的边缘。 图左在黑、白边缘之间的定义较不明显。
从图1到图3呈现了单一图像的模糊、像素化、宏区块;这些瑕疵往往不会再各个帧像逐一出现,而必须全时间完整测量设备以获得正确的结果。其他瑕疵如帧像停滞/遗失、声频切割、LipSync (声频/视频同步化),也需分析多组帧像。
图像质量分析评分
图像质量分析即测量视频流的整体。 因此汇集了专业技术人员观看视频,并以其专业的主观角度评分,设立了Differential Mean Opinion Scores (DMOS)。 但此方法仍有许多待解的难题,如训练技术人员的成本,还有操作人员观看屏幕的重复性成本。 另一个重大挑战则是关于主观测试的质量。 在制造过程中,根本不可能聘请视频质量专家观看各组设备的生产细节,只能让水平较差的操作人员观看视频并评分。 因此如分心、疲劳、眼睛过度刺激等人为因素,均会降低产品品质而让劣质品过关,由此促使了工程师必须重新设计影像测试的方法。
较好的图像质量分析方式,即必须能重复套用客观的测量方式,以测量音频与视频的质量。 目前有多种算法,均与专业操作人员的主观评分相关。常见的两种测量之一为峰值信噪比 (PPSNR),它是以均方差 (MSE)以及德州大学图像与视频工程实验室(LIVE)的Al Bovik教授和其团队,所设定的结构相似性(SSIM)指数为构架。 此项指数已成为最具公信力的视频质量测量指数。 只要套用如PSNR与SSIM算法,即可通过自动化、可重复的测量方法,轻松评定视频质量。
图4. 爱因斯坦照片的比较,代表了不同的失真程度: a) 参考图像, b)平均对比伸展, c)亮度平移, d)高斯噪音污染,e)脉冲噪音污染, f)JPEG压缩, g)模糊, h)空间缩放 (缩小), i)空间平移 (向右), i)空间平移 (向左), k)旋转 (逆时针), l)旋转 (顺时针)。
另一种视频质量测试方法是测量视频与音频内容的特定假影。 此时可套用特定瑕疵算法,以找出视频中的特定错误,如方格或帧像停滞/遗失。 许多生产应用不太需要如PSNR或SSIM的高性能测试。 反之,往往仅需确认没有产生宏区块、声频切割、视频停滞即可。 通过特定瑕疵的测量,即可迅速决定该款设备是通过还是失败。
具备NI Picture Quality Analysis软件的NI Digital Video Analyzer能够测量特定瑕疵,也可达到如PSNR与SSIM的高图像质量测量。 通过用户定义的测量,即可套用自定义的算法,以建立完全自定制的图像质量分析应用。
图5. 针对水平与垂直空间中的宏区块,需采集并分析1080p60的视频流。
参考与无参考测试
针对视频/音频流,进行图像质量分析测量的方法目前有三种。
1. 无参考测试: 不论图像内容如何,此方式可将测量套用至任何系统。 而此测量方式的挑战之处在于,因分析图像内容的不同,测量结果的差异也相当大。