主观测量
主观测量中使用的指标是MOS和DMOS。但是,在获得原始分数后,这些得分还不能直接使用。通常需要使用接下来的测量程序来消除得分之间的偏差。
令sijk表示主观测试的第k个阶段中,第i个用户给第j个视频的主观评分。主观测试一般会有两个测试阶段。
在处理原始评分的过程中,在每个测试阶段中计算视频的评分差异(difference scores)dijk。dijk的计算方式为:在同一个测试阶段中,受试者对视频的质量评分减去同一个受试者对该视频的参考视频的质量评分。每一个测试阶段都计算评分差异,有助于解释受试者在不同测试阶段使用质量量表的任何可变性。得分差异的计算如4−30。
(4−30) dijk=sijk−sijrefk
对于参考视频而言,在任何测试阶段,参考视频的dijk均为0,因此可以将其从最终的的评分差异中删除。然后利用4−33将每个阶段的评分差异转换为Z-scores的形式。
(4−31) μik=Nik1j=1∑Nikdijk
(4−32) σik=⎷Nik−11j=1∑Nik(dijk−μik)2
(4−33) zijk=dijk−μikσik
其中,Nik为受试者i在第k阶段的测试中评估的视频序列个数。
对于每一位受试者而言,在整个的测试中,数据库中的测试视频仅会出现一次。因此,将所有测试阶段的Z-scores合并后可以生成一个Z-scores矩阵{zij}。可以使用ITU-R BT.500-13(附件2的第2.3.2节)中定义的程序筛选并去掉不置信的受试者。
然后分析评分的分布。如果评分是正态分布的,则当该受试者给出的评分中,如果有5%以上的评分不在[μi−σi, μi+σi]区间中,则ITU-R BT.500-13(附件2的第2.3.2节)中定义的筛选程序会拒绝该受试者的评分。如果评分不是正太分布的,则当该受试者给出的评分中,如果有5%以上的评分不在[μi−2.235σi, μi+2.235σi]区间中时,则会拒绝该受试者的评分。然而,在这两种情况下,如果受试者对质量的判断始终保持悲观或乐观,则不会拒绝该受试者的得分。
然后将Z-scores线性调整至[0,100]的区间内。最后,利用重新调整后的、剩余的可信受试者的Z-scores的平均数作为每个视频的DMOS。