我们如何建立一套无参考视频质量评价体系?

如题所述

在实时互动无处不在的当代,视频质量成为了衡量用户体验的关键指标。单纯依赖人工进行大规模实时评估不可行,因此自动化评估体系的构建与推广势在必行。
然而,如何评判视频质量?不同的关注点将带来不同的答案。对于终端用户的直播体验而言,实时质量监控是重点;对于提供视频技术服务的人员来说,关注的是视频算法版本之间的细小改进或退步。因此,我们需要一套“主观视频质量体验”客观指标体系,既可用于客户端体验评估或故障检测,也作为算法优化的参考。我们将此体系命名为 VQA(Video Quality Assessment)。
构建 VQA 体系的难点在于数据收集与模型建立。数据收集涉及量化人对视频质量的主观评价,模型建立则需使模型能够取代人工评分。本文将分别梳理业界的评估方法、介绍声网的 Agora-VQA 模型构建过程,并总结未来的改进方向。
业界如何实现视频质量评估?建立视频质量评估模型通常分为两步:收集 VQA 数据与训练 VQA 模型。整个 VQA 训练过程通过客观模型对主观标注的模拟实现,预测效果的好坏由一致性评价指标衡量。主观 VQA 标注通过分级评分收集终端用户反馈,旨在量化真实用户的视频体验;客观 VQA 提供模仿主观质量分级的数学模型。
主观 VQA 数据收集主要涉及 MOS(Mean Opinion Score)与 DMOS(Differential Mean Opinion Score)。MOS 描述绝对评价,适用于 UGC 视频的质量量化;DMOS 表示相对评价,比较视频间的差异。本文重点介绍 MOS,ITU-T Rec BT.500 提供的操作指南保证了主观实验的信度和效度。
VQA 工具主要分为 Full Reference(全参考)、Reduced Reference(半参考)与 No Reference(无参考)三类。Full Reference 依赖完整原始视频序列作为参考,基于逐像素的 PSNR 和 SSIM 是最原始的比较方法;Reduced Reference 的比较对象是某些对应特征,适用于原始视频序列不可得的场景;No Reference 方法解除了对附加信息的依赖,更加“就事论事”地评价当前视频。
VQA 体系的一致性评价指标包括预测精度(PLCC、RMSE)与预测单调性(SROCC)。业界通常通过这些指标定义各类 VQA 工具的优劣。
Agora-VQA 如何实现视频质量评估?声网建立了 Agora-VQA Dataset 并在此基础上训练了 Agora-VQA Model,这是业内首个可在移动设备上运行的基于深度学习的视频主观体验 MOS 评估模型。它利用深度学习算法估计实时互动场景接收端视频画质的主观体验 MOS 分,极大提高了视频画质评估的效率,使得线上视频质量的实时评估成为可能。
Agora-VQA 的实现包含以下关键步骤:建立评估数据库、搭建打分 app、收集主观打分与进行数据清洗。数据库包含丰富的内容来源与均衡的画质区间,评估 app 提供了控制观看总时长与减少评分员疲劳的机制。数据清洗采用 ITU 标准与 95% 置信区间的计算方法,确保结果的准确性和可靠性。
VQA 工具的选择与性能比较是构建 Agora-VQA 的重要考虑因素。通过分析不同画质评估算法在 KonViD-1k 和 LIVE-VQC 上的相关性,以及模型的参数量和运算量对比,我们能够评估并优化 Agora-VQA 的性能。
展望未来,Agora-VQA 的发展将涵盖以下几个方向:从解码分辨率到渲染分辨率的扩展、从视频片段到整段通话的体验评估、从体验得分到故障分类的故障检测功能、以及从实时评估到行业标准化的进程。此外,Agora-VQA 也在逐步开放中,未来将集成在线评估功能,并发布离线测评工具。
通过本文的介绍,我们希望能够提供一个全面的 VQA 体系构建视角,鼓励开发者深入探讨并共同推动视频质量评估技术的发展。
温馨提示:内容为网友见解,仅供参考
无其他回答

我们如何建立一套无参考视频质量评价体系?
业界如何实现视频质量评估?建立视频质量评估模型通常分为两步:收集 VQA 数据与训练 VQA 模型。整个 VQA 训练过程通过客观模型对主观标注的模拟实现,预测效果的好坏由一致性评价指标衡量。主观 VQA 标注通过分级评分收集终端用户反馈,旨在量化真实用户的视频体验;客观 VQA 提供模仿主观质量分级的数学模型。...

图像质量评估综述
Le Kang等人使用5层卷积神经网络(CNN)进行无参考图像质量预测,而Weilong Hou等人采用深度学习框架综合图像代表、自然场景统计特征等进行图像质量评价。Ke Gu等人通过深度学习构建了新的图像质量指数(DIQI)以评估无参考图像质量。Sebastian Bosse等人设计了一种端到端的深度神经网络,用于无参考图像质量评估。

图像视频质量评估 (IQA\/VQA)
客观质量评估则是通过量化参考图像与评估图像的差异,如全参考(FR-IQA)模型,如PSNR和SSIM,考虑了人眼对细节和结构的敏感性。PSNR虽然直观,但忽视了人眼对亮度和色度的感知差异,而SSIM和其改进版本如MS-SSIM、IW-SSIM和GSSIM则更贴近人类视觉感知。无参考评估(NR-IQA)如VMAF和VSI,处理的是没有...

【音视频专题】音频质量评估方法那些事
上述无论有参考和无参考,都有其应用的局限性,包括使用场景比较窄,鲁棒性差,复杂度高等问题。而要克服这些问题,就需要一套覆盖多场景,性能运行几乎无感知的质量评估算法及体系。因此,声网自行开发了一套独有的音频质量评估手段,包括上行质量评估和下行质量评估。上行链路声音经历采集-AEC(回声消除)...

抖音短视频运营指南?
还能通过建立活跃度、垂直度、健康度让系统认为这是一个优质账号,获得初始权重; 最重要的一点就是让抖音对你这个账号有标签。 (3)养号的一些技巧【重点】 通过对话几位抖音运营者,我们总结了7条养号方法,仅供各位运营者参考。 1、一部手机一个手机号对应一个账号,尽量不要一部手机多个账号切换,也不要同一个...

手机拍摄视频时,如何提高画面质量
1. 码率设置过高,会使视频文件变得非常大,不利于传输和储存。2. 码率设置过低,会导致视频质量下降,出现模糊、卡顿等问题。3. 参考一些常用的标准设置,如 720p 的分辨率一般建议码率大约为 1500kbps 左右。4. 不同的视频内容和场景需要不同的码率设置,需要进行具体的测试和调整。5. 码率和视频...

网上很多付费教自媒体短视频创业的靠谱吗?还是说都是割韭菜?
要选择视频质量高的付费教程,还要选择正规平台购买。拿头条专栏为例子,我们可以先看看创作者的免费试看的教程怎么样,你能不能学得会,以及性价比等其他因素,综合考量是否购买。不走平台交易的教程不要买,虽然这年头好人很多,但坏人也不少。走正规平台买到的付费内容,最起码对我们有一个保障,在一定程度上能降低被骗...

我是一个大三的学生,想作一个关于视频编辑处理方向的科研立项,什么题目...
学习归来,有的同志在总结中写到:人家的集体办公好,很羡慕人家的作息时间,说明我们已经有所收获,因此从现在起,建立同年级、同课头的集体备课小组,定人员、定地点、定任务,在有效的工作时间里全身心投入到工作中去,晚上不办公,让同志彻底放松。 三、坚守阵地,惜时如金,提高质量。 课堂教学是提高教学质量的主阵地,...

视频质量参数问题
1.决定视频质量的参数有分辨率和码率,分辨率就是视频的尺寸,分辨率越高,清晰度越好,码率越高,视频质量越好,分辨率和码率越大,文件越大,但是转换视频不能超过原来的分辨率和码率,因为超过原来的分辨率和码率也不再提高质量。一般情况下设置为缺省。2.选择格式和编码方式,要看你对视频转换的目的,...

【VISION GUIDE - 11】一文看懂图像质量评估
无参考(No Reference Image Quality Assessment, NR-IQA)评估完全不依赖源图像信息。全参考方法如峰值信噪比(Peak Signal-to-Noise Ratio,PSNR)被广泛使用,基于均方误差计算失真情况,PSNR值越大,表示图像质量越好。结构相似度(Structure SIMilarity Index,SSIM)是一种更符合人类视觉直觉的评估标准,...

相似回答
大家正在搜