快手QoE指标设计的分析初探

  • 时间:
  • 浏览:1

直播回放:

在十月份LVS大会正式的演讲中,我机会给大伙儿儿删改分享,快手团队是要怎样解决什么困难,制定出符合短视频业务需求的QoE和QoS指标,并利用什么指标指导体验优化的。希望感兴趣的同学都都可不能否积极报名参会。

当用户看到画面后,需要评估开播过程的性能,整个开播过程与非 流畅的,这里主要用首帧时间来评估。

1,快手业务简介

A: 许多是大伙儿儿的十个 多技术结构,可不都可不能否最少提一下是将许多特殊信息写在视频流里面,通过什么特殊信息,在播放端就可不都可不能否判断,它和主播之间的延迟是几个。

Q2: 发送端到接收端的延时是要怎样统计的?

刚才介绍直播的QoE和QoS指标的数据架构设计 ,计算法律法律依据和观测的维度。接下来举例介绍,QoE和QoS指标到底是有什么关联?

快手的主要业务所以我短视频和直播,上图是许多快手的直播截图,从什么图片中可不都可不能否看出快手平台的内容比较具有生活气息,场景十分充裕,有室内有户外,有游戏有吃播,假若从技术的深度来看,大伙儿儿主要需要解决用户地域分布广、网络环境繁复、手机机型繁复、业务场景充裕等挑战。面对海量的用户,繁复的场景,大伙儿儿选择通过建立全面的数据监测体系,实时感知用户的体验问题,从而提出有针对性的优化策略,假若评估优化的收益。在实践中,大伙儿儿总结了一系列用户体验(QoE)、服务质量(QoS)相关指标,研究了它们之间的区别和化系,对于体验优化有指导性作用,在此分享一下大伙儿儿的相关经验,希望对从事相关工作的同学们能有帮助。

目前智能监控主所以我看省份,ISP和CDN十个 多维度聚合的结果,用许多来做线上的报警,参考历史同期的数据,做同比和环比的监测。此外,什么维度聚合随后进入到数据可视化模块,数据可不都可不能否很方便的做多样的可视化和多维度的分析,这里主所以我离线的业务分析。

QoS指标用于衡量系统中,客观占据 的质量相关事件,是技术优化的主要目标。从技术深度出发的优化,均以QoS为目标,如卡顿率,首屏时间等。下面介绍一下快手的QoS指标设计思路。

六, Q&A

5, 分析维度

许多问题说明,用户真是纷纷抱怨直播卡,假若大伙儿儿并没办法 抛下直播房间,还是继续等待在直播房间里面。许多情况汇报删改违背了随后介绍的,卡顿率影响观看时长的规律。卡顿率高了,假若大要素观众还是你会继续观看。

3,直播质量(QoS)指标介绍

假若许多例子还有十个 多很有意思的地方,许多直播同样的时间点,观察另外十个 多QoE指标:观看人数

A: 真是主播端没办法 十个 多buffer的强行限制,直播端会在buffer到一定长度进行丢帧,在拉流端,大伙儿儿将Buffer长度限制在5秒,为了控制延时的大小。

Q1: 码率自适应做在编码随后,要怎样实现自适应过程?

5,短视频大数据体系简介和预告

除了性能之外还有稳定性,拉流端还有某种场景是机会它机会许多愿因愿因断线了,断了随后用户会自动重连,通过统计重连次数观测稳定性。

 

这是十个 多QoE指标和QoS指标关联的例子,也展示了平时跟进具体问题的法律法律依据:重点监控QoE和核心的QoS指标,在QoE的指标占据 问题的随后,立刻快速的找到和它直接相关的QoS的指标,判断是都在服务质量真的跳出问题。

拉流开播随后,用户机会会持续观看一段时间,通过在拉流端上报卡顿次数和卡顿时长来计算整体的卡顿率,作为稳定播放期间性能的评估指标。卡顿率的定义所以我给定时间窗口内,占据 过卡顿的观看行为数量除以总的观看行为数量。

https://www.baijiayun.com/web/playback/index?classid=110073100147056&session_id=20110010020&token=GqnbiUX1y4lt681rrJ0J_RVM5yFl6dFS4sB52SAekvWq3jsp5ES4O8ykX8qRNLttvr5OwSoF9BcKp0fXMnVKLQ

首先,在主播端,评价主播端的推流性能是通过直接计算主播的推流卡顿,主播端最容易占据 问题所以我网络抖动愿因卡顿。在观众端,首先是通过计算黑屏率评估拉流可用性,黑屏指用户删改看不到直播的画面,即整个直播观看不可用。

QoE与QoS指标之间的关系,在大规模数据集下,规律是非常稳定的,假若在分析具体问题的随后,情况汇报往往会占据 变化,机会实际会影响QoE指标的因素太久,QoS指标所以我其中十个 多因素,在QoS指标在短时间下降,没办法 差到无法忍受的情况汇报下,直播间的内容和氛围,粉丝群体区别,主播个人所有号召力,一定会更显著影响QoE。

有十个 多特殊的维度是直播房间,单个房间的观看卡顿率,主播有没办法 推流卡顿也是时不时需要用到的QoS信息。

Q5: 没办法 主播推流端的GoP大小恒定的,还是个动态变化的?

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/vn9PLgZvnPs1522s82g/article/details/81810068

2, 主播端架构设计 数据

文 / 罗喆

五, 短视频业务

1, 直播删改流程

制订QoS指标随后,需要先架构设计 比较删改的打点数据,在主播端,架构设计 架构图从左往右,首先是摄像头和麦克风的架构设计 ,随后是去噪,美颜和特效等前解决算法,什么技术模块非常消耗CPU和机器的内存,为了监控性能,需要对许多过程中的帧率、CPU和内存占用做删改的上报。随后进入编码环节,这里大伙儿儿同样会监控帧率,除此之外,大伙儿儿也会采样上报编码器的客观质量数据,便于线上做大规模质量调优。在传输环节,大伙儿儿会统计主播端的卡顿次数,记录收流源站服务器的IP、地理位置等删改信息。

图中的第一根绳子 曲线,是观看人数曲线,对比下面的两条曲线,和上图一样,是十个 多QoS指标。可不都可不能否看到,在主播推流占据 卡顿的时刻,观看人数许多QoE直播所以我略有下降,并没办法 像评论卡顿数指标那样跳出大幅的变化。

A: 大伙儿儿实现码率自适应,主所以我通过预测可用发送传输速率,假若在传输速率占据 变化时,反向反馈给编码器,使之及时调整输出码率,从而实现码率自适应。

架构设计 到了数据随后,为什把它转上加十个 多监测指标呢?数据需要汇聚成许多对用户体验有关键影响的指标都可不能否进行观测,下面按照直播的流程介绍每个核心QoS指标。

接下来简单介绍一下快手的短视频业务,也为十月份的LVS大会做十个 多预告。这里主所以我简单讲下短视频业务和直播到底有什么不一样?主要从内容生产,传输,观看来对比:

首越快判断是都在机会QoS指标跳出了问题愿因的QoE指标波动。比如说主播在直播打王者荣耀,但他的手机连接王者荣耀的服务器卡了会使整个游戏画面变得比较卡,从而愿因直播看上去比较卡,许多随后用户的QoE指标会占据 变化,但直播的QoS指标都在正常的,所以在占据 QoE指标变化的随后,一般是先看和它直接相关的QoS指标是都在真的有问题。许多例子,在同样时间点,许多房间的拉流卡顿率也大幅度的上涨,可不都可不能否判断是服务质量出了问题。

简单介绍一下QoE(Quality of Experience)用户体验指标,QoE指标的设计理念是为了更贴近用户的真实感受,架构设计 的是用户的行为数据,主所以我用来衡量用户的主观体验,比如直播卡顿了,几个用户会选择抛下当前直播间。与之对应,技术服务质量指标(QoS,Quality of Service),主要反映的是客观指标,如占据 了几个次卡顿。如上图所示,是十个 典型QoE指标的示例。

全链路的数据架构设计 ,分析,都可不能否精准的定位问题,并制定方案改进。本文来自快手流媒体大数据平台架构师罗喆在LiveVideoStackCon热身分享上的分享,他会在10月19-20日的LiveVideoStackCon上分享更删改和删改的内容。

正机会短视频的业务,比直播要更繁复许多,假若大伙儿儿在制订QoE和QoS指标随后,遇到了所以困难。第一,短视频的功能繁多,流程繁复;第二,涉及模块多,包括上传模块,转码模块,CDN的各种繁复策略,全链路的监控难度比较大;第三,要平衡清晰度和流畅度,成本之间的矛盾关系,假若QoE和QoS的指标制定起来,挑战更大。

4,直播QoE-QoS指标联合分析

首先,第十个 多维度是省份,即地域,也所以我空间的维度,机会推流和拉流CDN服务商的资源分布是按大省机会大区来部署的,所以选择省份作为关键的地域上的维度来观测QoS至标。

4, 直播QoS指标

四, 直播QoE-QoS指标联合分析

剩下的还有所以细分的维度都在业务相关的,这里就不一一列举了。没办法 多的维度随后,机会不进行聚合,用于数据分析和监控很不方便。需要通过OLAP维度聚合模块,将维度进行一定程度上的聚合。

今天的主要内容分为以下几个要素:

首先,次均观看时长和在线人数会反映用户的行为,从图中可不都可不能否看出,次均观看时长和在线人数两条曲线在晚高峰时节 的随后会没办法 快达到峰值,而在白天时不时占据 十个 多比较平稳的增长情况汇报。许多增长趋势是用户行为愿因的,机会用户在晚上的随后更有时间刷短视频和观看直播,所以次均观看时长和在线人数一定会上涨。许多跟服务质量也会有关系,在晚高峰的随后机会卡顿严重,机会会引起曲线下行,但总体上来说,服务质量指标在这里所占的权重并都在决定性的。

运营商ISP,CDN,终端类型,网络类型,客户端版本都在在分析问题时常见的维度。

从推流端到拉流端的整个全流程都用这十个 核心的指标来监控大盘的情况汇报。

A: 动态变化,根据场景设置,但不用超过十个 多限定值。

接下来,看十个 多具体例子,这是十个 多单房间的卡顿监控数据:

许多截图是快手真实的业务数据的截图,横轴是卡顿率,纵轴是播放时长,可不都可不能否明显的看到许多曲线的趋势是随着卡顿率的上涨,播放时长快速的下降。实际情况汇报中,假若数据规模足够大,不管从任何维度观测,许多个多指标的关系,基本上都符合另十个 多的规律。许多规律也很容易理解,当直播观看变得很卡的随后,用户继续观看的动力下降,所以人会选择退出直播间。 

下面来看到播率和用户评论卡顿数,完播率的定义是删改的观看到十个 多短视频的比例,用户评论卡顿数的定义是直播间里观众给主播发送内容是”卡”或同义评论的数量。完播率评价的是,用户与非 看到十个 多短视频。用户评论卡顿数是用户很直观的十个 多真实反馈,当他真是许多直播间卡了,他会要强烈的抱怨一下,这反应了用户的真实体验。在影响许多个多指标的因素中,技术服务质量的权重就会比较大。完播率涉及到因素主要包括推荐给用户的视频是都在他喜欢看的,以及整个播放过程是都在流畅,什么与具体的技术服务指标都在较强相关性。用户评论卡顿数的波动有机会机会直播的过程富含许多因素影响到了直播,比如说网络抖动,主播机器卡了机会商业CDN的服务质量下滑等等,什么一定会愿因用户观看卡顿,而所以在技术服务质量。这十个 QoE指标,能比较删改的说明QoE指标和用户体验相关,也和QoS相关,假若QoS在不同的QoE指标所占的权重是不一样的,有的指标用户行为的权重会大许多,有的指标QoS权重会大许多。

进一步分析,机会有小量用户拉流卡顿,大伙儿儿推测,很有机会是跟主播推流卡顿有关,没办法 大伙儿儿看下第三张图,主播端推流监控数据,这两条曲线分别是推流的帧率和码率,在同样的时间点,可不都可不能否看到是主播推流码率大幅度下降了,此时,观众端卡顿率上升且QoE指标评论卡顿数也大幅度的上升。许多随后,就机会定位问题应该是主播的网络占据 了许多抖动,推流码率大幅度的下降,观众端感受到的卡顿大幅度上升。

在观看端,短视频的特点是观看时长、下载时长很短,高频,快手十个 多短视频默认不到7秒,下载时长机会不到1-2秒,假若是一下到底的体验。用户对于偶尔跳出的卡顿,会更加敏感。

首先一齐看一下直播业务的删改流程,可不都可不能否分为三块:推流端,传输CDN和播放端。

3, 播放端架构设计 数据

二, 直播的用户体验(QoE,Quality of Experience)监测指标简介

Q3: 主播端和拉流端的Buffer长度是要怎样选择的?

2,用户体验(QoE)监测指标简介

播放端的架构设计 数据,架构设计 过程是主播端的逆序过程。大伙儿儿会删改记录拉流节点信息,细分的首屏时间,接收缓冲区信息,卡顿,码率、解码帧率等,在播放失败的随后,也会上报错误信息和愿因。 

A: 什么值的过滤都在在服务器端做。

架构设计 / LiveVideoStack

上图的第一根绳子 曲线,许多是某直播房间的用户评论中跳出卡顿的数量,刚才在介绍QoE指标的随后也专门提到过许多指标,是用户主观感受的直接反馈。在17点58分的时间点上,许多指标时不时的上涨,应该是在许多随后用户小量的感觉到卡顿了,许多随后需要立刻去查和它相关的QoS指标:单个房间的拉流卡顿率。

三, 直播技术服务质量(QoS,Quality of Service)指标介绍

Q4: 卡顿时长的过滤是在服务器端,还是在客户端?

有了核心的QoS指标,还需要了解从什么维度上来分析什么指标,下面介绍一下分析什么指标的维度。

一, 快手业务简介

对于快手来说,QoE是重要的监测指标,但机会要找到影响QoE的因素,还需要通过QoS来监测。

首先,短视频会涉及到比较繁复的内容生产流程,导入、拍摄、剪辑,可不都可不能否叠加魔法表情、特效滤镜,比直播要繁复所以。其次是在架构设计 过程中,短视频可不都可不能否做更灵活的策略,如多CDN调度,预加载,CDN预热类式 的策略,监控起来也会有所以不一样的QoS、QoE指标,如慢速比、播放完成率等。