大数据是什么?如何出现和应用在人们的生活中?我们可以先来设想一个生活场景:当你早上醒来打开电视,遥控器已经自动更换到你以往关注的财经频道;当你准备开车去上班,导航仪已经按照目前的路况规划了你的上班路线,及时避开了拥堵路段;在你上班的时候,手机提醒你快到结婚纪念日了,同时用你的消费喜好数据为你推荐了几款礼物以作备选;当你结束一天的工作回到家中,电视已经根据你的内容喜好为你推荐好了频道和节目,这就是大数据应用。
近年来,广电行业也开始注重大数据的应用。在广电行业领域内,并不缺乏大数据,关键在于如何应用大数据。观众除了喜欢黄金时段看电视,还喜欢在哪些时段打开电视?他们收看电视都有哪些习惯?解决这一切问题的基础还是数据。
虽然对于多大体量的数据才能叫大数据并无定论,但可以肯定的是,行业内目前通用的收视率数据并非大数据。收视率数据是在传统抽样调查的基础上产生的,来源于有限的确知样本。这种既没有巨大体量,也缺乏多样性(也称多变性)和高速率(指数据输入输出的速度)特征的数据,与大数据的任何一个特点都不相符,但如何利用大数据开展收视率调查,继而形成完整、规范的流程,已成为业界关注的热点和未来的可能趋势。
传统的收视率数据完整地反映了用户收视行为的3W要素,即:谁在看(Who)、什么时间看(When)和看什么(What)。目前实行的收视率调查是建立在一套被行业内认可的、完整的技术和运维方案基础上的,在采集到观众收看电视节目的3W相关变量后,进行统计计算和报告而得到的最终结果,这也是收视率数据能够成为行业通用货币的基础。因此,在采用大数据生产收视率过程中,也必须建立一种科学的流程思维,并在这种思维指导下形成一套科学的大数据采集流程。
在当前电视生态系统范畴内,能与收视率产生联系形成大数据集的数据多种多样,包括电视机顶盒和基于移动终端视频消费的回路数据、社交媒体上视频分享和讨论的数据,以及与在线视频服务有关的ISP 服务器后台数据等各种与视频相关的数据,如何把这些大数据转化和生产成收视率数据,还需要增加一些必须的手段和环节。
相关阅读: