大数据已被视为传统媒体向新媒体转型的重要抓手,这已成业内共识。但到底什么是大数据?大数据对于广电媒体到底有啥意义呢?其实广电媒体对数据并不陌生,甚至还很熟悉,比如收听率、收视率、市场份额等等。那这些数据是不是大数据呢?
简单来说,广电人熟悉的收视率和收听率数据并不是真正的大数据,而是第三方数据公司对有代表性的样本户进行抽样调查的结果。而大数据则是全采样数据,因为它是在线采集,是所有用户在线上的一切信息和行为,海量、实时、高频率、全样本、交互性等是大数据的基本特征。
从数据分析的角度来说,传统的数据分析很难准确调研用户的行为习惯,对用户未来行为的预测更难以有效精准,而大数据分析则能够有效挖掘用户的真实想法和习惯,其结果也更为准确。
大数据是以智能化的方式分析,即能利用有效的工具对数据进行有效的挖掘和专业化处理。与传统的数据调研统计相比,大数据分析的好处是耗费的时间、人力物力更少,能够及时迅速地呈现结果。
大数据是永远在线,能够记录用户的行为、情感、思想、爱好与需求。而传统媒体根本不知道自己的用户是什么样的,更不清楚用户的真实需求。利用大数据技术能够更好地分析用户的潜在需求,提供更精准的产品和服务。
因此对于广电媒体而言,大数据是盈利模式转型的基础,同时,大数据还能够服务于各类决策,无论是具体节目内容的评估和优化,还是整个广电集团的战略方向。大数据本身也是能够带来商业利益的信息资本,广电媒体受众覆盖广,数据流量庞大,对许多商业公司而言都是垂涎三尺的资源。
从长远来看,建设大数据平台是广电媒体转型发展的必然,但就眼下而言,广电媒体能否引入技术思维进行数据挖掘和用户画像呢?作为数据盲的小编对此是一头雾水,必须请教高人。某个月黑风高的夜晚,一场驴唇不对马嘴的微信对话开始了……
“数据盲小编”与业内人士的对话
小编:广电建设基本的大数据平台大概需要多大人财物投入?大数据的目的是尽可能地了解用户,这个工作也叫“用户画像”,就是通过各种标签给用户进行特征描述。按照广电目前的情况(互联网平台搭建刚刚起步,缺乏智能技术),如何建立起用户标签体系?如何根据广电的需要进行数据建模和用户画像?如何挖掘更丰富的用户标签?
业内人士:建设大数据平台需要多大人力物力这个不太好评估,大公司可能投放上亿,小公司可能投入2个人使用开源免费软件也能搭建起来。
用户画像的话,一般是首先要有尽可能丰富的用户标签数据,如职业、收入等。然后要找出自己的用户关联分析,就可以看出自己用户的特点。当然,用户标签,除了像职位、收入、性别这种常见标签,还有一些本身就要靠挖掘才能得出的标签,如时尚达人、文艺青年之类。
一般来说,首先要有一个标签数据库,比如新浪微博根据自己海量用户的特点构建了一套标签库。然后你拿到自己用户的ID,把自己用户的ID与新浪微博用户的ID映射起来,就可以把自己用户与新浪微博的标签关联上,这样就知道用户的画像。
小编:映射是啥意思?
业内人士:拥有海量数据的平台才会拥有海量的标签,比如说阿里、新浪微博、百度,因为他们有足够的数据,所以他们可以构建自己的用户标签数据库。
例如广电如果想借助新浪微博的标签数据库,首要问题就是怎么把广电自己的用户和新浪微博标签库里的用户对应上。同一个用户,在广电的平台和新浪微博的平台使用的ID肯定是不一样的,只能通过用户的手机号或身份证号、邮箱来比对。
说白了,就是把你用户的身份证手机号匹配一下,找出你的用户在新浪微博的ID,这样就可以用上新浪微博的标签数据库,来对你自己的用户进行画像了,这就是我说的“映射”。
小编:广电收视收听统计中的样本户算是广电的用户吗?
业内人士:这些人不能算是广电的用户,因为你掌握的用户特征有限。这就是传统媒体和在线媒体的区别,互联网公司天然地知道自己的用户群体是哪些。
传统的电视媒是拿不到用户的身份证号、ID之类标签的,除非跟机顶盒公司合作,也许会有可能;或者通过你的网络电视台,采取会员注册的方式,也可能拿到,但网络电视台的用户又不完全等于电视观众。
传统媒体因为没有互联网平台,拿不到用户数据,所以只能依托央视索福瑞这种咨询公司进行线下调研,取得用户数据。因此传统媒体往新媒体转型或者与新媒体融合,将成为一种趋势。
小编:既然掌握自己的“用户”如此重要,而这又是广电的弱项,那广电该怎么做?
业内人士:就广电目前的情况而言,最简单的办法可以通过互联网渠道先找到自己的用户,然后借用别人的标签数据库。当然别人的标签数据库是不会开放的,因为那是他们用户的隐私,也是他们的私有资源。如果要用,除了公司层面的合作,就是看看有没有开放的平台,可以对外提供标签的接口。
“数据盲”小编关于“大数据”的思考
思考一:利用社交媒体获得广电自己的用户标签
与业内人士对话结束后,小编琢磨,现在广电媒体基本都开了微信公众号,是否可以利用微信平台获得用户标签呢?经过多方了解,这还真是一个获得用户标签的一个途径。
微信公共平台目前可以为公众号开发者提供包括用户分析数据接口、图文分析数据接口、消息分析数据接口、接口分析数据接口。通过数据接口,开发者可以获取与微信官方统计模块类似但更灵活的数据。
事实上,也早有传统媒体通过微信的开放平台获得自己的用户数据了。2013年11月28日,钱江晚报官方微信后台技术平台1.0版正式上线,他们在微信上所发布的各种内容、开展的各种活动,最终都会沉淀在自己的平台上,形成内容数据库、用户数据库,真正实现了把微信平台当成自己的渠道。
思考二:广电要建立自己的互联网渠道获得用户大数据
与BAT等巨头相比,传统媒体尽管缺乏技术基因,但在区域化的线下有巨大优势。换句话说,本地化的大数据平台就是传统媒体的优势和未来。
首先广电媒体巨大的流量是数据采集的前提,其次,广电媒体在资源、公信力等方面拥有本土优势,为挖掘本地用户数据提供极大便利。
为了获得本地用户的大数据,必须积极建设自己的互联网渠道,通过渠道获取“在线数据”,并通过对数据的收集、整理、分析等等,及时对产品、服务进行调整优化,以满足用户的需求。
思考三:“借船出海”与互联网巨头数据库对接
当然,在积极搭建互联网渠道和入口的同时,广电媒体仍然可以借鉴互联网公司的“数据思维”尝试挖掘自己的数据,把观众和听众变成用户。
简单的说,就是把广电获得的用户数据和BAT这样的海量数据拥有者的数据库进行对接,借用他们的数据库,发现我们的用户买过什么、想买什么;搜索过什么,对什么感兴趣;跟谁是朋友等等。
这招“借船出海”的前提是我们要先拥有自己的用户,获得可以跟外部数据库关联的ID,比如身份证号、手机号或者微信号、QQ号、电子邮箱等。
现在广电媒体通过摇红包等互动可以吸附到很多粉丝,但怎么把这些粉丝变成自己的用户,而不是得到实惠就走呢?可以尝试俱乐部会员制,首先通过吸引粉丝注册为用户,然后通过现金红包、奖品实物、可消费的服务等不同层级的优惠进行巩固,让注册用户固定化、忠诚化。