现在的位置: 首页 > 自动控制 > 科技·视野 > 正文

尹逊钰:云计算让视频识别成为现实

2010-08-24 21:58 科技·视野 ⁄ 共 5221字 ⁄ 字号 暂无评论

尹逊钰:谢谢各位,我今天演讲的题目大家看一下叫“视频中国,共赢云端”,今天听了很多专家的讲解,今天的收获也很大。在视频领域,尤其在三网融合的视频领域,哪些部分可以由云计算完成的?

过去我们了解了云计算的方向发展,包括科技,大家往往觉得云计算离我们很远,包括无锡有IBM的云计算中心,曙光6000等大型计算机都在做云计算。现实生活中有没有根据我们视频行业有关的云计算案例,今天我们就把这块与大家分享一下。

在座各位都是广电领域的专家,包括网络公司、电视台、企业和厂商的,我们要做三网融合的平台,除了网络之外还有三部分,一是内容,二是平台,三是产品。这是怎么也绕不开的,你必须得有大量的内容,有好的传输平台和好的运营平成、支撑平台才能够构架出业务体系,最终得有好的产品化包装,才能让用户买单,才能有人群来使用,才能产生商业价值。今天我会重点针对内容角度,平台和产品更多是由广电运营商来建设,而内容建设,我们认为会有新的解决方案提供这样的服务,来把海量的内容经过云端处理,把内容发送给不同的合作伙伴之中。

很多人讲广电是以内容为王,的确也是这样,因为有内容的牌照,我们才能在三网融合掌握先机,掌握市场准入的机会,达到目前的状况。同时,这些海量到底有多大的利用率?据我了解,电视台或者电视网络公司都有大量的内容,但都是以传统的方式存在,包括带库生产效率和新媒体化是很低的。有一个统计,目前只能利用到7%,还有90%多的内容没有被利用到。为什么呢?这块内容缺乏有效和高效的生产和处理手段来迅速转变成基于互联网上的,基于手机上的,基于IPTV的快速的面向用户的产品,网络是一个快速消费品,和电视还是有点不同的,电视的播出是由编导、导演的思路决定,我们电视每天要做的事情并不复杂,是一两个编导决定下来要过什么东西,从库里调出来,或者到外面拍摄,选择素材就可以了,但物联网不是,内容选择权要交给用户,而不是自己,当你有这种选择权的时候,就会发现这种选择权变得非常重要,这该需要庞大的资源体系。

当前电视台和网络电视台在做新媒体的时候更多采用传统公司非编的方式来做,昨天晚上下班之前我在车里看到消息,就是菲律宾劫持人质,7点半到8点之间,当时也播放了现场画面,说刚刚有15个人被杀死了,当时我非常愿意见证这个市场。我就在停车的时候用我的iPad打开了,当时通过iPad通过凤凰咨询台全程直播,打开的时候确实出现了窗口出现了六个

弹孔,说明刚刚发生枪战的过程。当突发事件出现的时候,能不能借助好的新媒体终端快速看到这些内容,这就是网络所带给我们的转变,以往电视播出很简单,你要守在电视前,现在不是这样。

今天早上遇到红灯我同事在做另外的事情,到底有多少人伤亡,因为昨天晚上没有明确答案,我搜索到全国电视台关于境外的频道最新报道菲律宾劫持人质的事情。我这里有刚刚三点钟的报道,所以,互联网的内容很多是来自于传统的,但传统的内容需要高效的方法变成互联网化、颗粒化,信息的播出是连续的内容,而不是针对现在越来越完善,越来越简单精致的新终端的模式。

如果在座各位下面有专门做产品和运营的朋友可能会有这样的想法,大家会有一个梦想,我们会有一个诉求,能不能在我们每天晚上睡觉的时候,来自于电视台上大量的内容就能够自动地被收录或截取成有效的,适合于互联网或者新媒体播出的资源,每天电视频道播了这么多东西,我们把数字化好,把有用的信息提取出来,这要快,要准,要省钱、省力。因为内容处理本身是一个体力活,没有太多的技术含量,就是一个数字化的过程。但数字化过程本身并不意味着简单地把内容录制下来或者把内容做一个直播,这个意义是不大的,更多的是要把你有价值信息里的核心内容整理出来,建立好有效的标签、标准的机制。

我们同时还在想,电视内容是一方面,还需要把现有媒资和第三方合作伙伴的资源和用户上载的资源变成我强大的资源平台而一致面向我各种各样的终端:电脑、手机或互联网、电视来进行发布。我想大家都有这样的想法。

归结下来,从实际的问题来讲,除了我们在播控平台的流程、政策方面的理解以外,实际开展这项业务的时候,的确会有这几个任务出现,我列出了几个问题,一是信源的要求,电视、媒资库、第三方内容、UGC。二是编码质量,高清收录,高清编码,采用H.264协议。三是处理能力,我们必须把自己从煤老板变成“媒老板”。四是处理效率,能不能做到电视发生了以后,我十分钟就可以检索到这个事件,通过各种通道看到它,这是用户的最终使用行为,为什么用户不用电视、IPTV一定要用电脑来看,一定是传统媒体无法满足的,就是时效性。四是碎片化,把一个个内容变成非常精准的内容。五是模式识别,尽量提取电视语音的特征帮你构成索引。六是做好新的媒体标引的属性。网络电视都有一些媒资,传统媒资侧重编导、节目制作角度去做,比如场景、角度,而新媒体的媒资面向应用的,传统媒资好比图书馆,

面向专家和学者服务的,新媒资像亚马逊,像卖书的,资料卖给1万多人的,需要新的标引重新建立,以往的媒资不能满足快速网络化消费。七是内容支持,iPad既不是手机,也不是电脑,但可以3G上网,我们很多政策对手机的约定对它是无效的,这些东西都是我们要考虑的。八是业务支持,就是要考虑基于视频的业务,直播、轮播、回看和搜索。八是产品能力,就是信息整合,信息关联和信息挖掘,这是根据你的平台和广告做出的具体的数据体系。

这是我搜索到的菲律宾人质的劫持事件,这是天脉在无锡建立的云计算收录平台,给各大有线电视台提供电视台收录、碎片化的处理,现在大概有200人、500个服务器,600T存储,每天进行生产,而且是源源不断的。这是下午14:02马尼拉事件的报道,这是CNN的。当前我们采用云计算的模式到底能做什么,为什么要这么做?中午12:20的新闻,北京电视台播出的。这是一段电视节目,是标清的质量,应该是在1.3M H.264的编码。我们在云计算的时候是把一个完整电视新闻或者新闻内容碎片化,把广告剔除,只剔除出内部的文本。现在天脉已经把语音识别、文字识别处理程度达到95%以上是自动化完成的,有了语音识别的模式以后,对我来讲,我在对视频的理解,就可以把它当成文字一样,我在搜索任何一个视频的时候,在搜索文本的时候就找到视频的内容,这个文字就是播音员的话,视频的内容反复在文字旁边反复播控。这是高码流、中码流,手机、IPTV、互联网全部特征和索引体系,这个体系到了用户端可以迅速地构建出一个有效的应用,因为对外发布来讲,基础内容有了,碎片化特征有了,栏目特征有了,主持人特征有了,里面的标清语音特征有了,这就是云计算的过程。用人工校对的话,每个文字和画面进行精准对应的话,这个2分钟的视频没有一天是做不出来的。这是建立公共云的必要性。

这是平台的商用情况。天脉这个平台目前定义为视频中国海量视频云计算中心,定位为无锡国家物联网产业园。目前天脉有三个机构,分别坐落于北京、无锡和上海,在北京主要做核心研发,各种各样模式识别的技术,手机、终端技术、互动展示技术,最近大家有没有注意到央视的《豪门盛宴》“阿凡达”的事情都是天脉来做的,一方面要看源头,有没有东西,有了东西之后能不能卖出去,所以,我们在做第二个事情就是内容怎么展现。

整个天脉有400多号人,无锡云计算中心,每天有400多台服务器源源不断地处理着来自中国各地的电视节目,现在能处理200个频道,2000档

栏目,3万条信息。目前我们在无锡云计算中心已经是世界最大的电视采集收录基地,国外数量没有这么多,这个模式可能不成立。

因为各省、各城市都需要做这个事情,其实电视收录本身是一个体力活,如果用人去做的话,有点太残酷了,其实它就应该让机器去完成,但现在的形状又不令人乐观,很多地方都在建立小而全的小型收录,效率非常低下,都是靠人一条处理的,这没有必要。互联网建立以后,异地采集,异地存储,远程推送、互联网交付都已经变成一个很实在的东西了,不再是个概念了。天脉做这个事情已经一年多了,我们现在已经为很多大型用户做异地采集,远程传输,成品推送这样的服务。

基于这一点,我们有一个比较多或者比较完善的技术体系来实现,这个体系不是一个科研室的产品,也不是我们设计中的一个理念,而是实实在在在商用过程中的东西。一是海量的处理,当你处理10个或者20个频道都不算海量,当你能处理几千档栏目就是海量。智能识别,语音识别的东西,很多用小软件也可以看到,但用到商用上替代人这有一个过程,而且它适合不同方言,不同地域的过程也是很复杂的过程。

模式识别,画面比对,我们会知道什么是广告,广告与文字中的区别,也需要大量的广告识别,而且怎么样让它通过Google搜索电视也是我们强调的。还有面对无数的终端,终端非常多,它的格式是什么样的,有的是用户原有的,有的是新格式的,所以需要非常强大的转码系统,不是一两个转码系统就可以了,而是需要云,吃进去的是草,挤出来的是奶。整个服务器的云是播出云,提供分发和CNN流量的,我们这里没有流量,就是简单的信号流量进,成品出,但500台服务器日夜咆哮,运算量都比别人大,因为它真的在做复杂的视频运算。做云计算来讲,包括存储体系,并行工作的体系我们都做非常好的设计。异地从北京送到上海、无锡计算以后,经过人工校对,这里面还会有5%会错,人名、地名会错,对国家的一些安全要求必须经过人的审核,审核之后到成品中心进行分解,分解之后做推送。

天脉的案例不是做代工生产平台,是帮助媒体挖掘出视频影音的DNA,你表面上看是视频,实际上是有DNA的,画面特征有大量丰富信息,意味着你会有不同的表现,比如深化同步的部分,在上海文广他们有一个对海外华人的播出平台,就是拿这种模式教中文,说中国的普通话,看中国时事的时候看着中国文字。这是一个商业资源,不仅仅是一个索引资源。

天脉可以通过云计算把传统的简单索引变成立体标

引,视频内涵的标引,而且它确实面向前端个性化的,我经常会跟现在的一些用户讲,我们要搜一个NBA的比赛,很多人都会说我能找到,我想看火箭队的比赛我也能找到,但看到姚明出场没有,但没有这个特征,因为电视上只有比赛没有特征,看姚明扣篮的动作肯定没有,但事实上我就想看姚明的比赛和扣篮,而现在要看姚明的比赛只能看场次,这不符合互联网的消费模式的习惯。互联网的消费模式是Google一搜就出来了,这个新的处理模式,技术比较复杂,必须构建在云端,不能每家独立建设,煤价独立建设也需要有庞大的技术成本在里面。

天脉在给新媒体提供的服务理念里提到三块:第一我们可以给各个地方做内容代加工,开玩笑就是视频领域的富士康,帮你加工内容就可以了,但我雇佣的是机器不是人去做。第二我们帮你做好一套适合于新媒体的标引体系,有了这个体系之后,你就可以快速标引产品,标引离你最近,最不能再做改造。第三创新模式或双子电视的模式帮你构建前端引用,我觉得这应该是运营商、用户最关心的和我们最擅长的,因为这是我最擅长的。天脉从目前的技术现状可以做到几点,三天之内可以完成异地电视台的节目收购,五天就可以把成品送过去,七天就能帮您构筑一套全业务的资源平台,包括IPTV、手机和互联网,十分钟就能让用户你的电视节目里播出的片断,一毫秒你可以看到基于毫秒的镜头来。

我的合作案例,目前都是积极比较大的合作案例,天脉云端目前支撑着国内几个大的客户做,央视,央视需要大量的网络信号和内容,其它公司做不了,我们在给他们提供服务,还有北京文广、中国教育电视台、陕西电视台,安徽电视台,全部资源平台推送过去。这是我们给教育电视台做的,这是给北京电视台的“北京时间”做的,网络电视、手机电视、TV社区,互动点播都是我们做的;上海文广SMG百事通IPTV的内容,现在中国IPTV的内容做得最成功的就是百事通平台,有200万用户,上海本地100万,江苏100万,无锡这个城市就20万,央视在云南只有几万用户,加在一起没有文广大,所以文广最成熟。文广现在实际上主要跟中国电信合作,中国电信提供机顶盒、计费,文广负责分发、节目播控,但节目源文广交给我们,直播节目是文广推送的,而点播和搜索的内容每一都是天脉来提供的,我们制作好的H.264编码格式的标清视频流每天Push到上海文广中心,由上海文广中心Push到各地SMG来做审核,所以,他对我有要求,什么东西要做一两小时,什么东西不能过夜等等,新闻类、影视类都交

给我,手机上、网站上都交给我们做,其它电视电视台。

我们非常想把生产价值展示给前端,所以,我们给冬奥会做了全景大型活动,包括央视的豪门盛宴,这些素材都是通过网络平台挖掘的,主持人张斌通过网络形式进行了新的资源展示,而且做到传统电视台的内容优化和节目优化里,带来新的收视率,同时我们给上海世博局提供关于上海世博会的媒体监测服务。

我们愿意与在座合作伙伴精诚合作,共赢未来!谢谢大家!

给我留言

留言无头像?