一、概述
在视频监控飞速发展的今天,海量视频画面已经大大超过了人力有效处理的范围。而智能视频分析技术极大地发挥与拓展了视频监控系统的作用与能力,使监控系统具有更高的智能化,大幅度降低资源与人员配置,全面提升安全防范工作的效率。目前已广泛应用于平安城市、智能交通、金融行业、政法监管、商业等领域。
智能视频分析技术是计算机视觉技术在安防领域应用的一个分支,是一种基于目标行为的智能监控技术。它能够在图像或图像序列与事件描述之间建立映射关系,从而使计算机从纷繁的视频图像中分辩、识别出关键目标的行为,过滤用户不关心的信息,其实质是自动分析和抽取视频源中的关键信息。
按照智能分析算法实现的方式进行区分,可以概括为以下几种类型的智能分析:
识别类分析:该项技术偏向于对静态场景的分析处理,通过图像识别、图像比对及模式匹配等核心技术,实现对人、车、物等相关特征信息的提取与分析。如人脸识别技术、车牌识别技术及照片比对技术等。
行为类分析:该项技术侧重于对动态场景的分析处理,典型的功能有车辆逆行及相关交通违章检测、防区入侵检测、围墙翻越检测、绊线穿越检测、物品偷盗检测、客流统计等。
图像检索类分析:该技术能按照所定义的规则或要求,对历史存储视频数据进行快速比对,把符合规则或要求的视频浓缩、集中或剪切到一起,这样就能快速检索到目标视频。
图像处理类分析:主要是对图像整体进行分析判断及优化处理以达到更好的效果或者将不清楚的内容通过算法计算处理达到看得清的效果。如目前的视频增强技术(去噪、去雾、锐化、加亮等)、视频复原技术(去模糊、畸变矫正等)。
诊断类分析:该项分析主要是针对视频图像出现的雪花、滚屏、模糊、偏色、增益失衡、云台PTZ失控、画面冻结等常见的摄像头故障进行准确分析、判断和报警,如视频质量诊断技术。
二、智能分析核心算法介绍
1. 运动检测算法
帧差法
相邻或间隔较近的两帧图像中按照对应位置直接进行像素值相减,从而获得差分图像。在差分图像中,若对应位置处像素值很小,则可认为其静止;如果对应位置的像素值较大,则可认为此处为运动部分。
帧差法相对简单,对于动态环境具有较强的自适应性,鲁棒性较好。但是易产生空洞现象,如果空洞过大则会影响轮廓完整性,将很难提取出准确的运动目标区域。
应用帧差法时要求背景绝对静止或基本无变化,噪声较小,目标运动速度不为零,目标区域内亮度变化较为明显。对于存在抖动、噪声等情况下的检测效果不佳,对于动态背景下的目标跟踪,则必须采用其他的方法先对全局运动做出补偿,如块匹配法、坐标变换法等。
背景差分法
混合高斯模型法(Gaussian Mixture
Model,GMM)也称为统计背景模型法。该算法的思想是:对于缓慢变化的背景,可以用正态分布来表征像素灰度值的变化,每一种背景像素的值都可以通过多个高斯分布的加权和来描述。最早提出的是三分布
GMM,每个像素点用三个高斯分布来分别表征背景、前景的阴影、前景这三种不同的模式,但实际情况很复杂,对背景、前景等模式都限定只用一个高斯分布来描述是不够的。因而之后又出现了固定分布数
K 的混合高斯分布模型(Fixed-K Gaussian Mixture Model)以及后面发展而来的基于自适应分布数 K
的混合高斯分布模型(Adaptive-K Gaussian Mixture Model,AKGMM)。
二值化
一幅图像包括目标物体、背景还有噪声,要想从多值的数字图像中直接提取出目标物体,最常用的方法就是设定一个阈值T,用T将图像的数据分成两部分:大于T的像素群和小于T的像素群。这是研究灰度变换的最特殊的方法,称为图像的二值化。
图像的二值化,就是将图像上的像素点的灰度值设置为0或255,也就是将整个图像呈现出明显的只有黑和白的视觉效果。
中值滤波
中值滤波法是一种非线性平滑技术,它将每一像素点的灰度值设置为该点某邻域窗口内的所有像素点灰度值的中值。
中值滤波是基于排序统计理论的一种能有效抑制噪声的非线性信号处理技术,中值滤波的基本原理是把数字图像或数字序列中一点的值用该点的一个邻域中各点值的中值代替,让周围的像素值接近的真实值,从而消除孤立的噪声点。
膨胀腐蚀
膨胀和腐蚀是两种基本的形态学运算。腐蚀就是使用算法,将图像的边缘腐蚀掉,作用就是将目标的边缘的“毛刺”剔除掉,即将物体与周围背景点分离。膨胀就是使用算法,将图像的边缘扩大些,作用就是将目标的边缘或者是内部的坑填掉,即将物体与周围背景点结合。
2. 车牌识别算法
车牌定位算法
对经过预处理后的二值车牌图像进行一阶水平差分得到跳变点图,分别统计水平和垂直方向上的跳变点个数(投影),通过设置标签和区域连通,粗定位车牌的上下和左右边界;选取一定区域的车牌图像进行色彩空间转换,判断车牌底色;对大于一定倾斜角的车牌进行水平矫正,使字符在同一水平线上;对矫正后的灰度图像进行Sobel水平算子和垂直算子进行边缘检测并二值化,采用类似粗定位的方法对车牌进行细定位。
车牌切分算法
算法是基于二值图像进行的,由于车牌颜色的不同,二值化车牌后得到黑底白字、白底黑字两种情况,这里将二值化后的车牌统一规定为黑底白字。由于二值图像会丢失掉很多信息以及汉字的结构等原因,可能会造成字符粘连模糊或断裂的缺陷,增加切分的难度。考虑到算法的实时性和适用性,采用投影法作为主要的分割法,根据车牌的先验知识(字符串的长宽比、字符间隙、字符的长宽比及笔划宽度),配以对粘连字符、断裂字符和车牌边框干扰的特殊处理来完成字符分割。
三、智能分析的现状和应用分析
1. 智能分析产品的发展现状
前端智能与后端智能
从智能分析产品部署来看,主要有两种模式:一类是前端智能产品,一类是后端服务器智能产品。两种产品各有千秋,其中前端智能正在快速发展中。前端视频分析顾名思义就是将智能视频分析算法集成在前端摄像机中,一台摄像机就可以实现智能分析。基于后端服务器的智能视频分析是指将智能算法软件安装在服务器中,前端普通摄像机的视频传入服务器,服务器对视频流进行图像分析和处理。前者的优点是对连接前端设备的网络带宽要求低,无需将视频传输回监控中心,只将报警信号传回即可,而且后端无需设置服务器机房,节省空间;但缺点是无法灵活切换各个前端设备的分析类型,一旦系统建设完成,无法改变特定前端设备的智能类型。后者的优势是可以灵活切换服务器取流的前端设备,对任意的前端设备都可以应用智能视频分析功能(把非智能变为智能),而且后续软件升级更方便快捷;但其缺点是当服务器数量较多时会占用较大的空间,同时对网络的带宽有一定的要求。
非压缩与压缩视频智能分析
绝大多数的智能视频分析算法是基于非压缩图像格式,如RGB或者YUV,所以图像信号在被采集以后不经过压缩直接送给视频分析单元。几乎所有的视频分析系统都自带有图像采集功能,通常是通过BNC输入模拟图像信号。新部署的图像监控系统中图像信号通常是以H.264压缩图像流的形式存在。IPC通常也直接输出压缩图像流,这就要求必须将图像流解压还原成原始图像格式后再进行分析(前端智能可以直接使用YUV进行分析),常用的压缩格式都不是无损(lossless)压缩。和压缩前的原始图像相比,解压后的图像会损失掉一些信息,不过由于压缩算法的特点,丢失的信息通常是高频的噪声信号,所以对运动检测的影响是较小的。当然前提是压缩流有足够的带宽,如果压缩比太高,图像会出现“马赛克”效应,给视频分析增加难度。
2. 智能视频分析的应用场景
(1)金融安保应用场景
视频智能分析在金融系统应用比较广泛,成熟度较好,普及率仅次于平安城市应用,基于视频智能分析的银行安保系统是每个银行(储蓄所,ATM机)的必备系统。主要包括以下检测:
人脸检测:
人脸检测抓怕,用于人脸叠加、比对;多人脸监测,用于ATM机取款检测;脸部遮挡监测,用于盗抢等监测。
滞留物检测:
取款人遗留物检测、加装读卡器、非法粘贴广告。
异常行为监测:
徘徊、 扭打、 人员接近、 长时间逗留。
视频异常检测:
视频遮挡、 视频丢失监测,防止出现视频存储丢失,需要时无法检索安保视频。
(2)交通行业智能分析场景
实时提取各个城市路口监控视频中的车牌、车型、车标、颜色、驾驶者人脸等信息,通过分布式计算集群对大量车辆信息进行关联挖掘,即可生成整个城市交通状态的可视化网图,如道路拥堵情况,易于拥堵的时段、趋势,以及不同区域的车辆迁移路线,甚至根据时间、天气、节假日情况等信息预测交通状况,从而为城市交通决策、应急指挥提供精准、实时的参考数据和信息支撑。
车牌识别:技术和应用已经比较成熟,准确率较高,用户体验已很好。
拥堵检测:车速、车密度、排队长度、逆行、行人检测,交通事故检测抛,洒检测,车型、驾驶员检测。
(3)群体事件分析
对人群等目标的正常行为和异常行为进行分析。能够对区域或场景中群体的行为进行分析,如统计穿越出入口或指定区域人的数量和密度,识别人群的整体运动特征,包括速度、方向等;检测公共场所是否有人员的聚集(规模)、奔跑、斗殴等异常行为,提前预警防止踩踏等恶性事件的发生。
四、智能分析面临的问题及未来发展趋势
1. 智能分析技术的难点
智能分析技术面临的难点是:智能分析的准确率、智能分析对环境的适应性及不同场景使用的复杂性。
(1)检测准确率达不到理想效果。视频分析技术的准确率达不到非常理想的效果,特别是实时报警类的应用,误报率和漏报率都是客户最关心的问题。如果误报太高,客户也接受不了,如果漏报,客户更加接受不了。特别是一些要求比较高的应用,只要有漏报,实际作用就微乎其微。
(2)智能分析对场景的要求较高,光照变化引起目标颜色与背景颜色的变化,可能造成虚假检测与错误跟踪。采用不同的色彩空间可以减轻光照变化对算法的影响,但无法完全消除其影响。
(3)安装调试复杂。智能分析应用产品几乎都需要按每一个应用场景进行不同的参数调试,而且会涉及到非常多的专业的参数调试。非专业人员根本无法调试出理想效果。
2. 大数据与智能分析的融合
大数据与视频监控具有天然的联系,据统计,每天全国新产生的视频数据达PB级别(PB=1024T),占全部大数据份额的50%以上,因此视频就是大数据。在安防领域,主要的数据来源是视频,与其他行业结构化的数据不一样,视频本身就是一种非结构化的数据,不能直接被计算机进行处理或分析。因此,安防要进行大数据应用,首先就要采用智能分析技术将非结构化的视频数据转换成计算机能够识别和处理的结构化信息,即将视频中包含的各种信息(主要是运动目标及其特征)提取出来转成文字描述并与视频帧建立索引关联,这样才能通过计算机来对这些视频进行快速搜索、比对、分析等。
综上分析,智能分析具有如下发展趋势:
(1)算法准确率和环境适应性不断提高,特别是机器学习、人工智能等技术的不断进步,促进智能分析应用的大规模部署。
(2)前端智能不断发展,各种SMART IPC不断涌现,包括专注某几种智能分析算法的专用IPC。
(3)智能分析与云计算、大数据的融合应用将越来越多。
五、结束语
目前,视频的高清化已经成为现实,制约智能分析分辨率的障碍已经消除,未来基于智能分析技术的安防应用将会是安防发展的一个大方向。给视频装上大脑,实时看得懂视频、快速检索历史视频成为新常态。传统的视频监控系统将会因为智能分析技术的大规模应用,逐步向智能大数据综合应用系统发展。