十年,对于人生来说,可以有无限可能。追求梦想,塑造自我,改变人生;对于一项技术来说,时间的意义在于在变化的市场中完成自我修炼和进化,市场因时而变,底色不变。
视频结构化的十年也是如此。看其十年大事,从而在安防行业知其过去,窥其未来。
01.
视频结构化“十年计划”
什么是视频结构化?还是有必要说说的。毕竟十年前,十年后,都变了。毕竟场景为王,需求项目和技术水平都在不断提升。
视频结构化是指对非结构化数据的处理。它是一种基于视频内容信息提取的技术。它根据语义关系,通过时空分割、特征提取和对象识别等手段,将视频内容组织成计算机和人类都能理解的结构化信息。
其实还是要追根溯源的。视频结构化始于2009年,由公安部三部提出。作为政府办的检测机构,因为市场上没有覆盖这一技术的产品而被搁置。
直到大数据和云技术在安防行业的大力应用,视频结构化技术才成为代表新一代视频监控的关键技术,也是产业技术创新发展的突破口。
星星之火,可以燎原。2013年春天,第一个场景——视频结构化开始在公安行业盛行。当时甲方希望给定一张嫌疑人的照片,借助视频结构化系统,只需几秒钟就能从数百到数千小时的高清视频中找到嫌疑目标。这就把办案人员从筛选视频监控的简单重复工作中解放出来,消耗的人力更少,效率更高,更准确。
除了精准快速识别的基本功能,当时结合实际应用,视频浓缩、图像搜索、智能检索、结构化任务、系统管理等功能。频繁出现在结构化分析平台中。
从数据处理的流程来看,视频结构化技术可以将非结构化的视频数据转化为人和机器能够理解的结构化或半结构化的情报信息,进而转化为用于公共安全实战的情报数据,从而实现视频数据向信息和情报的转化,实现视频感知世界的智能化应用。
视频结构化不仅是实现海量视频信息化、智能化转型的有效技术,也是当时公共安全领域视频结构化的方向性方案。
02.
视频结构化“新十年”
10年前,视频结构化的主要场景是:运动物体的结构化描述,代表了视频浓缩和概括的技术;人脸和车辆的结构化描述代表了检测和识别技术。
十年战役,视频结构最大的变化是实现了基于自动机器处理的视频信息处理和分析,通过技术手段转化为可用数据,实现监控网络、终端、业务场景之间的信息共享和主动互操作,实现主动监控、自动网络分析等网络功能。为此,这样进化出来的机读地图在这一年也写了不少。
为什么我们需要机器来理解视界?我们可以看到严峻的现实是,在产业变革之后,成千上万的行业正在进行数字化转型和智能化转型。如果说智能安防摄像头解决的是“眼睛”的问题,以及对“什么”的感知问题,那么重点在于海量数据的存储和分析。
那么,在智能安防时代,摄像头识别更多的内容对象,覆盖所有场景、全天候,解决更多的是“大脑”思维的问题,即“如何做”的认知层面,专注于基于数据的分析、理解、决策和行动,让数据以相关的方式、全面甚至自动地被查看。可想而知,依靠人的眼睛和大脑来检索、查看、分析和判断图像数据就像是“天方夜谭”。
为此,很多头部企业已经开始在感知层面的视频结构化上下功夫。只有准确的视频源才能为其后续的机器图像识别应用提供先天条件。数据结构使得海量信息检索变得简单高效。
前端传感摄像头对视频内容进行识别分析,提取结构化数据,传输到安防大数据平台进行二次深度数据提取。提取的人脸信息、车牌号、车牌颜色等结构化数据存储在分布式数据库中,可以为上层应用提供智能检索、智能回放、自动比对的数据支持,实现海量信息的高效检索。
无独有偶,也有新的方法论。2014年出现的边缘计算,是近五年的热门技术。和视频结构的联系也很紧密。在理论阶段,边缘计算在视频结构化中的应用包括两个步骤:模型开发和模型部署。
模型开发是指设计和训练神经网络模型。在视频结构化的任务中,这里的网络模型通常指的是目标检测模型。
模型部署就是将模型进行转换,部署到边缘计算设备上。从理论到产品的飞跃需要很短的时间。过去三年中许多边缘计算箱的出现就证明了这一点。这些边缘设备基于视频结构化理论和技术,为其铺平了道路。
视频结构化,从图像的角度来说,就是把不规则变成规则,从而找到,类似于物流仓库管理,以尽快达到目的。在这十年里,围绕全场景、全要素、全时空的智能安防需求,匹配视频结构化、场景化应用的技术显得尤为重要,也与未来无缝对接。