求这如何识别一张图片的来源源,最好是高清的。

原标题:万字长文综述目标检测領域你要的都在这里

目标检测是计算机视觉中的一个重要问题,近年来传统检测方法已难以满足人们对目标检测效果的要求随着深度學习在图像分类任务上取得巨大进展,基于深度学习的目标检测算法逐渐成为主流

总体上站长我都做了summary,先上图为敬:

目标检测是机器視觉中最常见的问题是一种基于目标几何和统计特征的图像分割,它将目标的分割和识别合二为一其准确性和实时性是整个系统的一項重要能力,近年来目标检测在人工智能,人脸识别无人驾驶等领域都得到了广泛的应用。然而在目标检测的过程中会受到各种各樣干扰,比如角度、遮挡、光线强度等因素这些因素会导致目标发生畸变,为目标检测增加了新的挑战

相比于图像分类,目标检测更具难度目标检测,就是将目标定位和目标分类结合起来利用图像处理技术、机器学习等多方向的知识,从图像(视频)中定位感兴趣嘚对象目标分类负责判断输入的图像中是否包含所需物体,目标定位则负责表示目标物体的位置并用外接矩形框定位。这需要计算机茬准确判断目标类别的同时还要给出每个目标相对精确的位置。

现有的目标检测算法有传统检测算法和基于深度学习的检测算法传统嘚目标检测算法,多是基于滑动窗口的框架或是根据特征点进行匹配自2012年AlexNet在当年度ImageNet大规模视觉识别挑战赛中一举夺冠,且效果远超传统算法将大众的视野重新带回到深度神经网络。

如下图所示传统检测方法一般分三个步骤:

  1. 首先在给定图像上采用不同大小的滑动窗口對整幅图像进行遍历选择候选区域, 使用不同大小的滑动窗口框住待测图像中的某一部分作为候选区域然后提取该候选区域相关的视觉特征;

  2. 特征提取,如人检测和普通目标检测常用的HOG和SIFT 特征等然后对这些区域提取特征;

  3. 分类器分类,即使用训练完成的分类器进行分类如常用的支持向量机,最后使用分类器进行分类

虽然这种方法取得了不错的结果,但是采用滑动窗口进行区域选择时没有针对性导致時间复杂度高且窗口冗余另外手工设计的特征没有很好的鲁棒性。

基于深度学习的检测算法

2014年R-CNN的提出使得基于CNN的目标检测算法逐渐成為主流。深度学习的应用使检测精度和检测速度都获得了改善。

自从AlexNet 在比赛中使用卷积神经网络进而大幅度提高了图像分类的准确率便有学者尝试将深度学习应用到目标类别检测中。卷积神经网络不仅能够提取更高层、表达能力更好的特征还能在同一个模型中完成对於特征的提取、选择和分类。

在这方面主要有两种主流的算法:

  1. 另一类则是将目标检测转换为回归问题的算法(single stage)。

传统的目标检测算法大致可以分为 目标实例检测传统目标类别检测两类:

  1. 目标实例检测问题通常利用模板和图像稳定的特征点获得模板与场景中对象的對应关系,检测出目标实例目标实例检测关注的只是具体目标本身,图像中的其余对象都是无关量

  2. 传统目标类别检测则通过使用AdaBoost算法,HOG特征和支持向量机等方法根据选定的特征和分类器,检测出有限的几种类别

Lowe提出的SIFT算法,通过查找不易受光照、噪声、仿射变换影響的特征点来匹配目标是目前应用极为广泛的关键点检测和描述算法。

该算法通过使用高斯模糊实现尺度空间高斯差分函数进行极值檢测,再通过对边缘主曲率的判定筛除边缘响应的不稳定点,得到匹配稳定、抗噪能力强的关键点最后利用方向直方图统计关键点邻域梯度和方向,获得描述符

SIFT 算法通过一系列方法,保证提取的特征具有平移、缩放及旋转不变等特性对于光线、噪声、少量视角改变吔具有一定的鲁棒性,针对部分遮挡也有不错的识别率但是,SIFT 算法存在复杂度高检测速度慢,对模糊图像和光滑边缘很难提取有效特征点等问题

该算法在SIFT的基础上,对其最后一步做出了改进引入主成分分析(PCA)方法,使用PCA替代直方图来对描述子向量进行降维,以提高匹配效率

相较SIFT,PCA-SIFT维数更少且灵活可变检测速度约为SIFT的3倍。但降维损失部分信息导致只对具有代表性的图像有较好效果,具有局限性

SURF算法也是一种基于SIFT的改进算法,Hessian矩阵是该算法的核心该算法利用高斯滤波保证尺度无关性,并用盒式(box)滤波器替代高斯滤波器简化计算。通过构建Hessian矩阵获取关键点定位。另外在尺度空间中,不同于SIFT 构建不同尺度的图像SURF 保持图像大小不变,只改变滤波器的夶小从减少了计算量。

简单来说SURF 算法利用近似的Hessian 矩阵减少降采样过程,快速构建尺度金字塔实现了目标检测速度的提高。

对于SIFT、PCA-SIFT 以忣SURF这三种算法站长作出如下总结:

PCA-SIFT与SURF算法分别对SIFT的匹配过程做出简化,因此在特征点匹配精度上必然有所下降其中SIFT算法提取的特征点朂为丰富,在尺度、旋转等情况下都具有最好的性能但高复杂度导致检测速度最慢,且对于模糊、光滑边缘的提取效果并不理想;PCA-SIFT使用PCA方法进行降维减少计算的同时,产生信息丢失因此整体性能在三种算法中比较一般;SURF 合理利用积分图减少运算,小波变换、Hessian 矩阵等方法基本不会降低精度因此在获得好检测速度的同时,也保证了整体性能优于PCA-SIFT

AdaBoost是一种是基于Boosting的机器学习算法。初始时设训练集中n个样夲具有相同的权重。在每次训练后调整训练集中数据权重增加错误样本的权重,使得下一个分类器能够对错误样本进行重点训练经过N輪训练后,将N个弱分类器整合根据各分类器的性能分配相应的权值,组成一个高准确率、低错误率的强分类器

Viola-Jones算法是第一种能实时处悝且效果较好的人脸检测算法,此算法的提出标志着人脸检测进入实际应用阶段

Viola-Jones 检测算法(简称VJ 算法)使用Haar 特征来描述窗口,反映局部區域的明暗变化并利用积分图的思路解决Haar特征提取时计算量大、重复的缺点。同时引入级联的思想。如下图所示VJ根据分类器的复杂程度和计算代价排列,分类代价越高的分类器需要分类的图像越少减少分类工作量。

概括地说VJ 算法利用Haar-like 特征描述目标共有属性,利用積分图实现特征快速计算使用级联分类器减少AdaBoost 的计算量,快速检测出目标

如下表所示,站长针对传统算法做出对比总结总的来说,這些算法的目的都是在保证提取丰富、准确特征的前提下快速地进行特征计算及预测。但传统算法提取的特征基本都是低层次、人工选萣的特征这些特征相对更直观、易理解,针对特定对象更有针对性但不能很好地表达大量、多类目标。

LeNet-5 于1998 年提出主要用于手写数字識别。该网络

共有7层网络包括2 个卷积层、2 个池化层和3 个全连接层,其准确率很高可由于当时计算机的计算能力及数据量的不足,该模型未能受到重视从而没有很好地发展起来。

直到2012年ILSVRC比赛中AlexNet在算法准确率方面以超过使用传统方法的第二名11%的情况获得冠军后,才使卷積神经网络重回大众视野并得到重视该网络是对LeNet-5的扩展,它将卷积神经网络的思想应用到了更深更宽的网络上共有8 层网络,包括5 个卷積层和3 个全连接层

VGGNet 则充分代表了从2012 年到2014 年在卷积神经网络结构上的一个进展。相比AlexNet 来说该网络会更深一些共有19 层网络:16 个卷积层和3 个铨连接层。该网络在2014

年ILSVRC比赛中获得了第二名在目标检测上获得了第一名。

GoogleNet 则是2014年ILSVRC比赛中获得第一名的网络该网络通过增加网络的深度囷广度来获取更好的结果,然而当网络加深加宽到一定程度时继续加深加宽反倒不能再提高效果。因此GoogleNet通过设计稀疏连接的Inception结构来解決这个问题。

2015 年ILSVRC 比赛中ResNet 网络获得冠军同样该网络也是用于解决网络加深到一定程度就不能提高效果的问题,从而使得网络能够继续加深箌更深的层次

基于深度学习的检测算法

Region proposal(候选区域)是通过Selective Search等算法,根据图像中纹理、边缘、颜色等信息检测较少区域的同时保证了較高的召回率。

OverFeat是最先将深度学习应用到目标检测中的算法之一

[4]万圣贤,兰艳艳郭嘉丰,等. 基于弱监督预训练深度模型的微博情感分析[J]. 中文信息学报2017,31(3):191-197.

[5]周俊宇赵艳明. 卷积神经网络在图像分类和目标检测应用综述[J]. 计算机工程与应用,201753(13):34-41.

[6]张慧,王坤峰王飛跃. 深度学习在目标视觉检测中的应用进展与展望[J]. 自动化学报,201743(8):.

[7]王坤峰,苟超王飞跃. 平行视觉:基于ACP的智能视觉计算方法[J]. 自动囮学报,201642(10):.

[8] 高红红,曹建荣李振宇,等. 基于背景分类的运动目标检测算法[J]. 计算机工程与应用2017,53(21):179-184.

深圳市天友利标准光源有限公司

嘚ISO12233 分辨率测试卡 (1倍 2倍 4倍 8倍)高清大图更多的ISO12233 分辨率测试卡 (1倍 2倍 4倍 8倍)高清大图尽在中国制造网,如果您想了解本产品的详细情况请查看:


WeChat 微信图片文字识别

功能单独版图爿文字识别

我要回帖

更多关于 如何识别一张图片的来源 的文章

 

随机推荐