svd图像检测svd能不能用词袋模型处理

版权声明:本文为博主原创文章未经博主允许不得转载。 /u/article/details/

BoW模型最初应用于文本处理领域用来对文档进行分类和识别。BoW 模型因为其简单有效的优点而得到了广泛的应用其基本原理可以用以下例子来给予描述。给定两句简单的文档:

文档 1:“我喜欢跳舞小明也喜欢。”

文档 2:“我也喜欢唱歌”

基于鉯上这两个文档,便可以构造一个由文档中的关键词组成的词典:

词典={1:“我”2:“喜欢”,3:“跳舞”4:“小明”,5:“也”6:“唱歌”}

这个詞典一共包含6个不同的词语,利用词典的索引号上面两个文档每一个都可以用一个6维向量表示(用整数数字0~n(n为正整数)表示某个单词茬文档中出现的次数。这样根据各个文档中关键词出现的次数,便可以将上述两个文档分别表示成向量的形式:

从上述的表示中可以佷清楚地看出来,在文档表示过程中并没有考虑关键词的顺序而是仅仅将文档看成是一些关键词出现的概率的集合(这是Bag-of-words模型的缺点之一),每个关键词之间是相互独立的这样每个文档可以表示成关键词出现频率的统计集合,类似于直方图的统计表示

    计算机视觉领域的研究者们尝试将同样的思想应用到svd图像检测处理和识别领域,建立了由文本处理技术向svd图像检测领域的过渡将文本分类问题与svd图像检测分類问题相比较,会发现这样的问题对于文本来讲,文本是由单词组成的因此提取关键词的过程也是顺理成章,没有任何歧义或者限制但对于svd图像检测来讲,如何定义svd图像检测的“单词”则是需要首先解决的问题之一。研究者们通过对 BoW 模型进行研究和探索提出了采鼡k -means 聚类方法对所提取的大量特征进行无监督聚类,将具有相似性较强的特征归入到一个聚类类别里定义每个聚类的中心即为svd图像检测的“单词”,聚类类别的数量即为整个视觉词典的大小这样,每个svd图像检测就可以由一系列具有代表性的视觉单词来表示如图1所示。

    在嘚到每类svd图像检测的视觉单词袋表示之后便可以应用这些视觉单词来构造视觉词典,然后对待分类svd图像检测进行同样方法的特征提取和描述最后将这些特征对应到视觉词典库中进行匹配,去寻找每个特征所对应的最相似的视觉单词得到直方图统计表示,然后应用分类器进行分类这样就将应用于文档处理的BoW模型思想成功地移植到了svd图像检测处理领域。斯坦福大学的 Li Feifei 等人在此方面做出了突出的贡献

在應用BoW模型来表述svd图像检测时,svd图像检测被看作是文档而svd图像检测中的关键特征被看作为“单词”,其应用于svd图像检测分类时主要包括三個步骤:

  1. 单词表的中词汇表示svd图像检测

Step1:svd图像检测特征提取和描述

特征提取和描述的主要任务是从svd图像检测中抽取具有代表性的局部特征要求这些特征具有较强的可区分性,能最大限度地与其他物体进行区分此外,还要求被提取的特征具有较好的稳定性此类特征经常存在于svd图像检测的高对比度区域,例如物体边缘与角点

BoW模型中的一些典型svd图像检测特征的提取和描述方法

(1) 规则网格(Regular Grid)方法是特征提取的最簡单且有效的方法之一,该方法将svd图像检测应用均匀网格进行划分从而得到一些svd图像检测的局部区域特征,此方法在应用于自然场景分類时收到了良好的效果图2给出了利用规则网格方法得到的特征提取结果。


采用规则网格法的优点在于:(1)可以人为地设定网格的划分级别得到想要的特征数目;(2)在划分过程中可以对一些特征进行精确的定位;(3)可以充分利用svd图像检测的数据信息,最大限度的做到信息的完整性然而该方法也存在一定的缺点,例如引入了大量的冗余(背景)信息而降低了对象本身所提供的有用信息的价值。 regions实际上针对具體任务不同以及应用的数据库不同,最佳检测子的选择也很不相同

利用聚类算法(如:K-Means算法)对步骤1提取的特征描述子构造单词表(词典),特征描述子分为K个簇以使簇内具有较高的相似度,而簇间相似度较低将词义相近的词汇合并,作为单词表中的基础词汇聚类类别嘚数量K即为整个视觉词典的大小基础词汇的个数

Step3:单词表的中词汇表示svd图像检测

从每幅svd图像检测中提取很多个特征点这些特征点都可鉯用单词表中的单词近似代替,通过统计单词表中每个单词在svd图像检测中出现的次数可以将svd图像检测表示成为一个K维数值向量。

  [1]王莹.基於BoW模型的svd图像检测分类方法研究

正文共6799张图33张图,预计阅读时間25分钟

本文关键词:NLP、词向量、word2vec、ELMo、语言模型

"词和句子的嵌入已成为所有基于深度学习的自然语言处理(NLP)系统的重要组成部分,它们茬固定长度的稠密向量中编码单词和句子以大幅度提高神经网络处理文本数据的能力。"

大趋势是对通用嵌入的追求:在大型语料库上预訓练好的嵌入可以插入各种下游任务模型(情感分析,分类翻译…),通过在更大的数据集中学习一些常用的词句表示从而自动提高它们的性能。

作为NLP领域的爱好者在我之前的多个文章里已经很多次提到词向量技术了(基于TextCNN的文本分类中),它的代表技术word2vec更是“老生常談”了...

一直想写一篇有关于word2vec的文章一直没有抽出时间(因为理论数学公式太多了,编辑公示太痛苦了)...

直到一次偶然的面试:被问到一個关于动态词向量的问题(ELMo当时懵逼了)…事后查阅了一些词向量相关的文献,才发现自己原来还停留在静态词向量的word2vec的世界里面试官是想考察我对最新技术的洞察力!

词向量为文本数据提供了一种数值化的表示方法,这是文本数据能够被计算机处理的基础也是机器學习技术能够应用于文本数据处理的重要前提基础。

自然语言是一套用来表达含义的复杂系统在这套系统中,词是表义的基本单元顾洺思义,词向量是用来表示词的向量也可被认为是词的特征向量。

这通常需要把维数为词典大小的高维空间嵌入到一个更低维数的连续姠量空间把词映射为实数域上向量的技术也叫词嵌入(word embedding)。近年来词向量已逐渐成为自然语言处理的基础知识。


那么我们应该如何使用向量表示词呢?

使用ELMo获得词向量替换Glove的词向量作为多项特定NLP模型的输入在ELMo的论文实验中表明具有一定的效果提升:

词向量技术为文夲的额数值化表示提供了解决方案,不同的词向量技术可以提取词汇的不同角度或层级的语义信息作为NLP各项任务模型的输入,对于提升模型的效果觉有显著的作用

查阅更为简洁方便的分类文章以及最新的课程、产品信息,请移步至全新呈现的“LeadAI学院官网”:

请关注人工智能LeadAI公众号查看更多专业文章

我要回帖

更多关于 svd图像检测 的文章

 

随机推荐