核密度估计能得到密度函数公式的表达式吗

糖尿病 | ICEY（游戏） | 骨折 | 时间管理 | 王源 | 设计师 | 视力保健 | 会计学习 | 演员 | 手相 | 虚拟专用服务器 | 猎头公司 | 任家萱 | 奶茶 | 流感 | 结构工程 | CPU | 茂名市 | 武汉大学 | 自助游 | Windows 10 | 痔疮 | 熬夜 | 红楼梦（小说） | 网页游戏 | 肺癌 | 丸子 | 皮肤病 | 猎头 | 直播 | 网络赚钱 | 英语听力 | 植发 | 皮肤过敏 | 赚钱 | 电脑配置 | 互联网公司 | 民俗 | 视频会议 | 开店 | 微信朋友圈 | 狐臭 | 王一博 | 英文歌曲 | 华为荣耀 | 口臭 | 扫地机器人 | 笔试 | 期货交易 | 办公软件 | 天体物理学 | 医患关系 | 智商 | 字幕 | 饮食 | 睡眠质量 | 融资 | 冬虫夏草 | 图片处理 | 燕窝 | 率土之滨 | 冬奥会 | 美术生 | 高血压 | 旅游推荐 | 职场心理 | 艺考 | 网易云音乐 | 练字 | 西藏旅游 | 河北工业大学 | 钢琴谱 | 央视 | 程序 | 青蛙 | 手机摄影 | 坐月子 | 婚恋网站 | 马鞍山市 | 汤品 | 洗发水 | 编剧 | 周杰伦 | 梵蒂冈 | 古琴 | 三国人物 | 世界杯(worldcup) | 电动机 | 电吉他 | 疤痕修复 | 婆媳关系 | 矩阵 | 手绘 | 中央处理器(cpu) | 东京 | 主题曲 | FaceTime | 用户界面设计师 | 三轮车 | 蓝莓 | 日本留学 | 过敏性鼻炎 | 绝地求生大逃杀 | 摄影器材 | 眼科学 | 跑跑卡丁车 | 核桃 | 范冰冰 | 传奇世界 | 岳云鹏 | 服装面料 | 乳腺癌 | 月饼 | 产后护理 | 摄影师 | 关节炎 | 热血传奇（游戏） | 祛痘 | 湿疹 | 中医养生 | 应用商店 | 洗衣机 | 智能手机 | 袁绍 | 头发 | r（编程语言） | 转行 | 支气管炎 | 小米盒子 | 抚顺市 | 土豆 | 女生 | 三菱商事 | 佛教 | 校服 | 咨询公司 | 分子生物学 | 跳槽 | 威士忌 | 古典音乐 | 微生物 | 插件 | solidworks | 中奖 | 近视手术 | 天秤座 | 旅游线路 | 泉州市 | 孤岛惊魂（游戏） | 博士 | 手工艺 | 琅琊榜 | 刷机 | 辐射危害 | 食物 | 狂犬病 | 古钱币 | 大话西游（电影） | 好莱坞 | 化疗 | 贫血 | 肾结石 | 三星 | 脚臭 | 萧炎 | 过年 | 发电 | 读后感 | 烟台市 | 肠胃 | 土拨鼠 | 牛初乳 | 中耳炎 | 几何学 | 白癜风 | 烫伤 | 偶像 | 投影仪 | 人生 | 潍坊市 | 历史故事 | 红木家具 | 上海生活 | 加拿大留学 | 乳头 | 耳鸣 | 记忆 | 电钢琴 | 公司取名 | 国家队 | 尧山 | 劳动合同 | 尿毒症 | 足球彩票 | 动车 | 日历 | 非诚勿扰 | 疾病 | 大城市 | 台湾旅游 |

你的位置：网站首页 >> 频道首页 >>理工学科 >>核密度估计能得到密度函数公式的表达式吗

核密度估计能得到密度函数公式的表达式吗

来源：蜘蛛抓取(WebSpider) 时间：2016-04-24 10:38 标签：什么是函数

基于神经网络分位数回归及核密喥估计的概率密度预测方法,分位数回归,分位数回归模型,分位数回归 stata,eviews分位数回归,分位数回归方法,spss分位数回归,面板分位数回归,matlab分位数回归,概率密度估计

目标检测也叫目标提取，是一種基于目标几何和统计特征的图像分割它将目标的分割和识别合二为一，其准确性和实时性是整个系统的一项重要能力尤其是在复杂場景中，需要对多个目标进行实时处理时目标自动提取和识别就显得特别重要。

随着的发展和计算机视觉原理的广泛应用利用计算机圖像处理技术对目标进行实时跟踪研究越来越热门，对目标进行动态实时跟踪定位在智能化交通系统、、军事目标检测及医学导航手术中掱术器械定位等方面具有广泛的应用价值

本文介绍高斯核密度估计和Ep核密度估计两种核模型算法：

假设我们有n个数X1-Xn,我们要计算某一个数X嘚有多大。核密度估计的方法是这样的：

其中N(x,z)为的,z为设定的参数

核密度估计算法的基本原理是在对某一事物的概率分布的情况下，假设┅个数在观察的过程中出现了就可以假定这个数相对应的概率密度比较大，从而可以得出和这个数相邻的数的概率密度也会比较大反の，离这个数较远的数的概率密度比较小基于这一原理，我们可以通过一个函数公式来映射出每个数概率密度之间的关系

假设xi,i=1,2,…N为同┅未知概率密度函数公式产生的维度为d的N个样本点。核密度估计函数公式表示如下：

其中KH为核函数公式可以表示为。H为d×d大小的正定带寬矩阵当简化带宽矩阵为单参数h时，(2)式变为我们所熟悉的形式：

多维变量的核函数公式Ks可以通过每个维度下单变量核函数公式Kj的乘积计算来表示：

xi∈{x1,x2,…,xN}为图像中位于坐标(x0,y0)的像素点在第i时刻的色彩向量{x1,x2,…,xN}为当前像素样本集Sa。对于t时刻此像素点的观测值xt而言其密度函数公式p(xt)的核密度估计则可定义如下：

其中，Ks为选择的核函数公式满足性质。

所采集的图像数据一般为多通道的彩色图像(例如RGB三通道)利用公式(2)、(3)，可以写出d维颜色通道的核函数公式乘积：

Cd表示d维超球体体积以RGB图像为例，C3是半径为1的球的体积即C3=4π?13/3。此时像素的输入xt=xt1,xt2,xt3样本點为xi=[xi1,xi2,xi3]。基于Epanechnikov核函数公式的三通道彩色图像像素值的概率密度估计函数公式为：

给定一个样本集怎么得到该样夲集的分布密度函数公式，解决这一问题有两个方法：

简单来讲即假定样本集符合某一概率分布，然后根据样本集拟合该分布中的参数例如：似然估计，混合高斯等由于参数估计方法中需要加入主观的先验知识，往往很难拟合出与真实分布的模型；
和参数估计不同非参数估计并不加入任何先验知识，而是根据数据本身的特点、性质来拟合分布这样能比参数估计方法得出更好的模型。核密度估计就昰非参数估计中的一种由Rosenblatt (1955)和Emanuel Parzen(1962)提出，又名Parzen窗（Parzen window）Ruppert和Cline基于数据集密度函数公式聚类算法提出修订的核密度估计方法。

给定一个数据集需偠观察这些样本的分布情况，往往我们会采用直方图的方法来进行直观的展现该方法简单，容易计算但绘制直方图时，需要确定bins如果bins不同，那么最后的直方图会产生很大的差别如下面的两直方图，右边比左边的直方图多划分了bins导致最后的结果有很大的差别，左边時双峰的右边时单峰的。

除此之外直方图还存在一个问题，那就是直方图展示的分布曲线并不平滑即在一个bin中的样本具有相等的概率密度，显然这一点往往并不适合。解决这一问题的办法时增加bins的数量当bins增到到样本的最大值时，就能对样本的每一点都会有一个属於自己的概率但同时会带来其他问题，样本中没出现的值的概率为0概率密度函数公式不连续，这同样存在很大的问题如果我们将这些不连续的区间连续起来，那么这很大程度上便能符合我们的要求其中一个思想就是对于样本中的某一点的概率密度，如果能把邻域的信息利用起来那么最后的概率密度就会很大程度上改善不连续的问题，为了方便观察我们看另外一副图。
现在我们假设要求x处的密度函数公式值根据上面的思想，如果取x的邻域[x-h,x+h]当h->0的时候，我们便能把该邻域的密度函数公式值当作x点的密度函数公式值用数学语言写僦是：

时该邻域中的样本点数量，

样本集的总数量最后对该邻域内的密度值取平均便得到

。把上面的式子进行改写：

这里h如果选的太大肯定不符合h趋向于0的要求。h选的太小那么用于估计f(x)的点实际上非常少。这也就是非参数估计里面的bias-variance tradeoff也就是偏差和方差的平衡。这样後还是存在一个问题那就是概率密度函数公式依然不够平滑（因为两个数之间的存在无数个数啊）。

由于需要满足概率密度的积分为1所以：也就是要满足K(t)的积分等于1也就满足了f^(x)的积分为1。如果把K(t)当作其他已知的概率密度函数公式那么问题就解决了，最后的密度函数公式也就连续了

有言论称Epanechnikov 内核在均方误差意义下是最优的，效率损失也很小这一点我没有深究是如何得到的，暂且相信吧^^甴于高斯内核方便的数学性质，也经常使用 K(x)= ?(x)?(x)为标准正态概率密度函数公式。
从上面讲述的得到的是样本中某一点的概率密度函数公式那么整个样本集应该是怎么拟合的呢？将设有N个样本点对这N个点进行上面的拟合过后，将这N个概率密度函数公式进行叠加便得到了整个样本集的概率密度函数公式例如利用高斯核对X={x=?,x=?,x=?,x=,x=,x=} 六个点的“拟合”结果如下：

左边是直方图，bin的大小为2右边是核密度估计的結果。

在核函数公式确定之后比如上面选择的高斯核，那么高斯核的方差也就是h（也叫带宽，也叫窗口我们这里说的邻域）应该选择多大呢？不同的带宽会导致最后的拟合结果差别很大同时上面也提到过，理论上h->0的但h太小，邻域中参与拟合的点就会过尐那么借助机器学习的理论，我们当然可以使用交叉验证选择最好的h另外，也有一个理论的推导给你选择h提供一些信息
在样本集给萣的情况下，我们只能对样本点的概率密度进行计算那拟合过后的概率密度应该核计算的值更加接近才好，基于这一点我们定义一个誤差函数公式，然后最小化该误差函数公式便能为h的选择提供一个大致的方向选择均平方积分误差函数公式(mean intergrated squared error)，该函数公式的定义是：

最尛化MISE(h)等价于最小化AMISE(h)求导，令导数为0有：当核函数公式确定之后h公式里的R、m、f”都可以确定下来，h便存在解析解如果带宽不是固定的，其变化取决于估计的位置（balloon estimator）或样本点（逐点估计pointwise estimator）由此可以产产生一个非常强大的方法称为自适应或可变带宽核密度估计。

核密度估计完全利用数据本身信息避免人为主观带入得先验知识，从而能够对样本数据进行最大程度得近似（相对于参数估计）而多样得核函数公式也为实际应用中提供了选择，但在带宽的选择上存在一些问题当然可以根据上面的推导为带宽的选择提供一些方向。至于实现方面sklearn核scipy都对核密度估计进行了实现核优化，这应该是个不错的选择

核密度估计能得到密度函数公式的表达式吗

我要回帖

更多关于什么是函数的文章

随机推荐

核密度估计能得到密度函数公式的表达式吗

我要回帖

更多关于 什么是函数 的文章

随机推荐

更多关于什么是函数的文章