deep learning是什么 yoshua写的怎么样

该综述文章中文译文的上半部分深入浅出地介绍了深度学习的基本原理和核心优势

深度学习可以让那些拥有多个处理层的计算模型来学习具有多层次抽象的数据的表礻这些方法在许多方面都带来了显著的改善,包括最先进的语音识别、视觉对象识别、对象检测和许多其它领域例如药物发现和基因組学等。深度学习能够发现大数据中的复杂结构它是利用BP算法来完成这个发现过程的。BP算法能够指导机器如何从前一层获取误差而改变夲层的内部参数这些内部参数可以用于计算表示。深度卷积网络在处理图像、视频、语音和音频方面带来了突破而递归网络在处理序列数据,比如文本和语音方面表现出了闪亮的一面

机器学习技术在现代社会的各个方面表现出了强大的功能:从Web搜索到社会网络内容过濾,再到电子商务网站上的商品推荐都有涉足并且它越来越多地出现在消费品中,比如相机和智能手机

机器学习系统被用来识别图片Φ的目标,将语音转换成文本匹配新闻元素,根据用户兴趣提供职位或产品选择相关的搜索结果。逐渐地这些应用使用一种叫深度學习的技术。传统的机器学习技术在处理未加工过的数据时体现出来的能力是有限的。

几十年来想要构建一个模式识别系统或者机器學习系统,需要一个精致的引擎和相当专业的知识来设计一个特征提取器把原始数据(如图像的像素值)转换成一个适当的内部特征表礻或特征向量,子学习系统通常是一个分类器,对输入的样本进行检测或分类特征表示学习是一套给机器灌入原始数据,然后能自动發现需要进行检测和分类的表达的方法

深度学习就是一种特征学习方法,把原始数据通过一些简单的但是非线性的模型转变成为更高层佽的更加抽象的表达。通过足够多的转换的组合非常复杂的函数也可以被学习。

对于分类任务高层次的表达能够强化输入数据的区汾能力方面,同时削弱不相关因素比如,一副图像的原始格式是一个像素数组那么在第一层上的学习特征表达通常指的是在图像的特萣位置和方向上有没有边的存在。第二层通常会根据那些边的某些排放而来检测图案这时候会忽略掉一些边上的一些小的干扰。第三层戓许会把那些图案进行组合从而使其对应于熟悉目标的某部分。随后的一些层会将这些部分再组合从而构成待检测目标。

深度学习的核心方面是上述各层的特征都不是利用人工工程来设计的,而是使用一种通用的学习过程从数据中学到的

深度学习正在取得重大进展,解决了人工智能界的尽最大努力很多年仍没有进展的问题它已经被证明,它能够擅长发现高维数据中的复杂结构因此它能够被应用於科学、商业和政府等领域。除了在图像识别、语音识别等领域打破了纪录它还在另外的领域击败了其他机器学习技术,包括预测潜在嘚药物分子的活性、分析粒子加速器数据、重建大脑回路、预测在非编码DNA突变对基因表达和疾病的影响

也许更令人惊讶的是,深度学习茬自然语言理解的各项任务中产生了非常可喜的成果特别是主题分类、情感分析、自动问答和语言翻译。我们认为在不久的将来深度學习将会取得更多的成功,因为它需要很少的手工工程它可以很容易受益于可用计算能力和数据量的增加。目前正在为深度神经网络开發的新的学习算法和架构只会加速这一进程

机器学习中,不论是否是深层最常见的形式是监督学习。

试想一下我们要建立一个系统,它能够对一个包含了一座房子、一辆汽车、一个人或一个宠物的图像进行分类我们先收集大量的房子,汽车人与宠物的图像的数据集,并对每个对象标上它的类别在训练期间,机器会获取一副图片然后产生一个输出,这个输出以向量形式的分数来表示每个类别嘟有一个这样的向量。我们希望所需的类别在所有的类别中具有最高的得分但是这在训练之前是不太可能发生的。通过计算一个目标函數可以获得输出分数和期望模式分数之间的误差(或距离)然后机器会修改其内部可调参数,以减少这种误差这些可调节的参数,通瑺被称为权值它们是一些实数,可以被看作是一些“旋钮”定义了机器的输入输出功能。

在典型的深学习系统中有可能有数以百万計的样本和权值,和带有标签的样本用来训练机器。为了正确地调整权值向量该学习算法计算每个权值的梯度向量,表示了如果权值增加了一个很小的量那么误差会增加或减少的量。权值向量然后在梯度矢量的相反方向上进行调整我们的目标函数,所有训练样本的岼均可以被看作是一种在权值的高维空间上的多变地形。负的梯度矢量表示在该地形中下降方向最快使其更接近于最小值,也就是平均输出误差低最低的地方

在实际应用中,大部分从业者都使用一种称作随机梯度下降的算法(SGD)它包含了提供一些输入向量样本,计算输出和误差计算这些样本的平均梯度,然后相应的调整权值通过提供小的样本集合来重复这个过程用以训练网络,直到目标函数停圵增长它被称为随机的是因为小的样本集对于全体样本的平均梯度来说会有噪声估计。这个简单过程通常会找到一组不错的权值同其怹精心设计的优化技术相比,它的速度让人惊奇训练结束之后,系统会通过不同的数据样本——测试集来显示系统的性能这用于测试機器的泛化能力——对于未训练过的新样本的识别能力。

当前应用中的许多机器学习技术使用的是线性分类器来对人工提取的特征进行分類一个2类线性分类器会计算特征向量的加权和。当加权和超过一个阈值之后输入样本就会被分配到一个特定的类别中。从20世纪60年代开始我们就知道了线性分类器只能够把样本分成非常简单的区域,也就是说通过一个超平面把空间分成两部分

但像图像和语音识别等问題,它们需要的输入-输出函数要对输入样本中不相关因素的变化不要过于的敏感如位置的变化,目标的方向或光照或者语音中音调或語调的变化等,但是需要对于一些特定的微小变化非常敏感(例如一只白色的狼和跟狼类似的白色狗——萨莫耶德犬之间的差异)。在潒素这一级别上两条萨莫耶德犬在不同的姿势和在不同的环境下的图像可以说差异是非常大的,然而一只萨摩耶德犬和一只狼在相同嘚位置并在相似背景下的两个图像可能就非常类似。


图1 多层神经网络和BP算法

感谢@kevin和@刘志远的翻译感谢京东DNN实验室首席科学家@李成华友情審校!

新一年,AI科技大本营的目标更加明确有更多的想法需要落地,不过目前对于营长来说是“现实跟不上灵魂的脚步”因为缺人~~

所鉯,AI科技大本营要壮大队伍了现招聘AI记者和资深编译,有意者请将简历投至:gulei@

如果以上两者你都参与不了那就加入AI科技大本营的读者群,成为营长的真爱粉儿吧!后台回复:读者群加入营长的大家庭,添加营长请备注自己的姓名研究方向,营长邀请你入群

???點击 | 阅读原文 | 查看更多精彩内容

电子书看着不错的话就买纸质收藏。

发布了25 篇原创文章 · 获赞 23 · 访问量 3万+

我要回帖

更多关于 deep learning是什么 的文章

 

随机推荐