机器学习中使用到底是一个什么原理

一个从没听过机器学习的人来求教_机器学习吧_百度贴吧
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&签到排名:今日本吧第个签到,本吧因你更精彩,明天继续来努力!
本吧签到人数:0成为超级会员,使用一键签到本月漏签0次!成为超级会员,赠送8张补签卡连续签到:天&&累计签到:天超级会员单次开通12个月以上,赠送连续签到卡3张
关注:7,166贴子:
一个从没听过机器学习的人来求教收藏
想我像我这种新手该看什么入门书呢
生物识别图像处理方面用的好像
求大神推荐几本入门书谢谢
百度众包平台机器学习提供专业训练数据服务,用采集,标注方式为您提供高质量训练数据!同时提供基于百度机器学习算法库的实用行业大数据解决方案!机器模型训练,就找百度众包
基础怎么样?基本的概率统计要知道才行
找一本书只看一本
一般的书都会讲的让你明白原理,不懂的网上查
关注微信公众号 roadtodatascientist,数据挖掘类工作面试辅导
登录百度帐号推荐应用
为兴趣而生,贴吧更懂你。或您所在位置: &
&nbsp&&nbsp&nbsp&&nbsp
第一章机器学习及数据挖掘基础原理总汇.pptx 59页
本文档一共被下载:
次 ,您可全文免费在线阅读后下载本文档。
下载提示
1.本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
2.该文档所得收入(下载+内容+预览三)归上传者、原创者。
3.登录后可充值,立即自动返金币,充值渠道很便利
需要金币:350 &&
你可能关注的文档:
··········
·····
大数据核心技术之数据挖掘与机器学习技术探索及应用第一章机器学习及数据挖掘基本原理王斌中国科学院信息工程研究所目录什么是机器学习(MachineLearning)学习能力是人类智能的一种体现机器学习是研究如何“利用经验来改善计算机系统自身的性能”的学科----FromT.M.MitchellTM.MachineLearning.NewYork:McGraw-Hill,1997.机器学习是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使不断改善自身的性能----来自《百度百科》机器学习vs.人类学习什么是数据挖掘(DataMining)数据挖掘常常也叫知识发现(Knowledge),有多种文字不同但含义接近的定义,例如“识别出巨量数据中有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程”。也可以顾名思义,数据挖掘就是试图从海量数据中找出有用的知识----FromU.Fayyad,G.Piatetsky-Shapiro,R.Smyth.Knowledgediscoveryanddatamining:Towardsaunifyingframework.In:Proc.KDD’96,Portland,OR,82-88.机器学习vs.数据挖掘本课程内容周志华,机器学习与数据挖掘。《中国计算机学会通讯》,):35-44.机器学习和其他学科什么是大数据(BigData)4V理论海量的数据规模(volume)快速的数据流转和动态的数据体系(velocity)多样的数据类型(variety)巨大的数据价值(value)大数据的魔力Google利用大数据预测了H1N1流感的爆发百度利用大数据成功预测2014年世界杯(从淘汰赛到决赛全部正确)核心原因:大数据+机器学习大数据vs.机器学习高性能计算机器学习数据“大”vs.机器学习MicheleBanko,andEricBrill.ScalingtoVeryVeryLargeCorporaforNaturalLanguageDisambiguation.InproceedingsofACL2001,page26-33.It’snotwhohasthebestalgorithmwins,it’swhohasthemostdata.(成功的机器学习应用不是拥有最好的算法,而是拥有最多的数据!)机器学习方法分类机械学习(Rotelearning):学习者无需任何推理或其它的知识转换,直接吸取环境所提供的信息。如塞缪尔的跳棋程序。示教学习(Learningfrominstruction):学生从环境(教师或其它信息源如教科书等)获取信息,把知识转换成内部可使用的表示形式,并将新的知识和原有知识有机地结合为一体。类比学习(Learningbyanalogy):利用二个不同领域(源域、目标域)中的知识相似性,可以通过类比,从源域的知识(包括相似的特征和其它性质)推导出目标域的相应知识,从而实现学习。例如,一个从未开过货车的司机,只要他有开小车的知识就可完成开货车的任务。归纳学习(Learningfrominduction):教师或环境提供某概念的一些实例或反例,让学生通过归纳推理得出该概念的一般描述。归纳学习方法分类监督学习(SupervisedLearning):监督学习是从标记的训练数据来推断一个功能的机器学习任务。如分类、回归。非监督学习(UnsupervisedLearning):无监督学习的问题是,在未标记的数据中,试图找到隐藏的结构。如聚类、密度估计。强化学习(ReinforcementLearning):强化学习是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。机器学习基本过程将数据对象进行特征(feature)化表示给定一个数据样本集,从中学习出规律(模型)目标:该规律不仅适用于训练数据,也适用于未知数据(称为泛化能力)对于一个新的数据样本,利用学到的模型进行预测例子:天气预报目标:预测明天北京会不会下雨数据:过去10年北京每一天的天气数据那天是否下雨:是/否那天的前一天傍晚18点的气温、相对湿度、风向、风速、气压等(特征)某条数据:&18,20,东,15,80,是&训练:学习得到规律(模型)预测:给定今天傍晚18点的气温、相对湿度、风向、风速、气压等、根据模型预测明天是否下雨机器学习的关键问题【表示】如何表示数据样本?通常用一个向量来表示一个样本,向量中选用哪些特征是关键【训练】如何找出规律【模型+策略+算法】*通常变成一个选择题,给你n个候选的模型让你选。【模型】确定选择的标准(什么样的模型才叫好模型)【策略】如何快速地从n个模型中选出最好的【算法】【测试】如何根据找到的规律进行预测*李航,《统计学习
正在加载中,请稍后...TECH2IPO/创见
「 等待新的科技故事 」
非码农也能看懂的&机器学习&原理
&机器学习&正成为各大IT砖家的口头禅,可他们到底是瞎忽悠还是真学术,若不是道儿上的人也很难辨明。于是,本文用一个买芒果的故事,轻松让你明白&机器学习&到底是怎么回事、有什么用。
我们先来说个老生常谈的情景:某天你去买芒果,小贩摊了满满一车芒果,你一个个选好,拿给小贩称重,然后论斤付钱。自然,你的目标是那些最甜最成熟的芒果,那怎么选呢?你想起来,啊外婆说过,明黄色的比淡黄色的甜。你就设了条标准:只选明黄色的芒果。于是按颜色挑好、付钱、回家。啊哈,人生完整了?呵呵呵。告诉你吧人生就是各种麻烦等你回到家,尝了下芒果。有些确实挺甜,有些就不行了。额~显然,外婆教的金科玉律还不够用,光看颜色不靠谱哪。闭关研究大半天以后,你得出结论:大个的明黄色芒果必然甜,小个的,就只有一半几率会是甜的了。于是下次,你满意地带着这个结论再去买芒果,却发现你经常光顾的那个小贩关门度假去了。好吧,换家店,结果人家的进货渠道还不一样,那芒果是另一个地方种的。你这套法则不管用了,又得从头再来。好吧,这家店里每种芒果你都尝了下,总结出来小个淡黄色的最甜。还没结束。你远房表妹又来找你玩了。要招待些好的吧?但她说了,她无所谓芒果甜不甜,汁水多就行。好呗,你还得再做一次实验,找到芒果越软汁水越多的规律。接着你又移民了。一尝这边的芒果,咦,新世界的大门打开了。绿色的芒果居然比黄色的好吃……最后,你结婚了,领导表示不爱吃芒果,要吃苹果。于是你所有关于芒果的知识都没用了。只能按老方法再重新研究遍苹果的物理特征跟它味道好不好之间的关系。苹果吃到吐?没办法,你爱老婆嘛。有请码农好了,现在想象下,这一路辛酸曲折的,你写了组程序帮忙减轻负担。那程序逻辑基本应该类似这样:预设变量 颜色、大小、店家、硬度如 颜色=明黄
店家=经常光顾的小贩则 芒果=甜如 硬度=软则 芒果=多汁用着很爽吧,你甚至可以把这套玩意儿发给你小弟,他挑来的芒果也包你满意。但每做一次新实验,你就得人肉改一次程序逻辑。而且你得首先保证自己已经理解了选芒果那套错综复杂的艺术,才能把它写进程序里。如果要求太复杂、芒果种类太多,那光把所有挑选规则翻译成程序逻辑就够你出一身大汗,相当于读个“芒果学”博士了。不是所有人都有“读博”的功夫的。有请“机器学习”算法机器学习算法其实就是普通算法的进化版。通过自动学习数据规律,让你的程序变得更聪明些。你从市场上随机买一批芒果(训练数据),把每只芒果的物理属性列一个表格出来,比如颜色、大小、形状、产地、店家,等等(特征),对应芒果的甜度、汁水多少、成熟度,等等(输出变量)。然后把这些数据扔给机器学习算法(分类/回归),它就会自己计算出一个芒果物理属性与其品质之间的相关性模型。等下一次你去采购时,输入店里在卖的芒果的物理属性(测试数据),机器学习算法就会根据上次计算出来的模型来预测这些芒果品质如何。机器用的算法可能跟你人肉写的逻辑规则类似(比如决策树),也有可能更先进,但反正基本上你不用多虑。好啦,现在你可以信心满满去买芒果了,颜色大小啥的都是浮云,交给机器去操心呗。更妙的是,你的算法还会逐渐进化(强化学习):根据其预测结果的正误,算法会自行修正模型,那么随着训练数据的积累,到后来它的预测就会越来越准确。最妙的来了,用同一个算法,你可以做好几个模型,苹果桔子香蕉葡萄各给爷来上一套,不要说老婆有令,就是七大姑八大婶各有所好,也再不用发愁了。用一句话总结机器学习就是:走自己的屌丝路,让你的算法牛逼去吧。
请后参与评论

我要回帖

 

随机推荐