同程旅游网怎么样样才能看懂行程类复杂统计图

当前位置: >
R语言学习路线和常用数据挖掘包
23:35 来源:
对于初学R语言的人,最常见的方式是:遇到不会的地方,就跑到论坛上吼一嗓子,然后欣然or悲伤的离去,一直到遇到下一个问题再回来。当然,这不是最好的学习方式,最好的方式是&&看书。目前,市面上介绍R语言的书籍很多,中文英文都有。那么,众多书籍中,一个生手应该从哪一本着手呢?入门之后如何才能把自己练就成某个方面的高手呢?相信这是很多人心中的疑问。有这种疑问的人有福了,因为笔者将根据自己的经历总结一下R语言书籍的学习路线图以使Ruser少走些弯路。
本文分为6个部分,分别介绍初级入门,高级入门,绘图与可视化,计量经济学,时间序列分析,金融等。
1.初级入门
《R语言实战》,这是高涛、肖楠等翻译的一本书详细全面介绍了入门、图形、统计、回归、方差、功效分析、广义线性模型、主成分、因子分析、缺失值处理等。除此之外,还可以去读刘思吹摹153分钟学会R》。这本书收集了R初学者提问频率最高的153个问题。为什么叫153分钟呢?因为最初作者写了153个问题,阅读一个问题花费1分钟时间,全局下来也就是153分钟了
2.高级入门
读了上述书籍之后,你就可以去高级入门阶段了。这时候要读的书有两本很经典的。《Statistics with R》和《The R book》。之所以说这两本书高级,是因为这两本书已经不再限于R基础了,而是结合了数据分析的各种常见方法来写就的,比较系统的介绍了R在线性回归、方差分析、多元统计、R绘图、时间序列分析、数据挖掘等各方面的内容,看完之后你会发现,哇,原来R能做的事情这么多,而且做起来是那么简洁。读到这里已经差不多了,剩下的估计就是你要专门攻读的某个方面内容了。下面大致说一说。
3.绘图与可视化
亚里斯多德说,&较其他感觉而言,人类更喜欢观看&。因此,绘图和可视化得到很多人的关注和重视。那么,如何学习R画图和数据可视化呢?再简单些,如何画直方图?如何往直方图上添加密度曲线呢?我想读完下面这几本书你就大致会明白了。
首先,画图入门可以读《R Graphics》,个人认为这本是比较经典的,全面介绍了R中绘图系统。该书对应的有一个网站,google之就可以了。更深入的可以读《Lattice:Multivariate Data Visualization with R》。上面这些都是比较普通的。当然,有比较文艺和优雅的&&ggplot2系统,看《ggplot2:Elegant Graphics for Data Analysis》。还有数据挖掘方面的书:《Data Mining with Rattle and R》,主要是用Rattle软件,个人比较喜欢Rattle!当然,Rattle不是最好的,Rweka也很棒!再有就是交互图形的书了,著名的交互系统是ggobi,这个我已经喜欢两年多了,关于ggobi的书有《Interactive and Dynamic Graphics for Data Analysis With R and GGobi》,不过,也只是适宜入门,更多更全面的还是去ggobi的主页吧,上面有各种资料以及包的更新信息!
4.计量经济学
关于计量经济学,首先推荐一本很薄的小册子:《Econometrics In R》,做入门用。然后,是《Applied Econometrics with R》,该书对应的R包是AER,可以安装之后配合使用,效果甚佳。计量经济学中很大一部分是关于时间序列分析的,这一块内容在下面的地方说。
5.时间序列分析
时间序列书籍的书籍分两类,一种是比较普适的书籍,典型的代表是:《Time Series Analysis and Its Applications :with R examples》。该书介绍了各种时间序列分析的经典方法及实现各种经典方法的R代码,该书有中文版。如果不想买的话,建议去作者主页直接下载,英文版其实读起来很简单。时间序列分析中有一大块儿是关于金融时间序列分析的。这方面比较流行的书有两本《Analysis of financial time series》,这本书的最初是用的S-plus代码,不过新版已经以R代码为主了。这本书适合有时间序列分析基础和金融基础的人来看,因为书中关于时间序列分析的理论以及各种金融知识讲解的不是特别清楚,将极值理论计算VaR的部分就比较难看懂。另外一个比较有意思的是Rmetrics推出的《TimeSeriesFAQ》,这本书是金融时间序列入门的东西,讲的很基础,但是很难懂。对应的中文版有《金融时间序列分析常见问题集》,当然,目前还没有发出来。经济领域的时间序列有一种特殊的情况叫协整,很多人很关注这方面的理论,关心这个的可以看《Analysis of Integrated and Cointegrated Time Series with R》。最后,比较高级的一本书是关于小波分析的,看《Wavelet Methods in Statistics with R》。附加一点,关于时间序列聚类的书籍目前比较少见,是一个处女地,有志之士可以开垦之!
金融的领域很广泛,如果是大金融的话,保险也要被纳入此间。用R做金融更多地需要掌握的是金融知识,只会数据分析技术意义寥寥。我觉得这些书对于懂金融、不同数据分析技术的人比较有用,只懂数据分析技术而不动金融知识的人看起来肯定如雾里看花,甚至有人会觉得金融分析比较低级。这方面比较经典的书籍有:《Advanced Topics in Analysis of Economic and Financial Data Using R》以及《Modelling Financial Time Series With S-plus》。金融产品定价之类的常常要用到随机微分方程,有一本叫《Simulation Inference Stochastic Differential Equations:with R examples》的书是关于这方面的内容的,有实例,内容还算详实!此外,是风险度量与管理类。比较经典的有《Simulation Techniques in Financial Risk Management》、《Modern Actuarial Risk Theory Using R》和《Quantitative Risk Management:Concepts, Techniques and Tools》。投资组合分析类和期权定价类可以分别看《Portfolio Optimization with R》和《Option Pricing and Estimation of Financial Models with R》。
7.数据挖掘
现在相关的书籍已经比较多了,可见&R语言经典书籍推荐&一文中推荐的几本书。
很多书都已经有电子版。可以在一些群或 新浪爱问 csdn等里面去找。
与数据挖掘有关或者有帮助的R包和函数的集合。
常用的包: fpc,cluster,pvclust,mclust
基于划分的方法: kmeans, pam, pamk, clara
基于层次的方法: hclust, pvclust, agnes, diana
基于模型的方法: mclust
基于密度的方法: dbscan
基于画图的方法: plotcluster, plot.hclust
基于验证的方法: cluster.stats
常用的包:
rpart,party,randomForest,rpartOrdinal,tree,marginTree,
maptree,survival
决策树: rpart, ctree
随机森林: cforest, randomForest
回归, Logistic回归, Poisson回归: glm, predict, residuals
生存分析: survfit, survdiff, coxph
3、关联规则与频繁项集
常用的包:
arules:支持挖掘频繁项集,最大频繁项集,频繁闭项目集和关联规则
DRM:回归和分类数据的重复关联模型
APRIORI算法,广度RST算法:apriori, drm
ECLAT算法: 采用等价类,RST深度搜索和集合的交集: eclat
4、序列模式
常用的包: arulesSequences
SPADE算法: cSPADE
5、时间序列
常用的包: timsac
时间序列构建函数: ts
成分分解: decomp, decompose, stl, tsr
常用的包: Base R, nlme
方差分析: aov, anova
密度分析: density
假设检验: t.test, prop.test, anova, aov
线性混合模型:lme
主成分分析和因子分析:princomp
条形图: barplot
散点图: dotchart
直方图: hist
密度图: densityplot
蜡烛图, 箱形图 boxplot
QQ (quantile-quantile) 图: qqnorm, qqplot, qqline
Bi-variate plot: coplot
Parallel coordinates: parallel, paracoor, parcoord
热图, contour: contour, filled.contour
其他图: stripplot, sunflowerplot, interaction.plot, matplot, fourfoldplot,
assocplot, mosaicplot
保存的图表格式: pdf, postscript, win.metafile, jpeg, bmp, png
8、数据操作
缺失值:na.omit
变量标准化:scale
变量转置:t
抽样:sample
堆栈:stack, unstack
其他:aggregate, merge, reshape
9、与数据挖掘软件Weka做接口
RWeka: 通过这个接口,可以在R中使用Weka的所有算法。
(责任编辑:itongji)
本文链接:
关键字:||
版权声明:本站内容部分来自互联网,转载请注明原文链接和作者,如有侵权或出处有误请和我们联系。您所在位置: &
&nbsp&&nbsp&nbsp&&nbsp
市纪委群众路线教育践活动调研工作未解决问题统计表 (标.doc69页
本文档一共被下载:
次 ,您可免费全文在线阅读后下载本文档
文档加载中...广告还剩秒
需要金币:250 &&
你可能关注的文档:
··········
··········
市纪委群众路线教育实践活动调研工作未解决问题统计表
为已解决问题)
类别 内容 序号 具体问题 反映人
或单位 解决
时限 解决措施 解决单位及负责
人姓名、电话
发展 农业1条 1  养殖技术落后   泾阳南程村  13年底 联系镇上安排技术人员指导 村主任:秦民权 
市委办群众路线教育实践活动调研工作已解决问题统计表
类别 内容 序号 具体问题 反映人
或单位 解决
时间 解决措施 解决单位及负责
人姓名、电话
2条 1  残疾人多,无收入来源 上高村 2013.6 开办上高村福利纸箱厂 上高村书记董乾坤
2  御杏产业的深度开发 山底村 2013.6 建成了御杏观光园 市委办、礼泉县果业局
第三产业 1条 1  发展壮大乡村旅游
2013.6 补助资金16.8万元,启动了56户农家乐 市委办、礼泉县旅游局
1条 1  没有村级发展规划
2013.6 投资20多万元完成村庄规划 市委办、市旅游局
3条 1  生产路面,雨天难行 上高村 2013.2 路面硬化2公里 上高村书记董乾坤
2  洗澡困难
2013.2 解决28套太阳能热水器
3  村内街道绿化问题 山底村 2013.6 从财政、住建、交通协调解决村内街道3公里 市委办、市交通局、
市住建局等部门
3条 1  村容村貌脏、乱、差问题
2013.6 筹资10万元改变乡村环境 烟霞镇山底村
2 村级办公场地和文化广场
2013.6 筹资60余万元,建成村级办公和文化广场 市委办、市民政局
3 村内排水不畅问题
2013.6 筹资15万元,修缮渠道衬贴3公里 市委办、市扶贫办
2条 1 特困户子女上学难 上高村 2012.9 通过
正在加载中,请稍后...《折线统计图》_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
评价文档:
《折线统计图》
阅读已结束,如果下载本文需要使用
想免费下载本文?
把文档贴到Blog、BBS或个人站等:
普通尺寸(450*500pix)
较大尺寸(630*500pix)
你可能喜欢下面是李红骑自行车和张军骑摩托车沿相同路线由甲地到乙地行驶情况统计图.观察统计图,回答问题:(1)甲、乙两地的路程是多少?(2)李红比张军早出发几小时?(3)图中两条折线的交点表示什么?张军出发几小时后同李红相遇?【考点】;.【专题】统计数据的计算与应用.【分析】(1)由图知甲、乙两地的路程是60千米;(2)李红比张军早出发2小时;(3)图中两条折线的交点表示张军骑摩托车追上李红,张军出发1小时后同李红相遇.【解答】解:(1)由图知甲、乙两地的路程是60千米;(2)李红比张军早出发2小时;(3)图中两条折线的交点表示张军骑摩托车追上李红,3-2=1(小时)张军出发1小时后同李红相遇.【点评】本题主要考查学生的观察图形的能力和计算能力,题目有一定的代表性,难度适中.声明:本试题解析著作权属菁优网所有,未经书面同意,不得复制发布。答题:wdzyzlhx老师 难度:0.80真题:1组卷:1
解析质量好中差ziyuankujiejiedeyisi,www.xx9.cc

我要回帖

更多关于 黑马程序员怎么样 的文章

 

随机推荐