怎样如何写好一篇学术论文文 胡键博客

学术研究的职责实际上也是学者嘚职责学术研究在于探求真理,在于挖掘具体问题的发展规律简而言之,学术研究的职责就是思想创新、理论创新当今,思想创新、理论创新已经相当不易这是因为,学科体系和学科门类前人都已经建立起来既有的思想、理论都作为一种体系而存在,要颠覆一个具体的理论观点容易但要颠覆一个学科体系是非常艰难的。因此创新特别是进行一个体系化的创新几乎是不可能的。当今的思想创新、理论创新只能是在既有的体系中进行枝枝叶叶的修建而已。当今世界各国都提出构建本国的创新体系,作为国家发展战略提出这樣的口号固然需要,但很可能这也只是政治口号而已因为,从实际情况来看国家创新体系必须要建立在理论创新体系之上。既然当今卋界几乎不可能构建理论创新体系那么,国家创新体系也只能是在国家原有的技术基础上进行填补而获得发展罢了但是,不能建立国镓创新体系并不意味着国家不可以拥有创新战略尽管战略具有全局性,创新战略可以不依赖理论创新体系而可以依赖于某一理论创新觀点、某一创新技术而成就一个国家的创新战略。所以当前,无论是德国的工业4.0还是美国的新型制造业等的国家创新战略都是基于某┅具体的理论创新、技术创新而制定的国家创新战略,而不是国家创新体系简而言之,当今的学术研究职责在于从某个具体的领域来进荇观点创新并以此来支撑技术的创新

创新不易,但说真话可能更难而学者的天职应该是说真话,为社会的公共利益说真话然而,现實中有诸多的因素使学者不愿意说真话了

一是现行科研管理体制下,学者“制造”论文的压力远远大于学术创新的压力而为了“制造”论文,就不得不迎合现实的需要言不由衷地对现实政治话语进行解释。就论文本身而言既不是论文,也没有任何创新完全是用政治话语的宣传取代了学术的科学性和真理性。这样的文章基本上是正确的废话

二是争取对领导人讲话的解释权,目的是争取成为决策部門的智库这样可以获得更多的学术资源,甚至可以获得一定的权力资源智库,奈思想之库而不是解释领导讲话。现在全国各高校、各研究机构都在努力争取做高端智库目的就是要获得政府的资源和资金支持。然而全国如此众多的智库,如果都能够提出独立的见解那么领导人究竟如何进行决策,听谁的意见来决策在众说纷纭之下,领导的决策能力会受到严重干扰根本就无法进行科学决策。智庫不宜太多而在于在几个重要的智库意见之中进行比较和权衡,这样就能顺利地进行决策太多的意见就等于没有意见,太多的智库僦基本山在迎合领导的意见,结果导致领导还是在智库对自己的赞扬声中按照自己的意见决策这样有智库与没有智库根本就没有区别。洅说高校的职责是教书育人,而不是资政高校做智库,似乎把高校的功能完全异化了特别是为了获得领导的批示,各高校的智库想盡办法向领导的秘书进行攻关这哪是智库,这不是另一种腐败吗公共资源的交易,毫无疑问是腐败

三是学者的学术研究大多数充满叻功利之心,或为职称或为荣誉,归根到底是为了利益在利益的驱使之下,真话、真理都会被束之高阁大多数学者都说是为稻粱谋,但当今的学者在物质利益方面应该说还是不错的总体上处于社会的中层。所谓为稻粱谋实际上是一种物质上的不满足感,千方百计偠在物质利益的享受上要跻身于上层社会所以,大多数学者称为了“精致的自利主义者”在当今中国,学者见面不再是思想的交流和學术的争鸣而是相互打听对方的收入和居住环境,实际上就是在攀比当今中国充满了各种各样的攀比之心。知识分子和学者都是这样作为社会的良知的一批学人都如此,社会还有什么道德、真话、真理可言呢卢梭就曾经指出:“当一个人只为维持生计而运思的时候,他的思想就难以高尚为了能够和敢于说出伟大的真理,就决不能屈从于对成功的追求我把我写的书送到公众面前,确信是为公众的利益说了话而其他的一切都在所不计。如果我的作品被公众抛弃了那是因为人们不愿从中吸取教益,那就算他们活该”可问题是,Φ国大部分学者一旦成功了就不在进一步考虑学术本身的问题了,而主要是考虑拓展人脉制造名声的泡沫和获取更多的物质利益。

笔鍺想就上述三种情况谈点个人看法其一,关于科研考核我认为,科研考核体制对于真正的学者是有百害无一益不管考核不考核,对於把学术作为自己生活的一部分的人考核只能是增加其思想负担,甚至为了考核而不得不迎合一些所谓的大项目而项目就会制约了思想的创新。学术创造应该是学者的自觉行为而且必须是在充分积累的基础上的思想井喷,没有积累任何考核都是通过外在的压力来逼迫学者生产。这无异于逼着公鸡下蛋另一方面,考核对于混迹于学者圈的不学无术的人来说他们就会在这种考核之下大肆制造学术垃圾,并借助于这些学术垃圾获取物质利益因为,考核只在于数量而在学术圈中滥竽充数的人非常善于编造论文的数量,而这正好迎合叻科研考核的需要结果,这样的人反而通过考核却获得了体制内的最大物质收益相反,那些做冷板凳的思想者由于不主动迎合论文數而无法获得必要的研究资源。因此我们不能再用行政的权力强制学者制造学术垃圾,从而制造学术论文的虚假繁荣要知道,学术创噺绝对不是考核出来的而是积累与思考出来的。

其二关于智库,我认为智库绝对不是为决策者提供具体问题的应对之策首先,智库應该提供智慧众所周知,社会科学不是工具而是智慧。试图从社会科学中找到解决具体问题的工具那就是把社会科学完全工具化了。社会科学最大的特点就是通过对历史与现实的研究总结出一些经验教训,但它不能确定某种做法的对与错、是与非因为任何一种措施都是有具体的时空条件的,离开具体的时空条件都难以判断其是非对错。也就是说社会科学的研究成果主要功能在于总结经验教训,揭示事物发展的规律而决策者就是通过学习其中的经验教训和把握事物发展的规律而获得解决具体问题的智慧。其次智库应该提供思想。社会科学虽然不能提供具体的工具但可以提供具体的理论和思想。一些决策者之所以找不到解决社会问题的具体工具是因为他缺乏理论素养,不愿意研读社会科学的理论著作解决问题的工具是一时之用的,但思想和理论一经掌握就能够为解决问题提供源源不断嘚思想源泉我们的社会实际上并不缺少工具,或者说并不缺少策略家但缺乏思想和理论,缺乏战略理论家再次,智库应该提供观察問题的专家视角许多从事实际工作的人往往能够找到解决具体问题的路径和工具,但这仅仅是经验性的无法在不同的工作中照搬。但昰学者之所以能够成为智库是因为学者的专业性和思考问题的深度与广度,从而能够提供观察问题和解决问题的全新视角因此,社会科学研究者作为智库不能贬低为工具性的对策家,而应该使作为智库的社会科学研究者成为战略理论家对策家只能解决某一具体问题,而战略理论家一旦形成某一战略理论这种理论将会为社会发展提供战略性的智慧。遗憾的是几乎所有的学者宁愿降低身价做策略家,而不愿意做理论家、战略家这就是当今社会的悲剧所在。

从决策者来看把大多数学者都纳入到智库之中,美其名曰是让学者服务政府但很有可能成为一些领导懒政惰政的根由。古人说不在其位不谋其政。知识分子可以参政议政可以在教书育人的同时资政谏政。泹不能完全去迎合决策者来进行资政实际上,智库不只是资政还要谏政。近几年是资政不能完全涵盖智库的功能。谏政同样是智库嘚重要功能中国封建王朝的历朝历代都设有谏官,也就是对宫廷的重大决策提出批评意见避免重大失误。开明的统治者往往能够容忍諫官的直言上谏而不是堵塞言路。李世明之所以能够开创贞观之治不就是因为有魏征吗?在加上善谋的房玄龄和善断的杜如晦因此,李世明获得一代贤君之称魏征、房玄龄、杜如晦实际上都是李世明最得力的智库。如果再李世明身边有太多庸碌之辈的智库李世明僦会难以决策,最后就成为庸碌的皇帝最终导致懒政惰政。也就是说智库不在于多而在于精。

其三关于学者的功利问题,我认为學者也有七情六欲,也食人间烟火所以,功利之心是不可无的即便仅为琴棋书画诗酒花,但也要钱来购买有功利之心是正常的。但昰古人有君子爱财取之有道之说。就是说有道之才方可取。然而今天的相当多的学者都是在通过学术来谋取物质利益,而不是在物質利益相对充足的情况下努力进行学术创新人的欲望时无穷的,物欲如果不加以控制物欲就会掩盖一切思想。当思想被物欲掩盖之后本来为思想而采取的任何行为,结果都迅速转化成为物质利益的行为学术研究原本是一个非常纯洁的行为,但今天已经成为最被社会所诟病的行为我没有去调查,如果发问卷调查一下社会对学者的贬责可能仅仅低于腐败。据统计2014年全国科技经费投入持续增加,全社会研究与试验发展(R&D)支出预计达到13400亿元(这应该还不算社会科学的科研经费国家社科规划办和各省社科规划办的各种社会基金项目經费也是在大规模增加),比2013年增加1553.4亿元﹔R&D占GDP比重预计可达2.1%比2013年提高0.2个百分点。在这种庞大的科研经费支持下科研创新不仅没有得到提升,反而纵容了一些浮躁的科研人员开始想方设法将科研经费转化为自己的个人收入中国科研经费占GDP的比重虽然只有2%,远远低于美国但总量已经超过日本。这样庞大的科研经费着实让老百姓咋舌正是科研经费多,结果众多的科研经费成为反腐败的对象学者的尊严鈈知放在哪里。这固然有多种原因但学者沽名钓誉、追逐物欲无疑是一个重要的原因。因此科研腐败就成为当今最受关注的话题,也荿为摧毁知识分子尊严的糖衣炮弹

那么,今天我们怎样做学术研究又怎样做资政的智库?大多数人都认为学术研究与智库是不矛盾的但科研管理部门是难以将二者平衡处理的,在大多数情况下会偏向一方。在强调学术研究时就会强调论文发表的数量;在强调智库時,就会强调专报的撰写尤其是领导的批示然而,学者不应该被机构的定位所左右能够将学术研究与智库统一起来的是领导对学术研究的态度,以及领导对学术成果的态度这两个态度非常重要。领导对学术研究的态度决定了学术研究命运;领导对学术成果的态度,決定了学术成果的形式

有不少领导因强调学者的智库功能,常常贬低学术研究的理论成果现在常常听到一些领导说学者的研究没有用,因为领导看不懂社会听不懂。难道领导看得懂、社会听得懂才是有用的吗一名学者读书不是十年寒窗,而是数十年寒窗研究更是博大而精深,是纯专业人士这样的作品肯定是领导看不懂,社会听不懂的如果领导都看得懂,社会都听得懂那么学者几十年的寒窗苦读和日常的免死苦想就成为徒劳。学术著作当然只有专业人士才能懂得否则,所有的领导和社会上的所有人士就都可以是学者了因此,一名好的领导不是去责备学术著作如何精深难懂而是要善于学习、努力学习,要与社会科学的学术发展保持相对一致的步伐这样財能读懂社会科学的理论著作,并从中寻找到一些治国理政的经验教训而不是试图用行政权力、项目经费把学术研究改造成为自己出谋劃策的一般谋士。这显然是对学者的极大浪费另一方面,由于强调智库的定位于是各高校和研究机构都大肆的撰写专报,为了获得批礻又不断对研究人员进行撰写专报的培训问题是,一份专报两千多字能够讲清楚什么呢?什么都没有讲清楚为什么领导喜欢这样的專报呢?一个重要的借口是:领导忙忙得没有时间读理论著作。曾经坊间流行一句话:要充分怀疑领导的阅读能力要充分相信领导的悝解能力。前者的意思就是领导没有时间阅读,所以要尽可能间断一些不过领导的理解能力非常强,一个字都可以理解出深刻的含义读书的时候,老师都强调一句话要大量阅读才能提高理解能力。难道领导真的与众不同在没有充分阅读的情况下就能理解?我不敢楿信难怪有诸多的重大决策出现严重的失误,我相信这与领导阅读的著作少不是没有关系的科学的决策的必须建立在对信息的充分把握之上,信息不对称的任何决策都会导致严重的后果

俗话说,根深才能叶茂理论研究与智库实际上就是根与叶的关系。没有根哪里還有叶?只有加强理论研究才能做得好智库有一位老师曾经说,要想做好顾问首先要做好学问。现在大多数年轻人不愿意去做理论研究不愿意做学术研究,每天就是琢磨如何对应急事件写几篇专报结果,几年下来连论文都不会写了不只是年轻人,有相当一批资深學者更是深陷其中并以此为乐。因为一旦专报获得批示,一夜之间就会获得诸多的学术荣誉和学术资源诚然,社会科学研究者在从倳学术研究的同时要进行资政但不应该放弃学术研究而专门去撰写资政报告。社会科学研究者应该要发表学术论文、出版学术专著其資政的方式应该是让领导去阅读自己的著作和论文,让领导自己去理解和体会其中的思想并从中获得治国理政的心得;而不是把论文和著作简化为专报,让人读后什么也体会不到其研究的理论功底和学术的厚重感

加载中,请稍候......

  • 一、大数据相关的工作介绍
  • 二、夶数据工程师的技能要求
  • 四、持续学习资源推荐(书籍博客,网站)
  • 五、项目案例分析(批处理+实时处理)

本人目前是一名大数据工程師项目数据50T,日均数据增长20G左右个人是从Java后端开发,经过3个月的业余自学成功转型大数据工程师

大数据本质也是数据,但是又有了噺的特征包括数据来源广数据格式多样化(结构化数据、非结构化数据、Excel文件、文本文件等)、数据量大(最少也是TB级别的、甚至可能是PB级别)、数据增长速度快等。

针对以上主要的4个特征我们需要考虑以下问题:

  1. 数据来源广该如何采集汇总?对应出现了Sqoop,CammelDatax等工具。

  2. 数据采集之后该如何存储?对应出现了GFS,HDFSTFS等分布式文件存储系统。

  3. 由于数据增长速度快数据存储就必须可以水平扩展。

  4. 数据存储之后该如何通过运算快速转化成一致的格式,该如何快速运算出自己想要的结果

    对应的MapReduce这样的分布式运算框架解决了这个问题;泹是写MapReduce需要Java代码量很大,所以出现了HivePig等将SQL转化成MapReduce的解析引擎;

    普通的MapReduce处理数据只能一批一批地处理,时间延迟太长为了实现每输入一條数据就能得到结果,于是出现了Storm/JStorm这样的低时延的流式计算框架;

    但是如果同时需要批处理流处理按照如上就得搭两个集群,Hadoop集群(包括HDFS+MapReduce+Yarn)和Storm集群不易于管理,所以出现了Spark这样的一站式的计算框架既可以进行批处理,又可以进行流处理(实质上是微批处理)

  5. 而后Lambda架构,Kappa架构的出现又提供了一种业务处理的通用架构。

  6. 为了提高工作效率加快运速度,出现了一些辅助工具:

  7. HueZepplin:图形化任务执行管悝,结果查看工具
  8. Scala语言:编写Spark程序的最佳语言,当然也可以选择用Python
  9. Python语言:编写一些脚本时会用到。
  10. AllluxioKylin等:通过对存储的数据进行预处悝,加快运算速度的工具

以上大致就把整个大数据生态里面用到的工具所解决的问题列举了一遍,知道了他们为什么而出现或者说出现昰为了解决什么问题进行学习的时候就有的放矢了。

一、大数据相关工作介绍

大数据方向的工作目前主要分为三个主要方向:

二、大数据笁程师的技能要求

附上大数据工程师技能图:

  1. Java高级(虚拟机、并发)
  2. Hive(Hql基本操作和原理理解)

假设每天可以抽出3个小时的有效学习时间加上周末每天保证10个小时的有效学习时间;

1)Linux学习(跟鸟哥学就ok了)—–20小时

  1. Linux操作系统介绍与安装。
  2. Linux常用软件安装

2)Java 高级学习(《深入理解Java虚擬机》、《Java高并发实战》)—30小时

3)Zookeeper学习(可以参照这篇博客进行学习:)

  1. Zookeeper分布式协调服务介绍。
  2. Zookeeper的原理以及选举机制
    • HDFS的概念和特性。
  1. MapTask並发数的决定机制
  2. MapReduce中的序列化框架及应用。
  3. MapReduce中的自定义分区实现
  4. MapReduce利用数据压缩进行优化。

5)Hive(《Hive开发指南》)–20小时

  1. Hive 与传统数据库对仳
  2. Hive 的数据存储机制。
  3. 在Hive 中如何实现高效的JOIN查询
  4. Hive 的内置函数应用。
  5. Hive 常用参数配置
  6. Hive 执行过程分析及优化策略

中文入门文档: 

  1. Scala编译器安装。
  2. 数组、映射、元组、集合
  3. 类、对象、继承、特质。
  4. 理解Scala高阶函数
  5. 理解Scala隐式转换。
  1. 执行第一个Spark案例程序(求PI)

这个部分一般工作中洳果不是数据挖掘,机器学习一般用不到可以等到需要用到的时候再深入学习。

中文文档(但是版本有点老): 

10)自己用虚拟机搭建一個集群把所有工具都装上,自己开发一个小demo —30小时

可以自己用VMware搭建4台虚拟机然后安装以上软件,搭建一个小集群(本人亲测I7,64位16G內存,完全可以运行起来以下附上我学习时用虚拟机搭建集群的操作文档)



第三阶段(辅助工具工学习阶段)

  1. Sqoop原理及配置说明
  2. Sqoop数据导入實战
  3. Sqoop数据导出实战、
  4. Sqoop批量作业操作

推荐学习博客: 

  1. FLUME日志采集框架介绍。
  2. FLUME参数配置说明
  3. FLUME采集nginx日志案例(案例一定要实践一下)

推荐学习博愙: 

  1. 任务调度系统概念介绍。
  2. 常用任务调度工具比较
  3. Oozie的配置说明。

推荐学习博客: 

推荐学习博客: 

第四阶段(不断学习阶段)

每天都会囿新的东西出现需要关注最新技术动态,不断学习任何一般技术都是先学习理论,然后在实践中不断完善理论的过程

1)如果你觉得洎己看书效率太慢,你可以网上搜集一些课程跟着课程走也OK 。如果看书效率不高就很网课相反的话就自己看书。

2)企业目前更倾向于使用Spark进行微批处理Storm只有在对时效性要求极高的情况下,才会使用所以可以做了解。重点学习Spark Streaming

3)快速学习的能力解决问题的能力溝通能力**真的很重要。

4)要善于使用StackOverFlow和Google(遇到解决不了的问题先Google,如果Google找不到解决方能就去StackOverFlow提问一般印度三哥都会在2小时内回答你的問题)。

可以去万能的淘宝购买一些视频课程你输入“大数据视频课程”,会出现很多多购买几份(100块以内可以搞定),然后选择一個适合自己的个人认为小象学院的董西成和陈超的课程含金量会比较高。\

  1. 至于书籍当当一搜会有很多其实内容都差不多。

我要回帖

更多关于 如何写好一篇学术论文 的文章

 

随机推荐