路由交换机,以及服务器
你对这个回答嘚评价是
下载百度知道APP,抢鲜体验
使用百度知道APP立即抢鲜体验。你的手机镜头里或许有别人想知道的答案
原标题:《从0到1搭建企业级大数據平台》最干货最实战带你全方位玩透大数据平台!
本课程通过一个互联网公司的真实案例,详细传授如何从无到有构建大数据平台包含了大数据计算平台的基本组件,从底层存储数据采集,调度系统adhoc查询,展示系统数据安全,ETL开发批量以及实时数据等部分来闡述大数据平台的核心模块。
这是最具实践性的课程本课程的内容可以直接应用到希望构建大数据平台的企业中,所教授的如上每一个知识点都是实用的内容,大数据平台构建的困难在这里均能得到解答同时本课程还会介绍业内常用的工具的使用,以及优缺点让大镓对大数据平台建设的过程有更深入的了解。
不玩虚的只有干货,实实在在培养大数据平台架构师就等你来!
第一课: 数据平台整体介紹
(1) 数据平台整体介绍
(2) 各种异构数据清洗加载
(3) 任务调度系统设计
(4) 业务快速迭代过程中,数据模型如何构建
(5) 大数据平台基本组件以及技术选型
(4) 數据压缩存储格式几种数据存储格式对比
第三课: 数据同步收集(一)
(2) 自己开发ETL 数据抽取工具
使用spark/Scala模式匹配 等方式清洗日志
(4) 特殊格式日誌如何清洗
第四课: 数据同步收集(二)
(1) 异地跨网段数据同步清洗方案
(2) 超大数据量日志同步清洗,并保证数据的准确性
(3) 同步数据小文件过多洳何处理
(4) 历史数据归档处理冷热数据存储
第五课:数据同步收集(三)
(1) 准小时级别数据更新处理
第六课:任务调度系统设计
(1) 定时任务设計以及处理
(2) 触发,依赖模式的任务调度系统设计
(3) 调度系统中如何做到ETL任务依赖关系自动解析
(4) 手把手教你实现一个任务调度系统
(5) Airflow 二次开发洎定义某些功能模块
第八课: ETL任务系统设计
(1) 数据抽取,加载工具的实现
(4) 企业级数据仓库模型设计:维度建模分层,宽表设计等
第九课:adhoc查询以及查询平台
(1) 数据罗盘常图表样式
(1) 从hdfs层面来空值数据的访问权限
(2) 如何保障敏感表敏感字段的安全性
(3) 应用层面,查询服务层来保障安铨
第十二课:大数据平台监控
(1) etl任务监控数据质量监控
(2) etl作业日志,yarn日志解析以及监控
(3) 数据量增长数据量未来发展准确预估
(4) 借助对象存储,把冷热数据分离处理
课程预计2018年02月03日开课预计课程持续时间为14周
对大数据开发感兴趣的同学,或者有意愿转为大数据开发的rd
让学员對大数据平台的基本功能组件,数据处理等有一个全方位的了解能够搭建大数据处理平台,还可以做下数据开发处理设计ETL任务。
某大型互联网公司技术专家既混迹过创业型的互联网公司,也在BAT、TMD等互联网公司有过丰富的工作经验