尚硅谷大数据项目之离线数仓项目2.0网盘下载
所属分类:大数据与机器学习
课程介绍:
新版数仓项目2.0:
一、包含的技术框架:
采集:Flume/Kafka/Sqoop
存储:MySQL/Hadoop/HBase/
计算:Hive/Tez
查询:Presto/Druid/Kylin
可视化:Echarts/Superset
任务调度:Azkaban
集群监控:Zabbix
元数据管理:Atlas
脚本:Shell
Linux:CentOS6.8
二、Shell脚本40多个
三、用户行为原始表:11张
四、业务表原始表:27张
五、数仓总表:近100张
六、包含的业务指标:近100个
七、标准的数仓建模理论:1)确定业务过程2)声明粒度3)确定维度4)确定事实
八、主流可视化技术:Echarts和Superset
九、专业的集群监控组件:Zabbix
十、当前最流行的元数据管理:Atlas
请先
!