Skip to main content

简介

在学习数据工程的过程中,我们常常需要使用到真实的环境。诸如Hadoop集群、Kafka集群等。对于数据开发人员而言,熟悉自己所学组件的部署过程过程也是十分重要的。
生产环境中我们使用到的集群通常是分布式部署,而在本地搭建分布式环境既繁琐又容易出错,当前项目中使用Docker来进行集群环境搭建

组件支持情况

组件支持备注
Hadoop当前组件:namenode, datanode, resourcemanager, nodemanager
Hive当前组件:metastore, hiveserver2
Hbase当前组件:master, regionserver
SparkStandalone: master, worker
FlinkStandalone: jobmanager, taskmanager
Kafka分布式
Zookeeper分布式
ClickHouse分布式
AirflowStandalone: webserver, scheduler
ElasticSearch分布式: elasticsearch
MongoDB分布式sharding:configsvr, routersvr, shardsvr
SupersetSuperset
Doris分布式: FE, BE
Kudu分布式: Master, TServer
tip

没有特殊说明登录账号和密码均为 admin/123456