大数据成长之路

Hadoop

如果通过hdfs shell上传的文件那么他的副本因子是根据 hdfs-site.xml中的配置,
如果是通过Java API方式那么他会使用副本因子为3的配置

日志数据内容

数据处理流程

Name		Name	Last commit message	Last commit date
Latest commit History 158 Commits
avro		avro
flink-base		flink-base
flink-study		flink-study
flinkonyarn		flinkonyarn
guice-di		guice-di
hadoop-parquet		hadoop-parquet
hadoop-study		hadoop-study
hive		hive
kudu-demo		kudu-demo
project		project
quickstart-scala		quickstart-scala
research-flume		research-flume
research-hbase		research-hbase
research-zookeeper		research-zookeeper
rocksdb-learning		rocksdb-learning
sqltree		sqltree
stateful-function		stateful-function
streaming-kafka		streaming-kafka
study-spark		study-spark
.gitignore		.gitignore
README.md		README.md
pom.xml		pom.xml