Hadoop_Ecosystem

WordCount_Python - Fetching the word count from the file.

Hive_Vehicle_data - Hive QL with vehicle data.

Hive_transform - Hive QL and using python code to transform and load the data.

Hive_Sum_transform - Lineorder data - Sum and Transformation using python

Hadoop_Stream_Average - Calculate the average using Hadoop streaming and python file.

Hadoop_Stream_Std_Dev - Calculate the standard deviation using Hadoop streaming and python file.

Hadoop_Stream_Join - Hadoop Streaming to join the Employee and Customer dataset.

Hadoop_Stream_Join_Agg - Hadoop Streaming to join and aggregate data from the Lineorder and Customer dataset.

Hadoop_Stream_Cluster - Clustering using hadoop streaming.

HBase - Creating system for Employee data

lo_pig - lo_discount_count, lo_revenue_sum - Lineorder data: Count and Sum

Pig_Join_Agg -Pig to join and aggregate data from the Lineorder and Customer dataset.

Hadoop_Multi_Node_WordCount - Fetching the word count from the file using python.

Mahout_Page_Rank - Implementation of Page Rank algorithm using Mahout

Mahout_Kmeans_Matrix_Fact - Implementation of Kmeans and Matrix Factorization for Movie Lens data using Mahout

Name		Name	Last commit message	Last commit date
Latest commit History 33 Commits
HBase.pdf		HBase.pdf
Hadoop_Multi_Node_WordCount.pdf		Hadoop_Multi_Node_WordCount.pdf
Hadoop_Stream_Average.pdf		Hadoop_Stream_Average.pdf
Hadoop_Stream_Average_myMapper.py		Hadoop_Stream_Average_myMapper.py
Hadoop_Stream_Average_myReducer.py		Hadoop_Stream_Average_myReducer.py
Hadoop_Stream_Cluster.pdf		Hadoop_Stream_Cluster.pdf
Hadoop_Stream_Cluster_myMapper.py		Hadoop_Stream_Cluster_myMapper.py
Hadoop_Stream_Cluster_myReducer.py		Hadoop_Stream_Cluster_myReducer.py
Hadoop_Stream_Join.pdf		Hadoop_Stream_Join.pdf
Hadoop_Stream_Join_Agg.pdf		Hadoop_Stream_Join_Agg.pdf
Hadoop_Stream_Join_Agg_myMapper_agg.py		Hadoop_Stream_Join_Agg_myMapper_agg.py
Hadoop_Stream_Join_Agg_myMapper_join.py		Hadoop_Stream_Join_Agg_myMapper_join.py
Hadoop_Stream_Join_Agg_myReducer_agg.py		Hadoop_Stream_Join_Agg_myReducer_agg.py
Hadoop_Stream_Join_Agg_myReducer_join.py		Hadoop_Stream_Join_Agg_myReducer_join.py
Hadoop_Stream_Join_myMapper.py		Hadoop_Stream_Join_myMapper.py
Hadoop_Stream_Join_myReducer.py		Hadoop_Stream_Join_myReducer.py
Hadoop_Stream_Std_Dev.pdf		Hadoop_Stream_Std_Dev.pdf
Hadoop_Stream_Std_Dev_myMapper.py		Hadoop_Stream_Std_Dev_myMapper.py
Hadoop_Stream_Std_Dev_myReducer.py		Hadoop_Stream_Std_Dev_myReducer.py
Hadoop_WordCount.pdf		Hadoop_WordCount.pdf
Hive_Sum_transform.pdf		Hive_Sum_transform.pdf
Hive_Vehicle_data.pdf		Hive_Vehicle_data.pdf
Hive_transform.pdf		Hive_transform.pdf
Mahout_Kmeans_Matrix_Fact.pdf		Mahout_Kmeans_Matrix_Fact.pdf
Mahout_Page_Rank.pdf		Mahout_Page_Rank.pdf
Pig_Join_Agg.pdf		Pig_Join_Agg.pdf
Pig_Join_Agg.txt		Pig_Join_Agg.txt
README.md		README.md
WordCount_Python.py		WordCount_Python.py
hive_sum_transform.py		hive_sum_transform.py
hive_transform.py		hive_transform.py
lo_discount_count.pig		lo_discount_count.pig
lo_pig.pdf		lo_pig.pdf
lo_revenue_sum.pig		lo_revenue_sum.pig

vineetdcunha/Hadoop_Ecosystem

Folders and files

Latest commit

History

Repository files navigation

Hadoop_Ecosystem

About

Topics

Resources

Stars

Watchers

Forks

Languages