mrjob

Here are 53 public repositories matching this topic...

groda / big_data

Tutorials on Big Data essentials: Hadoop, MapReduce, Spark.

docker big-data spark hadoop bigdata jupyter-notebook pyspark hadoop-cluster mapreduce gutenberg-ebooks spark-sql mrjob hadoop-hdfs testdfsio mapreduce-bash apache-sedona

Updated Apr 27, 2024
Jupyter Notebook

jehiah / gomrjob

Star

gomrjob - a Go Framework for Hadoop Map Reduce Jobs

go hadoop mapreduce mrjob dataproc

Updated Apr 19, 2024
Go

HearthSim / articles

Star

Analysis of Hearthstone replays

emr hearthstone replays mrjob

Updated May 18, 2017
Jupyter Notebook

MHassaanButt / Flight-Delays-Prediction

Star

In this project, I used Decision Tree Learning Model as the main algorithm to build the model. Due to the big amount of flight data, we implement the project using MRJob, PySpark and Spark's MLlib then compare the performance and accuracy of those implementations.

hadoop pyspark decision-tree mrjob spark-mllib

Updated Dec 21, 2021
Jupyter Notebook

Tarasa24 / PWA-Store

Star

The largest collection of publicly accessible Progressive Web Apps*

emr golang crawler pwa linode postgresql mrjob commoncrawl puppeteer

Updated Sep 2, 2022
HTML

nanfengpo / hadoop-with-python-code

Star

Exercises and examples developed for the Hadoop with Python tutorial

hadoop mrjob

Updated Apr 13, 2015
Jupyter Notebook

tugrulhkarabulut / hadoop-movie-rating-prediction

Star

Movie rating prediction application

flask machine-learning natural-language-processing hadoop hadoop-cluster hadoop-mapreduce mrjob

Updated Jun 30, 2021
CSS

thedatasociety / lab-hadoop

Star

hive hadoop hbase flume sqoop hadoop-mapreduce hadoop-streaming mrjob hadoop-hdfs hadoop-yarn

Updated Jan 19, 2024
PLpgSQL

shinde-chandrakant / BigData-Ops-on-TLC-Yellow-Taxi

Star

Analysed New York City's Yellow taxi data set with Big Data tools such as Hadoop, HBase, Sqoop, MapReduce and AWS Cloud Infrastructure.

aws hadoop aws-s3 bigdata hbase aws-emr mapreduce aws-rds data-modeling sqoop mrjob big-data-analytics

Updated Sep 18, 2023
Python

MadimetjaMadix / ELEN4020A_Lab3

Star

Using MapReduce Framework

mrs python3 mapreduce mrjob

Updated Apr 16, 2019
TeX

Mariona-FT / Information-Retrieval-REIN

Star

RECUPERACIÓ DE LA INFORMACIÓ Curs 2023-24 EPSEVG

elasticsearch information-retrieval indexing upc tokenization mrjob rastreator epsevg

Updated Apr 13, 2024
Jupyter Notebook

jonathanAmancioSales / BigData_AWS_EMR_MRJob_DIO

Star

Projeto de processamento distribuído de dados utilizando Python, MRJob e AWS EMR

aws cloud aws-s3 s3 s3-bucket aws-emr aws-ec2 mrjob

Updated Aug 8, 2021
Python

JaredP94 / MapReduce-Matrix-Multiplication

Star

python mapreduce mrjob

Updated Apr 9, 2018
Python

mrjuice01 / SharpGenTools

Star

Accurate and high performance C++ interop code generator for C#.

css csharp mrjob

Updated Nov 21, 2023
C

ARomoH / Basic-Sentiment-Analysis-MrJob-Twitter-

Star

Project developed to make an sentiment analysis using dictionary implemented with MrJob applying a map-reduce model. It can be executed locally or in HDFS enviroments (such as Hadoop or AWS)

hadoop sentiment-analysis map-reduce aws-ec2 mrjob twiiter hdfs-enviroments