Concaténe un ensemble de fichiers gbin dans un fichier CSV stocké dans HDFS.
$ HADOOP_CLASSPATH=target/gbincat-1.0-SNAPSHOT-jar-with-dependencies.jar \
hadoop adam.gaia.gbincat.GbinCat \
-d data/RDS-14-A-Converted-0.01/ -o RDS-14.csv -n 10
Traite l'ensemble des fichiers gbin des sous-répertoires de data/RDS-14-A-Converted-0.01/ (-d) et produit le fichier RDS-14.csv (-o) dans HDFS. Seuls les 10 premiers objets sont traités.
Le programme peut également être exécuté localement (sans HDFS)
$ java -cp target/gbincat-1.0-SNAPSHOT-jar-with-dependencies.jar adam.gaia.gbincat.GbinCat \
-d data/igsl_source -o igsl_source.csv -n 10
Idem mais le fichier igsl_source.csv est créé dans le système de fichier local.