Skip to content

Concaténe un ensemble de fichiers gbin dans un fichier texte stocké dans HDFS.

Notifications You must be signed in to change notification settings

hal91190/gbinCat

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

53 Commits
 
 
 
 
 
 
 
 

Repository files navigation

gbinCat

Concaténe un ensemble de fichiers gbin dans un fichier CSV stocké dans HDFS.

Exemples d'utilisation

$ HADOOP_CLASSPATH=target/gbincat-1.0-SNAPSHOT-jar-with-dependencies.jar \
  hadoop adam.gaia.gbincat.GbinCat \
  -d data/RDS-14-A-Converted-0.01/ -o RDS-14.csv -n 10

Traite l'ensemble des fichiers gbin des sous-répertoires de data/RDS-14-A-Converted-0.01/ (-d) et produit le fichier RDS-14.csv (-o) dans HDFS. Seuls les 10 premiers objets sont traités.

Le programme peut également être exécuté localement (sans HDFS)

$ java -cp target/gbincat-1.0-SNAPSHOT-jar-with-dependencies.jar adam.gaia.gbincat.GbinCat \
  -d data/igsl_source -o igsl_source.csv -n 10

Idem mais le fichier igsl_source.csv est créé dans le système de fichier local.

About

Concaténe un ensemble de fichiers gbin dans un fichier texte stocké dans HDFS.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages