ALS_debug

code used to test distributed ALS with spark

Instructions for use on EC2:

** Note: I launch the following cluster using spot instances:
-s 4 --cluster-type standalone -t m2.4xlarge
this runs the lastest spark AMI: ami-a60193cf

use version 0.7.0 of spark
clone code @ https://github.com/gingsmith/ALS_debug.git
run setup_cluster.sh from ALS_debug directory
get data from: http://www.cs.berkeley.edu/~vsmith/data/netflix_randSplit1_data.txt
run bad_scaling.sh, passing in [master jars sparkhome trainfile] as appropriate
run bad_memory.sh, passing in [master jars sparkhome trainfile] as appropriate

** depending on the size of the cluster, it may be important to change "nsplits", as well

example:

export PUBLIC_HOSTNAME=ec2-metadata -p | cut -d: -f2 | tr -d ' '

./rank_scaling.sh spark://$PUBLIC_HOSTNAME:7077 /mnt/ALS_debug/target/als_debug-assembly-1.0.jar /root/spark hdfs://$PUBLIC_HOSTNAME:9000/data/netflix_randSplit1_data.txt

./data_scaling.sh spark://$PUBLIC_HOSTNAME:7077 /mnt/ALS_debug/target/als_debug-assembly-1.0.jar /root/spark hdfs://$PUBLIC_HOSTNAME:9000/data/netflix_randSplit1_data.txt

Instructions for local use:

clone code @ https://github.com/gingsmith/ALS_debug.git
get data from: http://www.cs.berkeley.edu/~vsmith/data/netflix_randSplit1_data.txt
run bad_scaling.sh, passing in [master jars sparkhome trainfile] as appropriate
run bad_memory.sh, passin in [master jars sparkhome trainfile] as appropriate

** may want to manually change "nsplits"

Name		Name	Last commit message	Last commit date
Latest commit History 289 Commits
project		project
sbt		sbt
src		src
.DS_Store		.DS_Store
ALS_test.sh		ALS_test.sh
README.md		README.md
bals_rank_scaling.sh		bals_rank_scaling.sh
bals_strong_scaling.sh		bals_strong_scaling.sh
build.sbt		build.sbt
data_scaling.sh		data_scaling.sh
expected_scaling.txt		expected_scaling.txt
more_rank_scaling.sh		more_rank_scaling.sh
rank_scaling.sh		rank_scaling.sh
setup_cluster.sh		setup_cluster.sh
strong_scaling.sh		strong_scaling.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

project

project

sbt

sbt

src

src

.DS_Store

.DS_Store

ALS_test.sh

ALS_test.sh

README.md

README.md

bals_rank_scaling.sh

bals_rank_scaling.sh

bals_strong_scaling.sh

bals_strong_scaling.sh

build.sbt

build.sbt

data_scaling.sh

data_scaling.sh

expected_scaling.txt

expected_scaling.txt

more_rank_scaling.sh

more_rank_scaling.sh

rank_scaling.sh

rank_scaling.sh

setup_cluster.sh

setup_cluster.sh

strong_scaling.sh

strong_scaling.sh

Repository files navigation

ALS_debug

About

Releases

Packages

Languages

gingsmith/ALS_debug

Folders and files

Latest commit

History

Repository files navigation

ALS_debug

About

Resources

Stars

Watchers

Forks

Languages