Paper-Implementation-Overview-Gradient-Descent-Optimization-Algorithms

arXiv paper :

An Overview of Gradient Descent Optimization Algorithms - Sebastian Ruder

Python 2.7

Links to Original Paper published on arXiv.org>cs>arXiv:1609.04747 : [1], [2]

Link to Blog with Paper Explanation : [3]

Implemented following Gradient Desent Optimization Algorithms from Scratch:

Vanilla Batch/Stochastic Gradient Descent [4] : batch_gradient_descent.py
Momentum [5] : momentum.py
NAG : Nesterov Accelarated Gradient [6] : nesterov_accelarated_gradient.py
AdaGrad : Adaptive Gradient Algorithm [7] : adagrad.py
AdaDelta : Adaptive Learning Rate Method [8] : adadelta.py
RMS Prop [9] : rms_prop.py
Adam : Adaptive Moment Estimation [10] [11] : adam.py
AdaMax : Infinity Norm based Adaptive Moment Estimation [12] : adamax.py
Nadam : Nesterov-accelarated Adaptive Moment Estimation [13] : nadam.py
AMSGrad [14] : amsgrad.py

Time and Error Analysis :

Minimized dummy Cost Function f(x) = x^2 using default values as initial approximation = 1, error tolerance = 0.0001, learning rate = 0.1, gamma = 0.9, beta_1 = 0.9, beta_2 = 0.999

Name		Name	Last commit message	Last commit date
Latest commit History 29 Commits
LICENSE		LICENSE
README.md		README.md
adadelta.py		adadelta.py
adagrad.py		adagrad.py
adam.py		adam.py
adamax.py		adamax.py
amsgrad.py		amsgrad.py
batch_gradient_descent.py		batch_gradient_descent.py
error_chart.png		error_chart.png
inp.txt		inp.txt
momentum.py		momentum.py
nadam.py		nadam.py
nesterov_accelarated_gradient.py		nesterov_accelarated_gradient.py
rms_prop.py		rms_prop.py

License

harshraj11584/Paper-Implementation-Overview-Gradient-Descent-Optimization-Sebastian-Ruder

Folders and files

Latest commit

History

Repository files navigation

Paper-Implementation-Overview-Gradient-Descent-Optimization-Algorithms

arXiv paper :

An Overview of Gradient Descent Optimization Algorithms - Sebastian Ruder

Python 2.7

Time and Error Analysis :

About

Topics

Resources

License

Stars

Watchers

Forks

Languages