Gradient-Centralization

MXNet implementation of Gradient Centralization: https://arxiv.org/abs/2004.01461

Usage

Import optimizer.py, then add the suffix GC after the name of arbitrary optimizer.

import optimizer
opt_params = {'learning_rate': 0.001}
sgd_gc = optimizer.SGDGC(gc_type='gc', **opt_params)
sgd_gcc = optimizer.SGDGC(gc_type='gcc', **opt_params)
adam_gc = optimizer.AdamGC(gc_type='gc', **opt_params)
adam_gcc = optimizer.AdamGC(gc_type='gcc', **opt_params)

Parameter gc_type controls what types of layers will be centralized: 'gc' applies GC to both conv and fc layers, while 'gcc' will centralize only conv gradients.

Example

python3 mnist.py --optimizer sgdgc --gc-type gc --lr 0.1 --seed 42
python3 mnist.py --optimizer adamgc --gc-type gcc --lr 0.001 --seed 42

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
README.md		README.md
mnist.py		mnist.py
optimizer.py		optimizer.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

mnist.py

mnist.py

optimizer.py

optimizer.py

Repository files navigation

Gradient-Centralization

Usage

Example

About

Releases

Packages

Languages

mnikitin/Gradient-Centralization

Folders and files

Latest commit

History

Repository files navigation

Gradient-Centralization

Usage

Example

About

Topics

Resources

Stars

Watchers

Forks

Languages