BART training time #1525

sunilitggu · 2019-12-19T06:05:40Z

May I know how much time BART pre-training took in which GPU configuration? I can see in the paper its written 500K steps with batch size 8k but I want to know the time it took. Many thanks.

ngoyal2707 · 2019-12-19T14:56:23Z

The time can depend on the type and numbers of gpus. We trained for around 11-12 days on 256 gpus.

Summary: Before: ``` 2020-12-23 11:46:16 | INFO | fairseq_cli.eval_lm | num. model params: 353781760 2020-12-23 11:46:21 | INFO | fairseq.data.data_utils | loaded 89663978 examples from: /private/home/sshleifer/data-bin/new_hybrid_data/train ``` After: ``` 2020-12-23 11:46:16 | INFO | fairseq_cli.eval_lm | num. model params: 353,781,760 2020-12-23 11:46:21 | INFO | fairseq.data.data_utils | loaded 89,663,978 examples from: /private/home/sshleifer/data-bin/new_hybrid_data/train ``` Pull Request resolved: fairinternal/fairseq-py#1525 Test Plan: Run `fairseq-eval-lm` or `fairseq-train` and look at logs. For example, ``` export dd2=/private/home/sshleifer/data-bin/new_hybrid_data export m=/private/home/myleott/models/public_models/LM/roberta_lm.me_fp16.bm_none.tps1024.transformer_lm_gpt2_small.share.adam.b2_0.98.eps1e-08.cl0.0.lr0.003.wu3000.dr0.1.atdr0.1.wd0.01.ms2.uf4.mu100000.s1.ngpu64/model.pt fairseq-eval-lm $dd2 \ --path $m \ --sample-break-mode complete --gen-subset train \ --tokens-per-sample 3072 --max-tokens 3072 --context-window 2560 --softmax-batch 1024 --fp16 ``` Reviewed By: myleott Differential Revision: D25693004 Pulled By: sshleifer fbshipit-source-id: bfeb93fc6607cca2cb7a6e820f51e174d02d1f62

…rch#1525) Summary: Before: ``` 2020-12-23 11:46:16 | INFO | fairseq_cli.eval_lm | num. model params: 353781760 2020-12-23 11:46:21 | INFO | fairseq.data.data_utils | loaded 89663978 examples from: /private/home/sshleifer/data-bin/new_hybrid_data/train ``` After: ``` 2020-12-23 11:46:16 | INFO | fairseq_cli.eval_lm | num. model params: 353,781,760 2020-12-23 11:46:21 | INFO | fairseq.data.data_utils | loaded 89,663,978 examples from: /private/home/sshleifer/data-bin/new_hybrid_data/train ``` Pull Request resolved: https://github.com/fairinternal/fairseq-py/pull/1525 Test Plan: Run `fairseq-eval-lm` or `fairseq-train` and look at logs. For example, ``` export dd2=/private/home/sshleifer/data-bin/new_hybrid_data export m=/private/home/myleott/models/public_models/LM/roberta_lm.me_fp16.bm_none.tps1024.transformer_lm_gpt2_small.share.adam.b2_0.98.eps1e-08.cl0.0.lr0.003.wu3000.dr0.1.atdr0.1.wd0.01.ms2.uf4.mu100000.s1.ngpu64/model.pt fairseq-eval-lm $dd2 \ --path $m \ --sample-break-mode complete --gen-subset train \ --tokens-per-sample 3072 --max-tokens 3072 --context-window 2560 --softmax-batch 1024 --fp16 ``` Reviewed By: myleott Differential Revision: D25693004 Pulled By: sshleifer fbshipit-source-id: bfeb93fc6607cca2cb7a6e820f51e174d02d1f62

Summary: Before: ``` 2020-12-23 11:46:16 | INFO | fairseq_cli.eval_lm | num. model params: 353781760 2020-12-23 11:46:21 | INFO | fairseq.data.data_utils | loaded 89663978 examples from: /private/home/sshleifer/data-bin/new_hybrid_data/train ``` After: ``` 2020-12-23 11:46:16 | INFO | fairseq_cli.eval_lm | num. model params: 353,781,760 2020-12-23 11:46:21 | INFO | fairseq.data.data_utils | loaded 89,663,978 examples from: /private/home/sshleifer/data-bin/new_hybrid_data/train ``` Pull Request resolved: fairinternal/fairseq-py#1525 Test Plan: Run `fairseq-eval-lm` or `fairseq-train` and look at logs. For example, ``` export dd2=/private/home/sshleifer/data-bin/new_hybrid_data export m=/private/home/myleott/models/public_models/LM/roberta_lm.me_fp16.bm_none.tps1024.transformer_lm_gpt2_small.share.adam.b2_0.98.eps1e-08.cl0.0.lr0.003.wu3000.dr0.1.atdr0.1.wd0.01.ms2.uf4.mu100000.s1.ngpu64/model.pt fairseq-eval-lm $dd2 \ --path $m \ --sample-break-mode complete --gen-subset train \ --tokens-per-sample 3072 --max-tokens 3072 --context-window 2560 --softmax-batch 1024 --fp16 ``` Reviewed By: myleott Differential Revision: D25693004 Pulled By: sshleifer fbshipit-source-id: bfeb93fc6607cca2cb7a6e820f51e174d02d1f62

sunilitggu added needs triage question labels Dec 19, 2019

myleott removed the needs triage label Dec 19, 2019

myleott assigned ngoyal2707 Dec 19, 2019

ngoyal2707 closed this as completed Dec 19, 2019

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

BART training time #1525

BART training time #1525

sunilitggu commented Dec 19, 2019

ngoyal2707 commented Dec 19, 2019 •

edited

BART training time #1525

BART training time #1525

Comments

sunilitggu commented Dec 19, 2019

ngoyal2707 commented Dec 19, 2019 • edited

ngoyal2707 commented Dec 19, 2019 •

edited