GitHub - lanwuwei/GigaBERT: Zero-shot Transfer Learning from English to Arabic

GigaBERT

This repo contains pre-trained models and code-switched data generation script for GigaBERT:

@inproceedings{lan2020gigabert,
  author     = {Lan, Wuwei and Chen, Yang and Xu, Wei and Ritter, Alan},
  title      = {An Empirical Study of Pre-trained Transformers for Arabic Information Extraction},
  booktitle  = {Proceedings of The 2020 Conference on Empirical Methods on Natural Language Processing (EMNLP)},
  year       = {2020}
}

Fine-tuning Experiments

Please check Yang Chen's GitHub for code and data.

Checkpoints

The pre-trained models can be found here: GigaBERT-v3 and GigaBERT-v4

Please contact Wuwei Lan for code-switched GigaBERT with different configurations.

License

Apache License 2.0

Acknowledgement

This material is based in part on research sponsored by IARPA via the BETTER program (2019-19051600004).

Name		Name	Last commit message	Last commit date
Latest commit History 27 Commits
code-switched-data		code-switched-data
IE_tasks.png		IE_tasks.png
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

code-switched-data

code-switched-data

IE_tasks.png

IE_tasks.png

README.md

README.md

Repository files navigation

GigaBERT

Fine-tuning Experiments

Checkpoints

License

Acknowledgement

About

Releases

Packages

Languages

lanwuwei/GigaBERT

Folders and files

Latest commit

History

Repository files navigation

GigaBERT

Fine-tuning Experiments

Checkpoints

License

Acknowledgement

About

Topics

Resources

Stars

Watchers

Forks

Languages