AD-RDAT

Implementation of paper "Improving Arabic Diacritization with Regularized Decoding and Adversarial Training" at ACL-2021

Citation

@inproceedings{qin-etal-2021-improving,
    title = "Improving Arabic Diacritization with Regularized Decoding and Adversarial Training",
    author = "Qin, Han and Chen, Guimin and Tian, Yuanhe and Song, Yan",
    booktitle = "Proceedings of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing (Volume 2: Short Papers)",
    month = aug,
    year = "2021",
    address = "Online",
    pages = "534--542",
}

Requirements

Our code works with python 3.8 and requires the following packages: sklearn, pytorch.

It also require the PyTorch version of pre-trained language models: multi-lingual BERT and AraBERT.

Usage

See the commands in run.sh to train a model on the small sample data.

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
data/demo		data/demo
.gitignore		.gitignore
README.md		README.md
advMultiCri.py		advMultiCri.py
data_utils.py		data_utils.py
diacritization_stat.py		diacritization_stat.py
embedding.py		embedding.py
loss.py		loss.py
optimization.py		optimization.py
requirements.txt		requirements.txt
run.sh		run.sh
schedulers.py		schedulers.py
train_main.py		train_main.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

AD-RDAT

Citation

Requirements

Usage

About

Releases

Packages

Languages

synlp/AD-RDAT

Folders and files

Latest commit

History

Repository files navigation

AD-RDAT

Citation

Requirements

Usage

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages