sscorpus: A monolingual parallel corpus for sentence simplification

This corpus contains 492,993 aligned sentences extracted by pairing Simple English Wikipedia with English Wikipedia. These source data were downloaded in May 2016.

The form of each line in the corpus: original sentence <TAB> simple sentence <TAB> similarity score

For questions, please contact Tomoyuki Kajiwara at Tokyo Metropolitan University.

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
README.md		README.md
sscorpus.gz		sscorpus.gz

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

sscorpus.gz

sscorpus.gz

Repository files navigation

sscorpus: A monolingual parallel corpus for sentence simplification

About

Releases

Packages

tmu-nlp/sscorpus

Folders and files

Latest commit

History

README.md

README.md

sscorpus.gz

sscorpus.gz

Repository files navigation

sscorpus: A monolingual parallel corpus for sentence simplification

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Packages