GitHub

Python Framework for Extractive Text Summarization

Natural Language Processing project for Master's Degree in Computer Science (Machine Learning curriculum) @ University of Bari. Implementation based on paper "Centroid-based Text Summarization through Compositionality of Word Embeddings" accepted at MultiLing Workshop in EACL 2017

Params description

text: string to summarize
summary_length:
if k < 1 then summarize k% of the original text
else if k >= 1 choose the k most relevant sentences of the original text
query_based_token: It's a list.
If you don't like tfidf/lda methods to generate summary, give us your relevant token and we try to generate the summary based on them (example: ["music", "rock"]). If this list is full, centroid_mode param will be ignored.

Code usage:

import summarizer
s = summarizer.Summarizer(model_path="model.bin")
text = "text to summarize"
summary, text_error, boolean_error = s.summarize(text=text, summary_length=3, query_based_token=[])
summary_query_based, text_error_query_based, boolean_error_query_based = s.summarize(text=text, summary_length=0.5, query_based_token=["music", "rock"])

Name		Name	Last commit message	Last commit date
Latest commit History 69 Commits
summarizer_rest		summarizer_rest
summarizer_restful		summarizer_restful
.gitignore		.gitignore
README.md		README.md
data.py		data.py
lookup_table.py		lookup_table.py
manage.py		manage.py
summarizer.py		summarizer.py
token_smoother.py		token_smoother.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

summarizer_rest

summarizer_rest

summarizer_restful

summarizer_restful

.gitignore

.gitignore

README.md

README.md

data.py

data.py

lookup_table.py

lookup_table.py

manage.py

manage.py

summarizer.py

summarizer.py

token_smoother.py

token_smoother.py

Repository files navigation

Python Framework for Extractive Text Summarization

Params description

Code usage:

About

Releases

Packages

Contributors 2

Languages

TextSummarizer/TextSummarizer

Folders and files

Latest commit

History

Repository files navigation

Python Framework for Extractive Text Summarization

Params description

Code usage:

About

Resources

Stars

Watchers

Forks

Languages