Skip to content

ksnugroho/basic-text-preprocessing

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

11 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Basic Text-Preprocessing with Python

Pada Natural Language Processing (NLP), informasi yang akan digali berisi data-data yang strukturnya “sembarang” atau tidak terstruktur. Oleh karena itu, diperlukan proses pengubahan bentuk menjadi data yang terstruktur untuk kebutuhan lebih lanjut (sentiment analysis, topic modelling, dll).

Text data needs to be cleaned and encoded to numerical values before giving them to machine learning models, this process of cleaning and encoding is called as Text Preprocessing.

Kode ini executable dan vieawable tersedia di Jupyter Notebook.

Python 3.7 Binder nbviewer

Library

Kode pada repositori ini menggunakan beberapa library Python untuk melakukan text-preprocessing yaitu:

Artikel

Penjelasan sederhana dari setiap tahapan text-preprocessing pada repositori ini saya tulis pada artikel disini.

Penulis

Kuncahyo Setyo Nugroho
✉️ ksnugroho26@gmail.com