Project ini merupakan implementasi sederhana sistem temu kembali informasi menggunakan Python. Sistem ini dapat membaca dokumen teks, melakukan preprocessing dengan stemming bahasa Indonesia, membangun indeks menggunakan TF-IDF, dan melakukan pencarian dokumen yang relevan berdasarkan input pengguna.
- Preprocessing teks: lowercase, stopword removal, stemming
- Indexing dengan TF-IDF
- Query pencarian dengan cosine similarity
- Bahasa Indonesia
- Letakkan dokumen teks di folder
documents/
- Jalankan perintah:
python main.py
- scikit-learn
- Sastrawi