Skip to content

KamilAkarsu/turkish-news-classification

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Turkish News Category Classification Tutorial

Blog

Veri Kümesi

Interpress Turkish News Category Dataset (270K - Lite Version) veri kümesi, İnterpress medya takip şirketi tarafından 2010–2017 yılları arasında yazılı basın ve haber sitelerinden derlenen, 17 kategoride 273.601 adet haberden oluşan Türkçe haber veri kümesidir. Veri kümesinin kolay ayrıştırılabilir ve daha az sınıflı olarak 10 kategoride ("kültürsanat", "ekonomi", "siyaset", "eğitim", "dünya", "spor", "teknoloji", "magazin", "sağlık", "gündem") yeniden düzenlenerek "Lite" versiyonu oluşturulmuştur.

Veri kümesinin ham haline de buradan ulaşabilirsiniz.

Train Test
218,880 54,721

Çalışma Dosyaları

Google Colab

  • 1-load_dataset_and_preprocess.ipynb - HuggingFace Datasets üzerinden veri kümesini indirme, veri kümesinin içeriğinin incelenmesi ve ön işlemlerin uygulanması işlemlerinden oluşan çalışma dosyası

Open In Colab

Open In Colab

  • 3-train.ipynb - SVM eğitim modelin oluşturulması, eğitilmesi ve performansın değerlendrilmesi işlemlerinden oluşan çalışma dosyası

Open In Colab

  • 4-prediction.ipynb - Eğitilmiş model dosyası ile farklı haber metinleri ile test edilmesi işlemlerini içeren çalışma dosyası

Open In Colab

Sonuçlar

Katkı Verenler ✨

About

Turkish News Category Classification Tutorial

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 100.0%