Skip to content

TRScraper, doğal dil işleme uygulamalarında kullanılmak amacıyla geliştirilmiş, Türkçe içerik girilen büyük platformlarda metin madenciliği yapma imkanı sunan bir uygulamadır.

License

ardauzunoglu/TRScraper

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

78 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

TRScraper

TRScraper, doğal dil işleme uygulamalarında kullanılmak amacıyla geliştirilmiş, Türkçe içerik girilen büyük platformlarda metin madenciliği yapma imkanı sunan bir uygulamadır.

Yöntem ve Kullanılan Kütüphaneler

TRScraper, selenium kütüphanesini kullanarak çeşitli büyük platformlarda kazıma(scrape) işlemi yapar ve elde ettiği veriyi pandas kütüphanesi aracılığı ile .xlsx uzantılı Excel dosyasına aktarır.

Gereksinimler

'pip install -r requirements.txt' komutu ile gerekli kütüphaneleri kurabilirsiniz.

Chromedriver'ın indirilmesi gerekmektedir. İndirme tamamlandıktan sonra '.py' uzantılı dosyalar içerisindeki path değişkenine Chromedriver'ın uzantısı atamalısınız.

ChromeDriver'ı İndir

Geliştirme Aşamasında Olan Özellikler

  • Çeşitli Platformlar
  • Arayüz
  • Kullanılabilir Drive Sayısını Arttırma

Galeri - Ekşi Sözlük Örneği

1 2 3 4

Geliştirici

Github Hesabım: ardauzunoglu
LinkedIn Hesabım: Arda Uzunoğlu

About

TRScraper, doğal dil işleme uygulamalarında kullanılmak amacıyla geliştirilmiş, Türkçe içerik girilen büyük platformlarda metin madenciliği yapma imkanı sunan bir uygulamadır.

Topics

Resources

License

Stars

Watchers

Forks

Packages

No packages published

Languages