Skip to content

nanelimon-organization/TurkishNLPGuide

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

21 Commits
 
 
 
 

Repository files navigation

Turkish NLP Guide
TR-NLPGUIDE

Dikkat! ⭐

Bu repo 📚 Türkçe Doğal Dil İşleme (NLP) alanında kullanabileceğiniz değerli kaynaklara erişebilmenizi sağlıyor. Burada, Türkçe Doğal Dil İşleme alanıyla ilgili güncel ve değerli bilgilere kolayca ulaşabilirsiniz.

Türkçe'nin dil teknolojileri alanındaki zengin potansiyelini keşfetmek için bu repoyu kullanabilirsiniz. 💡 Ayrıca, Teknofest Türkiye birincilerinin çalışmalarına da yer verdim. Böylelikle benzersiz ve heyecan verici projeleri keşfetme imkanı elde edebilirsiniz.

Son olarak, unutmayın ki bu repo herkesin faydalanabileceği bir kaynaktır ve katkılarınızla Türkçe Doğal Dil İşleme alanına ve literatürüne önemli katkılarda bulunabilirsiniz. Sizin contribution (katkı) sağlamanız diğer insanları etkileyebilir ve ülkemize büyük faydalar sağlayabilir. Bu repo, katkıda bulunabileceğiniz bir ortamdır. Kendi kaynaklarınızı eklemek için pull request açarak contribution kısmında görünme fırsatını yakalayabilirsiniz. Türkçe Doğal Dil İşleme alanına yapacağınız katkılar ülkemize değer katabilir.

Haydi, Türkçe'nin dil işleme yeteneklerini birlikte keşfedelim ve bu alandaki geleceği birlikte şekillendirelim! 🚀🇹🇷

⭐️ Lütfen bu repoya star vermeyi unutmayalım! ⭐️


Teknofest

Tarih Derece Takım Adı Github Link
Türkçe Doğal Dil İşleme Yarışması 2020 1. FİXY GitHub
2. Global Maksimum GitHub
3. CLUTCH Bulunamadı
Türkçe Doğal Dil İşleme Yarışması 2021 1. TDD GitHub
2. TURQUEST GitHub
3. BİLİRKİŞİ GitHub
Türkçe Doğal Dil İşleme Yarışması 2022 Kamuda Mevzuat Arama Motoru Geliştirme Kategorisi 1. L2 Regülasyon GitHub
2. trtmlteam22 GitHub
3. IFL GARAJI 10100 GitHub
Türkçe Doğal Dil İşleme Yarışması 2022 Serbest Kategori 1. Nane&Limon GitHub
2. TEXT-GEN Bulunamadı
3. nlpTurk GitHub
Türkçe Doğal Dil İşleme Yarışması 2023 1. Nane&Limon GitHub
2. Overfit-GM (huggingface) Hugging Face
3. BRAIN-TR (LinkedIn) LinkedIn

Türkçe NLP Kütüphaneleri, Modelleri ve Araçları

Kategori Kütüphane/Model/Araç Açıklama Kaynak
Model BERTurk BERTurk, Türkçe için BERT/DistilBERT, ELECTRA ve ConvBERT modelleri içerir. GitHub
Model Loodos/Turkish Language Models Loodos/Turkish Language Models reposu, Transformer tabanlı Türkçe dil modelleri ve ilgili araçları içermektedir. GitHub
Model ELMO For ManyLangs ELMO For ManyLangs, birçok dil için önceden eğitilmiş ELMo temsillerini içerir. GitHub
Model Fasttext - Word Vector Fasttext - Word Vector, Common Crawl ve Wikipedia üzerinde fastText kullanılarak eğitilmiş 157 dil için önceden eğitilmiş kelime vektörlerini içerir. Resmi Web Sitesi
Model Turkish GPT (gpt-2.8.1-turkish-cased) Turkish GPT (gpt-2.8.1-turkish-cased) Hugging Face
Model Turkish-Text-Sentiment-Analysis Turkish-Text-Sentiment-Analysis, Türkçe metinlerin duygu analizini yapabilen bir modeldir. HuggingFace
Model HuggingFace - Diğer Türkçe Modeller HuggingFace Portalı'nda yayınlanan diğer Türkçe modelleri içerir. HuggingFace
Kütüphane ITU Turkish NLP Istanbul Technical University, Natural Language Processing Group tarafından sağlanan araçlar ve hizmetler. ITU Turkish NLP
Kütüphane spaCy Turkish models spaCy tarafından sağlanan Türkçe modeller. spaCy Turkish models
Kütüphane VNLP VNLP, Türkçe dil için state-of-the-art ve hafif NLP araçları sağlar. GitHub
Kütüphane Zemberek-NLP Türkçe için doğal dil işleme araçları sağlayan Zemberek-NLP. GitHub
Kütüphane Zemberek-Python Zemberek'in Python implementasyonu. GitHub
Word Embeddings Floret Embeddings Turkish Floret Embeddings, large and medium sized. HuggingFace
Word Embeddings VNLP Word Embeddings Word2Vec Turkish word embeddings. VNLP
Word Embeddings TurkishGloVe Turkish GloVe word embeddings. GitHub
Araç brolin59/trnlp Türkçe NLP için bazı araçlar. GitHub
Araç akoksal/Turkce-Duygu-Takibi Twitter Türkiye için duygu analizi aracı. GitHub
Araç MeteHanC/turkishnlp Basit ama iyi Türkçe NLP araçları. GitHub
Araç deeplearningturkiye/kelime_kok_ayirici Derin Öğrenme ile Türkçe kök bulma aracı. GitHub
Araç emres/turkish-deasciifier Türkçe karakter düzeltici. GitHub
Araç google-research/turkish-morphology Türkçe için iki seviyeli morfolojik analiz aracı. GitHub
Araç GlobalMaksimum/sadedegel Türkçe haber özetleyici. GitHub
Araç Fixy-TR/fixy Duygu analizi ve Türkçe yazım denetimi için bazı kurallara göre düzeltme yapabilen bir kütüphane. GitHub
Araç ardauzunoglu/rte-speech-generator Türkiye Cumhurbaşkanı için yeni söylemler oluşturmak için Doğal Dil İşleme. GitHub
Araç Zemberek-Server Zemberek Türkçe NLP Java Kütüphanesi üzerinde çalışan REST Docker Sunucusu. GitHub
Araç Mukayese Türkçe NLP araçlarını ve görevlerini karşılaştırmak için bir ölçekleme platformu. GitHub
Araç Turkish Stemmer Türkçe dil için kök bulma algoritması. GitHub
Araç sinKAF Türkçe cümlelerde ahlaki olmayan ifadelerin tespiti için bir makine öğrenimi kütüphanesi. GitHub
Araç TDD - Tools Turkish Data Depository (TDD) projesi tarafından sağlanan çevrimiçi araçlar. TDD - Tools
Araç Turkish-Summarizer - SadedeGel Turkish-Summarizer - SadedeGel, Türkçe metinleri özetlemek için kullanılabilir bir araçtır. GitHub
Araç TrTokenizer Türkçe dil için cümle ve kelime tokenizasyonu sağlayan bir araç. GitHub
Araç Starlang NLP Araçları Starlang tarafından sağlanan Türkçe NLP araçları. Morphological Analysis, Spell Checker, Dependency Parser, Deasciifier, NER
Araç snnclsr/NER Türkçe Dil için Adlandırılmış Varlık Tanıma sistemi. GitHub

NLP ~ Makale/Video

Kategori Açıklama Link
Articles Two-level Description of Turkish Morphology Link
Articles Doğal Dil İşleme İle Türkçe Yazım Hatalarının Denetlenmesi Link
Articles Türkçe ve Doğal Dil İşleme Link
Articles Doğal Dil İşleme Link
Articles TÜRKÇE İÇİN DERİN ÖĞRENME TABANLI DOĞAL DİL İŞLEME MODELİ GELİŞTİRİLMESİ Link
Articles TÜRKÇE OTOMATİK HECELEME SİSTEMİ VE HECE İSTATİSTİKLERİ Link
Articles Türkçe Haber Metinlerinin Konvolüsyonel Sinir Ağları ve Word2Vec Kullanılarak Sınıflandırılması Link
Articles LSTM Ağları ile Türkçe Kök Bulma Link
Articles Türkçe Tweetler Üzerinde Otomatik Soru Tespiti Link
Articles Classification of News according to Age Groups Using NLP Link
Articles Açık Kaynak Doğal Dil İşleme Kütüphaneleri Link
Articles Neden yasaklandı? Depremle ilgili Ekşi Sözlük yorumlarına NLP gözüyle bakış Link
Articles A collection of brand new datasets for Turkish NLP Link
Videos Uygulamalı Türkçe doğal dil işleme evreleri Link
Videos Türkçe Doğal Dil İşleme - Kemal Oflazer Link
Videos BOUN - Yapay Öğrenmeye Giriş - İsmail Arı Yaz Okulu 2018 Link
Videos BOUN - Doğal Dil İşleme - İsmail Arı Yaz Okulu 2018 Link
Videos BOUN - Konuşma / İşleme - İsmail Arı Yaz Okulu 2018 Link
Videos BOUN - Yapay Öğrenme Yaz Okulu 2020 Link
Videos Açık Seminer - NLP 101 Doğal Dil İşlemeye Giriş ve Uygulamalı Metin Madenciliği Link
Videos Starlang Yazılım Channel Link
Videos NLP with Duygu Link

Türkiye Veri Kaynağı

Kategori İsim Açıklama Kaynak
NLP TDD - Türkçe Dil Deposu (Türkçe Dil Deposu) Türkiye Açık Kaynak Platformu'nun ana projelerinden biri olan Türkçe Doğal Dil İşleme Projesi, Türk metinlerinin işlenmesi için gereken veri setlerini hazırlamayı amaçlamaktadır. TDD
NLP İTÜ NLP Grubu - Veri Setleri İstanbul Teknik Üniversitesi, Doğal Dil İşleme Grubu'nun veri setleri. ITU NLP Grubu
NLP Boğaziçi Üniversitesi TABI - NLI-TR Türkçe Doğal Dil İşlemede, Amazon Translate kullanılarak temel NLI veri kümeleri (SNLI ve MultiNLI) çevrilerek elde edilen büyük ölçekli iki veri kümesi. Boun-TABI/NLI-TR
NLP Türkçe NLP Suite Veri Setleri Türkçe NLP Suite Projesi, Türkçe NLP için çeşitli dilbilimsel kaynaklar sunmaktadır. Repo şu anda çeşitli NER veri setleri, tıbbi NLP veri setleri ve film incelemeleri, ürün incelemeleri ve daha fazlasını içeren duygu analizi veri setlerini içermektedir. Turkish NLP Suite Veri Setleri
NLP Bilkent Turkish Writings Dataset - Bilkent Turkish Writings Dataset
NLP YTÜ Kemik Doğal Dil İşleme Grubu - YTÜ Kemik Doğal Dil İşleme Grubu
Resmi Kurumlar Resmi İstatistik Portalı - Resmi İstatistik Portalı
Resmi Kurumlar Türkiye İstatistik Kurumu (TUİK) - Türkiye İstatistik Kurumu (TUİK)
Resmi Kurumlar Türkiye Cumhuriyeti Merkez Bankası - Türkiye Cumhuriyeti Merkez Bankası
Resmi Kurumlar ULAKBİM Veri Portalı - ULAKBİM Veri Portalı
Resmi Kurumlar Yüksek Seçim Kurulu Açık Veri Portalı - Yüksek Seçim Kurulu Açık Veri Portalı
Resmi Kurumlar Sağlık Bakanlığı Açık Veri Portalı (Pilot Çalışma) - Sağlık Bakanlığı Açık Veri Portalı (Pilot Çalışma)
Resmi Kurumlar Türkiye Ulusal Coğrafi Bilgi Portalı - Türkiye Ulusal Coğrafi Bilgi Portalı
Resmi Kurumlar Türkiye Ulusal Coğrafi Açık Veri Portalı - Türkiye Ulusal Coğrafi Açık Veri Portalı
Belediyeler İstanbul Büyükşehir Belediyesi Açık Veri Portalı - İstanbul Büyükşehir Belediyesi Açık Veri Portalı
Belediyeler Küçükçekmece Belediyesi Açık Veri Platformu - Küçükçekmece Belediyesi Açık Veri Platformu
Belediyeler Beyoğlu Açık Veri Setleri - Beyoğlu Açık Veri Setleri
Belediyeler Tuzla Belediyesi Açık Veri Portalı - Tuzla Belediyesi Açık Veri Portalı
Belediyeler İzmir Büyükşehir Belediyesi Açık Veri Portalı - İzmir Büyükşehir Belediyesi Açık Veri Portalı
Belediyeler Konya Açık Veri Portalı - Konya Açık Veri Portalı
Belediyeler Balıkesir Büyükşehir Belediyesi Açık Veri Platformu - Balıkesir Büyükşehir Belediyesi Açık Veri Platformu
Belediyeler Bursa Açık Veri Platformu - Bursa Açık Veri Platformu
Belediyeler Kocaeli Büyükşehir Belediyesi Açık Veri Paylaşımı - Kocaeli Büyükşehir Belediyesi Açık Veri Paylaşımı
Belediyeler Marmara Belediyeler Birliği Açık Veri Portalı - Marmara Belediyeler Birliği Açık Veri Portalı
Belediyeler Ankara Büyükşehir Belediyesi Açık Veri Portalı - Ankara Büyükşehir Belediyesi Açık Veri Portalı
Belediyeler Gaziantep Büyükşehir Belediyesi Açık Veri Portalı - Gaziantep Büyükşehir Belediyesi Açık Veri Portalı
Belediyeler Ordu Büyükşehir Belediyesi Coğrafi Açık Veri Portalı - Ordu Büyükşehir Belediyesi Coğrafi Açık Veri Portalı
Üniversiteler Fırat Üniversitesi Büyük Veri ve Yapay Zeka Laboratuvarı Veri Setleri - Fırat Üniversitesi Büyük Veri ve Yapay Zeka Laboratuvarı Veri Setleri
COVID T.C. Sağlık Bakanlığı COVID-19 Bilgilendirme Platformu - T.C. Sağlık Bakanlığı COVID-19 Bilgilendirme Platformu
COVID Türkiye COVID-19 Pandemi İzlem Ekranı (TURCOVID19) - Türkiye COVID-19 Pandemi İzlem Ekranı (TURCOVID19)
Finans Borsa İstanbul Data Store - Borsa İstanbul Data Store
Finans Dünya Bankası - Türkiye - Dünya Bankası - Türkiye
API Merkez Bankası Python API - Merkez Bankası Python API
API Merkez Bankası R API - Merkez Bankası R API
Diğer Amazon MASSIVE MASSIVE, 51 dilde 1 milyon cümlelik bir paralel veri kümesidir ve NLU görevleri için niyet tahmini ve yuva etiketleme için açıklamalar içermektedir. Amazon MASSIVE
Diğer OPUS: en-tr OPUS, web'den çevrilmiş metinlerin büyüyen bir koleksiyonudur. OPUS projesinde, ücretsiz çevrimiçi veriyi dönüştürmeye, dilbilimsel etiket eklemeye ve topluluğa genel olarak erişilebilir bir paralel derlem sağlamaya çalışıyoruz. OPUS: en-tr
Diğer CC-100 Web Tarama Verisinden Tek Dilli Veri Kümesi. Bu derleme, 100'den fazla dil için tek dilli veri içermektedir. CC-100
Diğer OSCAR OSCAR, Ungoliant mimarisi kullanılarak Common Crawl korpusunun dil sınıflandırması ve filtrelemesi ile elde edilen devasa çok dilli bir derlemedir. OSCAR
Diğer Universal Dependencies Universal Dependencies, dünya dillerinin TreeBank oluşturmak için uluslararası bir işbirliği projesidir. Universal Dependencies
Diğer UD Turkish Kenet Türkçe-Kenet UD TreeBank, 18.700 el ile işaretlenmiş cümle ve 178.700 sözcükten oluşmaktadır. Korpusu, TDK'dan sözlük örneklerini içermektedir. UD Turkish Kenet
Diğer UD Turkish BOUN BOUN TreeBank, TABILAB tarafından oluşturulmuş ve TÜBİTAK tarafından desteklenmektedir. Bu derleme, 9.761 cümle ve 121.214 sözcük içermektedir. UD Turkish BOUN
Diğer hermitdave/Frequency Word List - Frequency Word List
Diğer Bilkent Turkish Writings Dataset - Bilkent Turkish Writings Dataset
Diğer 170k Turkish Sentences from Wikipedia - 170k Turkish Sentences from Wikipedia
Diğer Wiktionary:Frequency Lists - Turkish - Wiktionary:Frequency Lists - Turkish
Diğer ooguz/Bad Word Blacklist for Turkish - ooguz/Bad Word Blacklist for Turkish
Diğer ahmetax/Turkish Stop Words List - ahmetax/Turkish Stop Words List
Diğer NLTK - Stop Words - NLTK - Stop Words
Diğer Tatoeba: Çok Dilli Cümleler - Tatoeba: Çok Dilli Cümleler
Diğer 466k İngilizce Kelime - 466k İngilizce Kelime