Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Diacritization Evaluation System نظم تقييم التشكيل #9

Open
linuxscout opened this issue Nov 8, 2015 · 1 comment
Open

Comments

@linuxscout
Copy link
Owner

A system to compare manual and automatic diacritisation results to evaluate the diacritization systems (Mishkal and others)
نظام لمقارنة التشكيل ما بين اليدوي والآلي، لتقييم أنظمة التشكيل الآلي مثل مشكال

تطوير أداة لتقييم التشكيل

  • أداة المقارنة وتقييم التشكيل
  • التشكيل الجزئي
  • تشكيل أواخر الكلمات فقط (الإعراب)

المعايير

معيار تشكيل الحروف:

  • عدد الحروف المشكولة/ غير المشكولة
  • عدد الحركات الصحيحة / الخاطئة
  • كل حرف غير مشكول في النتيجة يقابل ناقص حرف أما حرف مشكول

تطابق التشكيل TEXT SIMILARITY

  • تلوين الكلمات المطابقة وغير المطابقة
  • 3 درجات من التلوين: مطابق تماما، مطابق بدون إعراب، مطابق إعرابا فقط
  • كل كلمة غير مشكولة = ناقص عدد حروفها
  • تحديد حركة الإعراب: مثلُهم
  • دراسة نسبة الحركات الإعرابية في النص
  • معالجة حالة الأداة: تفضيل الأداة، إلا إذا كانت علاقة معنوية
  • المفاضلة بين الأدوات حسب ما بعدها
  • إعراب الكلمة المستبعدة

عينات التقييم

  • اختيار نصوص حديثة للمقارنة (وجدنا نصوصا في موقع الجزيرة التعليمي)
  • عينات من عصور متعددة ومجالات مختلفة
  • خيارات خاصة بتنميط التشكيل: أي توحيد تشكيل الحروف قبل حروف المدّ وتشكيل أل التعريف بنفس الطريقة
  • مقياس الرفع والتنوين
@abdoutech93
Copy link

Add the respect of rule of " لا تقف العرب الا على ساكن "

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

2 participants