Arabic Part of Speech Tagset "KTagset"

Synopsis

Part of speech tagging and areis the process of selecting the most likely sequence of syntactic categories for the words in a sentence. It determines grammatical characteristics of the words, such as part of speech, grammatical number, gender, person, etc. In the case of Arabic language, this task is not a trivial one since most of the words are ambiguous as a result of the absence of vowels.

KTagset system also uses a special tagset for Named Entity Recognition designed for the purposes.

Kalmasoft's Tagset (© KTagset) is the generic tagset for the Arabic PoS Tagger, it is the default tagset used by the system, but many other mappings are available as optional.

A tag is string of twenty two characters grouped in three 4-letters sets and one 10-letters set [4-10-4-4], the 10 letters ends with two digits to indicate the language variety while the rest of letters have their different grammatical notation, each letter may have different representation depending on the set it resides in and the specific position it occupies, basically the tag string is case sensitive and broadly categorized as follows {syntax}{morphology}{semantics}{ontology}.

"يستبدلانكن" => {VIIA}{TA3DM2PF10}{••••}{••••}
ترميز كلماسوفت (KTagset) يستخدم سلسلة من اثنين وعشرين حرفاً موزعة إلى أربعة مجموعات الثانية منها تضم عشرة أحرف تنتهي برقم يبين مستوى اللغة بينما البقية تتألف من أربعة لكل مجموعة، أي حرف في الترميز يأخذ وظيفته بحسب المجموعة وترتيبه داخلها، الترميز مرتب إلى الوظائف التالية (النحو، الإملاء، الدلالة، التكوين).

PositionTagEnglishArabic
1Nnounإسم
1Vverbفعل
1Pparticleأداة
1Ssymbolرمز
1Dnumberرقم
1Lscriptكتابة
1Eentityمسمى
1Xunparsedمجهول
not applicableغير مطلوب
Tensesالأزمان
2Pperfective, pastماض
2Iimperfective, presentمضارع
2Ffutureمستقبل
Moodsالبناء
3Iindicativeمبني على الضم
3Ssubjunctiveمبني على الفتح
3Mimperativeأمر
3Jjussiveمجزوم
3Eemphaticفعل مؤكد
Voicesالصيغة
4Aactive voiceمبني للمعلوم
4Ppassive voiceمبني للمجهول
Transitivityالتعدي
5Iintransitiveلازم
5Ttransitiveمتعد
5Dditransitiveمتعد لمفعولين
5Aambitransitiveمتعد ولازم
Formsالأوزان
61-9Form 1-9فَعلَ, فَعَّلَ, فاعَلَ, أفْعَلَ, تَفَعَّلَ, تَفاعَلَ, اِنْفَعَلَ, اِفْتَعَلَ, اِفْعَلَّ
6A-FForm 10-15اِسْتَفْعَلَ
Nounsالأسماء
2Mverbal noun (Masdar)مصدر
2Cactive participleاسم فاعل
2Ppassive participleاسم مفعول
2Hhyperbolic participleصيغة مبالغة
2Ssuperlativeاسم تفضيل
2Inoun of utilization (instrumental noun)اسم آلة
2BBroken pluralجمع تكسير
Casesالحالة
3Nnominativeحالة الرفع، مرفوع
3Aaccusativeحالة النصب، منصوب
3Ggenetive, possessiveحالة الجر، مجرور
Derivativesالمشتقات
4Erelative nominal constructمصدر صناعي
4Ddiminutiveصيغة تصغير
4Qnumerative nounاسم مرة
4Hinstance nounاسم هيئة
4Ttemporal nounاسم زمان
4Llocative nounاسم مكان
4Aadjectiveصفة
4Jrelative adjectiveنسبة
4Bpseudoverbal adjectiveصفة مشبهة
4Rinterrogativeاستفهام
4Vadverbحال
4Ppronounضمير
4Upersonal pronounضمير منفصل
4Wrelative pronounإسم موصول
4Mdemonstrative pronounإسم إشارة
4Nproper nounاسم صحيح
4Ztemporal adverbظرف زمان
4Klocative adverbظرف مكان
4Xreflexive pronounضمير
4Spossessive pronoun
4Ccardinal numberالعدد
4Oordinal numberالترتيب
4Fdefiniteمعرف
4Iindefiniteنكرة
Particlesالأدوات
2Cconjunctionعطف، أداة عطف
2Pprepositionحرف جر
2Ddefinite articleأداة تعريف
2Rinterrogativeأداة استفهام
2Nconditionalأداة شرط
2Msimileأداة تشبيه
2Eemphasisأداة توكيد
2Xexclusionالاستثناء
2Iinterjection
2Spostposition
Symbolsالرموز
2Ppunctuationترقيم
2Ccurrencyعملة
2Mmathحساب
2Ddateتاريخ
2Ttimeوقت

acronymبادئة
abbreviationإختصار
Person, Number, Genderالضمائر والعدد والجنس
7, 101first personمتكلم
7, 102second personمخاطب
7, 103third personغائب
8, 11Ssingularمفرد
8, 11Ddualمثنى
8, 11Ppluralجمع
9, 12Mmasculineمذكر
9, 12Ffeminineمؤنث
9, 12Uunisexمستوي الجنس
9, 12Nneuterعديم الجنس

Msound masculine pluralجمع مذكر سالم
Fsound feminine pluralجمع مؤنث سالم
Lcollective nounإسم جمع
Umass nounاسم غير المعدود
Radicalsالجذور
rootجذر
soundصحيح
defectiveمعتل
triconsonontal rootجذر ثلاثي صحيح
quadriliteral rootجذر رباعي
Hamzatedجذر مهموز
geminatedجذر مضعف
Hollow verbفعل أجوف
Weakened verbفعل ناقص
Assimilated verbفعل مثال

Iinitialأولي
Mmedialوسطي
Ffinalطرفي
Ontologyالتكوين
negationالنفي
negativeمنفي
affirmativeمثبت
Ainanimateجماد
Ianimateحي
Ppairedمزدوج
Ooddفردي
Language varietiesاللهجات
13-1410Modern Standard Arabicالعربية الفصحى
Named Entitiesالمسميات
E1PERPersonشخص
E1LOCLocationموقع
E1ORGOrganizationمؤسسة
E1QTYQuantityكمية
E2FACFacilityمرفق
E2PPLPopulated Placeمكان مأهول
E2TTLTitleلقب
E2VNTEventحدث
E2NATPhenomenonظاهرة
E2LANLanguageلغة
E2DATDateتاريخ
E2TIMTimeوقت
E2NUMNumberرقم
E2PRCPercentنسبة
E2MONMoneyنقود
E2STRAstronomicalجرم
E2DISDiseaseمرض
E2ORDOrdinalترتيب
E2CRDCardinalعدد
E2GRPGroupمجموعة
E3PROProductمنتج
E3FAMFamousمشهور
E3MRKLandmarkمعلم
E3CORCorporationشركة

Home » MAPS » MAPS Semantics » Arabic Part of Speech Tagset

Category Software | Reference MSLTAG | Family MAPSEMANL | Last updated 19/12/2019