Personal Names Retriever

Synopsis

The Personal Names Retriever is one of the MAPS suite for onomastics, a productivity tool for transcribed personal names retrieval, the system retrieves back the original names in theie native sripts using multi-tier algorithm to re-generate back each name based on the morphology and minimal hints from the user.

Information

Reference: MOLREV

Last updated: 14/1/2023

Preview
(A) Retrieving Romanized Names

A reversible name transcription system is not easy to accomplish, the name's inherent orthographic characteristics are totally lost when exported to another language. This is a major challenge for information retrieval systems utilized in CLIR applications.

No matter how bad the changes distorted the original orthography our system will reproduce the original name in native script thus improving the accuracy of name searching, transliteration, and the quality of identity verification initiatives by providing high accuracy ranked results, based on the linguistic, phonetic, and specific cultural variation patterns of the names.

It utilizes a rule engine that represents ample information related to the specific culture of a set of names and utilizes these rules to perform the best reverse-transcription. Please refer to Kalmasoft Arabic Transliteration System here KATS.

Retriever functional diagram

Name Retriever

Sample output
ID Latin KATS Arabic Vocalized Gender Type Variants
10 Abdulaziz obd Alozyz عبد العزيز عَبْدُ الْعَزِيز M
20 Akram !krm أكرم أَكْرَم M
31 Alharbi AlHrby الحربي الْحَرْبِي M
32 Al-Harby AlHrby الحربي الْحَرْبِي M
33 El Harbi AlHrby الحربي الْحَرْبِي M
41 Alhusaini AlHsyny الحسيني الْحُسَيْنِي M
42 El-Husayni AlHsyny الحسيني الْحُسَيْنِي M
43 Al-Hussaini AlHsyny الحسيني الْحُسَيْنِي M
44 El-Husseiny AlHsyny الحسيني الْحُسَيْنِي M
51 Alfarraj Alfrj الفرج الْفَرَج M الْفَرَّاج
52 Alfaraj Alfrj الفرج الْفَرَج M
61 Alnasrallah AlnSrAllh النصر الله الْنَّصْر الله M
62 Alnassralla AlnSrAllh النصر الله الْنَّصْر الله M
71 Alnuman AlnomAn النعمان الْنُّعْمان M
81 Rashyd r$yd رشيد رَشِيد M راشِد
82 Rashid r$yd رشيد رَشِيد M راشِد
83 Rachid r$yd رشيد رَشِيد M Fr راشِد
84 Rechid r$yd رشيد رَشِيد M راشِد
91 Khalidah KAld: خالدة خالِدة F
92 Jalida KAld: خالدة خالِدة F Sp
101 Alssakkaf AlsqAf السقاف السَّقَّاف M
102 Alsakaf AlsqAf السقاف السَّقَّاف M
103 Elsagaf AlsqAf السقاف السَّقَّاف M
104 Al-Saqqaf AlsqAf السقاف السَّقَّاف M
111 AAmna |mn: آمنة آمِنة F
112 Aminah |mn: آمنة آمِنة F
113 Aminah |mn: آمنة آمِنة F أَمِينَة
114 Amnah |mn: آمنة آمِنة F
121 Amro omrw عمرو عَمْرُو M
122 Amrou omrw عمرو عَمْرُو M Fr
131 Anasanas AlnsnAs النسناس الْنَّسْناس M
132 Alnasnas AlnsnAs النسناس الْنَّسْناس M
141 Anwar !nwr أنور أَنْوَر M
142 Anwer !nwr أنور أَنْوَر M Fr
151 Aqeel oqyl عقيل عَقِيل M
152 Aqyl oqyl عقيل عَقِيل M
153 Agiil oqyl عقيل عَقِيل M
161 Asem oAsm عاصم عَاصِم M
162 Aasim oAsm عاصم عَاصِم M
171 Hassan Hsn حسن حَسَن M حَسَّان
172 Hasan Hsn حسن حَسَن M
181 Ibrahim EbrAhym إبراهيم إبراهيم M
182 Ibrahem EbrAhym إبراهيم إبراهيم M
191 Jamaan jmoAn جمعان جَمْعان M
201 Jawad jwAd جواد جَوَّاد M جَوَاد
202 Jawwad jwAd جواد جَوَّاد M
203 Jaouad jwAd جواد جَوَّاد M Fr
211 Mohammed mHmd محمد مُحَمَّد M Fr
212 Muhammad mHmd محمد مُحَمَّد M
213 Mohamad mHmd محمد مُحَمَّد M
221 Otaibi otyby عتيبي عُتَيْبِي M
222 Utaybi otyby عتيبي عُتَيْبِي M
223 Otaiby otyby عتيبي عُتَيْبِي M
224 Outaiby otyby عتيبي عُتَيْبِي M Fr
231 Thabit xAbt ثابت ثابِت M
240 Rajih rAjH راجح راجِح M
251 Abubaker !bwbkr أبوبكر أَبُوبَكْر M
261 Abubakr !bwbkr أبوبكر أَبُوبَكْر M
262 Abu-Baker !bwbkr أبوبكر أَبُوبَكْر M
271 Waliid wlyd وليد وَلِيد M
272 Walyd wlyd وليد وَلِيد M
273 Oualid wlyd وليد وَلِيد M Fr
274 Waleed wlyd وليد وَلِيد M

(B) Retrieving transcribed Latin

Based on an industry-leading technology, it helps you recognize non-Latin names written in native language script, screen potential threats, and perform background checks across multiple geographies and cultures. This system actually does a relatively easier task since non-Latin scripts tend to maintain most of the phonetic characteristics of other non-Latin names. The system regenerates the name and optionally reproduces native script in a ranked output.

This system is targeting NLP use cases like text mining, MT, Arabic POS tagging systems, Named Entity Recognition and extraction, and information retrieval systems in general.

Please refer to Kalmasoft Arabic Transliteration System here KATS.

ID Arabic KATS Roman Type Script Variants
10 أوباما !wbAmA Obama
20 أوبنهايمر !wbnhAymr Obenheimer
30 خوليو Kwlyw Julio Julio
41 ليئة lye: Leah לאה
42 ليا lyA Leah
50 عامير &Amyr Amir אמיר
60 نفتالي nftAly Naftali נפתלי
71 روبيرت rwbyrt Robert
72 روبرت rwbrt Robert
81 مكنيلي mknyly McNealy
82 ماكنلي mAknly McKinley
90 لينين lynyn Lenin Ленин
100 جيمس jyms James
110 جون jwn John
121 أداموفيتش !dAmwfyt$ Adamovich Aдamobыщ Adamowic, Adamovic
122 آداموفيتش |dAmwfyt$ Adamovich
131 أدامز !dAmz Adams
132 أدامس !dAms Adams
133 آدامس |dAms Adams
134 آدامز |dAmz Adams
140 أدريان !dryAn Adrienne
151 ديفيد dyfyd David
152 دافيد dAfyd David
161 جيرهارد jyrhArd Gerhard
162 غيرهارد gyrhArd Gerhard
171 أدلر !dlr Adler
172 آدلر |dlr Adler
181 رافايل rAfAyl Rafael
182 رافاييل rAfAyyl Rafael
190 أرنولد !rnwld Arnold Arnauld
201 أرنو !rnw Arnault
202 آرنو |rnw Arnault
211 ستيف styf Steve
212 استيف Astyf Steve
213 اسطيف AsTyf Steve
221 ستيفن styfn Stephen Steven
222 استيفان AstyfAn Stephen
223 اسطيفان AsTyfAn Stephen
231 مايكل mAykl Michael
232 ميشيل my$yl Michael Michelle
233 ميخايل myKAyl Michael
234 ميخائيل myKAeyl Michael
235 ميكائيل mykAeyl Michael
240 موريس mwrys Maurice Morris
251 برنارد brnArd Bernard
252 برنار brnAr Bernard
261 ألبرت !lbrt Albert
262 ألبيرت !lbyrt Albert
263 آلبرت |lbrt Albert
271 كرستوفر krstwfr Christopher
272 كريستوفر krystwfr Christopher