قمنا بتصميم نظام تدقيق إملائي للويب يعمل كواجهة برمجية للتطبيقات (API). هذه الواجهة متوافرة حاليا كخدمة ويب سحابية (Cloud-based Web Service) وتعمل حاليا على الأنظمة السحابية لشركة أمازون الأمريكية (Amazon Web Services Cloud). يوفر نظامنا بشكل آلي ذكي اقتراحات لتصحيح الأخطاء الإملائية في النصوص التي يتم إدخالها عن طريق الويب مع أخذ الأخطاء الإملائية والصوتية الشائعة بعين الاعتبار.
يستخدم نظامنا معجما إلكترونيا ضخما يحوي 9 ملايين كلمة من كلمات اللغة العربية الفصحى الحديثة (Modern Standard Arabic) تم تجميعها من مصادر بيانات لغوية إلكترونية (Corpora) باستخدام تقنية الآلات الثنائية منتهية الحالات.(Finite State Transducers) تستخدم تقنية الآلات الثنائية منتهية الحالات بشكل واسع في مجال علم الحاسوب (Computer Science) وعلم اللغة الحاسوبي والمعالجة الحاسوبية للغة الطبيعية. يحوي معجمنا الإلكتروني للغة العربية الحديثة كلمات يستخدمها المتحدثون والكتاب في العصر الحديث في الكتب والصحف ووسائل الإعلام الأخرى. يحوي معجمنا الإلكتروني الخاص باللغة العربية الفصحى الحديثة عددا كبيرا من الكلمات الحديثة التي دخلت إلى اللغة العربية الفصحى والتي لا تحويها المعاجم التقليدية. تشتمل هذه الكلمات – على سبيل المثال- على المصطلحات والكلمات المتعلقة بالسياسة والعلوم إضافة إلى المصطلحات المسكوك (Coined-Terms). يحوي المعجم الإلكتروني لنظامنا الصيغ الصرفية والاشتقاقية (Inflected and Derived Forms) المحتملة لكلمات اللغة العربية الفصحى الحديثة (على سبيل المثال: كتب، ويكتبان، كتبوا، سيكتبن، كاتب، المكتوب.
يستطيع نظامنا أيضا اقتراح التصحيح الآلي للأخطاء الإملائية الشائعة باستخدام قوانين صوتية وإملائية سياقية (Context Sensitive Phonological and Orthographic Rules. تغطي هذه القوانين عددا كبيرا من الأخطاء الشائعة. على سبيل المثال، تغطي هذه القوانين الأخطاء التي تتسبب بها التغييرات الصوتية الخاطئة (Phonological Alternations) مثل تغيير الصيغة الصحيحة “تضاعف” إلى الصيغة الخاطئة “تظاعف”. تتعامل هذه القوانين أيضا مع الأخطاء التي تتسبب بها الأخطاء الكتابية (Orthographic Typos) مثل تغيير الصيغة الصحيحة “مسائل” إلى الصيغة الخاطئة “مساءل”. إضافة إلى ذلك، تأخذ هذه القوانين بعين الاعتبار الأخطاء الإملائية والصوتية الشائعة والتي قد يتسبب بها تأثير اللهجات العامية مثل تغيير الصيغة الصحيحة “خسائر” إلى “خساير“.
يمكن أيضا استخدام نظامنا كواجهة برمجية للتطبيقات (Rest API) لتطوير استراتيجيات خاصة للتدقيق الإملائي للويب. كما يمكن استخدام هذه الواجهة للتدقيق الإملائي لأنظمة قواعد البيانات ومحركات البحث (Search Engines). يمكن أيضا استخدام هذه الواجهة كمكون من مكونات تطبيقات الويب وتطبيقات الأجهزة الذكية عن طريق استخدامها للتعرف على الاستفسارات المدخلة بشكل خاطئ إضافة إلى إعطاء الاقتراحات التي تحوي التهجئة الصحيحة للأخطاء. على سبيل المثال، في حال قيام المستخدم بإدخال استفسار يحوي كلمة غير صحيحة إملائيا إلى أحد تطبيقات الويب، يمكن أن يقوم نظامنا بالبحث عن أقرب كلمة صحيحة تقابل هذه الكلمة ثم التأكد من وجود سجل فعلي في قاعدة بيانات التطبيق يقابل هذه الكلمة القريبة ليقوم النظام بعد ذلك باقتراح هذا السجل كسجل محتمل للاستفسار الخاطئ. كما يمكن أيضا استخدام نظامنا كواجهة برمجية للتطبيقات تتم الاستفادة منها في أنظمة تحليل النصوص (Text Analytics) للتعامل مع اللغة العربية.
تجدر الإشارة إلى أن شركة WebSpellCheker الأمريكية ومقرها ولاية سياتل قامت بشراء نظامنا للتدقيق الإملائي للغة العربية. تم دمج نظامنا في منتجات WebSpellCheker للتدقيق الإملائي والتي توفر التدقيق الإملائي عن طريق الويب للغات العالم. وفي إطار التسويق للنظام، قامت شركة WebSpellCheker بنشر هذا الإعلان عن مزايا نظامنا: