هل توحّد غوغل المصطلحات العربية العلمية؟
في أعقاب هجمات 11 سبتمبر/أيلول 2001، تزايد الاهتمام العالمي والأميركي بشكل خاص باللغة العربية، إذ أصبح من الضروري برأيهم مراقبة كل ما يكتب على صفحات الإنترنت بلغة الضاد.
تتوفر برمجيات للمراقبة الآلية باستخدام كلمات مفتاحية، لكن المهمة تتطلب الترجمة من العربية إلى الإنجليزية، وهي مهمة شبه مستحيلة إن أوكلت للبشر، خاصة مع تزايد كم الصفحات العربية التي تكتب أو يتم تبادلها عبر الإنترنت يوميا. ما الحل إذا؟ الترجمة الآلية من العربية إلى الإنجليزية.
وُجدت في ذلك الوقت عدة برمجيات للترجمة من العربية إلى الإنجليزية، منها “سيستران” و”بابل فيش” و”أي.بي.أم” و”صخر”، إلخ. ثم دخلت غوغل على الخط عام 2005 بنسخة تجريبية، وأصبح من الضروري إجراء مقارنات بين الترجمات المختلفة وبيان الأفضل منها. لكن عملية الاختبار معقدة ومكلفة، فمن سيمولها؟
تصدت الوكالة الأميركية لمشاريع البحوث المتقدمة التابعة لوزارة الدفاع (DARPA) لهذه المهمة، وهي التي سبق لها أن مولت الأبحاث التي أدت إلى ظهور شبكة الإنترنت، فكلفت بها المعهد الوطني للمعايير والتقنية (NIST)، المتخصص في تشجيع الابتكار من خلال تطوير علم القياس والمعايير الذي يعزز الأمن الاقتصادي الأميركي.
في عام 2005 أجرى المعهد المذكور اختبارا على عدة برمجيات للترجمة من العربية إلى الإنجليزية، وكانت المفاجأة باحتلال غوغل حديثة العهد في هذا المجال المرتبة الأولى، حيث تفوق برنامجها على برامج شركات عريقة مثل آي.بي.أم و”صخر” التي كانت قد بدأت أبحاثها في هذا المجال في منتصف التسعينيات.
أي.بي.أم من الشركات الرائدة التي اهتمت بالترجمة (رويترز)
ونال برنامج غوغل علامة قدرها 0.5137، في حين نال برنامج صخر علامة قدرها 0.3403 في اختبار أطلق عليه اسم “مسار البيانات غير المحدودة”.
أطلقت غوغل خدمة الترجمة من وإلى اللغة العربية رسميا في أبريل/نيسان 2006، واستخدمت المنهج الإحصائي، فوظفت كل النصوص العربية/الإنجليزية المتطابقة المتوفرة على شبكة الإنترنت لتدريب برنامج الترجمة من وإلى العربية.
ترجمة شعبية
ولم تكتف غوغل بالنصوص الرسمية كنصوص الأمم المتحدة والبنك الدولي والمنظمات الدولية الأخرى التي توفر نصوصا متطابقة باللغتين العربية والإنجليزية، بل استخدمت نصوص المواقع الحكومية والكتب المترجمة والنصوص الموجودة ضمن مواقع المؤسسات بكافة أشكالها، التجارية والإعلامية وغير الربحية، إن كانت متوفرة باللغتين العربية والإنجليزية.
وقد مكن ذلك غوغل من توظيف عشرات الملايين من أزواج الجمل العربية/الإنجليزية في تدريب برنامج الترجمة.
“معظم المطبوعات المتخصصة في تكنولوجيا المعلومات والاتصالات تستخدم كلمة “المخدم” كترجمة لمصطلح “سرفر” (Server)، لكن استخدام كلمة “خادم” أكثر انتشارا على الإنترنت، ولهذا فبرنامج غوغل للترجمة فضله على “مخدم” كونه يستخدم المنهج الإحصائي”
ونجم عن ذلك برنامج للترجمة من وإلى العربية، يمكن أن ينقل معنى النص في الكثير من الحالات، لكن لا يمكن الوثوق بنتائجه من دون مرجعية بشرية.
كما لا يمكن تداول النص إلا بعد إجراء تعديلات عميقة عليه، ومن المستبعد أن يقترب خلال المدى المنظور من مستوى الترجمة البشرية.
يمكن أن نطلق على الترجمة الآلية الإحصائية اسم الترجمة الآلية الشعبية، لأنها تعتمد المقابلات العربية الأكثر انتشارا على الإنترنت للكلمات والجمل الإنجليزية.
ومع ازدياد استخدام برنامج غوغل للترجمة من قبل المترجمين إلى اللغة العربية، تزداد إمكانية إحلال الترجمات الأكثر انتشارا للمصطلحات مكان الترجمات الأكثر دقة ورصانة.
فقبل عدة سنوات كان برنامج غوغل للترجمة يترجم مصطلح Automated Teller Machine أو ATM إلى “جهاز الصراف الآلي”، الآن أصبح يترجمه إلى “ماكينة الصراف الآلي”، لأن الأخير بات يتفوق من حيث عدد مرات الاستخدام عبر الإنترنت على مصطلح “جهاز الصراف الآلي”.
قبل سنوات، كنت أعمل على مشروع بحثي كبير لصالح إحدى الحكومات العربية، وكان المشروع يتضمن استبيانات طُلب منا أن نصممها باللغتين العربية والإنجليزية.
شركة مايكروسوفت تهتم أيضا بقطاع الترجمة وتنافس غوغل (رويترز)
بعد أن انتهينا من التصميم أرسلنا الاستبيانات إلى الفريق الحكومي المكلف بتدقيق ما نقوم به من أعمال. فوجئنا بعد عدة أيام بأن الفريق الحكومي وافق على النسخة الإنجليزية من دون تعديلات تذكر، لكنه أجرى تعديلات عديدة على النسخة العربية. وكانت معظم تلك التعديلات ركيكة.
استغربنا الأمر وتحرينا عنه فكانت المفاجأة كبيرة. قام المدقق الحكومي بإدخال أسئلة الاستبيان الموجودة في النسخة الإنجليزية إلى برنامج غوغل للترجمة، ثم قارن النتائج مع الأسئلة المطابقة في النسخة العربية، وقرر أن يعدل أسئلة النسخة العربية بما يتوافق مع ترجمة غوغل مع تعديلات بسيطة عليها، أي أنه وضع غوغل في مرتبة المدقق اللغوي.
فمثلا السؤال “كم عدد المخدمات لدى مؤسستكم؟” تم تعديله إلى “كم عدد الخوادم لدى المؤسسة الخاصة بكم؟”، وهو يكاد يطابق ما يعطيه برنامج غوغل للترجمة. وتكرر الأمر مع كافة أسئلة الاستبيان.
معظم المطبوعات المتخصصة في تكنولوجيا المعلومات والاتصالات تستخدم كلمة “المخدم” كترجمة لمصطلح “سرفر” (Server)، لكن استخدام كلمة “خادم” أكثر انتشارا على الإنترنت، ولهذا فبرنامج غوغل للترجمة فضله على “مخدم” كونه يستخدم المنهج الإحصائي.
لمسات عربية
كان أرسطو يقول: إن القلب هو مركز الأعصاب فهي تصعد منه وتهبط إليه. فأثبت أحد الجراحين الشبان في بداية عصر النهضة أن الدماغ وليس القلب هو مركز الأعصاب. وبيّن ذلك لأحد العلماء المتقدمين في السن والموالين لآراء أرسطو، من خلال تشريحه إحدى الجثث، فما كان من ذلك العالم إلا أن قال “لقد جعلتني أرى ذلك بوضوح، ولو لم يقل أرسطو غير ذلك لكنت صدقتك بالتأكيد”.
وآمل أن لا نصل إلى وضع مشابه يقول فيه المدقق اللغوي: لقد أقنعتني أن مصطلح “مخدم” هو المقابل المناسب لمصطلح “سرفر”، ولولا أن غوغل ترجمه إلى “خادم”، لكنت استخدمته بالتأكيد!
“اشتدت المنافسة في السنوات الأخيرة بين برامج الترجمة الآلية من وإلى اللغة العربية التي تستخدم المنهج الإحصائي، فبالإضافة إلى غوغل وآي.بي.أم، دخلت مايكروسوفت المنافسة من خلال محرك بحثها بينغ، كما دخلت المنافسة أيضا شركات أخرى”
من المفيد أن تتوفر اليوم إمكانية توحيد المقابلات العربية للمصطلحات الإنجليزية من خلال برنامج للترجمة الآلية، بعد أن فشلت مجامع اللغة العربية في القيام بذلك.
ولكن الأمر يتطلب استخدام أفضل القواميس العربية للمصطلحات، وهذا ممكن حيث توفر برامج الترجمة الآلية بما فيها برنامج غوغل إمكانية الاستعانة بقواميس.
هل ما زال المجال مفتوحا أمام مراكز الأبحاث العربية للعمل على تحسين الترجمة الآلية؟
اشتدت المنافسة في السنوات الأخيرة بين برامج الترجمة الآلية من وإلى اللغة العربية التي تستخدم المنهج الإحصائي، فبالإضافة إلى غوغل وآي.بي.أم، دخلت مايكروسوفت المنافسة من خلال محرك بحثها بينغ، ودخلت المنافسة أيضا شركات أخرى أهمها “فري ترانسليشن (freetranslation.com)، بل يدعي بعضها أن ترجمته أفضل من غوغل.
ويعود سبب احتدام المنافسة إلى احتدام الطلب على برامج الترجمة الآلية، بالإضافة إلى أنها لا تزال بعيدة جدا عن الدقة المطلوبة، ولا تزال بحاجة إلى أبحاث ودراسات واسعة في هذا المجال.
ولذلك فالاستثمار العربي في الترجمة الآلية من وإلى اللغة العربية لا يزال مطلوبا وبقوة.
ويمكن أن يتم من خلال مؤسسات بحثية عربية صرفة مدعومة من قبل الحكومات، أو من خلال التعاون بين جهات عربية وعالمية، كما هو حاصل بين مدينة الملك عبد العزيز للعلوم والتقنية وشركة آي.بي.أم في مشروعات بحثية كمشروع تطوير وتحسين الترجمة الآلية من اللغات الأخرى إلى اللغة العربية من خلال تقنيات عديدة كتعريب التركيبات اللغوية وإزالة اللبس بمعاني الكلمات.
علينا أن نمضي في هذا الطريق، سواء بمفردنا أو بالتعاون مع شركات عالمية، فمن دون فكر عربي ولمسات عربية، لا أعتقد أن الترجمة الآلية سوف ترقى إلى المستوى الذي نطمح إليه.
الجزيرة نت