التعرف على الترجمة الآلية العصبية

تعرف على كيفية عمل الترجمة الآلية العصبية بمصطلحات بسيطة. تقنية الذكاء الاصطناعي التي تقف وراء تطبيقات الترجمة الحديثة.

Linguin Team
A large group of colorful balls floating in the air
Photo by BoliviaInteligente on Unsplash

إذا كنت قد استخدمت تطبيق ترجمة في السنوات الخمس الماضية، فأنت قد استخدمت الترجمة الآلية العصبية. فهي القوة الدافعة وراء Google Translate وDeepL وApple Translate وLinguin. معظم المستخدمين ليس لديهم أدنى فكرة عن ماهية هذه التقنية أو لماذا تنتج مخرجات أفضل بكثير من برامج الترجمة الخرقاء التي سبقتها.

تشرح هذه المقالة الترجمة الآلية العصبية من الأساسيات — ما هي، وكيف تعمل، ولماذا هي مهمة، وماذا تعني لأدوات الترجمة التي تستخدمها يومياً. لا تحتاج إلى خلفية في التعلم الآلي.

المشكلة التي كان على أنظمة الترجمة حلها

اللغة البشرية ليست شيفرة حيث ترتبط كل كلمة في لغة ما بكلمة مقابلة في لغة أخرى. للكلمات معانٍ متعددة تعتمد على السياق. يختلف هيكل الجملة اختلافاً جذرياً بين اللغات. بعض المفاهيم موجودة في لغة ولا يوجد ما يعادلها في لغة أخرى. التعابير الاصطلاحية تعني شيئاً مختلفاً تماماً عما قد توحي به الكلمات المكونة لها.

حاولت أنظمة الترجمة الحاسوبية المبكرة التعامل مع هذا بواسطة قواعد صريحة. كان اللغويون يكتبون آلاف القواعد النحوية وخرائط الكلمات: إذا ظهر هذا الاسم الفرنسي في هذا الموضع النحوي، استخدم هذا المكافئ الإنجليزي، ثم طبق هذا التحويل. كانت الأنظمة هشة. اللغات لديها الكثير من الاستثناءات، واعتماد كبير على السياق، وتنوع اصطلاحي كبير لا يمكن لأي مجموعة قواعد محدودة أن تلتقطه.

حسّنت أنظمة الترجمة الإحصائية من النُهج القائمة على القواعد من خلال تعلم الأنماط من مجموعات كبيرة من النصوص المتوازية — وهي وثائق موجودة بلغة المصدر واللغة الهدف، مثل محاضر البرلمان الأوروبي المنشورة بـ 24 لغة. كان النهج الإحصائي أفضل من القواعد، لكنه كان يترجم عبارات قصيرة بمعزل عن السياق دون فهم كيف يتغير المعنى عبر الجمل الطويلة. كانت المخرجات غالباً صحيحة تقنياً كلمة بكلمة لكنها غير متماسكة ككل.

استبدلت الترجمة الآلية العصبية كلا النهجين بشيء مختلف جوهرياً: شبكة عصبية تتعلم الترجمة من خلال معالجة كميات هائلة من النصوص وتطوير تمثيل داخلي لكيفية تعيين المعنى عبر اللغات.

كيف تعمل الترجمة الآلية العصبية: المدخلات، المُشفر، آلية الانتباه، المخرجات

الفكرة الأساسية: ترميز المعنى، ثم فك تشفيره

الهيكل الأصلي للترجمة الآلية العصبية يتكون من مكونين يعملان بالتتابع:

المُشفر يقرأ جملة المصدر بأكملها — لنقل، جملة بالإسبانية — ويحولها إلى تمثيل رقمي كثيف. فكر في هذا على أنه ملخص رياضي مضغوط لمعنى الجملة. لا ينتج المُشفر أي مخرجات مترجمة؛ إنه فقط يبني تمثيلاً داخلياً غنياً لما تعنيه المدخلات.

فك التشفير يأخذ هذا التمثيل الداخلي ويولد جملة المخرجات في اللغة الهدف، كلمة تلو الأخرى. كل كلمة ينتجها تعتمد على كل من المعنى المشفر للمصدر والكلمات التي أنتجها بالفعل.

التقدم الحاسم مقارنة بالترجمة الإحصائية كان أن المُشفر يعالج جملة المصدر بأكملها كوحدة واحدة قبل بدء الترجمة. النظام لا يترجم كلمة بكلمة أو عبارة بعبارة بالتتابع؛ إنه يفهم الجملة الكاملة أولاً، ثم يعبر عن هذا الفهم بلغة أخرى.

آلية الانتباه: النظر إلى الكلمات الصحيحة

حل هيكل المُشفر/فك التشفير مشكلة الفهم الشمولي لكنه أدخل مشكلة جديدة: ضغط جملة كاملة في متجه رقمي واحد بحجم ثابت يتخلص من المعلومات. بالنسبة للجمل القصيرة، كان هذا يمكن التحكم فيه. بالنسبة للجمل الطويلة — النوع الذي يظهر في الوثائق القانونية والكتابة التقنية والنثر الأدبي — كانت التفاصيل المهمة تضيع.

آلية الانتباه، التي تم تقديمها في الأبحاث عام 2015، حلّت هذا. بدلاً من الاعتماد على متجه مضغوط واحد، يُسمح لفك التشفير بالنظر إلى أجزاء مختلفة من جملة المصدر المشفرة أثناء توليد كل كلمة من المخرجات. عند توليد الكلمة الإنجليزية “bank”، يمكن للنموذج أن ينتبه إلى ما إذا كانت الكلمات الإسبانية المحيطة تشير إلى مؤسسة مالية أو ضفة نهر. عند توليد ضمير، يمكنه الانتباه إلى الاسم الذي يشير إليه سابقاً في الجملة.

حوّلت آلية الانتباه أداء الترجمة الآلية العصبية على الجمل المعقدة والطويلة. أصبحت المخرجات متماسكة عبر الفقرات وليس فقط داخل الجمل الفردية.

المحولات (Transformers): الهيكل المعماري وراء الترجمة الحديثة

في عام 2017، نشر الباحثون هيكل المحولات (Transformer) — وهو تصميم نموذج يعتمد بالكامل على آليات الانتباه، ويعالج التسلسل الكامل بالتوازي بدلاً من معالجة الرمز تلو الآخر. مكّن هذا التصميم من التدريب على كميات أكبر بكثير من البيانات بكفاءة أعلى من أي نهج سابق.

كل نظام ترجمة رئيسي اليوم — بما في ذلك النماذج التي تشغل Linguin — يعتمد على هيكل المحولات (Transformer) الذي تم تكبيره بمزيد من المعاملات، ومزيد من بيانات التدريب، وتحسينات معمارية طورت على مر السنوات منذ نشر الورقة البحثية الأصلية.

ما يميز أفضل نماذج الترجمة الحديثة ليس الحجم فقط بل منهجية التدريب. النماذج المُحسّنة على بيانات خاصة بمجال معين تترجم المحتوى التقني أفضل من النماذج العامة. النماذج المدربة بتغذية راجعة بشرية تكون معايرة بشكل أفضل على الطبيعة الطبيعية والسجل اللغوي. النماذج التي تعالج نوافذ سياق أطول تحافظ على التماسك بشكل أفضل عبر الوثائق متعددة الفقرات.

مقارنة بين الترجمة القديمة القائمة على القواعد والترجمة العصبية بالذكاء الاصطناعي الحديثة

لماذا تبدو الترجمة العصبية أكثر طبيعية

التحسن من الترجمة الإحصائية إلى العصبية يكون أكثر وضوحاً في طبيعة المخرجات. كانت الترجمة الإحصائية تنتج جملًا كانت غالباً صحيحة تقنياً على مستوى الكلمة لكنها غير طبيعية كنثر — النوع من المخرجات الذي يقرأ كما لو أنه ترجم بواسطة آلة.

الترجمة العصبية تنتج مخرجات تقرأ كما لو كتبها شخص. الأسباب:

الوعي بالسياق. يفهم النموذج أن “cold” في “cold weather” و “cold” في “cold treatment” تتطلبان ترجمتين مختلفتين بناءً على السياق المحيط. كانت الأنظمة الإحصائية تترجم “cold” بناءً على إحصائيات التكرار؛ الأنظمة العصبية تترجمها بناءً على المعنى.

التماسك النحوي. تحافظ النماذج العصبية على التوافق عبر الجمل بأكملها. عندما يتطلب فاعل ما صيغة فعل معينة بعد عدة كلمات، يتعامل النموذج معها بشكل صحيح لأنه يعالج الجملة الكاملة كوحدة.

مخرجات اصطلاحية. تم تدريب النموذج على كتابة بشرية طبيعية وينتج كتابة بشرية طبيعية. بدلاً من تقديم كل عبارة وفقاً للقواعد وربط النتائج معاً، فإنه يولد المخرجات مباشرة، وهذه المخرجات تبدو كما لو كُتبت وليس كما لو رُكّبت.

حساسية السجل اللغوي. تميز النماذج العصبية الحديثة بين السجلات الرسمية وغير الرسمية والتقنية والعادية وتطابق سجل النص المصدر في الترجمة. فقرة قانونية رسمية تترجم إلى نثر رسمي في اللغة الهدف؛ منشور عادي على وسائل التواصل الاجتماعي يترجم إلى نثر عادي في اللغة الهدف.

كيف ينطبق هذا على Linguin

تستخدم Linguin نماذج محولات (Transformer) واسعة النطاق مُحسّنة لأنواع المحتوى التي يترجمها المستخدمون فعلياً: صفحات الويب، والأخبار، والمستندات، والمراسلات، والأبحاث. يتضمن خط أنابيب النموذج السياق من الجمل المحيطة عند الترجمة داخل المستندات، ولهذا تبدو الترجمة طويلة النص في Linguin أكثر تماسكاً من الأدوات التي تترجم جملة بجملة.

يتم تحديث التقنية باستمرار. تحسنت جودة نماذج الترجمة كل عام منذ أن أصبحت النهج العصبية مهيمنة، ولم يتباطأ معدل التحسن. ما تستخدمه Linguin اليوم أفضل بشكل ملموس مما كان متاحاً قبل عامين، والنماذج التي ستعمل بعد عامين من الآن ستكون أفضل بشكل ملموس مرة أخرى.

النتيجة العملية للمستخدمين هي أن الترجمة التي تحصل عليها من أداة مدعومة بالذكاء الاصطناعي اليوم تختلف جوهرياً في الجودة عما عنته “الترجمة الآلية” تاريخياً. وصمة العار المرتبطة بالمخرجات الآلية غير الموثوقة تأتي من جيل سابق من التكنولوجيا. نقلت الترجمة الآلية العصبية المعيار إلى النقطة التي أصبحت فيها المخرجات، بالنسبة لمجموعة واسعة من المحتوى اليومي، جيدة حقاً.

للحصول على نظرة مفصلة عن مدى دقة ترجمة الذكاء الاصطناعي الحديثة عبر اللغات وأنواع المحتوى، راجع دليل دقة ترجمة الذكاء الاصطناعي 2026. للتطبيقات العملية — بما في ذلك كيفية استخدام هذه الأدوات لتعلم اللغات — راجع دليلنا لتعلم اللغات باستخدام مترجم الذكاء الاصطناعي.