هوش مصنوعی نمیتواند مترجم خیلی خوبی باشد!
مقالات اقتصاد جهانی
بزرگنمايي:
بازار آریا - مترجم: سیدحسین علوی لنگرودی alavitarjomeh@gmail.com اگر قرار باشد برای ترجمه مطالب از ماشین استفاده کنید، بهترین راه برای آموزش آن چیست؟ اگر بخواهید برای این کار برنامه هوش مصنوعی روانشناسانه را دنبال کنید، لازم است تعدادی از مترجمان حرفهای و کاربلد را در یک اتاق دور هم جمع کرده و تلاش کنید ادراک و دانش آنها در زمینه ترجمه را به تعدادی قانون و دستورالعمل مرتبط با چگونگی فهم و تفسیر متون تبدیل کنید و در قالب یک نرمافزار واحد درآورید. اما تجربه نشان داده است که این ترفند کارگر نمیافتد؛ چراکه زبان یک سیستم تشکیلشده از یکسری قواعد تعریفشده و قطعی نیست.
در واقع لغات دارای یک معنی واحد نیستند، بلکه معانی مختلف و متفاوتی دارند که با توجه به متن و موقعیت آنها در جملات، یکی از آنها بهعنوان معنی درست انتخاب و استفاده میشود. بنابراین فقط نمیتوان با جستوجوی معنی یک لغت در دیکشنری به نتیجه رسید، بلکه باید بر اساس جمله و همچنین با توجه به شناختی که از نویسنده یا گوینده وجود دارد در مورد معنی کلمات تصمیم گرفت.
حال اگر بخواهیم هنر مترجمان را نادیده گرفته و از ماشینها برای ترجمه کمک بگیریم، چارهای جز کمک گرفتن از مهندسان نرمافزار برای جمعآوری و تحلیل میلیونها لغت و جمله و استخراج یکسری قواعد و قوانین مخصوص ترجمه نخواهیم داشت. تا اواخر دهه 1980 پیشرفت چندانی در زمینه ترجمه ماشینی صورت نگرفت و بسیاری از نهادها و دولتها سرمایهگذاری در این زمینه را بیهوده و مسخره میدانستند.
داستان خندهداری در مورد ترجمه ماشینی وجود دارد که اغلب مخالفان این نوع ترجمه، آن را نقل میکنند: در اواخر دهه 1990 که گامهای اولیه در زمینه طراحی برنامههای کامپیوتری ترجمه برداشته شد، تیتر اول یک روزنامه برای ترجمه به کامپیوتر داده شد که میگفت:
POP SHOT. WORLD SHAKEN
در آن زمان کامپیوتر این جمله را اینگونه ترجمه کرد: زلزله در ایتالیا. یک نفر مرد
جالب است بدانید همین جمله را در سال 2020 که پیشرفتهای بسیار خوبی در زمینه ترجمه ماشینی تا آن زمان به وقوع پیوست گوگل ترنسلیت این گونه معنی کرد: پاپ فریاد زد. دنیا تکان خورد.
در این جمله ما با کلمهای مواجه هستیم به نام SHOT که دارای دو معنی اصلی در انگلیسی است: یکی شلیک کردن و دوم فریاد زدن. حال اگر ماشین این جمله را بهصورت «پاپ شلیک کرد. دنیا تکان خورد» یا «پاپ فریاد زد. دنیا تکان خورد» ترجمه کند، به ظاهر ترجمه درستی صورت گرفته است.
حال آنکه بر اساس استدلال انسانی معقول به نظر نمیرسد که دنیا به خاطر فریاد زدن پاپ بر سر یک نفر به هم بریزد و تکان بخورد. علاوه بر این چندان معقول و منطقی به نظر نمیرسد که فردی مثل پاپ به فردی دیگر شلیک کند و چنین اقدامی از پاپ بعید به نظر میرسد. اما مترجم میداند آنچه میتواند دنیا را شوکه کند و تکان دهد شلیک به پاپ و سوءقصد به جان اوست و بنابراین ترجمه درست تیتر بالا توسط یک انسان میتواند این باشد: «سوء قصد به پاپ، دنیا را تکان داد.»
برای حل ابهام و چندمعنایی در ترجمه به عقل سلیم نیاز است. فقدان عقل سلیم یکی از مشکلات اصلی تمام سیستمهای ترجمه محسوب میشود.
با این همه، تلاشهای زیادی انجام شده است تا این نقیصه برطرف شود و ترجمه ماشینی به شکل معنادارتری صورت پذیرد. به عنوان مثال، سیستم ترجمه DeepL که بهعنوان یکی از قدرتمندترین و کمنقصترین سیستمهای ترجمه در جهان شناخته میشود، بهگونهای طراحی شده است که میتواند توالیهای لغات و همچنین معنی کل جملاتی را که قرار است با هم ترجمه شوند
در نظر بگیرد و فقط به دنبال ترجمه کلمه به کلمه و با کمک دیکشنری نباشد. بهعنوان نمونه، DeepL جمله مورد اشاره در قسمت بالا را این گونه ترجمه کرده است: «شلیک به پاپ دنیا را تکان داد» که ترجمه خوبی به نظر میرسد.
این پیشرفت در نگاه اول یک جهش بزرگ و امیدوارکننده به نظر میرسد که تا حدی چنین نیز هست. اما برای ترجمه مطلوب توسط ماشین کافی نیست، چراکه در اینجا هم اتکای ماشین برای ترجمه سایر لغات و جملات همان دادههای موجود در اینترنت یا همان ترجمههای احتمالا نادرستی است که از آن لغات و جملات وجود دارد. همین ترجمههای بیکیفیت و نادرست است که کیفیت ترجمه نهایی انجامشده توسط ماشینهایی مانند DeepL را کاهش میدهد. در واقع باید گفت اگرچه برنامههای ترجمه امروزی خیلی خوب و موفق هستند و کیفیت بسیار خوبی دارند؛ اما این به آن معنا نیست که عقل سلیم دارند. زبانهای طبیعی برخلاف زبانهای منطقی دارای منابع مختلف ابهام و پوشیدگی هستند که یکی از این منابع ابهام در زبانهای طبیعی وجود چندمعنایی در آنهاست. همه ما میدانیم که یک کلمه واحد میتواند دارای معانی متعددی باشد که باتوجهبه موقعیت و با استفاده از عقل سلیم باید یکی از آنها را انتخاب و استفاده کرد. بهعنوان مثال، به جمله زیر که نمونهای است از پیامد نبود عقل سلیم در ترجمه ماشینی توجه کنید:
Little John was looking for his toy box. Finally, he found it. The box was in the pen. John was very happy.
تمام کسانی که با زبان انگلیسی آشنایی دارند یک ترجمه رایج و بسیار پرکاربرد از کلمه pen را در ذهن دارند که همان خودکار است که البته میتوان فهمید این معنی کلمه pen نمیتواند در این جمله به کار گرفته شود، چرا که جعبه اسباببازی جان که ابعاد بزرگی دارد نمیتواند در داخل یک خودکار کوچک قرار داشته باشد.
در واقع معنی کمتر شناختهشده و کمکاربرد کلمهpen یعنی محوطه یا چهاردیواری کوچک در این جمله باید مدنظر باشد که این تشخیص با کمک عقل سلیم اتفاق میافتد. اما اگر از برنامههای ترجمه خواسته شود جمله بالا را ترجمه کنند، خروجی کار چندان خوب از آب درنمیآید؛ چراکه اغلب برنامهها ترجمه «جعبه در داخل خودکار بود» را پیشنهاد میدهند که ترجمهای بیمعنی و کاملا غلط است. البته وقتی این جمله برای ترجمه به برنامه DeepL داده شد، طبق انتظار ترجمه ظاهرا بهتری پیشنهاد شد: «جعبه در آغل بود.» اما مشکل این ترجمه به کلمه آغل مربوط میشود که جایی است برای نگهداری گوسفندان و وجود جعبه اسباببازی بچهها در آنجا بر اساس عقل سلیم چندان معقول و منطقی به نظر نمیرسد.
منبع: کتاب The age of AI: and our human future
-
دوشنبه ۱۰ دي ۱۴۰۳ - ۰۰:۱۴:۱۳
-
۲۱ بازديد
-
روزنامه دنیای اقتصاد
-
بازار آریا
لینک کوتاه:
https://www.bazarearya.ir/Fa/News/1237699/