بازار آریا

آخرين مطالب

هوش مصنوعی نمی‌تواند مترجم خیلی خوبی باشد! مقالات اقتصاد جهانی

هوش مصنوعی نمی‌تواند مترجم خیلی خوبی باشد!
  بزرگنمايي:

بازار آریا - مترجم: سید‌حسین علوی لنگرودی alavitarjomeh@gmail.com اگر قرار باشد برای ترجمه مطالب از ماشین استفاده کنید، بهترین راه برای آموزش آن چیست؟ اگر بخواهید برای این کار برنامه هوش مصنوعی روان‌شناسانه را دنبال کنید، لازم است تعدادی از مترجمان حرفه‌‌‌ای و کاربلد را در یک اتاق دور هم جمع کرده و تلاش کنید ادراک و دانش آنها در زمینه ترجمه را به تعدادی قانون و دستورالعمل مرتبط با چگونگی فهم و تفسیر متون تبدیل کنید و در قالب یک نرم‌‌‌افزار واحد درآورید. اما تجربه نشان داده است که این ترفند کارگر نمی‌‌‌افتد؛ چراکه زبان یک سیستم تشکیل‌شده از یک‌سری قواعد تعریف‌شده و قطعی نیست.
در واقع لغات دارای یک معنی واحد نیستند، بلکه معانی مختلف و متفاوتی دارند که با توجه ‌‌‌به متن و موقعیت آنها در جملات، یکی از آنها به‌‌‌عنوان معنی درست انتخاب و استفاده می‌شود. بنابراین فقط نمی‌توان با جست‌‌‌وجوی معنی یک لغت در دیکشنری به نتیجه رسید، بلکه باید بر اساس جمله و همچنین با توجه ‌‌‌به شناختی که از نویسنده یا گوینده وجود دارد در مورد معنی کلمات تصمیم گرفت.
حال اگر بخواهیم هنر مترجمان را نادیده گرفته و از ماشین‌‌‌ها برای ترجمه کمک بگیریم، چاره‌‌‌ای جز کمک‌‌‌ گرفتن از مهندسان نرم‌‌‌افزار برای جمع‌‌‌آوری و تحلیل میلیون‌‌‌ها لغت و جمله و استخراج یک‌سری قواعد و قوانین مخصوص ترجمه نخواهیم داشت. تا اواخر دهه 1980 پیشرفت چندانی در زمینه ترجمه ماشینی صورت نگرفت و بسیاری از نهادها و دولت‌‌‌ها سرمایه‌گذاری در این زمینه را بیهوده و مسخره می‌‌‌دانستند.
داستان خنده‌داری در مورد ترجمه ماشینی وجود دارد که اغلب مخالفان این نوع ترجمه، آن را نقل می‌کنند: در اواخر دهه 1990 که گام‌‌‌های اولیه در زمینه طراحی برنامه‌‌‌های کامپیوتری ترجمه برداشته شد، تیتر اول یک روزنامه برای ترجمه به کامپیوتر داده شد که می‌‌‌گفت:
POP SHOT. WORLD SHAKEN
در آن زمان کامپیوتر این جمله را این‌‌‌گونه ترجمه کرد: زلزله در ایتالیا. یک نفر مرد
جالب است بدانید همین جمله را در سال 2020 که پیشرفت‌‌‌های بسیار خوبی در زمینه ترجمه ماشینی تا آن زمان به وقوع پیوست گوگل ترنسلیت این گونه معنی کرد: پاپ فریاد زد. دنیا تکان خورد.
در این جمله ما با کلمه‌‌‌ای مواجه هستیم به نام SHOT که دارای دو معنی اصلی در انگلیسی است: یکی شلیک ‌‌‌کردن و دوم فریاد زدن. حال اگر ماشین این جمله را به‌‌‌صورت «پاپ شلیک کرد. دنیا تکان خورد» یا «پاپ فریاد زد. دنیا تکان خورد» ترجمه کند، به ‌‌‌ظاهر ترجمه درستی صورت‌‌‌ گرفته است.
حال ‌‌‌آنکه بر اساس استدلال انسانی معقول به نظر نمی‌رسد که دنیا به ‌‌‌خاطر فریاد زدن پاپ بر سر یک نفر به هم بریزد و تکان بخورد. علاوه بر این چندان معقول و منطقی به نظر نمی‌رسد که فردی مثل پاپ به فردی دیگر شلیک کند و چنین اقدامی از پاپ بعید به نظر می‌‌‌رسد. اما مترجم می‌‌‌داند آنچه می‌تواند دنیا را شوکه کند و تکان دهد شلیک به پاپ و سوءقصد به جان اوست و بنابراین ترجمه درست تیتر بالا توسط یک انسان می‌تواند این باشد: «سوء قصد به پاپ، دنیا را تکان داد.»
برای حل ابهام و چندمعنایی در ترجمه به عقل سلیم نیاز است. فقدان عقل سلیم یکی از مشکلات اصلی تمام سیستم‌های ترجمه محسوب می‌شود.
با این ‌‌‌همه، تلاش‌‌‌های زیادی انجام شده است تا این نقیصه برطرف شود و ترجمه ماشینی به شکل معنادارتری صورت پذیرد. به‌‌‌ عنوان ‌‌‌مثال، سیستم ترجمه DeepL که به‌‌‌عنوان یکی از قدرتمندترین و کم‌‌‌نقص‌‌‌ترین سیستم‌های ترجمه در جهان شناخته می‌شود، به‌‌‌گونه‌‌‌ای طراحی شده است که می‌تواند توالی‌‌‌های لغات و همچنین معنی کل جملاتی را که قرار است با هم ترجمه شوند
در نظر بگیرد و فقط به دنبال ترجمه کلمه ‌‌‌به ‌‌‌کلمه و با کمک دیکشنری نباشد. به‌‌‌عنوان نمونه، DeepL جمله مورد اشاره در قسمت بالا را این گونه ترجمه کرده است: «شلیک به پاپ دنیا را تکان داد» که ترجمه خوبی به نظر می‌‌‌رسد.
این پیشرفت در نگاه اول یک جهش بزرگ و امیدوارکننده به نظر می‌رسد که تا حدی چنین نیز هست. اما برای ترجمه مطلوب توسط ماشین کافی نیست، چراکه در اینجا هم اتکای ماشین برای ترجمه سایر لغات و جملات همان داده‌‌‌های موجود در اینترنت یا همان ترجمه‌‌‌های احتمالا نادرستی است که از آن لغات و جملات وجود دارد. همین ترجمه‌‌‌های بی‌‌‌کیفیت و نادرست است که کیفیت ترجمه نهایی انجام‌شده توسط ماشین‌‌‌هایی مانند DeepL را کاهش می‌دهد. در واقع باید گفت اگرچه برنامه‌‌‌های ترجمه امروزی خیلی خوب و موفق هستند و کیفیت بسیار خوبی دارند؛ اما این به آن معنا نیست که عقل سلیم دارند. زبان‌‌‌های طبیعی برخلاف زبان‌‌‌های منطقی دارای منابع مختلف ابهام و پوشیدگی هستند که یکی از این منابع ابهام در زبان‌‌‌های طبیعی وجود چندمعنایی در آنهاست. همه ما می‌‌‌دانیم که یک کلمه واحد می‌تواند دارای معانی متعددی باشد که باتوجه‌‌‌به موقعیت و با استفاده از عقل سلیم باید یکی از آنها را انتخاب و استفاده کرد. به‌عنوان مثال، به جمله زیر که نمونه‌‌‌ای است از پیامد نبود عقل سلیم در ترجمه ماشینی توجه کنید:
Little John was looking for his toy box. Finally, he found it. The box was in the pen. John was very happy.
تمام کسانی که با زبان انگلیسی آشنایی دارند یک ترجمه رایج و بسیار پرکاربرد از کلمه pen را در ذهن دارند که همان خودکار است که البته می‌توان فهمید این معنی کلمه pen نمی‌تواند در این جمله به کار گرفته شود، چرا که جعبه اسباب‌‌‌بازی جان که ابعاد بزرگی دارد نمی‌تواند در داخل یک خودکار کوچک قرار داشته باشد.
در واقع معنی کمتر شناخته‌شده و کم‌‌‌کاربرد کلمهpen یعنی محوطه یا چهاردیواری کوچک در این جمله باید مدنظر باشد که این تشخیص با کمک عقل سلیم اتفاق می‌‌‌افتد. اما اگر از برنامه‌‌‌های ترجمه خواسته شود جمله بالا را ترجمه کنند، خروجی کار چندان خوب از آب درنمی‌‌‌آید؛ چراکه اغلب برنامه‌‌‌ها ترجمه «جعبه در داخل خودکار بود» را پیشنهاد می‌دهند که ترجمه‌‌‌ای بی‌‌‌معنی و کاملا غلط است. البته وقتی این جمله برای ترجمه به برنامه DeepL داده شد، طبق انتظار ترجمه ظاهرا بهتری پیشنهاد شد: «جعبه در آغل بود.» اما مشکل این ترجمه به کلمه آغل مربوط می‌شود که جایی است برای نگهداری گوسفندان و وجود جعبه اسباب‌‌‌بازی بچه‌‌‌ها در آنجا بر اساس عقل سلیم چندان معقول و منطقی به نظر نمی‌‌‌رسد.
منبع: کتاب The age of AI: and our human future

لینک کوتاه:
https://www.bazarearya.ir/Fa/News/1237699/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

هؤیت عامل زیرگیری نیواورلئان شناسایی شد+ عکس

با خرید 100 هزارتومن طلای آب‌شده 13 سوت طلا هدیه بگیرید

وزیر نفت: تولید حداکثری گاز برای عبور از زمستان در حال انجام است

فاصله زمانی تصمیم تا اجرا را به حداقل ممکن برسانیم

بازاریان کرمان خون خود را اهدا کردند

ضرورت هماهنگی دستگاه‌های اجرایی با شورای عالی مناطق آزاد

مجری که حالا نماینده شده FATF را می‌خواهد به وزیر آموزش دهد!

تداوم نوسان قیمت‌ها در بازار خودرو/ شاهین گران شد + جدول

ترکیه شمال سوریه را هدف حملات توپخانه‌ای خود قرار داد

تعطیلی ادارات سراسر استان کرمان

در جلسه شورای‌عالی هماهنگی اقتصادی سران قوا چه گذشت؟

مشکلات اقتصادی اولویت است، نه تشدید اجرای قوانین حجاب

توضیح فضائلی درباره پیام دیروز رهبر انقلاب به نشست رسانه ملی

پرواز ایروان به تهران مجبور به فرود اضطراری شد+ جزئیات

بارش برف این شهر را تعطیل کرد

چرا قیمت ارز این‌روزها خواب ندارد؟

مصرف انرژی ساختمانی در ایران 5 برابر اروپا!

تناقض قیمت‌ها در بازار خودرو/ کاهش 2 میلیونی قیمت پژو 207

پزشکیان: برخورد با مردم در خیابان بخاطر درست عمل نکردن ما است

پیام عارف درپی درگذشت عضو جامعه روحانیت مبارز

پیروانی: دغدغه همه ما دلار 80 هزار تومانی است نه غیبت علی دایی

ماجرای کاهش حقوق بازنشستگان تامین اجتماعی

ثبت ورود و خروج کالا در سامانه جامع تجارت بزرگترین چالش اصناف است

رئیس کمیسیون اقتصادی مجلس: چطور برای شرکت‌های مونتاژ خودرو ارز داریم اما برای واردات خودرو ارز نداریم؟

140 هزار واحد صنفی در گیلان فعالیت می کنند

ظرفیت‌ها، چالش‌ها و نقاط قوت و ضعف حوزه صنعت و تولید شهرستان ری بررسی شد

اقتصاد دریامحور توسعه اقتصادی گیلان را فراهم می‌کند

زبانه آتش قیمت دلار کم نشده؛ تا پایان سال 1403 نرخ ارز چقدر می‌شود؟

زمستان گرمی که رادیکال‌ها برای دولت می‌خواهند/ آدرس‌های غلط اصلاح‌طلبان به پزشکیان درباره مذاکره با آمریکا!

سود بازرگانی سال آینده تا پایان بهمن سال جاری، تعیین و ابلاغ شود

تمدید اجرای تبصره 2 ماده 72 قانون نظام صنفی به مدت یک سال

سود بازرگانی سال آینده تا پایان بهمن سال جاری تعیین و ابلاغ شود

خطر سرمازدگی حکمرانان

افزایش هزینه برق صنایع توسط وزارت نیرو متوقف شد

وزیر ارتباطات: برخی فضای مجازی را صرفا دارای بعد فنی می‌دانند

اظهار نظر اسرائیل درباره دولت جدید سوریه

مازندران لرزید

عامل اختلاف قیمت سکه‌ها با تاریخ ضرب متفاوت

روند نزولی تورم اجاره‌بها در 3 ماهه اخیر

افزایش سوخت‌رسانی به نیروگاه‌ها از طریق خطوط لوله

افزایش سوخت‌رسانی به نیروگاه‌ها از خطوط لوله

بسیج امکانات برای راه‌اندازی واحد فرآورش آزادگان جنوبی

اعتراض یک نماینده مجلس به حمله های مکرر به پزشکیان در صداوسیما/ مردم در فقر هستند، تا کی این وضعیت را ادامه دهیم؟

سرمایه گذاری خارجی جذب شده در خراسان جنوبی به 100 میلیون دلار رسید

گلستان جزء 4 استان محروم کشور است/محور گفت‌و‌گو با رئیس جمهور حل مشکلات معیشتی مردم استان بود

هشدار 122 نماینده مجلس به پزشکیان درخصوص سیاست مخرب ارزی

شرکت‌های صندوق بازنشستگی ملزم به ثبت صورت‌های مالی در کدال شدند

برگزاری جلسه شورای عالی هماهنگی اقتصادی سران قوا

وزارت خارجه سفیر عربستان را احضار کرد

دستگیری یکی از عاملان تیراندازی در بازار زاهدان

© - www.bazarearya.ir . All Rights Reserved.

چاپ ایرانیان کمپانی