کریپتوباز

چگونه باستان‌شناسان با کمک هوش مصنوعی خط میخی را ترجمه می‌کنند

دیروز 17:00 مطالعه1دقیقه 761
چگونه باستان‌شناسان با کمک هوش مصنوعی خط میخی را ترجمه می‌کنند
پیش بینی
هوش مصنوعی با سرعت و دقت بی‌سابقه، متون ۵۰۰۰ ساله خط میخی را از روی الواح باستانی ترجمه می‌کند. این فناوری انقلابی، رازهای تمدن‌های کهن را آشکار کرده و تاریخ را به شکلی بی‌سابقه برای پژوهشگران و علاقه‌مندان زنده می‌سازد.

تصور کنید الواح گِلی باستانی که هزاران سال پیش با خط میخی پُر شده‌اند، امروز به کمک هوش مصنوعی خوانده و ترجمه شوند. این سناریو دیگر علمی-تخیلی نیست؛ فناوری هوش مصنوعی در حال باز کردن دروازه‌های تاریخ باستان است. خط میخی که یکی از کهن‌ترین نظام‌های نوشتاری بشر است، قرن‌ها معمایی دشوار برای پژوهشگران بود. اما اکنون الگوریتم‌های یادگیری ماشین به یاری باستان‌شناسان آمده‌اند تا متون باستانی ۵ هزار ساله را رمزگشایی کنند و داستان‌های ناگفته‌ی تمدن‌های اولیه را برای ما بازگو نمایند.
در ادامه این مقاله از کریپتوباز همراه ما باشید تا ببینیم این تحول علمی چگونه مرزهای باستان‌شناسی را تغییر داده است.

خط میخی؛ زبان باستانی که رمزگشایی آن دشوار است

خط میخی نخستین بار حدود ۳۲۰۰ سال پیش از میلاد توسط سومری‌ها در بین‌النهرین (عراق امروزی) ابداع شد و بعدها توسط تمدن‌هایی همچون اکدی‌ها، آشوری‌ها، بابلی‌ها و ایلامی‌ها به کار گرفته شد . این خط با علائم گوه‌ای‌شکل بر لوح‌های گلی نرم نوشته می‌شد و پس از خشک شدن لوح‌ها، متن برای هزاران سال محفوظ می‌ماند. اهمیت این لوح‌ها در ثبت رویدادهای سیاسی، اجتماعی، اقتصادی و علمی دنیای باستان بی‌نظیر است؛ از نامه‌های پادشاهان و اسناد تجارت گرفته تا اولین آثار ادبی جهان مانند حماسه گیلگمش. با این حال، خواندن و ترجمهٔ خط میخی بسیار دشوار است. هر علامت می‌تواند چندین معنا یا صدا داشته باشد و سبک نگارش در طول قرون و فرهنگ‌ها تغییر کرده است . برخلاف خط هیروگلیف مصری که سنگ رشید به رمزگشایی آن کمک کرد، برای بسیاری از متون میخی معادل دوزبانه روشنی وجود ندارد. همچنین زبان‌هایی چون سومری و اکدی که به خط میخی نوشته شده‌اند، قرن‌هاست که گویشور زنده‌ای ندارند.

نتیجهٔ این دشواری‌ها آن است که با گذشت بیش از ۱۵۰ سال از کشف نخستین کتیبه‌های میخی، هنوز بخش بزرگی از این متون ترجمه‌نشده باقی مانده‌اند. برآورد می‌شود حدود ۵۰۰ هزار لوح میخی در موزه‌های جهان نگهداری می‌شود، اما تنها کسری کوچک از آن‌ها توسط معدود متخصصان خوانده و ترجمه شده است . به‌عبارت دیگر، حدود ۹۰٪ نوشته‌های میخی هنوز رمزگشایی نشده‌اند . تعداد اندک آشورشناسان متخصص زبان‌های باستانی و پیچیدگی متن‌ها سبب شده بسیاری از این لوح‌ها دهه‌ها (و حتی بیشتر) در انتظار خوانده‌شدن بمانند. اینجاست که هوش مصنوعی وارد عمل می‌شود تا قفل این گنجینهٔ زبانی را بگشاید.

ترجمه خودکار خط میخی با هوش مصنوعی

پیشرفت‌های اخیر در یادگیری عمیق، دریچه‌ی تازه‌ای به دنیای زبان‌های باستانی گشوده است. یک تیم چندرشته‌ای از باستان‌شناسان و دانشمندان کامپیوتر در دانشگاه تل‌آویو و دانشگاه آریل اسرائیل مدلی از هوش مصنوعی ایجاد کرده‌اند که می‌تواند متون باستانی اکدی (نوشته‌شده به خط میخی) را به‌صورت خودکار به انگلیسی ترجمه کند. این ابزار در واقع نوعی سامانه ترجمهٔ ماشینی عصبی است که مشابه سرویس‌هایی مثل گوگل‌ترنسلیت عمل می‌کند، با این تفاوت که به‌جای زبان‌های زنده‌ی امروزی، برای زبانی استفاده شده که هیچ کس طی دوهزار سال اخیر آن را صحبت نکرده است. پژوهشگران با تغذیهٔ الگوریتم خود توسط هزاران جملهٔ ترجمه‌شده‌ی اکدی (از منابعی مانند پایگاه‌های داده‌ی دیجیتال) به مدل یاد داده‌اند الگوهای زبانی اکدی را به انگلیسی معادل‌یابی کند. نتیجه شگفت‌انگیز بوده است: متنی که خواندن آن برای یک متخصص ممکن است هفته‌ها زمان ببرد، توسط هوش مصنوعی در کسری از ثانیه ترجمه می‌شود.

چگونه کار می‌کند؟ از خط های میخی باستانی تا متن انگلیسی

این سامانه در دو مرحله عمل می‌کند. در مرحلهٔ اول، هوش مصنوعی متن میخی را به حروف الفبای لاتین (ترنسلیتریشن) برمی‌گرداند؛ یعنی هر علامت میخی اکدی را به معادل آوایی آن با خط الفبایی تبدیل می‌کند. در واقع یک «نسخهٔ لاتین‌شده» از متن اکدی تولید می‌شود. چنین کاری پیش‌تر در سال ۲۰۲۰ نیز توسط هوش مصنوعی با دقتی حدود ۹۷٪ انجام شده بود، چرا که در این روش هر علامت میخی تقریباً به یک واژه یا هجا برگردانده می‌شود و ترتیب کلمات اصلی حفظ می‌گردد. اما گام دشوارتر، مرحلهٔ دوم است: ترجمهٔ همین متن اکدی (لاتین‌شده) به جملات معنی‌دار انگلیسی. ساختار زبان اکدی با انگلیسی کاملاً متفاوت است و ترجمهٔ روان آن نیازمند جابجایی کلمات و درنظرگرفتن دستور زبان است. سامانهٔ هوش مصنوعی مذکور با بهره‌گیری از شبکه‌های عصبی عمیق (شبکه‌های ترنسفورمر) این مرحله را نیز انجام می‌دهد. به عبارت دیگر، مدل مستقیماً متن خط میخی اکدی را به انگلیسی روان برمی‌گرداند، گویی یک آشورشناس زبردست آن را تفسیر کرده باشد.

نتایج امیدوارکننده و دقت ترجمه

خروجی این مترجم خودکار بسیار فراتر از انتظار بوده است. پژوهشگران دقت ترجمه را با معیار BLEU (محک ارزیابی کیفیت ترجمهٔ ماشینی در مقایسه با ترجمهٔ انسانی) سنجیده‌اند. نسخهٔ ترانسلیتری (حروف‌لاتین) امتیاز BLEU معادل ۳۷٫۴۷ کسب کرده است که در محدودهٔ ترجمهٔ با کیفیت بالا ارزیابی می‌شود. حتی ترجمهٔ مستقیم از خط میخی به انگلیسی نیز امتیازی در حدود ۳۶٫۵ کسب کرده است. چنین امتیازهایی نشان می‌دهد که ترجمهٔ ماشینی متون میخی امکان‌پذیر است و می‌تواند قابل قیاس با ترجمهٔ انسانی باشد. برای یک زبان باستانی که منابع آموزشی بسیار محدودی دارد، این دستاورد بزرگی محسوب می‌شود. به گفته‌ی پژوهشگران، این هوش مصنوعی قادر است تفاوت‌های سبکی متون اکدی را نیز تشخیص دهد؛ مثلا متوجه می‌شود یک متن حالت ادبی و روایی دارد یا یک سند اداری و فرمول‌وار است. حتی تغییراتی که طی ۲۰۰۰ سال در رسم‌الخط میخی به‌وجود آمده را می‌تواند شناسایی کند و در ترجمه لحاظ نماید. چنین قابلیتی بسیار ارزشمند است، چون سبک نگارش و زبان اکدی در دوره‌های مختلف تاریخی (اکد باستان، بابلی، آشوری و غیره) متفاوت بوده و مدل باید انعطاف انطباق با هر دوره را داشته باشد.

چالش‌ها و محدودیت‌های ترجمه خط میخی با هوش مصنوعی

البته، ترجمهٔ ماشینی خط میخی هنوز در ابتدای راه است و کاستی‌هایی هم دارد. این مدل دریافت که برای متون بسیار ادبی یا غیرمعمول (مثلاً نامه‌های شخصی کاهنان یا متون حماسی)، احتمال بروز «خطای هذیان» در ترجمه بالا می‌رود. اصطلاح «هذیان» در هوش مصنوعی به مواردی گفته می‌شود که خروجی مدل کاملاً نامربوط به متن ورودی باشد. چنین خطاهایی زمانی رخ می‌دهد که مدل با جملات یا عباراتی مواجه شود که الگوی آن‌ها را به‌خوبی در داده‌های آموزشی نیاموخته است. در مقابل، متون رسمی و کلیشه‌ای (مانند فرمان‌های سلطنتی، اسناد اداری یا طالع‌بینی‌ها) بسیار دقیق‌تر ترجمه می‌شوند، چرا که ساختار تکرارشونده و ثابت‌شده‌ای دارند و الگوریتم به‌خوبی می‌تواند از پس آن‌ها برآید. بنابراین، خروجی فعلی هوش مصنوعی برای لوح‌های ساده و فرمولی تقریباً بی‌نقص است، اما برای متن‌های پیچیده‌تر نیاز به بازبینی و اصلاح توسط انسان دارد. در مجموع، همین که چنین سیستمی توانسته است جمله‌های اکدی باستانی را پس از هزاران سال به زبان امروزین بازگو کند، گامی تاریخی در مطالعات باستان‌شناسی و زبان‌شناسی محسوب می‌شود.

تشخیص خودکار علائم میخی و تسریع خواندن متن‌ها

پیش از ترجمه، خواندن خود متن میخی از روی لوح‌های فرسودهٔ گلی یک چالش اساسی است. باستان‌شناسان معمولاً از روی عکس یا اسکن سه‌بعدی لوح‌ها باید تک‌تک این علائم را بازخوانی و رونویسی کنند که کاری زمان‌بر و حساس است. در این زمینه نیز هوش مصنوعی انقلاب به پا کرده است. پژوهشگران دانشگاه کرنل آمریکا با همکاری دانشگاه تل‌آویو روشی ابداع کرده‌اند که می‌تواند هر نویسهٔ میخی را به‌طور دقیق از تصاویر دیجیتال کپی‌برداری و شناسایی کند. این رویکرد که ProtoSnap نام گرفته، از یک مدل هوش مصنوعی مولد به نام مدل انتشار (Diffusion Model) بهره می‌برد. ایده اصلی این است که شکل کلی هر علامت میخی را به‌صورت یک «الگوی اولیه» یا قالب کامپیوتری در نظر می‌گیرند و سپس تصویر پیکسل‌های یک علامت واقعی روی لوح را با این الگوی اولیه تراز می‌کنند. به زبان ساده، انگار که یک شابلون از پیش‌آماده از هر حرف میخی داریم و نرم‌افزار این شابلون را دقیقاً روی ردِّ همان حرف روی لوح منطبق می‌کند. نتیجه، یک نسخهٔ دیجیتال و واضح از تک‌تک نشانه‌های موجود در عکس لوح است که انگار توسط کتیبه‌خوانی ماهر با دست رونوشت شده است. تصویر زیر نحوهٔ عملکرد این روش را به‌صورت شماتیک نشان می‌دهد.

نمونه‌ای از لوح خط میخی اکدی

نمونه‌ای از لوح خط میخی اکدی؛ هوش مصنوعی با مقایسهٔ هر علامت با الگوی از پیش‌آموزش‌دیده، می‌تواند نسخه‌ای دقیق از متن را به صورت دیجیتال تولید کند.

این دستاورد دو پیامد مهم دارد. نخست آن‌که از این پس می‌توان متن میخی موجود در تصاویر یا اسکن‌ها را به‌طور خودکار به متن دیجیتال قابل ویرایش تبدیل کرد. در حقیقت، با بهره‌گیری از تکنیک فوق، مرحلهٔ دشوار خواندن علائم از روی لوح و رونویسی آن‌ها (که قبلا فقط از عهدهٔ متخصصان برمی‌آمد) توسط کامپیوتر انجام می‌شود. این همان چیزی است که به آن OCR باستانی می‌گوییم؛ یعنی تشخیص نوری نویسه‌ها برای متونی که به خط میخی نوشته شده‌اند. آزمون‌ها نشان داده‌اند مدل‌هایی که با داده‌های حاصل از روش ProtoSnap آموزش دیده‌اند، در تشخیص حروف میخی حتی نایاب و سخت‌خوان عملکردی به مراتب بهتر از تلاش‌های پیشین دارند. دومین پیامد، تسریع فوق‌العادهٔ روند ترجمه و پژوهش است. اکنون به جای صرف ساعت‌ها وقت برای نسخه‌برداری دستی از یک لوح، الگوریتم می‌تواند در زمانی کوتاه کل متن را استخراج کند. پژوهشگران تخمین می‌زنند این روش بتواند زمان موردنیاز برای کپی‌برداری از الواح و آماده‌سازی آن‌ها جهت ترجمه را تا ۷۰٪ کاهش دهد (صرفه‌جویی عظیمی در وقت) و به این ترتیب روند مطالعه و ترجمه متون را به‌شدت شتاب بخشد. افزون بر این، داشتن نسخه‌های دیجیتال استاندارد از هزاران لوح، امکان تحلیل تطبیقی در مقیاس بزرگ را فراهم می‌کند؛ مثلا می‌توان ساختار نگارش در شهرها یا دوره‌های مختلف را با هم مقایسه کرد یا شیوع یک عبارت را در صدها متن بررسی نمود. چنین رویکرد داده‌محوری پیش‌تر در باستان‌شناسی میسر نبود و می‌تواند دیدگاه‌های تازه‌ای دربارهٔ زبان، فرهنگ و جامعهٔ دنیای باستان به همراه آورد.

برای درک بهتر مزایای به‌کارگیری هوش مصنوعی در برابر روش سنتی ترجمهٔ متون باستانی، جدول زیر برخی ویژگی‌های این دو رویکرد را مقایسه می‌کند:

معیار ترجمهٔ سنتی (توسط انسان) ترجمه با هوش مصنوعی
سرعت بسیار کند – ترجمهٔ هر لوح ممکن است روزها یا هفته‌ها زمان ببرد بسیار سریع – ترجمهٔ فوری صدها متن در چند ثانیه
حجم قابل ترجمه محدود – تنها تعداد کمی از متون (به دلیل کمبود متخصص) گسترده – پردازش همزمان هزاران متن بدون خستگی یا افت سرعت
دقت ترجمه عموماً بالا – متخصص با درک عمیق از زبان، متنی دقیق و قابل اعتماد ارائه می‌دهد قابل قبول – در متون ساده دقت بالا؛ اما احتمال خطا یا «هذیان» در متون پیچیده
نیازمندی‌ها دانش تخصصی زبان باستانی، سال‌ها آموزش و آشنایی با زمینهٔ تاریخی داده‌های آموزشی (متون با ترجمهٔ معتبر) و توان پردازشی بالا برای آموزش مدل‌ها
نقش انسان کامل – انسان مترجم و تفسیرکنندهٔ اصلی متن است مشارکتی – انسان به‌عنوان ویراستار و ناظر برای اصلاح خروجی AI عمل می‌کند

همکاری انسان و هوش مصنوعی؛ تلفیق قدرت دو جهان

با ورود هوش مصنوعی به عرصه باستان‌شناسی، یک نگرانی طبیعی این است که آیا ماشین جایگزین متخصصان خواهد شد؟ واقعیت این است که دست‌کم در حال حاضر، AI نقش دستیار و شتاب‌دهنده را بازی می‌کند نه جانشین کامل انسان. پژوهشگرانی که ابزار ترجمهٔ ماشینی اکدی را توسعه داده‌اند تصریح می‌کنند که هدفشان یک «پروژهٔ همکاری انسان و ماشین» است. در این مدل مشارکتی، الگوریتم ابتدا پیش‌نویس ترجمه را تولید می‌کند و سپس آشورشناسان آن را بازبینی و تصحیح می‌کنند تا به ترجمه‌ای بی‌نقص و قابل استناد برسند. چنین همکاری دو سویه‌ای بهترین عملکرد را به دنبال دارد: سرعت و قدرت پردازش ماشین در کنار دقت و درک عمیق انسان. دکتر لوییس سائنز از دانشگاه آریل می‌گوید هوش مصنوعی قرار نیست مطالعات انسانی را کنار بزند، بلکه می‌تواند فرآیند ترجمهٔ انبوه متون را سرعت دهد و در نهایت حتی به افراد غیرمتخصص کمک کند متون باستانی را بخوانند. به عقیدهٔ او، آیندهٔ این فناوری نیازمند آن است که داده‌های بیشتری از متون موجود (حتی آن‌ها که در مقالات منتشر شده‌اند) دیجیتال‌سازی و به مدل اضافه شود تا دقت و دامنهٔ ترجمه‌ها بهبود یابد. به بیان دیگر، هرچه خوراک دادهی مدل غنی‌تر باشد، خروجی آن هم پخته‌تر خواهد بود. خوشبختانه پروژه‌های بزرگی مانند ORACC (مجموعه‌ی پیوستهٔ ترجمه‌های اکدی و سومری) و ابتکارهایی نظیر MTAAC در حال فراهم کردن چنین منابعی هستند.

موتور بابِلی؛ گامی به سوی مردمی‌سازی ترجمه خط میخ

از سوی دیگر، فراهم‌شدن ابزارهای ترجمهٔ خودکار می‌تواند درهای این حوزهٔ تخصصی را به روی علاقه‌مندان بیشتری بگشاید. برای نمونه، تیم اسرائیلی در حال توسعهٔ یک برنامهٔ آنلاین موسوم به «موتور بابِلی» است که به عموم اجازه می‌دهد متون میخی اسکن‌شده را همانند یک ترجمه‌گر آنلاین (مشابه Google Translate) به انگلیسی برگردانند. این بدان معناست که مثلاً یک دانشجوی تاریخ یا حتی یک علاقه‌مند عادی می‌تواند متن یک لوح میخی را بارگذاری کرده و ترجمهٔ تقریبی آن را فوراً مشاهده کند. هرچند این ترجمه هنوز نیاز به راستی‌آزمایی متخصصان دارد، اما گام بزرگی به سوی مردمی‌سازی دانش باستان‌شناسی است. تاکنون دانش خواندن خط میخی نزد گروه کوچکی از دانشگاهیان بود، اما شاید در آینده نزدیک هر کسی با کمک اپلیکیشن‌های هوشمند بتواند تا حدی از محتوای یک کتیبهٔ باستانی سر در بیاورد.

نتیجه‌گیری

هوش مصنوعی در حال رقم‌زدن انقلابی دیجیتال در باستان‌شناسی است. از ترجمهٔ فوری متون ۵۰۰۰ ساله گرفته تا خواندن خودکار حروفی که دست بشر هزاران سال پیش بر گل نرم حک کرده، همه نشان می‌دهد که تکنولوژی چگونه می‌تواند پرده از رازهای گذشته بردارد. یورام کوهن، استاد آشورشناسی دانشگاه تل‌آویو، اظهار می‌کند که با این پیشرفت‌ها ما می‌توانیم تعداد منابع مکتوب باستانی در دسترس را تا ۱۰ برابر افزایش دهیم. چنین افزایشی جهشی بزرگ در داده‌های تاریخی است و به پژوهشگران امکان می‌دهد تصویری دقیق‌تر و جامع‌تر از زندگی مردمان باستان – از مذهب و اقتصاد تا قوانین و جامعه – ترسیم کنند. شاید در آینده‌ای نه‌چندان دور، شاهد توسعهٔ فناوری‌های مشابهی برای دیگر زبان‌های باستانی گمشده نیز باشیم؛ از خط ایلامی و اوگاریتی گرفته تا هیروگلیف‌های مایا. هر کتیبهٔ ناخوانده می‌تواند قطعه‌ای از پازل تاریخ بشر باشد که تاکنون پنهان مانده است. اکنون ترکیب نبوغ انسان و سرعت خستگی‌ناپذیر ماشین، این قطعات پازل را یکی‌یکی در جای خود قرار می‌دهد. آیا روزی تمام متون کهن را به مدد هوش مصنوعی خواهیم خواند؟ نظرات خود را برای ما به اشتراک بگذارید.

مقاله رو دوست داشتی؟
نظرت چیه؟
سوالات متداول
داغ ترین مطالب
نظرات کاربران
ثبت دیدگاه جدید