
تصور کنید الواح گِلی باستانی که هزاران سال پیش با خط میخی پُر شدهاند، امروز به کمک هوش مصنوعی خوانده و ترجمه شوند. این سناریو دیگر علمی-تخیلی نیست؛ فناوری هوش مصنوعی در حال باز کردن دروازههای تاریخ باستان است. خط میخی که یکی از کهنترین نظامهای نوشتاری بشر است، قرنها معمایی دشوار برای پژوهشگران بود. اما اکنون الگوریتمهای یادگیری ماشین به یاری باستانشناسان آمدهاند تا متون باستانی ۵ هزار ساله را رمزگشایی کنند و داستانهای ناگفتهی تمدنهای اولیه را برای ما بازگو نمایند.
در ادامه این مقاله از کریپتوباز همراه ما باشید تا ببینیم این تحول علمی چگونه مرزهای باستانشناسی را تغییر داده است.
خط میخی؛ زبان باستانی که رمزگشایی آن دشوار است
خط میخی نخستین بار حدود ۳۲۰۰ سال پیش از میلاد توسط سومریها در بینالنهرین (عراق امروزی) ابداع شد و بعدها توسط تمدنهایی همچون اکدیها، آشوریها، بابلیها و ایلامیها به کار گرفته شد . این خط با علائم گوهایشکل بر لوحهای گلی نرم نوشته میشد و پس از خشک شدن لوحها، متن برای هزاران سال محفوظ میماند. اهمیت این لوحها در ثبت رویدادهای سیاسی، اجتماعی، اقتصادی و علمی دنیای باستان بینظیر است؛ از نامههای پادشاهان و اسناد تجارت گرفته تا اولین آثار ادبی جهان مانند حماسه گیلگمش. با این حال، خواندن و ترجمهٔ خط میخی بسیار دشوار است. هر علامت میتواند چندین معنا یا صدا داشته باشد و سبک نگارش در طول قرون و فرهنگها تغییر کرده است . برخلاف خط هیروگلیف مصری که سنگ رشید به رمزگشایی آن کمک کرد، برای بسیاری از متون میخی معادل دوزبانه روشنی وجود ندارد. همچنین زبانهایی چون سومری و اکدی که به خط میخی نوشته شدهاند، قرنهاست که گویشور زندهای ندارند.
نتیجهٔ این دشواریها آن است که با گذشت بیش از ۱۵۰ سال از کشف نخستین کتیبههای میخی، هنوز بخش بزرگی از این متون ترجمهنشده باقی ماندهاند. برآورد میشود حدود ۵۰۰ هزار لوح میخی در موزههای جهان نگهداری میشود، اما تنها کسری کوچک از آنها توسط معدود متخصصان خوانده و ترجمه شده است . بهعبارت دیگر، حدود ۹۰٪ نوشتههای میخی هنوز رمزگشایی نشدهاند . تعداد اندک آشورشناسان متخصص زبانهای باستانی و پیچیدگی متنها سبب شده بسیاری از این لوحها دههها (و حتی بیشتر) در انتظار خواندهشدن بمانند. اینجاست که هوش مصنوعی وارد عمل میشود تا قفل این گنجینهٔ زبانی را بگشاید.
ترجمه خودکار خط میخی با هوش مصنوعی
پیشرفتهای اخیر در یادگیری عمیق، دریچهی تازهای به دنیای زبانهای باستانی گشوده است. یک تیم چندرشتهای از باستانشناسان و دانشمندان کامپیوتر در دانشگاه تلآویو و دانشگاه آریل اسرائیل مدلی از هوش مصنوعی ایجاد کردهاند که میتواند متون باستانی اکدی (نوشتهشده به خط میخی) را بهصورت خودکار به انگلیسی ترجمه کند. این ابزار در واقع نوعی سامانه ترجمهٔ ماشینی عصبی است که مشابه سرویسهایی مثل گوگلترنسلیت عمل میکند، با این تفاوت که بهجای زبانهای زندهی امروزی، برای زبانی استفاده شده که هیچ کس طی دوهزار سال اخیر آن را صحبت نکرده است. پژوهشگران با تغذیهٔ الگوریتم خود توسط هزاران جملهٔ ترجمهشدهی اکدی (از منابعی مانند پایگاههای دادهی دیجیتال) به مدل یاد دادهاند الگوهای زبانی اکدی را به انگلیسی معادلیابی کند. نتیجه شگفتانگیز بوده است: متنی که خواندن آن برای یک متخصص ممکن است هفتهها زمان ببرد، توسط هوش مصنوعی در کسری از ثانیه ترجمه میشود.
بیشتربخوانید : هوش مصنوعی متن ۵ هزار ساله را رمزگشایی کرد
چگونه کار میکند؟ از خط های میخی باستانی تا متن انگلیسی
این سامانه در دو مرحله عمل میکند. در مرحلهٔ اول، هوش مصنوعی متن میخی را به حروف الفبای لاتین (ترنسلیتریشن) برمیگرداند؛ یعنی هر علامت میخی اکدی را به معادل آوایی آن با خط الفبایی تبدیل میکند. در واقع یک «نسخهٔ لاتینشده» از متن اکدی تولید میشود. چنین کاری پیشتر در سال ۲۰۲۰ نیز توسط هوش مصنوعی با دقتی حدود ۹۷٪ انجام شده بود، چرا که در این روش هر علامت میخی تقریباً به یک واژه یا هجا برگردانده میشود و ترتیب کلمات اصلی حفظ میگردد. اما گام دشوارتر، مرحلهٔ دوم است: ترجمهٔ همین متن اکدی (لاتینشده) به جملات معنیدار انگلیسی. ساختار زبان اکدی با انگلیسی کاملاً متفاوت است و ترجمهٔ روان آن نیازمند جابجایی کلمات و درنظرگرفتن دستور زبان است. سامانهٔ هوش مصنوعی مذکور با بهرهگیری از شبکههای عصبی عمیق (شبکههای ترنسفورمر) این مرحله را نیز انجام میدهد. به عبارت دیگر، مدل مستقیماً متن خط میخی اکدی را به انگلیسی روان برمیگرداند، گویی یک آشورشناس زبردست آن را تفسیر کرده باشد.
نتایج امیدوارکننده و دقت ترجمه
خروجی این مترجم خودکار بسیار فراتر از انتظار بوده است. پژوهشگران دقت ترجمه را با معیار BLEU (محک ارزیابی کیفیت ترجمهٔ ماشینی در مقایسه با ترجمهٔ انسانی) سنجیدهاند. نسخهٔ ترانسلیتری (حروفلاتین) امتیاز BLEU معادل ۳۷٫۴۷ کسب کرده است که در محدودهٔ ترجمهٔ با کیفیت بالا ارزیابی میشود. حتی ترجمهٔ مستقیم از خط میخی به انگلیسی نیز امتیازی در حدود ۳۶٫۵ کسب کرده است. چنین امتیازهایی نشان میدهد که ترجمهٔ ماشینی متون میخی امکانپذیر است و میتواند قابل قیاس با ترجمهٔ انسانی باشد. برای یک زبان باستانی که منابع آموزشی بسیار محدودی دارد، این دستاورد بزرگی محسوب میشود. به گفتهی پژوهشگران، این هوش مصنوعی قادر است تفاوتهای سبکی متون اکدی را نیز تشخیص دهد؛ مثلا متوجه میشود یک متن حالت ادبی و روایی دارد یا یک سند اداری و فرمولوار است. حتی تغییراتی که طی ۲۰۰۰ سال در رسمالخط میخی بهوجود آمده را میتواند شناسایی کند و در ترجمه لحاظ نماید. چنین قابلیتی بسیار ارزشمند است، چون سبک نگارش و زبان اکدی در دورههای مختلف تاریخی (اکد باستان، بابلی، آشوری و غیره) متفاوت بوده و مدل باید انعطاف انطباق با هر دوره را داشته باشد.
چالشها و محدودیتهای ترجمه خط میخی با هوش مصنوعی
البته، ترجمهٔ ماشینی خط میخی هنوز در ابتدای راه است و کاستیهایی هم دارد. این مدل دریافت که برای متون بسیار ادبی یا غیرمعمول (مثلاً نامههای شخصی کاهنان یا متون حماسی)، احتمال بروز «خطای هذیان» در ترجمه بالا میرود. اصطلاح «هذیان» در هوش مصنوعی به مواردی گفته میشود که خروجی مدل کاملاً نامربوط به متن ورودی باشد. چنین خطاهایی زمانی رخ میدهد که مدل با جملات یا عباراتی مواجه شود که الگوی آنها را بهخوبی در دادههای آموزشی نیاموخته است. در مقابل، متون رسمی و کلیشهای (مانند فرمانهای سلطنتی، اسناد اداری یا طالعبینیها) بسیار دقیقتر ترجمه میشوند، چرا که ساختار تکرارشونده و ثابتشدهای دارند و الگوریتم بهخوبی میتواند از پس آنها برآید. بنابراین، خروجی فعلی هوش مصنوعی برای لوحهای ساده و فرمولی تقریباً بینقص است، اما برای متنهای پیچیدهتر نیاز به بازبینی و اصلاح توسط انسان دارد. در مجموع، همین که چنین سیستمی توانسته است جملههای اکدی باستانی را پس از هزاران سال به زبان امروزین بازگو کند، گامی تاریخی در مطالعات باستانشناسی و زبانشناسی محسوب میشود.
تشخیص خودکار علائم میخی و تسریع خواندن متنها
پیش از ترجمه، خواندن خود متن میخی از روی لوحهای فرسودهٔ گلی یک چالش اساسی است. باستانشناسان معمولاً از روی عکس یا اسکن سهبعدی لوحها باید تکتک این علائم را بازخوانی و رونویسی کنند که کاری زمانبر و حساس است. در این زمینه نیز هوش مصنوعی انقلاب به پا کرده است. پژوهشگران دانشگاه کرنل آمریکا با همکاری دانشگاه تلآویو روشی ابداع کردهاند که میتواند هر نویسهٔ میخی را بهطور دقیق از تصاویر دیجیتال کپیبرداری و شناسایی کند. این رویکرد که ProtoSnap نام گرفته، از یک مدل هوش مصنوعی مولد به نام مدل انتشار (Diffusion Model) بهره میبرد. ایده اصلی این است که شکل کلی هر علامت میخی را بهصورت یک «الگوی اولیه» یا قالب کامپیوتری در نظر میگیرند و سپس تصویر پیکسلهای یک علامت واقعی روی لوح را با این الگوی اولیه تراز میکنند. به زبان ساده، انگار که یک شابلون از پیشآماده از هر حرف میخی داریم و نرمافزار این شابلون را دقیقاً روی ردِّ همان حرف روی لوح منطبق میکند. نتیجه، یک نسخهٔ دیجیتال و واضح از تکتک نشانههای موجود در عکس لوح است که انگار توسط کتیبهخوانی ماهر با دست رونوشت شده است. تصویر زیر نحوهٔ عملکرد این روش را بهصورت شماتیک نشان میدهد.
نمونهای از لوح خط میخی اکدی؛ هوش مصنوعی با مقایسهٔ هر علامت با الگوی از پیشآموزشدیده، میتواند نسخهای دقیق از متن را به صورت دیجیتال تولید کند.
این دستاورد دو پیامد مهم دارد. نخست آنکه از این پس میتوان متن میخی موجود در تصاویر یا اسکنها را بهطور خودکار به متن دیجیتال قابل ویرایش تبدیل کرد. در حقیقت، با بهرهگیری از تکنیک فوق، مرحلهٔ دشوار خواندن علائم از روی لوح و رونویسی آنها (که قبلا فقط از عهدهٔ متخصصان برمیآمد) توسط کامپیوتر انجام میشود. این همان چیزی است که به آن OCR باستانی میگوییم؛ یعنی تشخیص نوری نویسهها برای متونی که به خط میخی نوشته شدهاند. آزمونها نشان دادهاند مدلهایی که با دادههای حاصل از روش ProtoSnap آموزش دیدهاند، در تشخیص حروف میخی حتی نایاب و سختخوان عملکردی به مراتب بهتر از تلاشهای پیشین دارند. دومین پیامد، تسریع فوقالعادهٔ روند ترجمه و پژوهش است. اکنون به جای صرف ساعتها وقت برای نسخهبرداری دستی از یک لوح، الگوریتم میتواند در زمانی کوتاه کل متن را استخراج کند. پژوهشگران تخمین میزنند این روش بتواند زمان موردنیاز برای کپیبرداری از الواح و آمادهسازی آنها جهت ترجمه را تا ۷۰٪ کاهش دهد (صرفهجویی عظیمی در وقت) و به این ترتیب روند مطالعه و ترجمه متون را بهشدت شتاب بخشد. افزون بر این، داشتن نسخههای دیجیتال استاندارد از هزاران لوح، امکان تحلیل تطبیقی در مقیاس بزرگ را فراهم میکند؛ مثلا میتوان ساختار نگارش در شهرها یا دورههای مختلف را با هم مقایسه کرد یا شیوع یک عبارت را در صدها متن بررسی نمود. چنین رویکرد دادهمحوری پیشتر در باستانشناسی میسر نبود و میتواند دیدگاههای تازهای دربارهٔ زبان، فرهنگ و جامعهٔ دنیای باستان به همراه آورد.
برای درک بهتر مزایای بهکارگیری هوش مصنوعی در برابر روش سنتی ترجمهٔ متون باستانی، جدول زیر برخی ویژگیهای این دو رویکرد را مقایسه میکند:
معیار | ترجمهٔ سنتی (توسط انسان) | ترجمه با هوش مصنوعی |
---|---|---|
سرعت | بسیار کند – ترجمهٔ هر لوح ممکن است روزها یا هفتهها زمان ببرد | بسیار سریع – ترجمهٔ فوری صدها متن در چند ثانیه |
حجم قابل ترجمه | محدود – تنها تعداد کمی از متون (به دلیل کمبود متخصص) | گسترده – پردازش همزمان هزاران متن بدون خستگی یا افت سرعت |
دقت ترجمه | عموماً بالا – متخصص با درک عمیق از زبان، متنی دقیق و قابل اعتماد ارائه میدهد | قابل قبول – در متون ساده دقت بالا؛ اما احتمال خطا یا «هذیان» در متون پیچیده |
نیازمندیها | دانش تخصصی زبان باستانی، سالها آموزش و آشنایی با زمینهٔ تاریخی | دادههای آموزشی (متون با ترجمهٔ معتبر) و توان پردازشی بالا برای آموزش مدلها |
نقش انسان | کامل – انسان مترجم و تفسیرکنندهٔ اصلی متن است | مشارکتی – انسان بهعنوان ویراستار و ناظر برای اصلاح خروجی AI عمل میکند |
همکاری انسان و هوش مصنوعی؛ تلفیق قدرت دو جهان
با ورود هوش مصنوعی به عرصه باستانشناسی، یک نگرانی طبیعی این است که آیا ماشین جایگزین متخصصان خواهد شد؟ واقعیت این است که دستکم در حال حاضر، AI نقش دستیار و شتابدهنده را بازی میکند نه جانشین کامل انسان. پژوهشگرانی که ابزار ترجمهٔ ماشینی اکدی را توسعه دادهاند تصریح میکنند که هدفشان یک «پروژهٔ همکاری انسان و ماشین» است. در این مدل مشارکتی، الگوریتم ابتدا پیشنویس ترجمه را تولید میکند و سپس آشورشناسان آن را بازبینی و تصحیح میکنند تا به ترجمهای بینقص و قابل استناد برسند. چنین همکاری دو سویهای بهترین عملکرد را به دنبال دارد: سرعت و قدرت پردازش ماشین در کنار دقت و درک عمیق انسان. دکتر لوییس سائنز از دانشگاه آریل میگوید هوش مصنوعی قرار نیست مطالعات انسانی را کنار بزند، بلکه میتواند فرآیند ترجمهٔ انبوه متون را سرعت دهد و در نهایت حتی به افراد غیرمتخصص کمک کند متون باستانی را بخوانند. به عقیدهٔ او، آیندهٔ این فناوری نیازمند آن است که دادههای بیشتری از متون موجود (حتی آنها که در مقالات منتشر شدهاند) دیجیتالسازی و به مدل اضافه شود تا دقت و دامنهٔ ترجمهها بهبود یابد. به بیان دیگر، هرچه خوراک دادهی مدل غنیتر باشد، خروجی آن هم پختهتر خواهد بود. خوشبختانه پروژههای بزرگی مانند ORACC (مجموعهی پیوستهٔ ترجمههای اکدی و سومری) و ابتکارهایی نظیر MTAAC در حال فراهم کردن چنین منابعی هستند.
موتور بابِلی؛ گامی به سوی مردمیسازی ترجمه خط میخ
از سوی دیگر، فراهمشدن ابزارهای ترجمهٔ خودکار میتواند درهای این حوزهٔ تخصصی را به روی علاقهمندان بیشتری بگشاید. برای نمونه، تیم اسرائیلی در حال توسعهٔ یک برنامهٔ آنلاین موسوم به «موتور بابِلی» است که به عموم اجازه میدهد متون میخی اسکنشده را همانند یک ترجمهگر آنلاین (مشابه Google Translate) به انگلیسی برگردانند. این بدان معناست که مثلاً یک دانشجوی تاریخ یا حتی یک علاقهمند عادی میتواند متن یک لوح میخی را بارگذاری کرده و ترجمهٔ تقریبی آن را فوراً مشاهده کند. هرچند این ترجمه هنوز نیاز به راستیآزمایی متخصصان دارد، اما گام بزرگی به سوی مردمیسازی دانش باستانشناسی است. تاکنون دانش خواندن خط میخی نزد گروه کوچکی از دانشگاهیان بود، اما شاید در آینده نزدیک هر کسی با کمک اپلیکیشنهای هوشمند بتواند تا حدی از محتوای یک کتیبهٔ باستانی سر در بیاورد.
نتیجهگیری
هوش مصنوعی در حال رقمزدن انقلابی دیجیتال در باستانشناسی است. از ترجمهٔ فوری متون ۵۰۰۰ ساله گرفته تا خواندن خودکار حروفی که دست بشر هزاران سال پیش بر گل نرم حک کرده، همه نشان میدهد که تکنولوژی چگونه میتواند پرده از رازهای گذشته بردارد. یورام کوهن، استاد آشورشناسی دانشگاه تلآویو، اظهار میکند که با این پیشرفتها ما میتوانیم تعداد منابع مکتوب باستانی در دسترس را تا ۱۰ برابر افزایش دهیم. چنین افزایشی جهشی بزرگ در دادههای تاریخی است و به پژوهشگران امکان میدهد تصویری دقیقتر و جامعتر از زندگی مردمان باستان – از مذهب و اقتصاد تا قوانین و جامعه – ترسیم کنند. شاید در آیندهای نهچندان دور، شاهد توسعهٔ فناوریهای مشابهی برای دیگر زبانهای باستانی گمشده نیز باشیم؛ از خط ایلامی و اوگاریتی گرفته تا هیروگلیفهای مایا. هر کتیبهٔ ناخوانده میتواند قطعهای از پازل تاریخ بشر باشد که تاکنون پنهان مانده است. اکنون ترکیب نبوغ انسان و سرعت خستگیناپذیر ماشین، این قطعات پازل را یکییکی در جای خود قرار میدهد. آیا روزی تمام متون کهن را به مدد هوش مصنوعی خواهیم خواند؟ نظرات خود را برای ما به اشتراک بگذارید.