چگونه هوش مصنوعی می‌تواند به ترجمه خطوط تمدن‌های باستانی کمک کند؟

چگونه هوش مصنوعی می‌تواند به ترجمه خطوط تمدن‌های باستانی کمک کند؟

محققان علوم کامپیوتر در موسسه شرقی شیکاگو، بر روی برنامه‌ای برای خواندن تبلت‌های میخی همکاری می‌کنند

به گزارش بخش خبر دانشگاه شیکاگو، بیست و پنج قرن پیش، «اسناد اداری» امپراتوری هخامنشیان بر روی لوح‌های گلی حک شد و ده‌ها هزار قطعه از آن‌ها در سال 1933 در ایران امروزی توسط باستان‌شناسان مؤسسه شرقی دانشگاه شیكاگو کشف شد.  دهه‌ها محققان با دردسر زیاد این اسناد باستانی را به صورت دستی مطالعه و ترجمه می‌کردند؛ روند رمزگشایی دستی بسیار دشوار، کند و مستعد خطا است.

از دهه 1990 میلادی، پژوهشگران حوزه کامپیوتر برای کمک، به همکاری دعوت شدند، در آن زمان، به دلیل ماهیت سه بعدی تبلت‌ها و پیچیدگی حروف میخی‌، موفقیت چندانی حاصل نشد. اما پیشرفت فناوری در دانشگاه شیکاگو ممکن است در نهایت منجر به کپی‌برداری خودکار از این تبلت‌ها شود – که اطلاعات غنی در مورد تاریخ، جامعه و زبان هخامنشی را در بردارند – و ممکن است شرایط را برای باستان‌شناسان به منظور تجزیه و تحلیل دقیق‌تر فراهم نماید.

انگیزه‌ای که در پس خواندن الواح با خطوط کنده عمیق وجود دارد، منجر به همکاری بین محققان موسسه شرقی دانشگاه شیکاگو و گروه علوم کامپیوتر این دانشگاه شد. این کار روی بیش از 6000  تصویر از  بایگانی برج و باروی تخت‌جمشید انجام شد، و مرکز اطلاعات و محاسبات – طرحی را به عنوان یک مدل پیش‌فرض دنبال خواهد کرد که بتواند این تبلت‌ها را بخواند – در واقع به دنبال ابزار بالقوه‌ای است که بتواند مجموعه تبلت‌هایی که هنوز خوانده نشده را بخواند و آن را در مورد دیگر نوشته‌های باستانی مورد استفاده قرار دهد.

سوزان پاولوس ، دانشیار گروه آشورشناسی گفت: «چنانچه ما بتوانیم به ابزاری انعطاف‌پذیر و قابل توسعه دست یابیم که بتوان آن را به متون و دوره‌های مختلف تعمیم داد، توانسته‌ایم شرایط مطالعه را تغییر دهیم.»

 

مسئله یک ماشین خوب برای این کار است

این همکاری هنگامی شروع شد که پائولوس، ساندرا شلون و میلر پروسر از موسسه شرقی شیکاگو، با سانجی کریشنان  استادیار گروه علوم کامپیوتر، در یک رویداد مربوط به علوم انسانی دیجیتال در کالج نیوبائر یکدیگر را ملاقات کردند. شلون و پروسر بر روی برنامه‌ای که توسط موسسه شرقی شیکاگو پشتیبانی می‌شد، در رابطه با مدیریت اطلاعات، همکاری می‌کردند، این برنامه در رابطه با گردآوری و سازماندهی داده‌های باستان‌شناسی به دست‌آمده از کاوش‌ها و دیگر انواع پژوهش‌ها بود. کریشنان هوش مصنوعی و تکنیک یادگیری عمیق (یک زیر شاخه از یادگیری ماشینی و بر مبنای مجموعه‌ای از الگوریتم‌ها است که در تلاش هستند مفاهیم انتزاعی سطح بالا در داده‌ها را مدل نمایند) را برای تجزیه و تحلیه داده‌ها، که شامل داده‌های تصویری و مجموعه‌ای از انواع اطلاعات بود، به کار برد. استفاده همزمان از این تکنیک‌ها، بلافاصله خود را در وجوه مختلف نمایان ساخت.

کریشنان گفت: «این بسیار جالب است زیرا ما با چالش‌های مشابهی مواجه هستیم. در پنج سال گذشته علوم رایانه بهبود چشمگیری داشته است. ده سال پیش، این امکان‌پذیر نبود، و ما فکر نمی‌کردیم به چنین دست‌آوردهایی برسیم. در واقع مسئله اصلی یک ماشین خوب و مناسب است زیرا هدف مشخص است، ما یک مجموعه الگوی (نمونه‌های پیشتر مطالعه شده) مناسب داریم و موضوع نوشته‌ها را خیلی خوب می‌فهمیم و این به ما کمک می‌کند، و موضوعی کاملا ناشناخته نیست.»

این مجموعه الگو به لطف بیش از 80 سال مطالعه دقیق، توسط محققان موسسه شرق شناسی و دانشگاه شیکاگو و فشار اخیر برای دیجیتالی کردن تصاویر مجموعه تبلت‌ها با وضوح بالا – در حال حاضر بیش از 60 ترابایت داده که هنوز در حال افزایش است – و قبل از بازگشت این مجموعه به ایران بوده است. محققان با استفاده از این مجموعه لغت نامه‌ای به زبان ایلامی استخراج کردند و دانشجویان یاد می‌گیرند چگونه خط میخی را رمزگشایی کنند و از پایگاه اطلاعاتی با بیش از 100.000 نکته مهم و یا علائم فردی استفاده کنند.

با وجود منابع  مرکز محاسبات تحقیقاتی دانشگاه شیکاگو، کریشنان از این مجموعه یادداشت‌ها برای آموزش یک مدل یادگیری ماشین، مشابه آنچه در سایر پروژه‌های تصویری رایانه استفاده می‌شود، استفاده کرد. هنگامی که بر روی تبلت‌هایی که در مجموعه الگو وجود نداشت، نتیجه را آزمایش کرد، اعلام کرد این مدل موفق به رمزگشایی علائم خط میخی با دقت 80 درصد شده است، و تحقیقات آتی برای به دست‌آوردن میزان دقت بالاتر و بر روی 20 درصد باقیمانده متمرکز خواهد شد.

دیجیتالیزه کردن، بخش مهمی از کار را آسان کرده است

اما دقت 80 درصدی نیز می‌تواند بلافاصله برای تهیه رونوشت از کتیبه‌ها مفید باشد. پائولوس گفت: «بسیاری از این تبلت‌ها معاملات تجاری ابتدایی را توصیف می‌کنند، مشابه، یک مجموعه از رسیدهای خرید روزانه‌ی امروزی، و سیستمی که کارایی 100 درصدی نیز نداشته باشد، می‌تواند مفید باشد.»

پائولوس می‌گوید: «اگر كامپيوتر فقط بتواند قسمت‌های بسیار تکراری را ترجمه یا شناسایی كند و الباقی آن را به یك متخصص واگذار كند تا بتواند نام‌های دشوار یا افعال یا چیزهایی را كه نیاز به تفسیر دارند پر كند، باز هم کار بسیار زیادی را انجام داده است. و اگر رایانه نتواند تصمیم قاطع بگیرد، تنها کافی است نتایج احتمالی را به ما ارائه کند و یا احتمال برتر را به ما پیشنهاد کند، و این برای یک متخصص نقطه شروع خوبی خواهد بود، و شگفت انگیز است.»

این گروه، با نگاهی جاه‌طلبانه، تصور می‌کنند که می‌توان این سیستم، را به عنوان ابزاری برای رمزگشایی، با دیگر باستان‌شناسان نیز به اشتراک گذاشت؛ شاید این مدل برای خط‌های میخی به غیر از ایلامی نیز قابل استفاده باشد، یا ممکن است بتواند به بازیابی قسمت‌های مفقود شده از لوح‌های ناقص نیز کمک کند، و کلمات پیشنهادی ارائه کند. مدل ماشین یادگیری ممکن است در تعیین منشاء تبلت‌ها و سایر مصنوعات با منشأ ناشناخته نیز کمک کند، کاری که در حال حاضر با انجام آزمایشات شیمیایی مورد بررسی قرار می‌گیرد.

close

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *