В Израиле разработали переводчик с мертвого языка

В Израиле разработали переводчик с мертвого языка

Ученые создали нечто вроде Google Translate для археологов. В нем можно мгновенно расшифровать и перевести клинописные записи с древнего аккадского языка, которым никто не пользовался последние 2 тысячи лет.

Лишь несколько сотен специалистов во все мире способны расшифровать клиновидные штрихи на глиняных табличках. Археологи из Ариэльского университета из их числа. Совместно с учеными в сфере компьютерных технологий из Тель-Авивского они разработали программу для автоматического перевода на английский язык аккадской клинописи.

Аккадский — один из древнейших семитских языков на котором говорили и писали в великих империях Междуречья, начиная примерно с 3000 года до н.э. Постепенно он стал официальным имперским языком, потом был вытеснен арамейский и к началу Нашей эры окончательно вышел из употребления.

Писали на нем заостренным тростником или палочкой на мокрой глине, оставляя клиновидные отметки разной формы. Среди дошедших до нас памятников — литературные произведения, юридические документы, множество деловой переписки и административных записей. Причем язык и характер письменности сильно менялись. Записи с разницей в возрасте в тысячу лет могут иметь совершенно разные символы.

Некоторые аккадских клинописи уже расшифрованы специалистами, но смысл более полумиллиона глиняных табличек со всего мира остается неизвестным.



«Перевод всех нерасшифрованных табличек позволит нам увидеть первые дни истории, цивилизацию тех людей, посмотреть, во что они верили, о чем говорили, что писали», — рассказывает The Times of Israel один из ученых-компьютерщиков Гай Гутерц, который разрабатывал программу-переводчик, а ранее работал программистом в Google.

В 2020 году они с археологом и ассириологом из Ариэльского университета, профессором Шаем Гордином впервые использовали искусственный интеллект для перевода аккадской клинописи в транслитерированную латиницу. При этом клинописные символы преобразовывали в слова, сохраняя их первоначальный порядок. Результат выглядит для обывателя абсолютно бессмысленным набором букв, но это общий язык, который позволяет исследователям всего мира обсуждать клинопись. Тогда команде удалось достичь 97% точности перевода.

Следующим этапом работы стал перевод текста с аккадского на английский. Процесс это более трудоемкий и сложный, поскольку слова нужно не только перевести, но и соединить их в единые предложения и фразы в нужном синтаксическом порядке. С типовыми документами, например, указами правителя, это получалось точнее, чем с литературными текстами или письмами жрецов.

Главная проблема заключалась в том, что материал для обучения искусственного интеллекта ограничен. Даже в крупнейших онлайн-базах данных аккадских табличек — всего несколько десятков тысяч записей. Исследователи обратились к одной из крупнейших из них — Пенсильванского университета. Для обучения нейросети они использовали 90% этого материала, то есть 50 544 клинописных предложения. Еще по 5% оставили для проверки и тестирования переводчика.

«ChatGPT работает так хорошо, потому что разработчикам удалось обучить его практически всему, что есть в интернете. Для нас главной задачей в начале было собрать все возможные переводы, которые мы могли бы получить, чтобы сгенерировать как можно больше примеров», – объясняет Гутерц.

Но к удивлению ученых переводчик улавливает даже стиль, которым написан текст. То есть сам перевод может быть и невысокого качества, но по его стилистике можно понять, является ли текст шаблонным юридическим документом, письмом ученого, или астрологическим отчетом. Ранняя демонстрационная версия переводчика с клинописи на транслитерацию доступна на портале  The Babylon Engine.

Ученые оценили качество перевода программы с помощью метрики Best Bilingual Evaluation Understudy 4 (BLEU4), которую в свое время другие исследователи разработали для автоматического измерения степени соответствия между машинным переводом и человеческим. Минимальная оценка BLEU 4 – 0, а максимальная – 100. В результате, машинный перевод с клинописи на английский язык получил 36,52 баллов, и 37,47 баллов для транслитерированной клинописи на английский язык.

Это невысокий результат, но исследователи все равно им довольны. Тот же Google Translate, который существует уже более десяти лет, набирает лишь около 60 баллов по метрике BLEU4 за перевод с испанского на английский.

Допускает нейросеть и характерные для компьютерных языковых моделей «галлюцинации», то есть не просто ошибки, а совсем странные пассажи, никак не относящиеся к источнику перевода. И создатели честно в этом признаются. Скажем, в оригинальном аккадском тексте речь идет о сделке с каким-то человеком, а программа предлагает в качестве перевода фразу «они во Внутреннем Городе, во Внутреннем Городе». Но даже такой несовершенный алгоритм может стать большим подспорьем для ученых.

Хотя людей он пока точно не заменит. Профессор ассириологии Натан Вассерман из Института археологии Еврейского университета объясняет, что работа переводчика заключается не только в переводе, но и в понимании контекста аккадской культуры и литературы.

Что произойдет, если вы введете «Гамлета» в Google Translate? Получите ли вы достойный перевод шекспировского «Гамлета»?» – вопрошает он

Вассерман знает, о чем говорит. Он автор переводов с аккадского самых сложных текстов, в том числе гимнов, молитв, мифов. До таких высот искусственному интеллекту пока далеко.

Анастасия Адаховская «Детали». Фото: Depositphotos.com

 

Будьте всегда в курсе главных событий:

Подписывайтесь на ТГ-канал "Детали: Новости Израиля"

Новости

Трамп даст присягу внутри Капитолия - такое происходит впервые за 40 лет
Минобороны Нидерландов заключило контракт с Elbit, несмотря на критику
Байден опубликовал последнее селфи из Белого дома - фото

Популярное

Цукерберг признал: Маск одержал победу. Интернет уже никогда не будет прежним

Слова Марка Цукерберга в пятиминутном видео, которое он на этой неделе загрузил в свой аккаунт Instagram, на...

Ведомство «Битуах леуми» сообщило о размере социальных пособий в 2025 году

Служба национального страхования («Битуах леуми») сообщила о повышении социальных пособий в 2025 году в связи...

МНЕНИЯ