Биология

«Поймать вавилонскую рыбку: Человеческий мозг, нейронные сети и изучение иностранных языков». Краткая история машинного перевода

В серии романов «Автостопом по галактике» Дуглас Адамс придумал вавилонскую рыбку — существо, которое помещается в ухо и транслирует перевод с любого языка прямиком в мозг. Сейчас это не кажется фантастикой — наушники для автоматического синхронного перевода уже существуют, а машинный перевод совершенствуется благодаря нейросетям. В книге «Поймать вавилонскую рыбку: Человеческий мозг, нейронные сети и изучение иностранных языков» (издательство «Альпина нон-фикшн») научная журналистка Яна Хлюстова рассказывает, что такое язык, как работает мозг переводчика и насколько близко мы подобрались к изобретению устройства, которое может его заменить. Предлагаем вам ознакомиться с фрагментом, посвященным рождению машинного перевода.

С чего начинался машинный перевод

Наверное, в окружении каждого из нас есть технологические оптимисты — люди, которые считают, что прогресс безусловно полезен, а роботы и компьютеры не сегодня завтра заменят человека во многих сферах. Технологии и искусственный интеллект, действительно, довольно глубоко проникли в нашу жизнь. Они рекомендуют нам фильмы и сериалы, подсказывают пути объезда дорожных пробок, управляют самолетами и водят машину, пишут музыку и переводят тексты на иностранные языки за доли секунды.

Все мы пользуемся онлайн-переводчиками и функцией автоматического перевода сайтов. Качество работы таких доступных любому пользователю систем постоянно растет — сегодня, в начале 2020-х годов, тексты получаются не идеальными, но их смысл понятен практически на 100 процентов. Гаджеты, работающие в режиме голосового синхронного перевода, тоже есть — о них мы поговорим чуть позже. Неудивительно, что некоторые люди уверены: если не через несколько лет, то уж точно через несколько десятилетий системы машинного перевода полностью заменят переводчиков. Давайте с помощью ученых и самих переводчиков попробуем разобраться в том, насколько обоснованы эти прогнозы (надежды или опасения — с чьей точки зрения посмотреть). Но вначале выясним, когда появился и как развивался машинный перевод.

С чего все начиналось. IX век

Логично предположить, что первые шаги по созданию машинного перевода были сделаны в ХХ веке — не могла же эта работа начаться раньше, чем появились компьютеры. Но на самом деле человек, идеи которого в ХХ веке использовались для разработки систем машинного перевода, жил в Багдаде в IX веке. Его звали Абу Юсуф Якуб ибн Исхак аль-Кинди, и был он философом, математиком и астрономом. Один из важнейших своих трактатов аль-Кинди посвятил криптографии. Спустя 11 столетий эта работа пригодилась специалистам по машинному переводу.

Изначально криптографией назывался метод шифрования информации с использованием некоего алгоритма или секретного ключа. Это означает, что вы берете исходный текст и преобразуете его в иной вид, используя набор правил, например заменяя буквы символами. Без знания ключа, то есть соответствия букв и символов, расшифровать текст будет очень сложно.

Арабские ученые, в частности аль-Кинди, считаются родоначальниками криптоанализа — науки о методах расшифровки зашифрованной информации без знания ключа. В своих работах аль-Кинди демонстрировал глубокие познания в лингвистике и статистике, выделяя три подхода к расшифровке текстов:

  1. Анализ частоты употребления букв. Аль-Кинди предлагал определить наиболее часто встречающиеся буквы или символы в зашифрованном тексте, а затем сравнить их с нормальным распределением букв в нужном языке (сам аль-Кинди рассматривал арабский). Сегодня этот метод известен как частотный криптоанализ. Помните рассказ «Пляшущие человечки» Артура Конан Дойля? Шерлок Холмс сделал именно это: нашел в записках, текст которых был зашифрован рисунками человечков в разных позах, наиболее часто встречающуюся фигурку и подставил вместо нее букву «e» — самую распространенную в английском языке. В результате одно из слов стало выглядеть так: *е*е*. Холмс предположил, что это слово never, «никогда», и получил еще три соответствия «буква — рисунок», после чего дело пошло быстрее.
  1. Анализ лингвистических правил. Используя этот подход, аль-Кинди предлагал учитывать сочетаемость и несочетаемость букв, принимать во внимание их допустимые положения. Например, в русском языке комбинация букв «ам» будет встречаться чаще, чем «ао», а комбинации «аь» вообще не существует. Эти знания упрощают подбор ключа, уменьшая количество допустимых вариантов замен. Спустя несколько десятилетий идея аль-Кинди была развита другим арабским лингвистом и криптографом — Афифом ад-Дином Али ибн-Адланом аль-Маусали. При помощи словаря он составил списки двухи трехбуквенных сочетаний, которые встречаются в арабских словах.
  1. Анализ вероятности употребления слова. Этот подход основывается на семантических свойствах текстов. Аль-Кинди отмечает, что авторы склонны использовать устойчивые, повторяющиеся словосочетания или даже целые фразы. Так, например, арабские тексты часто начинаются с предложения «Во имя Аллаха милостивого и милосердного» — это дает значительное количество информации для расшифровки. Кроме того, аль-Кинди советовал расшифровщику обращать внимание на жанр и стилистику текста, ведь устойчивые фразы и словосочетания в разных случаях могут быть неодинаковыми.

От древности до начала ХХ века

Но очевидно, что от рождения криптоанализа до появления машинного перевода не так-то близко. Первые идеи о возможности «механического перевода» относятся к XVI–XVII векам. В то время они были практически неотделимы от идей о создании универсального языка (тогда можно было бы разработать единое приспособление для механического перевода, которым могли бы пользоваться все люди). В 1661 году шотландский интеллектуал Джордж Дальгарно опубликовал книгу «Искусство обозначений, общепонятные универсальные характеры и философский язык» (Ars signorum, vulgo character universalis et lingua philosophica). В ней он излагал свои идеи по поводу создания универсального письменного философского языка — позднее вместо этого термина стали использовать слово «пазиграфия». В 1668 году британский священник и энциклопедист Джон Уилкинс опубликовал труд «Опыт о подлинной символике и философском языке» (An Essay towards a Real Character and a Philosophical Language). В нем он тоже писал о создании универсального языка (а еще десятичной системы мер, впоследствии ставшей основой знакомой нам метрической системы).

Свою пазиграфию разработал и француз Жозеф де Маймье. Он изложил ее в изданной в 1797 году книге, которая так и называлась — «Пазиграфия» (Pasigraphie). В этой системе письменности используется 12 знаков — их можно комбинировать в соответствии с набором правил. Маймье использовал идеи, которые более века назад уже развивали Дальгарно и Уилкинс: в пазиграфии каждый следующий знак уточняет значение слова.

«Тело» слова может состоять из трех, четырех или пяти символов, другие же знаки как бы окружают эту основу и уточняют ее значение (для того чтобы правильно комбинировать символы, Маймье разработал специальные таблицы). Комбинациями из трех знаков записывались служебные слова, междометия и другая лексика, необходимая для связи разных частей высказывания. Слова из четырех знаков обозначали вещи, действия и идеи, приближенные к повседневной жизни, например дружбу, родство, дело. Пятью символами записывались более сложные, отвлеченные термины, касающиеся таких сфер, как наука, искусство, религия, политика и так далее.

Еще одним человеком, который внес существенный вклад в развитие тайнописи, был немецкий гуманист и историк Иоганн Тритемий, автор трудов «Стеганография» (Steganographia — трехтомник, написанный около 1499 года и опубликованный лишь в 1606 году) и «Полиграфия» (Polygraphia, вышел в 1518 году).

Стеганография — способ передачи или хранения информации, при котором сам этот факт остается в тайне. Зашифрованное сообщение должно выглядеть как нечто другое: список покупок, статья, изображение. Собственно, сама книга Тритемия и являет собой пример стеганографии. На первый взгляд речь в ней идет о магии, об общении на расстоянии при помощи духов и прочих потусторонних материях. На самом же деле в первых двух томах рассказывается о стеганографии и криптографии как науках. Ключи к шифру были опубликованы в приложении к первому же изданию «Стеганографии» в 1606 году (пояснения, как расшифровать книги, оставил сам автор).

В этом месте стоит сделать лирическое отступление: с третьим томом все оказалось сложнее, потому что имевшийся ключ не подходил к тексту и таблицам. В течение почти трех веков люди спорили о том, что представляет собой книга — еще одно зашифрованное сообщение или все-таки пособие по черной магии. Католическая церковь в 1609 году на всякий случай внесла «Стеганографию» в Index Librorum Prohibitorum — список запрещенных книг (и вычеркнула лишь в 1900 году).

Первым опубликовал ключ к тексту третьего тома профессор немецкого языка Томас Эрнст. Он решил загадку «Стеганографии», будучи еще студентом, а в 1996 году в голландском журнале Daphnis вышла его 200-страничная статья. Правда, она осталась незамеченной.

Тем временем над расшифровкой «Стеганографии» работал еще один специалист — математик Джим Ридс. Он решил эту задачу независимо от Эрнста и только потом, уже отправив свои результаты в журнал, случайно наткнулся на его статью. В 1998 году в журнале Cryptologia вышла 26-страничная публикация Рида, в конце которой он добавляет: первым человеком, взломавшим код, следует считать на его, а Томаса Эрнста, который справился с шифром Тритемия несколькими годами ранее. Содержание же третьего тома «Стеганографии» оказалось весьма банальным: там были записаны, например, начало 21-го псалма, предостережение «Податель этого письма мошенник и вор. Остерегайтесь его. Он хочет навредить вам» и тому подобное (и никакой черной магии).

Труд «Полиграфия» состоит из шести томов, каждый из которых содержит огромное количество шифров, причем шифровал Тритемий как реальные (латинский), так и выдуманные им языки. Спустя несколько десятилетий император Священной Римской империи Фердинанд III вдохновился работами Тритемия и попросил профессора математики и востоковедения, энциклопедиста Афанасия Кирхера разработать некий «универсальный язык», чтобы с его помощью можно было бы делать «механический» перевод текстов с других языков. Результатом работы Кирхера стал трактат 1663 года Polygraphia nova.

Ученый предложил систему перевода, сводившую языки, на которых был написан текст, к общим аспектам. Сначала переводчику требовалось найти нужное слово в специальном словаре. В нем слова были разобраны на части: в каждом выделялась основа, затем к ней при помощи специальных символов можно было приписать нужный род, число, склонение, время, наклонение и так далее. В итоге вместо слова у переводчика получалось нечто похожее на код. После этого требовалось взять словарь того языка, на который нужно сделать перевод, и провести обратную операцию: преобразовать код в текстовый вид. Впрочем, по задумке Кирхера, перевод на целевой язык был необязательным: предполагалось, что текст, написанный при помощи универсальной системы, сам по себе может функционировать как язык.

Все эти увлеченные лингвисты, математики и энциклопедисты были, конечно, не единственными людьми, которые занимались созданием искусственных универсальных языков и пытались раскладывать слова на составляющие, чтобы каким-то образом сделать перевод «автоматическим». Но качественный рывок произошел только в начале прошлого века, и связан он с именами Петра Смирнова-Троянского и Жоржа Арцруни.

1933–1947: от первых патентов до дня рождения машинного перевода

В 1933 году два человека независимо друг от друга получили патенты на изобретения — предшественники компьютерных «переводчиков». Первым новатором был Жорж Арцруни, француз армянского происхождения. 22 июля 1933 года он запатентовал машину с многообещающим названием «Механический мозг», над которой работал с 1929 года. Она состояла из четырех компонентов: «памяти» (двуязычного словаря, записанного на бумажной перфоленте), клавиатуры для ввода слов, поискового механизма и инструмента для отображения перевода (несколько «окошек» на клавиатуре). По сути, «мозг» был механизированным словарем.

Преподаватель Петр Смирнов-Троянский 5 сентября 1933 года получил патент СССР № 40995. Его изобретение называлось «Машина для подбора и печатания слов при переводе с одного языка на другой» и было намного более продвинутой версией механического словаря (рис. 10).

Машина представляла собой стол с наклонной поверхностью, «по которому могла свободно и легко передвигаться в различных направлениях лента (2), снабженная отверстиями (3) для пальцев». На поверхность ленты наклеивался многоязычный словарь «с расстановкой столбцов слов так, чтобы слова на наиболее часто употребляемые буквы были ближе к середине». Интересно, что слова давались не в привычной нам форме, а разбивались на составные части — почти как у Кирхера. На ленте были написаны основы слов, а для выражения грамматических отношений между ними Смирнов-Троянский разработал набор «логических символов», которые явно заимствовал из эсперанто. Например, суффикс -aj указывал на существительное во множественном числе, суффикс -n использовался для обозначения прямого дополнения, -ir указывал на глагол и так далее.

Перед столом был закреплен фотоаппарат, совмещенный с печатной машинкой. Лента печатной машинки и пленка камеры соединялись, чтобы подаваться в приборы синхронно.

Чтобы стол работал, требовалось несколько человек. Первый (знающий исходный язык) готовил текст, то есть выделял в словах основы и приписывал к ним соответствующие «логические символы» для обозначения чисел, падежей, глагольных форм и так далее. Затем наступала очередь оператора: он должен был передвигать ленту со словами так, чтобы основа переводимого слова (и, соответственно, его эквивалентов на других языках) оказалась напротив объектива фотоаппарата. Далее требовалось сделать снимок, одновременно набрав на клавиатуре печатной машинки соответствующие «логические символы».

В итоге получалось две ленты: одна с основами слов сразу на нескольких языках, а вторая с грамматическими пояснениями к ним. Когда весь исходный текст был набран таким образом, люди, владеющие целевым языком, брали две ленты и превращали основы слов с набором символов в обычные слова. Далее материал передавался редакторам, знающим оба языка,—их задачей было довести текст до литературного вида.

Петр Смирнов-Троянский понимал все несовершенства свой системы. Работу оператора он надеялся впоследствии механизировать, проблему многозначных слов пытался решить при помощи специалистов-языковедов. (Самому Троянскому окончить университет помешала Первая мировая война. Впоследствии он окончил Институт красной профессуры и преподавал общественные науки, а также историю науки и техники в советских университетах.)

К сожалению, академическое сообщество к изобретению отнеслось очень скептически, и идеи Смирнова-Троянского были забыты. Он умер в 1950 году, совсем немного не дожив до начала работ по машинному переводу в СССР. Исследователи считают, что принципы переводной машины Смирнова-Троянского могли бы лечь в основу первых советских экспериментов и это поставило бы изобретателя в ряды отцов машинного перевода наряду с Уорреном Уивером — математиком, директором естественно-научного отделения Фонда Рокфеллера.

Подробнее читайте:
Хлюстова, Я. Поймать вавилонскую рыбку: Человеческий мозг, нейронные сети и изучение иностранных языков / Яна Хлюстова. — М. : Альпина нон-фикшн, 2024. — 248 с.

Источник

Статьи по теме

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

12 − 6 =

Кнопка «Наверх»