ИИ чат-боты «думают» на английском, даже когда говорят на других языках

Большие языковые модели (LLM), лежащие в основе чат-ботов, «думают» на английском языке, даже если вопросы задаются на других языках, пишет ресурс New Scientist со ссылкой на исследование учёных Федеральной политехнической школы Лозанны. Чтобы понять, какой язык на самом деле используют LLM при обработке запросов, учёные изучили три версии модели Llama 2 компании Meta✴. Благодаря тому, что Llama 2 имеет открытый исходный код, исследователи смогли ознакомиться с каждым этапом обработки запроса.

Источник изображения: geralt/Pixabay

По словам одного из исследователей, они открыли эти модели и изучили каждый из их слоёв. ИИ-модели состоят из нескольких слоёв, каждый из которых отвечает за определённый этап обработки запроса: один переводит письменные подсказки в токены, другой контекстуализирует каждый токен, чтобы в итоге дать ответ.

Моделям были предложены три типа запросов на китайском, французском, немецком и русском языках. В одном случае предлагалось повторить заданное слово, во втором — перевести с одного неанглийского языка на другой, и в третьем — заполнить пробел в одно слово в предложении, например: «___ используется для занятий такими видами спорта, как футбол и баскетбол».

Отследив процессы, через которые проходит LLM, чтобы ответить на запрос, учёные обнаружили, что путь обработки через слои почти всегда проходит через то, что они называют английским подпространством. То есть, если предложить модели перевести с китайского на русский, русские символы проходят через английское подпространство, прежде чем вернуться на русский, говорит учёный, что является убедительным признаком того, что модели используют английский, чтобы помочь себе понять суть запроса.

Это вызвало у учёных обеспокоенность по поводу того, что использование английского языка в качестве посредника для обучения модели анализу языка несёт с собой риск распространить связанные с этим ограничения в мировоззрении на другие лингвистически и культурно отличающиеся регионы.

«Если английский станет основным языком, на котором системы обрабатывают запросы, мы, скорее всего, потеряем концепции и нюансы, которые можно оценить только на других языках», — говорит Карисса Велиз (Carissa Véliz) из Оксфордского университета.

Существуют также более фундаментальные риски, связанные с кодированием используемых во всем мире генеративных ИИ с англоцентрическими ценностями, сообщила Алия Бхатия (Aliya Bhatia) из Центра демократии и технологий в Вашингтоне (округ Колумбия). «Если модель используется для генерации текста на языке, которому она не обучена, это может привести к культурно нерелевантным галлюцинациям, а если модель используется для принятия решений о предоставлении убежища для сообщества, которое не вписывается в англоцентрическое воображение обществе, модель может стоять между человеком и доступом к безопасности», — говорит она.

Источник

Рупор Про09.03.2024

0 56 Время чтения: 2 мин.

Добавить комментарий Отменить ответ

OnePlus представила доступный флагманский смартфон Ace 3 — до 1 Тбайт памяти, Snapdragon 8 Gen 2 и зарядка на 100 Вт

Spotify изменила стоимость премиум-подписок для пользователей из некоторых стран

Техпроцесс Intel 10A будет освоен к концу 2027 года

Почти половина россиян пользуется Telegram ежедневно

Netflix резко нарастила аудиторию и прибыль, запретив совместное использование аккаунтов

Власти Арканзаса будут регулировать майнинг наравне с центрами обработки данных

Студия экс-режиссёра Dragon Age показала геймплей Eternal Strands — битва против огромного автоматона с огненным молотом

NVIDIA авансом оплатила крупные поставки памяти HBM3e от SK hynix и Micron

Apple осталась единственным крупным производителем без складного смартфона

Батареи и силовые установки для электромобилей «Атом» помогут разработать в Китае, но выпускать их будут в России

Учёные из Сингапура обучили ИИ-чат-бот эффективному способу взлома других чат-ботов, используя подсказки

Коллекционер ДНК. Как биологи открыли эксклюсому — новую структуру в клетках млекопитающих

«Самый важный патч в истории видеоигр»: разработчики Baldur’s Gate 3 побрили кота в ответ на недовольство фанатов

BenQ представила игровой проектор X3100i — частота обновления до 240 Гц и диагональ до 150 дюймов

В самый разгар разработки GTA VI команде переводчиков Rockstar понадобился тестировщик русской локализации

Компания отдала мошенникам $25,6 млн после видеоконференции с дипфейками

Гетеротрофные бактерии запомнили цикличность смены дня и ночи

Сюжет, создатели, участие Кори Барлога: Amazon раскрыл первые подробности сериала по God of War

Canalys: в следующем году объёмы поставок ПК увеличатся на 7,6 %

SpaceX установила новый рекорд многоразовости Falcon 9

Статьи по теме

Добавить комментарий Отменить ответ