«Алиса» получила нейросеть YandexGPT 2 — она отвечает на вопросы лучше старой в 67 % случаев - РУПОР PRO | Новости науки и технологий

«Яндекс» представил новую версию большой языковой модели YandexGPT 2 — она уже поддерживается голосовым помощником «Алиса» и отвечает на пользовательские запросы лучше старой в 67 % случаев. Этого удалось добиться за счёт улучшений на каждом этапе обучения модели, главным из которых оказался претрейн (pretrain).

Источник изображений: ya.ru/gpt/2

Для сравнения качества работы первой и второй моделей YandexGPT разработчики подготовили набор из 500 пользовательских заданий, которые максимально отличаются друг от друга, предложили их обеим моделям и сравнили результаты — новая оказалась лучше в 67 % случаев. Чтобы конкретизировать критерии, поставленные задачи были поделены на группы, и оценки отдельно провели по каждой из них:

генерация текста — YandexGPT 2 победила в 69 % заданий;
пересказ и анализ текста — 68 %;
«мозговой шторм» идей — 66 %;
стилизация текста под аудиторию или конкретного пользователя — 62 %;
ответы на вопросы — 62 %.

Обучение моделей производится в два этапа: один называется претрейн (pretrain), второй — файнтюн (finetune). Первый отвечает за сбор фактической информации, второй — за формат и стиль ответа. Эти этапы независимы друг от друга в том смысле, что проблемы одного невозможно исправить на другом. На этапе претрейна ИИ потребляет полезные знания, поэтому разработчикам необходимо правильно набирать их в общий массив — датасет. Обучать модель заново с каждым изменением датасета — слишком трудозатратный и недешёвый процесс. Поэтому переобучение производится, когда накапливается определённая критическая масса обновлений датасета.

Есть и другая проблема: обновлённый датасет может не улучшить, а ухудшить качество работы модели, и контролировать это вручную тоже крайне сложно, потому что чем выше качество датасета, тем труднее обнаруживать его проблемы. Данный процесс решили автоматизировать, производя тестовое обучение маленьких, быстрых моделей, разные версии которых сравниваются по качеству работы. При этом маленькая модель не всегда в полной мере отражает качество большой, поэтому приходится пользоваться дополнительными инструментами:

классификатор некачественного текста помог обнаружить проблемы с кодировками, наличие лишних тегов HTML, повторы предложений и другие ошибки;
классификатор полезного текста помог обнаружить, отвечает ли материал на конкретный вопрос пользователя;
долю текстов с высокой цитируемостью увеличили;
долю дублей сократили до значения менее 0,5 %;
запустили инструмент для оценки «фактовой полноты» — претрейн обучили давать ответы на 80 % фактовых запросов, с которыми справляется поисковая служба «Яндекса».

Модель YandexGPT 2 уже интегрирована в голосового помощника «Алиса» в навыке «Давай придумаем» в «Яндекс Станциях», умных телевизорах с «Алисой», приложении «Яндекса», в «Яндекс Браузере», а также на поисковых страницах ya.ru. Разработчики модели продолжат совершенствовать датасеты для претрейна и файнтюна. В перспективе планируется внедрение обучения с подкреплением на основе отзывов людей (RLHF — Reinforcement Learning from Human Feedback). Нейросеть появится и в других сервисах «Яндекса», где она может оказаться полезной.

Источник

Рупор Про07.09.2023

0 207 Время чтения: 2 мин.

«Алиса» получила нейросеть YandexGPT 2 — она отвечает на вопросы лучше старой в 67 % случаев

Добавить комментарий Отменить ответ

В процессорах Apple M1, M2 и M3 нашлась уязвимость, которую невозможно полностью устранить

Amazon уволит ещё 180 сотрудников игровых подразделений, зато сосредоточит усилия на бесплатных раздачах игр Prime Gaming

Массовые увольнения в технологическом секторе стали новой нормой

Apple представила процессоры M3, M3 Pro и M3 Max с мощной графикой и аппаратной трассировкой лучей

Хакеры украли данные более 82 тыс. человек, взломав ресурсы владельца CBS и Paramount

Одиночный майнер добыл блок в сети Биткоина и получил 6.25 BTC

TeamGroup представила высокоскоростные модули памяти T-Force Xtreem ARGB DDR5 с частотой до 8200 МГц

Creative выпустит первые в мире серийные TWS-наушники с MEMS-динамиками

Xiaomi откажется от MIUI — популярную оболочку заменит MiOS

Gigabyte выпустит новую модель бюджетного ультраширокого 34-дюймового монитора

Обзоры показали, что AMD соврала: GeForce GTX 1650 разгромила встройку Ryzen 7 8700G

Человекоподобный весельчак и аналог шимпанзе: разработчики Atomic Heart показали геймплей с уникальными роботами

Медицинский ИИ Google оказался человечнее живых врачей, но не всё так просто

Самолёт Virgin Atlantic выполнит первый трансатлантический перелёт на растительном масле

YMTC улучшит китайскую память 3D NAND даже под санкциями — готовится архитектура Xtacking 4.0

Прозрачный ноутбук Lenovo снова показался на изображении — его представят в конце февраля на MWC 2024

Американский лунный модуль Nova-C не пережил лунную ночь

AMD на направлении ИИ в следующем году сможет выручить не менее $400 млн

Антикризисный менеджмент в России: актуальное состояние и проблемы от эксперта

«Сбер» научил GigaChat создавать уникальную музыку по текстовому описанию

Статьи по теме

Добавить комментарий Отменить ответ