![Искусственный интеллект научили говорить на украинском](http://static2.gazeta.ua/img2/cache/preview/976/976332_w_800.jpg?v=0)
2020-7-27 09:43 |
Искусственный интеллект впервые научили говорить на украинском языке. Искусственный интеллект создали на базе модели GPT-2, которая позволяет нейросети генерировать текст, близкий к языку людей. Языковая модель выбирает слова, основываясь на предыдущих.
Строит логическое дерево последовательностей. Этим занималось технологическое креативное агентство ISD Group, сообщает ain. ua.
"Разработка интеллекта заняла полгода от составления языкового корпуса к шлифовке конечного результата. Команда проекта состояла из 8 человек", - рассказал основатель и руководитель агентства Виктор Шкурба.
Разработчики использовали украинские словари Lang-uk, Brown-uk, ВЕСУМ и ГРАЧ для создания речевого корпуса. Собрали 3 гигабайта произведений на украинском из онлайн библиотек.
Затем генератор GPT-2 дополнили инструментами, которые помогают строить контекст и корректные последовательности слов в текстах.
"Этого было мало, ведь на выходе нейросеть "говорила" старомодно. Впоследствии к языковому корпусу добавили субтитры современных фильмов, сериалов, блоги, твиты и другой user-generated контент из социальных сетей. Таким образом интеллект начал говорить современно и сленгово", - добавил Шкурба.
Позже разработчики решили предоставить нейросети характер.
"На втором этапе разработчики решили пойти на эксперимент. Не повторять создание нейтральной системы, искусственного советчика, а пойти дальше и придать ей характер. Это плохой парень, даже немного сумасшедший, который постоянно подталкивает своих друзей на какие-то безумные поступки", - сообщил руководитель агентства
Для сбора данных привлекли молодежь через открытые игровые телеграмм-боты. Пользователи давали ответы на вопросы. После этого через нейросеть несколько раз пропускали вымышленные ею же идеи. Обозначали наиболее удачные.
ЧИТАЙТЕ ТАКЖЕ: Facebook перешел на украинскую транслитерацию Kyiv
"Для этого в ISD создали систему похвалы и наказаний для АИ. Каждый сгенерированный вариант набирал определенный score, состоящий из "оценок" следующих параметров: ширины контекста, учета темы предыдущего предложения, связности и удаленности от исходных вариантов датасета. При учете всех параметров, нейросеть получала "плюсы" - rewards, но за злоупотребление ими система давала "минус" - penalties", - рассказал Виктор Шкурба.
Нейросеть удалось заставить выполнять определенные действия по шаблонам языкового корпуса и скорректировать генерацию последовательностей в сторону самых непредсказуемых и неординарных ответов.
Испытать искусственный интеллект можно по ссылке.
На сайте президента Украины создали электронную петицию с требованием обеспечить возможность просмотра видео на стримингових сервисах на украинском языке.
.
Подробнее читайте на gazeta.ua ...