Яндекс снял документальный фильм «Саха Тыла. Как научить машину понимать якутский»

17:56 - 22.12.2021 / 929 просмотров

Яндекс выпустил второй номер журнала ТЕХНО, который посвящён технологиям машинного перевода.

Главным материалом стал документальный фильм «Саха Тыла. Как научить машину понимать якутский». Он о том, как благодаря одному инициативному человеку в Переводчике появился якутский язык. Алексей Иванов собрал основу для обучения нейросети, обратился к программистам Яндекса и им вместе удалось сделать доступным малый язык для большого количества людей.

"Обучить якутскому языку оказалось непросто. Алексей Иванов собрал корпус якутских текстов и подготовил более 100 тысяч строк на разные темы для обучения нейросети. Данных всё же оказалось недостаточно, но разработчики Яндекса придумали обучение на языках, родственных якутскому, и решили проблему.

В фильме объяснили, как устроен машинный перевод и что нужно, чтобы нейросеть «выучила» новый язык с учётом всех его сложностей и особенностей. А ещё рассказали о героях, которые занимаются сохранением родного якутского языка: учат его заново во взрослом возрасте, используют в работе, снимают фильмы, пишут музыку. Съёмками фильма в Якутии и Москве занималась студия Stereotactic.

Ещё во втором выпуске ТЕХНО — подкаст с руководителем Переводчика Антоном Дворковичем, лонгриды о разработке машинного перевода, рассказ про обучение Переводчика эльфийскому, эмодзи, сложным языкам, для которых слишком мало данных, а также несколько тестов, которые помогут взглянуть на машинный перевод и языки «изнутри»:

— «Лингвоконструктор». Пользователь угадывает значение слова по значениям однокоренных слов из родственных языков.

— «Эмодзи-караоке». Угадайка песни по её переводу на язык эмодзи.

— «Как это по-русски». Для знатоков английского и любителей логики: нужно угадать, кто сделал перевод — человек или машина.

— «Переводи как машина». Тест, в котором можно увидеть, как машина подбирает лучший перевод предложения.

Журнал выпускается при поддержке издания N + 1, первый выпуск был посвящён языковым моделям.

Герои фильма

Герои фильма — люди, которые своим творчеством помогают сохранить родной язык. Они используют его в разных сферах современной культуры, опираются на личный опыт

Дуня Захарова — соврменная художница родом из Якутии

IAN HOPELESS — рэпер, пишет треки на двух языках.

Crispy Newspaper — хардкор-группа лейбла Юность Севера

Андрей Ноговицын — преподаватель и фотограф, который учит забытый язык заново

Люба Борисова — режиссер кинокомпании Сахафильм, где зародился феномен якутского кино

Алексей Васильев — фотограф, исследующий якутские традиции", - сообщает Яндекс.

Sakhaday.ru