Яндекс снял документальный фильм «Саха Тыла. Как научить машину понимать якутский»
Яндекс выпустил второй номер журнала ТЕХНО, который посвящён технологиям машинного перевода.
Главным материалом стал документальный фильм «Саха Тыла. Как научить машину понимать якутский». Он о том, как благодаря одному инициативному человеку в Переводчике появился якутский язык. Алексей Иванов собрал основу для обучения нейросети, обратился к программистам Яндекса и им вместе удалось сделать доступным малый язык для большого количества людей.
"Обучить якутскому языку оказалось непросто. Алексей Иванов собрал корпус якутских текстов и подготовил более 100 тысяч строк на разные темы для обучения нейросети. Данных всё же оказалось недостаточно, но разработчики Яндекса придумали обучение на языках, родственных якутскому, и решили проблему.
В фильме объяснили, как устроен машинный перевод и что нужно, чтобы нейросеть «выучила» новый язык с учётом всех его сложностей и особенностей. А ещё рассказали о героях, которые занимаются сохранением родного якутского языка: учат его заново во взрослом возрасте, используют в работе, снимают фильмы, пишут музыку. Съёмками фильма в Якутии и Москве занималась студия Stereotactic.
Ещё во втором выпуске ТЕХНО — подкаст с руководителем Переводчика Антоном Дворковичем, лонгриды о разработке машинного перевода, рассказ про обучение Переводчика эльфийскому, эмодзи, сложным языкам, для которых слишком мало данных, а также несколько тестов, которые помогут взглянуть на машинный перевод и языки «изнутри»:
— «Лингвоконструктор». Пользователь угадывает значение слова по значениям однокоренных слов из родственных языков.
— «Эмодзи-караоке». Угадайка песни по её переводу на язык эмодзи.
— «Как это по-русски». Для знатоков английского и любителей логики: нужно угадать, кто сделал перевод — человек или машина.
— «Переводи как машина». Тест, в котором можно увидеть, как машина подбирает лучший перевод предложения.
Журнал выпускается при поддержке издания N + 1, первый выпуск был посвящён языковым моделям.
Герои фильма
Герои фильма — люди, которые своим творчеством помогают сохранить родной язык. Они используют его в разных сферах современной культуры, опираются на личный опыт
Дуня Захарова — соврменная художница родом из Якутии
IAN HOPELESS — рэпер, пишет треки на двух языках.
Crispy Newspaper — хардкор-группа лейбла Юность Севера
Андрей Ноговицын — преподаватель и фотограф, который учит забытый язык заново
Люба Борисова — режиссер кинокомпании Сахафильм, где зародился феномен якутского кино
Алексей Васильев — фотограф, исследующий якутские традиции", - сообщает Яндекс.