Якутский язык впервые участвует в крупнейшем соревновании систем машинного перевода WMT2022, проводимого в рамках международной конференции EMNLP. Об этом сообщил Алексей Иванов, инициатор поддержки якутского языка и языков КМНС в машинных переводчиках.
Workshop on Machine Translation проводится с 2006 года в рамках международных конференций по обработке естественного языка и является крупнейшей событием в мире машинного перевода.
«WMT проводится каждый год в разных странах под эгидой Ассоциации компьютерной лингвистики (ACL) и объединяет специалистов со всего мира. Иными словами, якутский язык впервые становиться открытым и доступным всему мировому сообществу разработчиков машинного перевода. Все крупные мировые университеты и компании, занимающиеся машинным переводом, смогут изучать якутский язык. Это наглядный пример масштабирования якутского языка», - поделился Алексей Иванов.
Для того, чтобы объективно оценить результаты переводов, нужна помощь носителей якутского языка. Необходимо оценить перевод каждого предложения по шкале от “очень плохо” до “очень хорошо”. Для этого надо зарегистрироваться на платформе https://toloka.yandex.ru и сообщить на e-mail ratnus@yandex.ru «id» участника экспертной оценки. Более подробную информацию можно получить, отправив запрос на указанный e-mail.
«Большую благодарность хотелось бы выразить ГАУ РС(Я) "Сахапечать". Необходимое количество данных, а именно текстовых материалов на якутском языке, доступных в сети Интернет, было получено из электронного издательства ulus.media»? - дополнил Алексей Иванов.
Справка:
Ранее, благодаря Алексею Иванову и рабочей группы компании «Яндекс» весной 2020 г. был запущен якутский язык в сервисе Яндекс.Переводчик. В декабре 2022 г. Яндекс выпустил фильм про якутский язык «Саха Тыла. Как научить машину понимать якутский». Проект по поддержке якутского языка в машинных переводчиках реализуется без государственной поддержки.