Источник: Цифровая Югра

На IT-форуме в ХМАО обсудили спасение языков коренных народов с помощью ИИ

В мире подходы к сохранению многоязычия сильно различаются  /  Фото: Цифровая Югра

На полях XVII Международного IT-форума в Ханты-Мансийске прошла экспертная сессия, посвященная цифровому будущему малых языков. Эксперты из разных стран мира обсудили, как технологии могут помочь спасти от исчезновения наречия коренных народов, а также затронули этические границы использования искусственного интеллекта в этой сфере. Об этом сообщили в департаменте информационных технологий и цифрового развития Югры.

В центре внимания участников круглого стола «Как помочь языкам коренных народов освоить мир ИИ» оказался уникальный опыт Югры. Специалисты Югорского НИИ информационных технологий (ЮНИИТ) представили результаты своей трехлетней работы. За это время они оцифровали 400 книг — практически все имеющиеся письменные источники из окружной библиотеки — и создали масштабный языковой корпус на 310 тысяч переводческих пар. Итогом этой масштабной работы стало появление одного из языков коренных народов Севера в популярном онлайн-переводчике компании «Яндекс».

Эксперты отметили, что сегодня в мире подходы к сохранению многоязычия сильно различаются. В ряде государств традиционную речь поддерживают на государственном уровне: выпускают словари, издают художественную литературу и вводят обязательное изучение местных наречий в вузах. В то же время во многих странах, например африканских, большинство языков практически не представлены в глобальной Сети. Специалисты предупреждают: если языка нет в цифровом пространстве, он стремительно теряет шансы на выживание и передачу будущим поколениям.

Для того чтобы обучить искусственный интеллект новому языку, требуется огромная база качественных данных: оцифрованные тексты, аудиозаписи живой речи, изображения и контрольные вопросы для проверки языковых моделей. Без этого системная цифровизация невозможна.

Участники форума сошлись во мнении, что технологии искусственного интеллекта не должны угрожать культурному разнообразию. Напротив, ИИ обязан работать на сохранение уникального наследия человечества.

Ранее NEFT писала, что в ХМАО создадут корпус хантыйского языка с четырьмя диалектами. Работы разделены на три этапа и должны завершиться к 30 ноября.

Подписывайтесь на наш канал в телеграме, чтобы узнать важные новости первыми

Екатерина Кузнецова

Корреспондент