Лингвист Павел Гращенков / Фото: Пелагия Замятина / Вечерняя Москва

Переводчик с нивхского: Редкие языки сохраняют, используя новые технологии

Общество

В России 30 апреля впервые отметили День коренных малочисленных народов России. Лингвист Павел Гращенков на примере нивхского языка рассказал «Вечерней Москве» о ценности языков малых народов для науки и об использовании новых технологий в их сохранении.

— Павел Валерьевич, в чем особенность редкого нивхского языка?

— Во-первых, в нивхском языке нет прилагательных. Все то, что мы описываем прилагательными в русском, английском и других европейских языках, в нивхском задается глаголами. Они просто ставятся в нужные формы — и получается то же самое, описательная способность языка ничем не отличается. Во-вторых, в нивхском языке есть счетные классификаторы — как в китайском и языках Юго-Восточной Азии. Вы не можете сказать «два огурца», вы должны сказать: «два», потом специальное слово для огурцов, потом «огурцы».

Счетная классификация — это особенность ряда языков не только в Азии, но и в Южной Америке. А среди языков, распространенных на территории России, нивхский уникален. В русском есть лишь похожие явления: «два человека студентов» или «десять голов скота». А в языках со счетной классификацией вообще нельзя считать без использования специальных слов. В нивхском счетная классификация очень развитая, вся грамматика числительных сложная.

— А почему вы решили заняться его сохранением?

— Сохранять надо все языки, которые исчезают. Чем больше языков мы сохраняем — в живом виде, когда носители общаются, или хотя бы документируем максимально, — тем больше мы знаем о человеке.

— И какие знания о человеке дает язык малого народа?

— Если взять нивхский, то я рассказывал про прилагательные и числительные, но есть еще много вещей, интересных лингвистам. В современной лингвистике есть ряд теорий, которые предполагают, что язык устроен определенным образом.

Например, что во всех языках подлежащее должно согласовываться со сказуемым. Но на материале малых языков мы можем сделать наблюдения, которые опровергают наши представления о чем-то. Так, долго дискутировалось: могут ли существовать языки без частей речи — существительных, глаголов, прилагательных? И сегодня известно, что языки без прилагательных существуют (нивхский — тому пример), а вот без глаголов и существительных — нет. Поэтому каждый язык, который мы начинаем детально записывать, может сказать нам что-то важное для общих знаний о человеческом языке.

— На базе лаборатории автоматизированных лексикографических систем НИВЦ МГУ, которой вы руководите, вы занимаетесь нивхским уже третий год. Как новые технологии помогают в сохранении языка?

— К сожалению, никаких готовых методик, которые помогли бы сохранить язык или оживить его с помощью компьютеров, нейросетей, — нет. Но помочь они могут. Так, сейчас мы составляем корпус текстов для нивхского языка — совокупность разных текстов, которая станет базой для исследований. Сейчас осталось всего несколько десятков его носителей. И всем им уже около 80 лет. При этом между собой они уже не общаются — живут в разных местах. Они сами записывают кто что может: кто-то национальные легенды, мифы, сказки, кто-то составляет свои словари. Но в целом язык перестал передаваться молодым поколениям.

А наши студенты создали прототип русско-нивхского переводчика. И параллельно — инструмент для автоматического разбора нивхских текстов. Мы на основании собранных данных обучаем нейросети, которые помогут размечать нивхские данные или делать перевод.

— Зачем русско-нивхский перевод, если уже почти никто не говорит по-нивхски?

— Есть известные примеры языков, которые были возрождены. Так, иврит был возрожден практически с нуля несколькими энтузиастами, один из которых как раз был выходцем из Российской империи. Нивхов сейчас столько же, сколько и 100 лет назад, — 4,5 тысячи человек. И они энтузиасты своей культуры и традиций.

Если мы создадим набор инструментов для работы с нивхским языком, например переводчик, мы сможем им помочь. К примеру, виртуальный ассистент, вроде умной колонки, с которым дети могут взаимодействовать, — это один из очень хороших инструментов для возрождения языка. Но для создания колонки на нивхском нужны профессиональные разработчики, мощности, инструменты для синтеза и распознавания речи. Поэтому мы были бы рады поддержке со стороны крупных ИТ-компаний.

КСТАТИ

Нивхи (устар. гиляки) — коренной малочисленный народ, проживающий на Дальнем Востоке России. Представляют собой коренное население Приамурья, острова Сахалин и ближайших островов, заселившее регион 12 000 лет назад.

amp-next-page separator