907
ИИ-система спасет исчезающее ливвиковское наречие карельского языка
Петербургский Федеральный исследовательский центр РАН (СПб ФИЦ РАН) разработал первую специализированную систему автоматического распознавания речи для ливвиковского наречия карельского языка.

Фото: Baltphoto
Проект, поддержанный грантом Российского научного фонда, направлен на сохранение языкового наследия, находящегося под угрозой исчезновения, поскольку в повседневной жизни им активно владеют всего 5–7 тысяч человек. Об этом сообщили в Минобрнауки РФ.
Карельский язык, на котором говорят около 30 тысяч человек в мире (25 из которых живут в России), относится к исчезающим. Лингвисты отмечают, что без активных мер он может быть утрачен.
Новая технология не только поможет документировать устную речь, но и станет основой для онлайн-переводчика с функцией реального времени, а также инструментом для исследований культур коренных народов.
Система учитывает уникальные особенности карельской речи, включая частые переключения между карельским и русским языками в бытовом общении. Для обучения ИИ использовались тексты из открытого корпуса ВепКар, аудиозаписи носителей языка и другие источники.
Собранные данные хранятся на защищенном сервере, что позволяет совершенствовать алгоритмы и сохранять образцы устной речи для будущих поколений.
На первом этапе система будет доступна как компьютерное приложение, преобразующее речь через микрофон в текст. В перспективе разработку адаптируют для смартфонов, чтобы сделать технологию доступной широкой аудитории.
Ученые подчеркивают, что ключевой задачей стала работа с ограниченным объемом электронных ресурсов на карельском — для этого применялись методы, обеспечивающие высокую точность даже при малом количестве обучающих данных.
«Наша система — это шаг к сохранению не только языка, но и культурной идентичности его носителей», — пояснила старший научный сотрудник СПб ФИЦ РАН Ирина Кипяткова.
Она также отметила, что технология позволит автоматизировать стенографирование, анализ медиаконтента и создание систем перевода.
Помимо лингвистических исследований, разработка может быть использована в образовательных проектах и ассистивных сервисах. В работе над системой участвовали специалисты Карельского научного центра РАН, что подчеркивает межрегиональное значение проекта. Ученые надеются, что их работа вдохновит новые инициативы по сохранению языкового разнообразия России.
По информации:

Рекомендованы для посещения Петербургом2
|

Сергей Лазарев, Полина Гагарина и ANNA ASTI: кого послушать на VK Fest 2025 в Петербурге
Ева Польна, Лиза Арзамасова и День России: афиша Петербурга на неделю
Вечеринка Cava Disco, фестиваль «Паруса Кронштадта» и концерт A’Studio: афиша Петербурга на неделю
Главные события июня в Петербурге: фестиваль «Фортолет», «Алые паруса» и концерт «А’Студио»
Куда пойти с ребёнком летом в Санкт-Петербурге
Незабываемое лето в Петербурге: 10 вещей, которые нужно успеть до осени
