ВепКар :: Открытый корпус вепсского и карельского языков

О проекте ВепКар

Livvin piämurdehes Vepsän-karjalkielizes avvokorpusas

Добро пожаловать в ВепКар — открытый корпус вепсского и карельского языков, содержащий словари и корпуса прибалтийско-финских языков народов Карелии.

Проект ВепКар является продолжением работ по Корпусу вепсского языка. Корпус карельского языка включает собственно карельское, ливвиковское и людиковское наречия, обладающие в настоящее время собственными младописьменными формами.

На сайте корпуса представлены тексты на карельском и вепсском языках, словари и фольклорные коллекции. Речевой корпус содержит тексты, сопровождаемые аудиозаписями. Руководство для пользователей ВепКар научит вас работать в корпусе и пользоваться поисковыми инструментами. Материал ВепКара является основой для таких разрабатываемых ресурсов, как Аудиокарта прибалтийско-финских языков Карелии, Мультимедийный словарь карельского языка LiPaS – Livvin paginan sanat и Людиковский диалектный лексикон.

Программная оболочка корпуса ВепКар — это разрабатываемый нами проект с открытым исходным кодом Dictorpus и открытыми данными (лицензия CC-BY). Название проекта "Dictorpus" указывает на объединение словаря (DICTionary) и корпуса (cORPUS). Программа Dictorpus предназначена для коллективов лингвистов, работающих с языками мира. На данный момент в программу включена поддержка и учитываются особенности вепсского и карельского языков.

Проект поддержан грантами РГНФ, РФФИ и РНФ.

Публикации проекта

Что такое «корпус языка»

Корпус — это информационно-справочная система, основанная на собрании текстов в электронной форме. Корпус включает в себя тексты и словари, хранящиеся в базе данных, и компьютерную программу, обеспечивающую поиск и обработку текстов.

ВепКар в цифрах

Корпус вепсского и карельского языков был открыт 24 июля 2016. На данный момент в корпусе:
69 339 статей
о словах
6 751 текст на 53 диалектах
2 162 327    слов
ä