About VepKar

Varžinaiskarielah da VepKar-korpussah näh

Добро пожаловать в ВепКар — открытый корпус вепсского и карельского языков, содержащий словари и корпуса прибалтийско-финских языков народов Карелии.

Проект ВепКар является продолжением работ по Корпусу вепсского языка. Сотрудники Карельского научного центра РАН заполняют словарь и добавляют тексты в Корпус вепсского и карельского языков. Корпус карельского языка включает собственно-карельское, ливвиковское и людиковское наречия, обладающие в настоящее время собственными младописьменными формами.

Программная оболочка корпуса ВепКар — это разрабатываемый нами проект с открытым исходным кодом Dictorpus и открытыми данными (лицензия CC-BY). Название проекта "Dictorpus" указывает на объединение словаря (DICTionary) и корпуса (cORPUS). Программа Dictorpus предназначена для коллективов лингвистов, работающих с языками мира. На данный момент в программу включена поддержка и учитываются особенности вепсского и карельского языков.

Проект поддержан грантами РГНФ и РФФИ.

Публикации проекта

Что такое «корпус языка»

Корпус — это информационно-справочная система, основанная на собрании текстов в электронной форме. Корпус включает в себя тексты и словари, хранящиеся в базе данных, и компьютерную программу, обеспечивающую поиск и обработку текстов.

ВепКар в цифрах

Корпус вепсского и карельского языков был открыт 24 июля 2016. На данный момент в корпусе:
63 311 статей
о словах
3 140 текстов на 46 диалектах
Вы можете установить на свой телефон или планшет словарь вепсского и карельского языков Sanahelmi, построенный на основе данных ВепКар, в виде мобильного приложения для платформы Android.