О проекте VepKar

Vepsän korpusas i Vepsän i karjalan avokorpusas

Добро пожаловать в VepKar — открытый корпус вепсского и карельского языков, содержащий словари и корпуса прибалтийско-финских языков народов Карелии.

Проект VepKar является продолжением работ по Корпусу вепсского языка. Сотрудники Карельского научного центра РАН заполняют словарь и добавляют тексты в Корпус вепсского и карельского языков. Корпус карельского языка включает собственно-карельское, ливвиковское и людиковское наречия, обладающие в настоящее время собственными младописьменными формами.

Программная оболочка корпуса VepKar — это разрабатываемый нами проект с открытым исходным кодом Dictorpus и открытыми данными (лицензия CC-BY). Название проекта "Dictorpus" указывает на объединение словаря (DICTionary) и корпуса (cORPUS). Программа Dictorpus предназначена для коллективов лингвистов, работающих с языками мира. На данный момент в программу включена поддержка и учитываются особенности вепсского и карельского языков.

Проект поддержан грантами РГНФ и РФФИ.

Публикации проекта

Что такое «корпус языка»

Корпус — это информационно-справочная система, основанная на собрании текстов в электронной форме. С помощью электронного словаря, включенного в корпус, вы можете быстро искать и обрабатывать тексты. Именно такие корпуса и словари мы разработываем в рамках проекта «VepKar».

VepKar в цифрах

Корпус вепсского и карельского языков был открыт 24 июля 2016. На данный момент в корпусе:
31019 статей
о словах
2598 текстов на 6 языках
и 45 диалектах