О проекте VepKar

Livvin piämurdehes Vepsän-karjalkielizes avvokorpusas

Добро пожаловать в VepKar — открытый корпус вепсского и карельского языков, содержащий словари и корпуса прибалтийско-финских языков народов Карелии.

Проект VepKar является продолжением работ по Корпусу вепсского языка. Сотрудники Карельского научного центра РАН заполняют словарь и добавляют тексты в Корпус вепсского и карельского языков. Корпус карельского языка включает собственно-карельское, ливвиковское и людиковское наречия, обладающие в настоящее время собственными младописьменными формами.

Программная оболочка корпуса VepKar — это разрабатываемый нами проект с открытым исходным кодом Dictorpus и открытыми данными (лицензия CC-BY). Название проекта "Dictorpus" указывает на объединение словаря (DICTionary) и корпуса (cORPUS). Программа Dictorpus предназначена для коллективов лингвистов, работающих с языками мира. На данный момент в программу включена поддержка и учитываются особенности вепсского и карельского языков.

Проект поддержан грантами РГНФ и РФФИ.

Если вы используете VepKar или Dictorpus в своей научной работе, просим ссылаться на эту публикацию:

Зайцева Н.Г., Крижановский А.А., Крижановская Н.Б., Пеллинен Н.А., Родионова А.П. Открытый корпус вепсского и карельского языков (ВепКар): предварительный отбор материалов и словарная часть системы // Труды международной конференции «Корпусная лингвистика ‒ 2017». ‒ СПб., 2017. С. 172-177.

Что такое «корпус языка»

Корпус — это информационно-справочная система, основанная на собрании текстов в электронной форме. С помощью электронного словаря, включенного в корпус, вы можете быстро искать и обрабатывать тексты. Именно такие корпуса и словари мы разработываем в рамках проекта «VepKar».

VepKar в цифрах

Корпус вепсского и карельского языков был открыт 24 июля 2016. На данный момент в корпусе:
19545 статей
о словах
1785 текстов на 6 языках
и 42 диалектах