Соревнование морфологических парсеров

Информация о пользователе

Привет, Гость! Войдите или зарегистрируйтесь.


Вы здесь » Соревнование морфологических парсеров » Лемматизация » Лемматизация глаголов


Лемматизация глаголов

Сообщений 1 страница 3 из 3

1

Как быть с расхождением в лемматизации из-за того, что в морфологическом словаре глаголы совершенного и несовершенного вида могут быть слиты в одну статью? Так,  наш парсер для глаголов типа "закопает" выдаст лемму "закапывать" вместо  "закопать".

0

2

Да, я близко знакома с этой проблемой. Обсуждаемый сейчас вариант решения - что у оценщиков есть возможность отнести такие расхождения к категории "спорный вопрос грамматической теории" - и в дальнейшем при количественной оценке точности не штрафовать их. Что вы думаете?

0

3

Безусловно, люди-оценщики могут отнести такие расхождения к категории "спорный вопрос грамматической теории", но по хорошему оценивать точность надо бы программно. Программе нужно как-то указать, за какие расхождения штрафовать, а за какие нет. В данном  случае расхождения возможны у нескольких тысяч глаголов, все их перечислять затруднительно.
Нам кажется , что по крайней мере для таких глаголов можно выработать простые требования к формированию леммы: это должен быть инфинитив того же вида, что и анализируемая словоформа. Породить такую лемму будет несложно, а число расхождений из-за "спорных вопросов" снизится в десятки/сотни раз. Если это требование будет озвучено, мы подстроим под него анализатор.

0


Вы здесь » Соревнование морфологических парсеров » Лемматизация » Лемматизация глаголов


Рейтинг форумов | Создать форум бесплатно