Список для обсуждения:
род - m, f, n
падеж - nom, gen, dat, acc, ins, loc
число - sg, pl
время/наклонение/причастие/деепричастие - pres, past, imper, inf, partcp, ger
лицо - 1p, 2p, 3p
NB формы типа "пишу" и формы типа "напишу" объединяются в форму непрош. времени (pres), формы типа "пойдемте" считаются формами imper, формы имен из серии "пойти в солдаты" считаются nom, "в году" (второй предложный, местный) - loc
счетная форма (два шар/а) - gen
Слова, по которым точно будут расхождения (предлагается не учитывать)
слова общего рода (врач)
формы "второго родительного" типа "попить чаю" - не у всех выделяются
звательный падеж - не у всех выделяется
сравнительные степени на ПО- - не у всех выделяется, по-разному лемматизируется
Список категорий, по которым НЕ БУДЕТ оценки (преимущественно классифицирующие категории):
переходность глагола
вид глагола
одушевленность имен
переходный/непереходный глагол
краткая/полная/сравнительная/превосходная форма прилагательного и наречия
ВОПРОС К УЧАСТНИКАМ:
что делать с возвратностью?
что делать с залогом (предлагается различать залог только у причастий или не рассматривать его вообще)?