Ирина Эглит писал(а):Далее - повторяемость. Берем и определяем ТИМы по модели нескольких людей, потом берем другие тексты этих же людей. Если мы снова определим эти же ТИМы, то у нас есть посторяемость, т.е. мы определяем некую устойчивую структуру. Модель отражает мир. То же самое можно сделать раздельно для размерностей, знаков, тальности, чтобы убедиться, что не зависимо от текста мы определяем одно и то же у одного человека.
Если это ПР, то проделывается то же самое. По одному и тому же тексту несколько типировщиков определяют какой-то признак. Если у них есть сходимость между собой, то признак существует. Типировщикам даются разные тексты одного человека (желательно в перемешке с текстами других людей). Если они независимо друг от друга у одного и того же человека определяют одни и те же ПР, то признаки - существуют, есть повторяемость.
Наш эксперимент, который показывает повторяемость и сходимость уже проведен. В первом посте есть ссылка. Сходимость и повторяемость в ШСС на уровне 80%.
Все клево, только нюанс в том, что сходимость по элементам в 80% дает сходимость по типам при количестве в три элемента (размерность, знаки, тальность): 0.8 * 0.8 * 0.8 = 0.512 = 51.2%
Плюс к этому еще нужно учесть ненулевую вероятность узнавания автора текста, и тогда получаем совсем другие результаты.
Если же говорится о 80% независимо от элементов (то есть неважно повторяемость по определению ТИМов или повторяемость по определению размерности), то это противоречит матмодели + тогда непонятно зачем городить огород и не получать ТИМ сразу, если вероятность его определения таже, что и знаков.