Йа:
из совпавших результатов минимум 90% верны.
Вы:
Почему процент ошибок должен отличаться на других версиях?
когда я ввожу эту свою оценку, я очень грубо и интуитивно оцениваю не процент ошибок. Я сначала прикидываю вероятность того, что НЕПРАВИЛЬНЫЕ вердикты совпадут, для этого можно использовать следующее:
из шестнадцати вариантов случайная флуктуация должна выбрать один и тот же тип дважды.
1. ТИМы распределены равномерно (для простоты расчетов), то есть каждый тип встречается в природе в 1/16 случаев.
2. Ошибки распределены равномерно (опять же для простоты расчетов).
прикидываю, интуитивно чувствую, что очень маловероятно
совпадение вердиктов для НЕПРАВИЛЬНЫХ типов (думаю, можно и точно это оценить, но все лень). И чувствуя вот это, оцениваю уже долю ПРАВИЛЬНЫХ типов в совпавших как 90%
но при этом о том, что происходит в несовпавших типах я вообще не знаю. поэтому и не понимаю ваших расчетов в этой области.