Моделирование типирования по эксклюзивным признакам

Гипотезы, обсуждения, наблюдения, факты

Моделирование типирования по эксклюзивным признакам

Сообщение Danidin » Сб сен 29, 2018 9:45 pm

Цель: смоделировать, как меняется вероятность верного определения типа по мере увеличения числа задаваемых респонденту вопросов, являющихся эксклюзивными для данного типа.
Порядок моделирования:
1. генерируем набор квазислучайных соционических профилей (с широкой вариативностью расклада по дихотомиям) и из него выбираем 160 признаков, наиболее эксклюзивных для определённого типа (у которых в типном профиле столбец нужного типа лидирует с заданным отрывом)
2. генерируем набор квазислучайных соционических профилей (с близким к реальному раскладом дисперсии по признакам и учётом наличия отрицательного эксцесса в распределении популяции по наиболее сильным из них) - по 1000 на каждый тип
3. считаем ответ каждого из 16000 респондентов на каждый из 160 вопросов - как сумму корреляции типных профилей респондента и признака плюс некоторое количество случайного шума (да, это немного криво, но пока так).
4. определяем типный состав группы респондентов, которые по результатам одного или более вопросов попадают в верхнюю 1/16 по сумме своих ответов за эти вопросы. Прослеживаем изменение этого расклада по мере увеличения числа используемых для типирования вопросов. Определяем долю искомого типа в этой верхней 1/16 как надёжность методики.

Допущения:
1. численность всех типов в выборке одинаковая
2. среднее ответов на все вопросы принято за ноль
3. дисперсия всех вопросов в проекции на набор 15 признаков полагается одинаковой
4. дисперсия всех профилей респондентов в проекции на набор 15 признаков полагается одинаковой
5. искажающее симметрию социона взаимовлияние признаков не учитывается
6. ответы респондентов на вопросы взяты "как есть" а не приведены к квантованной шкале да-не_знаю-нет(-1...0...1) или 1-2-3-4-5
7. тонкие эффекты, вроде разногго уровня зашумлённости ответов у разных типов в связи с разным уровнем чёткости самовосприятия, не учитываются.

типирование_по_эксклюзивным_признакам.png
типирование_по_эксклюзивным_признакам.png (306.84 КБ) Просмотров: 1489

Первые 4 графика - типичные варианты роста вероятности верного диагноза с увеличением числа вопросов, далее указаны варианты с тем или иным изменением параметров моделирования.

Скачать код программы с яндекс-диска.

Вывод: вероятность верного определения типа по его эксклюзивным признакам растёт по мере увеличения числа предъявляемых респонденту подобных признаков (вопросов). Однако, в силу того, что все эксклюзивные свойства одного типа сильно скоррелированы меж собой (?), рост вероятности верного типирования человека в предполагаемый тип только по его эксклюзивным признакам, имеет естественный потолок в районе 66+/-2% (по крайней мере, для рассматриваемой автором методики расчёта этой вероятности). Влияние шума в ответах респондентов на высоту этого потолка не столь значительно и приводит скорее не к снижению максимальной точности (потолка надёжности), но к повышению необходимого для достижения этого потолка числа вопросов.
При доле шума в ответе около 70% (взятом за норму) нет практического смысла задавать более 80 эксклюзивных вопросов, так как после этого числа вероятность выходит на ровное плато в районе 60%, и почти перестаёт расти. В варианте с нулевым вкладом шума (в реальности не бывает) плато достигается много раньше, в районе 10 вопроса. Для варианта с минимальными требованиями к эксклюзивности вопросов (к типированию допускаются все признаки, в типном профиле которых столбец нужного типа просто лидирует, даже без какого-либо отрыва) надёжность снижается на 5-6% относительно варианта с сильными фильтрами.
Таким образом, автор полагает, что в типодиагностике всё же лучше использовать весь широкий спектр соционических вопросов, а не его узкую часть - в силу того, что в последнем случае используемые вопросы оказываются сильно скоррелированы и плохо подходят для различения близкородственных типов. Либо, как вариант, можно рассмотреть модель типирования, где эксклюзивные вопросы на тип сочетаются с вопросами, наиболее надёжно отличающими его от типов-соседей (в первую очередь, от квазитождественного и родственного по сенсорике-интуиции).
Последний раз редактировалось Danidin Сб сен 29, 2018 10:35 pm, всего редактировалось 1 раз.
Danidin
Местный
Местный
 
Сообщения: 1700
Зарегистрирован: Вс май 30, 2010 7:51 pm
Откуда: Санкт-Петербург
Медали: 6
Пол: Мужской
Соционический тип: Робеспьер
Темперамент: Меланхолик

Моделирование типирования по эксклюзивным признакам

Сообщение Danidin » Сб сен 29, 2018 9:46 pm

резерв
Danidin
Местный
Местный
 
Сообщения: 1700
Зарегистрирован: Вс май 30, 2010 7:51 pm
Откуда: Санкт-Петербург
Медали: 6
Пол: Мужской
Соционический тип: Робеспьер
Темперамент: Меланхолик

Моделирование типирования по эксклюзивным признакам

Сообщение Kuvaldos » Сб сен 29, 2018 10:04 pm

Империя пытается наносит ответный удар :add167
Аватара пользователя
Kuvaldos
Гуру
Гуру
 
Сообщения: 12709
Зарегистрирован: Ср июн 06, 2012 3:23 pm
Медали: 3
Пол: Мужской
Соционический тип: Максим Горький
Профессия: Ударник

Моделирование типирования по эксклюзивным признакам

Сообщение Danidin » Вт окт 02, 2018 12:33 am

На основе смоделированных данных построил графики распределения ответов респондентов - после того, как им был задан 1, 10 и 80 эксклюзивных вопросов. Красным отмечено распределение ответов искомого типа.
Stat4.png
Stat4.png (135.01 КБ) Просмотров: 1410


Как видите, если брать ответы лишь на 1 вопрос, то ответы людей типа, для которых этот признак является эксклюзивным, лишь немного сдвинуты в область положительных значений. После 10 вопросов сдвиг становится намного больше, после 80 - не остаётся ни одного респондента искомого типа со средним ответов ниже среднепопуляционного (или, вернее, среднетипного). Также становится отчётливо виден тип конфликтёра, а оставшиеся 14 разделяются примерно на 2 группы по 7 типов. В первой, чьи графики чуть больше смещены в положительную область - все типы, отличающиеся от искомого на 1-2 сильных признака из ведущей пятёрки (базис Юнга+рассудительность/решительность), во второй - типы, отличающиеся на 3-4 сильных признака.

То же, но в виде гистограммы (после 80 вопросов):
Stat2.png
Stat2.png (29.67 КБ) Просмотров: 1410


Код (только той части программы, что пишет в файл данные, на основе которых строятся обозначенные графики. Остальную, основную часть кода - см. по ссылке на яндекс-диск в 1 посте).
//================================ЧАСТЬ 7 строим графики распределения ответов
int q_step=79;//график будет строиться по совокупности ответов на q_step+1 эксклюзив. вопросов
Handle=FileOpen("Socionics_mod_2.csv",FILE_CSV|FILE_WRITE,";");
FileWrite(Handle,"","ИЛЭ","ЛИИ","СЭИ","ЭСЭ","СЛЭ","ЛСИ","ИЭИ","ЭИЭ","СЭЭ","ЭСИ","ИЛИ","ЛИЭ","ИЭЭ","ЭИИ","СЛИ","ЛСЭ");
int Stat[16][51];//массив для построения гистограммы распределения ответов
for(k=0;k<16;k++)
for(j=0;j<51;j++)
Stat[k][j]=0;
min=0;
max=0;
for(i=0;i<16000;i++)
{
n=answ[q_step][i];
if(n>max)max=n;
if(n<min)min=n;
}
double StatLim[52];//границы сумм ответов, по которым определяем попадание в столбцы гистограммы
for(j=0;j<52;j++)
StatLim[j]=((50-j)*min+j*max)/50.0;
for(k=0;k<16;k++)
for(i=0;i<1000;i++)
{
n=answ[q_step][1000*k+i];
for(j=0;j<52;j++)
if(n<=StatLim[j])
break;
Stat[k][j]++;
}
string txt[51];//заменяем точки на запятые в десятичных дробях (>.<)
for(j=0;j<51;j++)
{
if(StringSubstr(StatLim[j],0,1)=="-")
txt[j]=StringSubstr(StatLim[j],0,2)+","+StringSubstr(StatLim[j],3,2);
else txt[j]=StringSubstr(StatLim[j],0,1)+","+StringSubstr(StatLim[j],2,2);
}
for(j=0;j<51;j++)
FileWrite(Handle,txt[j],Stat[0][j],Stat[1][j],Stat[2][j],Stat[3][j],Stat[4][j],Stat[5][j],Stat[6][j],Stat[7][j],Stat[8][j],Stat[9][j],Stat[10][j],Stat[11][j],Stat[12][j],Stat[13][j],Stat[14][j],Stat[15][j]);
FileClose(Handle);


Теперь остаётся только смоделировать классический вариант типирования - когда будут задаваться эксклюзивные вопросы не для избранного типа, а для всех 16, а надёжность определяться как процент респондентов, у которых после очередного блока в 16 вопросов максимум баллов наберёт их реальный тип, или же у которых корреляция их ответов с усреднённым вектором ответов их типа будет максимальной среди всех 16.
Danidin
Местный
Местный
 
Сообщения: 1700
Зарегистрирован: Вс май 30, 2010 7:51 pm
Откуда: Санкт-Петербург
Медали: 6
Пол: Мужской
Соционический тип: Робеспьер
Темперамент: Меланхолик

Моделирование типирования по эксклюзивным признакам

Сообщение Буран » Вт окт 02, 2018 11:37 am

Интересная модель. И опять получается в результате один горб - Тэйл огорчится.

Так у тебя сейчас 160 вопросов на эксклюзивные признаки одного ТИМа? Я думал, по 10 вопросов на каждый ТИМ.
Аватара пользователя
Буран
КБ 'Грядущее'
КБ 'Грядущее'
 
Сообщения: 33333
Зарегистрирован: Чт сен 03, 2015 5:29 pm
Медали: 15
Пол: Мужской
Тип по психе-йоге: Лао-цзы (ЛВФЭ)
Профессия: проповедник неокосмизма

Моделирование типирования по эксклюзивным признакам

Сообщение Danidin » Вт окт 02, 2018 8:14 pm

Parf писал(а):Интересная модель.

Эта модель по сути воспроизводит весь процесс типирования. Признаю, в ней можно много к чему придраться: например, уровень шума (внесоционической дисперсии) в ответах подобран мной вручную, на глаз - в соответствии с распределением реальных свойств из таблиц Таланова по параметру отношения числа представителей типа, имеющих признак выше среднего к числу тех, у кого он проявлен ниже среднего. Однако, как было показано, показатели шума не сильно влияют на предел надёжности опросника.
Относительные показатели дисперсии разных признаков также были взяты мной не с потолка, а из статистики Таланова. Однако и их варьирование в разумных пределах нисколько не подвергают сомнению надёжность методики в целом, лишь смещает акценты. Например, если уменьшить дисперсию рассудительности-решительности, то доля полно-противоположного и квазитождественного типа в топе (верхняя 1/16 по набранным баллам) увеличится, а доля родственного по сенсорике-интуиции и зеркального - снизится.
Есть ещё момент, что набор свойств, из которых я выбирал эксклюзивные, был сгенерирован весьма своеобразным способом - с акцентом на повышение вероятности ситуации появления свойств, в признаковом профиле которых явно бы доминировало один-два признака. Для этого значение каждого из признаков получалось как произведение реальной дисперсии этого признака на шестую степень случайного числа и случайный знак (+/-). Сложно сказать, мог ли такой костыль в расчётах что-то исказить. Интуитивно чувствую, что нет, а как оно на самом деле... :add14
Parf писал(а):И опять получается в результате один горб - Тэйл огорчится.

Да, получился один горб, и ничего удивительного - так как в основе всех профилей лежат унимодальные распределения 15 признаков. Двугорбости там просто неоткуда взяться.
Интересно даже не отсутствие двугорбости, а отрицательного эксцесса распределения ответов как такового. Напомню, моделируя ответы респондентов в экселе я получил гистограмму распределения, которая по мере увеличения числа вопросов всё сильнее и сильнее сплющивалась. Здесь же она сохраняется в неизменном виде, сколько бы вопросов я не брал. Напомню, методика расчётов и там, и здесь одна и та же. Различие лишь одно: в экселе я квантовал ответы, здесь же отказался от этой затеи (в связи с тем, что она требует дополнительных допущений). Как видите, отказ от квантования привёл к сохранению кривой нормального распределения суммы ответов, сколько бы вопросов мы ни брали. Впрочем, не думаю, что это как-то значимо сказалось на надёжности диагноза (могу позже проверить этот момент, если интересно).

Parf писал(а):Так у тебя сейчас 160 вопросов на эксклюзивные признаки одного ТИМа? Я думал, по 10 вопросов на каждый ТИМ.
Да, пока я рассматривал вариант, в котором все признаки эксклюзивны для одного типа. Я хотел проверить, какой предел надёжности для данной методики типирования, найти её слабые места. И как и подозревал, из-за того, что профили всех эксклюзивных вопросов на один тип сильно скоррелированы меж собой, то потолок надёжности здесь гораздо ниже, чем 100 или даже 90%. Если задавать вопросы блоками по 16 штук, чтобы в каждом блоке было по 1 эксклюзивному свойству на тип, то предел надёжности теоретически должен быть много выше. Я планирую смоделировать 30 последовательных блоков по 16 вопросов (всего 480). Можете даже делать ставки - дотянется ли надёжность в таком случае до 100% или остановится чуть ниже? :)
Danidin
Местный
Местный
 
Сообщения: 1700
Зарегистрирован: Вс май 30, 2010 7:51 pm
Откуда: Санкт-Петербург
Медали: 6
Пол: Мужской
Соционический тип: Робеспьер
Темперамент: Меланхолик

Моделирование типирования по эксклюзивным признакам

Сообщение Experimentator » Вт окт 02, 2018 8:27 pm

Думаю, процентов до 80 дойдёт. Ну, посмотрим на практике.
Весь мир - театр, и люди - кто актер, кто зритель, кто буфетчик, кто суфлер, а кто-то - вешалка у входа в гардеробе...
Аватара пользователя
Experimentator
Активист
Активист
 
Сообщения: 260
Зарегистрирован: Вс сен 16, 2018 8:48 am


Вернуться в Соционика

Кто сейчас на конференции

Зарегистрированные пользователи: cooler462, GoGo [Bot], Google [Bot], Google Search Appliance, Joker, LeRoy, Yandex 3.0 [Bot], Yandex [Bot], Zevs