Два горба

Слабые места соционики, научный статус соционики

Два горба

Сообщение _Wind_ » Пт дек 20, 2019 9:55 am

Во-первых мне было интересно совпадёт ли форма кривой распределения для нормального и биномиального
Совпала
Значит 50 уже достаточно большое число, чтобы биномиальное приблизилось к нормальному
Для маленьких N нормальное уже и выше

qqq.gif
qqq.gif (4.83 КБ) Просмотров: 7159
_Wind_
Участник
Участник
 
Сообщения: 173
Зарегистрирован: Пн ноя 25, 2019 5:58 pm

Два горба

Сообщение _Wind_ » Пт дек 20, 2019 10:07 am

Prob-Irka писал(а):отвечают Да от 20 до 50 раз из 50


50-20 = 30 / 6 = 5 = сигма

Так?

qqq.gif
qqq.gif (4.31 КБ) Просмотров: 7156


vvv.gif
vvv.gif (16.31 КБ) Просмотров: 7156
_Wind_
Участник
Участник
 
Сообщения: 173
Зарегистрирован: Пн ноя 25, 2019 5:58 pm

Два горба

Сообщение _Wind_ » Пт дек 20, 2019 10:15 am

50 вопросов, сигма 5

qqq.gif
qqq.gif (4.28 КБ) Просмотров: 7157


Baes.xls
(65.5 КБ) Скачиваний: 38


Не особо изменилось
_Wind_
Участник
Участник
 
Сообщения: 173
Зарегистрирован: Пн ноя 25, 2019 5:58 pm

Два горба

Сообщение _Wind_ » Пт дек 20, 2019 10:24 am

Таракан

Сигма 5:

5.gif
5.gif (10.5 КБ) Просмотров: 7155


Baes_All.xls
(102 КБ) Скачиваний: 40

Сигма задаётся в поле A2

Сигма 6:

6.gif
6.gif (11.64 КБ) Просмотров: 7154
_Wind_
Участник
Участник
 
Сообщения: 173
Зарегистрирован: Пн ноя 25, 2019 5:58 pm

Два горба

Сообщение _Wind_ » Пт дек 20, 2019 10:31 am

Сигма 3.2 (колокол совпадает с биномиальным для Донов)

32.gif
32.gif (9.72 КБ) Просмотров: 7151


Сигма 2:

2.gif
2.gif (9.13 КБ) Просмотров: 7151
_Wind_
Участник
Участник
 
Сообщения: 173
Зарегистрирован: Пн ноя 25, 2019 5:58 pm

Два горба

Сообщение _Wind_ » Пт дек 20, 2019 10:34 am

Доны, сигма 2

b2.gif
b2.gif (4.31 КБ) Просмотров: 7087


Доны, сигма 5

b5.gif
b5.gif (4.28 КБ) Просмотров: 7087


Доны, сигма 7

b7.gif
b7.gif (4.4 КБ) Просмотров: 7087
_Wind_
Участник
Участник
 
Сообщения: 173
Зарегистрирован: Пн ноя 25, 2019 5:58 pm

Два горба

Сообщение _Wind_ » Пт дек 20, 2019 12:00 pm

Prob-Irka писал(а):А вероятность того, что перед нами Дон, если человек ответил 36 раз "Да" из 50 вопросов станет меньше 27%

А..

Так ты смотришь вероятность в центре колокола

Логично
Если мы оцениваем качество анкеты для большинства Донов

А я чего-то правый край тоже оценивал
Если только центр смотреть, то всё намного плачевней
Там даже не 60%, как с краю, а 30%

Правый край можно было бы использовать для узко специфической задачи - найти Дона, при том не важно сколько людей мы переберём
Но анкета позиционируется для типирования широких масс. Так что так и надо её оценивать
_Wind_
Участник
Участник
 
Сообщения: 173
Зарегистрирован: Пн ноя 25, 2019 5:58 pm

Два горба

Сообщение Prob-Irka » Пт дек 20, 2019 1:08 pm

Danidin,
С первого беглого прочтения, твои рассуждения кажутся верными. Но наверняка в них закралась ошибка. Подумай, где она?

Danidin писал(а):
Prob-Irka писал(а):Вероятно, для самых ярковыраженных типов мы приближаемся к 20%-й точности типирования по анкетам с 50 вопросами на каждый признак.

Prob-Irka, если у нас есть вопросы, определяющие полюс дихотомии с вероятностью 70% (а такие вопросы есть, и в достаточном количестве для каждой из сильнейших дихотомий), то даже самый простой тест из 4 вопросов - по одному вопросу на каждую из дихотомий - будет верно определять MBTI-тип в 0,7*0,7*0,7*0,7=0,2401=24% случаев.
Если ответы, данные за экстраверсию, логику, интуицию и иррациональность каждый приравнять к 1 баллу (и если вероятности ответов ДА и НЕТ на каждый из этих вопросов в среднем по популяции равны 50%), то 4 балла наберёт каждый 16-й респондент.
При этом среди набравших 4 балла
ENTP будет 24%(=0,7*0,7*0,7*0,7);
ENTJ, ENFP, ESTP и INTP (отличающихся от ENTP на одну дихотомию базиса Юнга) - по 10,3%(=0,7*0,7*0,7*0,3);
людей каждого из 6 типов, отличающихся от ENTP на две дихотомии - по 4,4%(=0,7*0,7*0,3*0,3);
людей каждого из 4 типов, отличающихся от ENTP на три дихотомии - по 1,9%(=0,7*0,3*0,3*0,3);
ISFJ, отличающихся от ENTP на все четыре дихотомии - 0,9%(=0,3*0,3*0,3*0,3).

То есть даже для такого простейшего теста ваша "лесенка" будет выглядеть как
24%-10,3%-10,3%-10,3%-10,3%-4,4%-4,4%-4,4%-4,4%-4,4%-4,4%-1,9%-1,9%-1,9%-1,9%-0,9%

что, согласитесь, уже куда лучше отделяет ведущий тип (правильный диагноз) от остальных, чем в ваших предположениях.
Но, давайте, теперь пусть у нас в тесте не 4 вопроса, а 12 - по 3 на каждую из дихотомий.
Пусть респондент будет определён как экстраверт, если он даст больше половины "экстравертных" ответов (то есть 2 или 3 из трёх). И по каждой из остальных дихотомий всё так же. То есть, мы сначала считаем полюса дихотомий, а затем выходим на тип. Какова точность такого теста?
Итак, если экстраверт отвечает ДА на экстравертный вопрос с вероятностью 0,7, то для него возможны варианты:
ДА ДА ДА (1 вариант)
ДА ДА НЕТ (3 варианта-перестановки)
ДА НЕТ НЕТ (3 варианта-перестановки)
НЕТ НЕТ НЕТ (1 вариант)
Итого вероятность дать 2 или 3 ДА равна 1*0,7*0,7*0,7+3*0,7*0,7*(1-0,7)=0,343+0,441=78,4% Соответственно, 21,6% давших 2 или 3 ответа ДА будут интровертами.
То есть, увеличение числа вопросов на дихотомию с 1 до 3 повышает точность определения дихотомии с 70% до 78,4%.
По остальным трём дихотомиям всё так же.
Поэтому точность определения типа по такому тесту на 12 вопросов будет 0,784*0,784*0,784*0,784=37,8%

Продолжаем. Если на каждую дихотомию будет не 3, а 5 вопросов, тогда имеем варианты ответов, в которых ДА больше, чем НЕТ:
5 ДА - 1 вариант
4 ДА и 1 НЕТ - 5 вариантов-перестановок
3 ДА и 2 НЕТ - 10 вариантов-перестановок (число перестановок определяется согласно числам из треугольника Паскаля)
Вероятность экстраверту дать больше ответов ДА, чем НЕТ на вопросы на экстраверсию равна
1*0,7^5 +5*0,7^4*(1-0,7)^1 +10*0,7^3*(1-0,7)^2=0,837 [^ - знак возведения в степень]
Точность определения типа при этом равна 0,837^4=49,1%
И т.д.

Таким образом, имеем:
вопросов на дихотомию _ точность определения дихотомии _ точность типирования
1 _ 0,7 _ 24%
3 _ 0,784 _ 37,8%
5 _ 0,837 _ 49,1%
7 _ 0,874 _ 58,4%
9 _ 0,901 _ 65,9%
11 _ 0,922 _ 72,3%
13 _ 0,938 _ 77,4%
15 _0,950 _ 81,5%
17 _0,960 _ 84,9%
19 _0,967 _ 87,4%
25 _0,983 _93,4%
Как видите, уже тест на 17*4=68 вопросов получается "точнее" большого опросника Таланова. Почему такая ерунда и что мы здесь не учли?
А не учли мы, что ответы на вопросы на каждую из дихотомий нельзя считать полностью независимыми друг от друга. Все они имеют не только дисперсию, связанную со случайными факторами (доля которой при увеличении числа вопросов уменьшается), но дисперсию, связанную собственно с принадлежностью к полюсу экстраверсии.

Поэтому в реальности хотя надёжность и возрастает с увеличением числа вопросов, но происходит это чуть медленнее и потолок находится не на 100%, а где-то в районе 80-85%.

И, наконец, можно ли определять надёжность теста в лоб, как это пытается делать Wind?
То есть, если взять среди всех респондентов ту их 1/16 часть, что дала больше всего положительных ответов на все 4 дихотомии, будет ли доля ENTP среди этих 6,25% равна надёжности теста? Правильный ответ - нет, не будет.
Эта доля будет ниже надёжности теста. Почему? Потому что при тестировании мы не валим все ответы в кучу, а сначала определяем полюса дихотомий, а затем выходим на тип.
Например, пусть у нас первые 5 вопросов на экстраверсию, следующие 5 на интуицию, следующие 5 на логику и последние 5 на иррациональность.
Тогда последовательность ответов
{ ДА ДА НЕТ ДА ДА НЕТ ДА ДА НЕТ ДА ДА ДА ДА ДА НЕТ НЕТ НЕТ ДА ДА ДА }
будет указывать на тип ENTP
а последовательность
{ ДА ДА НЕТ НЕТ НЕТ ДА ДА ДА ДА ДА ДА ДА ДА ДА ДА ДА ДА ДА ДА ДА}
даже значительно более редкая чем предыдущая (17 из 20 ДА гораздо менее вероятны, чем 14 из 20)
укажет не на ENTP, а на другой тип.

Цифры расхождения между точностью теста и долей ENTP среди давших больше всего ответов ДА в данной системе я приводил выше.
Вот конкретный пример для теста на 52 вопроса (13 на дихотомию)
Изображение
Точность теста* 78,3%, а доля ENTP среди давших больше всего ответов ДА* - только 62%
* - и то, и другое - без учёта корреляции ответов на вопрос на один признак.
Аватара пользователя
Prob-Irka
Модератор
Модератор
 
Сообщения: 9954
Зарегистрирован: Вт апр 10, 2012 10:18 pm
Медали: 13

Два горба

Сообщение Prob-Irka » Пт дек 20, 2019 2:52 pm

_Wind_
Идем дальше?

Мы рассмотрели 50 вариаций вопросов на один и тот-же ярковыраженный признак Дона и Гюго.
Эти 50 вариаций могли бы звучать приблизительно так:
1) Вы помните какого цвета брюки были сегодня утром у вашего папы, брата, мужа?
2) Вы помните какого цвета брюки были ВЧЕРА утром у вашего папы, брата, мужа?
3) Вы помните какого цвета брюки были сегодня у вашего коллеги, сидящего за соседним столом?
3) Вы помните какого цвета брюки были ВЧЕРА у вашего коллеги, сидящего за соседним столом?
...
49) Вы помните цвет входной двери в ваш подъезд.
50) Вы помните цвет входной двери в вашу фирму.
На такие 50 вопросов Дон и Гюго отвечают с вероятностью 70%.

Теперь предположим, что у нас в опроснике много таких огромных блоков вопросов. И каждый из этих блоков НАВЕРНЯКА (70%) определяет по очереди каждую возможную пару из 16 типов:
- то Дон и Гюго окажется в "таракане" самым правым и левым
- то Дон правым, а Гамлет левым
- то Дон правым, а Максим левым.
... Всего 15*16 сочетаний, если не ошибаюсь.

При всех этих сочетаниях внутри "таракана" тоже будет множество расположенных сочетаний всех 14 типов, которые ... ВНИМАНИЕ!... не имеют 70% ответов.
Их уверенность стремится к 50%.

Симулировать такое количество внутренних сочетатий, скорее всего Винду не удастся, но я думаю достаточно будет парных вариантов: 70% у Дон/Гюго, Дон/Гам, Дон/Максим... а внутри каждой пары 50% уверенности дать всем остальным типам.
При желании Винд мог бы разбить внутренний массив типов на группы по 60% и 50%.

Даже отбросив всевозможные сочетания и 50 похожих друг на друга вопросов "Байеса", у нас останется тест из 16 вопросов, в которых по очереди с точностью 70% определяются 16 типов, при этом все остальные типы, определяются с точностью близкой к 50%.
Такую задачу Винд мог бы решить без труда.

Пробирка, владеющая лишь арифметикой, предполагает, что вероятность определения любого типа в таком тесте в этом случае будет приблизительно такой:
70÷[70+(14×50)+30] =8,75%,
Даже хуже, чем в моей "лесенке":
10%+9%+8%...+5%=100%
К таким выводам приходит Пробирка, увидев "лесенку" эффективного вопроса Таланова:
70%÷(70%+67%+65%+...+33%+30%)

Было бы хорошо, чтобы Данидин, Каноник или Хижняк показали нам еще с десяток табличек с "сырыми" ответами, чтобы мы видели и эффективные вопросы и менее эффективные.

Но как известно Таланов "сырых" данных не публикует, а Данидин и Хижняк, по просьбе Таланова тоже.
Как-то Таланов писал, что публикация необработанных и сырых данных может привести к их некорректному использованию кем-либо.
Красивая защита!
Я восхитилась тогда корректностью его формулировки.
Но при наличии огромного числа таблиц Таланов мог бы и сырые данные опубликовать.

Кстати, кажется Данидин был автором публикации в результате опросника "улитки вероятностей всех 16 ТИМов", от которой он по просьбе Таланова позже отказался. Интересно, зачем?
Аватара пользователя
Prob-Irka
Модератор
Модератор
 
Сообщения: 9954
Зарегистрирован: Вт апр 10, 2012 10:18 pm
Медали: 13

Два горба

Сообщение kanonik » Пт дек 20, 2019 3:11 pm

Danidin,
С первого беглого прочтения, твои рассуждения кажутся верными. Но наверняка в них закралась ошибка. Подумай (помоги мне найти), где она?

:D :D :D :add6

Кстати, кажется Данидин был автором публикации в результате опросника "улитки вероятностей всех 16 ТИМов", от которой он по просьбе Таланова позже отказался. Интересно, зачем?

Всё смешалось в доме Облонских... Автором улитки (круговой диаграммы с предположительной процентовкой вклада типов в профиль) был В.Л.Таланов, техническая реализация онлайн-опросника с диаграммой была сделана Хижняком, применялась эта диаграмма лишь один месяц в опытном порядке в опросниках Таланова на сайте Хижняка, оба они совместно и вполне единодушно затем отказались от неё по причине ее итоговой малой валидности.
=========
«Если тебя лишили обязанностей гражданина, исполняй обязанности человека». (Сенека)
kanonik
Старожил
Старожил
 
Сообщения: 4490
Зарегистрирован: Вс авг 07, 2011 7:10 pm
Медали: 4

Два горба

Сообщение Prob-Irka » Пт дек 20, 2019 4:38 pm

kanonik писал(а):
Danidin,
С первого беглого прочтения, твои рассуждения кажутся верными. Но наверняка в них закралась ошибка. Подумай (помоги мне найти), где она?

:D :D :D :add6

Каноник,
Зачем ты исправил мою цитату?
Наверняка, чтобы указать на мою дурость.

Лучше сам помоги себе найти свои же ошибки.

kanonik писал(а):
Кстати, кажется Данидин был автором публикации в результате опросника "улитки вероятностей всех 16 ТИМов", от которой он по просьбе Таланова позже отказался. Интересно, зачем?

Всё смешалось в доме Облонских... Автором улитки (круговой диаграммы с предположительной процентовкой вклада типов в профиль) был В.Л.Таланов, техническая реализация онлайн-опросника с диаграммой была сделана Хижняком, применялась эта диаграмма лишь один месяц в опытном порядке в опросниках Таланова на сайте Хижняка, оба они совместно и вполне единодушно затем отказались от неё по причине ее итоговой малой валидности.


Ах, "Улитка" была внедрена в опросники с твоей подачи!
И увидев, что "улитка" снижает точность твоего опросника, сам её и убрал. Ну-ну...
И приплетаешь к такому позорному решению и Хижняка.

Зачем ты, Каноник, отказался от своей же "улитки"?
О какой валидности "Улитки" ты говоришь, если на ней я не видела никаких процентов. Там я видела плавное уменьшение тимных секторов от максимума к минимуму. Без цифр!
Если нет цифр, то с твоих слов и итоговая валидность "улитки" мала. Логично.
Аватара пользователя
Prob-Irka
Модератор
Модератор
 
Сообщения: 9954
Зарегистрирован: Вт апр 10, 2012 10:18 pm
Медали: 13

Два горба

Сообщение Prob-Irka » Пт дек 20, 2019 4:42 pm

Уже не первый раз тебя прошу, опубликуй с десяток самых эффективных и с десяток среднеэффективных вопросов с сырой статистикой ответов.

Прошу статистику не в сигмах, как ты публикуешь в группе ВК, а со статистикой сырых ответов, как это однажды сделал твой компаньон.
За что и получил от тебя нарекание.

Хотелось бы, чтобы "сырую твою" статистику могли проверить другие математики.

Чего тебе бояться, опубликуй исходники, ты же считаешь себя настоящим ученым?
Аватара пользователя
Prob-Irka
Модератор
Модератор
 
Сообщения: 9954
Зарегистрирован: Вт апр 10, 2012 10:18 pm
Медали: 13

Два горба

Сообщение _Wind_ » Пт дек 20, 2019 11:21 pm

Prob-Irka писал(а):... Всего 15*16 сочетаний, если не ошибаюсь.

16 факториал

0123 0
0132 1
0213 2
0231 3
0312 4
0321 5
1023 6
1032 7
1203 8
1230 9
1302 10
1320 11
2013 12
2031 13
2103 14
2130 15
2301 16
2310 17
3012 18
3021 19
3102 20
3120 21
3201 22
3210 23

0123 24


http://www.cplusplus.com/reference/algorithm/next_permutation/

Сделать модель на основе генератора случайных чисел не сложно

Вопрос только в том, что ты хочешь видеть на оси X?
_Wind_
Участник
Участник
 
Сообщения: 173
Зарегистрирован: Пн ноя 25, 2019 5:58 pm

Два горба

Сообщение _Wind_ » Пт дек 20, 2019 11:36 pm

А нет

16! = 20922789888000
_Wind_
Участник
Участник
 
Сообщения: 173
Зарегистрирован: Пн ноя 25, 2019 5:58 pm

Два горба

Сообщение _Wind_ » Сб дек 21, 2019 12:04 am

Пробирка, кх-кх-кх :)

qqq.jpg
qqq.jpg (23.99 КБ) Просмотров: 961


https://www.youtube.com/watch?v=cPn756tfbEE
_Wind_
Участник
Участник
 
Сообщения: 173
Зарегистрирован: Пн ноя 25, 2019 5:58 pm

Пред.След.

  • { SIMILAR_TOPICS }
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в Критика

Кто сейчас на конференции

Зарегистрированные пользователи: cooler462, GoGo [Bot], Google [Bot], Iskander, Start_error, vadimr, Yandex 3.0 [Bot], Yandex [Bot]