Утверждение о неравномерности выборки, то есть о наличии в ней аномальных значений - это гипотеза, которая может быть подтверждена либо опровергнута на основе полученных данных.
Но нельзя выдвигать гипотезу по ходу эксперимента, когда данные уже получены. Ведь на основе данных всегда можно выдумать что-нибудь эдакое - скажем, увидеть, что человек из Москвы получил больше баллов, и тут же выдвинуть гипотезу, что самые умные люди живут в Москве. Разумеется, она тут же на этих данных будет подтверждена.
Это как?
Нужны данные, но если ты их получаешь, то ты уже в эксперименте и все, убрать выброс нельзя. Так что ли?
Если ты не можешь сформировать по объективным или субъективным причинам репрезентативную выборку и у тебя получается один результат особо выделяется, ничего не мешает его убрать из этой выборки.
Есть разработанные методы для того, чтобы проверить, выброс ли это и убрать выбросы. И ими можно пользоваться.
Ещё проще пример. Бросаешь кубик, видишь, что на нём выпало 5 очков, и тут же выдвигаешь гипотезу: кубик кривой, на нём всегда выпадают пятёрки. И показываешь на результат бросания как подтверждение. А, если видишь, что выпало 4 очка, выдвигаешь другую гипотезу: кубик кривой, на нём всегда выпадают четвёрки. И эта гипотеза подтверждается результатом бросания. Можно даже по два раза подряд кидать: примерно на 6-м двойном бросании выпадет 2 раза одно и то же число очков, что подтвердит гипотезу о несимметричности кубика с уровнем доверия 35/36 (а это довольно высокий уровень). Разумеется, никакой ценности в подобных гипотезах нет.
Есть у Фазиля Искандера произведение "Где собака зарыта".
Там мальчик Чик, наблюдая за тем, где и когда выигрывают в "расшибаловку" вывел закономерность и в один день выиграл много денег.
"Чик знал, где зарыта собака"..
Осторожно, под спойлером текст.Почти Лев Толстой.))
И вот Чик пришел на огород и стал подбрасывать монеты, а Белочка подбегала к ним, нюхала и смотрела на Чика, не понимая, почему он подбрасывает такие несъедобные вещи вместо того, чтобы сбить ей грушу.
Подбрасывая монеты, Чик убедился, что в его руках великое открытие. Удивительно, что до него об этом никто не догадался. Вероятно, дело было в том, что монета, которую подбрасывают в воздух, обычно, ударившись о землю, отскакивает и переворачивается. И поэтому никто не заметил, что падает она все-таки той стороной, которой взлетела. На пять бросков примерно четыре раза монета ложилась правильно. Это была высокая точность.
Чик подбрасывал пятикопеечные, трехкопеечные и однокопеечные монеты, и они почти всегда падали той стороной, какой они лежали у него на большом пальце.
Чик заметил еще, что чем выше подбрасываешь вращающуюся монету, тем точнее она ложится. И еще он заметил, что чем мельче по размеру монета, тем точнее она ложится.
И Чик подумал: почему точность падения монеты увеличивается с высотой броска или уменьшением величины монеты? Дело в количестве вращений, решил он. Чем выше бросаешь монету, тем больше она вращается. И чем мельче монета, тем больше она успевает вращаться, даже если ты ее и не так высоко закидываешь.
Поэтому крупную, пятикопеечную монету надо забрасывать гораздо выше, чем, скажем, однокопеечную. Но в крупной монете есть и своя выгода, она тяжелее отскакивает от земли и, отскочив, реже переворачивается.