Благодарю Фуру за то, что привёл интересные примеры, которые помогли мне уточнить все возможные ошибки, возникающие при оценке корреляции и приводящие к ложным выводам о причинно-следственной связи.
Фура так и не понял, что утверждение "корреляция не означает причинно-следственную связь" расшифровывается так: корреляция между А и В не означает причинно-следственную связь между А и В. Потому что она означает наличие С, которое является общей причиной для А и В. В этом его главная ошибка, но в мои задачи не входит растолковывание ему этой ошибки. Пусть продолжает пребывать в уверенности, что в чём-то там меня уличил - меня это не волнует.
Итак, основные ошибки, приводящие к ложным корреляциям:
1. Вместо независимых случайных выборок берём выборки с автокорреляцией, в которых элементы зависят друг от друга.
2. Берём не случайные объекты, а только удовлетворяющие определённым условиям - причём эти условия связаны с признаками, которые мы измеряем.
3. Соединяем выборки между собой по своему произволу, вместо того, чтобы брать каждую пару параметров у одного и того же объекта.
4. Считаем корреляции сразу для нескольких пар параметров и выбираем из них наибольшую.
5. Берём слишком маленькие выборки и не оцениваем статистическую значимость результата.