Основная идея дисперсионного анализа (ANOVA)

Джон Пецзулло

Так называемый односторонний дисперсионный анализ (ANOVA) используется при сравнении трех или более групп чисел. При сравнении только двух групп (A и B) вы проверяете разницу (A - B) между двумя группами с помощью t-критерия Стьюдента. Поэтому при сравнении трех групп (A, B и C) естественно подумать о проверке каждого из трех возможных двухгрупповых сравнений (A - B, A - C и B - C) с помощью t-критерия.

Но выполнение исчерпывающего набора двухгрупповых t-тестов может быть рискованным, потому что по мере увеличения количества групп количество двухгрупповых сравнений увеличивается еще больше. Общее правило таково: N группы могут быть объединены в пары N ( N - 1) / 2 разными способами, поэтому в исследовании с шестью группами у вас будет 6 × 5/2, или 15 различных двухгрупповых сравнений.



Когда вы проводите много тестов на значимость, у вас повышаются шансы на успех. Ошибка типа I - ложное заключение о значимости при отсутствии реального эффекта. Этот тип ошибки также называется альфа инфляция . Поэтому, если вы хотите узнать, имеют ли все группы последовательные средства или одна или несколько из них отличаются от одной или нескольких других, вам понадобится Один тест, производящий Один p значение, которое отвечает на этот вопрос.

Односторонний дисперсионный анализ - это именно такой тест. Он не рассматривает различия между парами групповых средств; вместо этого он смотрит, как распределяется вся совокупность групповых средних, и сравнивает это с тем, насколько вы могли бы ожидать, что эти средние значения распространятся, если бы все группы были отобраны из одной и той же совокупности (то есть, если бы не было истинных различий между группы).

Результат этого расчета выражается в тестовой статистике, называемой Коэффициент F (обозначается просто как F ), отношение степени изменчивости между группы относительно того, сколько есть в группы.

Если нулевая гипотеза верна (другими словами, если между группами нет истинной разницы), то отношение F должно быть близко к 1, а его колебания выборки должны соответствовать Распределение Fisher F , который на самом деле представляет собой семейство функций распределения, характеризуемых двумя числами:

  • В числителе степеней свободы: Этот номер часто обозначается как df N или же df 1 , что на единицу меньше количества групп.

  • Знаменатель степеней свободы: Этот номер обозначается как df D или же df два , которое представляет собой общее количество наблюдений за вычетом количества групп.

Значение p можно рассчитать из значений F , df 1 , а также df два , и программа выполнит этот расчет за вас. Если значение p из дисперсионного анализа является значимым (менее 0,05 или выбранный вами альфа-уровень), то вы можете сделать вывод, что группы не все равно (потому что средства сильно различались друг от друга).