СТАТИСТИЧЕСКАЯ ПРОВЕРКА ГИПОТЕЗ – процедура принятия решения, следует ли на основе данных выборочного исследования принять или опровергнуть некое предположение о характеристиках или свойствах генеральной совокупности (см.).
Для того чтобы содержательная гипотеза могла быть проверена средствами статистики, она должна быть сформулирована как статистическая гипотеза (см.), с выделением нулевой и альтернативной гипотез. Проверка гипотезы сводится к принятию решения, следует ли принять нулевую гипотезу или отклонить ее в пользу альтернативной. При этом нулевая гипотеза (постулирующая отсутствие различий) выступает в качестве утверждения, которое считается справедливым до тех пор, пока не будут найдены противоречащие ему факты.
Поскольку решение, касающееся генеральной совокупности, принимается в соответствии с некоторым правилом (критерием) на основе случайной выборки, оно может оказаться как правильным, так и ошибочным (см. таблицу).
Ошибка, состоящая в том, чтобы отклонить, согласно критерию, нулевую гипотезу, которая на самом деле верна, называется ошибкой I рода, ее вероятность обозначается греческой буквой α.
Ошибка, заключающаяся в том, чтобы, в соответствии с критерием, принять нулевую гипотезу, которая на самом деле не верна, называется ошибкой II рода, ее вероятность обозначается буквой β. Вероятности правильных решений составляют соответственно (1 – α) и (1 – β).
Таблица
Возможные решения при проверке гипотез
В ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ
РЕШЕНИЕ (на основе выборки):
Принять H0
Отвергнуть H0
H0 верна
Правильное принятие H0 (1 – α)
Ошибка I рода (α)
H0 не верна
Ошибка II рода (β)
Правильное отклонение H0 (1 – β)
Нулевая и альтернативная гипотезы принимаются на основе одного и того же правила, которое называется критерием нулевой гипотезы. Однако условия их принятия принципиально асимметричны. Альтернативная гипотеза принимается в том случае, когда нулевая не подтверждается и должна быть отклонена. Решение о принятии альтернативной гипотезы происходит при зафиксированном значении вероятности ошибки первого рода α, которое выбирается из значений 0,1; 0,05; 0,01 и называется уровнем значимости.
Нулевая гипотеза принимается во всех случаях, когда ее нельзя отклонить. Однако при принятии нулевой гипотезы необходимо оценивать вероятность правильности такого решения (1 – β), которая называется мощностью критерия. Критерий нулевой гипотезы строится на основе специально подобранной численной функции, которая вычисляется по выборке и называется статистикой критерия.
Процедура проверки нулевой гипотезы H0 против альтернативной гипотезы H1 состоит в следующем:
для выборки по соответствующей формуле вычисляется значение статистики критерия;
выбирается уровень значимости α;
определяется критическая область, границы которой зависят от свойств критерия, выбранного уровня значимости, а также вида альтернативной гипотезы (односторонней, двусторонней);
принимается решение: если вычисленное значение статистики попадает в критическую область, нулевая гипотеза отклоняется, и принимается альтернативная. Если нет – принимается нулевая гипотеза, после чего по специальным формулам определяется мощность критерия (вероятность того, что решение о принятии нулевой гипотезы не является ошибочным).
Формулы и таблицы для вычисления критериев, определения их мощности и критических областей можно найти в учебной и справочной статистической литературе.
О.В. Терещенко