КРИТЕРИЙ “ХИ-КВАДРАТ” (χ²) – непараметрический критерий для статистической проверки гипотезы (см.) о статистической связи между двумя переменными (см.) по таблице сопряженности (см.). В основе К.”Х.-К.” лежит наиболее общее определение статистической связи (см.), согласно которому две переменные связаны между собой, если при изменении одной переменной меняется распределение другой.
Проверка гипотезы о связи двух переменных осуществляется на основе сравнения наблюдаемых частот fij таблицы сопряженности, полученной в результате исследования, с теоретическими частотами, рассчитанными в предположении о статистической независимости (см.) переменных по формуле: eij = (ni. × n.j) / n, где ni., n.j – маргинальные частоты соответствующих строки и столбца таблицы, n – объем выборки. Таким образом, нулевая и альтернативная гипотезы (соответственно, о наличии и отсутствии статистической связи) имеют вид:
H0 : fij = eij для всех значений i и j
H0 : fij ≠ eij хотя бы для некоторых значений i и j.
Решение о принятии или отклонении нулевой гипотезы принимается в результате сравнения значения критерия, вычисленного по формуле: χ²выч = ∑ (fij – eij)² / eij, с критическим значением χ²1-α, найденным по таблице распределения “хи-квадрат” для выбранного уровня значимости α.
Если χ²выч > χ²1-α, нулевая гипотеза отклоняется в пользу альтернативной, согласно которой статистическая связь между переменными существует. Если χ²выч < χ²1-α, оснований для отклонения нулевой гипотезы нет. Однако при принятии нулевой гипотезы об отсутствии статистической связи между двумя переменными необходимо контролировать мощность статистического критерия (см.).
К.”Х.-К.” позволяет проверить гипотезу о наличии статистической связи/независимости двух переменных, но не измеряет тесноту связи между ними. Для измерения связи между переменными, образующими таблицу сопряженности, применяются специальные коэффициенты, которые рассчитывают на основе вычисленного по таблице значения χ² (см. Коэффициент Ф, Коэффициент контингенции, Коэффициент Крамера).
О.В. Терещенко