МОДЕЛИРОВАНИЕ СТАТИСТИЧЕСКОЕ

МОДЕЛИРОВАНИЕ СТАТИСТИЧЕСКОЕ – представление или описание некоторого феномена или системы взаимосвязей между явлениями посредством набора переменных (показателей, признаков) и статистических взаимосвязей между ними. Цель М.С. (как и любого другого моделирования) – представить наиболее существенные черты изучаемого феномена в наглядном и доступном для изучения виде. Все статистические модели предназначены, в конечном счете, для измерения силы и направления связей между двумя или более переменными.

Наиболее сложные модели позволяют также судить о структуре связей между несколькими переменными. Большинство статистических моделей можно условно разделить на корреляционные, структурные и причинные. Корреляционные модели используются для измерения парных “ненаправленных” связей между переменными, т.е. таких связей, в которых причинная компонента отсутствует либо игнорируется. Примерами таких моделей являются коэффициент парной линейной корреляции Пирсона, ранговые коэффициенты парной и множественной корреляции, большинство мер связи, разработанных для таблиц сопряженности (за исключением теоретико-информационных коэффициентов и логарифмически-линейного анализа).

Структурные модели в М.С. предназначены для исследования структуры некоторого множества переменных либо объектов. Исходными данными для изучения структуры связей между несколькими переменными является матрица корреляций между ними. Анализ корреляционной матрицы может осуществляться вручную либо с помощью методов многомерного статистического анализа (см.) – факторного, кластерного, метода многомерного шкалирования. Во многих случаях исследование структуры связей между переменными является предварительным этапом при решении более сложной задачи – снижения размерности пространства признаков.

>Для исследования структуры совокупности объектов применяются методы кластерного анализа и многомерного шкалирования. В качестве исходных данных используется матрица расстояний между ними. Расстояние между объектами тем меньше, чем больше объекты “похожи” друг на друга в смысле значений измеренных на них переменных; если значения всех переменных для двух объектов совпадают, расстояние между ними равно нулю.

В зависимости от целей исследования, структурные модели могут быть представлены в виде матриц (корреляций, расстояний), факторной структуры либо визуально. Результаты кластерного анализа чаще всего представляются в виде дендрограммы; результаты факторного анализа и многомерного шкалирования – в виде диаграммы рассеяния. Структура матрицы корреляций может быть также представлена в виде графа, отражающего наиболее существенные связи между переменными.

Причинные модели предназначены для исследования причинных связей между двумя или несколькими переменными. Переменные, измеряющие явления-причины, называются в статистике независимыми переменными или предикторами; переменные, измеряющие явления-следствия, называются зависимыми. Большинство причинных статистических причинных моделей предполагают наличие одной зависимой переменной и одного или нескольких предикторов. Исключение составляют линейно-структурные модели, в которых может одновременно использоваться несколько зависимых переменных, а некоторые переменные могут в одно и то же время выступать в качестве зависимых по отношению к одним показателям и в качестве предикторов по отношению к другим.

>Классическая статистика допускала исследование причинных связей только посредством дисперсионного анализа. В последние десятилетия активно развивались техники, основанные на регрессионных и регрессионно-подобных моделях. К ним относятся методы парной линейной и нелинейной регрессии, множественной линейной регрессии, логит- и пробит-регрессии, а также путевой анализ, линейно-структурные уравнения, дискриминантный анализ. Применение регрессионных техник ограничено требованиями теоретического доказательства причинного характера связей между зависимыми и независимыми переменными, а также соблюдения при измерении переменных и построении модели трех критериев (принципов) каузальности (см.).

Исключение составляют аскриптивные переменные, которые могут использоваться в качестве предикторов без ограничений. Результаты регрессионного моделирования представляются в виде соответствующих уравнений, которые могут быть использованы как для предсказания значения, которое примет зависимая переменная при заданном наборе значений предикторов, так и для объяснения изменений зависимой переменной при изменении независимых переменных. Результаты путевого и линейно-структурного анализа могут быть также представлены в виде графа, на ребрах которого указываются соответствующие коэффициенты.

О.В. Терещенко

Оставьте комментарий