АНАЛИЗ ДАННЫХ

АНАЛИЗ ДАННЫХ – область математики и информатики, занимающаяся построением и исследованием наиболее общих математических методов и вычислительных алгоритмов извлечения знаний из экспериментальных (в широком смысле) данных.

В социологии А.Д. применяется в основном к анализу данных опросов. Первоначально А.Д. практически сводился к прикладным разделам математической статистики, поскольку объектом анализа являлись в основном случайные выборки из тех или иных совокупностей, называемых генеральными, что и составляет предмет математической статистики.

Прикладная математическая статистика и в настоящее время представляет собой наиболее обширный раздел А.Д.

Вместе с тем необходимость исследования больших массивов данных, не являющихся случайными выборками, – например, содержимого баз данных и данных в сети Интернет – привели к созданию других подходов, из которых в первую очередь следует отметить так называемый Data Mining (DM), что может быть переведено как “раскапывание данных” (в русскоязычной литературе термин обычно используется без перевода). DM в настоящее время несколько эклектичен по набору используемых методов и представляет собой скорее некоторую идеологию. Разницу между математической статистикой и DM можно проиллюстрировать следующим образом.

>Если типичной задачей математической сатистики является задача “найти зависимость между заданными переменными”, то для DM характерны задачи типа “найти переменные, между которыми существует достаточно хорошо выраженная зависимость”. DM находится в стадии интенсивного развития как в плане расширения арсенала используемых методов, так и углубления концепции, что в перспективе может привести к цельной системе методов, различающихся по шкале “направленный анализ – поисковый анализ”. Однако и на нынешнем этапе развития DM может успешно применяться в социологии. Имеются и принципиально иные разделы А.Д., пока еще в социологии практически не используемые, – например, математическая морфология, связывающая методы количественного анализа и визуального представления данных, или теория интерпретации эксперимента, которая сближает традиционный А.Д. и моделирование математическое (см.).

Н.Н. Леонов

Оставьте комментарий