Корреляционный анализ

Большая Советская Энциклопедия. Статьи для написания рефератов, курсовых работ, научные статьи, биографии, очерки, аннотации, описания.


А Б В Г Д Е Ё Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я 1 2 3 4 8 A L M P S T X
КА КВ КЕ КЁ КЗ КИ КЙ КЛ КМ КН КО КП КР КС КТ КУ КХ КШ КЫ КЬ КЭ КЮ КЯ
КОА
КОБ
КОВ
КОГ
КОД
КОЖ
КОЗ
КОИ
КОЙ
КОК
КОЛ
КОМ
КОН
КОО
КОП
КОР
КОС
КОТ
КОУ
КОФ
КОХ
КОЦ
КОЧ
КОШ
КОЩ
КОЭ
КОЮ
КОЯ

Корреляционный анализ, совокупность основанных на математической теории корреляции методов обнаружения корреляционной зависимости между двумя случайными признаками или факторами. Корреляционный анализ экспериментальных данных заключает в себе следующие основные практические приёмы: 1) построение корреляционного поля и составление корреляционной таблицы; 2) вычисление выборочных коэффициентов корреляции или корреляционного отношения; 3) проверка статистической гипотезы значимости связи. Дальнейшее исследование заключается в установлении конкретного вида зависимости между величинами (см. Регрессионный анализ). Зависимость между тремя и большим числом случайных признаков или факторов изучается методами многомерного Корреляционный анализ (вычисление частных и множественных коэффициентов корреляции и корреляционных отношений).

  Корреляционное поле и корреляционная таблица являются вспомогательными средствами при анализе выборочных данных. При нанесении на координатную плоскость выборочных точек получают корреляционное поле. По характеру расположения точек поля можно составить предварительное мнение о форме зависимости случайных величин (например, о том, что одна величина в среднем возрастает или убывает при возрастании другой). Для численной обработки результаты обычно группируют и представляют в форме корреляционной таблицы. В каждой клетке корреляционной таблицы (см. в ст. Корреляция в математической статистике) приводятся численности гц; тех пар (х, у), компоненты которых попадают в соответствующие интервалы группировки по каждой переменной.

  Предполагая длины интервалов группировки (по каждому из переменных) равными между собой, выбирают центры xi (соответственно yj) этих интервалов и числа nij в качестве основы для расчётов.

  Коэффициент корреляции и корреляционное отношение дают более точную информацию о характере и силе связи, чем картина корреляционного поля. Выборочный коэффициента корреляции определяют по формуле: ,

где , , , .

При большом числе независимых наблюдений, подчиняющихся одному и тому же распределению, и при надлежащем выборе интервалов группировки коэффициент  близок к истинному коэффициенту корреляции r. Поэтому использование  как меры связи имеет четко определённый смысл для тех распределений, для которых естественной мерой зависимости служит r (т. е. для нормальных или близких к ним распределений). Во всех др. случаях в качестве характеристики силы связи рекомендуется использовать корреляционное отношение h, интерпретация которого не зависит от вида исследуемой зависимости.

  Выборочное значение y|x вычисляется по данным корреляционной таблицы: 2y|x =

где числитель характеризует рассеяние условных средних значений  около безусловного среднего (аналогично определяется выборочное значение x|y). Величина y|x используется в качестве меры отклонения зависимости от линейной, т. к. обычно 2y|x>r2, x|y>r2 и лишь в случае линейной зависимости r2=2y|x=x|y. Так, при анализе корреляции между высотой и диаметром северной сосны было обнаружено, что условные средние значения высоты сосны для заданного диаметра связаны нелинейной зависимостью. Корреляционное отношение (высоты к диаметру) в этом случае равно 0,813, а коэффициент корреляции равен 0,762.

  Проверка гипотезы значимости связи основывается на знании законов распределения выборочных корреляционных характеристик. В случае нормального распределения величина выборочного коэффициента корреляции  считается значимо отличной от нуля, если выполняется неравенство ,

где ta есть критическое значение t-распределения Стьюдента с (n—2) степенями свободы, соответствующее выбранному уровню значимости a (см. Стьюдента распределение). Если же известно, что r¹ 0, то необходимо воспользоваться z-преобразованием Фишера (не зависящим от r и n): .

Исходя из приближённой нормальности z, можно определить доверительные интервалы для истинного коэффициента корреляции r.

  В случае когда изучаются не количественные признаки, а качественные, обычные меры зависимости не годятся. Однако, если удаётся каким-либо образом упорядочить изучаемые объекты в отношении некоторого признака, т. е. прописать им порядковые номера — ранги (по два номера в соответствии с двумя признаками), то в качестве выборочной характеристики связи можно воспользоваться, например, т. н. коэффициентом ранговой корреляции: ,

где diразность рангов по обоим признакам для каждого объекта. По степени уклонения R от нуля можно сделать некоторое заключение о степени зависимости качественных признаков. Проверка гипотезы независимости признаков при небольшом объёме выборки производится с помощью специальных таблиц, а при n > 10 для вычисления критических значений выборочных коэффициентов пользуются тем, что эти величины распределены приближённо нормально.

 

  Лит. см. при ст. Корреляция.

  А. В. Прохоров.

Так же Вы можете узнать о...


Анехо, Анешо (Anecho), город в Того, на берегу Гвинейского залива, административного центра округа .
Ахондрит, каменный метеорит редкого типа, не содержащий хондр.
Белый Нил, Бахр-эль-Абьяд (араб. бахр — река и абьяд — белый), название р.
Бородин Сергей Петрович (настоящие фамилия и имя; псевдоним до 1941 — Амир Саргиджан) [р.
Варен (Waren), город в ГДР, в округе Нёйбранденбург, на северном берегу озера Мюриц.
Внушение (мед.) Внушение (медицинское), метод лечения, заключающийся в том, что врач убеждает больного, находящегося в бодрствующем состоянии или под гипнозом, в благоприятном течении болезни, которой страдает больной, в благополучном её исходе (выздоровлении) и в возможности преодоления тех или иных проявлений этой болезни.
Галичина, историческое название части территории Южной Польши и западно-украинских земель; см.
Гипсофила, род растений семейства гвоздичных; то же, что качим.
Грушас Юозас [р.16(29).11.1901, Жаджюнай, ныне Шяуляйский район Литовской ССР], литовский советский писатель.
Джарджан, река в Якутской АССР, правый приток р.
Душак, посёлок городского типа в Каахкинском районе Марыйской области Туркменской ССР.
Звёздные каталоги, списки звёзд с указанием тех или иных однородных характеристик: экваториальных координат (и их изменений), звёздных величин, спектральных классов и др.
Инкреция [от лат. in — в, внутри и (se)cretio — отделение, выделение], образование и выделение железами внутренней секреции их продуктов — гормонов (инкретов) — непосредственно в кровь или лимфу.
Кампонгсаом, Сиануквиль, город и порт в Камбодже, на берегу Сиамского залива.