Функция распределеия величины Y, соответствует значению Х = х, характеризуется математическим ожиданием , дисперсией .
Распределение величины Y, соответствующие выбранным значениям величины Х, называется условиями распределениями, а дисперсии - условными дисперсиями. Геометрическое место точек, соответствующих центрам условных распределений , называется линией регрессии, а уравнение этой линии – уравнением регрессии.
Система из двух случайных величин всегда будут соответствовать две линии регрессии:
- регрессия y по x
- регрессия x по y
Если линии регрессии прямые, то регрессия двух величин называется линейной.
В прямоугольной системе координат линии регрессии могут быть заданы аналитически. Имеем следующую пару уравнений.
- регрессия y по x
- регрессия x по y
Уравнения нелинейной регрессии зависят от вида кривой.
Например, для параболической регрессии
Регрессия может быть однозначно описана, если известен вид уравнения и значения коэффициент а, в, с и т.д.
В системе двух уравнений линейной регрессии коэффициент а1 и а2 определяют положения начальных точек линии регрессии.
; ;
; ;
При а1 и а2 = 0, линии проходят через начало координат. Степень зависимости случайных величин определяется коэффициент в1 и в2 , которые называются коэффициент линейной регрессии.
Они представляют собой tgуглов наклона прямых регрессии к осям абсцисс и ординат. Координаты точки пересечения равны математическим ожиданиям величин хи у. Угол между ними изменяется от 0 до 90 чем меньше этот угол тем сильнее связь между величинами..
Основными числовыми характеристиками двумерного распределения случайных величин являются показатели их связи:
1.Ковариация или корреляционный момент (момент связи)
2. Коэффициент корреляции
3. Корреляционное отношение
1. Ковариация или корреляционный момент – представляют собой математическое ожидание произведения отклонений двух случайных величин от их математического ожидания.
2. Коэф. корреляции представляет собой ковариацию, нормализованную по стандартам :
Приведем изменения = -1 до + 1.
Значения +_ 1 соответствуют функциональной связи, р=0, отсутствие связи, знак ( +) – прямая связь, (-) – обратная связь.
Если оба уравнения регрессии – линейное
, то коэф. корреляции
3. Корреляционным отношением называется отношение дисперсии ( стандартов) центров условных распределений к общей дисперсии (стандарту) величины.
Таких отношений в двумерном распределении два: ;
В случае линейности обоих уравнений они совпадают, т.е.
Величины корреляционных отношений меняются от 0 до 1: = 0- свидетельствует о независимости величин.
Выявление корреляционной связи между различными свойствами геологических объектов способствуют решению многих геологических задач.
Например, наличие корреляционных связей между петрогенными и редкими элементами способствует оценке роли процессов дифференциации магмы и ассимеляции ею вмещающих пород; между концентрацией рудных элементов в породах и рудах – выяснению источников рудного вещества; между физическими свойствами и минеральным составом пород – демифрированию геофизических аномалий при геологическом картировании и т.д.
При отсутствии корреляционной связи коэф. корреляции, условные коэф. линейной регрессии и корреляционные отношения равны нулю.
Поэтому проверка гипотезы о наличии корреляционной связи заключается в расчете выборочных оценок этих характеристик и оценке значимости их отличия от «0».
Выборочная оценка коэф. корреляции вычитается по формуле:
;
При расчете вручную удобнее пользоваться формулой:
Когда математическое ожидание выборочного коэф. корреляции = 0, величина
,
имеет распределение Стьюдента с n – 2 степенями свободы если t расч. > t табл. то гипотеза об отсутствии корреляционной связи отвергается, т.е. связь существенная
Приблиз. Оценка коэф. корреляции – графическим путем строим точки по значению х и у в системе координат х и у
Следует помнить, что при проверке гипотез корреляционной связи случайных величин по коэф. корреляции необходимо учитывать функцию их эммирических распределений.
(пример стр. 53
Если не удается) проверить гипотезу о соответствии эмпирического распределения определенному закону, то для проверки гипотезы о наличии корреляционной связи используют ранговый коэффициент корреляции Спирмена.
Его расчет основан на замене выборочных значений случайных величин их рангами.
При этом предполагается, что если между значениями случайных величин нет корреляции, то и ранги их будут независимыми.
Ранговый коэф. корреляции вычисляется по формуле :
,
di - разность рангов,
n – количество пар
Для проверки значимости рангового коэффициент корреляции можно использовать величину:
- значение обратной функции нормального распределения при доверительной вероятности . (Шарапов прил. 29)
Если то гипотеза о независимости исследуемой величины отвергается.
Пример (К - стр. 54)
Результаты вычисления рангового коэффициента корреляции заносятся в след.
Таблицу:
№№
пп
mr
рк
di
di
Знач.
ранг
Знач.
ранг