Содержание
1. Виды и формысвязей социально- экономических явлений
2. Основные статистическиеметоды выявления корреляционной связи
3. Корреляционно-регрессионныйанализ. Уравнение парной регрессия: экономическая интерпретация и оценказначимости
4. Оценка качестваоднофакторных линейных моделей
5. Анализ ипрогнозирование экономических показателей на основе регрессионных моделей
6. Измерение связейнеколичественных переменных
Литература
1. Виды и формы связей социально-экономических явлений
Экономические данные представляют собой количественныехарактеристики каких-либо экономических объектов или процессов. Они формируютсяпод действием множества факторов, не все из которых доступны внешнему контролю.Неконтролируемые факторы могут принимать случайные значения из некоторогомножества значений и тем самым обуславливать случайность данных, которые ониопределяют. Стохастическая (вероятностная) природа экономических данныхобуславливает необходимость применения соответствующих статистических методовдля их обработки и анализа.
Статистические распределения характеризуются наличием болееили менее значительной вариации в величине признака у отдельных единицсовокупности. Естественно, возникает вопрос о том, какие же причины формируютуровень признака в данной совокупности и каков конкретный вклад каждой из них.Изучение зависимости вариации признака от окружающих условий и составляетсодержание теории корреляции.
Изучение действительности показывает, что вариация каждогоизучаемого признака находится в тесной связи и взаимодействии с вариациейдругих признаков, характеризующих исследуемую совокупность единиц. Вариацияуровня производительности труда работников предприятий зависит от степенисовершенства применяемого оборудования, технологии, организации производства,труда и управления и других самых различных факторов.
При изучении конкретных зависимостей одни признаки выступаютв качестве факторов, обусловливающих изменение других признаков. Признаки этойпервой группы в дальнейшем будем называть признаками-факторами (факторнымипризнаками); а признаки, которые являются результатом влияния этих факторов,будем называть результативными. Например, при изучении зависимости междупроизводительностью труда рабочих и энерговооруженностью их труда уровеньпроизводительности труда является результативным признаком, аэнерговооруженность труда рабочих — факторным признаком.
Рассматривая зависимости между признаками, необходимовыделить, прежде всего, две категории зависимости: 1) функциональные и 2)корреляционные.
Функциональные связи характеризуются полным соответствием между изменениемфакторного признака и изменением результативной величины, и каждому значениюпризнака-фактора соответствуют вполне определенные значения результативногопризнака. Функциональная зависимость может связывать результативный признак содним или несколькими факторными признаками. Так, величина начисленнойзаработной платы при повременной оплате труда зависит от количестваотработанных часов.
В корреляционных связях между изменением факторного ирезультативного признака нет полного соответствия, воздействие отдельныхфакторов проявляется лишь в среднем при массовом наблюдении фактических данных.Одновременное воздействие на изучаемый признак большого количества самыхразнообразных факторов приводит к тому, что одному и тому же значениюпризнака-фактора соответствует целое распределение значений результативногопризнака, поскольку в каждом конкретном случае прочие факторные признаки могутизменять силу и направленность своего воздействия.
При сравнении функциональных икорреляционных зависимостей следует иметь в виду, что при наличиифункциональной зависимости между признаками можно, зная величину факторногопризнака, точно определить величину результативного признака. При наличии жекорреляционной зависимости устанавливается лишь тенденция изменения результативногопризнака при изменении величины факторного признака. В отличие от жесткостифункциональной связи корреляционные связи характеризуются множеством причин иследствий и устанавливаются лишь их тенденции. Статистические показатели могутсостоять между собой в следующих основных видах связи: балансовой,компонентной, факторной и др.
Балансовая связь — характеризует зависимость междуисточниками формирования ресурсов (средств) и их использованием.
/>
/> — остаток на начало отчетногопериода;
/> — поступление за период;
/> — выбытие в изучаемом периоде;
/> — остаток на конец отчетногопериода.
Левая часть формулы характеризуетпредложение
/>,
а правая часть — использованиересурсов
/>
Компонентные связи показателей характеризуются тем, чтоизменение статистического показателя определяется изменением компонентов,входящих в этот показатель, как множители:
/>
В статистике компонентные связииспользуются в индексном методе. Например, индекс товарооборота в фактическихценах /> представляет произведениедвух компонентов, на пример, — индекса товарооборота в сопоставимых ценах /> и индекса цен />, т.е.
/>
Важное значение компонентной связисостоит в том, что она позволяет определять величину одного из неизвестныхкомпонентов:
/> или />
Факторные связи характеризуются тем, что онипроявляются в согласованной вариации изучаемых показателей. При этом однипоказатели выступают как факторные, а другие — как результативные.
Факторные связи могут рассматриватьсякак функциональные и корреляционные.
При функциональной связиизменение результативного признака /> всецелозависит от изменения факторного признака />:
При корреляционной связиизменение результативного признака /> невсецело зависит от факторного признака />,а лишь частично, так как возможно влияние прочих факторов />:
/>
Примером корреляционной связипоказателей является зависимость сумм издержек обращения от объематоварооборота. В этой связи, помимо факторного признака — объема товарооборота />, на результативный признак(сумму издержек обращения />) влияюти другие факторы, в том числе и не учтенные />.Поэтому корреляционные связи не являются полными (тесными) зависимостями.
2. Основные статистические методы выявлениякорреляционной связи
Кметодам исследования взаимосвязей относятся: метод взаимосвязанных параллельныхрядов, балансовый метод, индексный метод, метод аналитических группировок,корреляционные таблицы и графический метод.
Методвзаимосвязанных параллельных рядовсостоитв установлении связей между экономическими явлениями посредством сопоставленияпоказателей двух или нескольких рядов. Для этого признак-фактор ранжируется,т.е. располагается в порядке возрастания или убывания признака и соответственноему записываются значения результативного признака. Путем сравнениявзаимосвязанных рядов выявляется наличие связи и ее направление. Можносравнивать временные и территориальные ряды.
Балансовыйметодприменяется для анализа связей ипропорций в экономике. Баланс представляет систему показателей, состоящей изравенства ресурсов и их распределения. Схема баланса может быть представленаравенством:
а+ б= в + с
(Остатокначальный + Поступление = Расход + Остаток конечный).
Индексныйметод— метод анализа компонентных связей.Это вид связей, когда изменение какого-то сложного явления целиком определяетсяизменением компонентов, входящих в это сложное явление как множители (а=бв, или />). Индексныйметод анализа позволяет определить роль отдельных компонентов в совокупномизменении сложного явления.
Методаналитических группировок— этоустановление связи между двумя и более признаками группировкой единиц пофакторному признаку, а затем в группах вычисление средних и относительныхвеличин результативного признака. Для оценки тесноты связи одновременно сметодом группировок рассчитываются коэффициенты детерминации и эмпирическоекорреляционное отношение.
Корреляционная таблицаохватывает два ряда распределения: один рядпредставляет факторный признак, а другой — результативный. Концентрация частотоколо диагонали, соединяющей левый верхний угол с правым нижним углом таблицы,выражает прямую связь, и наоборот, концентрация частот около диагонали,соединяющей левый. нижний угол с правым верхним углом таблицы, выражаетобратную связь. Интенсивная концентрация частот около диагонали таблицыуказывает на существование тесной корреляционной связи. Корреляционная таблицадает более правильную характеристику связи при условии, что число групп по двумпризнакам одинаково.
Графический методсостоит в построении графиков. На графике значенияфакторного признака наносятся на ось абсцисс, а результативного признака — наось ординат. Если нанести на график средние значения результативного признака,то получим ломаную линию, которая называется эмпирической линией регрессии.
3. Корреляционно-регрессионныйанализ. Уравнение парной регрессия: экономическая интерпретация и оценказначимости
Основная задача корреляционного анализа заключаетсяв выявлении взаимосвязи между случайными переменными путем точечной иинтервальной оценки парных (частных) коэффициентов корреляции, вычисления ипроверки значимости множественных коэффициентов корреляции и детерминации.Кроме того, с помощью корреляционного анализа решаются следующие задачи: отборфакторов, оказывающих наиболее существенное влияние на результативный признак,на основании измерения степени связи между ними; обнаружение ранее неизвестныхпричинных связей. Корреляция непосредственно не выявляет причинных связей междупараметрами, но устанавливает численное значение этих связей и достоверностьсуждений об их наличии.
Регрессионный анализ предназначен для исследования зависимости исследуемойпеременной от различных факторов и отображения их взаимосвязи в формерегрессионной модели.
В регрессионных моделях зависимая (объясняемая) переменная Yможет быть представлена в виде функции f (X1, X2, X3,… Xm), где X1, X2, X3, … Xm — независимые (объясняющие) переменные, или факторы. В качестве зависимойпеременной может выступать практически любой показатель, характеризующий,например, деятельность предприятия или курс ценной бумаги. В зависимости отвида функции f (X1, X2, X3, … Xm)модели делятся на линейные и нелинейные. В зависимости от количества включенныхв модель факторов Х модели делятся на однофакторные (парная модельрегрессии) и многофакторные (модель множественной регрессии).
Связь между переменной Y и m независимымифакторами можно охарактеризовать функцией регрессии Y= f (X1, X2,X3, … Xm), которая показывает, каково будет в среднемзначение переменной yi, если переменные xi примут конкретные значения.
Данное обстоятельство позволяет использовать модель регрессиине только для анализа, но и для прогнозирования экономических явлений.
Под линейностью здесь имеется в виду, что переменная y предположительно находиться подвлиянием переменной xв следующей зависимости:
/>,
где /> - постояннаявеличина (или свободный член уравнения), />-коэффициент регрессии, определяющий наклон линии, вдоль которой рассеяны данныенаблюдений. Это показатель, характеризующий изменение переменной />, при изменении значения /> на единицу. Если /> - переменные />и /> положительнокоррелированные, если /> — независимыеодинаково распределенные случайные величины – остаток с нулевым математическиможиданием (/>) и постоянной дисперсией (/>). Она отражает тот факт,что изменение /> будет неточноописываться изменением Х – присутствуют другие факторы, неучтенные в данноймодели.
Для оценки параметров регрессионногоуравнениянаиболее часто используют метод наименьших квадратов (МНК),который минимизирует сумму квадратов отклонения наблюдаемых значений />от модельныхзначений />.
Согласно принципу методанаименьших квадратов, оценки /> и/> находятся путемминимизации суммы квадратов
/>
по всем возможным значениям /> и/> при заданных(наблюдаемых) значениях/>. Задачасводится к известной математической задаче поиска точки минимума функции двухпеременных. Точка минимума находится путем приравнивания нулю частныхпроизводныхфункции /> попеременным /> и />. Это приводит к системенормальных уравнений
/> />
решением которой и является пара />, />. Согласно правиламвычисления производных имеем
/>/>
/>/>
так что искомые значения />,/> удовлетворяют соотношениям
/> />
Эту систему двух уравнений можнозаписать также в виде
/>
Эта система является системой двух линейных уравнений с двумянеизвестнымии может быть легко решена, например, методом подстановки. Врезультате получаем
/> (3.2) />
Такое решение может существовать только при выполненииусловия
/>
что равносильно отличию от нуля определителя системынормальных уравнений. Действительно, этот определитель равен
/>
Последнее условие называется условиемидентифицируемостимодели наблюдений />,и означает, что не все значения/> совпадаютмежду собой. При нарушении этого условия всеточки />, лежат на однойвертикальнойпрямой/>
Оценки /> и /> называют оценкаминаименьших квадратов. Обратим еще раз внимание на полученное выражениедля />. Нетрудно видеть, чтов это выражение входят уже знакомые нам суммы квадратов, участвовавшие ранее вопределении выборочной дисперсии
/>
Для двух переменных />теоретическийкоэффициент корреляции определяется следующим образом:
/>.
где /> — дисперсии случайныхпеременных />, а /> их ковариация.
Парный коэффициент корреляции является показателем теснотысвязи лишь в случае линейной зависимости между переменнымии обладаетследующими основными свойствами:
Коэффициент корреляции принимает значение в интервале(-1,+1), или
|rxy|
Коэффициент корреляции не зависит от выбора начала отсчета иединицы измерения, т.е.
r (α1X+β; α2Y+β)=rxy,
где α1, α2, b — постоянные величины, причем α1>0,α2>0.
Случайные величины Х, Y, можно уменьшать (увеличивать) вα раз, а также вычитать или прибавлять к значениям />одно и тоже число β — это не приведет к изменению коэффициента корреляции r.
При r= ±1 случайные величины/>связаны линейнойзависимостью, т.е.
/>.
Приr = 0 линейная корреляционная связьотсутствует.
В практических расчетах коэффициенткорреляции rгенеральной совокупности обычно не известен. По результатам выборки может бытьнайдена его точечная оценка – выборочный коэффициент корреляции r, таккак выборочная совокупность переменных />случайна,то в отличие от параметра r, r – случайная величина. Оценкой коэффициента корреляции /> является выборочныйпарный коэффициент корреляции:
/>= />, (3.3)
/> />
Для оценкизначимости коэффициента корреляции применяется t — критерий Стьюдента. При этомфактическое значение этого критерия определяется по формуле:
/> (3.4)
Вычисленное поэтой формуле значение tнабл сравнивается с критическим значениемt-критерия, которое берется из таблицы значений t Стьюдента с учетом заданногоуровня значимости и числа степеней свободы.
Если tнабл > tкр, то полученноезначение коэффициента корреляции признается значимым (то есть нулевая гипотеза,утверждающая равенство нулю коэффициента корреляции, отвергается). И такимобразом делается вывод о том, что между исследуемыми переменными есть теснаястатистическая взаимосвязь.
Если значение /> близкок нулю, связь между переменными слабая. Если случайные величины связаныположительной корреляцией, это означает, что при возрастании одной случайнойвеличины другая имеет тенденцию в среднем возрастать. Если случайные величинысвязаны отрицательной корреляцией, это означает, что при возрастании однойслучайной величины, другая имеет тенденцию в среднем убывать.
4. Оценка качества однофакторных линейныхмоделей
Качество модели регрессии связывают с адекватностью моделинаблюдаемым (эмпирическим) данным. Проверка адекватности (или соответствия)модели регрессии наблюдаемым данным проводится на основе анализа остатков — />.
Послепостроения уравнения регрессии мы можем разбить значение у, в каждомнаблюдении на две составляющих — />и />; /> (4.1)
Остаток/> представляет собойотклонение фактического значения зависимой переменной от значения даннойпеременной, полученное расчетным путем: /> (/>). Если />(/>), то для всех наблюденийфактические значения зависимой переменной совпадают с расчетными(теоретическими) значениями. Графически это означает, что теоретическая линиярегрессии (линия, построенная по функции />) проходит через все точки корреляционного поля, что возможнотолько при строго функциональной связи. Следовательно, результативный признак /> полностью обусловленвлиянием фактора />.
На практике, какправило, имеет место некоторое рассеивание точек корреляционного поляотносительно теоретической линии регрессии, т. е. отклонения эмпирическихданных от теоретических (/>).Величина этих отклонений и лежит в основе расчета показателей качества(адекватности) уравнения.
При анализе качества модели регрессиииспользуется основное положение дисперсионного анализа, согласно которому общаясумма квадратов отклонений зависимой переменной от среднего значения /> может быть разложена надве составляющие — объясненную и необъясненную уравнением регрессии дисперсии:
/> (4.2)
где /> — значения y,вычисленные по модели />.
Разделив правуюи левую часть (4.2) на />
/>
/>.
Коэффициент детерминацииопределяется следующим образом:
/> (4.3)
Коэффициент детерминациипоказывает долювариации результативного признака, находящегося под воздействием изучаемыхфакторов, т. е. определяет, какая доля вариации признака Y учтена вмодели и обусловлена влиянием на него факторов.
Чем ближе /> к 1,тем выше качество модели.
Для оценки качества регрессионных моделей целесообразнотакже использовать коэффициент множественной корреляции (индекскорреляции
R R = />= /> (4.4)
Данный коэффициент являетсяуниверсальным, так как он отражает тесноту связи и точность модели, а такжеможет использоваться при любой форме связи переменных.
При построении однофакторной моделион равен коэффициенту линейной корреляции
Очевидно, что чем меньшевлияние неучтенных факторов, тем лучше модель соответствует фактическим данным.Также для оценки точности регрессионныхмоделей целесообразно использовать среднюю относительную ошибку аппроксимации: />
/> ( 4.5)
Чемменьше рассеяние эмпирических точек вокруг теоретической линии регрессии, темменьше средняя ошибка аппроксимации. Ошибка аппроксимации меньше 7 %свидетельствует о хорошем качестве модели.
После того как уравнение регрессии построено, выполняетсяпроверка значимости построенного уравнения в целом и отдельных параметров.
Оценить значимость уравнения регрессии – это означает установить,соответствует ли математическая модель, выражающая зависимость между Y и Х,фактическим данным и достаточно ли включенных в уравнение объясняющихпеременных Х для описания зависимой переменной Y
Оценка значимостиуравнения регрессии производится для того, чтобы узнать, пригодно уравнениерегрессии для практического использования (например, для прогноза) или нет. Приэтом выдвигают основную гипотезу о незначимости уравнения в целом, котораяформально сводится к гипотезе о равенстве нулю параметров регрессии, или, чтото же самое, о равенстве нулю коэффициента детерминации: />. Альтернативная ей гипотезао значимости уравнения — гипотеза о неравенстве нулю параметров регрессии.
Для проверки значимости моделирегрессии используется F-критерий Фишера, вычисляемый какотношение дисперсии исходного ряда и несмещенной дисперсии остаточнойкомпоненты. Если расчетное значение с n1= k и n2 = (n — k- 1) степенями свободы, где k – количествофакторов, включенных в модель, больше табличного при заданном уровнезначимости, то модель считается значимой. Для модели парной регрессии:
/> (4.6)
В качестве меры точности применяютнесмещенную оценку дисперсии остаточной компоненты, которая представляет собойотношение суммы квадратов уровней остаточной компоненты к величине (n- k -1),где k – количество факторов, включенных в модель. Квадратный корень из этойвеличины (/>) называется стандартнойошибкой оценки.
/> (4.7)
Для модели парной регрессии
/>
Анализстатистической значимости параметров модели парной регрессии
/>
Значения />,соответствующие данным /> притеоретических значениях /> и /> являются случайными.Случайными являются и рассчитанные по ним значения коэффициентов /> и />.
Надежность получаемых оценок /> и/> зависит от дисперсиислучайных отклонений (ошибок). По данным выборки эти отклонения и,соответственно, их дисперсия не оцениваются – в расчетах используются отклонениязависимой переменной />от ее расчетныхзначений />: />. Так как ошибки (остатки) /> нормально распределены, тосреднеквадратическое отклонение ошибок используется для измерения этойвариации. Среднеквадратические отклонения коэффициентов известны как стандартныеошибки (отклонения):
/>
/> (4.8)
где/> - среднее значение независимойпеременной х;
/> стандартная ошибка,вычисляемая по формуле (4.8);
/>.
Проверка значимости отдельных коэффициентов регрессии связана сопределением расчетных значений t-критерия (t–статистики) длясоответствующих коэффициентов регрессии:
/> (4.9)
Затем расчетные значения /> сравниваютсяс табличными tтабл. Табличное значение критерияопределяется при (n-2) степенях свободы (n - число наблюдений) исоответствующем уровне значимости a (0,1; 0,05)
Если расчетное значение t-критерия с (n- 2) степенями свободы превосходит его табличное значение при заданномуровне значимости, коэффициент регрессии считается значимым. В противном случаефактор, соответствующий этому коэффициенту, следует исключить из модели (приэтом ее качество не ухудшится).
По имеющейся информации о результатахдеятельности 19 Российских предприятий, стоящих по рейтингу на первых позициях,построить уравнение линейной зависимости прибыли предприятий от размерасобственного капитала.
Собранный статистический материалпредставлен в таблице 1.
Таблица 1. Данные о величинесобственного капитала и прибыли Российских предприятий за 2005Рейтинг Название предприятия Собственный капитал, млн. руб. Прибыль, млн. руб.
1
2
3
4 1 «Газпром» 2772000 348400 2 РЖД 1851000 237545 3 ОАО «Сургутнефтегаз» 707913 214479 4 РАО «ЕЭС России» 386200 203448 5 Нефтяная компания «ЛУКойл» 222156 126326 6 ГМК «Норильский никель» 208143 118159 7 ТНК-ВР 165000 110400 8 «Связьинвест» 167572 95700 9 Нефтяная компания «Сибнефть» 153000 84800 10 АФК «Система» 150844 76503 11 Сбербанк России 148000 62929 12 “Татнефть” 103653 36876 13 «Северсталь» 103275 34312 14 Нефтегазовая компания «Славнефть» 101270 29923 15 Евраз Груп 77558 29517 16 «Русал» 75600 28512 17 АК «Транснефть» 46629 4608 18 АвтоВАЗ www.tatneft.ru/ 43308 1400 19 Магнитогорский металлургический комбинат 28500 1345
На основании имеющихся данных найдем:
1)уравнение прямой регрессии У = а + bX, где У – прибыль предприятий(результативный признак), Х – размер собственного капитала (факторный признак).
2)тесноту связи между прибыльюпредприятий с помощью линейного коэффициента корреляции rху.
Получили, что коэффициенты регрессииа = 51,61 и b = 0,115. Таким образом, уравнениезависимости прибыли предприятий (У) от величины собственного капитала (Х) имеетвид: У = 51,61 + 0,115Х, т.е. при увеличении размера собственного капитала на 1млн. руб. прибыль предприятий в среднем увеличивается на 115 тыс. руб.
Коэффициент корреляции rху = 0,867 свидетельствует о сильной ипрямой связи между размером собственного капитала и прибылью организации.
Изобразим графически исходные данныео прибыли и размере собственного капитала и полученную прямую зависимостиданных признаков.
5. Анализ и прогнозированиеэкономических показателей на основе регрессионных моделей
Регрессионные модели могут быть использованы дляпрогнозирования возможных ожидаемых значений зависимой переменной.
Прогнозируемоезначение переменной /> получается приподстановке в уравнение регрессии
/> (5.1)
ожидаемой величины фактора />.Данный прогноз называется точечным. Значение независимой переменной /> не должно значительно отличаться отвходящих в исследуемую выборку, по которой вычислено уравнение регрессии.
Вероятность реализации точечного прогноза теоретически равнанулю. Поэтому рассчитывается средняя ошибка прогноза или доверительный интервалпрогноза с достаточно большой надежностью.
доверительныеинтервалы, зависят от стандартной ошибки, удаления /> отсвоего среднего значения />,количества наблюдений n и уровня значимости прогноза α. Вчастности, для прогноза будущие значения /> свероятностью (1 — α) попадут в интервал
/>/>/>.
6. Измерение связей неколичественныхпеременных
Методыкорреляционного и дисперсионного анализа не универсальны: их можно применять,если все изучаемые признаки являются количественными. При использовании этихметодов нельзя обойтись без вычисления основных параметров распределения(средних величин, дисперсий), поэтому они получили название параметрическихметодов.
Междутем в статистической практике приходится сталкиваться с задачами измерениясвязи между качественными признаками, к которым параметрические методы анализав их обычном виде неприменимы. Статистической наукой разработаны методы, спомощью которых можно измерить связь между явлениями, не используя при этомколичественные значения признака, а значит, и параметры распределения. Такиеметоды получили название непараметрических.
Оценитьтесноту связи между признаками можно с помощью коэффициентов взаимнойсопряженности и коэффициентов контингенции или ассоциации.
Всоциально-экономических исследованиях нередко встречаются ситуации, когдапризнак не выражается количественно, однако единицы совокупности можноупорядочить. Такое упорядочение единиц совокупности по значению признаканазывается ранжированием. Примерами могут быть ранжирование студентов(учеников) по способностям, любой совокупности людей по уровню образования,профессии, по способности к творчеству и т.д.
Приранжировании каждой единице совокупности присваивается ранг, т. е.порядковый номер. При совпадении значения признака у различных единиц имприсваивается объединенный средний порядковый номер. Например, если у 5-й и 6-йединиц совокупности значения признаков одинаковы, обе получат ранг, равный (5 +6) / 2 = 5,5.
Измерениесвязи между ранжированными признаками производится с помощью ранговыхкоэффициентов корреляции Спирмена (р) и Кендэлла (X). Эти методы применимы не только для качественных, но идля количественных показателей, особенно при малом объеме совокупности, так какнепараметрические методы ранговой корреляции не связаны ни с какимиограничениями относительно характера распределения признака.
Сущностьметода Спирмена (Spearman) состоитв следующем:
1) располагаютварианты факторного признака по возрастанию — ранжируют единицы по значениюпризнака X;
2)для каждой единицы совокупности указывают ранг с точки зрения результативногопризнака У.
Еслисвязь между признаками прямая, то с увеличением ранга признака X ранг признака У также будетвозрастать; при тесной связи ранги признаков X и У в основном совпадут. При обратной связи возрастаниюрангов признака X будет, какправило, соответствовать убывание рангов признака У. В случае отсутствия связипоследовательность рангов признака У не будет обнаруживать никакого порядкавозрастания или убывания.
Теснотасвязи между признаками оценивается ранговым коэффициентом корреляции Спирмена (в случае, когда нет связанных рангов):
/>
/> — квадрат разности рангов;
n – числонаблюдений ( число пар рангов).
Коэффициенткорреляции Спирмена принимает значение в интервале (-1,+1). Чем ближе он кединице, тем более тесня связь между признаками. Знак коэффициента показываетнаправление связи.
Литература
1. Гусаров В.М., «Теория статистики», –М.: Аудит, ЮНИТИ, 2002;
2. Громыко Г.Л. Теория статистики: учеб. – М., Изд-воИнфра-М, 2000.
3. Ефимова М.П., Петрова Е.В., РумянцевВ.Н., «Общая теория статистики», — М.: “Инфра — М”, 2003;
4. «Практикум по статистике: Учеб.пособие для вузов» / Под ред. В. М. Симчеры / ВЗФЭИ. – М.: ЗАО «Финстатинформ»,2000; Симчера В.М. Практикумпо статистике: учеб. пособ. – М. Изд-во Финстатинформ, 1999.
5. Шмойлва Р.А. Практикум по теории статистики: учеб.пособ. – М., Изд-во Финансы и статистика, 2002.