МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ ОРЛОВСКИЙГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ
ИНСТИТУТ БИЗНЕСА И ПРАВА
ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ФАКУЛЬТЕТ
Кафедра «Экономика и менеджмент»
А.В. Чернова
И.А. Краснобокая
СТАТИСТИЧЕСКОЕ ИЗУЧЕНИЕ ВЗАИМОСВЯЗИ
СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ ЯВЛЕНИЙ И ПРОЦЕССОВ
Методические указания по выполнению лабораторной работы
Дисциплина — «Статистика»
Специальность — 060400 «Финансы и кредит»
060500 «Бухгалтерский учет, анализ и аудит»
060800 «Экономика и управление на предприятиях
туризма и гостиничного хозяйства»
061000 «Государственное и муниципальное управление»
061100 «Менеджмент организации»
061500 «Маркетинг»
351000 «Антикризисное управление»
351200 «Налоги и налогообложение»
Печатается по решению редакционно-издательского совета Орел ГТУ
Орел 2003
Авторы: профессор кафедрыэкономики и менеджмента, доктор экономических наук А.В. Чернова, старшийпреподаватель кафедры экономики и менеджмента, кандидат экономических наук И.А.Краснобокая
Рецензент: заведующий кафедройэкономики и менеджмента, профессор, доктор экономических наук С.А. Никитин.
Методические указания повыполнению лабораторной работы содержат рекомендации и задания по установлениюстепени тесноты и характера направления зависимости между признаками. Предназначеныдля студентов специальностей 060400 «Финансы и кредит», 060500 «Бухгалтерскийучет, анализ и аудит», 060800 «Экономика и управление на предприятияхтуризма и гостиничного хозяйства», 061000 «Государственное имуниципальное управление», 061100 «Менеджмент организации», 061500«Маркетинг», 351000 «Антикризисное управление», 351200«Налоги и налогообложение» при изучении дисциплины «Статистика».
Редактор.
Технический редактор.
Орловский государственныйтехнический университет
Лицензия ИД №00670 от 05.01.2000г.
Подписано к печати. .03 г. Формат60х84 1/16.
Печать офсетная. Уч. изд. л. Усл.печ. л.,. Тираж 300 экз.
Заказ №
Отпечатано с готового оригинал-макетана полиграфической базе ОрелГТУ, 302030, г. Орел, ул. Московская, 65.
Орел ГТУ, 2003
Чернова А.В., Краснобокая И.А., 2003
Содержание
1. Методические указания по выполнению лабораторной работы
2. Пример выполнения лабораторнойработы
2.1 Задание на лабораторную работу
3. Порядок выполнения лабораторной работы
Рекомендуемая литература
Приложение
1. Методические указания по выполнению лабораторнойработы
Наиболее разработанной в теориистатистики является методология корреляционно-регрессионного анализа парнойкорреляции, которая исследует связь между одним признаком-фактором (х) и однимпризнаком-результатом (у).
В основу выявления иустановления аналитической формы связи положено применение в анализе исходнойинформации математических функций, для чего применяют различного вида уравненияпрямолинейной и криволинейной связи.
Это уравнение называетсяуравнением регрессии (или уравнение парной зависимости).
Например, уравнение парнойлинейной корреляционной зависимости имеет следующий вид:
/>,(1)
где ух — теоретические значения результативного признака, полученные по уравнениюрегрессии;
a0, a1 — коэффициенты (параметры) уравнения регрессии.
Коэффициент парной линейнойрегрессии а1 показывает изменение результативного признака у подвлиянием изменения факторного признака х. Уравнение (1) показывает среднеезначение изменения результативного признака у при изменении факторного признаках на одну единицу его измерения, т.е. вариацию у, приходящуюся на единицувариации х. Знак а1 указывает направление этого изменения.
Параметры уравнения a0,a1 определяют путем решения системынормальных уравнений, полученной на основе метода наименьших квадратов.
В основу этого метода положенотребование минимальности сумм квадратов отклонений фактических данных (уi) от выровненных (yxi):
S (уi — yxi) 2 = S (уi — а0- а1×хi) 2 ®min, (2)
Так, для уравнения парнойлинейной зависимости система уравнений имеет следующий вид:
/> (3)
/> (4)
Параметры уравнения прямой будутиметь следующий вид:
/> (5)
/>.(6)
Определив значения а0,а1 и подставив их в уравнение связи />,находим значение ух, зависящее только от заданного значения х.
Для прямолинейных зависимостейизмерителем тесноты связи между признаками является коэффициент парной корреляции,который рассчитывается по формуле:
/>, (7)
где /> -среднее произведение факторного и результативного признака:
/>;(8)
/> -среднее значение факторного признака:
/>;(9)
/> -среднее значение результативного признака:
/>;(10)
/> -среднее квадратическое отклонение результативного признака:
/>; (11)
/> -среднее квадратическое отклонение факторного признака:
/>. (12)
Квадрат линейного коэффициентакорреляции называется линейным коэффициентом детерминации:
r2 =d. (13)
Коэффициент детерминациипоказывает, какая часть общей вариации результативного признака (y) объясняется влиянием изучаемого фактора (x).
Для получения выводов опрактической значимости синтезированных в анализе моделей, показаниям теснотысвязи дается качественная оценка. Это осуществляется на основе шкалы Чеддока.
Таблица 1 — Шкала Чеддока
Показания
тесноты связи 0,1 — 0,3 0,3 — 0,5 0,5 — 0,7 0,7 — 0,9 0,9 — 0,999
Характеристика
силы связи слабая умеренная заметная высокая
весьма
высокая
При r =1 связь является функциональной, при r= 0 связьотсутствует. Если коэффициент корреляции со знаком "+", то связьпрямая, если со знаком "-", то связь обратная.
Для практического использованиямоделей регрессии важна оценка их адекватности, т.е. соответствия фактическимстатистическим данным.
Посколькукорреляционно-регрессионный анализ связи между признаками проводится дляограниченной по объему совокупности, то параметры уравнения регрессии,коэффициенты корреляции и детерминации могут быть искажены действием случайныхфакторов. Чтобы проверить насколько эти показатели характерны для всейгенеральной совокупности, не являются ли они результатом стечения случайныхобстоятельств, необходимо проверить адекватность построенной статистическоймодели.
При численности объектов анализадо 30 единиц возникает необходимость проверки значимости (существенности) коэффициентарегрессии. При этом выясняют насколько вычисленные параметры характерны дляотображения условий: не являются ли полученные значения параметров результатомдействия случайных причин.
Значимость параметров простойлинейной регрессии осуществляется с помощью t-критерияСтьюдента. При этом вычисляют фактические (расчетные) значения t-критерия:
для параметра а0:
/>, (14)
где /> -средне квадратическое отклонение результативного признака
у от выровненных значений уx, которые рассчитываются по уравнению регрессии:
/>. (15)
для параметра а1:
/>. (16)
Вычисленные по формулам (13) и (15)значения, сравниваются с критическими tк,которые принимаются согласно данным таблицы Стьюдента с учетом заданного уровнязначимости (a) и числа степеней свободы(k = n — 2). В социально-экономических исследованиях уровень значимости a обычно принимают равным 5%, т.е. a = 0,05, что соответствует доверительнойвероятности 95%. Параметр признается существенным при условии, если tф > tк. Втаком случае практически невероятно, что найденные значения параметровобусловлены только случайными совпадениями.
Показатели тесноты связи,исчисленные по данным сравнительно небольшой статистической совокупности, такжемогут искажаться действием случайных причин. Это вызывает необходимостьпроверки их существенности, дающей возможность распространять выводы порезультатам выборки на генеральную совокупность.
Для оценки значимостилинейного коэффициента корреляции r применяется t-критерий Стьюдента. При этом определяется фактическое (расчетное)значение критерия (trф):
/>, (17)
где n-2 — число степеней свободы при заданном уровне значимости a и объеме выборки n.
Вычисленное значение trфсравнивается с критическимtk, которое берется из таблицы Стьюдента сучетом заданного уровня значимости a ичисла степеней свободы k = n — 2.
Если trф> tk, то это свидетельствует о значимостилинейного коэффициента корреляции r и существенности связимежду признаком-фактором и признаком-результатом.
Поскольку не все фактическиезначения результативного признака лежат на линии регрессии, более справедливодля записи уравнения корреляционной зависимости воспользоваться следующейформулой:
/>,(18)
где e — отражает случайную составляющую вариации результативногопризнака.
В некоторых случаях рассеяниеточек корреляционного поля настолько велико, что для принятия решений вуправлении не целесообразно пользоваться уравнением регрессии, так какпогрешность в оценке анализируемого показателя будет чрезвычайно велика. Длявсей совокупности наблюдаемых значений рассчитывается средняя квадратическаяошибка уравнения регрессии, которая представляет собой среднее квадратическоеотклонение фактических значений результативного признака у относительнозначений, рассчитанных по уравнению регрессии ух:
/>. (19)
Среднюю квадратическую ошибкууравнения регрессии Se сравнивают со средним квадратическимотклонением результативного признака sу.Если Se
Таким образом, опираясь наоценку существенности параметров уравнения регрессии и значений линейногокоэффициента корреляции, а также на основании оценки надежности уравнениярегрессии, дают заключение об адекватности построенной регрессионной модели ивозможности распространения выводов, полученных по результатам малой выборки навсю генеральную совокупность.
После проверки адекватности,установления точности и надежности регрессионной модели необходимо еепроанализировать, т.е. дать экономическую интерпретацию параметров регрессии.
Для уравнения парной линейнойзависимости прежде всего необходимо проверить согласуется ли знак параметра а1с теоретическими представлениями и соображениями о направлении влиянияпризнака-фактора на результативный признак. Для удобства интерпретациипараметра а1 следует использовать коэффициент эластичности:
/>.(20)
Коэффициент эластичностипоказывает среднее изменение результативного признака при изменении факторногопризнака на 1% и вычисляется в% -ах.
Уравнение регрессионнойзависимости является базой для расчета прогнозных значений результативногопризнака, стоящих за пределами изучаемого ряда. Для осуществления прогнозазначений результативного признака по уравнению регрессии используют недискретные (точечные), а интервальные оценки.
Средняя квадратическая ошибкауравнения регрессии дает возможность в каждом отдельном случае с определеннойвероятностью указать, что величина результативного признака расположена вопределенном интервале относительно значения, вычисленного по уравнениюрегрессии.
Зная дисперсию результативногопоказателя у и задаваясь уровнем доверительной вероятности, определяютдоверительные границы прогнозного значения результативного признака упрогнозпри значении факторного признака хо по формуле:
/>, (21)
где ухо — дискретная (точечная) оценка прогнозного значения результативного признака у,рассчитанная по уравнению регрессии, при заданном значении факторного признакахо;
ta — критерий Стьюдента, который длялинейной зависимости определяется в соответствии с уровнем значимости a по распределению Стьюдента с k = n — 2 степенями свободы;
При практическом использованииуравнения регрессии следует помнить, что экстраполяция, т.е. нахождениепрогнозируемых уровней за пределами изучаемого ряда, допускается только тогда,когда существенно не изменяются условия формирования уровней признаков, которыележат в основе определения параметров уравнения регрессии. В противном случаеиспользование уравнений для составления прогнозов должно быть отвергнуто.
2. Пример выполнения лабораторной работы
2.1 Задание на лабораторную работу
На основе ранжированных данных опроизводительности труда и стаже работы двадцати рабочих бригады (таблица) необходимо:
2.1 Установить результативный ифакторный признаки.
2.2 Определить наличие и формукорреляционной связи между производительностью труда рабочих бригады и стажемработы.
2.3 Построить на графике полекорреляции и эмпирическую линию корреляционной связи.
2.4 Построить регрессионнуюмодель парной корреляционной зависимости и определить её параметры.
2.5 Построить на графикетеоретическую кривую корреляционной зависимости.
2.6 Рассчитать показателитесноты связи между выработкой рабочего и стажем работы. Дать качественнуюоценку степени тесноты связи.
2.7 Оценить существенность параметроврегрессивной модели и показателей тесноты связи. Дать оценку надёжностиуравнения регрессии.
2.8 Дать экспериментальнуюинтерпретацию параметров построенной регрессионной модели.
2.9 На основании регрессионноймодели парной зависимости указать доверительные границы, в которых будетнаходиться прогнозное значение уровня производительности труда рабочегобригады, если стаж его работы составит 10,5 лет при уровне доверительнойвероятности 95%.
Решение:
Установим результативный ифакторный признаки: результативный признак (y) — выработка, факторный (x) — стаж работы, лет.
Определим наличие и формукорреляционной связи между производительностью труда рабочих бригады и стажемработы. Так как увеличение значений признака-фактора влечёт за собой увеличениевеличины результативного признака. То можно предположить наличие прямойкорреляционной связи между выработкой и стажем работы. Проведём группировкуработников бригады по признаку-фактору — стажу работы. Результаты оформим втаблицу 2. Сравнив средние значения результативного признака по группам, можносделать вывод о наличии связи между выработкой и стажем работы. Причём онабудет являться прямой, так как рост значений признака фактора влечёт ростсредних значений признака результата.
Построим поле корреляции./> />
Рисунок 1. Поле корреляции
Построим регрессионную модельпарной корреляционной зависимости и определим её параметры: /> - уравнение парнойлинейной корреляционной зависимости (регрессионная модель).
/>→/>, />→/>
Таблица 2 — Расчётная таблица.
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/> 8 800 6400 640000 64 789,02 -1,95 3,8025 152,5 23256,25 10,98 120,56 8 850 6800 722500 64 102,5 10506,25 60,98 3718,56 8 720 5760 518400 64 232,5 54056,25 -69,02 4763,76 9 850 1650 722500 81 872,86 -0,95 0,9025 102,5 10506,25 -22,86 622,57 9 800 7200 640000 81 -152,5 23256,3 -72,86 5308,57 9 880 7920 774400 81 -72,5 5256,25 7,14 50,98 9 950 8550 902500 81 2,5 6,25 77,14 5950,57 9 820 7380 672400 81 -132,5 17556,25 -52,86 2794,17 10 900 9000 810000 100 956,7 0,05 0,0025 -52,5 2756,25 -56,7 3114,89 10 1000 10000 1000000 100 47,5 2256,25 43,3 1874,89 10 920 9200 846400 100 -32,5 1056,25 -36,7 1346,89 10 1060 10600 1123600 100 107,5 11556,25 103,3 10670,89 10 950 9500 902500 100 2,5 6,25 -6,7 44,89 11 900 9900 810000 121 1040,54 1,05 1,1025 -52,5 2756,25 -140,54 975,15 11 1200 13200 1440000 121 247,5 61256,25 159,46 25421, 19 11 1150 12650 1322500 121 197,5 39006,5 109,46 11981,49 11 1000 11000 1000000 121 47,5 2256,25 -40,54 1643,49 12 1200 14400 1440000 144 1124,38 2,05 4, 2025 247,5 6156,25 75,62 5718,38 12 1100 13200 1210000 144 147,5 21756,25 -24,38 594,38 12 1000 12000 1000000 144 47,5 2256,25 -124,38 5470,38 199 19050 192310 2013 19050,16 32,95 358275 12969,33
Найдём среднее произведениефакторного и результативного признака по формуле (8):
/>.
Рассчитаем средние значениефакторного и результативного признака:
факторного по формуле (9):
/>.
результативного, по формуле (10):
/>;/>.
Подставим значения результативногои факторного признака в уравнение парной линейной корреляционной зависимостиполучим регрессионную модель парной корреляционной зависимости: /> — регрессионная модельзависимости выработки от стажа работы.
/>
/>;/>.
/>
5. Построим на графикетеоретическую кривую корреляционной зависимости.
6. Рассчитаем показатели теснотысвязи между выработкой рабочего и стажем работы. Для прямолинейных зависимостейизмерителем тесноты связи между признаками является коэффициент парнойкорреляции, который рассчитывается по формуле (7).
Для расчёта коэффициента парнойкорреляции рассчитаем среднее квадратическое отклонение факторного ирезультативного признака:
результативного признака, поформуле (11)
/> (штук)
факторного признака, по формуле(12)
/> (лет)
Подставим полученные значения вформулу (7) рассчитаем показатель тесноты связи:
/>
Дадим качественную оценкустепени тесноты связи. Для этого рассчитаем коэффициент детерминации, которыйпоказывает какая часть общей вариации результативного признака (y) объясняется влиянием изучаемого фактора (x).
/>;/>.
На основе шкалы Чеддока можносделать вывод о том, что между выработкой т стажем работы существует прямаявысокая связь.64% изменения выработки обусловлено изменением стажа работырабочих.
7. Оценим существенностьпараметров регрессионной модели и показателей тесноты связи и дадим оценкунадёжности уравнения регрессии.
Значимость параметров простойлинейной регрессии осуществляется с помощью t-критерияСтьюдента. Рассчитаем значения t-критерия Стьюдента дляпараметра a0и a1:для параметра а0, по формуле (14). Для этого рассчитаем среднеквадратическое отклонение результативного признака у от выровненных значений уx по формуле (15):
/>, />
для параметра a1по формуле (16):
/>
Для оценки значимости линейного коэффициента корреляции r применяется t-критерий Стьюдента. Приэтом определяется фактическое (расчетное) значение критерия (trф).Рассчитаем это значение по формуле (17):
/>
Для всей совокупностинаблюдаемых значений рассчитаем среднюю квадратическую ошибку уравнения регрессиипо формуле (19):
/> (штук).
Так как />, то уравнение регрессиицелесообразно и может быть использовано в дальнейшем статистическом анализе.
81,98
Так как /> (фактическое) > /> (критическое), то значениепараметра /> признаётся существенным,то есть оно не является результатом стечения случайных обстоятельств.
Так как />> />, то /> также признаётсясущественным.
Так как />> />, то связь междупроизвольностью труда и стажем работы признаётся существенной.
8. Дадим экспериментальнуюинтерпретацию параметров построенной регрессионной модели. Так как коэффициентрегрессии /> > 0, то этоподтверждает теоретические представления о прямой зависимости между выработкойи стажем работы. Значение />= 83,84шт. можно интерпретировать так: при увеличении стажа на 1 год выработкаувеличивается на 83,84 шт.
Рассчитаем коэффициентэластичности по формуле (20), который показывает среднее изменение результативногопризнака при изменении факторного признака на 1%:
/>%.
То есть при увеличении стажа на1% их выработка увеличивается на 0,88%.
9. Укажем доверительные границы,в которых будет находиться прогнозное значение уровня производительности трударабочего бригады, если стаж его работы составит 10,5 лет при уровнедоверительной вероятности 95% по формуле (21):
/> штук
/>
/>
/>
Таким образом, с вероятностью95% можно ожидать, что при стаже работы работника 10,5 лет составит не менее956 штук и не более 1040 штук.
3. Порядок выполнения лабораторной работы
На основе ранжированных данных опроизводительности труда и стаже работы двадцати рабочих бригады (таблица 2) необходимо:
3.1 Установить результативный ифакторный признаки.
3.2 Определить наличие и формукорреляционной связи между производительностью труда рабочих бригады и стажемработы.
Построить на графике полекорреляции и эмпирическую линию корреляционной связи.
Построить регрессионную модельпарной корреляционной зависимости и определить ее параметры.
Построить на графикетеоретическую кривую корреляционной зависимости.
Рассчитать показатели тесноты связимежду выработкой рабочего и стажем работы. Дать качественную оценку степенитесноты связи.
Оценить существенностьпараметров регрессионной модели и показателей тесноты связи. Дать оценкунадежности уравнения регрессии.
Дать экономическую интерпретациюпараметров построенной регрессионной модели.
На основании регрессионноймодели парной зависимости указать доверительные границы, в которых будетнаходиться прогнозное значение уровня производительности труда рабочегобригады, если стаж его работы составит 10,5 лет при уровне доверительнойвероятности 95%.
Таблица 2 — Распределение рабочих бригады по выработке и стажу работы
№ п/п
рабочего
Стаж работы,
лет Выработано изделий одним рабочим, шт.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
8
8
8
9
9
9
9
9
10
10
10
10
10
11
11
11
11
12
12
12
800
850
720
850
800
880
950
820
900
1000
920
1060
950
900
1200
1150
1000
1200
1100
1000
Рекомендуемая литература
1. Гусаров В.М. Статистика: Учеб. пособие для вузов. — М.: ЮНИТИ-ДАНА,2002. — 463 с.
2. Ефимова М.Р. и др. Практикум по общей теории статистики: Учеб. пособие/ М.Р. Ефимова, О.И. Ганченко, Е.В. Петрова. — М.: Финансы и статистика, 2000. — 280 с.
3. Практикум по статистике: Учеб. пособие для вузов / Под ред.В.М. Симчеры/ ВЗФЭИ. — М.: ЗАО «Финстатинформ», 1999. — 259 с.
4. Статистика: Учеб. пособие / Под ред. проф. М.Р. Ефимовой. — М.: ИНФРА-М,2002. — 336 с.
5. Теория статистики: Учебник / Под ред. Г.А. Громыко. — М.: ИНФРА-М,2000. — 414 с.
6. Теория статистики: Учебник / Под ред.Р.А. Шмойловой. — 2-е изд.,доп. и перераб. — М.: Финансы и статистика, 1998. — 576 с.
7. Чернова А.В. Теория статистики: Учебное пособие по курсу «Статистика».Ч.1 (для студентов экономических специальностей) / Орел ГТУ, 1997. — 101 с.
8. Чернова А.В. Статистика промышленности: Учебное пособие по курсу«Статистика». Ч.2 (для студентов экономических специальностей) / ОрелГТУ. Каф. «ЭиМ». — Орел, 1998. — 114 с.
Приложение
МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
ОРЛОВСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ
ИНСТИТУТ БИЗНЕСА И ПРАВА
Кафедра «Экономика и менеджмент»
ЛАБОРАТОРНАЯ РАБОТА
по дисциплине «Статистика»
на тему: " Статистическое изучение взаимосвязисоциально-экономических явлений и процессов"
Выполнил студент: __________
Группа: ____________________
Специальность: _____________________
Руководитель лабораторнойработы: ___________________
Оценка защиты: _____________________
Орел 2003