--PAGE_BREAK--Построение модели множественной регрессии включает этапы:
1. выбор формы связи
2. отбор факторных признаков
3. обеспечение достаточного объема совокупности для получения верных оценок.
I. все множество связей между переменными, встречающиеся на практике достаточно полно описывается функциями 5-ти видов:
1. линейная:
2. степенная:
3. показательная:
4. парабола:
5. гипербола:
Хотя все 5 функций присутствуют в практике КРА, наиболее часто используется линейная зависимость, как наиболее простая и легко поддающаяся интерпретации уравнение линейной зависимости: , (2.5)
где к – множество факторов включающихся в уравнение,
bj– коэффициент условно-чистой регрессии, который показывает среднее по совокупности отклонение результативного признака от его среднего значения при отклонении фактора xjот своей средней величины на единицу при условии, что все остальные факторы, входящие в уравнение сохраняют средние значения.[9]
Параметры уравнения множественной регрессии и определение с помощью МНК.
Пример:
0 – т.к. >0,7 следовательно на них обращаем особое внимание ЭКО. Шкала тесноты связи:
Если связь 0 – 0,3 – слабая связь
0,3 – 0,5 – заметная
0,3 – 0,5 – тесная
0,7 – 0,9 – высокая
более 0,9 – весьма высокая
Затем сравниваем два признака (доход и пол)
Отбор факторов для включения в уравнение множественной регрессии:
1. между результативным и фактическим признаками должна быть причинно-следственная зависимость.
2. результативный и фактический признаки должны быть тесно связаны между собой иначе возникает явление мультиколлинеарности (>06), т.е. включенные в уравнение факторные признаки влияют не только на результативный, но друг на друга, что влечет к неверной интерпретации числовых данных.
Отбор факторов для модели осуществляется в два этапа. На первом идет анализ, по результатам которого исследователь делает вывод о необходимости рассмотрения тех или иных явлений в качестве переменных, определяющих закономерности развития исследуемого процесса, на втором — состав предварительно отобранных факторов уточняется непосредственно по результатам статистического анализа.[1]
Методы отбора факторов для включения в уравнение множественной регрессии:
1. экспертный метод – основан на интуитивно логическом анализе который выполняется высококвалифицированными экспертами.
2. использование матриц парных коэффициентов корреляции осуществляется параллельно с первым методом, матрица симметрична относительно единичной диагонали.
3. пошаговый регрессионный анализ – последовательное включение факторных признаков в уравнение регрессии и проверки значимости проводится на основании значений двух показателей на каждом шаге. Показатель корреляции, регрессии.
Показатель корреляции: рассчитывают изменение теоретической корреляции отношения или изменение средней остаточной дисперсии. Показатель регрессии – изменение коэффициента условно чистой регрессии.[14]
2.3. Проверка адекватности моделей, построенных на основе уравнений регрессии
Для практического использования моделей регрессии большое значение имеет их адекватность, т.е. соответствие фактическим статистическим данным.
Корреляционный и регрессионный анализ обычно (особенно в условиях так называемого малого и среднего бизнеса) проводится для ограниченной по объёму совокупности. Поэтому показатели регрессии и корреляции – параметры уравнения регрессии, коэффициенты корреляции и детерминации могут быть искажены действием случайных факторов. Чтобы проверить, насколько эти показатели характерны для всей генеральной совокупности, не являются ли они результатом стечения случайных обстоятельств, необходимо проверить адекватность построенных статистических моделей.
Проверка адекватности моделей, построенных на основе уравнений регрессии, начинается с проверки значимости каждого коэффициента регрессии.[12]
При численности объектов анализа до 30 единиц возникает необходимость проверки значимости (существенности) каждого коэффициента регрессии. При этом выясняют насколько вычисленные параметры характерны для отображения комплекса условий: не являются ли полученные значения параметров результатами действия случайных причин.
Значимость коэффициентов простой линейной регрессии (применительно к совокупностям, у которых n
(2.6)
Для параметра a0 :
(2.7)
для параметра a1:
(2.8)
где n - объём выборки;
— среднее квадратическое отклонение результативного признака от выравненных значений ŷ;
или (2.9)
— среднее квадратическое отклонение факторного признака x от общей средней .[8]
Вычисленные по вышеприведенным формулам значения сравнивают с критическими t , которые определяют по таблице Стьюдента с учетом принятого уровня значимости α и числом степеней свободы вариации . В социально-экономических исследованиях уровень значимости α обычно принимают равным 0,05. Параметр признаётся значимым (существенным) при условии, если tрасч>tтабл . В таком случае практически невероятно, что найденные значения параметров обусловлены только случайными совпадениями.
Параметр модели признается статистически значимым, если tp>tкр
Наиболее сложным в этом выражении является определение дисперсии, которая может быть рассчитана двояким способом.
Наиболее сложным этапом, завершающим регрессионный анализ, является интерпретация уравнения, т.е. перевод его с языка статистики и математики на язык экономиста.
Интерпретация моделей регрессии осуществляется методами той отрасли знаний, к которой относятся исследуемые явления. Но всякая интерпретация начинается со статистической оценки уравнения регрессии в целом и оценки значимости входящих в модель факторных признаков, т.е. с выяснения, как они влияют на величину результативного признака. Чем больше величина коэффициента регрессии, тем значительнее влияние данного признака на моделируемый. Особое значение при этом имеет знак перед коэффициентом регрессии. Знаки коэффициентов регрессии говорят о характере влияния на результативный признак. Если факторный признак имеет знак плюс, то с увеличением данного фактора результативный признак возрастает; если факторный признак со знаком минус, то с его увеличением результативный признак уменьшается.[12]
Интерпретация этих знаков полностью определяется социально-экономическим содержанием моделируемого (результативного) признака. Если его величина изменяется в сторону увеличения, то плюсовые знаки факторных признаков имеют положительное влияние. При изменении результативного призна-л-1 в сторону снижения положительное значение имеют минусовые знаки факторных признаков. Если экономическая теория подсказывает, что факторный признак должен иметь положительное значение, а он со знаком минус, то необходимо проверить расчеты параметров уравнения регрессии. Такое явление чаще всего бывает в силу допущенных ошибок при решении. Однако следует иметь в виду, что при анализе совокупного влияния факторов, при наличии взаимосвязей между ними характер их влияния может меняться. Для того чтобы быть уверенным, что факторный признак изменил знак влияния, необходима тщательная проверка решения данной модели, так как часто знаки могут меняться в силу допустимых ошибок при сборе или обработке информации.[4]
При адекватности уравнения регрессии исследуемому процессу возможны следующие варианты.
1. Построенная модель на основе ее проверки по F-критерию Фишера в целом адекватна, и все коэффициенты регрессии значимы. Такая модель может быть использована для принятия решений к осуществлению прогнозов.
2. Модель по F-критерию Фишера адекватна, но часть коэффициентов регрессии незначима. В этом случае модель пригодна для принятия некоторых решений, но не для производства прогнозов.
3. Модель по F-критерию Фишера адекватна, но все коэффициенты регрессии незначимы. Поэтому модель полностью считается неадекватной. На ее основе не принимаются решения и не осуществляются прогнозы.[12]
3. ПРИМЕНЕНИЕ РЕГРЕССИОННОГО АНАЛИЗА ДЛЯ ИЗУЧЕНИЯ ОБЪЕКТА ИССЛЕДОВАНИЯ
Таблица 3.1.
Исходные данные[15]
№ предприятия
Объем добычи, тыс. т
Численность рабочих, чел
Стоимость основных фондов, тыс. у.е.
Фондоотдача, тыс. т/
Производительность труда
1
1275
240
10450
0,12
5,31
2
1250
210
7458
0,17
5,95
3
1054
264
9845
0,11
4
4
1513
240
8580
0,18
6,3
5
2214
276
9900
0,22
8,02
6
950
234
9790
0,1
4,06
7
1890
246
9350
0,2
7,68
8
2380
250
12650
0,19
9,52
9
2065
300
11290,4
0,18
6,88
10
1785
276
13200
0,14
6,47
11
1420
290
11200
0,13
4,9
12
1720
310
1460
1,18
5,55
Выделим основные показатели деятельности предприятия такие как: объем добычи, стоимость ОПФ и производительность труда рабочих.
Для начала необходимо найти недостающие данные. Проведём расчет производительности труда по формуле 3.1:
, (3.1)
где — выпуск валовой продукции;
— средняя списочная численность.
Результаты расчетов поместим в таблицу 3.2.
Таблица 3.2
Производительность труда, млн. руб./чел.
Для установления зависимости объёма добычи от стоимости ОПФ и производительности труда рабочих проведём корреляционно-регрессионный анализ.
Чтобы провести анализ, присвоим переменным C, X, Y значения показателей величин: стоимости ОПФ, производительность труда рабочих и объёма добычи соответственно.
Прежде всего найдём средние значения показателей объёма добычи, стоимости основных фондов и производительности труда (X, Y, Z) по формуле средней арифметической 3.2:
, (3.2)
где xi–значение показателя i-го предприятия;
n- количество предприятий.
Результат представим в виде таблицы 3.3
Таблица 3.3
Средние значения показателей
Далее проведём ряд расчётов и для удобства их проведения поместим результаты промежуточных расчетов в таблицу 3.4.
Таблица 3.4
Результаты расчетов
Найдём среднее квадратическое отклонение каждого показателя по формуле 3.3:
продолжение
--PAGE_BREAK--