Содержание
Задание 1. 2
Задание 2. 6
Задание 3. 8
Задание 4. 10
Задание 5. 13
Список литературы… 17
Задание 1
1. Определите, на какой диаграмме показаны временныеданные, а на какой пространственные (рис.1 и рис. 2).
/>
Рисунок 1 – Структура использования денежных доходов за2001 г
/>
Рисунок 2 – Структура использования денежных доходов за2001 г
Ответ:
Прогнозы часто осуществляются на основе некоторыхстатистических показателей, которые изменяются во времени. Если эти показателиимеют значения на определенные промежутки времени, следующие друг за другом, тообразуются некоторые ряды данных с определенными тенденциями. Ряд расположенныхв хронологической последовательности значений статистических показателей,представляют собой временной (динамический) ряд.
Динамическим рядом называется ряд чисел или рядоднородных статистических величин, показывающих изменения размеров какого-либоявления или признака во времени.
Каждый временной ряд состоит из двух элементов: отрезкивремени (периоды), в рамках которых был зафиксирован определенныйстатистический показатель и статистические показатели, характеризующие объектисследования (уровни ряда). Эти данные представлены на рис. 1.
На рис. 2 представлены пространственные данные, т.е.совокупность каких-либо параметров (в данном случае структуры денежныхрасходов) за один временной период (за декабрь).
2. Дайте определение регрессии.
Исследуя природу, общество, экономику, необходимосчитаться со взаимосвязью наблюдаемых процессов и явлений. При этом полнотаописания так или иначе определяется количественными характеристикамипричинно-следственных связей между ними. Оценка наиболее существенных из них, атакже воздействия одних факторов на другие является одной из основных задачстатистики.
Задачи регрессионного анализа лежат в сфере установленияформы зависимости, определения функции регрессии, использования уравнения дляоценки неизвестных значений зависимой переменной.
Аппроксимация данных с учетом их статистическихпараметров относится к задачам регрессии. Они обычно возникают при обработкеэкспериментальных данных, полученных в результате измерений процессов илифизических явлений, статистических по своей природе (как, например, измерения врадиометрии и ядерной геофизике), или на высоком уровне помех (шумов). Задачейрегрессионного анализа является подбор математических формул, наилучшим образомописывающих экспериментальные данные.
Математическая постановка задачи регрессии заключается вследующем. Зависимость величины (числового значения) определенного свойстваслучайного процесса или физического явления Y от другого переменного свойстваили параметра Х, которое в общем случае также может относиться к случайнойвеличине, зарегистрирована на множестве точек xk множеством значений yk, приэтом в каждой точке зарегистрированные значения yk и xk отображаютдействительные значения Y(хk) со случайной погрешностью sk, распределенной, как правило, по нормальномузакону. По совокупности значений yk требуется подобрать такую функцию f(xk, a0,a1, …, an), которой зависимость Y(x) отображалась бы с минимальнойпогрешностью. Отсюда следует условие приближения:
yk = f(xk, a0, a1, …, an) + sk.
Функцию f(xk, a0, a1, …, an) называют регрессиейвеличины y на величину х. Регрессионный анализ предусматривает задание видафункции f(xk, a0, a1, …, an) и определение численных значений ее параметровa0, a1, …, an, обеспечивающих наименьшую погрешность приближения к множествузначений yk. Как правило, при регрессионном анализе погрешность приближениявычисляется методом наименьших квадратов (МНК). Для этого выполняетсяминимизация функции квадратов остаточных ошибок:
s?a0,a1, …, an) =/>[f(xk, a0, a1,…, an) — yk]2.
Для определения параметров a0, a1, …, an функцияостаточных ошибок дифференцируется по всем параметрам, полученные уравнениячастных производных приравниваются нулю и решаются в совокупности относительновсех значений параметров. [3]
Таким образом, регрессия – это односторонняя вероятностнаязависимость между случайными величинами: y = f(x)
3. Определите виды регрессий:
y = 12,5 – 1,44 x1 + 5 x2 – 2.27 x3 + e
y = 1/ (11+10,.45x1 – 9,44 x2 + 3.33 x3 – 1.37x4 + e)
y = e45.45+100x + e
Покажите, где здесь результирующая, а где объясняющиепеременные. Что обозначает е в уравнениях регрессии?
Виды регрессии обычно называются по типу аппроксимирующихфункций: полиномиальная, экспоненциальная, логарифмическая и т.п.
Таким образом, можно говорить о том, что
y = 12,5 – 1,44 x1 + 5 x2 – 2.27 x3 + e – этополиномиальная регрессия
y – результирующая переменная
x1, x2, x3 — объясняющие переменные
e – ошибка регрессии
y = 1/ (11+10,.45x1 – 9,44 x2 + 3.33 x3 – 1.37x4 + e) — это гипербола
y – результирующая переменная
x1, x2, x3, х4 — объясняющие переменные
e – ошибка регрессии
y = e45.45+100x + e – это экспоненциальная регрессия
y – результирующая переменная
x — объясняющая переменные
e – ошибка регрессии
Задание 2
1. Дайте определение парной регрессии.
Аналитическое выражение связей между признаками можетбыть представлена виде уравнений регрессии:
yx = a0+a1x
где х – значение факторного признака
у – значение результативного признака (эмпирические)
ух – теоретические значения результативного признака,полученные по уравнению регрессии.
а0 и а1 – это коэффициенты регрессии, которыеопределяются путем решения следующей системы уравнений:
/>na0+a1?x = ?y
a0?x+a1?x = ?xy2
В основе решения данной системы уравнений лежит методнаименьших квадратов, сущность которого заключается в минимизации суммыквадратов отклонений эмпирических значений признака от теоретических,полученных по уравнению регрессии:
?(yi-yx)2 > min
а0 — показывает влияние неучтенных в модели факторов ичеткой интерпретации не имеет
а1 – показывает на сколько в среднем изменяется значениерезультативного признака при изменении факторного признака на единицусобственного измерения [5]
2. По Российской Федерации за 2001 год известны значениядвух признаков (табл. 1):
Таблица 1Месяц Расходы на покупку продовольственных товаров в общих расходах, % (y) Средний денежный доход на душу населения, руб. (x) Январь 69 1954,7 Февраль 65,6 2292,0 Март 60,7 2545,8 Апрель … … Май … … Июнь … … Июль … … Август … … Сентябрь … … Октябрь 53,3 3042,8 Ноябрь 50,9 3107,2 Декабрь 47,5 4024,7
Для оценки зависимости y от x построена парная линейнаярегрессионная модель с помощью метода наименьших квадратов:
y = a + bx + e, где а = 196/4, b = 1/196
Парный коэффициент корреляции rxy = 1/ (-196) * 78
Средняя ошибка аппроксимации: А = 196/46 + 4,6
Известно, что Fтабл. = 4,96, а Fфакт = 196/2 + 5
Определите коэффициент детерминации. Определите линейнуюмодель через среднюю ошибку аппроксимации и F-критерий Фишера.
Решение:
Найдем коэффициенты парной линейной регрессионной модели:
а = 196/4 = 49
b = 1/196 = 0,0051
Получим уравнение регрессии:
y = 49 + 0,0051x + e,
Значит, с увеличением среднего денежного дохода на 1 руб.доля расходов на покупку продовольственных товаров снижается в среднем на0,0051 %.
Линейный коэффициент парной корреляции
rxy = 1/ (-196) * 78 = -0,39
(связь умеренная, обратная)
Найдем коэффициент детерминации
rxy2 = (-0,39)2 = 0,158. Вариация результата на 15,8 %объясняется вариацией фактора x.
Средняя ошибка аппроксимации А = 196/46 + 4,6 = 8,86, чтоговорит о высокой ошибке аппроксимации (недопустимые пределы). В среднемрасчетные значения отклоняются от фактических на 8,86 %.
Проверяем F-критерий Фишера. Для этого сравним Fтабл. иFфакт.
Fтабл. = 4,96
Fфакт.=103
Fтабл.
Вывод: линейная парная модель плохо описывает изучаемуюзакономерность.
Задание 3
В табл. 2 приведены данные, формирующие цену настроящиеся квартиры в двух различных районах.
Таблица 2Район, а/б Жилая площадь, м2 Площадь кухни, м2 Этаж, средние/крайние Дом, кирпич/панель Срок сдачи, через сколько мес. Стоимость квартиры, тыс. долл 1 17,5 8 1 1 6 17,7 1 20 8,2 1 2 1 31,2 2 23,5 11,5 2 2 9 13,6 … … … … … … … 1 77 17 2 1 1 56,6 2 150,5 30 2 2 2 139,2 2 167 31 2 1 5 141,5
Имеется шесть факторов, которые могут оказывать влияниена цену строящегося жилья:
район, где расположена строящаяся квартира (а или б);
жилая площадь квартиры;
площадь кухни;
этаж (средний или крайний);
тип дома (панельный или кирпичный);
срок сдачи квартиры (через сколько месяцев).
Определите минимальный объем выборки Nmin. Для оценкизависимости y от х построена линейная множественная регрессионная модель спомощью метода наименьших квадратов:
y = a0 + a1x1 + a2x2 + a3x3 + a4x4 + a5x5 + a6x3 + e
где a0 = -196/11,5
a1 = -196/8-10
a2 = 1/196+0,79
a3 = 0,1-1/196
a4 = 196/5 — 16
a5 = 0,12*196
a6 = 1/196-0,4
Какие фиктивные переменные были использованы в модели?Дайте экономическую интерпретацию полученной модели.
Решение:
Найдем минимальный объем выборки Nmin. Число факторов,включаемых в модель, m = 6, а число свободных членов в уравнении n = 1.
Nmin. = 5 (6+1) = 35
Найдем коэффициенты линейной множественной модели:
a1 = -196/8-10 = -34,5
a2 = 1/196+0,79 = 0,79
a3 = 0,1-1/196 = 0,095
a4 = 196/5 – 16 = 23,2
a5 = 0,12*196 = 23,52
a6 = 1/196-0,4 = -0,39
Получили уравнение регрессии:
y = a0 – 34,55x1 + 0,79x2 + 0,095x3 + 23,2x4 + 23,52x5-0,39x3 + e
Экономическая интерпретация полученной модели: квартиры врайоне а стоят на 34,55% дешевле, чем в районе b. При увеличении жилой площадина 0,79 % стоимость квартиры возрастает на 0,095 %. Квартиры на средних этажахстоят на 0,095 % дороже, чем на крайних. Квартиры в кирпичных домах стоят на 23,2% дороже, чем в панельных. При увеличении срока сдачи дома на 1 % стоимостьквартиры уменьшается на 0,39%.
Фиктивные переменные – это район (принимает значения аили б), этаж (средний или крайний); тип дома (панельный или кирпичный).
Задание 4
Постройте модель сезонных колебаний дохода торговогопредприятия, используя первую гармонику ряда Фурье, по данным, приведенным втабл. 2, изобразите графически.
Таблица 2Месяц Доход, тыс. руб. Январь 58,33+112* (1/196) = 58,90 Февраль 52+112* (1/196) = 52,57 Март 43,67+112* (1/196) = 44,24 Апрель 41,02+112* (1/196) = 41,59 Май 42,77+112* (1/196) = 43,34 Июнь 50,01+112* (1/196) = 50,58 Июль 56,6+112* (1/196) = 57,17 Август 64,74 + 112* (1/196) = 65,31 Сентябрь 71,04+112* (1/196) = 71,61 Октябрь 73,54+112* (1/196) = 74,11 Ноябрь 72,16+112* (1/196) = 72,73 Декабрь 66,3+112* (1/196) = 66,87
Воспользуйтесь вспомогательной таблицей 3.
Таблица 3t соs t sin t 1,00 0,00 0,523599 0,87 0,50 1,047198 0,50 0,87 1,570796 0,00 1,00 2,0944395 -0,50 0,87 2,617994 -0,87 0,50 3,141593 -1,00 0,00 3,665191 -0,87 -0,50 4,18879 -0,50 -0,87 4,712389 0,00 -1,00 5,235988 0,50 -0,87 5,759587 0,87 -0,50