Реферат по предмету "Статистика"


Сводка, группировка, статистические таблицы

Лабораторная работа № 1. Тема: «Сводка, группировка, статистические таблицы». Цель: выявление обобщающих закономерностей, характерных для изучаемой совокупно-сти объектов наблюдения как целостной системы. Цель исследования—определение уровня успеваемости студентов 1-ого курса, а так же факторов на него влияющих. В качестве исследуемых признаков я рассматриваю: 1. средний балл по итогам экзаменов за 1-ый курс (баллы).

2. посещаемость занятий в университете на 1-ом курсе. 3. самообразование (дополнительное обучение, курсы) (ч/нед). 4. сон (ч/сутки). 5. пол (м, ж). 6. подготовка к семинарским и практическим занятиям (ч/нед). 7. нравятся ли студенту на 1-ом курсе занятия в университете (да, нет). Из представленных признаков я выделяю признак-результат—средний балл зачётки по итогам 1-ого курса,

так как его значение отвечает цели исследования. Остальные шесть признаков являются признаками-факторами, т. к. они оказывают влияние на признак-результат. Наблюдение единовременное ауд. 722, 522 СПбГИЭУ. Дата проведения: 03.11.2000г. по форме проведения—опрос. Объектом наблюдения являются 2 группы студентов (1093 и 1094) 2-ого курса. единица наблюдения—студент. Исследование основного массива.

Таблицы с исходными данными. Таблица 1 Средний балл за¬чётки по итогам экзаменов за 1-ый курс (бал-лы) Посещае-мость заня-тий на пер-вом курсе Самообра-зование (доп. Кур-сы) ч/нед Подготовка к семинар¬ским заня¬тиям (ч/нед) Сон (ч/сут) Пол (м, ж) Нравятся ли занятия в универ-ситете (да, нет) 4,7 19,5 0 5 7 Ж Да 4,5 22 2 6 9 Ж Да 4,2 22 0 2 6 М Да 4,3 19,5 0 7 7

Ж Да 4,5 17,7 Ж Нет 4,2 9,5 6 12 10 Ж Да 4,0 12,5 0 5 5 Ж Да 4,7 22 4 7 6 Ж Да 4,6 17,5 3 4 8 Ж Да 4,7 9,5 0 2 7 Ж Да 4,5 11,5 6 3 7 Ж Да 4,0 11,5 2 3 9 Ж Да 4,2 19,8 Ж Нет 4,0 20,5 6 9 5 Ж Да 3,2 9,10 М Нет 4,0 17,8 М Нет 3,2 14,8 М Нет 3,5 14,8 М Нет 4,8 22 0 10 10

Ж Нет 4,6 8,5 0 1 8 М Да 4,5 22 0 4 7 Ж Да 4,5 22 6 2 7 М Да 4,2 17,9 М Нет 4,5 14,5 6 4 10 Ж Да 4,2 11,8 Ж Нет 4,8 17,9 Ж Нет 4,0 10,5 0 2 7 Ж Да 4,2 17,5 2 6 5 Ж Да 3,0 9,9 М Нет 4,8 19,5 2 2 8 Ж Да 4,8 19,5 2 6 9 Ж Да 4,3 17,5 4 2 7 Ж Да 3,2 6,5 М Нет 4,5 22 2 5 9

Ж Нет 4,7 22 4 3 6 Ж Да 4,2 22 3 5 8 Ж Да 4,6 9,8 Ж Нет 3,0 14,10 М Нет 3,0 6,9 М Нет 4,0 22 2 5 9 Ж Да 4,7 17,10 Ж Нет 3,5 11,7 М Нет 4,7 22 6 2 5 Ж Да 4,5 22 0 0 8 Ж Да 3,2 17,5 4 8 9 Ж Да 4,8 22 0 0 5 М Да 3,2 9,5 0 5 10 М Да 4,5 17,5 0 3 10 Ж Да 3,0 14,5 5 3 7

М Нет 4,7 11,7 М Нет Структурные группировки. 1 группировка. Таблица 2 Средний балл по итогам экзаменов за 1 курс, баллы Число студентов % к итогу Fi [3-3,5] 9 18 9 [3,5-4] 3 6 12 [4-4,5] 15 30 27 [4,5-5] 50 Итог: 50 100 Для удобства разбиваем вариационный ряд на 4 равных интервала. Величину интервала определяем по формуле: h = R / n = (X max –

X min) / n = (5-3) / 4 = 0,5 гистограмма: кумулята: считаем по несгруппированным данным для большей точности: Х = (4,7 + 4,5 + 4,2 + 4,2 +4,5 + 4,2 + 4,0 + 4,7 + 4,6 + 4,7 + 3,5 + 4,0 + 3,2 + 4,0 + 3,2 + 3,5 + + 4,8 + 4,6 + 4,5 + 4,5 + 4,2 + 4,5 + 4,2 + 4,8 + 4,0 + 4,2 + 3,0 + 3,2 + 4,8 + 4,8 + 4,3 + 4,5 + 4,7 + 4,2 + 4,6 + 3,0 + 3,0 + 4,0 + 4,7 + 3,5 + 4,7 + 4,5 + 3,2 + 4,5 + 4,8 + 3,2 + 3,0 + 4,5 + 4,7) / 50 = 4,27 (балла) Ме = x0 +  Ме (N/2 –

F(x0) / NMe Me = 4+ 0,5 (25 –12) / 15 = 4,4 (балла) Мо = х0 +  Мо (NМо – NМо-1) / (NМо – NМо-1) + (NМо – NМо+1) Mo = 4,5 + 0,5 (25-15) / ((23-15) + (23-0)) = 4,6 (балла) D =  (xi – x)2 / n считаем по несгруппированным данным. D = 0,3 (кв. балла) bx = D bx = 0,3 = 0,55 (балла)

V = bx / x  100% V = (0,55 / 4,27)  100% = 128% R = xmax – xmin R = 5 – 3 = 2 (балла) Вывод: средний балл зачётки по итогам экзаменов за 1-ый курс для данной совокупности составляет 4,27 балла. Т. к. коэффициент вариации является величиной незначительной (128%), можно предполагать, что такой средний балл является типичным для данной со-вокупности. Наиболее распространённым является балл зачётки 4,6 балла.

Средний балл у 50% студентов не больше 4,4 балла. Группировка 2 Таблица 3 Посещаемость, ч/нед Число студентов, чел % к итогу Fi [6-10] 9 18 9 [10-14] 8 16 17 [14-18] 15 30 32 [18-22] 50 Итог: 100 Разбиение на интервалы аналогично группировке 1. Для несгруппированных данных, значит более точный результат.

Х =  xi / n X = 16, 13 (ч/нед) Ме = x0 +  Ме (N/2 – F(x0) / NMe Ме = 14 + 4 (25 – 17) / 15 = 17,3 (ч/нед) D =  (xi – x)2 / n D = 19,4 ((ч/нед)2) bx = D = 4,4 (ч/нед) V = bx / x  100% = (4,4 / 16,13)  100% = 27,2% R = xmax – xmin R = 22 – 16 = 16 (балла) Вывод: средняя посещаемость в группах составляет 16,13 ч/нед

(70% от часов в неделю назначенных расписанием). Коэффициент вариации является величиной незначительной (28,6%), следовательно. Такая средняя посещаемость типична для студентов данной сово-купности. Большинство студентов посещало 17,3 ч/нед. Посещаемость занятий у 50% сту-дентов меньше 19 ч/нед, у 50% больше 19 ч/нед. Группировка 3 Таблица 4 Самообразование, курсы (ч/нед) Число студентов % к итогу Fi 0 25 50 25 2 8 16 33 3 2 4 35 4 6 12 41 5 2 4 43 6 7 14 50

Итог: 100 Полегон частот: кумулята Х =  xi i /  i = (0  25 + 2  8 + 3  2 + 4  6 + 5  2 + 6  7) / 50 = 1,96 (ч/нед) NMe = (n+1) / 2 = 51 / 2 = 25,5 Me = x NMe ; Me = 2 (ч/нед) ; Мо = 0 (ч/нед) D =  (xi – x)2 i /  I = ((0 – 1,96)2  25 + (2 – 1,96)2  8 + (3 – 1,96)2  2

+ (4 – 1,96)2  6 + (5 – 1,96)2  2 + (6 – 1,96)2  7) / 50 = 5,1 (ч/нед)2 bx = 2,26 (ч/нед) V = (2,26 / 1,96)  100% = 115% R = 6 – 0 = 6 (ч/нед) Вывод: среднее количество часов, затраченное студентами на самообразование 1,96 ч/нед. Т. к. коэффициент вариации является величиной значительной (115%), то среднее количество является не типичным для данной совокупности. Наиболее распространённым является количество часов самообразования

равное 0 ч/нед. Ровно половина из 50 опро-шенных студентов не занимались на первом курсе дополнительным самообразованием. Группировка 4 Таблица 5 Подготовка к семи-нарам, ч/нед Число студентов % к итогу Fi [0-3] 21 42 21 [3-6] 18 36 39 [6-9] 8 16 47 [9-12] 3 6 50 Для удобства разбиваем вариационный ряд на 4 равных интервала. Величину интервала определяем по формуле: h = R / n. h = 3.

Х =  xi / n Х = 4,08 (ч/нед) Ме = 3 + 3 (25 – 21) / 18 = 3,6 (ч/нед) Мо = 0 + 3 (21 – 0) / ((21 – 0) + (21 – 8)) = 1,85 (ч/нед) D =  (xi – x)2 / n D = 7,2 ((ч/нед)2) bx = 2,7 (ч/нед) V = (2,7 / 4,08)  100% = 65,6% R = 12 – 0 = 12 (ч/нед) Вывод: среднее время, затраченное на подготовку к семинарским занятиям у студентов на 1 курсе 4,08 ч/нед.

Т. к. коэффициент вариации является величиной значительной, то среднее время подготовки является величиной не типичной для данной совокупности студентов. Наиболее распространённым количеством часов на подготовку равно 1,85 ч/нед. Число студентов, занимающихся больше 3,6 ч/нед равно числу студентов, за-нимающихся подготовкой к занятиям больше 3,6 ч/нед. Группировка 5 Таблица 6 Сон, ч/сутки Число студентов % к итогу Fi 5 6 12 6 6 3 6 9 7 13 26 22 8 11 22 33 9 8 16 41 10 9 18 50

Итог: 50 100 X = (5 6 + 6 3 + 7 13 + 8 11 + 9 8 + 10 9) / 50 = 7,78 (ч/сут) NMe = (n+1) / 2 Me = 8 (ч/сут) Мо = 7 (ч/сут) D =  (xi – x)2 i /  I D = 2,4 ((ч/сут)2) bx = 1,55 (ч/сут) V = (1,55 / 7,78)  100% = 19,9% R = 10 – 5 = 5 (ч/сут) Вывод: среднее значение часов сна 7,78 ч/сутки. Т. к. коэффициент вариации является ве-личиной незначительной

(19,9%), то такое среднее значение часов сна является типичным для данной совокупности. Наиболее распространённым является количество часов сна 7 ч/сутки. Количество студентов, которые спят больше 8 ч/сутки равно количеству студен-тов, спящих меньше 8 ч/сут. Группировка 6 Таблица 7 пол Число студентов, чел % к итогу Fi Ж 33 66 30 М 17 34 50 Итог: 50 100 Вывод: из таблицы видно, что большинство опрошенных студентов

женского пола. Группировка 7 Таблица 8 Нравятся ли занятия на 1 курсе Число студентов, чел % к итогу Fi Да 30 60 30 Нет 20 40 50 Итог: 50 100 Вывод: из таблицы видно, что большинству студентов данной совокупности нравились занятия на 1 курсе в академии. Комбинационные группировки. Таблица 9 сон Средний балл зачётки Всего 3 3,2 3,5 4 4,2 4,3 4,5 4,6 4,7 4,8 5 0 1 0 2 0 0 0 1 1 1 6 6 0 0 0 0 1 0 0 0 2 0 3 7 1 0 2 1 1 2 2 0 3 1 13 8 0 1 1 1 3 0 2 0 0 1 11 9 1 1 0 2 1 0 2 0 0 1 8 10 2 2 0 0 1 0 2 0 1 1 9

Итог: 4 5 3 6 7 2 8 3 7 5 50 Вывод: из таблицы видно, что наиболее крупные элементы расположены близко к побоч-ной диагонали. Следовательно, зависимость между признаками близка к обратной. Таблица 10 Посещаемость Средний балл зачётки Всего 3 3,2 3,5 4 4,2 4,3 4,5 4,6 4,7 4,8 [6-10] 2 3 0 0 1 0 0 2 1 0 9 [10-14] 0 0 2 3 1 0 0 0 1 0 7 [14-18] 2 2 1 1 2 1 3 1 1 1 15 [18-22] 0 0 0 2 3 1 5 0 4 4 19 Итог: 4 5 3 6 7 2 8 3 7 5 50 Вывод: из таблицы видно, что наибольшие элементы расположены близко к главной

диа-гонали. Следовательно, зависимость между признаками близка к прямой. Аналитические группировки. Группировка 1 Таблица 11 Введём обозначения: 1. неудовлетворительная подготовка к занятиям [0-3] 2. удовлетворительная [3-6] 3. хорошая [6-9] 4. отличная [9-12] Подготовка к занятиям Число студентов, чел Средний балл зачётки за 1 курс

Неудовлетворительная 21 3,7 Удовлетворительная 18 4,3 Хорошая 8 4,4 Отличная 3 4,5 Всего: 50 Вывод: из таблицы видно, что зависимость между фактором и признаком существует. Группировка 2 Таблица 12 Введём обозначения: 1. 1/3 всех занятий [6-12] ч/нед 2. половина [12-18] ч/нед 3. все занятия [18-22] ч/нед Посещаемость занятий Число студентов, чел Средний балл зачётки за 1 курс 1/3 всех занятий 13 3,3 половина 19 4,0

все занятия 18 4,5 Всего: 50 Вывод: из таблицы видно, что зависимости между признаком-фактором и признаком-результатом явной нет. Группировка 3 Таблица 13 Самообразование Число студентов, чел Средний балл зачётки за 1 курс Посещали доп. курсы 25 4,2 Не посещали доп. курсы 25 4,0 Вывод: не наблюдается явной зависимости между признаком-фактором и признаком ре-зультатом.

Лабораторная работа № 2 Тема: Корреляционный анализ, множественная линейная регрессия. Цель: выбор оптимальной модели многофакторной регрессии на основе анализа различных моделей и расчитан для них коэффициентов множественной детерминации и среднеквадратических ошибок уравнения многофакторной регрессии. Корреляционная матрица Таблица 1 0 1 2 3 4 0 1 0,572 0,115 0,486 0,200 1 0,572 1 0,218 0,471 -0,112 2 0,115 0,218 1 0,452 -0,048 3 0,438 0,471 0,452 1 -0,073 4 -0,2 -0,112 -0,048 -0,073 1

Где х0 – средний балл зачётки (результат), х1 – посещаемость занятий, х2 – самообразова-ние (доп. курсы), х3 – подготовка к семинарским занятиям, х4 – сон. Введём обозначения признаков-факторов: 1 – посещаемость занятий на 1 курсе (ч/нед); 2 – самообразование (ч/нед); 3 – подготовка к семинарским и практическим занятиям (ч/нед); 4 – сон (ч/сут); 0 – средний балл зачётки по итогам экзаменов за 1 курс.

Расчётная таблица для моделей многофакторной регрессии. Таблица 2 Модель многофакторной регрессии R2 E2 1-2-3-4 0,39 0,45 1-2-3 0,37 0,46 2-3-4 0,23 0,51 1-3-4 0,38 0,45 1-2 0,33 0,47 1-3 0,36 0,46 1-4 0,35 0,47 2-3 0,20 0,52 2-4 0,05 0,56 3-4 0,22 0,51 По трём критериям выбираем оптимальную модель. 1. число факторов минимально (2) 2. max R, R = 0,36 3. min E, E = 0,46 Следовательно, оптимальной моделью является модель 1-3. Значит, признаки-факторы «посещаемость занятий на 1 курсе» и «подготовка к семинарским занятиям» влияют

зна-чительнее других факторов на признак-результат. Среднеквадратическая ошибка уравнения многофакторной регрессии небольшая по срав-нению с ошибками, рассчитанными для других моделей многофакторной регрессии. Составляю для этой модели уравнение регрессии в естественных масштабах. Х0/1,3 = a + b1x1 + b3x3 Корреляционная матрица. Таблица 3 0 1 3 0 1,00 0,57 0,48 1 0,57 1,00 0,47 3 0,43 0,47 1,00

t0/1,3 = 1t1 + 3t3 0,57 = 1 + 0,473 0,57 = 1 + 0,47(0,44 – 0,471) 1 = 0,4 0,44 = 0,471 + 3 3 = 0,44 – 0,471 3 = 0,25 t0/1,3 = 0,4t1 + 0,25t3 b1 = (0 / x1) 1 = (0,47 / 4,4) 0,4 = 0,071 b3 = (0 / x3) 3 = (0,79 / 2,68) 0,25 = 0,073 a = x0 – b1x1 – b3x3 = 4,27 – 0,071  16,13 – 0,073  4,08

= 2,8 имеем: х0/1,3 =2,8 + 0,071х1 + 0,073х3 – уравнение линейной множественной регрессии. R0/1,3 = 1r01 + 3r03 R0/1,3 = 0,4  0,58 + 0,25  0,48 = 0,6 Вывод: коэффициент 1 говорит о том, что признак-результат—средний балл зачётки за 1 курс на 0,4 долю от своего среднеквадратического отклонения (0,4  0,79 = 0,316 балла) при изменении

признака-фактора—посещаемости на 1 курсе на одно своё СКО (4,4 ч/нед). &#61538;3 – средний балл зачётки изменится на 0,25 долю от своего СКО (0,25 0,79 = 0,179 балла) при увеличении признака-фактора—подготовки к семинарским занятиям на одно своё СКО (2,68 ч/сут). Т. к. &#61538;1 < &#61538;3, следовательно фактор 1—посещаемость занятий влияет на средний балл за-чётки больше, чем фактор 3—подготовка к занятиям.

R2 говорит о том, что 36% общей вариации значений среднего балла зачётки на 1 курсе вызвано влиянием посещаемости и подготовки к занятиям. Остальные 60% вызваны про-чими факторами. R = 0,58 свидетельствует о том, что между посещаемостью занятий и подготовкой к ним и средним баллом зачётки существует заметная линейная зависимость. Коэффициент b1 говорит о том, что если посещаемость занятий увеличится на 1 ч/нед, то средний балл зачётки увеличится в среднем на 0,071 балла, при условии

неизменности всех остальных факторов. b2 говорит о том, что если подготовка к занятиям увеличится на 1 ч/нед, то средний балл зачётки в среднем увеличится на 0,073 балла. &#61538;1 = 0,4 &#61538;3 = 0,25 r01 = 0,52 r03 = 0,44 r13 = 0,47 Граф связи признаков-факторов: х2 – подготовки к семинарским занятиям, ч/нед; х1 - по-сещаемости занятий, ч/нед с признаком-результатом х0 – средним баллом зачётки по ито-гам экзаменов за 1 курс. &#61538;1 – мера непосредственного влияния на признак-результат

посещаемости занятий. &#61538;3 – мера непосредственного влияния подготовки к занятиям на средний балл зачётки. r01 = &#61538;1 + r13&#61538;3, где r01 – общее влияние х1 на r13&#61538;3 – мера опосредованного влияния х1 через х3 на х0. r01 = 0,4 + 0,47 &#61655; 0,25 = 0,52 r03 = &#61538;3 + r31&#61538;1, где r03 – общее влияние х3 на r31&#61538;1 – мера опосредованного влияния х3 через х1 на х0. Лабораторная работа № 3. Тема: «Дисперсионное отношение.

Эмпирическая и аналитическая регрессии.» Цель: выявление зависимости между признаками-факторами и признаком-результатом. Таблица с исходными данными. Таблица 1 Средний балл за¬чётки по итогам экзаменов за 1-ый курс (баллы) Посещаемость занятий на первом курсе (ч/нед) Самообразование (доп. Курсы) (ч/нед) Подготовка к семи-нар¬ским заня¬тиям (ч/нед) 4,7 19,5 0 5 4,5 22 2 6 4,2 22 0 2 4,3 19,5 0 7 4,5 17,5 0 3 4,2 9,5 6 12 4,0 12,5 0 5 4,7 22 4 7 4,6 17,5 3 4 4,7 9,5 0 2 4,5 11,5 6 3 4,0 11,5 2 3 4,2 19,5 4 8 4,0 20,5 6 9 3,2 9,5 0 0 4,0 17,5 0 8 3,2 14,5 0 2 3,5 14,5 0 2 4,8 22 0 10 4,6 8,5 0 1 4,5 22 0 4 4,5 22 6 2 4,2 17,5 4 4 4,5 14,5 6 4 4,2 11,5 2 2 4,8 17,5 0 4 4,0 10,5 0 2 4,2 17,5 2 6 3,0 9,5 0 0 4,8 19,5 2 2 4,8 19,5 2 6 4,3 17,5 4 2 3,2 6,0 0 0 4,5 22 2 5 4,7 22 4 3 4,2 22 3 5 4,6 9,5 0 1 3,0 14,0 0 2 3,0 6,5 0 5 4,0 22 2 5 4,7 17,5 6 0 3,5 11,5 0 6 4,7 22 6 2 4,5 22 0 0 3,2 17,5 4 8 4,8 22 0 0 3,2 9,5 0 5 4,5 17,5 0 3 3,0 14,5 5 3 4,7 11,5 5 3

Рассматриваю первую пару признаков: признак-фактор—посещаемость занятий на 1 курсе (ч/нед) и признак-результат—средний балл зачётки по итогам экзаменов за 1 курс (баллы). Далее обосную взаимосвязь между ними. Расчётная таблица №1 Таблица 2 Посещаемость занятий (ч/нед) Число наблю-дений xi yi &#61540;yi &#61540;2yi &#61540;2yi &#61546;i yi - y (yi–y)2&#61546;I [6-10] 9 8,6 3,7 0,71 0,5 4,5 -0,5 2,25 [10-14] 8 11,5 4,1 0,38 0,14 1,12

-0,1 0,08 [14-18] 15 16,4 3,7 1,01 1,02 15,3 -0,5 3,75 [18-22] 18 19,6 4,4 0,31 0,09 1,62 0,4 2,88 Сумма 50 - - - - 22,54 - 8,96 Средняя - 15,3 4,0 - - 5,6 - 2,24 &#61540;2y = (&#61669;(yi–y)2&#61546;I) &#61540; 2y = 8,96 / 50 = 0,1792 (балла)2 E2y= (&#61669;б2yi&#61546;I) / &#61669;&#61546;I E2y = (4,5 + 1,12 + 15,3 + 1,62) / 50 = 0,4508(балла)2 б2y =

E2y + &#61540; 2y = 0,4508 + 0,1792 = 0,63 (балла)2 &#61554;2 = &#61540; 2y / б2y = 0,1792 / 0,63 = 0,28 (0,28%) построение аналитической регрессии. yx = a + bx xy = (&#61669;xy&#61546;I) / &#61669;&#61546;I = 62,52 б2x = 19,4 (ч/нед)2 b = (xy – x y) / б2x = (62,52 – 15,3 &#61655; 4,0) / 19,4 = 0,068 a = y – bx = 4,0 – 0,068 &#61655; 15,3 = 2,96 Линейное уравнение регрессии зависимости среднего балла зачётки за 1 курс от посещае-мости: строим по

двум точкам yx = 2,96 + 0,068х 1. yx = 2,96 + 0,068 &#61655; 6 = 3,358 2. yx = 2,96 + 0,068 &#61655; 22 = 4,446 rxy = (xy – x y) / бxбy = 0,37 Корреляционное поле Эмпирическая линия регрессии Аналитическая линия регрессии Распределение среднего балла зачётки за 1 курс по признаку-фактору—посещаемости за-нятий на 1 курсе. Вывод: &#61554;2 свидетельствует о том, что 28% общей вариации результативного признака вы-звано

влиянием признака фактора—посещаемостью. Остальные 72% - вызваны влиянием прочих факторов. Можно сказать, что это слабая корреляционная зависимость. Интерпретируя параметр b, предполагаем, что для данной совокупности студентов с увеличением посещаемости занятий на 1 курсе на 1 ч/нед средний балл зачётки увеличивается на 0,068 балла. rxy говорит о том, что между признаком-результатом и признаком-фактором заметная линейная связь.

Рассматриваю вторую пару признаков: Расчётная таблица № 2. Таблица 3 Подготовка к семинар-ским заня-тиям (ч/нед) Число наблю-дений xi yi &#61540;yi &#61540;2yi &#61540;2yi &#61546;i yi - y (yi–y)2&#61546;i [0-3] 20 1,2 3,78 0,63 0,39 7,8 -0,22 0,96 [3-6] 18 4,0 4,31 0,45 0,2 3,6 0,31 1,72 [6-9] 9 6,8 4,46 0,28 0,07 0,63 0,46 1,9 [9-12] 2 9,5 4,4 0,399 0,15 0,3 0,4 0,32 Сумма 50 - - - -

2,33 - 4,9 средняя - 3,5 4,0 - - 3,08 - 1,2 &#61540;2y = (&#61669;(yi–y)2&#61546;I) &#61540; 2y = 4,9 / 50 = 0,098 (балла)2 E2y= (&#61669;б2yi&#61546;I) / &#61669;&#61546;I E2y = 12,33 / 50 = 0,25 (балла)2 б2y = E2y + &#61540; 2y = 0,35 (балла)2 &#61554;2 = &#61540; 2y / б2y = 0,098 / 0,35 = 0,28 (0,28%) &#61554; = 0,53 построение аналитической регрессии. yx = a + bx xy = (&#61669;xy&#61546;I) / &#61669;&#61546;I xy = 15,2 б2x = 7,2 (ч/нед)2 b = (xy

– x y) / б2x = (15,2 – 3,5 &#61655; 4,0) / 7,2 = 0,16 a = y – bx = 4,0 – 0,16 &#61655; 3,4 Линейное уравнение регрессии зависимости среднего балла зачётки за 1 курс от подготов-ки к семинарским занятиям: yx = 2,96 + 0,068х x = 0 y = 3,4 x = 7 y = 4,5 rxy = (xy – x y) / бxбy = (15,2 – 14) / 2,6 = 0,46 Корреляционное поле Эмпирическая линия регрессии Аналитическая линия регрессии Распределение среднего балла зачётки за 1 курс по признаку-фактору—подготовке

к се-минарским занятиям. Вывод: &#61554;2 свидетельствует о том, что 28% общей вариации результативного признака вызвано влиянием признака фактора—подготовкой к семинарским занятиям. Остальные 72% - вызваны влиянием прочих факторов. Можно сказать, что это слабая корреляционная зависимость. Интерпретируя параметр b, предполагаем, что для данной совокупности студентов с увеличением подготовки

к занятиям на 1 курсе на 1 ч/нед средний балл зачётки увеличивается на 0,16 балла. rxy говорит о том, что между признаком-результатом и признаком-фактором есть умеренная линейная связь. Рассматриваю третью пару признаков: Расчётная таблица № 3 Таблица 4 Самообразование (ч/нед) Число наблюдений xi yi &#61540;yi &#61540;2yi &#61540;2yi &#61546;i yi - y (yi–y)2&#61546;i 0 25 0 4,07 0,68 0,46 11,5 -0,03 0,022 2 8 2 4,38 0,3 0,09 0,72 0,28 0,62 3 2 3 4,40 0,2 0,04 0,08 0,3 0,18 4 6 4 4,22 0,5 0,25 1,5 0,12 0,08 5 2 5 3,35 0,35 0,12 0,24

-0,75 1,16 6 7 6 3,3 0,40 0,16 1,12 0,2 0,28 Сумма 50 - - - - 15,88 - 2,34 средняя - 1,96 4,1 - - 0,31 - 0,39 &#61540;2y = (&#61669;(yi–y)2&#61546;I) &#61540; 2y = 2,34 / 50 = 0,046 (балла)2 E2y= (&#61669;б2yi&#61546;I) / &#61669;&#61546;I E2y = 15,88 / 50 = 0,31 (балла)2 б2y = E2y + &#61540; 2y = 0,31 + 0,046 = 0,36 (балла)2 &#61554;2 = &#61540; 2y / б2y = 0,046 / 0,36 = 0,13 (13%) &#61554; = 0,36 построение аналитической

регрессии. yx = a + bx xy = (&#61669;xy&#61546;I) / &#61669;&#61546;I xy = 8,22 б2x = 5,1 (ч/нед)2 b = (xy – x y) / б2x = (8,22 – 8,036) / 5,1 = 0,032 a = y – bx = 4,1 – 0,032 &#61655; 1,96 = 4,03 Линейное уравнение регрессии зависимости среднего балла зачётки за 1 курс от самооб-разования: yx = 2,96 + 0,068х x = 0 y = 3,4 x = 7 y = 4,5 rxy = (xy – x y) / бxбy = (8,2 – 8,036) / 2,25 &#61655; 0,6 = 0,12 Корреляционное поле Эмпирическая линия регрессии

Аналитическая линия регрессии Вывод: &#61554;2 свидетельствует о том, что 13% общей вариации результативного признака вы-звано влиянием признака фактора—самообразованием. Можно сказать, что это очень слабая корреляционная связь. Зная коэффициент b, предполагаем, что для данной совокупности студентов с увеличением самообразования на 1 ч/нед средний балл зачётки увеличивается на 0,032 балла. rxy говорит о том, что между признаком-

результатом и признаком-фактором есть слабая прямая линейная связь. Министерство Высшего Образования РФ Санкт-Петербургский Государственный Инженерно-Экономический Университет Лабораторные работы По статистике Студентки 1 курса Группы 3292 Специальность коммерция Харькиной Анны.

Преподаватель: Карпова Г. В. Оценка: СПб 2001



Не сдавайте скачаную работу преподавателю!
Данный реферат Вы можете использовать для подготовки курсовых проектов.

Поделись с друзьями, за репост + 100 мильонов к студенческой карме :

Пишем реферат самостоятельно:
! Как писать рефераты
Практические рекомендации по написанию студенческих рефератов.
! План реферата Краткий список разделов, отражающий структура и порядок работы над будующим рефератом.
! Введение реферата Вводная часть работы, в которой отражается цель и обозначается список задач.
! Заключение реферата В заключении подводятся итоги, описывается была ли достигнута поставленная цель, каковы результаты.
! Оформление рефератов Методические рекомендации по грамотному оформлению работы по ГОСТ.

Читайте также:
Виды рефератов Какими бывают рефераты по своему назначению и структуре.

Сейчас смотрят :

Реферат Регулирование конфликтов на государственной и муниципальной службе
Реферат Midevil Times Essay Research Paper Highlights of
Реферат «Хочу все знать»
Реферат Прокурорский надзор как гарантия законности в российском государстве
Реферат American Labor Essay Research Paper Labor Immigrants
Реферат Возмещение вреда причиненного вследствие недостатков товаров работ или услуг
Реферат Понятие экономическая сущность и виды косвенных налогов
Реферат Viii всероссийская научно-практическая конференция студентов, аспирантов, молодых ученых с международным участием
Реферат Land Animal Eyes Essay Research Paper Land
Реферат Этнокультурологические особенности традиционного китайского праздника Цинминцзе
Реферат The Flies Les Mouches Essay Research Paper
Реферат Бібліотека, як об’єкт цензурної політики на Україні в 20 ст.
Реферат Развитие розничной торговли в РФ и Татарстане
Реферат База даних "Продуктовий магазин"
Реферат Коллективная материальная ответственность, как способ предотвращения потерь в магазинах розничной сети