Реферат по предмету "Статистика"


Сводка, группировка, статистические таблицы

Лабораторная работа № 1. Тема: «Сводка, группировка, статистические таблицы». Цель: выявление обобщающих закономерностей, характерных для изучаемой совокупно-сти объектов наблюдения как целостной системы. Цель исследования—определение уровня успеваемости студентов 1-ого курса, а так же факторов на него влияющих. В качестве исследуемых признаков я рассматриваю: 1. средний балл по итогам экзаменов за 1-ый курс (баллы).

2. посещаемость занятий в университете на 1-ом курсе. 3. самообразование (дополнительное обучение, курсы) (ч/нед). 4. сон (ч/сутки). 5. пол (м, ж). 6. подготовка к семинарским и практическим занятиям (ч/нед). 7. нравятся ли студенту на 1-ом курсе занятия в университете (да, нет). Из представленных признаков я выделяю признак-результат—средний балл зачётки по итогам 1-ого курса,

так как его значение отвечает цели исследования. Остальные шесть признаков являются признаками-факторами, т. к. они оказывают влияние на признак-результат. Наблюдение единовременное ауд. 722, 522 СПбГИЭУ. Дата проведения: 03.11.2000г. по форме проведения—опрос. Объектом наблюдения являются 2 группы студентов (1093 и 1094) 2-ого курса. единица наблюдения—студент. Исследование основного массива.

Таблицы с исходными данными. Таблица 1 Средний балл за¬чётки по итогам экзаменов за 1-ый курс (бал-лы) Посещае-мость заня-тий на пер-вом курсе Самообра-зование (доп. Кур-сы) ч/нед Подготовка к семинар¬ским заня¬тиям (ч/нед) Сон (ч/сут) Пол (м, ж) Нравятся ли занятия в универ-ситете (да, нет) 4,7 19,5 0 5 7 Ж Да 4,5 22 2 6 9 Ж Да 4,2 22 0 2 6 М Да 4,3 19,5 0 7 7

Ж Да 4,5 17,7 Ж Нет 4,2 9,5 6 12 10 Ж Да 4,0 12,5 0 5 5 Ж Да 4,7 22 4 7 6 Ж Да 4,6 17,5 3 4 8 Ж Да 4,7 9,5 0 2 7 Ж Да 4,5 11,5 6 3 7 Ж Да 4,0 11,5 2 3 9 Ж Да 4,2 19,8 Ж Нет 4,0 20,5 6 9 5 Ж Да 3,2 9,10 М Нет 4,0 17,8 М Нет 3,2 14,8 М Нет 3,5 14,8 М Нет 4,8 22 0 10 10

Ж Нет 4,6 8,5 0 1 8 М Да 4,5 22 0 4 7 Ж Да 4,5 22 6 2 7 М Да 4,2 17,9 М Нет 4,5 14,5 6 4 10 Ж Да 4,2 11,8 Ж Нет 4,8 17,9 Ж Нет 4,0 10,5 0 2 7 Ж Да 4,2 17,5 2 6 5 Ж Да 3,0 9,9 М Нет 4,8 19,5 2 2 8 Ж Да 4,8 19,5 2 6 9 Ж Да 4,3 17,5 4 2 7 Ж Да 3,2 6,5 М Нет 4,5 22 2 5 9

Ж Нет 4,7 22 4 3 6 Ж Да 4,2 22 3 5 8 Ж Да 4,6 9,8 Ж Нет 3,0 14,10 М Нет 3,0 6,9 М Нет 4,0 22 2 5 9 Ж Да 4,7 17,10 Ж Нет 3,5 11,7 М Нет 4,7 22 6 2 5 Ж Да 4,5 22 0 0 8 Ж Да 3,2 17,5 4 8 9 Ж Да 4,8 22 0 0 5 М Да 3,2 9,5 0 5 10 М Да 4,5 17,5 0 3 10 Ж Да 3,0 14,5 5 3 7

М Нет 4,7 11,7 М Нет Структурные группировки. 1 группировка. Таблица 2 Средний балл по итогам экзаменов за 1 курс, баллы Число студентов % к итогу Fi [3-3,5] 9 18 9 [3,5-4] 3 6 12 [4-4,5] 15 30 27 [4,5-5] 50 Итог: 50 100 Для удобства разбиваем вариационный ряд на 4 равных интервала. Величину интервала определяем по формуле: h = R / n = (X max –

X min) / n = (5-3) / 4 = 0,5 гистограмма: кумулята: считаем по несгруппированным данным для большей точности: Х = (4,7 + 4,5 + 4,2 + 4,2 +4,5 + 4,2 + 4,0 + 4,7 + 4,6 + 4,7 + 3,5 + 4,0 + 3,2 + 4,0 + 3,2 + 3,5 + + 4,8 + 4,6 + 4,5 + 4,5 + 4,2 + 4,5 + 4,2 + 4,8 + 4,0 + 4,2 + 3,0 + 3,2 + 4,8 + 4,8 + 4,3 + 4,5 + 4,7 + 4,2 + 4,6 + 3,0 + 3,0 + 4,0 + 4,7 + 3,5 + 4,7 + 4,5 + 3,2 + 4,5 + 4,8 + 3,2 + 3,0 + 4,5 + 4,7) / 50 = 4,27 (балла) Ме = x0 +  Ме (N/2 –

F(x0) / NMe Me = 4+ 0,5 (25 –12) / 15 = 4,4 (балла) Мо = х0 +  Мо (NМо – NМо-1) / (NМо – NМо-1) + (NМо – NМо+1) Mo = 4,5 + 0,5 (25-15) / ((23-15) + (23-0)) = 4,6 (балла) D =  (xi – x)2 / n считаем по несгруппированным данным. D = 0,3 (кв. балла) bx = D bx = 0,3 = 0,55 (балла)

V = bx / x  100% V = (0,55 / 4,27)  100% = 128% R = xmax – xmin R = 5 – 3 = 2 (балла) Вывод: средний балл зачётки по итогам экзаменов за 1-ый курс для данной совокупности составляет 4,27 балла. Т. к. коэффициент вариации является величиной незначительной (128%), можно предполагать, что такой средний балл является типичным для данной со-вокупности. Наиболее распространённым является балл зачётки 4,6 балла.

Средний балл у 50% студентов не больше 4,4 балла. Группировка 2 Таблица 3 Посещаемость, ч/нед Число студентов, чел % к итогу Fi [6-10] 9 18 9 [10-14] 8 16 17 [14-18] 15 30 32 [18-22] 50 Итог: 100 Разбиение на интервалы аналогично группировке 1. Для несгруппированных данных, значит более точный результат.

Х =  xi / n X = 16, 13 (ч/нед) Ме = x0 +  Ме (N/2 – F(x0) / NMe Ме = 14 + 4 (25 – 17) / 15 = 17,3 (ч/нед) D =  (xi – x)2 / n D = 19,4 ((ч/нед)2) bx = D = 4,4 (ч/нед) V = bx / x  100% = (4,4 / 16,13)  100% = 27,2% R = xmax – xmin R = 22 – 16 = 16 (балла) Вывод: средняя посещаемость в группах составляет 16,13 ч/нед

(70% от часов в неделю назначенных расписанием). Коэффициент вариации является величиной незначительной (28,6%), следовательно. Такая средняя посещаемость типична для студентов данной сово-купности. Большинство студентов посещало 17,3 ч/нед. Посещаемость занятий у 50% сту-дентов меньше 19 ч/нед, у 50% больше 19 ч/нед. Группировка 3 Таблица 4 Самообразование, курсы (ч/нед) Число студентов % к итогу Fi 0 25 50 25 2 8 16 33 3 2 4 35 4 6 12 41 5 2 4 43 6 7 14 50

Итог: 100 Полегон частот: кумулята Х =  xi i /  i = (0  25 + 2  8 + 3  2 + 4  6 + 5  2 + 6  7) / 50 = 1,96 (ч/нед) NMe = (n+1) / 2 = 51 / 2 = 25,5 Me = x NMe ; Me = 2 (ч/нед) ; Мо = 0 (ч/нед) D =  (xi – x)2 i /  I = ((0 – 1,96)2  25 + (2 – 1,96)2  8 + (3 – 1,96)2  2

+ (4 – 1,96)2  6 + (5 – 1,96)2  2 + (6 – 1,96)2  7) / 50 = 5,1 (ч/нед)2 bx = 2,26 (ч/нед) V = (2,26 / 1,96)  100% = 115% R = 6 – 0 = 6 (ч/нед) Вывод: среднее количество часов, затраченное студентами на самообразование 1,96 ч/нед. Т. к. коэффициент вариации является величиной значительной (115%), то среднее количество является не типичным для данной совокупности. Наиболее распространённым является количество часов самообразования

равное 0 ч/нед. Ровно половина из 50 опро-шенных студентов не занимались на первом курсе дополнительным самообразованием. Группировка 4 Таблица 5 Подготовка к семи-нарам, ч/нед Число студентов % к итогу Fi [0-3] 21 42 21 [3-6] 18 36 39 [6-9] 8 16 47 [9-12] 3 6 50 Для удобства разбиваем вариационный ряд на 4 равных интервала. Величину интервала определяем по формуле: h = R / n. h = 3.

Х =  xi / n Х = 4,08 (ч/нед) Ме = 3 + 3 (25 – 21) / 18 = 3,6 (ч/нед) Мо = 0 + 3 (21 – 0) / ((21 – 0) + (21 – 8)) = 1,85 (ч/нед) D =  (xi – x)2 / n D = 7,2 ((ч/нед)2) bx = 2,7 (ч/нед) V = (2,7 / 4,08)  100% = 65,6% R = 12 – 0 = 12 (ч/нед) Вывод: среднее время, затраченное на подготовку к семинарским занятиям у студентов на 1 курсе 4,08 ч/нед.

Т. к. коэффициент вариации является величиной значительной, то среднее время подготовки является величиной не типичной для данной совокупности студентов. Наиболее распространённым количеством часов на подготовку равно 1,85 ч/нед. Число студентов, занимающихся больше 3,6 ч/нед равно числу студентов, за-нимающихся подготовкой к занятиям больше 3,6 ч/нед. Группировка 5 Таблица 6 Сон, ч/сутки Число студентов % к итогу Fi 5 6 12 6 6 3 6 9 7 13 26 22 8 11 22 33 9 8 16 41 10 9 18 50

Итог: 50 100 X = (5 6 + 6 3 + 7 13 + 8 11 + 9 8 + 10 9) / 50 = 7,78 (ч/сут) NMe = (n+1) / 2 Me = 8 (ч/сут) Мо = 7 (ч/сут) D =  (xi – x)2 i /  I D = 2,4 ((ч/сут)2) bx = 1,55 (ч/сут) V = (1,55 / 7,78)  100% = 19,9% R = 10 – 5 = 5 (ч/сут) Вывод: среднее значение часов сна 7,78 ч/сутки. Т. к. коэффициент вариации является ве-личиной незначительной

(19,9%), то такое среднее значение часов сна является типичным для данной совокупности. Наиболее распространённым является количество часов сна 7 ч/сутки. Количество студентов, которые спят больше 8 ч/сутки равно количеству студен-тов, спящих меньше 8 ч/сут. Группировка 6 Таблица 7 пол Число студентов, чел % к итогу Fi Ж 33 66 30 М 17 34 50 Итог: 50 100 Вывод: из таблицы видно, что большинство опрошенных студентов

женского пола. Группировка 7 Таблица 8 Нравятся ли занятия на 1 курсе Число студентов, чел % к итогу Fi Да 30 60 30 Нет 20 40 50 Итог: 50 100 Вывод: из таблицы видно, что большинству студентов данной совокупности нравились занятия на 1 курсе в академии. Комбинационные группировки. Таблица 9 сон Средний балл зачётки Всего 3 3,2 3,5 4 4,2 4,3 4,5 4,6 4,7 4,8 5 0 1 0 2 0 0 0 1 1 1 6 6 0 0 0 0 1 0 0 0 2 0 3 7 1 0 2 1 1 2 2 0 3 1 13 8 0 1 1 1 3 0 2 0 0 1 11 9 1 1 0 2 1 0 2 0 0 1 8 10 2 2 0 0 1 0 2 0 1 1 9

Итог: 4 5 3 6 7 2 8 3 7 5 50 Вывод: из таблицы видно, что наиболее крупные элементы расположены близко к побоч-ной диагонали. Следовательно, зависимость между признаками близка к обратной. Таблица 10 Посещаемость Средний балл зачётки Всего 3 3,2 3,5 4 4,2 4,3 4,5 4,6 4,7 4,8 [6-10] 2 3 0 0 1 0 0 2 1 0 9 [10-14] 0 0 2 3 1 0 0 0 1 0 7 [14-18] 2 2 1 1 2 1 3 1 1 1 15 [18-22] 0 0 0 2 3 1 5 0 4 4 19 Итог: 4 5 3 6 7 2 8 3 7 5 50 Вывод: из таблицы видно, что наибольшие элементы расположены близко к главной

диа-гонали. Следовательно, зависимость между признаками близка к прямой. Аналитические группировки. Группировка 1 Таблица 11 Введём обозначения: 1. неудовлетворительная подготовка к занятиям [0-3] 2. удовлетворительная [3-6] 3. хорошая [6-9] 4. отличная [9-12] Подготовка к занятиям Число студентов, чел Средний балл зачётки за 1 курс

Неудовлетворительная 21 3,7 Удовлетворительная 18 4,3 Хорошая 8 4,4 Отличная 3 4,5 Всего: 50 Вывод: из таблицы видно, что зависимость между фактором и признаком существует. Группировка 2 Таблица 12 Введём обозначения: 1. 1/3 всех занятий [6-12] ч/нед 2. половина [12-18] ч/нед 3. все занятия [18-22] ч/нед Посещаемость занятий Число студентов, чел Средний балл зачётки за 1 курс 1/3 всех занятий 13 3,3 половина 19 4,0

все занятия 18 4,5 Всего: 50 Вывод: из таблицы видно, что зависимости между признаком-фактором и признаком-результатом явной нет. Группировка 3 Таблица 13 Самообразование Число студентов, чел Средний балл зачётки за 1 курс Посещали доп. курсы 25 4,2 Не посещали доп. курсы 25 4,0 Вывод: не наблюдается явной зависимости между признаком-фактором и признаком ре-зультатом.

Лабораторная работа № 2 Тема: Корреляционный анализ, множественная линейная регрессия. Цель: выбор оптимальной модели многофакторной регрессии на основе анализа различных моделей и расчитан для них коэффициентов множественной детерминации и среднеквадратических ошибок уравнения многофакторной регрессии. Корреляционная матрица Таблица 1 0 1 2 3 4 0 1 0,572 0,115 0,486 0,200 1 0,572 1 0,218 0,471 -0,112 2 0,115 0,218 1 0,452 -0,048 3 0,438 0,471 0,452 1 -0,073 4 -0,2 -0,112 -0,048 -0,073 1

Где х0 – средний балл зачётки (результат), х1 – посещаемость занятий, х2 – самообразова-ние (доп. курсы), х3 – подготовка к семинарским занятиям, х4 – сон. Введём обозначения признаков-факторов: 1 – посещаемость занятий на 1 курсе (ч/нед); 2 – самообразование (ч/нед); 3 – подготовка к семинарским и практическим занятиям (ч/нед); 4 – сон (ч/сут); 0 – средний балл зачётки по итогам экзаменов за 1 курс.

Расчётная таблица для моделей многофакторной регрессии. Таблица 2 Модель многофакторной регрессии R2 E2 1-2-3-4 0,39 0,45 1-2-3 0,37 0,46 2-3-4 0,23 0,51 1-3-4 0,38 0,45 1-2 0,33 0,47 1-3 0,36 0,46 1-4 0,35 0,47 2-3 0,20 0,52 2-4 0,05 0,56 3-4 0,22 0,51 По трём критериям выбираем оптимальную модель. 1. число факторов минимально (2) 2. max R, R = 0,36 3. min E, E = 0,46 Следовательно, оптимальной моделью является модель 1-3. Значит, признаки-факторы «посещаемость занятий на 1 курсе» и «подготовка к семинарским занятиям» влияют

зна-чительнее других факторов на признак-результат. Среднеквадратическая ошибка уравнения многофакторной регрессии небольшая по срав-нению с ошибками, рассчитанными для других моделей многофакторной регрессии. Составляю для этой модели уравнение регрессии в естественных масштабах. Х0/1,3 = a + b1x1 + b3x3 Корреляционная матрица. Таблица 3 0 1 3 0 1,00 0,57 0,48 1 0,57 1,00 0,47 3 0,43 0,47 1,00

t0/1,3 = 1t1 + 3t3 0,57 = 1 + 0,473 0,57 = 1 + 0,47(0,44 – 0,471) 1 = 0,4 0,44 = 0,471 + 3 3 = 0,44 – 0,471 3 = 0,25 t0/1,3 = 0,4t1 + 0,25t3 b1 = (0 / x1) 1 = (0,47 / 4,4) 0,4 = 0,071 b3 = (0 / x3) 3 = (0,79 / 2,68) 0,25 = 0,073 a = x0 – b1x1 – b3x3 = 4,27 – 0,071  16,13 – 0,073  4,08

= 2,8 имеем: х0/1,3 =2,8 + 0,071х1 + 0,073х3 – уравнение линейной множественной регрессии. R0/1,3 = 1r01 + 3r03 R0/1,3 = 0,4  0,58 + 0,25  0,48 = 0,6 Вывод: коэффициент 1 говорит о том, что признак-результат—средний балл зачётки за 1 курс на 0,4 долю от своего среднеквадратического отклонения (0,4  0,79 = 0,316 балла) при изменении

признака-фактора—посещаемости на 1 курсе на одно своё СКО (4,4 ч/нед). &#61538;3 – средний балл зачётки изменится на 0,25 долю от своего СКО (0,25 0,79 = 0,179 балла) при увеличении признака-фактора—подготовки к семинарским занятиям на одно своё СКО (2,68 ч/сут). Т. к. &#61538;1 < &#61538;3, следовательно фактор 1—посещаемость занятий влияет на средний балл за-чётки больше, чем фактор 3—подготовка к занятиям.

R2 говорит о том, что 36% общей вариации значений среднего балла зачётки на 1 курсе вызвано влиянием посещаемости и подготовки к занятиям. Остальные 60% вызваны про-чими факторами. R = 0,58 свидетельствует о том, что между посещаемостью занятий и подготовкой к ним и средним баллом зачётки существует заметная линейная зависимость. Коэффициент b1 говорит о том, что если посещаемость занятий увеличится на 1 ч/нед, то средний балл зачётки увеличится в среднем на 0,071 балла, при условии

неизменности всех остальных факторов. b2 говорит о том, что если подготовка к занятиям увеличится на 1 ч/нед, то средний балл зачётки в среднем увеличится на 0,073 балла. &#61538;1 = 0,4 &#61538;3 = 0,25 r01 = 0,52 r03 = 0,44 r13 = 0,47 Граф связи признаков-факторов: х2 – подготовки к семинарским занятиям, ч/нед; х1 - по-сещаемости занятий, ч/нед с признаком-результатом х0 – средним баллом зачётки по ито-гам экзаменов за 1 курс. &#61538;1 – мера непосредственного влияния на признак-результат

посещаемости занятий. &#61538;3 – мера непосредственного влияния подготовки к занятиям на средний балл зачётки. r01 = &#61538;1 + r13&#61538;3, где r01 – общее влияние х1 на r13&#61538;3 – мера опосредованного влияния х1 через х3 на х0. r01 = 0,4 + 0,47 &#61655; 0,25 = 0,52 r03 = &#61538;3 + r31&#61538;1, где r03 – общее влияние х3 на r31&#61538;1 – мера опосредованного влияния х3 через х1 на х0. Лабораторная работа № 3. Тема: «Дисперсионное отношение.

Эмпирическая и аналитическая регрессии.» Цель: выявление зависимости между признаками-факторами и признаком-результатом. Таблица с исходными данными. Таблица 1 Средний балл за¬чётки по итогам экзаменов за 1-ый курс (баллы) Посещаемость занятий на первом курсе (ч/нед) Самообразование (доп. Курсы) (ч/нед) Подготовка к семи-нар¬ским заня¬тиям (ч/нед) 4,7 19,5 0 5 4,5 22 2 6 4,2 22 0 2 4,3 19,5 0 7 4,5 17,5 0 3 4,2 9,5 6 12 4,0 12,5 0 5 4,7 22 4 7 4,6 17,5 3 4 4,7 9,5 0 2 4,5 11,5 6 3 4,0 11,5 2 3 4,2 19,5 4 8 4,0 20,5 6 9 3,2 9,5 0 0 4,0 17,5 0 8 3,2 14,5 0 2 3,5 14,5 0 2 4,8 22 0 10 4,6 8,5 0 1 4,5 22 0 4 4,5 22 6 2 4,2 17,5 4 4 4,5 14,5 6 4 4,2 11,5 2 2 4,8 17,5 0 4 4,0 10,5 0 2 4,2 17,5 2 6 3,0 9,5 0 0 4,8 19,5 2 2 4,8 19,5 2 6 4,3 17,5 4 2 3,2 6,0 0 0 4,5 22 2 5 4,7 22 4 3 4,2 22 3 5 4,6 9,5 0 1 3,0 14,0 0 2 3,0 6,5 0 5 4,0 22 2 5 4,7 17,5 6 0 3,5 11,5 0 6 4,7 22 6 2 4,5 22 0 0 3,2 17,5 4 8 4,8 22 0 0 3,2 9,5 0 5 4,5 17,5 0 3 3,0 14,5 5 3 4,7 11,5 5 3

Рассматриваю первую пару признаков: признак-фактор—посещаемость занятий на 1 курсе (ч/нед) и признак-результат—средний балл зачётки по итогам экзаменов за 1 курс (баллы). Далее обосную взаимосвязь между ними. Расчётная таблица №1 Таблица 2 Посещаемость занятий (ч/нед) Число наблю-дений xi yi &#61540;yi &#61540;2yi &#61540;2yi &#61546;i yi - y (yi–y)2&#61546;I [6-10] 9 8,6 3,7 0,71 0,5 4,5 -0,5 2,25 [10-14] 8 11,5 4,1 0,38 0,14 1,12

-0,1 0,08 [14-18] 15 16,4 3,7 1,01 1,02 15,3 -0,5 3,75 [18-22] 18 19,6 4,4 0,31 0,09 1,62 0,4 2,88 Сумма 50 - - - - 22,54 - 8,96 Средняя - 15,3 4,0 - - 5,6 - 2,24 &#61540;2y = (&#61669;(yi–y)2&#61546;I) &#61540; 2y = 8,96 / 50 = 0,1792 (балла)2 E2y= (&#61669;б2yi&#61546;I) / &#61669;&#61546;I E2y = (4,5 + 1,12 + 15,3 + 1,62) / 50 = 0,4508(балла)2 б2y =

E2y + &#61540; 2y = 0,4508 + 0,1792 = 0,63 (балла)2 &#61554;2 = &#61540; 2y / б2y = 0,1792 / 0,63 = 0,28 (0,28%) построение аналитической регрессии. yx = a + bx xy = (&#61669;xy&#61546;I) / &#61669;&#61546;I = 62,52 б2x = 19,4 (ч/нед)2 b = (xy – x y) / б2x = (62,52 – 15,3 &#61655; 4,0) / 19,4 = 0,068 a = y – bx = 4,0 – 0,068 &#61655; 15,3 = 2,96 Линейное уравнение регрессии зависимости среднего балла зачётки за 1 курс от посещае-мости: строим по

двум точкам yx = 2,96 + 0,068х 1. yx = 2,96 + 0,068 &#61655; 6 = 3,358 2. yx = 2,96 + 0,068 &#61655; 22 = 4,446 rxy = (xy – x y) / бxбy = 0,37 Корреляционное поле Эмпирическая линия регрессии Аналитическая линия регрессии Распределение среднего балла зачётки за 1 курс по признаку-фактору—посещаемости за-нятий на 1 курсе. Вывод: &#61554;2 свидетельствует о том, что 28% общей вариации результативного признака вы-звано

влиянием признака фактора—посещаемостью. Остальные 72% - вызваны влиянием прочих факторов. Можно сказать, что это слабая корреляционная зависимость. Интерпретируя параметр b, предполагаем, что для данной совокупности студентов с увеличением посещаемости занятий на 1 курсе на 1 ч/нед средний балл зачётки увеличивается на 0,068 балла. rxy говорит о том, что между признаком-результатом и признаком-фактором заметная линейная связь.

Рассматриваю вторую пару признаков: Расчётная таблица № 2. Таблица 3 Подготовка к семинар-ским заня-тиям (ч/нед) Число наблю-дений xi yi &#61540;yi &#61540;2yi &#61540;2yi &#61546;i yi - y (yi–y)2&#61546;i [0-3] 20 1,2 3,78 0,63 0,39 7,8 -0,22 0,96 [3-6] 18 4,0 4,31 0,45 0,2 3,6 0,31 1,72 [6-9] 9 6,8 4,46 0,28 0,07 0,63 0,46 1,9 [9-12] 2 9,5 4,4 0,399 0,15 0,3 0,4 0,32 Сумма 50 - - - -

2,33 - 4,9 средняя - 3,5 4,0 - - 3,08 - 1,2 &#61540;2y = (&#61669;(yi–y)2&#61546;I) &#61540; 2y = 4,9 / 50 = 0,098 (балла)2 E2y= (&#61669;б2yi&#61546;I) / &#61669;&#61546;I E2y = 12,33 / 50 = 0,25 (балла)2 б2y = E2y + &#61540; 2y = 0,35 (балла)2 &#61554;2 = &#61540; 2y / б2y = 0,098 / 0,35 = 0,28 (0,28%) &#61554; = 0,53 построение аналитической регрессии. yx = a + bx xy = (&#61669;xy&#61546;I) / &#61669;&#61546;I xy = 15,2 б2x = 7,2 (ч/нед)2 b = (xy

– x y) / б2x = (15,2 – 3,5 &#61655; 4,0) / 7,2 = 0,16 a = y – bx = 4,0 – 0,16 &#61655; 3,4 Линейное уравнение регрессии зависимости среднего балла зачётки за 1 курс от подготов-ки к семинарским занятиям: yx = 2,96 + 0,068х x = 0 y = 3,4 x = 7 y = 4,5 rxy = (xy – x y) / бxбy = (15,2 – 14) / 2,6 = 0,46 Корреляционное поле Эмпирическая линия регрессии Аналитическая линия регрессии Распределение среднего балла зачётки за 1 курс по признаку-фактору—подготовке

к се-минарским занятиям. Вывод: &#61554;2 свидетельствует о том, что 28% общей вариации результативного признака вызвано влиянием признака фактора—подготовкой к семинарским занятиям. Остальные 72% - вызваны влиянием прочих факторов. Можно сказать, что это слабая корреляционная зависимость. Интерпретируя параметр b, предполагаем, что для данной совокупности студентов с увеличением подготовки

к занятиям на 1 курсе на 1 ч/нед средний балл зачётки увеличивается на 0,16 балла. rxy говорит о том, что между признаком-результатом и признаком-фактором есть умеренная линейная связь. Рассматриваю третью пару признаков: Расчётная таблица № 3 Таблица 4 Самообразование (ч/нед) Число наблюдений xi yi &#61540;yi &#61540;2yi &#61540;2yi &#61546;i yi - y (yi–y)2&#61546;i 0 25 0 4,07 0,68 0,46 11,5 -0,03 0,022 2 8 2 4,38 0,3 0,09 0,72 0,28 0,62 3 2 3 4,40 0,2 0,04 0,08 0,3 0,18 4 6 4 4,22 0,5 0,25 1,5 0,12 0,08 5 2 5 3,35 0,35 0,12 0,24

-0,75 1,16 6 7 6 3,3 0,40 0,16 1,12 0,2 0,28 Сумма 50 - - - - 15,88 - 2,34 средняя - 1,96 4,1 - - 0,31 - 0,39 &#61540;2y = (&#61669;(yi–y)2&#61546;I) &#61540; 2y = 2,34 / 50 = 0,046 (балла)2 E2y= (&#61669;б2yi&#61546;I) / &#61669;&#61546;I E2y = 15,88 / 50 = 0,31 (балла)2 б2y = E2y + &#61540; 2y = 0,31 + 0,046 = 0,36 (балла)2 &#61554;2 = &#61540; 2y / б2y = 0,046 / 0,36 = 0,13 (13%) &#61554; = 0,36 построение аналитической

регрессии. yx = a + bx xy = (&#61669;xy&#61546;I) / &#61669;&#61546;I xy = 8,22 б2x = 5,1 (ч/нед)2 b = (xy – x y) / б2x = (8,22 – 8,036) / 5,1 = 0,032 a = y – bx = 4,1 – 0,032 &#61655; 1,96 = 4,03 Линейное уравнение регрессии зависимости среднего балла зачётки за 1 курс от самооб-разования: yx = 2,96 + 0,068х x = 0 y = 3,4 x = 7 y = 4,5 rxy = (xy – x y) / бxбy = (8,2 – 8,036) / 2,25 &#61655; 0,6 = 0,12 Корреляционное поле Эмпирическая линия регрессии

Аналитическая линия регрессии Вывод: &#61554;2 свидетельствует о том, что 13% общей вариации результативного признака вы-звано влиянием признака фактора—самообразованием. Можно сказать, что это очень слабая корреляционная связь. Зная коэффициент b, предполагаем, что для данной совокупности студентов с увеличением самообразования на 1 ч/нед средний балл зачётки увеличивается на 0,032 балла. rxy говорит о том, что между признаком-

результатом и признаком-фактором есть слабая прямая линейная связь. Министерство Высшего Образования РФ Санкт-Петербургский Государственный Инженерно-Экономический Университет Лабораторные работы По статистике Студентки 1 курса Группы 3292 Специальность коммерция Харькиной Анны.

Преподаватель: Карпова Г. В. Оценка: СПб 2001



Не сдавайте скачаную работу преподавателю!
Данный реферат Вы можете использовать для подготовки курсовых проектов.

Поделись с друзьями, за репост + 100 мильонов к студенческой карме :

Пишем реферат самостоятельно:
! Как писать рефераты
Практические рекомендации по написанию студенческих рефератов.
! План реферата Краткий список разделов, отражающий структура и порядок работы над будующим рефератом.
! Введение реферата Вводная часть работы, в которой отражается цель и обозначается список задач.
! Заключение реферата В заключении подводятся итоги, описывается была ли достигнута поставленная цель, каковы результаты.
! Оформление рефератов Методические рекомендации по грамотному оформлению работы по ГОСТ.

Читайте также:
Виды рефератов Какими бывают рефераты по своему назначению и структуре.