БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
ФАКУЛЬТЕТ ФИЛОСОФИИ И СОЦИАЛЬНЫХ НАУК
КАФЕДРА ПСИХОЛОГИИ
«СТАТИСТИЧЕСКИЕ МЕТОДЫ В ПСИХОЛОГИИ»
ЛЕКЦИИ
студента 1 курса отделения психологии
Тункевича Виктора Викторовича
преподаватель В.В. Сечко
Минск, 2012
Составные части математической статистики.
Математическую статистику можно условно подразделить на три части:
1. Описательная статистика.
2. Теория статистического вывода.
3. Планирование и анализ эксперимента.
- Описательная статистика – это раздел математической статистики, занимающейся описанием, представлением и табулированием совокупности исходных данных.
-Теория статистического вывода представляет собой общий класс задач, характеризующихся попытками вывести свойства большого массива данных (генеральной совокупности). Путём исследования небольшого объёма данных (выборки). Теория статистического вывода строится на описательной статистике.
-Планирование и анализ эксперимента представляют собой статистические методы, разработанные для обнаружения и исследования взаимосвязей между изучаемыми переменными.
Основные этапы статистической обработки данных.
1-й этап: Исходный (предварительный) анализ исследуемого реального явления.
В результате этого анализа определяются:
· Основные цели исследования на содержательном неформализованном уровне.
Способы организации выборки.
1. Простой случайный отбор – это способ получения n объектов из конечной генеральной совокупности состоящей из N объектов при котором, каждая… Затем, используя таблицу случайных чисел или корзину с шарами, отбирают друг… 2. Простой отбор с помощью регулярной, но не существенной для изучаемого вопроса процедуры. Например, в…
Шкалы измерений.
Любое эмпирическое научное исследование начинается с того, что исследователь фиксирует выраженность интересующих его свойств у объектов исследования… 1. Объекты исследования (в психологии это чаще всего люди)
2. Их свойства (то, что интересует исследователя и составляет предмет изучения)
Табулирование данных.
Для анализа и интерпретации количественных данных их необходимо каким-то образом обобщить. Для этого часто используют табулирование данных, то есть, представляют исходную выборку в виде таблицы соответствующей структуры. Табулирование данных осуществляется в 4этапа:
R=xmax- xmin
Определение размаха выборки. Для этого необходимо из максимального элемента выборки вычесть минимальный элемент выборки.
Формула №6.1
1. Определение ширины интервала группирования данных. Для этого размах выборки делится на количество интервала.
h=
Формула №6.2
К1= и К2=
где h- ширина интервала, R- размах выборки, k- количество интервала. Одной из основных проблем на этом этапе, является выбор количество интервала. Очень небольшое количество интервалов, может слишком упростить и сгладить общую тенденцию. Слишком большое количество интервалов, может привести к излишней детализации рассматриваемого явления. Можно воспользоваться следующей рекомендацией: количество интервалов выбирается таким образом, чтобы в среднем, каждый интервал попадало 5-6 элементов выборки. Поэтому сначала вычисляются 2 числа К1 и К2 по следующим формулам:
Формула №6.3
1. Определение границ интервалов группирования данных.
При этом необходимо обращать внимание, чтобы левая граница первого интервала… 2. Непосредственно само табулирование данных. На этом этапе подсчитывается, сколько элементов исходной выборки, попало…
Квантили и их интерпретация.
Квантиль (К) – это такая точка на числовой прямой, которая делит исходные данные на 2 части с известными пропорциями (долями), в каждой из…
Обычно указывают долю наблюдений, расположенных слева от квантилей. Эта доля называется порядком или уровнем квантили.…
Графическое представление данных.
Гистограмма!
Меры центральной тенденции.
Часто, для описания исходных данных, используют ряд показателей, которые позволяют характеризовать всю совокупность исходных данных в целом. Такие показатели в статистике называются мерами центральной тенденции. К ним относятся:
Мода
Медиана
Среднее значение
Мода выборки!
Мода выборки – это такое значение в исходных данных (выборке), которая встречается наиболее часто. Будем обозначать моду (Xmod). Например, для выборки 8, 6, 2, 9, 10, 6, 9, 9 имеет:
Раз
Раза
Раз
Раза
Раз
Xmod=9.
В некоторых случаях, мода находится не так просто:
· В случае, когда все значения в выборке, встречаются одинаково часто, принято считать, что такая выборка не имеет моды. Например: 2, 3, 6, 7, 9 - моды нет. 2, 2, 3, 3, 6, 6 - моды нет. 2, 2, 2, 2, 2, 2 - Xmod=2.
· Если в упорядоченной выборке 2 соседних значения встречаются одинаково часто и чаще всех остальных значений, то в этом случае в качестве моды выбирается среднее значение этих двух величин. Например: 10, 2, 8, 2, 6, 5, 5, 2, 8, 5, 1 расставим цифры по возрастанию: 1, 2, 2, 2,5, 5, 5, 6, 8, 8, 10, тогда Xmod == 3,5
· Если одинаково часто, встречаются 2 значения в выборке, но они не являются соседними в упорядоченнойвыборке, а в выборке ещё есть значения, которые встречаются реже этих двух значений, то принято считать, что выборка имеет 2 моды и называется бимодальной. Например: 1, 2, 2, 2, 4, 5, 5, 5, 6, 8, 8, 10 - они не являются соседями и получается 2 моды: Xmod1=2; Xmod2=5.
Пример комбинированного случая:
1, 2, 2, 2,5, 5, 5, 6, 8, 8, 8, 10 сначала пишем: Xmod1 == 3,5; Xmod2=8.
Медиана выборки!
Медиана – это такое значение в выборке, которое делит упорядоченную выборку пополам, то есть, половина элементов выборки, меньше медианы, а вторая половина элементов – больше медианы. Будем обозначать медиану (Xmed). При вычислении медианы, возможны 2 ситуации:
· Выборка содержит не чётное число наблюдений. В этом случае, в качестве медианы выбирается значение расположенное точно в середине упорядоченной выборки. Например: 2, 10, 8, 7, 3 сначала мы упорядочиваем выборку: 2, 3, 7, 8, 10. Если выборка содержит большое нечётное количество наблюдений, то для нахождения порядкового номера элемента выборки, расположенного точно в середине упорядоченной выборки, необходимо вычислить следующую величину: , где n- общее число элементов выборки. Например, для выборки объёма n=75:==38, однако это не медиана, а лишь порядковый номер элемента, то есть в нашем примере Xmed≠38.
· Выборка содержит чётное количество наблюдений. В этом случае в качестве медианы, выбирается значение равное среднему значению двух величин, расположенных в середине упорядоченной выборки. Например: 2, 3, 6, 7, 8, 10 Xmed==6,5. Если выборка содержит большое чётное количество наблюдений, то для нахождения порядковых номеров двух элементов в выборке, расположенных точно в середине упорядоченной выборки, необходимо вычислить 2 следующие величины: ,+1. Однако это не медианы, а лишь порядковые номера элементов, то есть в нашем примере Xmed≠ .
Среднее значение выборки!
x= =
Для вычисления среднего значения все элементы выборки суммируются и полученная сумма, делится на количество элементов выборки.
Формула №9.4
Среднее значение обладает некоторыми свойствами:
1. Если выборка состоит из одного и того же значения, то среднее значение такой выборки равно этому значению. Например: 18, 18, 18, 18, 18; х=18.
2. Если к каждому элементу выборки добавить одну и ту же величину «с», то среднее значение изменится на ту же величину в соответствующем направлении в зависимости от знака «с». Например: хнов.=хстар.+с.
3. Если каждый элемент выборки умножить на одну и ту же величину «с», то среднее значение изменится в «с» раз. Например: хнов.=хстар.∙с.
4. Сумма отклонений каждого элемента выборки от среднего значения для любой выборки всегда равна нулю.
Меры изменчивости.
Рассмотренные в §9 меры центральной тенденции, позволяют нам характеризовать в каком-то смысле все элементы выборки в целом. В этом случае… Наиболее простой мерой изменчивости является размах выборки, которая…
Формула №10.5
Чем больше дисперсия выборки, тем более разбросаны элементы выборки по числовой оси относительно среднего значения выборки. Пример: вычислить… После этого составим расчётную таблицу:
Хi
Xi-
1-2=-1
(-1)2=1
3-2=1
…
Формула №10.6
Для нашего примера имеем:
Формула №10.7
Например, если дисперсия =2,25, то стандартное отклонение будет равно , стандартное отклонение позволяет характеризовать разброс элементов… На практике часто пользуются правилом 3-х стандартных отклонений (3-х сигм).…
Формула №10.8
Где М и сигма константы, принимающие для соответствующей шкалы следующие значения:
шкала
М
δ
Стены
…
Формула №10.9
Если β равняется нулю, то это означает, что исходная выборка (её гистограмма) является симметричной: β=0
Если β больше нуля, то говорят, что выборка имеет положительную или…
Нормальное распределение.
Значение величин представляющих исходные даны, не возможно точно предугадать, даже при полностью известных условиях эксперимента, в которых они…
Зная это распределение, мы можем делать некоторые выводы о событиях, в которых участвуют эти величины. Однако эти…
Формула №11.11
Пример: проверить на нормальность распределения исходные данные «показателя» аналогии.
Решение:
Для вычисления эмпирических значений асимметрии и эксцесса составим следующую расчётную таблицу:
Xi
…
Распределения, связанные с нормальным распределением.
1. (хи-квадрат) распределения Пирсона.
2. t-распределение Стьюдента (настоящая фамилия Госсет).
3. F-распределение Фишера.
5 7 9 8 6 5 4 9 7 2 1 1 1 1 3 9 3 9 4 3 2 5 7 8 1
2. Осуществить табулирование исходных данных и построить полигон частот.
Граница интервалов
Подсчёт
Частоты
1 – 3
I I I I I I I
3 – 5
I I I I I
5 – 7
I I I I
7 – 9
I I I I I
9 – 11
I I I I
5 7 9 8 6 5 4 9 7 2 1 1 1 1 3 9 3 9 4 3 2 5 7 8 1
3. Осуществить табулирование исходных данных и построить огиву (сглаженную кривую).
Граница интервалов
Подсчёт
Частоты
Накопленные частоты
%
1 – 3
I I I I I I I
3 – 5
I I I I I
7+5=12
5 – 7
I I I I
12+4=16
7 – 9
I I I I I
16+5=21
9 – 11
I I I I
21+4=25
5 7 9 8 6 5 4 9 7 2 1 1 1 1 3 9 3 9 4 3 2 5 7 8 1
4. Вычислить моду выборки.
1 – 5
2 – 2
3 – 3
4 – 2
5 – 3
6 – 1
7 – 3
8 – 2
9 – 4
Ответ: Хmod=1
5. Вычислить медиану выборки.
1 1 1 1 1 2 2 3 3 3 4 4 5 5 5 6 7 7 7 8 8 9 9 9 9
Если нечётное количество респондентов, то
Ответ: Хmed=5
6. Вычислить среднее значение выборки.
Округляем число до целого, из 4,8 округляем до 5.
Ответ: =5
7. Вычислить дисперсию выборки.
Хi
Ответ: =12,4
8. Вычислить стандартное отклонение выборки.
Ответ: Sх=3,52
ЛИТЕРАТУРА:
1. Ермолаев О.Ю. – «Математическая статистика для психологов». Учебник (2003);
2. Наследов А.Д. – «Математические методы в психологическом исследовании. Анализ и интерпретация данных». Учебное пособие (2006);
3. Сидоренко Е.В. – «Методы математической обработки в психологии» (2006).