Содержание
Введение
Глава 1. Теоретическая часть
1.1 Основные понятия, используемые в математическойобработке психологических данных
1.2 Статистический анализэкспериментальных данных
1.3 Вторичные методы обработки материалов психологическихисследований
Глава 2. Практическая часть
2.1 Ранговая корреляция
Заключение
Литература
Введение
Психология получила статус наукиблагодаря эксперименту и использованию математики при обработкеэкспериментальных данных и психологических исследований. Математика впсихологии служит таким логическим инструментом доказательства, даваявозможность научного понимания психологических закономерностей и болееглубокого их анализа Математическая статистика — область современнойматематики, основанная на теории вероятностей и занятая поиском законовизменения и способов измерения случайных величин, обоснованием методоврасчетов, производимых с такими величинами.
Математическая статистикавозникла (XVII в) и развивалась параллельно с теорией вероятностей. Дальнейшееразвитие математической статистики (вторая половина XIX — начало XX в) обязано,в первую очередь, П.Л. Чебышеву, А.А. Маркову, А.М. Ляпунову, а также К. Гауссу,А. Кетле, Ф. Гальтону, К. Пирсону и др.
В XX в. Наиболее существенныйвклад в математическую статистику был сделан советскими математиками (В.И. Романовский,Е.Е. Слуцкий, А.Н. Колмогоров, Н.В. Смирнов), а также английскими (Стъюдент, Р.Фишер, Э. Пирсон) и американскими (Ю. Нейман, А. Вальд) учеными.
Еще в середине XIX начале XXвека наблюдается, правда, еще не вполне регулярные, но, тем не менее,приносящие обоюдную пользу, — попытки провести аналогии между психологическимии физическими исследованиями, особенно в области построения лабораторногоэксперимента, анализа и обработки экспериментальных данных. Почти одновременнов психологию и физику приходят вероятностные и статистические методы, теориядифференциальных уравнений, вариационное исчисление и другие. О том, чтобыматематически описать деятельность мозга мечтал И.П. Павлов.
Психология получила статус наукиблагодаря эксперименту (как естественно-научная дисциплина) и математическойстатистике. Благодаря проникновению в количественные свойства психическихявлений, психология получила множество логических доказательств, которыеявились научным обоснованием изучения психики человека. Именно поэтомуматематика как строгая логическая дисциплина необходима любому специалисту,практикующемуся в области психологии. Современная математическая статистикапредставляет собой большую и сложную систему знаний. Математическая статистиканужна психологу не только для проведения научных исследований, а постоянно вего повседневной работе. Статистики разработали целый комплекс простых методов,которые совершенно доступны любому квалифицированному специалисту психологу.
Глава 1. Теоретическая часть1.1 Основные понятия, используемые в математическойобработке психологических данных
1) признаки и переменные.
2) шкалы измерения.
3) Статистические гипотезы.
4) Статистические критерии.
1. Признаки и переменные — этоизмеряемые психологические явления. Такими явлениями могут быть время решениязадачи, количество допущенных ошибок, уровень тревожности, показательинтеллектуальной лабильности, интенсивность агрессивных реакций, угол поворотакорпуса в беседе, показатель социометрического статуса и множество другихпеременных. Понятия признака и переменной могут использоваться каквзаимозаменяемые. Они являются наиболее общими. Иногда вместо них используютсяпонятия показателя или уровня, например уровень настойчивости, показательвербального интеллекта и др.
Математическая обработка — это оперированиесо значениями признака, полученными у испытуемых в психологическом исследовании.Такие индивидуальные результаты называют также «наблюдениями», «наблюдаемымизначениями», «вариантами», «датами» и др. значениепризнака определяется при помощи специальных шкал измерения.
2. Шкалы измерения. Измерение — этоприписывание числовых форм объектами или событиям в соответствии сопределенными правилами.С. Стивенсом предложена классификация из 4 типов шкализмерения:
а) Номинативная, илиноминальная, или шкала наименований;
б) Порядковая, или ординальная,шкала;
в) Интервальная, или шкаларавных интервалов;
г) Шкала равных отношений.
Шкала наименований. Кэтой шкале относятся материалы, в которых изучаемые объекты отличаются друг отдруга по их качеству. При обработке таких материалов нет никакой нужды в том,чтобы располагать эти объекты в каком-то порядке, исходя из их характеристик.
Шкала порядка. Если в шкаленаименований порядок следования изучаемых объектов практически не играетникакой роли, то в шкале порядка — это видно из ее названия — именно на этупоследовательность переключается все внимание. К этой шкале в статистикеотносят такие исследовательские материалы, в которых рассмотрению подлежатобъекты, принадлежащие к одному или нескольким классам, но отличающиеся присравнении одного с другим: больше — меньше, выше — ниже и т.п.
Шкала интервалов. К нейотносятся такие материалы, в которых дана количественная оценка изучаемогообъекта в фиксированных единицах. Например, в опытах учитывалось, сколько точекмогут поставить, работая с максимально доступной скоростью, испытуемые. Оценочнымиединицами в опытах служило число точек. Подсчитав их, исследователь получил тоабсолютное число точек, которое оказалось возможным поставить за отведенноевремя каждому участнику опытов. Главная трудность при отнесении материалов кшкале интервалов состоит в том, что нужно располагать такой единицей, котораябыла бы при всех повторных изменениях тождественной самой себе, т.е. одинаковойи неизменной.
Шкала отношений. К этой шкалеотносятся материалы, в которых учитываются не только число фиксированныхединиц, как в шкале интервалов, но и отношения полученных суммарных итоговмежду собой. Чтобы работать с такими отношениями, нужно иметь некую абсолютнуюточку, от которой ведется отчет. При изучении психологических объектов эташкала практически неприменима.
3. Статистические гипотезы. Формулированиегипотез систематизирует предположения исследователя и представляет их в четкоми лаконичном виде. Благодаря гипотезам исследователь не теряет путеводной нитив процессе расчетов и ему легко понять после их окончания, что, собственно, онобнаружил. Статистические гипотезы подразделяются на нулевые и альтернативные,направленные и ненаправленные.
Нулевая гипотеза — это гипотеза оботсутствий различий. Она обозначается как Н0 и называется нулевой потому, чтосодержит число 0: Х1 — Х2 = 0, где Х1, Х2 — сопоставляемые значения признаков. Нулеваягипотеза — это то, что мы хотим опровергнуть, если перед нами стоит задачадоказать значимость различий.
Альтернативная гипотеза — этогипотеза о значимости различий. Она обозначается как Н1. альтернативнаягипотеза — это то, что мы хотим доказать, поэтому иногда ее называютэкспериментальной гипотезой.
Нулевая и альтернативнаягипотезы могут быть направленными и ненаправленными.
Статистические критерии.
Статистический критерий — этоправило, обеспечивающее надежное поведение, то есть принятие истинной иотклонение ложной гипотезы с высокой вероятностью. Статистический критерийобозначает метод расчета определенного числа и само это число.
Параметрические критерии — этокритерии, включающие в формулу расчета параметры распределения, то есть средниеи дисперсии (t-критерий Стъюдента, критерий F и др.) Непараметрические критерии- это критерии, не включающие в формулу расчета параметров распределения иоснованные на оперировании частотами или рангами (критерий-Q Розенбаума,критерий-Т Вилкоксона и др.) Параметрические критерии и непараметрическиекритерии имеют свои преимущества и недостатки.
Параметрические критерии:
1. Позволяют прямо оценитьразличия в средних, полученных в двух выборках (t — критерий Стъюдента).
2. Позволяют прямо оценитьразличия в дисперсиях (критерий Фишера) 3. Позволяют выявить тенденцииизменения признака при переходе от условия к условию (дисперсионныйоднофакторный анализ), но лишь при условии нормального распределения признака.
4. Позволяют оценитьвзаимодействие двух и более факторов в их влиянии на изменения признака (двухфакторныйдисперсионный анализ).
5. Экспериментальные данныедолжны отвечать двум, а иногда трем, условиям:
а) значения признака измерены поинтервальной шкале;
б) распределение признакаявляется нормальным;
в) в дисперсионном анализедолжно соблюдаться требование равенства дисперсий в ячейках комплекса.
6. Математические расчетыдовольно сложны.
7. Если условия, перечисленные вп.5, выполняются, параметрические критерии оказываются несколько более мощными,чем непараметрические.
Непараметрические критерии.
1. Позволяют оценить лишьсредние тенденции, например, ответить на вопрос, чаще ли в выборке Австречаются более высокие, а в выборке Б — более низкие значения признака (критерииQ, U, и др.).
2. Позволяют оценить лишьразличия в диапазонах вариативности признака (критерий).
3. Позволяют выявить тенденцииизменения признака при переходе от условия к условию при любом распределениипризнака (критерии L и S).
4. Эта возможность отсутствует.
5. Экспериментальные данныемогут не отвечать ни одному из этих условий:
а) значения признака могут бытьпредставлены в любой шкале, начиная от шкалы наименований;
б) распределение признака можетбыть любым и совпадение его с каким-либо теоретическим законом распределениянеобязательно и не нуждается в проверке;
в) требования равенствадисперсий отсутствует.
6. Математические расчеты побольшей части просты и занимают мало времени (за исключением лишь некоторыхкритериев).
7. Если условия, перечисленные вп.5, не выполняются, непараметрические критерии оказываются более мощными, чемпараметрические, так как они менее чувствительны к «засорениям».1.2 Статистический анализ экспериментальных данных
Методы первичной статистической обработкирезультатов эксперимента Статистические методы применяются при обработкематериалов психологических исследований для того, чтобы извлечь из техколичественных данных, которые получены в экспериментах, при опросе инаблюдениях, возможно больше полезной информации. В частности, в обработкеданных, получаемых при испытаниях по психологической диагностике, это будетинформация индивидуально-психологических особенностях испытуемых.
Методами статистическойобработки результатов эксперимента называются математические приемы, формулы,способы количественных расчетов, с помощью которых показатели, получаемые входе эксперимента, можно обобщать, приводить в систему, выявляя скрытые в нихзакономерности. Речь идет о таких закономерностях статистического характера,которые существуют между изучаемыми в эксперименте переменными величинами.
Некоторые из методовматематико-статистического анализа позволяют вычислять так называемыеэлементарные математические статистики, характеризующие выборочноераспределение данных, например, выборочное среднее, выборочная дисперсия, мода,медиана и ряд других. Иные методы математической статистики, например,дисперсионный анализ, регрессионный анализ, позволяют судить о динамикеизменения отдельных статистик выборки. С помощью третьей группы методов,скажем, корреляционного анализа, факторного анализа, методов сравнениявыборочных данных, можно достоверно судить о статистических связях,существующих между переменными величинами, которые исследуют в данномэксперименте.
Все методыматематико-статистического анализа условно делятся на первичные и вторичные. Первичныминазывают методы, с помощью которых можно получить показатели, непосредственноотражающие результаты производимых в эксперименте измерений. Соответственно подпервичными статистическими показателями имеются в виду те, которые применяютсяв самих психодиагностических методиках и являются итогом начальнойстатистической обработки результатов психодиагностики. К первичным методамстатистической обработки относят, например, определение выборочной среднейвеличины, выборочной дисперсии, выборочной моды и выборочной медианы. В числовторичных методов обычно включают корреляционный анализ, регрессионный анализ,методы сравнения первичных статистик у двух или нескольких выборок.
Рассмотрим методы вычисленияэлементарных математических статистик, начав с выборочного среднего.
Выборочное среднее значение какстатистический показатель представляет собой среднюю оценку изучаемого вэксперименте психологического качества. Эта оценка характеризует степень егоразвития в целом у той группы испытуемых, которая была подвергнутапсиходиагностическому обследованию. Сравнивая непосредственно средние значениядвух или нескольких выборок, мы можем судить об относительной степени развитияу людей, составляющих эти выборки, оцениваемого качества. Выборочное среднееопределяется при помощи следующей формулы:
где — выборочная средняя величинаили среднее арифметическое значение по выборке; n количество испытуемых в выборкеили частных психодиагностических показателей, на основе которых вычисляетсясредняя величина; хk частные значения показателей у отдельных испытуемых. Всеготаких показателей n, поэтому индекс k данной переменной принимает значения от 1до n; принятый в математике знак суммирования величин тех переменных, которыенаходятся справа от этого знака.
Дисперсия как статистическаявеличина характеризует, на сколько частные значения отклоняются от среднейвеличины в данной выборке. Чем больше дисперсия, тем больше отклонения илиразброс данных. Иногда вместо дисперсии для выявления разброса частных данныхотносительно средней используют производную от дисперсии величину, называемуювыборочное отклонение. Оно равно квадрат ному корню, извлекаемому из дисперсии,и обозначается тем же самым знаком, что и дисперсия, только без квадрата — :
Медианой называется значениеизучаемого признака, которое делит выборку, упорядоченную по величине данногопризнака, пополам. Справа и слева от медианы в упорядоченном ряду остается поодинаковому количеству признаков.
Мода еще одна элементарнаяматематическая статистика и характеристика распределения опытных данных. Модойназывают количественное значение исследуемого признака, наиболее частовстречающееся в выборке. Иногда исходных частных первичных данных, которые подлежатстатистической обработке, бывает довольно много, и они требуют проведенияогромного количества элементарных арифметических операций. Для того чтобысократить их число и вместе с тем сохранить нужную точность расчетов, иногдаприбегают к замене исходной выборки частных эмпирических данных на интервалы. Интерваломназывается группа упорядоченных по величине значений признака, заменяемая впроцессе расчетов сред ним значением.
1.3 Вторичные методы обработки материаловпсихологических исследований
С помощью вторичных методовстатистической обработки экспериментальных данных непосредственно проверяются,доказываются или опровергаются гипотезы, связанные с экспериментом. Эти методы,как правило, сложнее, чем методы первичной статистической обработки, и требуютот исследователя хорошей подготовки в области элементарной математики и статистики.Обсуждаемую группу методов можно разделить на несколько подгрупп:
1. Регрессионное исчисление.
2. Методы сравнения между собойдвух или нескольких элементарных статистик (средних, дисперсий и т.п.),относящихся к разным выборкам.
3. Методы установления статистическихвзаимосвязей между переменными, например их корреляции друг с другом.
4. Методы выявления внутреннейстатистической структуры эмпирических данных (например, факторный анализ).
Регрессионное исчисление — этометод математической статистики, позволяющий свести частные, разрозненныеданные к некоторому линейному графику, приблизительно отражающему их внутреннюювзаимосвязь, и получить возможность по значению одной из переменных приблизительнооценивать вероятное значение другой переменной.
Следующий метод вторичнойстатистической обработки, посредством которого выясняется связь или прямаязависимость между двумя рядами экспериментальных данных, носит название методкорреляций. Он показывает, каким образом одно явление влияет на другое илисвязано с ним в своей динамике. Подобного рода зависимости существуют, кпримеру, между вели чинами, находящимися в причинно-следственных связях друг сдругом. Если выясняется, что два явления статистически достоверно коррелируютдруг с другом и если при этом есть уверенность в том, что одно из них можетвыступать в качестве причины другого явления, то отсюда определенно следуетвывод о наличии между ними причинно-следственной зависимости.
Имеется несколько разновидностейданного метода: линейный, ранговый, парный и множественный. Линейный корреляционныйанализ позволяет устанавливать прямые связи между переменными величинами по ихабсолютным значениям. Эти связи графически выражаются прямой линией, отсюданазвание «линейный». Ранговая корреляция определяет зависимость немежду абсолютными значениями переменных, а между порядковыми местами, илирангами, занимаемыми ими в упорядочен ном по величине ряду. Парныйкорреляционный анализ включает изучение корреляционных зависимостей толькомежду парами переменных, а множественный, или многомерный, между многимипеременными одновременно.
Глава 2. Практическая часть2.1 Ранговая корреляция
В психологии часто возникает потребностьанализа связи между переменными, которые не могут быть измерены в интервальнойили реляционных шкалах, но тем не менее поддаются упорядочению и могут быть проранжированыпо степени убывания или возрастания признака. Для определения тесноты связимежду признаками, измеренными в порядковых шкалах, применяются методы ранговойкорреляции. К ним относятся: коэффициенты ранговой корреляции Спирмена иКендалла (используются для определения тесноты связи между двумя величинами) икоэффициент конкордации (устанавливает статистическую связь между несколькими признаками).Использование коэффициента линейной корреляции Пирсона в случае, когда о законераспределения и о типе измерительной шкалы отсутствует сколько-нибудь надежнаяинформация, может привести к существенным ошибкам.
Методы ранговой корреляции могутбыть использованы для определения тесноты связи не только между количественнымипеременными, но и между качественными признаками при условии, что их значенияможно упорядочить и проранжировать. Эти методы также могут быть использованыприменительно к признакам, измеренным в интервальных и реляционных шкалах,однако их эффективность в этом случае всегда будет ниже.
Коэффициент ранговой корреляцииСпирмена. Каждая из двух совокупностей располагается в виде вариационного рядас присвоением каждому члену ряда соответствующего порядкового номера (ранга),выраженного натуральным числом. Одинаковым значениям ряда присваивают среднееранговое число.
Сравниваемые признаки можноранжировать в любом направлении:
как в сторону ухудшения качества(ранг 1 получает самый большой, быстрый, умный и т.д. испытуемый), так инаоборот. Главное, чтобы обе переменные были проранжированы одинаковымспособом.
Коэффициент ранговой корреляцииСпирмена находится по формуле n
6 ⋅∑ d i2
rS = 1 − i =1, n −n3
где di — разность рангов длякаждой i-пары из n наблюдений.
Если в вариационных рядах для Xи Y встречаются члены ряда с одинаковыми ранговыми числами, то в формулу длякоэффициента корреляции Спирмена необходимо внести поправки Tx и Ty наодинаковые ранги:
n
6 ⋅ ∑ d i2 l
rS = 1 − i=1, T = ∑ (t k − t k).
3
1
(n 3 − n) − (Tx + Ty) k =1
2
Здесь l — число групп ввариационном ряду с одинаковыми ранговыми числами; tk — число членов в каждойиз l групп.
Ранговый коэффициент корреляцииСпирмена, как и линейный, изменяется от -1 до +1, однако значение ранговогокоэффициента корреляции Спирмена всегда меньше значения коэффициента линейнойкорреляции Пирсона: rS
Проверка гипотезы о значимостикоэффициента ранговой корреляции Спирмена проводится по-разному в зависимостиот объема выборки.
1. Объем выборки больше 30 (n> 30).
Проверка нулевой гипотезы h0: с= 0 при альтернативной h1: с ≠ 0 осуществляется с помощью критерияСтьюдента и заключается в вычислении величины rS
t = ⋅ n−2,1 − rS2
имеющей распределение Стьюдентас df = n — 2 степенями свободы. Эмпирическое значение сравнивается скритическими значениями tб (n — 2).
Нулевая гипотеза с = 0 неотвергается, если эмпирическое значение попадает в область допустимых значений:
| t | ≤ t0,05 (df), df = n- 2.
Коэффициент ранговой корреляцииСпирмена значимо отличается от нуля, если эмпирическое значение попадает вкритическую область:
| t | > t0,01 (df), df = n — 2.
2. Очень малый объем выборки (n ≤30).
Проверка нулевой гипотезыосуществляется путем сравнения вычисленного коэффициента rS с критическимизначениями rб (n), взятым из статистических таблиц для выбранного уровнязначимости б и числа пар наблюдений n (табл.3.1). Нулевая гипотеза с = 0 неотвергается, если эмпирическое значение попадает в область допустимых значений:
| rS | ≤ r0,05 (n).
Коэффициент ранговой корреляцииСпирмена значимо отличается от нуля, если вычисленное значение попадает вкритическую область:
| rS | > r0,01 (n).
Таблица 3.1
Критические значениякоэффициента ранговой корреляции Спирмена α α α n n n 0,05 0,01 0,05 0,01 0,05 0,01 7 0,745 0,893 15 0,518 0,654 23 0,415 0,531 8 0,690 0,857 16 0,500 0,632 24 0,406 0,520 9 0,663 0,817 17 0,485 0,615 25 0,398 0,510 10 0,636 0,782 18 0,472 0,598 26 0,389 0,500 11 0,609 0,754 19 0,458 0,582 27 0,383 0,491 12 0,580 0,727 20 0,445 0,568 28 0,375 0,483 13 0,555 0,698 21 0,435 0,555 29 0,368 0,474 14 0,534 0,675 22 0,424 0,543 30 0,362 0,466
В методике С.А. Будаси испытуемомупредлагается проранжировать 20 качеств по степени желательности (ранг 20 присуждаетсясамому желаемому качеству). Затем в другой колонке его просят проранжироватьэти же качества по степени выраженности у него в данный момент (ранг 20получает самое характйрное качество). На основе расчета коэффициента ранговойкорреляции Спирмена делается вывод об уровне самооценки испытуемого. Результатыиспытуемого С. О-ва приведены в таблице 3.2 Требуется рассчитать коэффициенткорреляции Спирмена между выраженностью качеств у обследуемого испытуемого вданный момент и его идеальным представлением.
Решение:
Составляем расчетную таблицу, вкоторую заносим две ранговые последовательности (желаемую N и реальную N'),разности рангов d и d2.
Таблица 3.2
Расчет коэффициента ранговойкорреляции СпирменаКачества N N’ d = N — N’ d2 уступчивость 14 15 — 1 1 смелость 15 18 — 3 9 вспыльчивость 2 16 — 14 196 настойчивость 13 13 0 0 нервозность 1 7 — 6 36 терпеливость 17 10 7 49 увлекаемость 12 20 — 8 64 пассивность 8 2 6 36 холодность 10 19 — 9 81 энтузиазм 9 17 — 8 64 осторожность 16 4 12 144 капризность 3 1 2 4 медлительность 18 6 12 144 нерешительность 7 11 — 4 16 энергичность 20 12 8 64 жизнерадостность 19 8 11 121 мнительность 4 3 1 1 упрямство 5 9 — 4 16 беспечность 11 14 — 3 9 застенчивость 6 5 1 1 1056
Значение коэффициента корреляцииСпирмена подсчитываем по формуле
6 ⋅1056
rS = 1 − 3 = 0, 206.
20 − 20
Вследствие малого n (меньше 30) гипотезуо значимости коэффициента корреляции проверяем с помощью статистических таблиц.Для n = 20 имеем (см. табл.3.1):
h0? h1
⎯⎯|⎯⎯⎯⎯⎯|⎯⎯⎯⎯⎯⎯|⎯⎯⎯⎯⎯⎯→
0, 206 0,445 0,568 r
Значение коэффициента корреляцииrS = 0, 206 попадает в область допустимых
значений, что не позволяетотвергнуть нулевую гипотезу. Коэффициент корреляции не отличается от нуля.
Вывод:
Отсутствует связь междувыраженностью качеств у обследуемого испытуемого в данный момент и идеальнымпредставлением.
Заключение
В нашей работе мы рассмотрелиметоды математической обработки экспериментальных данных. Также выполнилипрактическую часть, произвели расчеты по методу ранговой корреляции Спирмена, высчиталикоэффициент корреляции Спирмена между выраженностью качеств у обследуемогоиспытуемого в данный момент и его идеальным представлением. На основе расчетов,сделали вывод об отсутствии связи между выраженностью качеств у обследуемогоиспытуемого в данный момент и идеальным представлением.
Психология — это наука, котораяисследует, наблюдает, анализирует. Она постоянно ищет свой путь в выявленииновых закономерностей и фактов. Математические методы обработки данныхоказывают на этом пути дают неоценимую помощь. Они используют математическиеприемы, формулы, способы качественных расчетов, с помощью которых показатели,получаемые в ходе эксперимента, можно обобщать, приводить в систему, выявляяскрытые в них закономерности.
Литература
1. Сидоренко Е.В. Методыматематической обработки в психологии/Е.В. Сидоренко. — СПб.: — 2002.
2. Немов Р.С. Психология / Р.С. Немов.- М.: — 2005. — 630
3. Харченко М.А. Корреляционныйанализ: Учебное пособие для ВУЗов / Л.М. Носилова. — Воронеж.: — 2008.