--PAGE_BREAK--Столь же широкое применение, как и при исследовании интеллекта, факторный анализ получил и в других областях психологии, в частности при изучении темперамента, создании клинической терапии и т.д.
За последние годы факторный анализ все более широко начал применяться и в других областях знания: в социологии, метеорологии, медицине, географии, экономике и др.
В факторном анализе при исследовании конкретных массивов информации существует возможность использовать различные модели, или, иначе, различные виды факторных решений. На основании этой неопределенности факторного анализа некоторые ученые ставили под сомнение его полезность как орудия научного исследования. Очевидно, однако, что точно также подобного обвинения заслуживают и другие прикладные науки, поскольку и в них имеются теоретические альтернативы.
За всю историю развития факторного анализа психологи и статистики разработали несколько типов факторных решений. Сторонник очередной теории аргументировал обычно ее полезность возможностью интерпретации психологических экспериментов. Сильнейшие эмоции, характерные для одного периода развития факторного анализа, остроумно выразил Куртон: “Факторную теорию можно определить как математически разумную гипотезу. Специалист в области факторного анализа – это субъект, одержимый некой навязчивой идеей о природе умственных способностей или личности. Применяя высшую математику к исследуемому предмету, он доказывает, что его оригинальная точка зрения верна и неизбежна. Обычно он доказывает также, что все другие специалисты в факторном анализе – опасные сумасшедшие и единственное их спасение состоит в том, чтобы принять его теорию; только в этом случае выяснится истина об их болезни. Поскольку противники никогда не поддерживают такое обвинение, то он обзывает их безнадежными и устремляется в области математики, наверняка им не известные; тем самым доказывается не только необходимость, но и достаточность неизлечимости оппонентов”/20, с.21/.
2. Основные теоретические понятия факторного анализа
2.1. Факторная матрица.
Факторный анализ – это ветвь математической статистики. Его цели, как и цель других разделов математической статистики, заключается в разработке моделей, понятий и методов, позволяющих анализировать и интерпретировать массивы экспериментальных или наблюдаемых данных вне зависимости от их физической формы.
Одной из наиболее типичных форм представления экспериментальных данных является матрица, столбцы которой соответствуют различным параметрам, свойствам, тестам и т.п., а строки – отдельным объектам, явлениям, режимам, описываемым набором конкретных значений параметров. На практике размеры матрицы оказываются достаточно большими: так, число строк этой матрицы может колебаться от нескольких десятков до нескольких сотен тысяч (например, при социологических обследованиях), а число столбцов – от одного – двух до нескольких сотен. Непосредственный, “визуальный”, анализ матриц такого размера невозможен, поэтому в математической статистике возникло много подходов и методов, предназначенных для того, чтобы “сжать” исходную информацию, заключенную в матрице, до обозримых размеров, извлечь из исходной информации наиболее “существенное”, отбросив “второстепенное”, “случайное”.
При анализе данных, представленных в форме матрицы, возникают два типа задач. Задачи первого типа имеют целью получить “короткое описание” распределения объектов, а задачи второго – выявить взаимоотношения между параметрами.
Следует иметь в виду, что основной стимул для появления указанных задач заключается не только и не столько в желании коротко закодировать большой массив чисел, а в значительно более принципиальном обстоятельстве, имеющем методологический характер: коль скоро удалось коротко описать большой массив чисел, то можно верить, что вскрыта некая объективная закономерность, обусловившая возможность короткого описания; а ведь именно поиск объективных закономерностей и является основной целью, ради которой, как правило, и собираются данные.
Упомянутые подходы и методы обработки матрицы данных отличаются тем, какого типа задачи обработки данных они предназначены решать, и тем, к матрицам какого размера они применимы.
Что же касается проблемы короткого описания связей между параметрами при среднем числе этих параметров, то в данном случае соответствующая корреляционная матрица содержит несколько десятков или сотен чисел и сама по себе она еще не может служить “коротким описанием” существующих связей между параметрами, а должна с этой целью подвергнуться дальнейшей обработке.
Факторный анализ как раз и представляет собой набор моделей и методов, предназначенных для “сжатия” информации, содержащейся в корреляционной матрице. В основе различных моделей факторного анализа лежит следующая гипотеза: наблюдаемые или измеряемые параметры являются лишь косвенными характеристиками изучаемого объекта или явления, на самом же деле существуют внутренние (скрытые, не наблюдаемые непосредственно) параметры или свойства, число которых мало и которые определяют значения наблюдаемых параметров. Эти внутренние параметры принято называть факторами. Задача факторного анализа – представить наблюдаемые параметры в виде линейных комбинаций факторов и, может быть, некоторых дополнительных, “не существенных” величин – “помех”. Замечательным является тот факт, что, хотя сами факторы не известны, такое разложение может быть получено и, более того, такие факторы могут быть определены, т.е. для каждого объекта могут быть указаны значения каждого фактора.
Факторный анализ, независимо от используемых методов, начинается с обработки таблицы интеркорреляций, полученных на множестве тестов, известной как корреляционная матрица, а заканчивается получением факторной матрицы, т.е. таблицы, показывающей вес или нагрузку каждого из факторов по каждому тесту. Таблица 1 представляет собой гипотетическую факторную матрицу, включающую всего два фактора.
Факторы перечисляются в верхней строке таблицы от более значимого к менее значимому, а их веса в каждом из 10 тестов даны в соответствующих столбцах.
Таблица 1
Гипотетическая факторная матрица
Оси координат. Принято представлять факторы геометрически в виде осей координат, относительно которых каждый тест может быть изображен в виде точки. Рис. 1 поясняет эту процедуру. На этом графике каждый из 10 тестов, приведенных в табл.1, отображен в виде точки относительно двух факторов, которые соответствуют осям I и II. Так, тест 1 представлен точкой с координатами 0,74 по оси I и 0,54 по оси II. Точки, представляющие остальные 9 тестов, построены аналогичным способом, с использованием значений весов из табл. 1.
Следует заметить, что положение осей координат не фиксировано данными. Исходная таблица корреляций определяет лишь положение тестов (т.е. точек на рис. 1) относительно друг друга. Те же точки можно нанести на плоскость с любым положением координатных осей. По этой причине при проведении факторного анализа обычно вращают оси до тех пор, пока не получают наиболее приемлемого и легко интерпретируемого отображения.
Рис. 1. Гипотетическое факторное отображение, показывающее веса двух групповых факторов по каждому из 10 тестов.
На рис. 1 полученные после вращения оси I’ и II’ показаны пунктирными линиями. Это вращение выполнено в соответствии с предложенными Терстоуном критериями положительного многообразия и простой структуры. Первый предполагает вращение осей до положения, при котором исключаются все значимые отрицательные веса. Большинство психологов считают отрицательные факторные нагрузки логически несоответствующими тестам способностей, так как такая нагрузка означает, что чем выше оценка индивидуума по специфическому фактору, тем ниже будет его результат по соответствующему тесту. Критерий простой структуры, в сущности, означает, что каждый тест должен иметь нагрузки по как можно меньшему числу факторов.
Выполнение обоих критериев дает факторы, которые можно наиболее легко и однозначно интерпретировать. Если тест имеет высокую нагрузку по одному фактору и не имеет значимых нагрузок по другим факторам, мы можем кое-что узнать о природе этого фактора, изучив содержание данного теста. Напротив, если тест имеет средние или низкие нагрузки по шести факторам, то он мало что скажет нам о природе любого из них.
На рис. 1 хорошо видно, что после вращения осей координат все вербальные тесты (1-5) располагаются вдоль или очень близко к оси I’, а числовые тесты (6-10) тесно группируются вокруг оси II’. Новые факторные нагрузки, измеренные относительно повернутых осей, приведены в табл. 2. Факторные нагрузки в табл. 2 не имеют отрицательных значений, за исключением пренебрежительно малых величин, явно относимых к ошибкам выборки. Все вербальные тесты имеют высокие нагрузки по фактору I’ и практически нулевые – по фактору II’. Числовые тесты, напротив, имеют высокие нагрузки по фактору II’ и пренебрежимо низкие – по фактору I’. Таким образом, вращение координатных осей существенно упростило идентификацию и называние обоих факторов, а также описание факторного состава каждого теста. На практике число факторов часто оказывается больше двух, что, разумеется, усложняет их геометрическое представление и статистический анализ, но не изменяет существа рассмотренной процедуры.
Таблица 2
Факторная матрица после вращения
Тест
Фактор I’
Фактор II’
1.Словарный
0,91
-0,06
2.Аналогии
0,75
0,02
3.Завершение предложений
0,80
0,00
4.Восстановление порядка слов в предложении
0,39
-0,02
5.Понимание прочитанного
0,86
-0,04
6.Сложение
-0,09
0,55
7.Умножение
0,07
0,64
8.Арифметические задачи
0,18
0,68
9.Составление уравнений
0,16
0,54
10.Завершение числовых рядов
0,13
0,38
Некоторые исследователи руководствуются теоретической моделью как принципом вращения осей. Кроме того, принимается в расчет неизменность, или подтверждение одних и тех же факторов в независимо выполненных, но сравнимых исследованиях.
Интерпретация факторов. Получив после процедуры вращения факторное решение (или, проще говоря, факторную матрицу), мы можем переходить к интерпретации и наименованию факторов. Этот этап работы скорее требует психологической интуиции, нежели статистической подготовки. Чтобы понять природу конкретного фактора, нам ничего не остается, как изучить тесты, имеющие высокие нагрузки по этому фактору, и попытаться обнаружить общие для них психологические процессы. Чем больше оказывается тестов с высокими нагрузками по данному фактору, тем легче раскрыть его природу. Из табл. 2, к примеру, сразу видно, что фактор I’ вербальный, а фактор II’ числовой. Приведенные в табл. 2 факторные нагрузки отображают к тому же корреляцию каждого теста с фактором.
2.2. Косоугольная система координат и факторы 2-го порядка.
Изображенные на рис. 1 оси называются ортогональными, так как они строго перпендикулярны друг другу. Иногда кластеры тестов располагаются таким образом, что лучшего соответствия используемым критериям удается достичь при использовании облических ( косоугольных) осей. В таком случае уже сами факторы коррелируют друг с другом. Одни исследователи утверж-дали, что использование ортогональных (некоррелирующих) факторов всегда предпочтительнее, поскольку такие факторы дают более простую и четкую картину взаимосвязи черт. Другие настаивают на том, что косоугольную систему координат следует использовать всякий раз, когда она лучше соответствует изучаемым данным, поскольку большинство имеющих ясный физический смысл категорий и не должны быть независимыми. Очевидный пример – рост и вес. Несмотря на высокую корреляцию между собой, они оказались весьма полезными категориями при оценке телосложения.
Когда факторы коррелируют между собой, существующие между ними интеркорреляции можно подвергнуть тому же статистическому анализу, который мы применяем к интеркорреляциям между тестами. Иными словами, у нас есть возможность “факторизовать факторы” и получить факторы второго порядка. Этот способ обработки данных был использован в ряде исследований таких переменных, как способности и черты личности. В некоторых исследованиях с использованием тестов способностей был получен единственный общий фактор второго порядка. Как правило, американские исследователи, применяющие факторный анализ, начинают с объяснения как можно большей части общей дисперсии групповыми факторами и только затем выявляют общий фактор как фактор второго порядка, если данные подтверждают его наличие. У английских психологов, напротив, принято начинать с общего фактора, которому приписывается основная доля общей дисперсии, а затем возвращаться к групповым факторам для объяснения остаточной корреляции. Эта разница в методиках является следствием теоретических различий.
2.3. Основные теории факторного анализа. На протяжении более полувека предпринимались многочисленные попытки с помощью статистических методов факторного анализа понять природу и организацию способностей, связанных с разнообразной человеческой деятельностью. Тем не менее эти методы до сих пор остаются наиболее тесно связанными с изучением когнитивных способностей, или “интеллекта”, направлением, в рамках которого и зародился факторный анализ. Рассмотрим лишь некоторые широко известные теории интеллекта, выбор которых обусловлен их воздействием на конструирование и использование тестов.
Двухфакторная теория. Первой теорией организации черт, основанной на статистическом анализе показателей тестов, была двухфакторная теория, развитая английским психологом Чарльзом Спирменом (Spearman, 1904; 1927). В своем первоначальном виде эта теория утверждала, что все виды интеллектуальной активности используют долю единого общего фактора, названного генеральным, или фактором g (от англ. general — общий). Кроме того, в теории Спирмена постулировалось наличие многочисленных специфических, или s-факторов (от англ. specific), каждый из которых сказывается на выполнении только одной из интеллектуальных функций. Положительная корреляция между любыми двумя функциями приписывалась, таким образом, действию фактора g. Чем больше эти две функции были “насыщены” (saturated) фактором g, тем выше должна бы быть корреляция между ними. Напротив, присутствие специфических факторов вело к снижению корреляции между функциями.
Несмотря на постулирование Спирменом двух типов факторов – генерального и специфических, фактор g рассматривается в его теории как единственная причина корреляции. Поэтому, в отличие от других теорий связи черт, эту теорию было бы точнее называть однофакторной, однако она сохранила свое первоначальное название. Рис. 2 иллюстрирует основополагающий принцип корреляций тестов согласно этой теории. Из этой схемы видно, что, в соответствии с теорией Спирмена, тесты 1 и 2 должны высоко коррелировать между собой, поскольку каждый сильно насыщен фактором g, о чем свидетельствуют заштрихованные участки. Незаштрихованным частям каждого теста соответствуют специфический фактор и дисперсия ошибок. Тест 3 должен слабо коррелировать с каждым из двух других тестов, поскольку включает очень малую долю фактора g.
Рис. 2. Принципиальная модель корреляции в двухфакторной теории
Согласно двухфакторной теории, целью психологического тестирования должно быть измерение величины фактора g у каждого индивидуума. Если этот фактор пронизывает все способности, тогда он дает нам единственную основу для предсказания результатов деятельности индивидуума в разных ситуациях. Специфические факторы измерять бесполезно, так как каждый из них, по определению, сказывается только на какой-то одной функции. Вот почему Ч.Спирмен предложил заменить разнородную совокупность заданий, встречаемых в тестах интеллекта, единственным, пусть односторонним, тестом, но при этом высоко насыщенным фактором g. Он полагал, что тесты на абстрактные отношения, по всей вероятности, лучше всех других измеряют g и поэтому могут быть использованы для этой цели. Примерами тестов, разработанных для измерения g, являются Прогрессивные матрицы Равена и Культурно-свободный тест интеллекта Кэттелла (Cattell’s Culture Fair Intelligence Test).
продолжение
--PAGE_BREAK--С самого начала Спирмен понимал, что двухфакторная теория нуждается в уточнении. Когда сравниваемые деятельности достаточно похожи, корреляция между ними может достигать величины, превышающей степень связи между переменными, объяснимую действием фактора g. Поэтому в добавление к генеральному и специфическим факторам, вероятно, существует промежуточный класс факторов, не столь универсальных, как g, но и не столь специфичных, как s-факторы. Такой фактор, общий только для группы (а не для всех вообще) интеллектуальных функций, был назван групповым фактором. В первых вариантах своей теории Спирмен допускал возможность весьма узких и пренебрежительно малых групповых факторов. Позднее, под давлением фактов, полученных в исследованиях некоторых его учеников, он стал использовать в своих теоретических построениях гораздо более широкие групповые факторы, такие как арифметические, технические и лингвистические способности.
Многофакторные теории. Преобладавший в американской психологии взгляд на организацию черт, основанный на ранних факторно-аналитических исследованиях, заключался в признании ряда довольно широких групповых факторов, каждый из которых мог входить с разными весами в различные тесты. Например, вербальный фактор мог бы иметь значительный вес в словарном тесте, несколько меньший вес – в тесте словесных аналогий, и еще меньший – в тесте на арифметическое рассуждение. На рис. 3 в наглядной форме представлены интеркорреляции пяти тестов с точки зрения многофакторной модели. Корреляции тестов 1, 2 и 3 друг с другом – следствие их общих нагрузок вербальным фактором (V). Аналогично этому, корреляция между тестами 3 и 5 – результат действия пространственного фактора (S), а между тестами 4 и 5 – числового (N). Тесты 3 и 5 отличаются сложной факторной композицией: каждый имеет существенные нагрузки более чем по одному фактору (тест 3 – по факторам V и S, а тест 5 – по факторам S и N). Обращаясь к рассмотренной в предыдущем разделе основной теореме факторного анализа, мы можем сделать некоторые выводы об относительной величине этих интеркорреляций. Например, тест 3 будет сильнее коррелировать с тестом 5, чем с тестом 2, потому что веса фактора S в тестах 3 и 5 (области с диагональной штриховкой) больше, чем веса фактора V в тестах 2 и 3 (области с горизонтальной штриховкой).
Рис. 3. Принципиальная модель корреляции в многофакторных теориях
Публикация программной книги Т. Келли Crossroads in the mind of man (T.L. Kelly, 1928) подготовила почву для большого числа исследований, нацеленных на выявление групповых факторов. Важнейшими среди предложенного Келли набора факторов были следующие: манипулирование пространственными отношениями, легкость оперирования числами, легкость оперирования словесным материалом, а также память и скорость. Этот перечень был позднее переработан и дополнен исследователями, использовавшими более современные методы факторного анализа, рассмотренные в предыдущем разделе.
Одним из ведущих представителей многофакторной теории был Л.Л. Терстоун. Основываясь на обширных исследованиях, как своих собственных, так и учеников, Терстоун выделил около дюжины групповых факторов, которые он назвал “первичными умственными способностями”. К факторам, чаще всего подтверждавшимся в работах самого Терстоуна и других независимых исследователей (French, 1951; Harman, 1975; Thurstone, 1938; Thurstone, & Thurstone, 1941), относятся следующие:
V. Вербальное понимание (Verbal Comdivhension). Главный фактор в таких тестах, как понимание прочитанного, словесные аналогии, восстановление порядка слов в предложениях, вербальное рассуждение и подбор пословиц. Данный фактор наиболее адекватно измеряется словарными тестами.
W. Беглостьречи(Word Fluency). Выявляется в таких тестах, как анаграммы, подбор рифм или называние слов данной категории (например, мужские имена или слова, начинающиеся с буквы Т).
N. Числовой (Number). Почти полностью отождествляется со скоростью и точностью простых арифметических вычислений.
S. Пространственный (Space). Может представлять собой два разных фактора. Один связан с восприятием фиксированных пространственных или геометрических отношений, другой с манипулированием зрительными образами, при котором изменение положения или трансформацию объекта необходимо представить зрительно (Mc Gee, 1979; Portegal, 1982).
M. Ассоциативнаяпамять(Associative Memory). В основном обнаруживается в тестах, требующих механической памяти на ассоциативные пары. Есть некоторые основания предполагать, что этот фактор может отражать степень использования опор памяти (Christal, 1958), а противоречит существованию более широкого фактора, присутствующего во всех тестах памяти. Некоторые исследования подтверждают наличие ограниченных факторов памяти, таких как память на временные последовательности и положение в пространстве.
Р. Перцептивная скорость (Perceptual Speed). Быстрое и точное зрительное восприятие деталей, сходства и различий. Возможно, это тот же фактор, что и фактор скорости, выявленный Т.Л. Келли и другими предшественниками, по крайней мере, он относится к ряду факторов, идентифицированных позднее в задачах на восприятие (Thurstone, 1944).
I (илиR). Индукция(илиОбщийвывод) – (Induction, or General Reasoning). Этот фактор установлен наименее четко. Терстоун первоначально предположил наличие индуктивного и дедуктивного факторов. Последний лучше всего измерялся тестами на силлогистический вывод, а первый – тестами, требующими от испытуемого найти принцип (правило, закономерность и т.п.), как в тестах на завершение числовых последовательностей. Доказательства наличия дедуктивного фактора оказались, однако, гораздо слабее доказательств в пользу существования индуктивного фактора. Кроме того, некоторые исследователи исходили из предположения, что фактор логического мышления лучше всего измеряется тестами на арифметическое мышление.
Следует отметить, что различия между общими, групповыми и специфическими факторами не столь существенны, как может показаться в первый момент. Если число или разнообразие тестов в батарее невелико, одним общим фактором можно объяснить все корреляции между ними. Но когда те же самые тесты включены в батарею с более разнородным составом тестов, исходный общий фактор может выделиться как групповой, т.е. общий только для некоторых, но не для всех тестов. Аналогично этому, некоторый фактор может быть представлен только одним тестом в исходной батарее, но разделяться несколькими тестами в более крупной батарее. Такой фактор был бы идентифицирован как специфический в первой батарее, но оказался бы групповым в более полной, комплексной батарее. Поэтому вряд ли нужно удивляться, что интенсивные факторные исследования специальных областей выявили множество факторов вместо одной или двух первичных умственных способностей, первоначально идентифицированных в каждой такой области. Именно это и произошло в исследованиях вербальных и перцептивных тестов, тестов памяти и тестов на логическое рассуждение.
Складывается впечатление, что факторные исследования привели к ошеломительному “размножению” факторов. Число когнитивных факторов, описанных на сегодняшний день различными исследователями, перевалило за 100. Относительного порядка в этой сфере удалось достичь путем перекрестной идентификации факторов, описанных разными исследователями и зачастую под разными названиями (Ekstrom, French, & Harman, 1979; French, 1951; Harman, 1975). Такую перекрестную идентификацию можно выполнить только в тех случаях, когда в сравниваемых исследованиях используется ряд общих тестов.
Очевидно, что даже после всех попыток упростить ситуацию и согласовать действия исследователей в области изучения способностей методами факторного анализа, число факторов остается большим. Человеческое поведение изменчиво и сложно, и, по-видимому, наивно ожидать, что его можно адекватно описать с помощью дюжины или около того факторов. Но для конкретных целей можно подобрать подходящие факторы в отношении как их природы, так и их широты. Так, если бы мы отбирали кандидатов для трудной и высокоспециализированной работы технического характера, то, вероятно, захотели бы измерить у них довольно узкие факторы восприятия и пространственных отношений, наиболее отвечающие требованиям будущей работы. С другой стороны, при отборе студентов, мы бы отдали явное предпочтение нескольким широким факторам, таким как вербальное понимание, легкость оперирования числами и умение делать общие выводы.
Иерархические теории. Альтернативная схема организации факторов была предложена рядом английских психологов, включая С. Берта (Burt, 1949) и Ф. Вернона (Vernon, 1960) и американцем Л. Хамфрейсом (Humphreys, 1962). Схема, поясняющая применение Верноном этого подхода, воспроизведена на рис. 4. На вершине иерархии Вернон поместил спирменовский фактор g. На следующем уровне – два широких групповых фактора, соответствующих вербально-образовательным (v:ed) и практико-техническим способностям (р:m). Эти главные факторы можно далее подразделить на несколько второстепенных. Вербально-образовательный фактор, например, дает среди прочих вербальный и числовой субфакторы, а практико-технический разделяется на такие субфакторы, как технической осведомленности, пространственный и психомоторных способностей. Еще более узкие субфакторы можно выделить в ходе последующего анализа, скажем, вербальных заданий. На самом нижнем уровне иерархии находятся специфические факторы. В более поздний, уточненный вариант этой модели Вернон (Vernon, 1969) включил более сложные взаимосвязи и перекрестные вклады факторов на третьем уровне, особенно в том, что касается образовательных и профессиональных достижений. К примеру, научные и технические способности связаны в этой модели с пространственными способностями и технической осведомленностью; математические способности – с пространственными и числовыми, а также, почти напрямую, с фактором g (через фактор индукции).
Общий фактор (g)
Главные
групповые Вербально- Практический (р:m)
факторы образовательный (v:ed)
Второстепенные
групповые
факторы Вербаль- Техни- Простран- Психо-
осведомленности ный Числовой ческий ственный моторный
Специфические
факторы П П П П П П П П
Рис. 4. Модель иерархической организации способностей
Л. Хамфрейс (Humphreys, 1962, 1970) также рекомендовал иерархическую модель в качестве средства, позволяющего справиться с разрастанием факторов. Однако вместо того, чтобы считать какой-то один уровень факторов главным (или первичным), он предлагал составителям или пользователям тестов выбирать тот уровень иерархии, который наиболее соответствует их целям. Кроме того, Хамфрейс признавал, что один и тот же тест, в зависимости от содержания, процесса и других аспектов, может быть внесен более чем в одну иерархию. По его мнению, чтобы измерить какой-нибудь один аспект, нужно сделать тест гетерогенным относительно всех остальных аспектов. Если, например, нас интересует способность человека решать задачи на аналогии, то следует воспользоваться тестом, содержащим вербальные, числовые, рисуночные и пространственные аналогии. Если же мы хотим измерить вербальную способность, нам следует использовать разнообразные типы заданий, такие как определение слов, аналогии и завершение рядов. Эта методика отличается от той, которой пользовался Гилфорд, искавший отдельные факторы (и тесты) для каждой гомогенной ячейки своей трехмерной классификации. Однако в своей более поздней работе Гилфорд (Guilford, 1981) применил схему частичной иерархической организации при идентификации факторов высшего порядка среди некоторых факторов, входящих в его оригинальную модель структуры интеллекта.
Иерархическая модель интеллекта получает все более широкое признание как по теоретическим, так и по практическим соображениям. Как теоретическая модель связи черт она совмещает единственный общий фактор (g Спирмена) с многофакторными отображениями. В методологическом плане было доказано, что многофакторные и иерархические решения математически эквивалентны и допускают преобразование одного в другое (Harman, 1976; chap.15; Schmid, & Leiman, 1957). Косоугольное решение (с коррелируемыми факторами), которое приводит к иерархической модели, можно преобразовать в ортогональное решение (с некоррелируемыми факторами). В ортогональном решении факторы второго порядка выделяются как факторы первого порядка иной широты. Более широкие факторы имеют нагрузки по большему числу переменных, чем менее широкие.
С практической точки зрения, главное преимущество тестов, разработанных исходя из иерархической модели, состоит в том, что они сочетают всесторонний охват способностей с гибкостью использования. Сообразуясь с различными целями тестирования, пользователь может выбрать один суммарный показатель батареи либо один или несколько показателей по кластерам тестов, измеряющим более узко определяемые факторы. При определенных обстоятельствах показатели по отдельным субтестам могут оказаться полезными, например, в том, что касается выявления слабости или силы специализированных навыков.
Следует помнить, что выявляемые с помощью факторного анализа черты – это не более чем выражение корреляций между мерами поведения. К ним следует относиться не как к первоэлементам или причинным факторам, а как к описательным категориям. Отсюда понятно, что различные принципы классификации могут применяться к одному и тому же набору данных.
Каков бы ни был механизм их формирования, факторы, или способности, идентифицируемые с помощью факторного анализа, представляют собой описательные категории, отражающие изменяющиеся взаимосвязи характеристик деятельности в разнообразных ситуациях. Эти факторы есть не застывшие сущности, а продукт накапливаемого человеком жизненного опыта. И коль скоро структура опыта варьирует у отдельных людей или их групп, разумно ожидать появления различных факторных отображений. По мере трансформации опыта конкретного человека – вследствие образования, выполнения профессиональных обязанностей или других продолжительных видов деятельности – могут появляться новые черты, а ранее существовавшие – сливаться в более широкие комплексы.
3. Применение факторного анализа на практике
3.1. Требования к организации факторного анализа.
В работе исследователя по конструированию психодиагностического теста можно выделить три основных этапа:
1) формирование “чернового” варианта теста;
2) выбор диагностической модели и определение ее параметров;
3) стандартизация и испытание построенной диагностической модели.
Под диагностической моделью понимается способ компоновки (преобразования) исходных диагностических признаков (вариантов ответов на задания теста) в диагностический показатель. Таких способов может быть бесконечное множество.
Для определения параметров диагностической модели используются различные методы эмпирико-статистического анализа данных. В частности, если во множество исходных признаков входят несколько взаимосвязанных признаков, то одну или сразу несколько диагностических моделей можно получить, используя методы факторного анализа.
Факторный анализ является сложной процедурой. Как правило, хорошее факторное решение (достаточно простое и содержательно интерпретируемое) удается получить по меньшей мере после нескольких циклов ее проведения – от отбора признаков до попытки интерпретации после вращения факторов. Для того чтобы прийти к нему, надо соблюдать немало требований. Назовем основные.
1) Переменные должны быть измерены, по крайней мере, на уровне шкалы интервалов (по классификации Стивенса). Многие переменные, такие как меры отношений и мнений в социологии, различные переменные при обработке результатов тестирования, не имеют точно определенной метрической основы. Тем не менее предполагается, что порядковым переменным можно давать числовые значения и включать в факторный анализ.
2) Не следует включать дихотомические переменные. Но если цель исследования состоит в нахождении кластерной структуры, использование факторного анализа к данным, содержащим дихотомические переменные, оправданно.
3) Отбирая переменные для факторного анализа, следует учесть, что на один искомый фактор должны приходиться не менее трех переменных.
продолжение
--PAGE_BREAK--4) Для хорошо обоснованного окончательного решения необходимо, чтобы число испытуемых было в три или более раз больше, чем число переменных, в совокупности которых определяется окончательное факторное решение. Впрочем, это требование не является общепринятым. Поскольку количество испытуемых увеличить труднее по ходу обработки, то следует отобрать столько переменных, чтобы их число не превышало одной трети от числа испытуемых.
Для разведочного компонентного или факторного анализа это требование соблюдать не обязательно, но надо помнить, что чем сильнее оно нарушено, тем менее точны результаты. Это означает, что если сбор данных будет проведен на другой выборке, то получится новое факторное решение, которое лишь отчасти будет схоже с тем, которое получено на имеющейся выборке. Следовательно, делаемые выводы не носят общего характера, их нельзя распространять на другие случаи.
5) Не имеет смысла включать в факторный анализ переменные, которые имеют очень слабые связи с остальными переменными. С большой вероятностью они будут иметь малую общность и не войдут ни в один фактор. Если в работе не стоит задача сформировать шкалу вопросника на основе факторного анализа или какая-либо аналогичная задача, то не следует также включать все переменные, имеющие друг с другом очень тесные связи. Скорее всего, они образуют один фактор. Чем больше таких переменных включается в факторный анализ, тем больше вероятность того, что они образуют первый фактор и к нему присоединится большинство остальных переменных.
6) Устойчивость выявленной факторной структуры (ее неслучайность) тем меньше, чем больше составляющих ее факторов. Она также неустойчива при малом количестве испытуемых. В четвертом пункте обсуждалось достаточное количество испытуемых.
Итак, основные этапы факторного анализа:
1) сбор эмпирических данных и подготовка корреляционной (ковариационной) матрицы;
2) выделение первоначальных (ортогональных) факторов;
3) вращение факторной структуры и содержательная интерпретация результатов факторного анализа.
Второй этап – это прежде всего выбор метода факторного анализа. Назовем наиболее используемые из них в психологии.
Метод главных компонент. В данном методе поиск решения идет в направлении вычисления собственных векторов (факторов), а собственные значения характеризуют дисперсию (разброс) по факторам.
Метод главных факторов. Для определения числа факторов используются различные статистические критерии, при помощи которых проверяется гипотеза о незначительности матрицы корреляционных остатков.
Метод максимального правдоподобия (Д. Лоли), в отличие от предыдущего, основывается не на предварительной оценке общностей, а на априорном определении числа общих факторов и в случае большой выборки позволяет получить статистический критерий значимости полученного факторного решения.
Метод минимальных остатков (Г. Харман) основан на минимизации внедиагональных элементов остаточной корреляционной матрицы; проводится предварительный выбор числа факторов.
Альфа-факторный анализ был разработан специально для изучения психологических данных; выводы носят в основном психометрический, а не статистический характер; минимальное количество общих факторов оценивается по собственным значениям и коэффициентам общности. Факторизация образов, в отличие от классического факторного анализа, предполагает, что общность каждой переменной определяется как линейная регрессия всех остальных переменных.
Перечисленные методы отличаются по способу поиска решения основного уравнения факторного анализа. Выбор метода требует большого опыта работы. Однако некоторые исследователи используют сразу несколько методов, выделенные же во всех методах факторы считают наиболее устойчивыми.
Третий этап – это “поворот” факторов в пространстве для достижения простой структуры, в которой каждая переменная характеризуется преобладающим влиянием какого-то одного фактора. Выделятся два класса вращения: ортогональное и косоугольное. К ортогональным методам относятся методы “Varymax” (Kaiser, 1958) – максимизируется разброс квадратов факторных нагрузок по каждому фактору в отдельности, что приводит к увеличению больших нагрузок и уменьшению – маленьких. “Quartymax” — простая структура; в отличие от предыдущего метода формируется для всех факторов одновременно. В некоторых случаях важнее получить простую структуру, чем сохранить ортогональность факторов. Для достижения этого используются аналогичные методы косоугольного поворота: “Oblymin” и “Oblymax”.
Все описанные выше модели факторного анализа относятся к эксплораторному (поисковому) факторному анализу. Настоящим переворотом в факторном анализе было изобретение конфирматорного (подтверждающего) факторного анализа (КФА). Основной принцип КФА: в качестве гипотезы формируется структура ожидаемой матрицы факторных нагрузок (весов), которая затем накладывается на заданную корреляционную матрицу. Гипотеза подвергается статистической проверке, и постепенно исследователь приходит к соответствующей экспериментальным данным матрице нагрузок, не прибегая к вращению факторов. Однако гипотеза должна основываться на серьезном анализе природы изучаемых переменных и лежащих в их основе факторов. Часто для этого проводится предварительно эксплораторный факторный анализ. В качестве математического аппарата в данной модели используется моделирование с помощью линейных структурных уравнений.
Метод КФА позволяет оценить валидность тестов (конструктную, дискриминантную, конвергентную). Использование множества индикаторов для каждого латентного конструкта дает возможность представить степень, с которой каждая переменная объясняет латентную переменную. Остаточная дисперсия обусловлена случайными колебаниями. С помощью параметров измерительной модели определяется внутренняя согласованность теста, по которой можно говорить об уровне надежности измерения. Моделирование с помощью латентно-структурных уравнений позволяет проводить также анализ данных лонгитюдного исследования с множественными индикаторами (K. Joreskog, 1979, 1988).
При интерпретации факторов можно начать работу с того, что выделить наибольшие факторные нагрузки в данном факторе. Для выделения можно использовать приемы, аналогичные выделению значимых коэффициентов корреляции, то есть оценивать факторные нагрузки, сравнивая их по величине с критическими значениями коэффициентов корреляции. Для подбора названий факторов нет формализованных приемов, здесь можно довериться интуиции. В качестве предварительного варианта можно использовать имя переменной, которая вошла в фактор с наибольшей нагрузкой.
3.2. Разработка психодиагностического теста с применением факторного анализа на примере опросника “Шестнадцать личностных факторов (16PF)” Р.Кэттелла.
Приложение факторного анализа к разработке личностных опросников в так называемой “лексической” традиции /1, с.396/ можно обнаружить в работе, начатой Р. Кэттеллом в 1940-х гг.
В разработке опросника “Шестнадцать личностных факторов” Р. Кэттелл первоначально исходил из так называемых L-данных (life record data), т.е. данных, полученных путем регистрации реального поведения человека в повседневной жизни. Пытаясь добиться исчерпывающего описания личности, он стал собирать все названия черт личности, встречающиеся или в специальном словаре, или в психиатрической и психологической литературе. Выделенные Г. Олпортом и Х. Олдберг 4500 слов, ясно обозначающих черты личности и особенности поведения (на базе словаря из 18000 слов), Р. Кэттелл разбил на синонимичные группы и отобрал в каждой из них по одному слову, выражающему основное смысловое содержание соответствующей группы. Это позволило сократить список личностных черт до 171. Затем каждая из этих характеристик личности оценивалась экспертами с целью выбора наиболее значимых.
Взаимная корреляция экспертных оценок позволила выделить 36 корреляционных плеяд, внутри которых расположились высококоррелирущие характеристики. Все плеяды содержали пары членов, имеющие значимые отрицательные корреляции, например: веселый – печальный, разговорчивый – молчаливый и т.д. Так был получен набор из 36 биполярных названий, который был расширен до 46 за счет включения специальных терминов, найденных в работах других исследователей. Для всех биполярных пар были составлены рабочие определения. Например:
Эмоциональный
Стабильный
Всегда аффектированный, возбуж-денный, много смеется, часто бывает сердит, проявления эмоций отличаются чрезмерной выразительностью.
Эмоциональная выразительность отсутствует, диапазон эмоциональных проявлений мал, сохраняет спокойствие даже в эмоциогенных ситуациях
В результате факторизации L-данных было получено от 12 до 15 факторов. В дальнейшем Р. Кэттелл осуществил переход (обусловленный трудностями экспертного оценивания) к Q-данным (questionnaire data), т.е. данным, полученным с помощью опросников. При этом сбор Q-данных координировался с имеющимися L-данными. Р. Кэттеллом созданы разные модификации факторных моделей с различным числом входящих в них факторов, однако наиболее известной является 16-факторная, соотнесенная с опросником “Шестнадцать личностных факторов”.
Факторы личности, диагностируемые опросником “Шестнадцать личностных факторов”, обозначаются буквами латинского алфавита, причем буква “Q” используется только для тех факторов, которые выделены на основе Q-данных. Факторы имеют “бытовые” и “технические” названия. Первые представляют собой общедоступные определения, ориентированные на непрофессионалов. Например, фактор А – “сердечность, доброта – обособленность, отчужденность”. Технические названия предназначены для специалистов и тесно связаны с научно установленным значением фактора. При этом часто используются искусственно созданные названия: например, тот же фактор А будет определяться как “аффектотимия — сизотимия”. Как бытовые, так и технические названия факторов даются в биполярной форме, чем устраняется двусмысленность в определении их содержания. Следует иметь в виду, что определение концов оси фактора как положительных (+), так и отрицательных (-) условно и не имеет ни этического, ни психологического смысла. Обычно описание каждого фактора (см. приложение 1)у Р. Кэттелла состоит из разделов:
а) буквенный индекс фактора; разработана также система универсальной индексации, включающая сведения о принципе выделения того или иного фактора и его порядковом номере;
б) техническое и бытовое название;
в) список наиболее значимых характеристик в L-данных;
г) интерпретация фактора.
Рассмотренные выше факторы – первого порядка. В итоге их дальнейшей факторизации были выделены более общие факторы второго порядка. Р. Кэттелл неоднократно “извлекал” вторичные факторы из корреляций между первичными. В разных работах автора представлено от четырех до восьми вторичных факторов. Предпринимались попытки получения факторов третьего порядка, однако практического значения результаты не имеют (рис.5).
18000 терминов, описывающих личность
¯ Грамматический и семантический
4500 наименований черт анализ (Олпорт и Олдберг, 1936)
¯
171 группа синонимов Семантический анализ (Кэттелл, 1946)
¯
46 поверхностных черт Статистический анализ, метод корреля-
¯ ционных плеяд (Кэттелл, 1946, 1957)
20 факторов первого порядка Факторный анализ (Кэттелл, 1946, 1957)
¯
9 факторов второго порядка Факторный анализ (Кэттелл, 1957, 1969)
¯
5 факторов третьего порядка Факторный анализ (Кэттелл, 1969, 1973)
¯
Рис. 5. Исследовательская стратегия, использованная при разработке опросника “Шестнадцать личностных факторов.
Р. Кэттеллом и его сотрудниками, помимо двух основных форм опросника “16PF” (А и В, по 187 вопросов в каждой, для обследования взрослых людей с образованием не ниже 8-9 классов; форма А считается стандартной), разработаны также формы С, D, E. Формы С и D сокращенные, по 105 заданий, и предназначены для лиц, имеющих более низкий уровень образования. Форма Е используется для обследования малограмотных лиц. Известны варианты опросника для детей и подростков. Существует специальное “патологическое” дополнение к опроснику, которое состоит из 12 клинических факторов-шкал. Возможно групповое обследование.
В пятой редакции опросника (только одна форма, содержащая 185 вопросов) внутренняя согласованность и ретестовая надежность шкал для 16 первичных факторов выше, чем в его более ранних редакциях. Техническое руководство к пятой редакции содержит также гораздо больше сведений о валидности. Однако проблема отсутствия факторной независмости 16 первичных шкал, очевидная в ранних редакциях опросника, сохраняется, по всей видимости, и в его последней редакции. Эта проблема подчеркивается неспособностью исследователей, использовавших оригинальные переменные Кэттелла, воспроизвести его 16 факторов или получить хотя бы близкое факторное решение. Вместо этого в большинстве исследований, использующих данные, на которых Кэттелл построил свою систему, было выявлено от 4 до 7 факторов, что привело впоследствии к наиболее популярному 5-факторному решению.
Отмечая недостатки подхода Р. Кэттелла к исследованию личности, Л.Ф. Бурлачук и С.М. Морозов делают вывод о том, что “Р. Кэттелл принял факторный анализ за гораздо более эффективный инструмент познания личности, чем он фактически является” /2, с.379/.
Заключение
В настоящее время методы факторного анализа составляют сложную специальную область математической статистики. В психологической диагностике факторный анализ широко используется как для решения исследовательских задач, так и при конструировании психодиагностических методик.
Факторный анализ является эффективным средством получения короткого описания взаимоотношений между параметрами при среднем числе параметров и, кроме того, в несколько модифицированном виде служит одной из основных составляющих лингвистических методов обработки экспериментальных данных с большим числом параметров.
Многочисленные экспериментальные исследования, в частности по обработке психологических, социологических, экономических и других данных, показали, что определяемые факторы, как правило, хорошо интерпретируются как некоторые существенные внутренние характеристики изучаемых объектов. Таким образом, факторный анализ оказался эффективным формальным средством генерации новых понятий и гипотез в самых различных науках.
В настоящее время факторный анализ все чаще используется в роли подтверждающего, чем исследовательского метода. Нередко его сочетают с моделированием структурными уравнениями для оценивания теоретически сформулированной модели вклада различных переменных в выполнение задачи.
Слабое место традиционного факторного анализа – в недостаточном внимании к выбору анализируемых переменных.
Поскольку конечным результатом методов факторного анализа является, как правило, получение содержательно интерпретируемых факторов, то при решении практических задач факторный анализ в настоящее время является еще в большой мере искусством, овладение которым требует некоторого опыта.
Как указывалось выше, основная задача факторного анализа состоит в экономном описании экспериментальных данных. Это вовсе не означает, что всегда методами факторного анализа ищут “фундаментальные”, “базисные” категории (факторы) в данной области, например, в психологии. Иногда бывает необходимо по возможности наиболее полно проанализировать набор параметров, характеризующих умственные способности некоторой популяции. Но даже и в этом случае факторы не могут полностью описать ситуацию хотя бы потому, что некоторые важные параметры попросту еще не придуманы. Теоретически задача исчерпывающе полного описания неразрешима; однако в практическом исследовании с ограниченным кругом решаемых вопросов и небольшим числом рассматриваемых параметров она разрешима вполне. Нужно только помнить, что факторный анализ дает всегда интерпретацию лишь данного экспериментального материала и, следовательно, сокращенное описание лишь данного набора параметров.
Главную цель факторного анализа хорошо выразил Келли: “Факторный анализ не пытается искать истину в бесконечном времени, бесконечном пространстве или для бесконечной выборки; наоборот, он стремится дать простое описание конечной группы объектов, функционирующих конечным числом способов, в терминах некоторого пространства небольшого числа измерений. Разочарован будет тот, кто пожелает найти в факторном анализе более туманные цели и истины”/20, с.16/.
продолжение
--PAGE_BREAK--