Проблема валидности эксперимента в психологии
Необходимость более тесной интеграции теоретических и прикладных исследований в психологии, интенсивного развития практической психологии [11, 12], наконец, наблюдающийся в последние годы существенный прогресс как философской [19], так и специальной [24] методологии научного познания, в том числе в области психологии [17], —все это побуждает со всей тщательностью, во многом с более совершенных методологических позиций проанализировать состояние ее методического арсенала. Метод эксперимента привлекает внимание в этой связи в силу двух обстоятельств. С одной стороны, для психологической науки этот метод был и остается основным инструментом получения эмпирических данных, проверки теоретических гипотез [16].
С другой стороны, по мере того как сфера применения лабораторного эксперимента все более расширялась, далеко выйдя за первоначальные рамки общей психологии, данный метод подвергался возрастающей критике. Ее лейтмотив—неудовлетворенность степенью научной достоверности и практической ценности знания, обеспечиваемых данным методом.
Примером критики первого из этих недостатков может служить анализ модельной природы лабораторного эксперимента, проведенный А. Чапанисом (A. Chapanis). Взяв в качестве примера ряд исследований по проблеме бдительности оператора, он делает следующее обобщение:
“Всякий лабораторный эксперимент —лишь модель реальной жизни, причем модель, которая всегда является неполной, а значит, и неверной [29, с. 561]. Неадекватность эксперимента как модели, отмечает далее {117} Чапанис, обусловливается, как правило, еще двумя обстоятельствами: во-первых, типичным для лабораторного эксперимента рандомизированным предъявлением стимулов (в реальной жизни стимулы обычно воспринимаются в контекстных и последовательностных рамках) и, во-вторых, прежде всего повышенной, по сравнению с условиями“реальной жизни”, частотой воспроизведения аварийных ситуаций и других стрессовых воздействий. Наконец, ко всему этому можно добавить часто встречающиеся в литературе сетования на неудовлетворительную репрезентацию исследуемой популяции, на влияние разного рода артефактов, в особенности установок предвзятости, носителями которых часто оказываются не только испытуемые, но и сам экспериментатор [9, 15, 16, 25].
В отношении критики второго главного недостатка рассматриваемого метода весьма показательной является статья Е. Г. Чемберса (Е. G. Chambers) [28]. Исходя из того что быстро развивающаяся автоматизация производства выдвигает в число актуальных практических задач проблему перманентного“переучивания”кадров, автор задался целью выяснить, сколь полезным могут быть в этом отношении результаты многочисленных лабораторных исследований по так называемому переносу научения—одной из традиционных проблем общей психологии. Проанализировав имевшуюся в то время (середина 50-х годов) весьма обширную литературу, Чемберс пришел к неутешительному выводу: несмотря на возможную научную значимость, исследования, проведенные по данной проблеме, в подавляющем большинстве не могут быть использованы для решения указанной задачи. Главная причина—крайне упрощенный и искусственный характер тех заданий, которые предлагаются испытуемым в такого рода исследованиях (например, усвоение парных словесных ассоциаций, формирование навыка нажатия на кнопку при появлении определенного сигнала и т. п. ).
Таким образом, налицо определенные признаки кризисной ситуации: с одной стороны, констатируется“непрактичность”многих лабораторных экспериментов, проведенных в русле общепсихологического исследования, а с другой—ставится под сомнение возможность адекватного моделирования в прикладном лабораторном эксперименте тех аспектов профессиональной деятельности, которые составляют предмет непосредственного интереса со стороны практики. Учитывая сказанное, нельзя не согласиться с выводом Б. Ф. Ломова о том, что“разработка теории психологического эксперимента является сейчас одной из наиболее острых задач, в решении которой заинтересованы так или иначе все отрасли психологии” [18, с. 33].
Успех в решении данной задачи, естественно, возможен лишь при ориентации на соответствующие положения марксистско-ленинской философской методологии. Здесь прежде всего необходимо принять во внимание замечание К. Маркса о том, что“.... не только результат исследования, но и ведущий к нему путь должен быть истинным”[1]. Не случайно во многих работах по философской и специальной методологии научного познания подчеркивается, что в становлении и развитии знания, взятом как относительно самостоятельный процесс, важную роль наряду с критерием общественно-исторической практики призваны сыграть и“внутринаучные критерии обоснования знания, в частности логические формы доказательства”. Их роль тем значительнее, что и сам по себе критерий практики (одной из основных форм которой является, как известно, эксперимент)“включается в познание посредством получаемых в итоге его применения понятий, суждений, умозаключений, где логическая правильность операций мышления выступает в качестве одного из обязательных условий истинности выводов” [20, с. 338]. В качестве одного из таких критериев внимание психологов в последние годы во все возрастающей степени привлекает валидность исследовательской {118} (в первую очередь экспериментальной) методики. Существуют различные типы и виды этого критерия, каждый из которых используется для характеристики определенного аспекта исследовательской конструкции [5]. Однако мы ограничим свой анализ рассмотрением лишь типов валидности, поскольку именно с ними связана возможность совершенствования того или иного метода. Это—валидность содержательная и валидность экологическая (практическая). Первый из этих типов можно определить как степень соответствия между, с одной стороны, предметом исследования и содержанием получаемого результата, которые приписываются экспериментальной методике ее автором, и, с другой стороны, тем, что она фактически представляет собой в этих отношениях. Второй тип валидности характеризует методику с точки зрения практической применимости даваемого ею знания (на что и указывает соответствующий термин— “практическая”). Пользуясь только что обозначенными понятиями, можно сказать, что А. Чапанис фактически обвинил лабораторный эксперимент в низкой содержательной валидности, тогда как Е. Г. Чемберс—в отсутствии валидности практической. Попутно укажем на взаимосвязь, существующую между этими типами: первый является необходимым, но не достаточным условием второго; вместе с тем отсутствие у методики практической валидности во многих случаях (но отнюдь не всегда) может служить основанием для более глубокого анализа ее содержательной валидности. Отсюда следует, что применение критерия валидности—это не что иное, как один из важнейших механизмов того критико-рефлексивного отношения к своим задачам и средствам их решения, которое столь характерно для современного этапа развития научного познания [24].
Не случайно поэтому в последние годы авторы экспериментальных исследований в области психологии при характеристике применявшейся методики и оценке ее эффективности довольно часто обращаются к критерию валидности, причем как в содержательном, так и в практическом ее аспектах. Однако эта положительная тенденция в значительной мере тормозится его недостаточной разработанностью. Весьма фрагментарные и разрозненные описания данного критерия, содержащиеся в новейших публикациях по конструированию психологического эксперимента [9, 15, 27, 31], не только не устраняют, но, наоборот, подчеркивают необходимость специального, систематического анализа данной проблемы. Предпринимая попытку в этом направлении, остановимся вначале на факторах, определяющих содержательную валидность экспериментальной методики, а затем коснемся вопросов, связанных с экологической валидностью. УСЛОВИЯ, ОБЕСПЕЧИВАЮЩИЕ СОДЕРЖАТЕЛЬНУЮ ВАЛИДНОСТЬ
Экспериментальная гипотеза как системообразующий фактор. В гносеологическом плане эксперимент выступает прежде всего как один из тех главных“стыков”, где два основных звена общей цепи познания — теория и практика —входят в непосредственное соприкосновение и взаимодействие друг с другом. При этом теоретическое звено представлено экспериментальной гипотезой, практическое—процедурой и результатами ее экспериментальной проверки. В отличие от исторического процесса человеческого познания, примат в котором во всех отношениях принадлежит общественной практике [20], в рамках отдельного научного эксперимента роль основы и системообразующего фактора отводится теоретической гипотезе. Она конституирует не только всю структуру конкретной методики, но в некоторых случаях (когда выдвигается достаточно весомое теоретическое положение или методологический принцип) и сам экспериментальный метод в целом. {119} Последнее можно проиллюстрировать, сославшись на хорошо известный факт усовершенствования С. Л. Рубинштейном и его сотрудниками метода естественного эксперимента. Напомним, что в своей первоначальной форме этот метод строился на исключении каких-либо целенаправленных воздействий на ребенка со стороны экспериментатора—считалось, что лишь при этом условии может быть достигнут желанный эффект естественности. Однако С. Л. Рубинштейн, исходя из теоретической концепции о развитии ребенка в условиях обучения и воспитания под влиянием определенным образом организованных воздействий, выдвинул совершенно новый методический принцип, согласно которому построенное по типу педагогического процесса воздействие вполне естественно [3]. На этом принципе основаны широко используемые в наше время методики формирующего (обучающего или воспитывающего) эксперимента.
Экспериментальная гипотеза может считаться психологически содержательной, если в ее основу положено теоретическое понятие, соответствующее современному уровню развития науки и отражающее те психические феномены, которые должны выступать в предстоящем исследовании в роли промежуточных переменных. Иными словами, необходимо, чтобы в гипотезе были указаны, причем как можно более дифференцированно, те психические процессы или состояния, которые, с одной стороны, провоцируются или изменяются в количественном отношении под влиянием независимой переменной (т. е. фактора, планомерно изменяемого экспериментатором с целью выяснить его влияние на психику и поведение испытуемых), а с другой—непосредственно детерминируют те или иные значения зависимых переменных, находя в них, таким образом, свое внешнее проявление (при этом в роли зависимых переменных могут выступать скорость выполнения экспериментального задания, количество допущенных при этом ошибок, латентное время ответа и т. п. ). Независимо от того, презентированы ли в какой-либо форме сознанию испытуемого соответствующие психические процессы или состояния, теоретическое понятие, в котором они отражены, выступает в исследовании в качестве средства для объяснения зафиксированных изменений зависимых переменных.
К сожалению, далеко не во всех экспериментальных исследованиях промежуточные переменные эксплицированы должным образом.
Яркий пример тому —зарубежные работы, посвященные применению функциональной музыки на производстве. Как показал специальный анализ [7], музыка в этих исследованиях рассматривается всего лишь как фоновый, ритмически организованный звуковой раздражитель, оказывающий на работающих сугубо физиологическое воздействие. Односторонность такого понимания функциональной музыки, нс учитывающего ее художественной содержательности и упрощающего структуру перцептивного процесса при полном игнорировании его мыслительного и эмоционального компонентов, проявилась, в частности, в тенденции исключать из соответствующих программ произведения с поэтическим словесным текстом, не принимать во внимание при составлении этих программ вкусы и пожелания самих рабочих.
В методическом плане все это означало искажение фактического содержания промежуточной переменной, т. е. содержательную невалидность указанных исследований. В методологическом же отношении здесь имеет место ошибка, на которую специально обратил внимание исследователей М. Г. Ярошевский. Сущность ее состоит в том, что нераздельность физиологического и психического в деятельности целостного организма как объекта исследования как бы переносится на его предмет. Это приводит к гипертрофии роли физиологического при недооценке или полном игнорировании функции психического, т. е. , по сути, к физиологическому редукционизму [26, с. 11].
Успешная попытка “развести”психологические и физиологические факторы, выполняющие роль промежуточных переменных, была предпринята в свое время Е. А. Деревянко при исследовании динамики утомления [10]. На материале лабораторного эксперимента убедительно показано, что в детерминации продуктивности работы физиологические потенции и профессиональный опыт индивида опосредуются его способностью {120} к эмоционально-волевому напряжению; хотя последняя в свою очередь в значительной степени зависит от нейрофизиологических особенностей организма, тем не менее ее уровень во многом определяется такими сугубо психологическими факторами, как отношение к труду, чувство ответственности и т. п.
Другим примером такого рода может служить проведенное нами совместно с В. Г. Лоосом исследование, направленное на оптимизацию режима труда и отдыха на конвейерно-поточных линиях [8]. Производственный эксперимент был построен таким образом, чтобы эффект, вызываемый сугубо психологическим фактором осознания рабочими своей регулирующей роли по отношению к скорости движения конвейерной ленты, можно было оценить изолированно от воздействий физиологического характера, оказываемых на человеческий организм фактическим изменением темпа работы в соответствии с кривой работоспособности.
Что касается проверяемости экспериментальной гипотезы, то необходимо, чтобы логический объем каждого из входящих в ее состав понятий (а значит, и объем выводов, формулируемых в результате исследования) полностью репрезентировался независимыми и зависимыми переменными, используемыми в данном исследовании. Если же в описании в качестве промежуточных переменных фигурируют, как это нередко случается, максимально обобщенные наименования психических процессов и состояний (такие, как“восприятие”, “внимание”, “память”, “стресс”и т. п. ), то это делает его маловалидным. Ведь ни одна методика не может представить исследуемый психический процесс в столь широком разнообразии типов и видов, чтобы такого рода тотальные наименования оказались правомерными. Поэтому промежуточные переменные должны быть специфицированы со всеми ограничениями, вытекающими из конкретных особенностей как стимульного материала, с которым имеет дело испытуемый, так и применяемых в данном эксперименте зависимых переменных.
Независимые переменные как психологические модели ситуаций “реальной жизни”. В этом вопросе полезно выделить два взаимосвязанных аспекта: 1) репрезентацию исследуемого фактора per se; 2) представление его взаимосвязей с другими факторами исследуемой реальности.
В отношении первого аспекта возможны различные решения: а) данный фактор воспроизводится в эксперименте в его натуральном виде; б) при его репрезентации используются приемы ограничения, сокращения, технической замены и обогащения; в) данный фактор отображается в эксперименте по методу психологического замещения—имитационного, изобразительно-символического или комбинированного [б]. Какой из указанных подходов следует предпочесть в том или ином конкретном случае, зависит от многих обстоятельств. Однако для создания валидной методики всегда необходимо обеспечить тождественность психических процессов и состояний, провоцируемых, с одной стороны, в естественных и, с другой— в экспериментальных условиях [6]. Что касается второго из названных аспектов, то определенная аналитичность репрезентации реальной действительности в лабораторном эксперименте не просто допустима—она составляет его неотъемлемую черту. Все зависит от того, какие именно связи исследуемого фактора не представлены в лабораторной ситуации. Несущественные, случайные, несомненно, могут быть опущены без какого-либо ущерба для валидности планируемого эксперимента. Для репрезентации же существенных связей следует воспользоваться одним из вариантов факторного планирования [25]. Таким образом, нельзя согласиться с мнением Чапаниса, будто присущая эксперименту неполная репрезентация исследуемой реальности неминуемо является вместе с тем репрезентацией“неверной”. Аналогичных {121} переменных. Такого рода непредвиденное воздействие (именуемое с тех пор“эффектом Хоторна”) может быть легко обнаружено и соответствующим образом учтено, если в дополнение к экспериментальной группе в аналогичном помещении будет работать контрольная группа испытуемых. Однако в данном случае это сделано не было, и эксперимент, замышлявшийся как модель типичной производственной ситуации, в действительности представлял собой лишь квазимодель.
Средством избежать искажающего влияния артефактов является и их предупреждение путем создания такой экспериментальной конструкции, которая во всех отношениях носила бы“естественный” характер. Успешный опыт проведения таких экспериментов существует. Мы имеем в виду проведенное еще в 20-х годах под руководством Э. Заксенберга лабораторное исследование влияния скорости движения конвейера на производительность труда при выполнении различных видов физической работы [13].
Выбор и регистрация зависимых переменных. Главная проблема, которая встает здесь перед исследователем, — добиться того, чтобы, говоря словами С. Л. Рубинштейна, “внешнее протекание акта адекватно отражало бы его внутреннее психическое содержание”[22, с. 37]. Адекватность отражения предполагает прежде всего его полноту. Последняя же обеспечивается достаточно глубоким знанием сущности исследуемого феномена.
Хорошей иллюстрацией этого требования могут служить исследования утомления. Казалось бы, здесь нет и не может быть никаких“подводных камней”: нужно брать в качестве зависимой переменной показатели продуктивности работы, и цель исследования будет достигнута. Однако полностью валидным такое исследование окажется лишь в том случае, если будет правильно выбрано время фиксации названных показателей. Дело в том, что нередко интервал между работой, вызывающей утомление, и моментом, когда оно впервые начинает себя проявлять, исчисляется несколькими часами.
Самооценка валидности. Реализация изложенных выше требований делает описание исследования настолько “прозрачным”, что в нем сразу же прорисовываются те моменты, состояние которых определяет степень валидности оцениваемой методики. Исследование, описание которого не содержит полной и четкой спецификации основных элементов экспериментальной конструкции и ее структуры в целом, не может быть признано валидным. Иными словами, вначале анализ и оценку валидности разработанной экспериментальной методики должен представить ее автор. В этом случае читатель и критик получают возможность выполнить одну из своих функций—проконтролировать и оценить обоснованность, логическую непротиворечивость представленных рассуждений и, исходя из такой оценки, сделать вывод о том, насколько в действительности валидна данная методика.
НЕКОТОРЫЕ ПРЕДПОСЫЛКИ ПОВЫШЕНИЯ ЭКОЛОГИЧЕСКОЙ ВАЛИДНОСТИ ЭКСПЕРИМЕНТАЛЬНЫХ МЕТОДИК
Попытаемся теперь установить объективный смысл критических замечаний, высказанных Чемберсом в адрес экспериментальных исследований переноса тренировки. Мы видим этот смысл отнюдь не в отрицании практической ценности всякого лабораторного эксперимента, а в косвенном указании на необходимость проведения по данной проблеме, в дополнение к экспериментам общепсихологического плана, экспериментальных исследований прикладного, а затем и практического характера. Следовательно, здесь встает задача состыковки всех трех звеньев исследовательской системы, классифицируемых по степени общности и характеру получаемых результатов. {123}
Задача состыковки прикладного и практического уровней исследования глубоко проанализирована в одной из работ Ю. М. Забродина [12]. Представляется весьма конструктивным положение о том, что“для решения практических задач, точно так же как и для решения задач исследовательских, нужна своя, особая, адекватная им система методов— применения (а не добывания) психологических знаний”[12, с. 10]. Важное значение имеет также указание на гносеологическую особенность данного стыка— необходимость перехода от “предметного”отражения различных аспектов и сфер реальности, характерного не только для общепсихологических, но в значительной мере и для прикладных психологических исследований, к целостным явлениям и объектам, которые существуют в этой реальности. “Другими словами, от абстракции отдельных сторон реальности приходится переходить к действительным контактам, взаимодействию, к управлению этими самыми реальными объектами”[12, с. б]. Это предполагает прежде всего предварительное выявление не только общих свойств, но и индивидуальных особенностей реального объекта. На этой основе и к тем и к другим свойствам должны быть приложены уже не“предметные”, не абстрактные знания, а знания системы, конкретные, представляющие собой, по выражению К. Маркса, “синтез многих определений, следовательно единство многообразного” [2]. Причем, как подчеркивает Ю. М. Забродин, “синтез различного научного знания для таких объектов в направлении решения практической задачи (в силу системности объекта) должен быть комплексным, как и сами практические решения” [12, с. 10].
Важнейшим средством проверки правильности такого комплексного синтеза и комплексного решения становится практический эксперимент.
О том, какой высокой степенью сложности и специфичности могут обладать системные объекты, с которыми при проведении таких экспериментов имеет дело, в частности, инженерная психология, свидетельствует, например, опыт конструирования систем отображения информации для диспетчерских пунктов объединенных энергосистем. Как отмечает В. Ф. Венда [4], в отличие от вычислительной техники, средств связи и другого серийно выпускаемого оборудования система отображения информации для каждой АСУ проектируется отдельно, поскольку нестандартны сами функции операторов. В связи с этим в практических экспериментах по оценке структуры систем отображения информации могут участвовать только диспетчеры конкретного объединения. Приведенный пример убедительно показывает: если в прикладном эксперименте прототипом при моделировании служит определенный класс объектов, то в эксперименте практическом эту функцию выполняет тот или иной единичный объект, по отношению к которому и осуществляется“привязка” знаний, полученных на уровне прикладного исследования. Стык между общепсихологическим и прикладным уровнями исследования коренным образом отличается от стыка между этим последним и непосредственно практическим экспериментом. Если во втором случае применение полученных знаний осуществляется в основном путем дедукции (разумеется, после предварительного их синтеза), то в первом случае“перенос” полученного знания в практику происходит опосредованно —через синтез новой теории, на основании которой разрабатываются эмпирические гипотезы для прикладных, в том числе экспериментальных, исследований. Возможность и сам факт разработки таких гипотез должны служить показателями экологической валидности той или иной экспериментальной методики общепсихологического уровня.
Подведем краткий итог. Мы сделали лишь первоначальную попытку систематического анализа общенаучного критерия валидности в приложении к психологическому эксперименту. Однако и она показывает, сколь существенно данное понятие для дальнейшего развития экспериментальной психологии. Критерий валидности предстает здесь как решающий фактор субъективной (авторской) и объективной (исходящей {124} от научного сообщества) рефлексии, обеспечивающий органическое взаимодействие логической оценки и практической проверки экспериментальных методик на всех уровнях их исследования: общепсихологическом, прикладном и практическом. Всесторонняя и детальная разработка этого критерия (а здесь пока существует немало“белых пятен”) является поэтому важнейшей методологической предпосылкой дальнейшего прогресса экспериментальной психологии. ЛИТЕРАТУРА Маркс К. , Энгельс Ф. Соч. 2-е изд. , т. 1, с. 7. Маркс К; Энгельс Ф. Соч. , т. 46, ч. 1, с. 37.
Будилова Е. А. Методология, теория и эксперимент в научном творчества С. Л. Рубинштейна. — Вопр. психологии, 1979, № 3, с. 106—114. Венда В. Ф. Инженерная психология и синтез систем отображения информации М. , 1975. Гильбух Ю. З. Актуальные проблемы валидации психологических тестов. — Вопр. психологии, 1978, № 5, с. 108-118... Гильбух Ю. З. Тренировочные устройства в профессиональном обучении (Психолого-педагогические аспекты). Киев, 1979.
Гильбух Ю. З. , Костюк Л. Г. , Лоос В. Г. Проблема функциональной музыки в зарубежной психологии. — Вопр. психологии, 1971, № 3, с. 162—168. Гильбух Ю. З. , Лоос В. Г. Психологические проблемы НОТ. — Соц. труд, 1967 № 8, с. 70—79. Готтсданкер Р. Основы психологического эксперимента. М. , 1982. Деревянко Е. А. Взаимодействие между некоторыми физиологическими и психологическими факторами при развитии утомления в процессе трудовой деятельности. — В кн. : Тез. докл. на I съезде Об-ва психологов. М. , 1959, с. 173—176. Забродин Ю. М. Проблемы разработки практической психологии (О научных основах психологической службы). — Психол. ж. , 1980, т. 1, № 2, с. 5—18.
Забродин Ю. М. Развитие советской психологии и задачи психологической службы. — Психол. ж. , 1984, т. 5, № 6, с. 3—20. Заксенберг Э. Производительность труда при непрерывном потоке. — В кн. : Организация поточного производства в машиностроении. М. —Л. , 1933, с. 9—59. Зараковский Г. М. , Рысакова С. Л. , Чернов К. А. Принципы постановки экспериментов при разработке моделей сложных действий человека-оператора. — Психол. ж. , 1984, т. 5, № 6, с. 93—105. Кэмпбелл Д. Модели экспериментов в социальной психологии и прикладных исследованиях. М. , 1980. Личность в психологическом эксперименте. М. , 1973.
Ломов Б. Ф. Методологические и теоретические проблемы психологии. М. , 1984. Ломов Б. Ф. О роли практики в развитии теории общей психологии. — Вопр. психологии, 1971, № 1, с. 26—35. Материалистическая диалектика: в 5-ти т. Т. 2: Субъективная диалектика М 1982. Материалистическая диалектика. Краткий очерк теории. М. , 1985. Паповян С. С. Эксперимент в прикладной социальной психологии: актуальные проблемы статистического анализа данных. — Психол. ж. , 1985, т. 6, # 6, с. 90—100. Рубинштейн С. Л. Основы общей психологии. М. , 1946.
Система испытаний для психологического профотбора шоферов. Харьков, 1936. Швырев В. С. Научное познание как деятельность. М. , 1984.
Экспериментальная психология. Вып. 1, 2 / Под ред. Фресс П. , Пиаже Ж. М. , 1966. Ярошевский М. Г. Психофизиология труда и зарождение принципа деятельности в советской психологии. — Вопр. психологии, 1977, № 6, с. 3—16.
Bures J. Techniques and Basic Experiments for the Study of Brain and Behaviour Amsterdam, 1983.
Chambers E. G. Transfer of Training: a Practical Problem. — Occup. Psychol, 1956 v. 30, № 5, р. 557—578. Chapanis A. The Relevance of Laboratory Studies to Practical Situation. — Ergonomics, 1967, v. 10, № 5, р. 557—578. Mayo E. Social Problems of Industrial Civilization. L. , 1949. Zeisel J. Inquiry by Design: Tools for Environment-Behaviour Research. Cambridge, 1985