П. Клайн
Личностные опросники — широко используемые методикиизмерения личностных качеств, поскольку они могут разрабатываться так, что имбудут присущи многие атрибуты эффективных тестов: надежность,дискриминативность и стандартизованность. Однако, в силу природы личностныхпеременных, труднее всего бывает установить валидность именно этих методик.
Проблемыконструирования личностных опросников
Как и в случае тестов способностей, качество отдельныхзаданий (вопросов, утверждений) является определяющим для всего опросника, ипоэтому в данной главе будут рассматриваться трудности, возникающие приформулировании заданий, а также преимущества различных типов заданий.
При разработке заданий для личностных опросников необходимоучитывать следующие проблемы, которые, если их не обойти, неизбежно приведут книзкой валидности тестов.
(1) Установка на согласие (responseset of acquiescence). Это тенденция испытуемого соглашаться с утверждениями илиотвечать на вопросы «да» независимо от их содержания. Чаще всегопроявляется, согласно Guilford (1959), когда утверждения (вопросы) неоднозначныи неопределенны.
(2) Установка на социально одобряемые ответы (response setof social desirability). Это тенденция испытуемых отвечать на вопросы тестатак, чтобы выглядеть «социально положительным»: если возможен«социально желательный» ответ, то весьма вероятно, что испытуемыебудут его давать. Эта установка, как показал Edwards (1957), оказывает, вчастности, влияние на результаты теста ММРI (Minnesota Multiphasic PersonalityInventory).
(3) Установка на неопределенные или средние ответы (responseset of using the uncertain or middle category). Если в опросникепредставлена средняя категория ответов, отражающая нерешительность илинеуверенность в ответе (напр., «не уверен», «не знаю», или«затрудняюсь ответить»), то многие испытуемые склонны к нейприбегать, как к безопасному компромиссу. Это приводит к снижению валидностизаданий, поскольку большинство методов анализа вопросов основывается на крайнихзначениях показателей.
(4) Установка на «крайние» (расположенные покраям шкалы) ответы (response set of using the extreme response). Эта установкаможет проявляться при использовании многоэлементной рейтинговой шкалы.Некоторые испытуемые, независимо от содержания вопросов, предпочитают выбиратькрайние ответы (Vernon, 1964).
(5) Очевидная валидность (face validity) вопросов(утверждений). Несомненно, в тестах личности необходима уверенность в том, чтоответы на вопросы могут рассматриваться как правдивые. Cattell и Kline (1977)рассматривают данные опросника как данные Q и Qi. Данные из первого множестварассматриваются так, как если бы они отражали поведение испытуемого, данные извторого — как ответ на отдельный вопрос, ответ, который либо нагружен некоторымфактором, либо нет, независимо от того, отражает ли он поведение испытуемого.
(6) Выборка из генеральной совокупности вопросов. В тестахинтеллекта и специальных способностей, обсуждавшихся в предыдущей главе,относительно легко убедиться в том, что задания принадлежат или с высокойстепенью вероятности выглядят принадлежащими к подразумеваемой для них генеральнойсовокупности. Лингвистические задания нелегко перепутать с математическими иликакими-либо другими. Однако, в области особенностей личности и темперамента всегораздо сложнее.
В самом деле, иногда даже опытные и искусные разработчикивопросов (например, Cattell, 1957) бывают удивлены тем, что вопросы нагруженыне теми факторами, для выявления которых они были созданы, а также тем, чтовопросы вообще не нагружены ни одним из факторов. Эта проблема с точки зренияклассической теории тестов состоит в трудности определения конкретнойвыборочной совокупности вопросов. В результате возникает проблема подбораадекватной выборки из выборочной совокупности вопросов или утверждений длятеста, а без этого тест не может быть валидным.
(7) Выборка из генеральной совокупности испытуемых. Какуказано выше, в личностных тестах труднее обеспечить адекватность выборки извыборочной совокупности, чем в тестах способностей. При использовании тестовспособностей обычно известна вполне определенная категория лиц (популяция), длякоторой данный тест предназначен, и таким образом, по крайней мере в принципе,можно эффективно подбирать выборки. Однако, в личностных тестах, в отличие оттестов, разрабатывающихся для испытуемых с той или иной патологией, в идеаленужны выборки из общей популяции (т.е. всего населения страны), в которойвстречаются все возможные показатели. Такие выборки, как показано, должны бытьбольшими, и их обычно трудно получить.
(8) Проблемы в установлении адекватного критериявалидности. Существует, как уже подробно обсуждалось в разделе о валидности,значительная трудность в нахождении адекватного критерия. Например, если мыпытаемся измерить авторитаризм, то будем вынуждены полагаться на рейтинги,поскольку нет никаких других внешних мерил (в отличие от, например, школьныхэкзаменов в случае диагностики способностей). Рейтинги — это неадекватныйинструмент, а если бы они подходили, тест был бы не нужен. Аналогично, еслисуществуют высокоэффективные тесты авторитаризма, которые могут бытьиспользованы в качестве критерия валидности, вероятно, в новом тесте нетнеобходимости.
Таким образом, мы вынуждены ограничиваться исследованиямиконструктной валидности, обычно основывающимися на мультивариативном анализеразрабатываемого теста по сравнению с другими переменными, а такжеисследованиями специальных групп, имеющих по предположению контрольныепоказатели по рассматриваемой переменной.
Таковы основные сложности, возникающие при конструированииличностных опросников, и следует отчетливо их себе представлять, прежде чем выприступите к формулированию вопросов или утверждений. Две последние проблемы,хотя они и являются определяющими, выходят на первый план уже после того, какподобраны задания теста.
Формулированиевопросов (утверждений ) для личностных опросников
Практически нет необходимости особо говорить о том, что длятестов личности имеет большое значение то, чтобы ответы на вопросы могли бытьобъективно и с высокой надежностью оценены. Следовательно, мы должны сделатьэто возможным путем разработки формы вопросов. Ниже приведены формы вопросов,используемых в наиболее известных опросниках — тех, которые оказались наиболееэффективными на практике.
(1) Вопросы с ответом типа «да-нет». Такиевопросы использовались автором этой книги в разработанных им тестах личности,AI3Q (Kline, 1971), OOQ и OPQ (Kline and Storey, 1978). Их легко формулировать,они понятны испытуемым и ответы на них даются быстро. Такова форма вопросовличностных тестов Айзенка. Типичный дихотомический вопрос: «Любите ли вызагорать на пляже?»
(2) Вопросы с ответами типа «да-?-нет»,«да-затрудняюсь ответить — нет». Это вариант вопросов типа«да-нет», описанных выше, с добавлением категории неопределенности,потому что некоторые испытуемые становятся раздражительными к несговорчивыми,если их заставляют отвечать либо «да», либо «нет» навопросы, в ответах на которые они не очень уверены.
Трудность с такими вопросами состоит в том, что эта«средняя» категория очень привлекательна для испытуемых и редкобывает информативной. Bendig (1959) показал это на примере теста МРI (MaudsleyPersonality Inventory — ранней версии EPI, Eysenck Personality Inventory), вкотором не делалось различие между дихотомической и трихотомической формойвопросов, и сделал заключение о том, что дихотомические вопросы более предпочтительны,поскольку они заставляют преодолевать нежелание делать выбор. С моей точкизрения между вопросами типа «да-нет» и «да-?-нет» различиестоль невелико, что вопрос о том, какую форму выберет разработчик теста,становится не более, чем делом личного предпочтения. Cattell и его коллегаиспользуют трихотомическую форму для некоторых из вопросов в своих факторныхтестах личности.
(3) Альтернативные задания (с ответами типа«правда-ложь»). Эти задания состоят из утверждений (часто от первоголица), которые испытуемые должны отметить как верные или неверные для них.Примером альтернативного задания является: «Я ненавижу втискиваться впереполненный автобус». Это форма утверждений, используемая в ММРI. Посуществу, она ненамного отличается от дихотомических вопросов, хотяформулирование их как альтернативных утверждений, а не как дихотомическихвопросов, может до некоторой степени повлиять на языковую представленностьзадания.
(4) Задания с ответами типа «нравится-ненравится» (одно слово или фраза). Это весьма оригинальная форма задания,которая в настоящее время используется у Grygier (1961) в динамическом тестеличности (DPI — Dynamic Personality Inventory), тесте, основанном на шкалеличностных предпочтений Кроута (Krout Personal Preference Scale) (Krout andTabin, 1954). Примерами таких заданий могут быть: (1) «фонарщики»;(2) «воротники из бобрового меха»; (3) «бас-барабан».Испытуемые должны указать, нравится им предложенное или не нравится. Grygier иGrygier в своем руководстве по DPI утверждают, что эти задания являются сугубопроективными по своей природе, a DPI — это в сущности проективный опросник.Однако, так это или нет, такие задания не обязательно должны быть проективными,и может оказаться, что это чрезвычайно полезная, хотя и необычная, формазаданий.
(5) Задания с рейтинговыми шкалами. Эти задания состоят изпредложений, к которым прилагаются рейтинговые шкалы. Cornrey (1970) — наиболеевидный исследователь, использовавший эти задания — отдавал им предпочтениепотому, что в них преодолеваются трудности, связанные с коррелирующимидихотомическими заданиями (см. обсуждение далее, в гл. 6), а также потому, чтоиспытуемым они кажутся более разумными; нежели дихотомические задания, хотя иможет проявиться установка на крайние ответы (см. выше). Cornrey использует двесемибалльные шкалы, крайними значениями которых являются:«всегда-никогда» и «определенно да — определенно нет», взависимости от формулировки задания. Типичным примером может быть: «Мненравится бывать с друзьями в кафе: всегда, очень часто, часто, от случая кслучаю, редко, очень редко, никогда». Очевидной проблемой для этой шкалыявляется различная интерпретация индивидуумами терминов частоты.
(6) Разнообразные трихотомические задания. Вдействительности это варианты трихотомической формы вопроса типа«да-нет» (тип 1 в данном списке). Cattell, например, в тесте 16PFиспользует эти задания, потому что они более подходят по смыслу в отношениинекоторых утверждений, чем «да — затрудняюсь ответить — нет».Примерами трихотомий являются: «обычно — иногда — никогда»,«верно — не знаю — неверно», «согласен — не уверен- не согласен». Эти варианты предоставляют большую гибкость при формулировании заданий,чем жесткие формы типа «да-нет» (дихотомическая) или альтернативные.
(7) Трихотомические задания с выбором. Это варианты типа(6), позволяющие вложить в лаконичную форму задания почти любую мысль. В нихиспользуются три завершающих предложение фразы, одну из которых испытуемыйдолжен выбрать. Вот типичный пример: «Когда мне нечего делать, я могу: (а)позвонить другу, чтобы поболтать; (б) заняться разгадыванием трудногокроссворда; (в) пойти на джазовый концерт». Некоторые разработчики тестовиспользовали такие задания (например, Myers-Briggs, 1962) с двумя, тремя иболее вариантами выбора. Они могут быть упомянуты как отдельная категориязаданий.
(8) Задания с вынужденным выбором. В таких заданиях, какуже говорилось выше, испытуемые принуждаются к выбору того, какое из (обычнодвух) утверждений более точно применимо к ним или более верно для них, хотяможет быть и больше вариантов выбора. Однако, задания с вынужденным выборомвключены в данный список как отдельная категория не потому, что ониконцептуально отличаются от трихотомических заданий с выбором, а потому, чтоEdwards ( 1959) разработал довольно много заданий с вынужденным выбором,которые были специально сконструированы в пары, уравновешенные по тенденции ксоциально одобряемым ответам, чем пытался устранить влияние этой установки.
(9) Другие формы. Основные типы заданий, описанные в пунктах(1) — (8), — это те, которые в основном используются в наиболее известныхличностных опросниках. Все они, с точки зрения формы (в отличие от содержания),довольно легко формулируются, для них существует несколько правил, которые будуобсуждены, ниже, они лаконичны, наконец, просты в работе, а также дляподсчетов.
Очевидно, возможны и другие типы заданий) и в Myers-BriggsType Indicator (MBTI), например, находим тип заданий, которые более напоминаютпроективный тест, хотя они оцениваются объективно. Испытуемые должны указать,какое из пары слов более привлекательно для них. Вероятно, их лучшерассматривать как вариант заданий «нравится-не нравится» (тип 3 вданном списке).
Cattell и др. (1970) используют аналогичные задания в тестеMAT (Motivational Analysis Test — тест анализа мотивов), хотя можно было бывозразить, что это задания объективного теста, а не теста личности; разработкаобъективных тестов описана в главе 4.
Все рассматривавшиеся до сих пор виды заданий требуют отиспытуемых самостоятельной работы. Испытуемые должны отвечать настолькоправдиво, насколько возможно, хотя, как я уже указывал, есть такие методыконструирования тестов, в которых предполагается, что это не обязательно.Некоторые задания в них, хотя по форме и являются такими же, как в приведенныхвосьми пунктах, отличаются по сопровождающим их инструкциям. Так, в личностномопроснике Эдвардса (Edwards, 1967) испытуемые должны отвечать на вопросызаданий так, как будто они смотрят на себя со стороны (как они полагают, другиевидят их). Это, как можно надеяться, устраняет, по крайней мере частично,тенденцию к социально положительным ответам.
Хотя есть и другие типы заданий, используемых в личностныхопроскиках, нет никакого сомнения, что среди приведенных восьми типов можнонайти задания, хорошо апробированные в практике тестирования личности. Болеетого, фактически нет такого содержания, которое не могло бы быть эффективносформулировано в виде задания одного из этих типов.
Правила дляформулирования заданий
Итак, у нас есть перечень типов заданий, приведенных выше,и теперь следует обсудить некоторые приемы, принятые разработчиками тестов сцелью преодолеть описанные выше проблемы.
Большинство из того, что будет сказано, очевидно и исходитиз здравого смысла. Несмотря на это, изучение многих опубликованных тестов, атакже тестов, используемых для внутреннего подбора кадров в крупныхорганизациях, убедило автора в том, что все это должно быть сказано. Слишкомчасто разработчики тестов, ослепленные блестящей методикой анализа заданий, забываюто том определяющем факте, что тест не может быть лучше (но может быть хуже),чем его задания. Guilford (1959), личностные опросники которого были средипервых, разрабатывавшихся при помощи факторного анализа (правда, на шкалах, ужехорошо изученных за сорок лет исследований), делает несколько предположений,полезных для разработчиков заданий в тестах личности. По нашему опыту, этиправила показали себя как весьма эффективные.
(1) Устраняйте возможность проникновения испытуемых в сутьтого, что изучается при помощи данных заданий. Это делается не ради того, чтобыввести их в заблуждение, а потому, что если испытуемые догадаются, чтонекоторое задание предназначено для измерения черты X, то ответы будут отражатьих точку зрения по выраженности у себя этой черты, а не реальное положение дел.Представления же некоторых испытуемых о своей личности могут быть значительноискаженными. Как утверждает Guilford (1959), идеальным было бы оцениватьиспытуемого по чертам, о которых он не знает, задавая ему вопросы о том, что онзнает хорошо.
(2) Формулируйте понятные, недвусмысленные вопросы(утверждения). Это важно для того, чтобы уменьшить погрешность, возникающуюиз-за неверного понимания вопросов. Высокая надежность зависит, в известнойстепени, от этого качества теста.
(3) Задания должны отражать конкретные, а не общие аспектыизучаемой области поведения. Так, задание вида: «Нравится ли вамспорт?» — является слишком общим: термин «спорт» — неопределенный, как и термин «нравится». Необходимо задать болееконкретный вопрос: «Вы играете регулярно в какую-либо спортивнуюигру?» или «Вы регулярно следите за игрой вашей любимой спортивнойкоманды?», «Следите ли вы за результатами скачек?» На этивопросы, ответы на которые вряд ли будут фальсифицировать или относительно которыхреальное поведение вряд ли изменится, испытуемые будут отвечать одинаково,когда бы вы их ни тестировали.
(4) В каждом задании следует задавать только один вопросили делать только одно утверждение. Рассмотрим пример: «Думаю, следуетзаставить черных и представителей других рас эмигрировать». Если этозадание предназначено для измерения расизма, то оно будет плохим. Есть расисты(такие, как южно-африканские), которые проводят резкие различия между черными илюдьми других рас. Другие считают всех, кто не являются англо-саксами, неотносящимися к людям. Следовательно, некоторые расисты могут положительноответить на этот вопрос, тогда как другие — нет (только черных следуетпринуждать к эмиграции). Более злостные расисты могут быть готовы оставить черныхи представителей других рас, но видеть их исключительно в качестве рабов. А,например, немцы, проживающие в Англии, опять-таки ответят «нет»,исходя из своей интерпретации понятия «другие расы» (см. п. 2 выше).Это задание. явно бесполезно: у него слишком неопределенная формулировка иодновременно задаются два вопроса. Следовало бы дать утверждение более точно:«Думаю, следует заставить негров эмигрировать». Сейчас оно болеепонятно (выражение «черные и представители других рас» заменено наболее точное), и в нем остался только один вопрос.
(5) Избегайте, насколько это возможно, слов, определяющихчастоту действий. Они обычно настолько субъективны, что вносят большуюнеопределенность. Это положение прояснят примеры.
Пример А. «Часто ли вам снятся сны?» Здесь всезависит от значения слова «часто». Некоторые испытуемые могутиспытывать такое чувство, что видеть сон раз в месяц — это часто, и ответят навопрос утвердительно. Другие могут возразить, что один сон за ночь — это нечасто, потому что исследования показали, что людям снятся три-четыре сна заночь, и ответят «нет». Вопрос, таким образом, становитсябессмысленным. Ответы указывают противоположное тому, что происходит на самомделе. Улучшенный вопрос будет звучать: «Снятся ли вам сны дважды в неделюили чаще?»
Пример Б. «Испытываете ли вы иногда беспричинноебеспокойство?» Очевидно, что этот вопрос порождает ту же проблему, что ипредыдущий. Однако, он еще хуже, поскольку «иногда» буквальноозначает «чаще, чем однажды». Следовательно, практически все испытуемыевынуждены, если они отвечают искренне, ответить на этот вопрос положительно.Однако, этот вопрос мог бы быть очень полезным, поскольку всем известно, чтолюди действительно различаются по частоте беспричинного беспокойства. Дело не всодержании, а в форме вопроса, которая не выдерживает критики. Как же можноболее точно сформулировать вопрос, в котором частота столь существенна? Вулучшенном виде это может выглядеть: " Испытывали ли вы беспокойство безособых причин в последние две (четыре) недели?"
(6) Насколько возможно, избегайте терминов, выражающихчувства. Вместо этого, попытайтесь представить задание в контексте поведения.Это правило было проиллюстрировано в пункте (3) выше, в котором задание былосформулировано более конкретно с целью повышения надежности при тестировании поистечении некоторого времени. Для этого слово «нравится» былозаменено на «играете». Важным для нас здесь является то, чтоиспытуемый без колебаний отвечает, играет он или нет, а со словом «нравится»возникает целая проблема. Сообразительные, высокообразованные, точно выражающиесвои мысли испытуемые могут долго колебаться в выборе значения этого слова:«Да, им нравится это, но, вероятно, „наслаждаться“ будет чуточкуточнее; „находить удовольствие“ -да, но...»,-и т.д. Конечно, идля такого задания, как в вышестоящем пункте (5), в котором исследуется чувствобеспокойства, эта проблема также существует. Однако, выражать это задание вповеденческой форме, например: " Бьется ли ваше сердце быстро и пересыхаетли во рту безо всяких причин?", кажется слишком искусственным. Особенностьсостоит в следующем. Если только задание может быть сформулировано так, чтобынеопределенные слова о чувствах могли быть заменены на описание поведения, этодолжно быть сделано. Когда это невозможно, конечно же, стоит попытатьсясоставить задания, в которых описываются чувства. Их пригодность илинепригодность будет выявлена на этапе анализа заданий.
(7) При помощи инструкций обеспечьте, чтобы испытуемыедавали первые приходящие на ум ответы. Не позволяйте испытуемым долгоразмышлять над значением заданий. Эффективное задание личностного теста,которое действительно имеет отношение к поведению испытуемого, должно вызватьнемедленную и точную реакцию. В противном случае вероятно, что задание невыявляет ту область поведения, которая имеет существенное отношение к измерениюличностных качеств. Некоторые примеры прояснят этот момент.
Пример А. «Нравится ли вам наблюдать за щеглами?»Этот вопрос у испытуемых, за исключением орнитологов, не вызовет, вероятно,ничего, кроме смеха над его очевидной эксцентричностью. Большинство людей этопросто не интересует.
Пример Б. «Любите ли вы хлеб с маслом?» Это явноне эксцентричный вопрос. Многие испытуемые, по крайней мере на Западе, где нетнедостатка в основных продуктах питания, не будут испытывать по этому поводусколько-нибудь сильных чувств, воспринимая это как данность.
Пример В (взят из пробных заданий для разработанногоавтором теста А130; Kline, 1971). «Позволяете ли вы вашей собаке лизатьвам лицо?» Это задание было предназначено для выявления чистоплотности, иключевым ответом для него является «нет». Очевидно, те люди, укоторых нет собаки, ответят «нет», но можно возразить, что часточистоплотность не является причиной отсутствия домашних животных. К моемуудивлению, этот вопрос вызвал исключительно значимые ответы. Некоторыеиндивидуумы, дойдя до этого вопроса, отказывались вовсе отвечать на вопросытеста, говоря, что все это вообще отвратительно; один испытуемый даже говорилмне, что он никогда не был так оскорблен, и никогда бы не допустил подобноймерзости, и тому подобное в том же духе.
Нет никакого сомнения, что этот вопрос затрагивает нечтоскрытое и подавляемое. Уместность вышеупомянутой инструкции к тесту теперьпонятна. Именно первый ответ, по всей вероятности, является индикаторомопределенного личностного качества. Как только испытуемые начинают раздумыватьнад вопросами, включаются не только защитные процессы, но и сознательныеискажения, такие как желание произвести впечатление, угодить экспериментатору,-все это отрицательно влияет на результаты теста.
И вот что еще более важно: многие задания не могутвыдержать критической оценки в основном из-за вполне оправданного желанияисследователей вложить слишком много информации в краткую форму задания. Вотпочему особое значение при создании заданий тестов придается понятности иконкретности.
Можно было бы поразмышлять над приведенным выше примером В,и тогда не было бы никаких проблем. Некто либо позволяет, либо не позволяетсобаке лизать его лицо. Нет никаких сложностей в решении того, что: (а) собакаесть собака; (б) что она именно лижет; (в) и что именно она лижет — лицо иличто-нибудь другое. Однако, большинство тестов личности не являются такимиоднозначными. Между прочим, стоит отметить, что этот вопрос оказался неудачными его пришлось удалить.
Пример Г. «Бывают ли у вас яркие сны?» Этотпример хорошо иллюстрирует наше указание. Большинство испытуемых, вероятно,смогут дать немедленный ответ — либо «да», либо «нет».Однако, при внимательном рассмотрении этот вопрос оказывается неприемлемым.«В конце концов, насколько яркими могут быть сны? Мои сны кажутся мнеяркими, но это мое субъективное мнение. Я действительно вижу яркие сны, но ятакже иногда вижу несколько однообразные и серые сны,»- подобные мыслизатрудняют ответы.
Пример Д. «У вас много друзей?» Как и в первомпримере, на этот вопрос, по размышлении, чрезвычайно трудно дать точный ответ.Проблема опять заключается в значении определенных слов, в данном случае«много» и «друзей». С этими трудностями столкнутсявнимательные, вдумчивые и добросовестные испытуемые. Они могут рассуждать так:«Думаю, у меня много друзей, но что значит „много“? Сколько насамом деле в среднем друзей имеют люди? Без этой информации, а также без знанияо разбросе вокруг среднего значения, невозможно ответить, много их у меня, илинет.»
Хотя все эти мысли несомненно правильны, на практике этотвопрос у многих испытуемых вызывает автоматический ответ. Слово«друзья» тоже может породить проблемы. Испытуемые могут рассуждать:«Что такое друг, чем он отличается от знакомого, есть ли вообще какие-либоразличия? Возьмем А, является ли он мне другом? Некоторым образом, нам нравитсябывать вместе, но если бы он мне был нужен, он был бы практически бесполезен.Теперь Б...»,-и так далее.
Из этих примеров понятно, что в инструкциях необходимопросить испытуемых выполнять задания настолько быстро, насколько это возможно.Конечно, нельзя избежать того, что таким инструкциям не всегда следуют, и висследовании навязчивости, выполненном автором книги, один из вопросов,касающийся того, быстро ли испытуемый решается на что-либо и придерживаетсяэтого решения, ясно показал возможность многих различных ответов, хотя на негои отвечали утвердительно «да».
Это последнее наблюдение подводит нас к той критике,которая направлена против личностных опросников, что мы сейчас и обсудим.
Возражение: задания личностных опросников по существубессмысленны
Это становится очевидным из приведенных выше примеров Г иД. Рассчитывать на то, что испытуемые-интеллектуалы будут отвечать быстро, — это не только оскорбительно для испытуемых (так утверждает Alice Heim в связи собсуждением некоторых тестов интересов; Heim and Watts, 1966), но более того, утаких испытуемых появляются серьезные сомнения в том, что такие задания могутвообще что-либо измерять.
На эти критические замечания получен эмпирический ответ:анализ заданий любого рода показывает, что наше множество заданий измеряетоднородный фактор, в то время как исследования валидности демонстрируют, что жеэто за фактор. Тот факт, что задания имеют сомнительное значение, становитсянесущественным, если ответы на эти задания фактически являются эффективнодискриминативными или коррелируют с внешним критерием. Вышеприведенная критика,хотя и может показаться серьезной, не имеет, таким образом, большого значения.
Таковы правила формулирования заданий, описанные Guilford(1959), и они способствуют обеспечению того, что подготовленные вопросы будутобеспечивать решение тех задач, которые стоят перед ними. Автору этой книги приконструировании собственных заданий для личностных тестов всегда удавалосьсоздать надежные и, как я полагаю, валидные методики, когда он следовал этимправилам. Удалось ли бы ему это без уже известной нам методологии, неизвестно.
Устранение влиянияустановок на ответ
Кроме того, что при разработке заданий следует всегдапомнить о вышеперечисленных правилах, необходимо, конечно, ослабить, насколькоэто возможно, влияние наиболее существенных установок на ответ. Ниже описано,как это следует делать.
Установка насогласие (acquiescence)
Установки на ответы (response sets) были определеныКронбахом (Cronbach, 1946) как стилистическая последовательность, стимулируемаяформой ответов на задания личностного опросника. Как указывалось ранее, одной изнаиболее существенных является установка на согласие (см. Messick, 1962), тоесть тенденция соглашаться с утверждением независимо от его содержания.
Сбалансированныешкалы
Messick (1962) утверждает, что сбалансированная шкала — этоодин из способов минимизации влияния установки на согласие. Сбалансированнойназывается такая шкала, для которой равное или примерно равное количествозаданий имеют ключевые ответы «да» или «нет»,«верно» или «неверно».
Однако, здесь заслуживают внимания два момента. Во-первых,сбалансированная шкала не устраняет полностью тенденцию: установка на согласиевсе же может проявиться, но, как указывает Knowies (1963), такая шкала непозволит спутать «соглашающегося» испытуемого с тем, у кого реальновысокие показатели, а это важно. Конечно, можно возразить, что«соглашающийся» испытуемый с потенциально высокими показателями небудет выявлен при сбалансированной шкале. Если это происходит чаще, чем внескольких отдельных случаях, то последующее исследование валидности тестабудет обречено на неудачу.
Во-вторых, искажающего влияния этой установки на показателипо тесту можно избежать только в том случае, если будут сформулированы в равнойстепени содержательные, недвусмысленные и побуждающие к определенному ответузадания, имеющие как положительные, так и отрицательные ключевые ответы. Есливы сможете сформулировать лишь очень небольшое количество заданий с ключевымответом «нет», то эти задания будут способствовать низкой валидностишкалы. Несколько примеров пояснят это.
Пример 1. Рассмотрим вопрос на экстравертированность:«Вам нравятся вечеринки?» Обратной формой этого вопроса будет:«Вам не нравятся вечеринки?» В этих заданиях стилистические оборотыязыка удовлетворительны, потому что принято говорить, что вечеринки нравятсяили не нравятся. Они также удовлетворительны, потому что, как это и случается,испытуемому с высоким показателем по параметру экстраверсии нравятся вечеринки,а испытуемому с низким показателем — не нравятся. Таким образом, полярностьэтих заданий эффективна. Однако, часто попытка получить обратную форму вопросастановится источником ошибок.
Пример 2. Следующее задание было создано, чтобы выявитьудовлетворение, получаемое от статистики — как утверждают, оно относится кчертам навязчивости: «Являетесь ли вы одним из тех людей, кто находитстатистические данные и таблицы совершенно скучными?» Это обратная формавопроса с ключевым ответом «нет». Однако, очевидно, (прежде чемпервое испытание теста показало, что этот вопрос не работает), можно не считатьстатистику скучной, но и не восхищаться ею. Таким образом, обращение вопросов,когда они относятся к некоторым крайним проявлениям в поведении, вероятнеевсего не даст результата в силу континуальности, лежащей в основе многихответов на задания. Обращение вопросов обычно предполагает дихотомичностьответа. Другими словами, если ответ на вопрос является дихотомическим, тообращение вопроса для сбалансированной шкалы возможно; если же используютсякрайние (граничные) значения из континуума, обращение не будет удачным.
Пример 3. Аналогично, можем рассмотреть вопрос о том,нравится ли испытуемым отдавать распоряжения. Обратная форма вопроса, такаякак: «Вы не испытываете удовольствия, когда вам вменяется в обязанностьотдавать распоряжения?» — не может быть удачной, потому что возможныслучаи, когда отрицание неприязни к распоряжениям, приказам вовсе не означаетполучение удовольствия от этого. В основе этого ответа лежит континуум, а недихотомия. Этот вопрос не может быть обращен.
Пример 4. В данном задании рассматривается аккуратность:«В школах сильно преувеличивают значение аккуратности». Можноутверждать, что навязчиво аккуратный индивидуум будет считать, что значениеэтой особенности поведения невозможно преувеличить. Следовательно, данноезадание было написано так, чтобы отрицательный ответ действительно выявлялисследуемую черту. Таким образом, с точки зрения разработки заданий, этожизнеспособное «негативное» задание.
В этих примерах проиллюстрированы два наиболее важныхмомента в формулировании заданий с отрицательными ключевыми ответами: они могутбыть сформулированы, во-первых, если отрицательный ответ соответствуетреальному поведению, и во-вторых, если в основе ответов лежит дихотомия, а неконтинуум, как в приведенном выше примере 1.
Понятные,недвусмысленные утверждения
Имеющий значение в контексте нашей работы вопрос был поднятGuilford (1959) при попытке устранить установку на согласие из личностныхопросников. Он утверждает, что согласие наименее вероятно тогда, когда заданияпонятны, недвумысленны и относятся к конкретному поведению. Поскольку этикачества уже были указаны среди тех, которые, по моему предположению, должныбыть присущи разрабатываемым заданиям, я не буду более говорить о них, а лишьпроиллюстрирую это положение несколькими примерами.
Так, вопрос: «Играете ли вы на каком-либо музыкальноминструменте?»,-является настолько конкретным, что индивидуум должен был быиметь предельно выраженную установку на согласие, чтобы утвердительно ответитьна этот вопрос, если это не соответствует истине. С другой стороны, вопрос:«Нравится ли вам музыка?»- настолько неопределенный (в том, где жекритерий того, что музыка нравится?), что согласие вероятно будет фактором,влияющим на положительные ответы в этом вопросе. В последнем примере есть двеособенности. Прежде всего, обратите внимание, что данный вопрос несравним свопросом: «Нравятся ли вам вечеринки?» В этом вопросе критерий того,нравятся ли вечеринки, известен каждому: частые посещения с желанием иэнтузиазмом. Следовательно, этот вопрос — практически сокращенная формавопроса: «Посещаете ли вы много вечеринок?» Таким образом, для неговероятность подвергнуться влиянию установки на согласие меньше, чем длявопроса: «Любите ли вы музыку?»
К этой особенности относится и неопределенное утверждение«нравится музыка». Это выражение бесполезно в задании. Так, слово«нравится» может соответствовать разнообразным чувствам: от тех,которые испытывают великие композиторы и исполнители, когда слушают, пишут илиисполняют музыку, до чувств человека, который любит слушать популярные песенки,совершая субботние покупки. Подобно этому, термин «музыка» означаетогромное разнообразие различных направлений: например, джаз, поп, народнаямузыка, рок, барокко, доклассическая, классика, романтизм, модерн, неоклассицизм,- а, кроме того, может иметь отношение к слушанию и исполнению, так чтоидентичные ответы на вопрос могут отражать совершенно различное поведение.Например, «да» для испытуемого 1 может отражать наслаждение от пенияконтр-тенора в ранней полифонической венецианской церковной музыке. А дляиспытуемого 2 это может отражать удовольствие прослушивания мотивчика типа«Танцуй со мной», когда он сидит за рулем своей машины. Любоезадание, в результате оценки которого оказывается, что столь разные областиповедения будут отнесены к одному и тому же классу, с очевидностью являетсябесполезным.
Проверка влиянияустановки на согласие
До сих пор все наши усилия были направлены — при помощисбалансированных шкал и формулирования предельно ясных и конкретных заданий — на уменьшение влияния установки на согласие или на то, чтобы сделать менеевероятным получение за счет тенденции к согласию высоких показателей попеременной, для измерения которой предназначен тест. Однако, как ужеговорилось, действие этой установки возможно даже при сбалансированных шкалах,и далеко не всегда можно создать настолько понятные вопросы, чтобы бытьуверенным, что влияние установки устранено. Поэтому разработаны методики,предназначенные для проверки того, была ли установка на согласие фактором, влияющимна ответы. Эти методики будут описаны в главе 6.
Социальноодобряемые ответы
Edwards (1957) показал на материале с заданиями ММРI, чтонаблюдается высокая положительная корреляция между степенью социальнойжелательности утверждений, оценивавшейся экспертами, и количеством реальныхсоциально одобряемых ответов на них испытуемыми. Поэтому он утверждает, чтоданная установка должна детерминировать ответы на задания и, следовательно,является основным источником невалидности тестов. Хотя, очевидно, невозможнополностью устранить влияние установки на социально одобряемые ответы, естьразнообразные приемы, полезные для уменьшения ее влияния. Эти приемы описаныниже.
Задания с вынужденным выбором, подобранные по их социальнойжелательности
В списке личностных предпочтений (Personal PreferenceSchedule) Эдвардса (EPSS) (Edwards, 1959), как мы уже отмечали в обсуждениитипов заданий (см. п. 8 на стр.95), задания состоят из двух утверждений,подобранных по социальной желательности, одно из которых испытуемый должен выбрать.Это радикальное решение для устранения влияния установки на социальноодобряемые ответы. Однако, этот метод не получил поддержки по следующимпричинам.
(1) Крайне трудно получить согласованные утверждения,релевантные также в терминах содержания, которое мы хотим измерить {Edwards,1957). Действительно, серьезное возражение против EPPS — это то, что данныйтест является немногим более, чем упражнением по конструированию тестов, и малосвидетельств того, что он измеряет переменные с какой-либо эффективностью (см.Kline, 1979).
(2) Любые незначительные различия в социальнойжелательности между частями заданий имеют тенденцию увеличиваться, когда онипредъявляются вместе, как это предусмотрено в форме вынужденного выбора, чтосводит на нет большинство из усилий по подбору утверждений.
(3) Экспертное оценивание социальной желательности — значительное упрощение данного явления. Это становится ясно из того, какполучается средняя экспертная оценка социальной желательности для каждогозадания. Для этого предполагается, что социальная желательность одномерна (хотяa priori это не так). В действительности было бы нужно многомерное шкалированиевлияния социальной желательности по всем заданиям, и затем подсчет показателейпо отдельным измерениям — процедура, которая могла бы быть, несомненно,рекомендована в свете приведенного выше пункта (2)! Кроме того, как указываетMessick (1960), социальная желательность сама по себе допускает значительныеиндивидуальные различия: то, что социально желательно для члена парламента,почти наверное не является таковым для лондонского докера.
Исходя из этих трех причин, не рекомендуется прибегать ктакому радикальному и, по-видимому, недостаточно эффективному шагу, какконструирование спаренных заданий, подобранных по их социальной желательности.
Избегайте явно социально желательных / нежелательныхзаданий
Существует ряд характеристик и качеств, с которыми мало ктозахочет согласиться, по крайней мере в среде образованных европейцев. Онинастолько очевидны, что когда мы проиллюстрируем их ниже несколькими примерамиутверждений, то они покажутся явно абсурдными. Вот несколько примеровутверждений, которые являются явно социально желательными или нежелательными:
(1) Я с трудом переношу неудачи: (да, нет).
(2) Я не понимаю юмор: (да, нет).
(3) Я постоянно лгу: (да, нет).
(4) Я мало сексуален: (да, нет).
(5) Я сексуальный психопат: (да, нет).
(6) Я не могу контролировать свои эмоции: (да, нет).
(7) Я завистливый и ревнивый человек: (да, нет).
(8) Я скупой: (да, нет).
(9) Когда возможно, я отлыниваю от работы: (да, нет).
(10) Я лгу, чтобы избавиться от хлопот: (да, нет).
(11)Я ненавижу негров: (да, нет).
(12) Я в основе своей антисемит: (да, нет).
По нашему опыту разработки тестов, мы были бы сильноудивлены, если бы любой из двенадцати приведенных примеров оказался приемлемымдаже для исследовательского теста. Например, для тестов личности, используемыхв профотборе, они будут совершенно бесполезными. Представьте себе утверждение(11)в тесте, предназначенном для работников социального обеспечения, илиутверждение (12) в тесте, предложенном человеку, надеющемуся получить работу вфирме, владельцем которой является еврей.
Измерение социальножелательных или нежелательных черт
Если измерению подлежат социально желательные илинежелательные черты, при разработке заданий следует избегать прямолинейногоподхода, как в перечисленных выше утверждениях. Два примера пояснят сказанное.
Пример 1. Задание для измерения скупости. Поскольку (см.утверждение 8 выше) прямой подход не годится, я утверждал при разработке тестаAI3Q, что скупой человек вполне мог бы думать, что содержащиеся в народноймудрости высказывания о бережливости очень разумны, тоща как на менее скупогоони не произвели бы впечатления. Следовательно, я попытался сформулироватьзадание следующим образом: «Каждый ребенок должен знать, что бережливостьлучше богатства.» Похоже, что в этом задании ответы как «да»,так и «нет», не имеют отношения к социальной желательности (неявляются социально одобряемыми). Действительно, этот вопрос оказался удачным повсем результатам анализа заданий.
Пример 2. Задание для выявления мстительности. Мало ктоподтвердит утверждение: «Я мстителен.» Однако, как уже говорилось,мстительные индивидуумы обычно проецируют свою мстительность на других, т.е.действуют механизмы защиты. Таким образом, я сконструировал утверждение:«Поступками большинства революционеров руководит мстительнаяжестокость.» Я подумал, что мало кого из испытуемых можно было быдействительно причислить к революционерам, так что мнения обследуемых будутотражать их собственные защитные реакции и стремления. Это задание оказалосьудачным, и я полагаю, что проекция — это механизм, действие которого может бытьиспользовано в формулировании вопросов, которые слишком социально нежелательны,чтобы задавать их прямо.
Пример 3. Задание для выявления лености. Если опираться намеханизм проекции, то можно сформулировать утверждение так:«Промышленность сегодня находится в плачевном состоянии, потому чторабочие в основном ленивы.» Следует заметить, что если это утверждениерассматривается некоторыми испытуемыми как факт, то есть не«включает» проективный механизм, то анализ заданий полностью выявитэто: вопрос не будет работать.
Использование шкалылжи
Некоторые авторы (например, Айзенк в тестах ЕРI и EPQ)вводят особую группу заданий для выявления тех лиц, которые склонны даватьсоциально одобряемые ответы. Они состоят из вопросов, касающихся незначительныхпроступков, которые, увы, иногда совершаются большинством людей. Набравшийнаибольшее количество баллов по такой шкале рассматривается как дающийсоциально одобряемые ответы, а поэтому его показатели по тесту могут бытьпроигнорированы. Хотя Eysenck и Eysenck (1976), исходя из факторного анализазаданий теста EPQ утверждают, что шкала лжи измеряет определенную личностнуюпеременную, для практического тестирования со значительным потоком испытуемыхэтот прием для обнаружения установки на социально одобряемые ответы весьмаполезен.
Вот некоторые типичные утверждения шкалы лжи: «Яникогда не лгу»; «Я всегда прихожу вовремя на встречи исвидания»; «Я всегда плачу за проезд на транспорте».
Адекватный анализзаданий и валидизация теста
Несмотря на все сказанное, я по-прежнему утверждал бы, чтопри соответствующем анализе и отборе заданий во время разработки теста, притщательной валидизации теста, как и в случае с установкой на согласие, влияниемтенденции к социально одобряемым ответам можно пренебречь.
(1) Анализ заданий. По определению, наличие в тестезадания, провоцирующего социально одобряемые реакции, должно приводить к тому,что распределение ответов на него будет смещено, то есть не будетсоответствовать нормальному распределению. Таким образом, устранением из тестазаданий с распределением ответов, отличным от нормального, мы избавимся отдействия установки на социально одобряемые ответы. Более того, если большинствозаданий дают нормальное распределение ответов и они нагружены некоторым общимфактором, тогда установка на социально одобряемые ответы не может оказыватьсильное влияние и на другие задания, относящиеся к тому же фактору. Подобныеаргументы приводятся при анализе заданий с использованием бисериальнойкорреляции результатов выполнения каждого задания с общим показателем по тесту.Таким образом, при адекватном анализе те задания, результат выполнения которыхподвержен влиянию установки на социально одобряемые ответы, должны бытьустранены, если только, по нелепой случайности, все задания, выбранные нами длятеста, не оказались измеряющими эту черту. Возможность возникновения этойситуации должна проверяться при валидизации теста.
(2) Валидизация теста. Более важной процедурой, нежелипроверка на тенденцию к социально одобряемым ответам, является валидизациятеста. Если мы покажем, что тест валиден, то тогда не имеет значения, влияет лина его выполнение установка на социально одобряемые ответы, или нет. Один изпутей доказательства того, что тест свободен от действия установки на социальноодобряемые ответы, — показать при исследовании валидности, что он не связан сошкалой социальной желательности Кроуна-Марлоу (Crowne-Marlowe SocialDesirability Scale; Crowne и Marlowe, 1964), шкалой, coстоящей из явносоциально желательных (нежелательных) утверждений.
Выводы относительноустановки на социально одобряемые ответы
Нет сомнения, что установка на социально одобряемые ответыможет влиять на результаты выполнения заданий, и, следовательно, на показателитестов личности. Несмотря на это, ее влияние может быть минимизировано. Вотнекоторые выводы:
(1) Следует всячески избегать заданий с явно социально желательнойили нежелательной окраской.
(2) Процедура анализа заданий позволит устранить тезадания, ответы на которые явно смещены в одном направлении («да» или«нет»).
(3) Должна быть всегда продемонстрирована валидность теста,что позволит окончательно устранить все задания, в ответах на которыесказывается установка на социальную желательность.
(4) Нет необходимости предпринимать столь тщательноразрабатываемые меры предосторожности против установки на социальнуюжелательность, как это делал Edwards (1957).
Другие установки наответы
Тенденцияподтверждать крайние ответы
Это тенденция, сказывающаяся в рейтинговых шкалах и такихтестах, как, например, тест личностных шкал Комрея (Cornrey Personality Scales;Cornrey, 1970), то есть тех, в форму заданий которых входят рейтинговые шкалы.С моей точки зрения, преимущества рейтинговых шкал (в плане чувстваудовлетворения у тех испытуемых, которые полагают, что на вопросы лучшеотвечать в такой форме) сводятся на нет проблемами, возникающими с темииспытуемыми, которые склонны подтверждать крайние ответы. Для того, чтобы неспутать их с лицами, имеющими высокие показатели по тесту, сбалансированнаяшкала уже не поможет, потому что при такой установке каждый из крайних пунктовшкалы одинаково привлекателен. Единственный способ избежать этой проблемы — неиспользовать задания данного типа. Если же мы по каким-либо причинам вынужденыиспользовать такие шкалы, то тщательный анализ заданий и валидизация переменныхтеста, вероятно, смогут устранить те вопросы (утверждения), которые особеннопобуждают испытуемых проявлять эту установку.
Как утверждает Guilford (1959), наиболее благоприятнойпочвой для проявления любых установок на ответы являются те задания, которыенеопределенны, неоднозначны и неконкретны. Значение этого утвержденияневозможно преувеличить. Формулирование заданий путем следования указанным вышеправилам позволит минимизировать влияние установок. Более того, тщательнаявалидизация теста продемонстрирует, что влияние этих искажающих факторовнезначительно. Однако, это влияние не будет столь несущественным, если не будутприняты меры предосторожности. Применительно к установкам на крайние ответыможем рекомендовать избегать использовать задания типа рейтинговых.
Тенденция кподтверждению средних значений
Несомненно, лучший способ избежать проявления этойустановки — это использовать дихотомические задания. Однако, у некоторыхиспытуемых возникают сложности при работе с дихотомическими заданиями. Онисчитают, что на них невозможно отвечать, а поэтому (для этих испытуемых)желательно введение некоторой средней категории ответов. Исследования (Bendig,1959) показали столь высокую корреляцию между дихотомическими итрихотомическими заданиями, что риск проявления побочных явлений, подобныхобсуждаемому, не оправдывает использования последних.
Хорошо сформулированные задания могут быть написаны так,что выбор средней категории не будет притягательным для испытуемых. Этакатегория ответов особенно привлекательна тогда, когда оба крайних значения вравной степени не затрагивают, безразличны для испытуемых. Например: «Чтобы вы предпочли: (а) осмотреть консервный завод; (б) пойти в местный музей; (в)не знаю?» Как могут быть выявлены такие вопросы при проверке теста в томслучае, когда мы используем дихотомические задания? Автор данной книгииспользовал такой прием: во время проверки теста он снабдил его специальнойинструкцией, в которой указывалось, что все задания, при выполнении которыхиспытуемым потребовалась средняя категория ответов, должны быть помеченыкрестиком. От тех заданий, которые часто отмечаются таким образом, лучшеотказаться, если только они не оказались особенно эффективными в ходе анализазаданий.
Задания, для которых необходима средняя категория ответов,не смогут пройти процедуру анализа и будут автоматически устранены, аисследование валидности может показать, что установка на средние ответы неявляется существенным источником ошибок.
Довольно об установках на ответы. Если будут использоватьсяте приемы, о которых речь шла выше, то мы склонны полагать, что влияниеустановок на ответы будет минимальным. Дальнейшая валидизация тестов покажет,действительно ли это так.
Содержание вопросов(утверждений)
До сих пор при обсуждении принципов конструирования заданийосновное внимание уделялось их форме. При этом мы предполагали, что знаем,какие черты (особенности) пытаемся тестировать. Тем не менее, справедливо былобы спросить, каким же именно образом мы принимаем решения о содержании заданий.Трудно делать общие заключения об этом, поскольку многое зависит отособенностей конкретной области поведения, для диагностики которой мы хотимразрабатывать тест личности. Чтобы проиллюстрировать, как принимать решения осодержании тестов, я приведу несколько примеров.
Теоретическийпример
Kline (1968) выполнил экспериментальное исследованиеособенностей анального характера (Freud, 1908), в ходе которого дляконструируемого теста было поставлено большое количество эмпирических задач.Существует ли анальный характер? Если да, то измеряется ли он другимиличностными опросниками? Имеет ли он отношение к научению ребенка справлятьбольшую нужду? Изменяется ли он от культуры к культуре, как следовало быожидать, исходя из психоаналитической теории? Чтобы ответить на эти вопросы,было необходимо сконструировать и валидизировать инструмент для измеренияанального характера. Чтобы сделать это, я должен был решить, какие черты должнывойти в тест.
Далее следует краткое описание того, как содержаниевопросов (утверждений) было отшлифовано, прежде чем они превратились в заданиятеста. Получившийся в результате этого тест (Ai3Q), похоже, выдержал подробныекритически проверки (см. Kline, 1978). Были подробно изучены психоаналитическиеописания анального характера (напр., Abraham, 1921; Jones, 1923; Menninger,1943), и составлен список всех черт и специфических примеров поведения. Примерыиз публикации Jones (1923) перечислены ниже.
(1) Промедление в удовлетворении потребностей, доводимое доих интенсивной концентрации, монотонная настойчивость, своевольнаянезависимость — уверенность, что никто не может сделать что-либо так хорошо,как он сам.
(2) Неспособность перепоручать работу.
(3) Мелочное внимание к подробностям.
(4) Нежность к детям.
(5) Склонность к доминированию.
Подобным образом был собран длинный подробный список черт иособенностей поведения. Затем они были преобразованы в задания теста сиспользованием всех тех правил и приемов, которые обсуждались в данной главе.
Практический пример
Нет сомнений в том, что полезно иметь инструмент дляизмерения агрессивности, например, в центре по перевоспитанию правонарушителейили для малолетних заключенных. Основным подходом в этом случае было бысоставление списка всех проявлений агрессивности, которые только можновообразить, преобразование их в задания и апробация на соответствующей выборке.Следует отметить, что при таком подходе не стоит вопрос о том, что естьагрессия как личностное измерение. Для этого необходимо специальноеисследование. Так, факторный анализ заданий продемонстрировал бы, есть литолько одно измерение, ряд коррелирующих между собой измерений, нескольконекоррелирующих измерений или ни одного реального синдрома поведения, которыемогли бы быть значимо описаны как агрессивность.
Получениесодержания задания
Возвращаясь к нашему примеру, отметим, что есть наборпризнаков агрессивного поведения, которые бы могли быть использованы взаданиях: постоянно дерется (не в шутку); когда раздражен, вступает в драку полюбому поводу; использует в драке разбитые бутылки; носит с собой бритвы,кастеты, велосипедные цепи, складные ножи, ремни с металлическими бляхами,имеет тяжелые ботинки; бьет упавших противников ногами; избивал кого-либо допотери сознания; страдал от несправедливости и оскорблений; кричит, еслираздражен; разбрасывает вещи по комнате; лжет, чтобы раздразнить конкурентов;придумывает страшные истории. Затем подобный список при помощи приемов,описанных в данной главе, может быть преобразован в задания теста.
Заключение
При тех сложных и неизбежно неточных инструкциях дляконструирования заданий тестов личности, приведенных в данной главе, наиболееценным может оказаться краткое пошаговое описание интересующей нас процедуры.Оно и приводится ниже. Полное обоснование всех этих положений содержится втексте главы.
(1) Перечислите черты и особенности поведения из описаний впсихологической литературе.
(2) Преобразуйте описание каждой черты или особенностиповедения в задание. Это лучше всего сделать при помощи обычных форм заданийопросников: (а) дихотомических заданий (типа «да-нет»); (б)трихотомических заданий (типа «да-?-нет»): (в) альтернативныхзаданий; (г) заданий типа «нравится-не нравится»; (д) заданий свынужденным выбором; (е) заданий с рейтинговыми шкалами. Выбор формы заданиязависит от особенностей используемого материала и оценки преимуществ инедостатков каждого типа заданий.
(3) Независимо от используемого типа заданий старайтесь,чтобы назначение каждого задания не было слишком очевидным.
(4) формулируйте каждое задание понятно и недвусмысленно.
(5) Насколько возможно, обеспечьте, чтобы каждое заданиеотносилось к какой-либо конкретной области поведения.
(6) В каждом задании должен содержаться только один вопросили одно утверждение.
(7) Избегайте использовать термины частоты и другиесубъективные выражения.
(8) Когда это возможно, задания должны касаться поведения,а не чувств и отношений.
(9) Обеспечьте, чтобы ответы на задания давались быстро.
(10) Избегайте влияния основных установок на ответы, такихкак установка на согласие и установка на социально одобряемые ответы.
(11) Вероятность проявления установки на согласие лучшевсего уменьшается формулированием понятных заданий и использованиемсбалансированных шкал.
(12) Проверьте при помощи процедур анализа заданий то, чтотенденция к согласию — несущественный фактор.
(13) Установки на социально одобряемые ответы легче всегоизбежать путем тщательного формулирования заданий.
(14) Проверьте при помощи техники анализа заданий, чтоустановка на социально одобряемые ответы — несущественный фактор.
(15) Избегайте с помощью адекватной формы заданий влиянияустановок на выбор крайних или средних категорий ответов.
(16) Проверьте при помощи процедуры валидизации, чтовлияние установок на ответы не является существенным. Если тесты валидны, тоустановки на ответы не могут оказывать влияние на их показатели.
Список литературы
Для подготовки данной работы были использованы материалы ссайта psychology.net.ru/