Так же как и медицинское обследование, любое психодиагностическое обследование может существенно повлиять на судьбу человека. Поэтому во всех странах, где психодиагностическая практика широко и интенсивно развивается, она регламентируется как общим профессионально-этическим кодексом, так и специально разработанными профессионально-этическими стандартами в области тестирования и психодиагностики.
Итак, каковы же основные профессионально-этические принципы?
1. Принцип специальной подготовки и аттестации лиц, использующих психодиагностические методики.
2. Принцип личной ответственности.
3. Принцип ограниченного распространения психодиагностических методик (принцип "профессиональной тайны").
4. Принцип обеспечения суверенных прав личности.
5. Принцип объективности.
6. Принцип конфиденциальности.
7. Принцип психопрофилактического изложения результатов.
Как теоретическая дисциплина, общая психодиагностика рассматривает закономерности вынесения валидных и надёжных диагностических суждений, правила "диагностических умозаключений", с помощью которых осуществляется переход от признаков или индикаторов определённого психического состояния, структуры, процесса к констатации наличия и выраженности этих психологических "переменных". Иногда такие правила сравнительно просты, иногда довольно сложны, в одних случаях "встроены" в сам диагностический инструмент, в других - требуют особой работы с диагностическими показателями – стандартного сравнения профилей, расчёта интегральных показателей, сопоставления с альтернативными диагностическими пробами, экспертной интерпретации, выдвижения и отбрасывания гипотез.
Основание, используемое для классификации психодиагностических инструментов, - это характеристика того основного методического принципа, который положен в основу данного приёма. По этому основанию обычно различают:
1. Объективные тесты.
2. Стандартизованные самоотчёты, которые, в свою очередь, включают:
а) тесты-опросники;
б) открытые опросники, предполагающие последующий контент-анализ;
в) шкальные техники, построенные по типу семантического дифференциала Ч. Осгуда [225], и методики классификации;
г) индивидуально-ориентированные техники типа ролевых репертуарных решеток.
3. Проективные техники.
4. Диалогические (интерактивные) техники (беседы, интервью, диагностические игры).
Объективные тесты - это те методики, в которых возможен правильный ответ, то есть правильное выполнение задания.
Общим для всей группы методик стандартизованного самоотчёта является использование вербальных способностей испытуемого, а также обращение к его мышлению, воображению, памяти.
Тесты-опросники предполагают набор пунктов (вопросов, утверждений), относительно которых испытуемый выносит суждения (как правило, используется двух- или трёхальтернативный выбор ответов). Опросники строятся как одномерные или многомерные, включающие целый ряд психологических переменных.
Открытые опросники не предусматривают стандартизованного ответа испытуемого; стандартизация обработки достигается путём отнесения произвольных ответов к стандартным категориям.
Шкальные техники предполагают оценку тех или иных объектов (словесных утверждений, изобразительного материала, конкретных лиц и т. п.) по выраженности в них качества, заданного шкалой (например: "тёплый - холодный", "сильный - слабый"). Обычно используются трёх-, пяти- и семиточечные шкалы. Особый вариант шкалирования - это субъективная классификация, предполагающая выявление субъективной структурации объектов на уровне шкалы наименований.
Индивидуально-ориентированные (идеографические) техники типа репертуарных решёток могут по форме совпадать со шкальными, опросными методами, напоминать беседу или интервью. Их основное отличие от тест-опросников состоит в том, что параметры, которые оцениваются (оси, измерения, конструкты), не задаются извне, а выделяются на основе индивидуальных ответов данного конкретного испытуемого. Отличие этих методов от метода интервью состоит в том, что репертуарные решётки позволяют осуществлять применение современного статистического аппарата и делают довольно надёжными диагностические выводы относительно индивидуальных особенностей субъекта.
Проективные техники основаны на том, что недостаточно структурированный материал, выступающий в качестве "стимула", при соответствующей организации всего эксперимента в целом порождает процессы фантазии, воображения, в которых раскрываются те или иные характеристики субъекта. В клиническом употреблении проективные техники часто строятся на интуиции и теоретической подготовке психодиагноста, которые оказываются необходимыми на этапе интерпретации данных. Исследовательское употребление проективных техник предполагает, как правило, применение контент-аналитических процедур, стандартизирующих обработку данных.
Диалогические техники учитывают, что психодиагност вступает в контакт с обследуемым и достигает наилучших диагностических результатов за счёт специфических особенностей этого контакта, релевантных диагностической задаче.
При конструировании и адаптации тестовых методик используются два класса задач: задачи с предписанными ответами, так называемые закрытые задачи, и задачи со свободными ответами, так называемые открытые задачи. В большинстве нормированных и стандартизированных, то есть психометрически обоснованных, психологических методик используются задачи первого класса. Это относится не только к тестам способностей, интеллектуального развития и др., но и к стандартизированным опросникам, где в качестве задач рассматриваются вопросы или утверждения, на которые необходимо реагировать заранее заданным образом. Задачи второго класса чаще всего формируются для так называемых проективных методик.
До включения в тест задача должна быть оценена с точки зрения объективности, надёжности, валидности, трудности и дискриминативности.
Объективной задача может быть признана тогда, когда она несколькими (не менее трёх) независимыми экспертами-психологами оценивается как соответствующая признаку, который подлежит измерению.
Надёжной задача является, если при её повторном предъявлении она вызывает у испытуемого эквивалентную первому предъявлению реакцию.
Валидной задача считается тогда, когда в соответствии с критерием она чаще всего правильно решается теми испытуемыми, у которых измеряемый признак более выражен, чем у других испытуемых. (Например, в интеллектуальном тесте валидными будут те задачи, которые правильно решают испытуемые с более высоким интеллектом, чем с более низким).
Трудность задачи рассчитывается из соотношения процента правильных ответов на данную задачу с учётом объёма репрезентативной выборки испытуемых. Оптимальными для теста являются задачи, индекс трудности которых равен 50 %.
Коэффициент дискриминативности, или согласованности, отдельной задачи с тестом позволяет оценить, насколько точно задача дифференцирует испытуемых по измеряемому признаку. Он равен коэффициенту корреляции между средним результатом анализируемой задачи (по принципу: правильный - неправильный ответ) и средним первичным результатом по всем задачам теста.
Психологический диагноз предполагает использование и анализ результатов исследования, полученных с помощью различных методик. Причём все данные должны быть представлены в единой шкале, то есть все первичные результаты тестовых исследований необходимо преобразовать таким образом, чтобы они оказались сопоставимыми - стандартизация шкал теста.
Под надёжностью теста понимается степень точности, с которой тест измеряет определённое свойство или способ поведения личности. Надёжность теста – это характеристика точности его как измерительного инструмента, его устойчивости к действию помех (как внешних, так и внутренних). Эмпирическое определение надёжности теста является обязательным условием его допуска для использования в практической деятельности психолога.
В психометрике обоснование получили три метода оценки надёжности тестов:
1) метод повторного тестирования (метод тест-ретест);
2) метод тестирования параллельной, или эквивалентной, формой теста;
3) метод деления, или расщепления теста на части. Оценка надёжности по методу повторного тестирования требует, чтобы тест дважды предъявлялся одной и той же выборке испытуемых через какое-то время. Длительность временного промежутка определяется содержанием и характером задач теста.
Второй метод оценки надёжности теста требует наличия параллельной, то есть эквивалентной, формы теста, например формы "А" и "Б".
епрезентативную выборку испытуемых, на которой проверяется надёжность теста, случайным образом делят на две примерно равночисленные группы. Затем первой группе предъявляются задачи формы "А", а второй группе – задачи формы "Б". Через некоторое время (не более одной недели) задачи формы "Б" решает первая группа, а формы "А" - вторая. После этого для всей репрезентативной выборки испытуемых отдельно вычисляются первичные результаты для форм "А" и "Б", которые затем подвергаются корреляции.
Общим недостатком первых двух методов оценки надёжности теста является то, что они зачастую дают заниженные или завышенные коэффициенты надёжности. Дело в том, что дисперсия результатов, на основе которой рассчитывается коэффициент корреляции, неоднородна по своему составу. Наряду с дисперсией действительных индивидуальных различий в неё входят частные дисперсии, обусловленные влиянием как внутренних, психологических, причин (колебания внимания, усталость и др.), так и внешних (уличный шум, поведение и высказывания исследователя и т. п.). При этом сила и сочетание этих причин в первом и во втором тестировании могут быть различными, и оценить их влияние или полностью их нейтрализовать оказывается невозможным.
Поэтому, особенно при проверке надёжности тестов мощности (например, интеллектуальных тестов) и достижений, предпочтение следует отдавать третьему методу, поскольку он предполагает лишь однократное тестирование. Третий метод оценки надёжности включает два различных приёма расчёта: разделение тестовых задач на две части, например по принципу "чётные и нечётные", и расчёт коэффициента консистентности задач теста.
Валидность (или обоснованность) всякой процедуры измерения состоит в однозначности (устойчивости) получаемых результатов относительно измеряемых свойств объектов, то есть относительно предмета измерения. Отличие понятия "валидности" от "надёжности" измерения удобно раскрывать с помощью различения "объекта" и "предмета" измерения.
Надёжность - это устойчивость процедуры относительно объектов. Надёжность не обязательно предполагает валидность. В психологии довольно часто возникает такая ситуация, когда исследователь вначале предлагает определённую процедуру измерения, показывает её надёжность – способность устойчиво различать объекты, но вопрос о валидности остаётся открытым.
Устойчивость теста относительно объектов (испытуемых) является необходимым, но не достаточным условием его устойчивости относительно измеряемых атрибутов (свойств) объектов. Надёжность является необходимым, но не достаточным условием валидности. Отсюда понятно основное соотношение психометрики:
валидность < надёжность.
Это означает, что валидность теста не может превышать надёжности теста.
Данное соотношение, однако, неверно трактовать как указание на прямо пропорциональную связь валидности и надёжности. Повышение надёжности отнюдь не обязательно приводит к повышению валидности. В терминах Анны Анастази валидность определяется репрезентативностью теста относительно измеряемой области поведения.
При проверке устойчивости распределения общая логика основывается на индуктивном рассуждении: если "половинное" (полученное по половине выборки) распределение хорошо моделирует конфигурацию целого распределения, то можно предположить, что это целое распределение будет также хорошо моделировать распределение генеральной совокупности.
Таким образом, доказательство устойчивости распределения означает доказательство репрезентативности тестовых норм.
Репрезентативность критериальных тестов. В тестах по критерию в качестве реального эталона применяется критерий, ради которого создаётся тест – целевой критерий. Особое значение такой подход имеет в тех областях практики, где высокие результаты могут дать узкоспециализированные диагностические методики, нацеленные на очень конкретные и узкие критерии. Такая ситуация имеет место в обучении: тестирование, направленное на получение информации об уровне усвоения определённых знаний, умений и навыков (при профессиональном обучении), должно точно отражать уровень освоения этих навыков и тем самым давать надёжный прогноз эффективности конкретной профессиональной деятельности, требующей применения этих навыков.
Процентильная шкала. Когда в качестве единственного эталона измерения психодиагностами рассматривается сам тест, то в качестве меры измеряемого свойства выступает местоположение балла на кривой распределения. Применяется Процентильная шкала. В качестве универсальной меры, пригодной для разных (по своей качественной направленности и количеству пунктов) тестов, используется "Процентильная мера". Процентиль – процент испытуемых из выборки стандартизации, которые получили равный или более низкий балл, чем балл данного испытуемого.
Таким образом, в качестве источника данной меры выступает нормативная выборка (выборка стандартизации), на которой построено нормативное распределение тестовых баллов. Процентильные шкалы лежат в основе всех традиционных шкал, применяемых в тестологии (Точки MMPI, стены 16 PF и др.)
Стандартизация шкалы. В психометрике следует различать две формы стандартизации. Под стандартизацией теста понимают, прежде всего, стандартизацию самой процедуры проведения, инструкций, бланков, способа регистрации, условий и т. п. Без стандартизации теста невозможно получить нормативного распределения тестовых баллов и, следовательно, тестовых норм.
Под стандартизацией шкалы понимают линейное преобразование масштаба нормальной (или искусственно нормализованной) шкалы.
Применение стандартных шкал позволяет прибегать на практике к более грубым, приближённым способам проверки типа распределения тестовых баллов.
Применение стандартных шкал необходимо для соотнесения результатов по разным тестам, для построения "диагностических профилей" по батарее тестов и тому подобных целей.