Текст книги "Психодиагностика"
Автор книги: Евгения Романова
Жанр: Психотерапия и консультирование, Книги по психологии
сообщить о неприемлемом содержимом
Текущая страница: 6 (всего у книги 32 страниц) [доступный отрывок для чтения: 11 страниц]
Отдельного рассмотрения заслуживает вопрос об отношении метода тестов к другим методам психологической науки, в частности к эксперименту.
Довольно часто метод тестов, в действительности родившийся как развитие экспериментального метода, определяют как особую разновидность психологического эксперимента.
Так, в понимании К. К. Платонова тест – это «краткий экспериментально-психологический метод, исследующий тот или иной психический процесс (функциональный тест), личность в целом (проективный тест) или группу» [208].
В то же время многие серьезные исследователи четко разграничивают психологический лабораторный эксперимент, созданный для исследовательских целей, и психологический тест, имеющий отчетливую практическую направленность. Согласно В. Штерну (1922), под психологическим тестом «понимают постановку строго определенной задачи, имеющей целью распознание известного психического свойства. От психологического лабораторного эксперимента тест отличается тем, что он в короткое время и с помощью простых средств определяет характеризующую человека индивидуальную ценность» [307].
В. Штерн в свое время назвал психологический тест испытательным экспериментом (Prufungexperiment) в отличие от классического, исследовательского эксперимента (Fersuhengexperiment) [307; 405]. Различие между ними, согласно В. Штерну, заключается в следующем: в то время как исследовательский эксперимент фиксирует значения нескольких показателей у одного лица, испытательный эксперимент (тест) делает это по одному показателю, зато у многих лиц.
Однако М. С. Бернштейн [34; 35] подверг уничтожающей критике такое деление, считая его механистическим. В частности, он справедливо указал на то, что, с одной стороны, всякий эксперимент представляет определенное испытание для исследуемого лица (отсюда – само понятие «испытуемый»), а с другой стороны, тесты «все более широко применяются в исследовательских целях». Вместе с тем М. С. Бернштейн согласился с тем, что «психологический тест является разновидностью психологического эксперимента» [35]. При этом он отмечал у них следующие общие свойства:
♦ вызывать реакции испытуемых;
♦ обеспечивать упрощение и изоляцию отдельных видов поведения испытуемых;
♦ делать своим предметом лишь определенные психические свойства;
♦ планомерно варьировать стимульные воздействия;
♦ обеспечивать возможность многократного повторения процедуры в отношении одних и тех же испытуемых;
♦ подвергать полученные результаты количественной обработке;
♦ служить средством решения разного рода общепсихологических вопросов (хотя наряду с этим метод тестов, в отличие от эксперимента, в основном применяется в целях практической психодиагностики).
Указанный тезис М. С. Бернштейн подкреплял также ссылками на общность исторического пути, пройденного тестовой методикой, с одной стороны, и обычной экспериментальной процедурой – с другой. Кроме того, в подтверждение своей позиции он приводил многочисленные высказывания видных психологов и тестологов своего времени. Что же касается специфических особенностей метода тестов, то М. С. Бернштейн прежде всего считал необходимым исключить из их числа такие надуманные, по его мнению, черты, как большая, по сравнению с экспериментом, простота, меньшая точность и использование лишь бланковых материалов (в противоположность аппаратурному оборудованию, применяемому в экспериментальных исследованиях). Подлинными же отличительными признаками метода тестов М. С. Бернштейн считал следующие:
1) его функцию служить измерительным инструментом (для чего тест оснащается соответствующими нормами и шкалами);
2) то, что он менее абстрактен и более жизнен, чем эксперимент;
3) его экономичность (проявляющуюся в том, что тестовая методика строится по принципу «необходимого и достаточного», в соответствии с которым и определяется количество составляющих его заданий);
4) наличие четко сформулированных критериев качества (главными среди которых являются валидность и надежность).
Получившая столь разностороннее обоснование тенденция рассматривать метод тестов как разновидность психологического эксперимента еще более усилилась со второй половины 1930-х гг., когда метод тестов подвергся разрушительной критике. В этот период стали говорить о применении в практической психодиагностике метода эксперимента, подразумевая, естественно, под этим термином прежде всего метод тестов [34; 35]. В дальнейшем, однако, по мере того как происходила реабилитация последнего, интерес к выявлению специфических особенностей данного метода вновь усилился.
Так, заключая свое описание методов сбора фактического материала, используемых в психологии, характеристикой метода тестов, А. И. Раев и Л. А. Регуш пишут (1981): «Все вышерассмотренные методы имеют в конечном счете своей целью исследование собственно психических явлений для получения каких-то новых данных, обогащающих психологическую науку. Тесты выполняют другую функцию. Они предназначены для того, чтобы установить наличие или отсутствие уже известных психологических особенностей тех или других испытуемых» [230].
«Экспериментатора, – пишет М. Г. Ярошевский (1976), – интересует детерминационная зависимость наблюдаемых факторов от производящих их причин. Он испытывает набор условий, чтобы установить, функцией каких переменных является данный феномен. При тестировании в отличие от экспериментирования, – продолжает М. Г. Ярошевский, имея в виду начальный этап развития метода тестов, – психолог фиксирует, что люди делают, не варьируя условий их деятельности. Он измеряет полученные результаты при помощи некоторого критерия, регистрируя количественные вариации. Здесь переменными являются индивидуальные различия».
Представляет интерес выяснить, как психологи соотносят метод тестов с другими диагностическими методами.
Среди известных нам характеристик тестов одной из наиболее глубоких представляется попытка видного советского психолога К. Н. Корнилова проанализировать логическую основу данного метода. В опубликованной в 1928 г. и вызвавшей большой резонанс статье «Сравнительная значимость методов научного исследования в области психологии и педологии с точки зрения марксизма» [144] К. Н. Корнилов утверждал, что в отличие от всех других исследовательских методов психологии, имеющих индуктивную природу, метод тестов – это «метод простой дедукции, вывод от общих, установленных индуктивных путем положений к отдельным частным случаям» и что «мы во всяком тестовом обследовании имеем дело с самым обычным типом дедуктивного умозаключения» [144]. Это положение представляется верным в своей основе, хотя и не исчерпывающим. Мы обратимся к нему еще раз, когда будем давать собственную характеристику метода тестов.
Как бы продолжая эту идею, целый ряд авторов, трактуя метод тестов весьма расширительно, включают в данное понятие любую исследовательскую методику, в которой находят применение количественные характеристики. Так, например, к тестам иногда относят стандартизованное (квантифицированное) наблюдение, метод оценочных классификаций (рейтинг), и в том числе различные социометрические методики [2; 3].
С другой стороны, иногда мы сталкиваемся с необоснованным намерением к сужению объема рассматриваемого понятия. Так, например, К. М. Гуревич пишет, в частности: «В книгах по тестологии обычно все виды испытаний именуют одинаково – тестами (далее следуют ссылки на две работы зарубежных авторов. – Примеч. авт.). Поскольку, – продолжает К. М. Гуревич, – все же все эти виды испытаний психологически различны, то и следовало бы назвать их по-разному – психологические задания с детерминирующей поведение испытуемого инструкцией именовать, вслед за Дж. Кэттеллом и Бине, тестами, а все другие так и назвать – методами психологической диагностики с указанием присущей им специфики (психофизиологическая, проективная и пр.)» [87].
Данное предложение не может не вызвать целый ряд вопросов.
Во-первых, что конкретно следует понимать под выражением «психологически различны»? Ведь, как было отмечено в начале нашего аналитического обзора, метод тестов реализуется в сотнях тестовых методик, которые, естественно, психологически различаются в том или ином отношении (по содержанию стимульного материала, по характеру предписываемых реакций и т. д.). Эти различия получают логическое оформление путем выделения различных типов тестовых методик.
Во-вторых, характеризуя объем данного понятия, следует, по-видимому, исходить из определения его содержания, которое, однако, не представлено в цитируемой работе.
В-третьих, нельзя не обратить внимание на противоречие между обсуждаемым предложением и тем определением метода тестов, которое было сформулировано К. М. Гуревичем ранее. Если ранее К. М. Гуревич утверждал, что тестами следует считать лишь психофизиологические испытания, то теперь он, наоборот, предлагает такие испытания из объема рассматриваемого понятия исключить.
Подобная противоречивость суждений может быть объяснена, в частности, недостаточной разработанностью вопроса о логической структуре и гносеологической сущности метода тестов.
Нельзя сказать, что этот вопрос совершенно не обсуждался в тестологической литературе [2; 3].
Как мы уже отмечали, ряд зарубежных авторов связывают познавательные возможности данного метода с идеей выборки, однако при этом не затрагивается главный ее аспект – принципы построения таких выборок, процедурная и критериальная основа метода тестов.
Целесообразно придерживаться разных требований к психодиагностическим методикам разного типа.
1. Измерительные методы (тесты) должны удовлетворять следующим требованиям:
а) должны быть однозначно сформулированы цели, предмет и область применения методики. Предмет, диагностический конструкт (концепт) должен быть сформулирован в теоретических понятиях и соотнесен на теоретическом уровне с системой релевантных концептов. Должна быть четко выделена область применения, под которой подразумевается особая социальная среда или сфера общественной практики (производство, медицина, семейная жизнь и т. п.), контингент испытуемых (пол, возраст, образование, профессиональный опыт, должностное положение). Должны быть конкретизированы цели использования результатов: для прогноза успешности профессиональной деятельности, для психологического вмешательства, для принятия правовых, административных решений, для прогноза стабильности коллектива и т. п.;
б) процедура проведения должна быть задана в виде однозначного алгоритма, пригодного для передачи лаборанту, не имеющему специальных психологических знаний, или ЭВМ, используемой для предъявления заданий и анализа ответов;
в) процедура обработки должна включать статистически обоснованные методы подсчета и стандартизации тестового балла (по статистическим или критериальным тестовым нормам). Выводы (диагностические суждения) на основе тестового балла должны сопровождаться указанием на вероятностный уровень статистической достоверности этих выводов;
г) тестовые шкалы должны быть проверены на репрезентативность, надежность и валидность в заданной области применения. Другие разработчики и квалифицированные пользователи должны иметь возможность повторить стандартизированные исследования в своей области и разработать частные стандарты (нормы);
д) процедуры, основанные на самоотчете, должны быть снабжены средствами контроля за достоверностью, позволяющими автоматически отсеивать недостоверные протоколы;
е) головная методическая организация определенного ведомства области применения должна вести банк данных, собранных по тесту, и производить периодическую коррекцию всех стандартов методики.
2. Экспертные методы:
а) данный пункт повторяет содержание пункта а) для тестов. Дополнение: инструкция по применению снабжается указанием на требуемую квалификацию экспертов, их необходимое количество для получения надежных данных по методу независимых оценок;
б) инструкции к проведению должны пройти специальные испытания на однозначность их выполнения экспертами по отношению к некоторому эталонному набору данных (текстов, рисунков, звуко– или видеозаписей и т. п.);
в) процедура обработки результатов должна включать в себя такое документирование промежуточных этапов обработки, которое позволило бы перепроверить конечный результат другому эксперту;
г) пользователи-разработчики должны иметь возможность воспроизвести (повторить) нормативное исследование по измерению экспертной согласованности на эталонном наборе данных;
д) головная организация должна вести банк данных, обеспечивая подготовку пользователей и переподготовку (в соответствии с пересмотренными стандартами методики).
Любая методика, не удовлетворяющая перечисленным выше требованиям, не может считаться профессиональной психодиагностической методикой. Методики должны проходить аттестацию в рамках головных методических организаций, в обязанности которых входит составление библиотек «аттестованных психодиагностических методик». Вся инструктивная литература по методикам, не прошедшим аттестацию, не может считаться годной для применения в практической психологии.
Это не исключает возможности применения неаттестованных методик в исследовательских целях.
3.4. Критерии оценки качества тестовых процедурЗа несколько десятилетий, истекших с момента, когда задача интенсивной разработки психодиагностических методик вновь была выдвинута в число наиболее актуальных проблем советской психологии [43; 44; 61; 76], по рассматриваемой проблеме проделана значительная работа. В публикациях Б. Г. Ананьева [11–15]; А. А. Бодалева, М. Д. Дворяшиной, И. М. Палея [220]; Д. Б. Богоявленской [42]; В. М. Блейхера и Л. Ф. Бурлачука [37]; Л. А. Венгера [60; 61]; П. Я. Гальперина [70]; К. М. Гуревича [87]; В. В. Давыдова [88]; Ю. М. Забродина [99–105]; Г. М. Зараковского [108]; И. И. Ивановой и В. Г. Асеева [119]; З. И. Калмыковой [218]; А. Г. Ковалева и В. Н. Мясищева [136]; Б. Б. Коссова [145]; Г. С. Костюка [147]; A. Н. Леонтьева [162]; Б. Ф. Ломова [169]; Н. А. Менчинской [181]; В. Г. Норакидзе [193]; А. В. Петровского [206]; К. К. Платонова [208]; Я. А. Пономарева [209]; А. И. Раева и Л. А. Регуш [230]; Е. Ф. Рыбалко [12]; А. А. Смирнова и Е. И. Степановой [262]; Ю. Л. Сыэрда [274]; Н. Ф. Талызиной [275]; Б. М. Теплова [278; 281]; Д. Б. Эльконина [310]; В. А. Ядова [317]; И. С. Якиманской [318] и других отечественных исследователей сформулированы наиболее общие требования, реализация которых должна, по мысли авторов, обеспечить оптимизацию тестовых методик по критериям их научной достоверности и практической эффективности.
Значительное число исследований посвящено разработке критериально-оценочного аппарата тестологии. В них обсуждаются широко известные и теперь уже общепринятые положения, касающиеся критериев качества психологических тестов. Такими критериями являются: надежность, валидность, прогностическая ценность, объективность, а также доступность и удобство практического использования. Выделим характеристики некоторых из них, поскольку по отношению к ним не возникает каких-либо вопросов.
Критерий объективности применительно к психологическим тестам имеет три значения. Два из них являются общими для всех психологических тестов. Это, во-первых, стандартность условий тестирования по отношению ко всем испытуемым и, во-вторых, строгая регламентация процедуры оценивания, обусловливающая выставление одной и той же оценки за данный результат любым количеством оценщиков. Третье значение – специфическое для личностных тестов – заключается в обеспечении независимости результатов теста от возможных попыток их сознательного искажения испытуемым [2; 3; 69].
Под доступностью и удобством практического использования понимаются прежде всего относительная простота и кратковременность процедуры тестирования и оценивания, отсутствие высоких требований к квалификации персонала, осуществляющего тестирование, а также дешевизна стимульной части теста (аппаратов, оборудования, буклетов и т. д.).
Что касается прогностической ценности, то это – одно из основных требований к тестам – исходит от заинтересованных практиков и в течение уже многих лет представляет собой основную «область уязвимости» для критиков-теоретиков. Вместе с тем в отечественной литературе имеется особое мнение о специфике прогностической ценности тестовых измерений [см. 102; 104]. Здесь речь идет о возможности использовать данные психодиагностики для прогноза поведения субъекта:
♦ в другой ситуации;
♦ в «другом субъекте»;
♦ в другое время;
♦ в другой задаче.
Выделяются два типа прогноза: эмпирический, основанный на принципе простого «переноса» данных в области «малых изменений», и теоретический, основанный на применении теоретических моделей явлений. Если эмпирический прогноз теснейшим образом связан с идеей «подобия» ситуаций, субъектов, движений во времени и в пространстве задач, то теоретический прогноз оказывается связанным с проблемой интерпретации и «силой и мощностью» теоретической модели. Эта проблема затрагивает проблемы «перекрестной валидизации» и имеет непосредственное отношение к связке: «данные тестового измерения – математическая модель обработки данных – психологическая модель явления (субъекта) – психическая регуляция noведения – прогноз поведения».
3.5. Оценка надежности тестовНесмотря на кажущуюся простоту, данная проблема постоянно находится в фокусе внимания психометристов, порождая нескончаемый поток публикаций [72; 73; 138; 147]. Публикации, посвященные различным аспектам надежности, начали появляться и в советской литературе [75; 79; 87; 184; 274; 277].
В современной психометрии стало уже привычным в качестве фундаментальных характеристик пригодности теста как измерительного инструмента выделять его надежность и валидность.
Однако, несмотря на все возрастающее внимание к проблеме надежности, многие ее аспекты остаются недостаточно разработанными, дискуссионными. Как отмечается в одной из последних работ по психологическому тестированию, изданных за рубежом [325], в течение многих десятилетий усилия исследователей концентрировались главным образом на совершенствовании методов, посредством которых оценивается согласованность измерения, и лишь сравнительно недавно взоры стали обращаться к вопросам, связанным с установлением причин, обусловливающих недостаточную надежность тех или иных тестов.
Поэтому и в подходах к трактовке различных аспектов этого понятия, в интерпретации конкретных коэффициентов надежности, наконец, в понимании взаимосвязи надежности и валидности все еще сохраняется немало спорных, а то и просто неосвещенных моментов. В частности, недостаточно четко специфицированы отдельные аспекты надежности, остаются «белые пятна» и в вопросе о факторах, создающих погрешность измерения, недостаточно проанализированы и пути повышения надежности тестовых методик. Все это делает проблему надежности одной из наиболее актуальных в современной тестологии.
Надежность (reliability — англ.) теста – это характеристика точности его как измерительного инструмента, устойчивости его к действиям помех (состояние испытуемых, их отношение к процессу тестирования и др.).
При разработке теста на базе репрезентативной выработки исследователь отбирает задачи, вопросы (или модифицирует их) таким образом, чтобы распределение реальных тестовых оценок было по возможности близко к нормальному. Величина дисперсии в этом случае считается истинной и обозначается через D или s2.
Каждый член тестированной выборки занимает свое определенное место на шкале «сырых» оценок и шкале стандартных отклонений. Теоретически это место для каждого члена выборки должно быть постоянно. Повторное выполнение теста теми же испытуемыми должно давать такое же распределение мест на указанных шкалах, как и в первый раз. В этом идеальном случае тест считается абсолютно надежным. На практике оценка и места испытуемых в результате повторного тестирования часто меняются. Распределение в этом случае в большей степени отличается от нормального, чем исходное, принятое за эталонное, истинное.
Для такого распределения величина дисперсии выше, чем s2 на величину дисперсии ошибки измерения: s2х = s2 + s22.
Надежность теста определяется, как правило, по окончании процедуры анализа задач и составления окончательной формы теста. Метод повторного тестирования (ретестирования) является основным при определении надежности теста. Метод повторного тестирования чаще всего находит применение при контроле надежности скоростных тестов и опросников. Наиболее простой способ нахождения коэффициента надежности заключается в расчете коэффициента полной корреляции (по Пирсону) между результатами первого и второго тестирования у группы испытуемых.
Тест считается надежным, когда коэффициент надежности находится в пределах 0,6 ± 0,1. Случаи, когда r < 0,6, должны рассматриваться особо.
Правообладателям!
Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.Читателям!
Оплатили, но не знаете что делать дальше?