![](/books_files/covers/thumbs_240/differencialnaya-psihologiya-i-psihodiagnostika-izbrannye-trudy-53945.jpg)
Автор книги: Константин Гуревич
Жанр: Общая психология, Книги по психологии
сообщить о неприемлемом содержимом
Текущая страница: 25 (всего у книги 35 страниц) [доступный отрывок для чтения: 12 страниц]
Но «знать» это одно, а уметь логически обработать – другое. Последнее зависит не от одного владения правилами логической обработки, но и от признаков, выделяемых для такой обработки.
Поэтому специфика материальной наполненности теста, с одной стороны, и особенности выборки или совокупности испытуемых – с другой, приводят в различных их сочетаниях к неодинаковым характеристикам надежности одного и того же психологического теста при его повторных проверках. Это признается современной тестологией. Как можно заключить, тестологи не считают надежность неотъемлемым признаком самого теста. Отсюда возникают требования к четкому описанию выборок, на которых устанавливалась надежность.
Так, авторы «Стандартных требований…» пишут:
«В руководящих указаниях по применению теста при сообщении данных о надежности… выборки должны быть описаны достаточно подробно, чтобы лицо, пользующееся тестом, могло судить, в какой мере приведенные данные приложимы к тем испытуемым и к тем проблемам, с которыми оно имеет дело». В комментарии, сопровождающем это требование, содержатся такие указания: «…надежность теста, предназначенного для отбора работников, должна быть установлена путем тестирования кандидатов (из числа которых будет произведен отбор), а не студентов колледжа и не лиц, уже состоящих на работе» (Standards for Educational and Psychological Test, 1974, § Г. 2).
Мало того, выдвигается и такое пожелание: «В руководящих указаниях по применению теста следует представлять демографическую информацию – распределение испытуемых по возрасту, полу, социально-экономическому и интеллектуальному уровню, трудовому статусу, биографии и времени пребывания в данной группе» (Standards for Educational and Psychological Test, 1974, § Г. 2.21).
Из сказанного вытекает, что исследователя не может удовлетворять информация о том, что надежность теста по сведениям, которые приводятся автором теста, достаточно высока. Совершенно необходимо проверить эту надежность в тех условиях, в которых тест будет применяться, с учетом всех тех особенностей, которые присущи интересующей исследователя выборке или популяции.
И сами диагностируемые свойства обнаружат себя по-разному, в зависимости от того, какой материал и какой выборке будет предъявлен для работы. Допустим, диагностируется некое элементарное умение обобщать, однако степень познанности испытуемыми материала, на котором изучается это умение, жизненный опыт в выделении функциональных признаков, подлежащих обобщению, – все это неизбежно отразится на конечных результатах работы испытуемых. Следовательно, диагностироваться будет не одно лишь элементарное умение обобщать, но и то, насколько близки испытуемым конкретные объекты, предлагаемые им в тесте.
Известно, что нередко испытуемые дают абсурдные ответы на вопросы или задачи теста, хотя, казалось бы, эти вопросы и задачи ничего трудного в себе не содержат. Если исключить из рассмотрения возможные случаи патологии и оставаться в рамках работы с людьми, обладающими нормальным мышлением, то абсурдные ответы, по-видимому, можно объяснить тем, что испытуемый, не имея опыта логической обработки объектов, в которых представлены задачи теста, начинает искать ответы по ассоциации, по случайным реминисценциям и т. п. Такого рода ответы не должны обмануть психолога-экспериментатора: понятно, что он, как специалист, не имеет права их оценивать в качестве доказательства алогичного мышления данного субъекта. Скорее всего, подобные ответы нужно отнести к категории так называемых «вынужденных». Испытуемый считает себя обязанным (раз он согласился участвовать в опыте) что-то ответить. Но он не умеет логически обрабатывать чуждый ему материал, у него нет такого опыта, само осознание правил такой обработки ему никогда ранее не требовалось. Это может быть и не единственная, но существенная и часто встречающаяся причина нелепых ответов. Заметим, что в истории применения тестов встречались исследования, в которых авторы описывали случаи тестирования своеобразных по национально-культурно-му составу выборок и на основании полученных результатов пытались делать заключение о каких-то особенностях мышления участников тестирования. Между тем здесь было бы более уместно говорить не об особенностях мышления как такового, а о своеобразии словарно-понятийного запаса испытуемых и о сложившихся в их практике способах его логической обработки. В не столь резко выраженном виде вопрос этот постоянно стоит перед психологом. Поэтому надежность, установленная на одной выборке, совсем не обязательно будет воспроизведена на любой другой.
Сказанное относится не к одним лишь интеллектуальным тестам, но также и к перцептивным, моторным и всевозможным тестам «специальных способностей». Вообще нет психологических тестов, которые не затрагивали бы прошлый опыт испытуемых, их знания и умения. Отсюда вытекает, что материальная наполненность теста, объекты, из которых построены задания, действия, которые нужно выполнить испытуемым, – все это ставит выборки, представляющие различные совокупности в не вполне одинаковые условия, а следовательно, коэффициенты надежности, полученные на различных выборках, могут сильно расходиться между собою.
Представляется необходимым более подробно остановиться на том, как должна устанавливаться надежность испытуемой функции. Адекватный прием установления этой надежности – повторное тестирование. Однако при использовании этого приема перед психологом неизбежно встает такой вопрос: если тесты действительно испытывают психологические свойства или функции, то совершенно неизбежно то, что эти диагностируемые признаки лишь в исключительных случаях останутся через достаточно длительный срок по своему уровню неизменными. В общем, чем короче срок от первого до второго испытания, тем – при прочих равных условиях – больше шансов, что диагностируемые психологические признаки сохранят зафиксированный уровень первого испытания, а чем срок больше, тем шансы на сохранение уровня будут ниже. Следовательно, как будто целесообразно проводить повторное тестирование через короткий срок после первого. Но тут есть и другая сторона дела: если повторить тестирование через небольшой срок, то испытуемые – по крайней мере, некоторые из них – попытаются воспроизвести свои прежние ответы по памяти и, следовательно, отойдут от смысла выполнения заданий.
Вряд ли можно подсказать исследователю, какой срок можно считать оптимальным (хотя такие сроки указываются некоторыми авторами руководств по тестированию).
Специалист, исходя из психологической сущности теста, условий, в которых тест предлагается испытуемым, считаясь с характеристиками групп испытуемых, должен сам выбирать такой срок. Естественно, что выбор должен получить научное обоснование с учетом только что перечисленных и, возможно, каких-то еще моментов. Так, например, если диагностируемое свойство психики таково, что как раз в период проведения тестирования оно интенсивно развивается, то при проведении повторных испытаний вряд ли можно даже при относительно небольшом разрыве во времени между повторным и первым испытаниями рассчитывать на получение высокого коэффициента надежности – процесс интенсивного развития, очевидно, приведет к тому, что обозначится разница между испытуемыми: одни пройдут его с большим, другие – с меньшим успехом, а это, в свою очередь, может зависеть от мотивации, от усвоенных приемов работы над материалом, контактов с учителями и многого другого. Можно полагать, что менее интенсивный процесс развития в данной выборке испытуемой функции может обеспечить более высокие показатели надежности.
Поэтому нельзя признать достаточным простое указание на то, что проводилось повторное тестирование и что при корреляции установлен такой-то коэффициент надежности. Исследователь, предлагающий читателю результаты своего тестирования, возможно претендующий на популяризацию своей методики, должен кратко и ясно описать не только процедуру установления надежности, но и обоснование избранного им срока от первого до повторного тестирования. Психологический тест, диагностирующий свойство, которое в период испытания находится в процессе интенсивного развития, допустим умение обобщать (во время прохождения некоторых разделов курса математики), может характеризоваться не очень высоким коэффициентом надежности, что, разумеется, не может быть истолковано как недостаток методики. Иными словами, коэффициент надежности, получаемый при сопоставлении первого и повторного тестирования, не следует рассматривать только с его узко формальной стороны, по его абсолютному значению, он должен интерпретироваться как показатель определенных изменений, развития исследуемого свойства. Вероятно, в некоторых случаях исследователю, представляющему свой тест, следовало бы рассмотреть по частям ту выборку, на которой устанавливалась надежность. При таком рассмотрении выделится часть выборки, люди, прошедшие сходный путь развития, а также другая часть, где развитие испытуемых шло особенно быстрыми темпами, и часть выборки, где развития у испытуемых практически совсем нельзя заметить. Каждая часть выборки заслуживает специального анализа и истолкования.
Совершенно другие требования к надежности должны быть предъявлены к методикам (или тестам), диагностирующим стойкие природные, а тем более – генетически обусловленные психофизиологические особенности, например свойства нервной системы в их физиологических показателях. Коэффициенты надежности при сопоставлении первого и повторного испытания даже при значительных сроках, отделяющих первое от повторного, тут должны быть достаточно высоки. Только специфические функциональные состояния испытуемых могут снизить эту надежность. Таким образом, вопрос о надежности того психологического или психофизиологического свойства, которое испытывается тестом, не решается всегда однозначно. Решение зависит от сущности самого диагностируемого свойства.
Мы осветили некоторые важные стороны вопроса надежности психологических диагностических методик. Исследователь может разрабатывать тесты для решения своих частных задач, например задач теоретического порядка, не связанных с диагностическими и прогностическими целями. Установление валидности подобных тестов не может считаться обязательным делом. Однако если результаты тестирования могут хотя бы в малейшей степени повлиять на судьбу людей, проходивших испытания, необходимо знать, насколько тест пригоден для того, чтобы выполнить свое назначение, и насколько высока вероятность того, что результаты тестирования отражают такие стойкие индивидуально-психологические особенности людей, которые реализуются в их учебной и производственной деятельности и так или иначе влияют на ее успешность и эффективность.
Психолог, работающий в области психологической диагностики, должен знать, каков сложившийся в настоящее время аппарат установления валидности, какие трудности и неясности возникают при его использовании. Но это особый вопрос, хотя и тесно соприкасающийся с вопросом о надежности, он требует специального рассмотрения.
1.2. Статистика – аппарат доказательства психологической диагностикиКонструирование психолого-диагностических методик ставит перед психологом два вопроса.
1. Какие признаки, какие психологические или психофизиологические особенности должны быть выделены в качестве объекта диагностирования?
2. Как построить методику, как доказать, что полученные с ее помощью данные диагностируют выделенные признаки, другими словами, что методика отвечает замыслу?
Первый вопрос – вопрос о содержании методики. Ответ на него должен раскрыть ту психологическую или психофизиологическую реальность, в изучении которой – по теоретическим или практическим соображениям – заинтересован психолог. Такой ответ может дать только психологическая теория. Только она может с надлежащей компетентностью обозначить объекты диагностирования, их «гомологию» и иерархию. Понятно, что диагностика служит не только для того, чтобы подтверждать гипотезы, она может и опровергать их, и выдвигать новые. Но диагностируемые признаки в конечном счете систематизируются теорией.
Однако нередко при психологическом диагнозе пренебрегают теорией, а стремясь якобы приблизиться к требованиям практики, оперируют случайным и неустойчивым набором теоретически неясных психологических признаков человека и не заботятся о том, чтобы научно обосновать объект диагностирования и ввести его в систему теоретических понятий. В конечном счете это отражается на самой методике и на эффективности ее применения. Пора уже признать, что решающее слово в определении объекта психологической диагностики принадлежит теории. Тестология избегала такого признания, и это отнюдь не пошло ей на пользу. Только в последние годы эмпирика в тестологии начинает уступать место вытесняющей ее теории.
Недостаточную теоретическую обоснованность того, что диагностируется, тестология пыталась возместить детально разработанной техникой диагностирования, обработки, сопоставлений и пр. Предполагалось, что созданный для этой цели хорошо продуманный аппарат поднимет полученные результаты на уровень теории, если не общепсихологической, то хотя бы своей собственной, тестологической. Это была бы если не полностью независимая от психологии, то все же относительно самостоятельная теория, теория – «как диагностировать».
Однако при всех достоинствах созданной тестологией методической системы скрупулезной статистической проверки тестов из результатов этой проверки никак не вытекали собственно теоретические принципы. Поэтому и задача внесения этих принципов в тесты посредством применения теории вероятностей и статистики оказалась нерешаемой. Складывались принципы тестирования, но не принципы выделения предметов тестирования. Форма и содержание предстали разобщенными, и стало ясно, что форма не обеспечивает содержание. Необходимо же было обеспечить их единство.
Трудность состоит в том, что признание доминирующей роли содержания никак не означает, будто форме, технике, методической стороне дела можно отводить второстепенное и несущественное место. Диагностика стоит на сравнении, ранжировании, сопоставлении. Для всего этого абсолютно необходима методическая точность, иначе при известной массовости получаемых данных диагностическое исследование теряет смысл. Попробуйте опереться не на методическую строгость, а на «общепсихологическую интуицию» отдельных экспериментов – и вы тотчас же лишитесь критериев, а с ними – и научного содержания диагноза.
Методическая идея, даже если она теоретически обоснована, еще не превращается в методику; для этого должна быть продумана и последовательно осуществлена особая и весьма трудоемкая процедура. Только дилетантам представляется, будто эта процедура для всех методик одинакова и независима от идеи. На деле оказывается, что «доведение» методики, ее проверка есть задача также в большей мере теоретическая и чаще всего требующая как психологической, так и математико-статистической подготовки.
Представление о том, что формальная сторона подготовки методики вроде как не относится к психологу, а может быть передана в руки подсобного специалиста, есть представление ложное. Психолог-диагност должен вникать в суть статистических приемов, которые служат критериальными для его методик, так как эти приемы органически связаны с методическими идеями.
Получившие распространение в наши дни и хорошо обоснованные с математической стороны статистические приемы применялись и применяются в диагностике лишь потому, что они в большей или меньшей степени отвечали и отвечают определенным психологическим воззрениям. Поэтому их нельзя абсолютизировать и применять в любых случаях, как некий статистический универсальный ключ. Неадекватное применение статистических приемов может привести к столь же плачевным результатам, как и пренебрежение к статистике.
В частности, это относится к статистическим приемам проверки надежности и валидности методик и к понятию так называемой «нормы».
Речь идет, таким образом, о том, что статистический аппарат, который необходим в работах по психологической диагностике, не находится вне этой диагностики, это аппарат самой диагностики и ее обслуживания, его назначение состоит в том, чтобы методическая идея была последовательно реализована, чтобы результаты ее истолкования были вполне определенными, чтобы они отличались необходимой доказательностью. Иными словами, статистика есть аппарат доказательства психологической диагностики. Логический смысл самой теории как бы теряет силу с того момента, как методика поступает в руки экспериментаторов, работающих часто изолированно друг от друга по месту и времени. С этого момента вступает в силу аппарат методики, прежде всего «статистика, с ее неукоснительными правилами сбора, обработки и сопоставлений материала, с ее вероятностным подходом к оценке полученных выводов». Психолог, недооценивающий роль статистики, может добиться только того, что его выводы будут поставлены под сомнение.
Статистика применяется для того, чтобы установить меру надежности диагностических методик. Прием, обычно применяемый в этом случае, – это корреляция. Какова же, собственно, доказательная роль статистики в этом случае?
Критерий надежности прочно вошел в диагностику, однако при его применении нельзя упускать из виду его логической сущности. В частности, представляется целесообразным толковать надежность в трех смыслах, в зависимости от того, что за ряды коррелируются.
1. Как надежность методики, применяемой в качестве измерительного или ранжирующего инструмента.
2. Как стабильность изучаемого психологического или психофизиологического признака или функции.
3. Как константность, то есть относительную независимость получаемых с помощью методики результатов от неучтенных условий опыта и личности экспериментатора.
Цель этого толкования состоит в том, чтобы осветить сущность статистического приема и самого критерия надежности (Гуревич К. М., 1969).
Если придерживаться данной интерпретации, то о надежности измерительного инструмента можно судить, основываясь на следующих соображениях. Допустим, что для измерения длины предметов наблюдателю дана линейка с делениями, и таких делений – двадцать пять. Наблюдатель не знает, каковы эти деления – сантиметры, дюймы или вершки, – он прежде всего заинтересован в том, чтобы сравнивать между собою предметы по их длине и выражать эту длину в каких-то единицах. Заранее известно, что предметы будут различаться по признаку длины; длина одного составит, положим, десять единиц, длина другого – пять единиц, а третьего – двадцать единиц. Если линейка не протарирована, то прежде всего наблюдатель должен утвердиться в уверенности, что все деления линейки одинаковы. В частности, один из простых приемов, который можно применить, чтобы решить этот вопрос, состоит в том, чтобы сопоставить между собой две половины линейки. Если при измерении одного и того же объекта выявится расхождение между делениями одной и другой половины, то это должно означать, что инструмент ненадежен и для измерений неприменим. Все соображения, которые приведены выше, носят не столько узкоматематический, сколько логический характер. При проверке методики (теста) на надежность применяется сопоставление с помощью метода корреляций четных и нечетных заданий по их решаемости на представительной выборке. Этим устанавливается надежность методики как таковой.
Специфические особенности психологии и психофизиологии таковы, что определить надежность самой методики не значит решить все вопросы, связанные с ее применением. Нужно еще установить, насколько стабильны признаки, которые исследователь намерен измерить или ранжировать. Хорошо известно, что многие психологические или психофизиологические признаки в более или менее значительной степени определяются психическими состояниями, а эти последние нередко носят временный характер (Рябинина Э. П., 1976). Чем теснее и непосредственнее связан измеряемый признак с психическими состояниями и чем более подвержен данный субъект постоянным сменам психических состояний, тем в меньшей мере будут стабильны результаты ранжирования или измерения этого признака. Многие психологические признаки нестабильны по самой своей природе: это, например, признаки, которые характеризуются уровнем их развития, положим развитие мышления в каких-то его проявлениях, развитие специальной памяти и т. п. При изучении последних признаков приходится еще считаться с тем, что субъекты могут находиться в не вполне одинаковых условиях и этим может определиться темп их развития.
Как и в предыдущем случае, можно выбрать статистический прием, который адекватно выразил бы искомую стабильность признака. Исследователь не вправе забывать, что роль этого приема чисто служебная: он должен быть применен в качестве приема доказательства. Вопрос о том, что он должен подтвердить и что опровергнуть, ставится исключительно по смыслу самого исследования. Совершенно очевидно, что там, где речь идет о диагнозе лиц, развивающихся в силу каких-то причин разными темпами, там и не следует ждать высоких совпадений между двумя аналогичными пробами, разделенными таким периодом, который достаточен для выявления различий в развитии. Корреляция между первой и второй пробой тогда докажет, что признаки изменились у разных испытуемых в разной степени. Дальнейший анализ, если он нужен для цели исследования, мог бы показать, что испытуемые, находившиеся под влиянием одной группы воздействий, развивались быстрее, чем испытуемые, находившиеся под влиянием другой группы воздействий.
В некоторых видах диагностических исследований вопрос о стабильности измеряемых признаков имеет решающее значение – это исследования, на основании которых строится длительный прогноз. Естественно, что психолог, высказывающий суждения о каком-то признаке, который может на долгие годы предопределить судьбу испытуемых, должен быть вполне уверен в том, что признак этот характеризуется высокой стабильностью. Тридцать-сорок лет тому назад это бесспорное, казалось бы, положение еще не было осознано психологами, занятыми прикладными проблемами; признаки, обосновывающие прогноз, не проверялись на стабильность.
В последние годы проведено много исследований, показывающих, что стабильность ряда функций и процессов, которые должны были бы играть заметную роль в прогнозе, невысока. Прямо и косвенно относящиеся к этому вопросу данные можно найти в обзоре Л. Тайлер (Tyler L., 1972). Укажем, что, повторив психологические испытания через двадцать лет, авторы одного из таких исследований получили коэффициент корреляции между первым и вторым испытанием, равный +0,22. Исследуемые признаки, как видно, не отличаются высокой стабильностью, следовательно, и прогноз, основывающийся на этих признаках, характеризуется незначительной вероятностью. Во всех описанных ситуациях статистика может входить как доказательство большей или меньшей стабильности признака и как таковое она поистине незаменима.
В некоторых видах психологических исследований, имеющих в виду диагностические цели, приобретают особое значение условия опытов, а среди них – личность экспериментатора, его «неформализуемые» особенности, присущая ему манера общения с испытуемыми во время опыта. Очевидно, личность экспериментатора играет более существенную роль при проведении так называемых недетерминированных методик, к числу которых относятся проективные методики. В той или другой степени личность экспериментатора влияет на исход любого психологического эксперимента, но не всегда это влияние имеет существенное значение.
Правила диагностического экспериментирования предусматривают, что опыты и испытания должны всегда проходить в тождественных условиях. Поэтому диагностические методики снабжаются подробными инструкциями, с примерами и правилами их разбора. Но определенное значение сохраняют некоторые неучтенные условия, а среди них и личность экспериментатора, сообщающего инструкции. Волевой нажим, динамичность в сообщении инструкции, наконец, даже дикция и громкость – все это может отразиться на результатах применения методики.
В любом случае, если у исследователя возникает подозрение по поводу влияния личности экспериментатора или других условий на исход процедуры диагностирования, целесообразно проверить методику с помощью критерия «константности». Иначе результаты одного диагностирования будут несопоставимы с результатами другого. Такие проверки проводились, например, в лаборатории дифференциальной психофизиологии Института общей и педагогической психологии АПН СССР (Олыпанникова А. Е., Александрова Н. И., 1969).
В упомянутой работе был использован тот же статистический прием-корреляция. С его помощью было доказано, что при достаточной общепсихологической квалификации экспериментаторов ни их личные особенности, ни другие неучитываемые условия при проведении некоторых психофизиологических диагностических исследований не играют значительной роли.
В практике методических критериев тестологии вопрос о влиянии личности экспериментатора и некоторых условий тестирования специально рассматривается лишь в редких случаях. Однако это не может служить основанием для его недооценки. Применение любого критерия при проверке методик не может носить характер формальности. Приступая к конструированию и затем к использованию своих методик, исследователь ставит перед собою определенные вопросы. Поиск ответа на них и приводит его к статистике.
К сожалению, приходится констатировать, что на формальное отношение к статистике, на недооценку ее собственно доказательного смысла наталкивают некоторые зарубежные руководства по применению тестов. Сплошь и рядом солидные издания, содержащие полезную информацию, выделяют раздел статистики из общего текста и подают его как свод обязательных правил. Возможно, что для малоквалифицированных экспериментаторов такой способ изложения полезен; он может предостеречь их от грубых ошибок, коренящихся в слепой доверчивости по отношению к любым данным, лишь бы они были получены экспериментальным путем. Но собственно логическая сторона статистики остается при этом нераскрытой. Неквалифицированный экспериментатор избегает одних ошибок, но не гарантирован от того, чтобы совершать другие, вытекающие из бездумного применения статистики.
Прежде всего это относится к понятию надежности. Психологу, знакомому с современным состоянием проблемы психологического развития, ясно, что двукратное применение тестов через какой-то промежуток времени (например, через полгода, как рекомендует Л. Кронбах в своем известном руководстве по тестированию) может привести к значительному расхождению результатов первого и второго тестирования (Рябинина Э. П., 1976). Это расхождение, собственно, не означает, что тесты плохи. Оно может быть обусловлено и тем, что за период между двумя применениями тестов развитие детей или взрослых в экспериментальной выборке шло неодинаковым темпом: одни развивались быстрее, другие – медленнее. Темп может зависеть и от специфических возрастно-половых особенностей детей к моменту первого и второго тестирования, от изменения их интеллектуально-учебной мотивации в оба обозначенных момента, от их индивидуальных особенностей и от ряда других, вероятно, уже менее существенных обстоятельств. Конечно, может иметь решающее значение и то, что функции, испытываемые тестом, вообще неустойчивы и по этой причине не могут служить надежным – то есть стабильным – объектом измерений. Все эти достаточно простые соображения, однако, могут быть упущены при слепом следовании формальному требованию, которое гласит, что тест должен обладать определенной надежностью, как бы независимо от того, что и в каких условиях им испытывается.
Само по себе это требование резонно. От чего бы ни зависела низкая надежность, ее нельзя просто игнорировать, нужно понять, от чего она зависит.
С другой стороны, если имеются теоретические основания для того, чтобы считать испытываемое качество устойчивым и стабильным, как это, например, имеет место в отношении основных свойств нервной системы, то ссылки на неравномерность развития испытуемых как на причину низкой надежности должны быть признаны несостоятельными.
Иногда исследователи, проверяющие тест, бездоказательно считают, будто все способы установления надежности теста словно бы идентичны. Разумеется, самым простым по организации является способ проверки теста как измерительного инструмента, что достигается сопоставлением его частей, обычно – путем коррелирования четных и нечетных задач теста. Что такая проверка теста нужна, это не может быть предметом спора. Но она никак не заменяет других способов проверки, в частности проверки стабильности измеряемой функции, а в некоторых случаях, где это необходимо, и проверки теста на константность – путем сопоставления результатов, полученных в более или менее одинаковых условиях и на одной и той же экспериментальной выборке двумя экспериментаторами. Все это говорит о том, что статистика не может достичь поставленных перед нею целей, если она будет восприниматься исследователями как совокупность технических приемов; статистика полезна, если она служит в качестве аппарата доказательств психологической диагностики.
Один из укоренившихся приемов проверки диагностических методик – проверка их валидности. В самом деле, если тест испытывает какое-то психическое качество и если это качество, согласно гипотетическим построениям психолога, имеет существенное значение в каком-то виде учебной или трудовой деятельности, то тем самым как бы постулируется, что между уровнем развития или степенью представленности данного психического качества и успешностью выполнения учебной и трудовой деятельности должна существовать определенная связь. Чаще всего предполагается, что чем выше представленность психического качества, тем должна быть выше успешность.
Это рассуждение и было, по-видимому, причиной того, что для установления валидности постоянно производили корреляции между успешностью в тесте, диагностирующем данное психическое качество, и теми видами успешности, которые так или иначе устанавливались в изучении психологом учебной и трудовой деятельности.
Следует заметить, что вопрос о валидности всегда представлялся одним из наименее ясных и наименее разработанных (Wallace S. R., 1965). Видный американский психолог Е. Гизелли (Ghiselli Е., 1949), неоднократно изучавший состояние валидности применительно к исследованиям в области профессионального труда, показал, что коэффициенты корреляции, получаемые при реализации сопоставлений «тест – профессиональная успешность», обычно невысоки.
Правообладателям!
Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.Читателям!
Оплатили, но не знаете что делать дальше?