Автор книги: Евгений Тавокин
Жанр: Социология, Наука и Образование
сообщить о неприемлемом содержимом
Текущая страница: 5 (всего у книги 15 страниц) [доступный отрывок для чтения: 5 страниц]
Стратифицированная (районированная, гнездовая) случайная выборка
Чисто случайная выборка является идеальной с точки зрения теоретических соображений. Однако в реальной социологической практике, когда в качестве генеральной совокупности используется никак не преобразованный список единиц, образующих объект исследования, простая случайная выборка используется крайне редко. Это вызвано рядом причин:
=> отсутствие достоверных и полных сведений о генеральной совокупности (наиболее типичная);
=> громоздкость необходимых для ее реализации процедур;
=> экономическая и научная неэффективность.
Поэтому в социологической практике используются модифицированные случайные выборки. Суть модификации состоит в том, что процедура отбора распадается на несколько последовательных этапов – ступеней. На каждой ступени осуществляется структурирование (стратификация) того множества, которое необходимо репрезентировать в выборке.
На первой ступени в качестве исходного множества выступает вся генеральная совокупность, образующая объект исследования. В ней по какому-либо основанию (или нескольким основаниям) выявляется структура (страты, гнезда) и определяется характер связей между ее элементами.
С формальной точки зрения все модификации случайной выборки основаны на известной теореме о сложении дисперсий. В соответствии с ней общая дисперсия может быть представлена как сумма межгрупповой и внутригрупповой дисперсий:
σ2общ = σ2м + σ2в .
Первый тип модификации случайной выборки основан на уменьшении ошибки выборки за счет уменьшения величины межгрупповой дисперсии. Этот способ улучшения случайной выборки означает, что ошибка уменьшается за счет сведения к нулю влияния на ошибку первой компоненты – межгрупповой дисперсии. Второй тип предполагает уменьшение внутригрупповой дисперсии. В этом случае исследователь приобретает преимущество за счет того, что дисперсия соотносится не со всей генеральной совокупностью, а только с числом гнезд, попавших в выборку. Первая модификация случайного отбора и получила название районированной (стратифицированной) выборки. Ее преимущественное использование основано на том, что σ2м , как правило, на порядок больше σ2в . Пример – влияние уровня образования на электоральную активность и политические ориентации.
Это – стратификация, предполагающая использование одного признака для выделения страт. При этом сами страты выбираются на основе содержательных соображений и используется пропорциональный отбор. Она называется одномерной пропорциональной стратифицированной выборкой.
В 1970—1980-е гг. была проведена большая работа по развитию методов многомерной стратификации для априорного описания объекта исследования. Однако их реализация требует высокого профессионализма, связана со значительными материально-техническими затратами и наличием условий, позволяющих обеспечивать приемлемую достоверность отбора. Особую трудность представляет составление списка единиц генеральной совокупности. Вместо одного полного списка приходится составлять несколько, длина которых в сумме равна полному. По этим причинам социологи уже давно перешли к многоступенчатому случайному отбору.
При его реализации необходимо выделять промежуточные (первичные) и конечные объекты исследования. Промежуточными объектами в социологических исследованиях чаще всего выступают те территориальные образования или организации, в которых затем выделяются конечные единицы обследования. Применяется в основном 3—5-ступенчатые выборки. На каждой ступени составляется «свой» список промежуточных единиц, из которых и осуществляется случайный отбор. Применение многоступенчатого отбора приводит к тому, что уменьшается численность конечных единиц отбора на каждой ступени.
Многоступенчатый отбор по своей природе является гнездовым. Под гнездом понимается тот промежуточный объект исследования, который отбирается на каждой ступени для того, чтобы служить исходной совокупностью для последующего отбора. Поэтому и весь метод многоступенчатого отбора часто называют гнездовым.
В качестве гнезд в социологической практике могут выступать регионы (административно-территориальные образования, например, Поволжье, Сев. Кавказ, Урал и т.д.), сферы деятельности (промышленность, сельское хозяйство, транспорт и т.п.), избирательные или врачебные участки, дома, предприятия, учреждения, социально-профессиональные группы, аудитории театров и т.д. При отборе гнезд можно руководствоваться как принципом случайности, так и соображениями, нарушающими этот принцип. Второй случай получил название «метод типических единиц» и имеет большее распространение в современной российской социологии. В расчет принимаются экономические (главным образом, финансовые), политические, организационные (наличие профессиональных исполнителей), содержательные и другие соображения. Иногда гнезда (страты) отбираются на основе экспертных оценок.
На последнем этапе гнездовой выборки применяется, как правило, чисто случайный отбор единиц наблюдения.
Гнездовой отбор обладает большими преимуществами перед чисто случайным, особенно – при территориальных выборках. Значительно проще и дешевле проводить отбор и обследование нескольких компактных групп, чем многих десятков и сотен отдельных единиц. Основные рекомендации по реализации гнездового отбора состоят в том, чтобы различия между гнездами были минимальными, а предпочтение отдавать необходимо большому числу малых гнезд перед малым числом крупных.
Неслучайные методы отбора
К данной группе относятся методы отбора, которые не основываются на принципе равенства шансов каждой единицы генеральной совокупности попасть в выборочную. Условия отбора в выборках этого типа определяются исследователем, исходя из самых разных соображений, среди которых часто большую роль играют субъективные.
Основные факторы, которые определяют природу неслучайного отбора, – а) готовность исследователя иметь дело с максимально доступным для него числом единиц генеральной совокупности (фактор доступности); б) стремление максимально гарантировать попадание в выборку тех единиц, которые обладают определенными свойствами (фактор целесообразности).
Первый фактор означает, что социолог готов смириться с тем, что решение о попадании в выборку принадлежит респонденту. Второй фактор означает, что это решение принадлежит именно ему.
Отход от классического принципа случайности, конечно же, не может не вызвать подозрений в правомерности такой выборки. (Именно эти аргументы служили объяснением просчетов в массовых опросах в США в 1940—1950-х гг.). Однако контраргументы выглядят не менее убедительно:
=> ограниченность ресурсов, которые далеко не всегда позволяют реализовывать хорошую «самовзвешивающуюся» выборку;
=> этические мотивы (ведь роль респондента добровольная, и приходится иметь дело с теми, кто оказывается доступным);
=> существенное отличие объектов социальной природы от случайных, что повышает роль и обусловливает неизбежность привлечения при проектировании выборки содержательных соображений.
Если подходить строго формально, то возможные комбинации сочетаний факторов «доступности» и «целенаправленности», определяющие тип неслучайной выборки, можно представить в виде табл. 3.2.
Таблица 3.2
Типология неслучайных методов обора
A и B – те случаи, когда социолог руководствуется главным образом соображениями доступности. Отличие состоит в том, что для случая A респонденты определяются заранее, а в случае B в процессе самого опроса. Это типы так называемой «доступной выборки». В нее попадают респонденты преимущественно из тех, кто оказывается «под рукой», по достаточно расплывчатым признакам («знакомые», «коллеги», «демократы» и т.п.). Как правило, эти типы выборки используются в пилотажных исследованиях. К ним приходится обращаться и тогда, когда изучаются достаточно интимные стороны жизни людей (здесь очень высока доля отказов от участия в исследовании).
Весьма важная сфера применения доступной выборки – изучение причинно-следственных связей, в основе которых – материалы монографических исследований различного типа (эксперимент, наблюдение, глубинные интервью). Как правило, в них изучаются социальные процессы, имеющие широкое распространение и инвариантные к социально-демографическим или каким-либо другим системообразующим факторам. Интерпретация полученных таким образом материалов требует тщательного обоснования границ репрезентации содержательных выводов.
Вариант C характерен тем, что респондент для исследования подбирается из соображений доступности, но право включения его в состав выборки принадлежит социологу. Здесь влияние социолога на состав выборочной совокупности весьма велико.
Вариант D отличается от C тем, что решение на участие в исследовании принадлежит респонденту. По этой причине выборку, образованную этим способом, часто называют стихийной. Такая выборка реализуется при почтовых и прессовых опросах.
Для варианта E в отличие от предыдущих решающим при формировании выборки оказывается фактор целенаправленности. Здесь социолог, не полагаясь на капризы случая, сам определяет тех, кто должен быть включен в состав выборки. Чаще всего этот способ реализуется в виде квотного отбора.
Квотный отбор должен обеспечить почти полное совпадение значений критериальных характеристик выборочной и генеральной совокупностей. При этом объем выборки оказывается существенно меньшего объема, чем при чисто случайном отборе. Именно это является решающим положительным фактором данного варианта, когда нет достаточных возможностей получения самовзвешивающейся случайной выборки. Одно из привлекательных следствий – дешевизна этого способа отбора.
Важнейший принцип квотного отбора состоит в том, что критерии отбора должны высоко коррелировать с исследуемыми свойствами объекта исследования. При невыполнении данного принципа квотная выборка дает резкие искажения характеристик генеральной совокупности. К числу таких критериев относятся, как правило, социально-демографические характеристики. Выбор этих характеристик в качестве критериев обусловлен тем, что, во-первых, они действительно являются ключевыми в подавляющем большинстве предметных областей социологических исследований, а, во-вторых, именно для них имеется возможность получать достаточно надежную, достоверную и актуальную статистику (надо заметить, что в современной России эта возможность все больше и больше приобретает статус потенциальной).
При квотном отборе используют обычно 3—4 критериальных характеристики. Увеличение их числа сильно усложняет его реализацию, так как это означает увеличение числа ограничений, которое необходимо соблюдать при ее формировании. Большое число ограничений увеличивает трудности формирования структуры выборочной совокупности, удовлетворяющей требованиям репрезентации.
Другой важный принцип квотного отбора – независимость критериев. Его несоблюдение приводит к нерациональным затратам сил и средств.
Практика применения квотной выборки
Квотный отбор применяется в априорном и апостериорном варианте. Наиболее распространен априорный вариант. По сути дела, это результат проектирования выборки, который реализуется в процессе проведения сбора эмпирии.
Апостериорный вариант квотной выборки применяется на стадии контроля качества уже собранной эмпирической фактуры и представляет собой корректировку параметров выборки в соответствии с заданными критериями генеральной совокупности. Технически это выглядит как проведение выборки из выборки. Эту процедуру часто называют «ремонтом выборки». При этом объем выборочной совокупности уменьшается, иногда довольно заметно. Однако в некоторых случаях ее объем может превысить исходный. Это происходит тогда, когда выявляется нехватка единиц, представляющих редкие, но очень важные для содержательного анализа типологические группы. Их общий объем тогда искусственно увеличивается по принципу «весов» в необходимое число раз. Во столько же раз увеличивается и общий объем выборки.
Проблемы квотного отбора
Однозначно положительного мнения о квотном отборе пока еще не сложилось. У него есть как сторонники, так и противники. Основные проблемы, определяющие предмет дискуссии, состоят в следующем.
1. Необходимость твердой уверенности в высокой корреляции критериев и исследуемых свойств. Этот метод для своего корректного применения требует еще более тщательного предварительного изучения объекта исследования, чем при проектировании стратифицированной многоступенчатой выборки. При отсутствии уверенности в наличии тесных связей между критериями и исследуемыми свойствами применение квотного метода весьма рискованно.
2. Обязательное наличие актуальной достоверной информации о генеральной совокупности.
3. Техника отбора. Предоставление интервьюерам свободы в выборе респондентов может привести к формированию «доступной выборки». (Известна склонность интервьюеров опрашивать знакомых, коллег, соседей, с высоким образовательным уровнем и т.д.). Существует и опасность, связанная с поисками «последних» (редких) респондентов, в результате чего интервьюер может пойти на фальсификацию.
Как видно, названные опасности квотного отбора вполне устранимы, а его широкое использование в социологической практике есть практическое доказательство заложенных в нем преимуществ.
Кроме квотного отбора существуют и другие разновидности реализации целевой выборки по варианту E. Например, при формировании состава участников эксперимента, для которого необходимы люди, обладающие определенными свойствами. Он применяется также при формировании контрольных групп при проведении эксперимента. (Один из приемов – «точечный метод»: подбор для каждого члена экспериментальной группы соответствующего ему по заданным критериям респондента в контрольной группе). Этот вид целевой выборки применяется и при отборе экспертов. Для этого используются их объективные характеристики, тестирование, взаимный отбор кандидатов в эксперты, самооценки самих кандидатов.
Метод типических единиц – разновидность целевой выборки по варианту E, при которой отбираются не респонденты, а территориальные единицы, предприятия, учреждения по определенным критериям.
Метод «снежного кома» – разновидность экспертной выборки, при котором респонденты (они же выступают в роли экспертов-информаторов) сообщают имена других потенциальных респондентов, которые обладают необходимыми характеристиками. Ценность этого метода особенно велика, когда необходимо участие «редких единиц» (например, ученых с очень узкой специализацией).
Пример проектирования квотной выборки для конкретного региона представлен в приложении 1. Методика реализации выборки – см. приложение 2.
Вариант F в социологической практике – явление исключительно редкое. Гораздо чаще он встречается в реальной жизни (например, всевозможные «конкурсы красоты»).
Из всех видов неслучайного отбора наибольшее распространение получили квотная и стихийная выборки.
В социологической практике обычно используются комбинированные варианты проектирования и реализации выборки. Преобладает вариант многоступенчатой стратифицированной квотной случайной выборки. При этом каждая последующая страта (гнездо) выбирается, как правило, неслучайным образом. Исходят из соображений содержательного, организационного, ситуативного порядка или каких-либо других. Однако на последней ступени принцип случайности соблюдается весьма тщательно. Полученный таким образом массив подвергается обязательному «ремонту», т.е. реализуется апостериорный вариант квотной выборки. Схематически это показано на рис. 3.1.
Рис. 3.1 Типология и структура практической реализации выборки
Многофазные выборки
Эти виды выборки используются в многофазных исследованиях, когда одна и та же генеральная совокупность с определенными интервалами времени изучается несколько раз. Чаще всего применяются двухфазные выборки. Они отличаются друг от друга по трем критериям:
=> доле единиц первой фазы, включенных во вторую и последующие;
=> уровню соблюдения принципа равенства шансов каждой единицы выборки первой фазы попасть во вторую;
=> величине интервала времени, отделяющего фазы друг от друга.
В зависимости от того, имеется ли общая часть выборок разных фаз, можно графически представить следующие ситуации (рис. 3.2).
Рис. 3.2. Варианты двухфазных выборок
Вариант I с коэффициентом замены u = 0 представляет собой чистое панельное исследование. Его практическая реализация чрезвычайно сложна. Используется в социологии весьма редко. Варианты II и III с коэффициентом замены 0 < u <1 – промежуточные.
Вариант II представляет собой наиболее типичный случай реализации панельного исследования, когда производится выборка из выборки. Использовался еще российскими земскими статистиками. По узкой программе обследовались все хозяйства, по более сложной – только определенная часть. Этот же тип выборки применялся при телевизионных опросах жителей Москвы в 1992—1995 гг. службой «Мнение».
По этому же варианту проводятся «когортные» исследования, когда в выборку первой фазы попадают лица, у которых в один и тот же период произошло важное событие (рождение в один и тот же год, заключение брака, окончание школы и т.п.).
Вариант III – особый тип панельного исследования, при котором к объему выборки предъявляются жесткие требования. Поэтому недобор респондентов из числа первой фазы должен быть обязательно восполнен другими, но при этом критериальные характеристики выборки остаются неизменными.
Вариант IV с коэффициентом замены u = 1 – повторное исследование. Он получил в социологии широкое распространение, так как обладает рядом преимуществ по сравнению с первым и вторым вариантами панельного исследования:
=> не требует сложной организационной работы для обеспечения постоянного состава;
=> уменьшается число отказов респондентов участвовать в опросе;
=> отсутствует эффект влияния первой фазы на результаты второй.
Проблемы выборки на современном этапе
I. Одна из главных проблем – недостоверность или отсутствие информации о генеральных совокупностях:
а) репрезентирующих население России и регионов (в основном, это касается социальной и профессиональной структуры, уровня материального расслоения, реального уровня безработицы, уровня доходов, национально-этнической напряженности и т.п.);
б) обеспечивающих маркетинговые исследования (зоны распространения товаров, их клиентура, структура населения по уровню и направлениям покупательского спроса и способности).
Способы решения:
1. Отказ от квот.
2. Ужесточение элементов случайности в процедурах.
3. Обеспечение актуального состояния большой базы адресов, допускающей возможность 3—4-кратной ротации в течение года.
4. Применение 30%-ного перебора объема выборки.
5. Предварительная рассылка писем.
6. Использование принципа: «Замена – хуже, чем недобор».
II. Увеличение причин погрешностей:
1. Отказы. 2. Ошибки в адресах. 3. Все большая часть людей не живет по месту прописки. 4. Прерванные интервью. 5. Многократная недоступность респондента.
Способы преодоления:
а) тотальный контроль;
б) требование подробного отчета о причинах недоступности; Эти способы снижают ошибки примерно в 1,5 раза.
III. Недостаточно оптимальная структура статей расхода по обеспечению выборки. Необходима ее отработка и совершенствование.
Некоторые практические правила реализации выборки
В стратифицированных гнездовых выборках главная – последняя ступень. Под нее необходимо закладывать множество надежных инфраструктур организации и контроля.
Хорошими интервьюерами оказываются женщины с высшим техническим образованием среднего возраста (их сейчас много среди безработных).
Идеальным решением проблемы выборки представляется разработка классической многоаспектной выборки, которую необходимо всякий раз корректировать в подвыборку в зависимости от конкретной ситуации. В итоге должна быть ежегодно обновляемая база конкретных адресов, которые ротируются в течение года. При этом объем выборки при каждой ротации не должен превышать 30%-ного уровня.
При отборе респондентов в семье целесообразно опрашивать всех, а потом полученную выборку перевзвешивать.
Эмпирические зависимости:
65% респондентов находятся с первого раза.
75% респондентов находятся всегда.
18% респондентов не находятся никогда.
Доля доступных респондентов приблизительно постоянна. Если ориентироваться только на них, то ошибка выборки: 5,5—5,7%.
При телефонных опросах недоступные номера телефонов передаются интервьюерам высшей квалификации. Если и у них ничего не получается, то по соответствующему адресу высылается «группа захвата».
При апостериорной коррекции необходимо учитывать не только квоты, но и долю отказников.
Для повышения точности выборочных исследований необходимо вести тщательный учет доли (веса) влияния каждого вида ошибок в общем результате. В конце концов должен появиться «Банк ошибок выборки», с указанием веса каждой из них.
Внимание! Это не конец книги.
Если начало книги вам понравилось, то полную версию можно приобрести у нашего партнёра - распространителя легального контента. Поддержите автора!Правообладателям!
Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.Читателям!
Оплатили, но не знаете что делать дальше?