Электронная библиотека » Виталий Попков » » онлайн чтение - страница 6


  • Текст добавлен: 1 марта 2016, 02:40


Автор книги: Виталий Попков


Жанр: Учебная литература, Детские книги


сообщить о неприемлемом содержимом

Текущая страница: 6 (всего у книги 18 страниц) [доступный отрывок для чтения: 6 страниц]

Шрифт:
- 100% +

Глава IV
ВЫБОРОЧНОЕ ИССЛЕДОВАНИЕ

Нельзя объять необъятное…

Козьма Прутков


Не обязательно съедать всю кастрюлю каши, чтобы понять, что она пересолена…

Народная мудрость


4.1. Генеральная совокупность и выборка. Сплошные и выборочные исследования

Практически все исследования, выполняемые в области естественных и гуманитарных наук, носят выборочный характер. Термины «выборка» и «генеральная совокупность» должны быть известны читателю, и все же, учитывая их важность для рассмотрения вопросов, связанных с планированием исследования, оценкой и интерпретацией его результатов, приведем их определения.

Генеральной совокупностью называют все (без исключения) объекты определенного типа. Например, «население России – все граждане, проживающие на ее территории; «граждане России» – все, имеющие гражданство РФ (не зависимо от страны проживания); по аналогии с этим «студенты российских вузов», или просто «студенты» разных вузов в разных странах. Количество объектов, входящих в генеральную совокупность называют ее объемом. Очевидно, что объем генеральных совокупностей, может быть различным. В некоторых случаях под генеральной совокупностью подразумевается полный списочный состав одного крупного населенного пункта, предприятия, учебного заведения, а иногда ее объем мыслится даже как бесконечно большой. Если обследуется вся генеральная совокупность, то исследование называется сплошным. Цель сплошного исследования – «получить представление обо всех, и о каждом в отдельности». Примерами сплошных исследований могут служить всероссийская перепись населения или всеобщая диспансеризация населения страны. Совершенно очевидно, что сплошные исследования больших по объему генеральных совокупностей требуют больших затрат времени, сил и средств. В ряде случаев они, в принципе, невыполнимы (например, когда генеральная совокупность представляется как бесконечно большая, или когда исследование связано с разрушением объекта). И, наконец, еще одно очень важное обстоятельство, обусловленное характером наших знаний об окружающем мире, – сплошное исследование не способно дать нам «абсолютно точное знание». Такое знание можно представить себе только как абстрактное понятие недостижимое в практической деятельности.

Получить абсолютно точное знание о какой-либо (даже ограниченной по объему) генеральной совокупности невозможно в связи с ее нестабильностью – изменениями, которые происходят в ней постоянно. Так, не только состав студентов конкретного вуза, но и состояние каждого студента, могут измениться даже в ходе проведения самого исследования и полученные знания все равно не будут абсолютно точными. Если к этому еще добавить, что ни одно конкретное измерение не является абсолютно точным, то погоня за птицей счастья в виде абсолютно точного и полного знания представляется занятием, лишенным смысла.

Поэтому человечество давно освоило более экономный путь получения приблизительного знания – выборочный метод, идея которого заключается в том, чтобы «изучив часть, получить представление о целом», «изучив некоторых, получить представление обо всех» или, выражаясь терминами статистики – «изучив выборку, получить представление о генеральной совокупности». Выборочный метод используется нами настолько часто, что порой мы даже этого не замечаем. Например, попробовав кусочек торта, мы говорим – вкусный торт, относя это знание ко всему торту. Оценив ответы студента на три вопроса экзаменационного билета, делаем заключение о том, как студент усвоил предмет в целом. Сдав на анализ капельку крови, получаем заключение о состоянии всей крови. Заметим, что если в двух первых примерах трудно использовать сплошное исследование, то в третьем – это просто невозможно.

Выборочной совокупностью (или выборкой) называют часть генеральной совокупности, отобранную для изучения. Исследования, выполненные на выборке, называют выборочными. В отличие от сплошных исследований, выборочное исследование не ставит целью изучение индивидуальных свойств отдельных объектов, цель таких исследований – получить преставление об обобщающих статистических параметрах (средних арифметических, стандартных отклонениях и т. д.) выборки и по которым можно приблизительно оценить одноименные параметры генеральной совокупности.

Здесь, пожалуй, уместно заметить, что под генеральной совокупностью можно понимать не только множество объектов определенного типа, но и теоретически бесконечное множество всех возможных состояний, в которых может находиться отдельный объект. В этом случае выборкой будет являться ограниченная совокупность результатов измерений одного и того же объекта, выполненных в различных его состояниях.

С гносеологической точки зрения выборочная процедура представляет собой удобный и экономичный способ реализации индуктивного метода (от частного к общему) и обеспечивает одну из важнейших особенностей научного знания – его абстрактный и обобщающий характер (например, когда ученый говорит о влиянии обучения, воспитания или тренировки на какие-либо свойства и качества человека, он имеет в виду не конкретного человека, а «человека вообще»).

4.2. Репрезентативность выборки

Для того чтобы успешно реализовать идею выборочного исследования, прежде всего, необходимо чтобы выборка по своему качественному составу и количественным статистическим параметрам хорошо совпадала с параметрами генеральной совокупности т. е. была репрезентативной (от лат. гергеsento – представляю).

Для обеспечения репрезентативности выборки исследователь должен учитывать и соблюдать условия, при которых выборка наилучшим образом репрезентирует генеральную совокупность, и в каждом конкретном случае устанавливать, с какой уверенностью, и на какую именно генеральную совокупность можно обобщить результаты выборочного наблюдения.

Первым условием, которое должно неукоснительно соблюдаться при планировании выборочного исследования, является качественная определенность и однородность, как самой генеральной совокупности, так и выборки. Подчеркнем, что, говоря о качественной однородности, мы не имеем в виду количественную однородность изучаемых признаков, которая, в репрезентативной выборке и в генеральной совокупности должны быть одинакова. Речь идет о том, что недопустимо к одной генеральной совокупности и в одну выборку относить лиц, различающихся по существенным типологическим признакам, (разный пол, сильно отличающийся возраст, или разная спортивная квалификация). В подобных случаях совершенно непонятно – на какую генеральную совокупность можно обобщить выявленные на выборке свойства и зависимости. Например, в одном из исследований генеральная совокупность была определена как «дети старшего дошкольного возраста». Выборка была скомплектована из детей – мальчиков и девочек. Вполне очевидно, что средние арифметические, стандартные отклонения и другие статистические характеристики такой смешанной выборки нельзя отнести ни девочкам, ни к мальчикам. Если даже между детьми разного пола в этом возрасте нет существенных различий, по одному показателю, то по ряду других они могут быть различны. Кроме того, для установления наличия или отсутствия таких различий все равно нужно сравнить раздельные выборки девочек и мальчиков. То обстоятельство, что эти группы объединяют в процессе занятий, игр и других воспитательных мероприятий отнюдь не является поводом для объединения их в одну выборку при проведении научного исследования.

Вторым условием, обеспечивающим репрезентативность выборки, является исключение субъективных влияний на ее состав. Выполнение этого условия обеспечивает принцип рандомизации – случайного отбора вариантов из генеральной совокупности, при котором каждая единица наблюдения имеет одинаковую вероятность попасть в выборку. Нарушение этого принципа лишает исследователя права обобщения результатов выборочного исследования на генеральную совокупность и, тем самым, лишает смысла выборочное исследование.

Каждый исследователь, решивший использовать выборочный метод, заинтересован в том, чтобы статистические параметры выборки как можно меньше отклонялись от параметров генеральной совокупности. Поэтому третьим условием, обеспечивающим репрезентативность выборки, является минимизация расхождения между одноименными параметрами генеральной и выборочной совокупностей, до пределов, обеспечивающих достаточную степень их совпадения.

4.3. Ошибки выборочного исследования

Неизбежное расхождение между выборочной и генеральной характеристикой называют ошибкой выборки. На величину этой ошибки влияют два компонента, имеющие различные причины.

Первый компонент – случайные ошибки (которые обычно называют ошибками репрезентативности) – это статистические погрешности, присущие самой природе выборочного метода. Эти ошибки можно количественно оценить методами математической статистики. Кроме того, их можно уменьшить до приемлемых пределов путем увеличения объема выборки. В большинстве пособий по математической статистике и методам научных исследований обсуждаются способы оценки и уменьшения именно случайных погрешностей, в связи с этим, многие исследователи ошибочно считают, что репрезентативность выборки зависит только от случайной погрешности, не задумываясь о втором компоненте выборочной ошибки.

Второй компонент ошибки выборочного исследования – систематические ошибки, вызывающие так называемые «смещения» – расхождения между параметрами выборки и генеральной совокупности. Систематическая ошибка представляет наибольшую опасность, поскольку эту ошибку можно увидеть, только сравнив параметры выборки с одноименными параметрами генеральной совокупности. А поскольку параметры генеральной совокупности исследователю никогда не известны, то исследователь лишен возможности выявить систематическую погрешность. Даже если смещение между параметрами выборки и генеральной совокупности настолько велико, что результат исследования не имеет смысла, результаты исследования будут выглядеть вполне правдоподобно, однако сами по себе они никогда не позволят обнаружить систематическое смещение или оценить его величину.

Кроме того, в отличие от случайной погрешности, систематическая ошибка с увеличением объема выборки не уменьшается. Поэтому выборка, обладающая значительной систематической погрешностью, не может быть репрезентативной, даже при ничтожно малой случайной ошибке.

Именно поэтому обсуждение вопроса о репрезентативности выборки начнем с систематических ошибок, или так называемых «смещений», как наиболее опасных.

4.3.1. Систематические ошибки выборочного исследования

Классическим примером, иллюстрирующим систематическое смещение, стал предвыборный опрос, проведенный перед президентскими выборами американским журналом «The Literary Digest» в 1936 г. Судя по результатам опроса, победу должен был одержать республиканец А. Ф. Лэндон. Его конкурент Ф. Д. Рузвельт получил всего 40,9 % голосов. Казалось, что результат выборов не вызывает сомнений, т. к. объем выборки, подвергнутой предвыборному опросу был огромен – свыше двух миллионов человек! Разумеется, что случайная ошибка при таком объеме выборки ничтожна.

В действительности уверенно победил Рузвельт, получив 60,2 % голосов избирателей. Расхождение в 19,3 % объяснялось несоблюдением требования рандомизации – случайного отбора при комплектовании выборки. В опросе проведенном «The Literary Digest», в качестве основы выборки использовались телефонные справочники, а также регистрационные списки владельцев автомобилей. В эти списки на тот момент входили не просто «американские избиратели», а представители зажиточных слоев американского общества. Менее состоятельные слои населения, отдававшие предпочтение предвыборной программе Рузвельта, оказались недостаточно представлены в выборке.

Как видно из этого примера, систематическое смещение, вызывающее полное искажение представления о генеральной совокупности, не зависит от объема выборки, а определяется способом ее комплектования.

Единственный способ избежать систематической ошибки – это точное определение реальной генеральной совокупности, из которой взята выборка и соблюдение принципа рандомизации.

Не следует думать, что этот пример является неким уникальным историческим курьезом, относящимся только к социологическим исследованиям. Частые ссылки именно на этот случай связаны, с тем, что в нем представилась уникальная возможность сравнить результаты выборочного исследования (предвыборного опроса) с результатами сплошного исследования генеральной совокупности (итогами выборов). Поскольку у авторов выборочных исследований такой возможности никогда нет, систематическая ошибка, если она имеет место, так и остается не выявленной.

Рассмотрим еще несколько умозрительных примеров из области педагогических исследований физической культуры и спорта. Для этого введем в оборот следующие понятия:

«Идеальная генеральная совокупность», – множество объектов, которое исследователь намерен изучать выборочным методом;

«Реальная генеральная совокупность» (или «основа выборки») – та совокупность, из которой исследователь имеет возможность извлечь выборку, (и из которой он фактически ее извлек). Соответственно, назовем выборку из первой совокупности «идеальной выборкой», а из второй – «реальной выборкой».

Если объем идеальной генеральной совокупности относительно невелик и четко ограничен (например, студенты одного конкретного университета), она может совпадать с основой выборки (общим списочным составом студентов этого университета). В этом случае идеальная и реальная выборки также совпадут, и никакого систематического смещения не возникает (при условии, что результаты исследования обобщаются только на студентов данного университета, но не на студентов всех университетов).

Несколько сложнее выглядит ситуация, когда объем идеальной генеральной совокупности слишком велик, или его границы четко не очерчены. В силу этих и других причин исследователь, чаще всего, не имеет возможности использовать в качестве основы выборки полный состав идеальной генеральной совокупности, а извлекает выборку из какой то ее части. Если эта часть (основа выборки) по структуре своего состава и уровню изучаемых свойств существенно отличается от идеальной генеральной совокупности, то извлеченная из нее выборка тоже даст смещенное представление о параметрах идеальной генеральной совокупности. Очевидно, что обобщать полученные результаты можно будет только на саму основу выборки. Схема такой выборочной процедуры и соотношение обсуждаемых понятий показаны на рисунке 1:


Риc. 1. Расхождение между идеальной и реальной выборками из идеальной и реальной генеральных совокупностей [5].


Из рисунка видно, что по замыслу исследователя, идеальная генеральная совокупность, состоящая из объектов А и В, должна быть представлена идеальной выборкой, являющейся ее уменьшенной копией, с таким же пропорциональным соотношением объектов А и В. Однако в силу различных причин, отбор происходит из реально доступной исследователю генеральной совокупности, содержащей преимущественно объекты В. Очевидно, что и полученная исследователем реальная выборка не совпадает с идеальной выборкой по соотношению объектов А и В. Вероятность совпадения процентного соотношения объектов разного типа в идеальной генеральной совокупности и реальной выборке тем меньше, чем разнообразнее объекты в идеальной генеральной совокупности и чем хуже эти объекты «перемешаны».

Еще один пример. Если исследователь разрабатывает нормативы по тестам физической подготовленности футболистов – учащихся детских спортивных школ России, то идеальной генеральной совокупностью являются все учащиеся всех детских спортивных школ России. Однако, не имея возможности осуществить выборку не только из всех, но даже из большинства этих школ, он ограничивается выборкой из реально доступной ему совокупности – одной конкретной детской спортивной школы, которая может значительно отличаться от остальных школ составом учащихся, условиями, квалификацией педагогов и применяемыми методами тренировки и т. д.

Очевидно, что реальной генеральной совокупностью в этом случае будет основа выборки – все учащиеся именно этой спортивной школы, но не учащиеся всех российских спортивных школ. Кроме того, если обследовалась только одна из учебных групп, а не выборка из всех учащихся этой школы, то весьма сомнительно, что исследователь вправе обобщать полученные данные даже на всю эту школу.

Эти примеры приводятся для того, чтобы показать насколько важно для исследователя заранее определить границы идеальной генеральной совокупности, сформировать основу выборки и саму выборку, таким образом, чтобы они точно и надежно отражали структуру и состояние идеальной генеральной совокупности. Аналогичных примеров можно привести великое множество. Тот факт, что систематическая погрешность всегда остается не выявленной, отнюдь не означает, что она отсутствует. По этой причине практически все педагогические диссертации, в той или иной мере, дают повод для сомнений в отсутствии систематического смещения выборки относительно генеральной совокупности, на которую автор распространяет свои выводы, обобщения и практические рекомендации.

4.3.2. Случайные ошибки выборочного исследования

Значительно проще ситуация выглядит со случайными погрешностями, поскольку они не только поддаются количественной оценке, но и могут быть уменьшены до разумных пределов за счет увеличения объема выборки.

Смысл и характер случайных погрешностей нетрудно понять, если представить себе, что мы по случайному закону одновременно извлекли из одной и той же генеральной совокупности не одну, а несколько выборок. Здравый смысл убеждает нас в том, что если в каждой из выборок вычислить среднее арифметическое (Xk), то полученные средние не совпадут между собой. Действительно, средние значения Xk отдельных выборок подвержены случайным отклонениям от генеральной средней X0. Не смотря на то, что точную величину и знак каждой из этих погрешностей заранее предсказать невозможно, ее можно описать с помощью распределения вероятностей, т. е. зависимости между возможными значениями погрешности и вероятностями их появления. Таким образом, для того, чтобы описать случайную погрешность нужно указать два числа – значение погрешности и вероятности.

Для этой цели используют специальную стандартную меру возможного (вероятного) отклонения выборочного параметра от одноименного генерального параметра, которую называют ошибкой репрезентативности. Эта ошибка может быть вычислена для любого параметра на данных самой выборки. Ошибку репрезентативности обычно обозначают буквой m, а подстрочный индекс указывает, к какому параметру она относится.

Например, ошибка репрезентативности среднего арифметического обозначается ±mx и вычисляется по формуле:



где mx – ошибка репрезентативности;

σ – среднее квадратическое отклонение изучаемого признака;

n – объем выборки.

Из формулы (1) видно, что случайные отклонения выборочной средней от генеральной могут быть как положительными, так и отрицательными, кроме того, нетрудно заметить, что mx зависит от σ (т. е. чем больше варьирует признак, тем ошибка больше) и от объема выборки n (чем больше n, тем меньше ошибка).

В связи с тем, что исследователь не может произвольно уменьшать σ (это было бы нарушением основного принципа комплектования выборки – случайного отбора), то у него есть единственный путь уменьшить mx и повысить точность оценки генеральной средней – это увеличить объем выборки.

Заметим, что величина ошибки обратно пропорциональна n, т. е. для уменьшения ошибки в k раз, выборку увеличить в k2 раза.

Поскольку эта ошибка носит случайный характер, она не является точным значением отклонения конкретной выборочной средней от генеральной средней, а служит только для вероятностной оценки возможного отклонения. Конкретная ошибка может быть как меньше, так и значительно больше, чем mx).

Не смотря на то, что для случайной погрешности заранее точно предсказать ее величину и знак в каждой отдельной выборке, взятой из одной и той же генеральной совокупности невозможно, это не означает, что случайные погрешности повторных измерений «ведут» себя совершенно беспорядочным, хаотическим образом. Зависимость величины mX от доверительной вероятности Р и объема выборки n исследовал английский ученый Уильям Госсет (Стьюдент), в честь которого она была названа t-распределением Стьюдента. Из этого распределения следует, что с заданной доверительной вероятностью Р среднее значение отдельной выборкиXi, выраженное в масштабе ошибки репрезентативности, может отклониться от генеральной средней X0на величину, не превышающую ±mXtS. Коэффициент ts представляет собой нормированное отклонение:



При постоянном значении вероятности P, значение tS тем больше, чем меньше n. При одном и том же значении n большим значениям P соответствуют большие значения tS.

Внимание! Это не конец книги.

Если начало книги вам понравилось, то полную версию можно приобрести у нашего партнёра - распространителя легального контента. Поддержите автора!

Страницы книги >> Предыдущая | 1 2 3 4 5 6
  • 0 Оценок: 0

Правообладателям!

Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.

Читателям!

Оплатили, но не знаете что делать дальше?


Популярные книги за неделю


Рекомендации