Текст книги "Статистика. Ответы на экзаменационные билеты"
Автор книги: Ангелина Яковлева
Жанр: Прочая образовательная литература, Наука и Образование
сообщить о неприемлемом содержимом
Текущая страница: 4 (всего у книги 12 страниц)
24. Выборочный коэффициент корреляции
Выборочный коэффициент корреляции является одним из основных показателей тесноты связи между двумя переменными. При изучении зависимости переменной Y от переменной Х выборочный коэффициент корреляции обозначается как rxy. При изучении зависимости переменной Х от переменной Y выборочный коэффициент корреляции обозначается как ryx.
Выборочный коэффициент корреляции является оценкой коэффициента корреляции Pxy генеральной совокупности.
Выборочный парный коэффициент корреляции ryx:
где ух — среднее арифметическое произведения факторной и результативной переменных:
Sy – выборочное среднеквадратическое отклонение результативной переменной у, показывающее, на сколько единиц в среднем отклоняются значения результативной переменной у от ее среднего значения y—:
у2 – среднее значение из квадратов значений результативной переменной у:
y2 – квадрат средних значений результативной переменной у:
Sx – выборочное среднеквадратическое отклонение факторной переменной х, показывающее, на сколько единиц в среднем отклоняются значения факторной переменной х от ее среднего значения x:
Выборочный коэффициент корреляции обладает следующими свойствами:
1) по абсолютной величине выборочный коэффициент корреляции не превосходит единицы: |ryx| ≤ 1, или –1 ≤ ryx ≤ 1;
2) если ryx = 0, т. е. выборочный коэффициент корреляции равен нулю, то переменные Y и Х не связаны статистической зависимостью. В этом случае проведение регрессионного анализа между исследуемыми переменными считается нецелесообразным;
3) если |ryx| = 1, т. е. выборочный коэффициент корреляции по абсолютной величине равен единице, то наблюдаемые значения исследуемых переменных связаны линейной функциональной зависимостью;
4) `если выборочный коэффициент корреляции принадлежит интервалу от нуля до единицы, то связь между исследуемыми переменными прямая; если же выборочный коэффициент корреляции принадлежит интервалу от нуля до минус единицы, то связь между исследуемыми переменными обратная.
25. Выборочное корреляционное отношение. Свойства выборочного корреляционного отношения
Выборочное корреляционное отношение является основным показателем при оценке тесноты нелинейной корреляционной связи между двумя переменными Y и Х. При изучении зависимости переменной Y от переменной Х выборочное корреляционное отношение обозначается как ηyx.
При изучении зависимости переменной Х от переменной Y выборочное корреляционное отношение обозначается как ηxy.
Выборочным корреляционным отношением
Y к Х называется отношение межгруппового среднего квадратического отклонения к общему среднему квадратическому отклонению переменной Y:
где Gмежгр – это межгрупповое среднее квадратическое отклонение переменной Y:
Gобщ – это общее среднее квадратическое отклонение переменной Y:
где n – объем выборки (сумма всех частот);
mх – частота значениях переменной X;
m – частота значения у переменной Y;
у – среднее значение переменной Y;
ух – условная средняя переменной Y.
Выборочным корреляционным отношением X
к Y называется отношение межгруппового среднего квадратического отклонения к общему среднему квадратическому отклонению переменной Х:
Выборочное корреляционное отношение обладает следующими свойствами:
1) значение выборочного корреляционного отношения принадлежит интервалу от нуля до единицы включительно:
0 ≤ ηyx ≤ 1;
2) если ηyx = 0, т. е. значение выборочного корреляционного отношения равно нулю, то между исследуемыми переменными Y и Х корреляционная зависимость отсутствует;
3) если ηyx = 1, т. е. значение выборочного корреляционного отношения равно единице, то между исследуемыми переменными Y и Х существует функциональная зависимость;
4) выборочное корреляционное отношение не меньше абсолютной величины выборочного коэффициента корреляции:
5) если выборочное корреляционное отношение равно абсолютной величине выборочного коэффициента корреляции, т. е. если то между исследуемыми переменными существует точная линейная корреляционная зависимость. Основным достоинством выборочного корреляционного отношения ηyx по сравнению с выборочным коэффициентом корреляции ryx является то, что показатель выборочного корреляционного отношения можно использовать как меру тесноты любой формы связи.
26. Общая модель парной регрессии
Предположим, что в результате статистического наблюдения были получены данные, характеризующие две переменные – Х и Y. С помощью корреляционного анализа было доказано наличие взаимосвязи между данными переменными. Следующим этапом исследования является задача определения точного вида выявленной зависимости между переменными с помощью регрессионного анализа.
Регрессионный анализ – это определение аналитического выражения связи или вида функции, в которой изменение одной величины (результативной переменной) обусловлено влиянием независимой величины (факторной переменной). Регрессионное уравнение, или регрессионная функция, количественно характеризует данную взаимосвязь.
Базисная регрессионная модель – это модель парной, или однофакторной, регрессии, в которой участвуют одна факторная и одна результативная переменные. Модель однофакторной регрессии называется полиномом первой степени и используется для описания равномерно развивающихся во времени процессов.
Модель парной регрессии зависимости результативной переменной у от факторной переменной х в общем виде записывается следующим образом:
yi = в0 + в1xi + εi,
где yi – значения результативной переменной, /= 1,n;
хi — значения факторной переменной, /= 1,n;
в0, в1 – неизвестные параметры модели парной регрессии;
n – количество наблюдений.
Модель парной регрессии зависимости результативной переменной х от факторной переменной у в общем виде записывается следующим образом:
хi = в0 + в1уi + εi.
Параметр εi модели парной регрессии называется случайной ошибкой модели. Появление случайной ошибки в модели регрессии обусловлено следующими объективными предпосылками:
1) существованием вероятности того, что переменные, участвующие в модели, могут быть измерены с ошибкой.
2) включение в модель парной регрессии только одной факторной переменной, которая не способна полностью объяснить вариацию результативной переменной.
Вид функции регрессии, т. е. аналитическую форму зависимости между результативной и факторной переменными, можно определить двумя методами.
1. Путем визуальной оценки характера связи. На линейном графике по оси абсцисс откладываются значения факторной переменной х, по оси ординат – значения результативной переменной у. На пересечении соответствующих значений отмечаются точки. Полученный точечный график в указанной системе координат называется корреляционным полем. Если соединить полученные точки, то полученная линия будет называться эмпирической.
2. Путем теоретического и логического анализа природы изучаемых явлений, их социально-экономической сущности.
Параметр в1 уравнения парной регрессии называется коэффициентом регрессии. Его величина показывает, насколько в среднем изменится результативный признак у при изменении факторного признака х на единицу своего измерения. Знак параметра β1 в уравнении парной регрессии указывает на направление связи между переменными:
1) если в1 > 0, то связь между переменными прямая, т. е. с увеличением значения факторной переменной х увеличивается и значение результативной переменной у, и, наоборот, с уменьшением значения факторной переменной х уменьшается и значение результативной переменной у;
2) если в1 < 0, то связь между переменными обратная, т. е. с увеличением значения факторной переменой x значение результативной переменной y уменьшается, и, наоборот, с уменьшением значения факторной переменой x значение результативной переменной y увеличивается.
27. Нормальная линейная модель парной регрессии
При построении нормальной (классической) линейной модели парной регрессии, т. е. модели регрессии с одной факторной переменной, учитываются следующие условия:
1) хi (факторная переменная) является неслучайной (детерминированной) величиной, независящей от распределения случайной ошибки регрессионной модели εi;
2) математическое ожидание случайной ошибки регрессионной модели Е(εi) равно нулю во всех i наблюдениях, т. е. Е (εi) = 0 при i = 1,n;
3) дисперсия случайной ошибки регрессионной модели D(εi) постоянна для всех наблюдений, т. е.:
D(εi) = Е(εi) = G2 = const;
4) случайные ошибки регрессионной модели не коррелированы между собой, т. е. ковариация случайных ошибок любых двух разных наблюдений равна нулю:
Cov(εiεj) = E(εiεj) = 0, где i ≠ j.
Ковариацией называется показатель тесноты связи между переменными:
где xy – среднее арифметическое значение произведения факторной и результативной переменных:
x – среднее арифметическое факторной переменной;
y – среднее арифметическое результативной переменной;
Четвертое условие выполняется в том случае, если
изучаемые данные не являются временными рядами;
5) исходя из третьего и четвертого условий, можно добавить пятое условие о том, что случайная ошибка регрессионной модели является случайной величиной, подчиняющейся нормальному закону распределения с нулевым математическим ожиданием и дисперсией G2: εi~N(0, G2). На основании перечисленных условий нормальная линейная модель парной регрессии записывается следующим образом:
yi = в0 + в1xi + εi,
где yi – значения результативной переменной;
xi – значения факторной переменной;
в0, в1 – неизвестные параметры модели парной регрессии;
εi – случайная ошибка регрессионной модели;
n – количество наблюдений.
Нормальная линейная модель парной регрессии может быть также записана в матричном виде:
Y = βX + ε,
где Y – вектор значений результативной переменной размерности n × 1;
X – вектор значений факторной переменной размерности n × 2. Первый столбец является единичным, т. к. в регрессионной модели параметр в0 умножается на единицу;
β – вектор коэффициентов регрессионной модели размерности 2 × 1; n.
ε – вектор случайных ошибок регрессионной модели размерности n × 1.
28. Классический метод наименьших квадратов для модели парной регрессии
Неизвестные параметры в0 и в1 нормальной линейной модели парной регрессии определяются с помощью классического метода наименьших квадратов, или МНК.
Предположим, что исследователем собран цифровой материал, характеризующий две переменные – х и у.
Связь между исследуемыми переменными описывается равенством вида:
yi = β0+ β1xi. (2)
В соответствии с методом наименьших квадратов в качестве метода оценки неизвестных параметров регрессионной модели будет выступать сумма квадратов отклонений наблюдаемых значений результативного признака у от теоретических значений у (рассчитанных с помощью регрессионной модели):
Для нахождения оптимальных значений неизвестных параметров β0 и β1 необходимо минимизировать функционал F по данным параметрам, т. е. необходимо рассчитать такие значения параметров β0 и β1, которые бы доставляли минимум функции:
При минимизации данного функционала неизвестными являются только значения коэффициентов регрессии β0 и β1. Значения результативной и факторной переменных известны из наблюдений.
Для определения минимума функции двух переменных нужно вычислить частные производные этой функции по каждому из оцениваемых параметров и приравнять их к нулю. Результатом будет являться стационарная система уравнений для функции (2):
Если разделить обе части каждого уравнения системы на (-2), раскрыть скобки и привести подобные члены, то получим систему:
Решением системы нормальных уравнений являются оценки неизвестных параметров уравнения регрессии β0 и β1:
где у – среднее значение результативной переменной;
х – среднее значение факторной переменной;
ху— среднее арифметическое значение произведения результативной и факторной переменных;
G2(x) – дисперсия факторной переменной.
29. Линейная модель множественной регрессии
Линейная модель множественной регрессии – это метод характеристики аналитической формы связи между результативной (зависимой) переменной и несколькими факторными (независимыми) переменными. Построение модели множественной регрессии целесообразно в том случае, если с помощью коэффициента множественной корреляции было доказано наличие линейной связи между исследуемыми переменными.
При построении линейной модели множественной регрессии учитываются следующие условия:
1) величины х1i … xki являются неслучайными и независимыми переменными;
2) математическое ожидание случайной ошибки регрессионной модели Е(εi) равно нулю во всех / наблюдениях, т. е. Е(εi) = 0 при i = 1,n;
3) дисперсия случайной ошибки регрессионной модели D(e) постоянна для всех наблюдений,т. е. D(εi) = Е(εi) = G2 = const;
4) случайные ошибки регрессионной модели не коррелированы между собой, т. е. ковариация случайных ошибок любых двух разных наблюдений равна нулю: Cov(εiεj) = E(εiεj) = 0, где i ≠ j.
Ковариацией называется показатель тесноты связи между переменными:
где ху — среднее арифметическое значение произведения факторной и результативной переменных:
х — среднее арифметическое факторной переменной;
у — среднее арифметическое результативной переменной.
Четвертое условие выполняется в том случае, если изучаемые данные не являются временными рядами;
5) исходя из третьего и четвертого условий, можно добавить пятое условие о том, что случайная ошибка регрессионной модели является случайной величиной, подчиняющейся нормальному закону распределения с нулевым математическим ожиданием и дисперсией G2: εi~N(0, G2). На основании перечисленных условий линейная модель множественной регрессии записывается следующим образом:
yi= β0+ β1x1k+… + βn xik+ εi,
где уi – значение /-ой результативной переменной, i= 1,n;
х1i…хki,— значения факторных переменных, i= 1,n;
β0… βn – неизвестные параметры регрессионной модели;
εi – случайные ошибки модели множественной регрессии.
Добавление в модель множественной регрессии такого компонента, как вектор случайных ошибок, необходимо в связи с практической невозможностью оценить связь между переменными с абсолютной точностью.
Линейная модель множественной регрессии также может быть записана в матричном виде:
Y = βX + ε,
где – вектор значений результативной переменной размерности п×1
30. Классический метод наименьших квадратов для модели множественной регрессии
Неизвестные параметры в0… вn линейной модели множественной регрессии определяются с помощью классического метода наименьших квадратов, или МНК.
Общий вид линейной модели множественной регрессии:
yi= β0+ β1x1k+… + βn xik+ εi,
где уi – значение /-ой результативной переменной, i= 1,n;
х1i…хki,— значения факторных переменных, i= 1,n;
β0… βn – неизвестные параметры регрессионной модели;
εi – случайные ошибки модели множественной регрессии.
В соответствии с методом наименьших квадратов в качестве метода оценки неизвестных параметров регрессионной модели будет выступать сумма квадратов отклонений наблюдаемых значений результативного признака у от теоретических значений у (рассчитанных с помощью регрессионной модели):
Для нахождения оптимальных значений неизвестных параметров β0… βn необходимо минимизировать функционал F по данным параметрам, т. е. необходимо рассчитать такой вектор оценки параметра β, который бы доставлял минимум функции, т. е. минимизировал бы сумму квадратов отклонений наблюдаемых значений результативной переменной у от теоретических значений y (значений, рассчитанных с помощью регрессионной модели).
Матричная форма функционала F метода наименьших квадратов:
где Y – вектор значений результативной переменной;
X — вектор значений факторной переменной.
Для определения минимума функционала (1) необходимо вычислить частные производные этой функции по каждому из оцениваемых параметров и приравнять их к нулю.
Общий вид стационарной системы уравнений для функции (1):
В результате решения системы нормальных уравнений получим следующие МНК-оценки неизвестных параметров регрессионной модели:
Предположим, что в ходе исследований была доказана линейная зависимость между результативной и двумя факторными переменными, выражающаяся равенством вида:
где i= 1,n.
31. Предмет, методы и задачи социально-экономической статистики
С помощью социально-экономической статистики исследуются количественные характеристики различных массовых социальных и экономических явлений и процессов общественной жизни с учетом их качественной стороны.
Цель социально-экономической статистики заключается в адекватном описании условий, процесса и результатов функционирования рыночной экономики, анализе тенденций и закономерностей развития общества с помощью системы взаимосвязанных количественных показателей.
Предметом социально-экономической статистики является качественно-количественная сторона жизнедеятельности общества.
Объектами изучения социально-экономической статистики являются:
1) потребители услуг, материальных и духовных ценностей, информации, представленные индивидами или групповыми объектами;
2) физические лица, организации, структуры, предоставляющие населению определенные услуги, либо организованный социальный процесс;
3) массовые экономические процессы и явления, а также экономическая система в целом.
В процессе сбора, обработки и анализа статистических материалов социально-экономическая статистика опирается на инструментарий общей теории статистики. Помимо этого, в социально-экономической статистике применяются различные методологии математической статистики.
В свою очередь, экономическая статистика базируется на основных тезисах экономической теории и тесно взаимосвязана с бухгалтерским учетом. Социальная статистика имеет в своей основе разработки в области различных общественных наук.
В социально-экономической статистике широко применяются следующие статистические методы:
1) графический и табличный методы представления данных;
2) метод классификаций и группировок;
3) метод расчета абсолютных и относительных показателей;
4) методы расчета средних величин;
5) методы расчета показателей вариации;
6) индексный метод;
7) методы расчета показателей рядов динамики;
8) методы факторного анализа;
9) метод корреляционно-регрессионного анализа.
К основным задачам социально-экономической статистики относятся:
1) системный анализ сложившейся ситуации в социальной и экономической сферах общества;
2) анализ важнейших тенденций и закономерностей развития отраслей социальной и экономической инфраструктуры;
3) изучение уровня жизни населения;
4) исследование влияния различных факторов на динамику социальных и экономических явлений;
5) изучение взаимосвязей социальных и экономических явлений между собой и с другими явлениями общественной жизни;
6) разработка новых и совершенствование действующих статистических показателей, обеспечение сопоставимости их с показателями других отраслей;
7) интегрирование исследований на макроуровне для определения первопричин различных социальных и экономических явлений;
8) расширение круга показателей и статистических мнений, использование при оценке общественного мнения приемов и методов социологии и психологии;
9) предоставление органам государственного управления информации, необходимой им для принятия решений по кругу вопросов, связанных с формированием социально-экономической политики, разработкой различных государственных программ и мер по их реализации;
10) обеспечение информацией о развитии экономики и социальной сферы руководителей предприятий и компаний, менеджеров, организаторов производства и бизнесменов;
11) информирование об основных итогах и тенденциях социально-экономического развития широкой общественности, научно-исследовательских учреждений, общественно-политических организаций и отдельных лиц.
32. Единая система классификации и кодирования информации (ЕСКК)
Системный подход к исследованию социально-экономической стороны жизнедеятельности общества, используемый социально-экономической статистикой, предполагает разработку системы показателей, которая охватывает основные сферы социальной и экономической деятельности данного общества.
В составе системы показателей социально-экономической статистики выделяют несколько разделов:
1) показатели статистики численности населения (демографической статистики): показатели численности и состава населения, показатели таблиц смертности, методы исчисления перспективной численности населения;
2) показатели статистики рынка труда, производительности труда, оплаты труда и затрат на рабочую силу: показатели численности и состава занятых в экономике, показатели использования рабочего времени, показатели уровня и динамики производительности труда и др.;
3) показатели статистики национального богатства: показатели состава, движения и использования основных фондов, показатели инвестиционной деятельности и др.;
4) макроэкономические показатели производства товаров и услуг в системе национальных счетов: валовой выпуск, промежуточное потребление, добавочная стоимость, валовой внутренний продукт и др.;
5) показатели статистики рынка товаров и услуг: показатели объема, структуры и динамики товарооборота, показатели оборачиваемости товаров, показатели статистики поставок и реализации продукции, показатели запасов материальных ресурсов и др.;
6) показатели статистики издержек производства и обращения, результатов финансовой деятельности предприятий: показатели динамики и уровня динамики себестоимости продукции и издержек обращения, показатели прибыли и др.;
7) показатели статистики внешнеэкономических связей: объем экспорта, объем импорта, внешне торговый оборот, сальдо внешней торговли и др.;
8) показатели статистики уровня жизни населения и отраслей социальной сферы: валовой располагаемый доход и валовой скорректированный рас полагаемый доход домашних хозяйств, расходы на конечное потребление домашних хозяйств и др. При исследовании социально-экономических явлений и организации статистической информации важнейшими инструментами являются классификации, группировки и номенклатуры.
Классификация – это систематизированное распределение множества явлений и объектов на определенные подгруппы на основании их сходства или различия в соответствии с установленными методами.
Классификатор – это систематизированный перечень объектов (отраслей, предприятий и т. п.), каждому из которых присваивается код.
Номенклатура – это стандартный перечень объектов и их групп, в котором дополняются и детализируются классификаторы.
Классификационные группировки – это подмножества объектов, полученные в результате классификации.
С целью достижения достоверности и сопоставимости статистических показателей на международном уровне в РФ была создана Единая система классификации и кодирования информации (ЕСКК).
ЕСКК – это совокупность общероссийских классификаторов, средств ведения классификаторов и нормативных документов по их разработке.
Общероссийский классификатор – это классификатор, принятый государственным стандартом РФ и обязательный для применения в определенных сферах деятельности.
Среди наиболее важных общероссийских классификаторов можно выделить классификатор видов экономической деятельности, продукции и услуг (ОКВЭД). Классификации видов экономической деятельности являются базой для анализа статистических данных о производстве, факторах производства и др.
Правообладателям!
Это произведение, предположительно, находится в статусе 'public domain'. Если это не так и размещение материала нарушает чьи-либо права, то сообщите нам об этом.