Электронная библиотека » Владимир Брюков » » онлайн чтение - страница 4


  • Текст добавлен: 26 сентября 2017, 20:01


Автор книги: Владимир Брюков


Жанр: Личные финансы, Бизнес-Книги


Возрастные ограничения: +12

сообщить о неприемлемом содержимом

Текущая страница: 4 (всего у книги 14 страниц) [доступный отрывок для чтения: 5 страниц]

Шрифт:
- 100% +

3.4. Решение в Excel уравнения авторегрессии второго порядка AR(2)


После того как с помощью соответствующей коррелограммы (см. табл. 3.1) мы пришли к выводу, что для получения оптимального прогноза по курсу доллара следует построить модель авторегрессии второго порядка AR(2), то следующим нашим шагом должно стать нахождение ее параметров. Правда, для этого развернутое уравнение авторегрессии AR(2), представленное в формуле (3.10), необходимо немного упростить. С этой целью из этой формулы следует убрать остатки, которые появятся только после решения данного уравнения. Кроме того, чтобы убрать у коэффициентов факторных переменных подстрочные индексы (цифры) обозначим их различными буквами. В результате формула (3.9) приобретет более удобный для решения вид (3.13):





ГдеY t-1 – курс доллара США с лагом в один месяц; Y t-2– курс доллара США с лагом в два месяца; c – свободный член (константа).


Мы уже научились решать уравнения регрессии в Excel – см. алгоритм действий № 3 «Как решить уравнение регрессии в Excel». Поэтому используя этот алгоритм, можно получить соответствующее уравнение авторегрессии, которое, как известно, является частным случаем уравнения регрессии и отличается от последнего лишь наличием лаговых факторных переменных. А для загрузки и первичной обработки данных по ежемесячному курсу доллара необходимо воспользоваться первым пунктом алгоритма действий № 1 «Как строить диаграммы в Microsoft Excel» ‑ Шаг 1. Поиск данных, их загрузка и первичная обработка в Excel».

Далее создадим в Excel три столбца: во-первых, с зависимой переменной USDOLLAR – ежемесячный курс доллара США; во-вторых, с двумя независимыми переменными USDOLLAR(-1) – курс доллара США с лагом один месяц и USDOLLAR (-2) ‑ курс доллара США с лагом два месяца. При этом загруженная база данных по американской валюте у нас охватывает период с июня 1992 г. по апрель 2010 г.

Далее, согласно алгоритму действий № 3 «Как решить уравнение регрессии в Excel», установим в появившемся окне РЕГРЕССИЯ следующие опции (см. рис. 3.2): Входной интервал y ($B$1:$B$214); Входной интервал Х($C$1:$D$214); Уровень надежности (99); выходной интервал ($L$2).




Рис. 3.2. Установка опций в окне РЕГРЕССИЯ


В результате решения в Excel уравнения авторегрессии AR(2) со свободным членом мы получим следующий вывод итогов, представленный в виде таблицы 3.2. Возьмем из данной таблицы значения коэффициентов (см. столбец «Коэффициенты») и, подставив их в формулу (3.13), получим следующее уравнение авторегрессии (с округлением):


USDOLLAR = 0,2260+1,2980 USDOLLAR(-1) -0,3047 USDOLLAR(-2)


Где USDOLLAR ‑ зависимая переменная курс доллара США; USDOLLAR(-1) ‑ независимая переменная курс доллара США с лагом один месяц; USDOLLAR(-2) ‑ независимая переменную курс доллара США с лагом в два месяца; 0,2260 ‑ свободный член (константа).


При этом экономическая интерпретация данного уравнения авторегрессии второго порядка следующая: во-первых, в период с июня 1992 по апрель 2010 г. при исходном уровне 0,2260 руб. рост на один рубль курса доллара в текущем месяце приводил к повышению прогнозируемого курса доллара в будущем месяце в среднем на 1,2980 руб.; во-вторых, одновременно с этим рост курса доллара в прошлом месяце приводил к снижению прогнозируемого кура доллара в будущем месяце в среднем на 0,3047 руб.

Действуя согласно алгоритму действий № 4 «Оценка статистической значимости уравнения регрессии и его коэффициентов», мы можем сделать следующие выводы.

1.1. Поскольку коэффициент детерминации R2для данного уравнения регрессии оказался равен 0,9977, то отсюда можно сделать вывод, что оно в 99,77% случаях в состоянии объяснить ежемесячные колебания курса доллара.

1.2. Значимость F равна 1,3E-245или =0, а, следовательно, уравнение регрессии статистически значимо как при 95% уровне надежности, так и при 99% уровне надежности.

2.1. P-Значение для коэффициента свободного члена уравнения равно 0,037226, а следовательно этот коэффициент статистически значим лишь при 95% уровне надежности, но не значим при 99% уровне надежности, поскольку он больше 0,01. P-Значение для двух коэффициентов регрессии равно 0, а, следовательно, эти коэффициенты статистически значимы как при 95% уровне надежности, так и при 99% уровне надежности.


Таблица 3.2 «Вывод итогов в Excel для уравнения авторегрессии второго порядка AR(2)»





3.5. Решения в EViews уравнения авторегрессии второго порядка AR(2)


Однако вышеуказанное уравнение авторегрессии второго порядка с константой можно решить не только в Excel, но и в EViews. Более того, решение данного уравнения регрессии в EViews имеет ряд преимуществ, обусловленных спецификой данной программы. Во-первых, в EViews можно быстрее оценить прогностическую точность полученной статистической модели; во-вторых, есть возможность протестировать полученные остатки на стационарность, наличие автокорреляции, а также провести ряд других важных тестов, о которых мы расскажем позднее. Тем читателям, которым еще не приходилось решать уравнения регрессии в EViews, советуем внимательно познакомиться с алгоритмом действий № 5 «Как решить уравнение регрессии в EViews»


Алгоритм действий № 6 «Как решить уравнение регрессии в EViews»


Шаг 1. Импорт данных из Excel и создание рабочего файла в EViews

Для импорта ежемесячных данных по курсу доллара (на конец месяца) за период с июня 1992 г. по апрель 2010 г. из Excel в EViews необходимо воспользоваться алгоритмом действий № 2 «Импорт данных и создание рабочего файла в EViews». При этом столбец с соответствующими данными по курсу доллара мы обозначили как USDOLLAR.

Шаг 2. Выбор опций в EViews для решения уравнения регрессии.

После импорта данных в Excel выбираем в командной строке EViews опции Object/New OBJECT, а затем в появившемся окне new OBJECT(новый объект) выбираем опцию EQUATION(уравнение) ‑ см. рис. 3.3.





Рис. 3.3. Опция EQUATION в окне New OBJECT программы EViews


Далее в EViews появляется новое окно ‑ EQUATION ESTIMATION(ОЦЕНКА УРАВНЕНИЯ), которое мы должны заполнить следующим образом (см. рис. 3.4.).

Следует иметь в виду, что в опции ESTIMATION SETTINGS (ПАРАМЕТРЫ ОЦЕНИВАЕМОЙ МОДЕЛИ) в мини-окне METHOD (МЕТОД РЕШЕНИЯ) по умолчанию появляется опция LS – LEAST SQUARES (NLC AND ARMA), которая переводится как МЕТОД НАИМЕНЬШИХ КВАДРАТОВ (НЕЛИНЕЙНЫЙ МНК И ARMA). Поскольку данное уравнение авторегрессии мы решаем с помощью метода наименьших квадратов, то эту опцию мы оставляем. Хотя при необходимости в EViews можно использовать несколько других методов решения уравнений, на которых мы сейчас не будем останавливаться.


Шаг 3. Выбор параметров оцениваемой статистической модели


В опции ESTIMATION SETTINGS (ПАРАМЕТРЫ ОЦЕНИВАЕМОЙ МОДЕЛИ) есть еще одно мини-окно SAMPLE (ВЫБОРКА), в котором по умолчанию указывается либо общее количество наблюдений, либо период наблюдения. В данном случае в мини-окне SAMPLE появилась надпись: 1992M06 2010M05, что означает, что наша выборка содержит ежемесячные данные за период с июня 1992 г. по май 2010 год.

Особенно внимательным следует быть при заполнении мини-окна EQUATION SPECIFICATION (СПЕЦИФИКАЦИЯ УРАВНЕНИЯ), в котором нужно написать латиницей название зависимой переменной (ее в списке всегда пишут первой слева) и независимых переменных, а также – в случае необходимости – константу (свободный член уравнения), обозначаемую латинской буквой C.

В нашем случае мини-окно EQUATION SPECIFICATION заполняется следующим образом (3.14):

USDOLLAR USDOLLAR(-1) USDOLLAR(-2) C


где USDOLLAR ‑ зависимая переменная курс доллара США; USDOLLAR(-1) ‑ независимая переменная курс доллара США с лагом один месяц; USDOLLAR(-2) ‑ независимая переменную курс доллара США с лагом в два месяца; С ‑ свободный член (константа).


Мини-окно EQUATION SPECIFICATION легко заполнить, если воспользоваться уравнением авторегрессии (3.13.). При этом нужно сделать следующее: во-первых, убрать буквенные обозначения коэффициентов регрессии, но оставить константу С; во-вторых, вместо Yt поставить соответствующее название зависимой переменной ‑ USDOLLAR, а для факторных (независимых) переменных Y t-1 и Y t-2 в скобках еще и добавить соответствующую цифру лага со знаком минус.

Если вспомнить, что формула USDOLLAR USDOLLAR(-1) USDOLLAR(-2) C фактически означает уравнение авторегрессии второго порядка со свободным членом, то мини-окно EQUATION SPECIFICATION можно заполнить другой, более краткой, но вполне равнозначной формулой:


USDOLLAR AR(1) AR(2) C (3.15)


Где USDOLLAR‑ зависимая переменная; AR(1)‑ авторегрессия первого порядка или USDOLLAR(-1); AR(2) ‑ авторегрессия второго порядка или USDOLLAR(-2) и С ‑ константа (свободный член уравнений).





Рис. 3.4. Заполнение окна EQUATION ESTIMATION


Шаг 4. Вывод в EViews параметров уравнения авторегрессии

Итак, все опции, необходимые для решения уравнения авторегрессии, установлены. Далее щелкаем кнопку OK в окне EQUATION ESTIMATION. В результате чего получаем данные с параметрами уравнения авторегрессии, которые мы поместили в табл. 3.3. При этом не стоит удивляться тому, что после соответствующей корректировки количество наблюдений у нас сократилось с 215 до 213. Это обусловлено тем, что при создании факторных переменных с лагом один и два месяца мы потеряли два наблюдения. В результате теперь наша скорректированная выборка охватывает период не с июня 1992 г., а с августа 1992 г. по апрель 2010 г.

Для того чтобы нашему читателю можно было легче понять содержащиеся в табл. 3.3 англоязычные термины, мы решили дать их вместе с параллельным переводом в скобках. Если сравнить табл. 3.3 с выводом итогов, полученным после решения этого же уравнения авторегрессии в Excel (см. табл. 3.2), то можно прийти к выводу о тождественности большей части информации, имеющейся в обеих таблицах. Следует также заметить, что как в программе Excel, так и в EViews, мы смогли получить коэффициенты уравнения регрессии с одинаковым уровнем точности.


3.6. Интерпретация параметров уравнения авторегрессии в EViews

О том, какой статистический смысл имеют те или иные параметры уравнения регрессии при выводе итогов в Excel, , уже говорилось в главе 1 нашей книги. Однако при выводе итогов в EViews мы получаем новую информацию о других важных параметрах уравнения регрессии, которых нет при выводе итогов в Excel. Для того чтобы обратить внимание читателя на эти дополнительные параметры мы решили выделить их жирным шрифтом в табл. 3.3. Далее мы познакомимся со статистическим смыслом этих еще не изученных нами дополнительных параметров уравнения регрессии.

1. В таблице 3.3 среди пока неизвестных нам параметров уравнения регрессии можно назвать такой важный показатель, как Log likelihood (Логарифм максимального правдоподобия), который используется в качестве критерия для отбора наиболее адекватных уравнений регрессии. Чем выше логарифм максимального правдоподобия, тем более адекватным считается данное уравнение регрессии. При этом логарифм максимального правдоподобия находится по следующей формуле (3.16):



2. Следующим еще неизученным нами параметром уравнения регрессии является Durbin-Watson stat (Критерий Дарбина – Уотсона), который является своего рода тестом на наличие автокорреляции в остатках. Как мы уже говорили, при наличии автокорреляции в остатках оценки коэффициентов уравнения регрессии нельзя назвать состоятельными и эффективными. При этом критерий Дарбина – Уотсона находится следующим образом (3.17):




Где n – количество наблюдений; еt – отклонение (остатки) прогноза от фактического курса доллара; еt-1 ‑ отклонение (остатки) прогноза от фактического курса доллара c лагом в один месяц. В нашем случае критерий Дарбина – Уотсона находится следующим образом:


Правда, критерий Дарбина – Уотсона нельзя использовать для тестирования уравнений авторегресии на наличие автокорреляции в остатках, поскольку в данном случае он теряет свою мощность. Это объясняется тем, что применение данного критерия предполагает строгое соблюдение предпосылки о разделении переменных на зависимую (результативную) и независимую (факторную) переменную. В уравнениях авторегрессии, как известно, в правой части уравнения имеются лаговые значения результативной переменной, а, следовательно, вышеуказанная предпосылка не соблюдается. В этом случае фактическое значение критерия Дарбина – Уотсона приблизительно равно 2, как при наличии, так и при отсутствии автокорреляции в остатках. Тем не менее в обычных уравнениях регрессии данный критерий весьма полезен для тестировании остатков на наличие автокорреляции.

3. Следующий параметр уравнения регрессии, на наш взгляд, не представляет каких-либо трудностей для его понимания ‑ Mean dependent var(Среднее Значение зависимой переменной). При этом среднее значение зависимой переменной рассчитывается по довольно простой формуле (3.18):



Где n – количество наблюдений; Yt – зависимая переменная ежемесячный курс доллара.

В нашем случае среднее значение (вернее сказать, среднее хронологическое, поскольку мы берем период за 213 месяцев) зависимой переменной мы находим следующим образом:





4. Еще один показатель, характеризующий зависимую переменную данного уравнения регрессии ‑ S.D. dependent var (Стандартное отклонение зависимой переменной). При этом стандартное отклонение зависимой переменной находится так (3.19):




5. Важными параметрами уравнения регрессии является два информационных критерия‑ Akaike info criterion (Информационный критерий Акаика) и Schwarz criterion (Критерий Шварца). Оба этих информационных критериев можно использовать в качестве критериев для определения в уравнении регрессии оптимальной длины лага. При этом они основаны на принципе снижения остаточной суммы квадратов при добавлении значимого фактора. Так, информационный критерий Акаика находится по следующей формуле (3.20):


Где LL ‑ логарифм максимального правдоподобия; T – количество наблюдений; k – общее количество лагов в уравнении авторегрессии.

:

В нашем случае информационный критерий Акаика равен

AIC = -2×256,1815: 213 × 2 × 3: 213 =2,4336.

В свою очередь информационный критерий Шварца рассчитывается по формуле

SC = -2LL: T + (k ln T):T. (3.21)

Относительно нашего уравнения регрессии информационный критерий Шварца имеет

следующее значение:

SC = -2 × 256,1815: 213 + (3 ln 213):213 =2,4809.


Обычно оцениваемая статистическая модель лучше соответствует фактическим данным при более высоком порядке p и q в модели ARMA(p, q). При этом платой за это кажущееся повышение точности является вполне очевидная потеря в простоте статистической модели и в экономии включенных в него параметров. Поэтому для достижения компромисса между точностью уравнения регрессии и экономией его параметров, пользуются информационными критериями Акаика и Шварца.

Причем, при выборе из двух уравнений регрессии обычно предпочтение отдается той статистической модели, у которой меньше значения этих информационных критериев. Следует также заметить, что информационный критерий Шварца по сравнению критерием Акаика отбирает уравнения регрессии с более экономичными параметрами.


Таблица 3.3. Вывод итогов в EViews и принятие решения о статистической значимости уравнения регрессии и значимости его коэффициентов





Как мы уже говорили, в уравнениях авторегрессии при тестировании остатков на наличие автокорреляции критерий Дарбина-Уотсона теряет свою мощность. Поэтому в этих случаях приходится пользоваться иными критериями. Например, тем, кто работает в Excel, с этой целью проще воспользоваться критерием h Дарбина или как его еще называют h – статистикой Дарбина. Его расчет выполняется по следующей формуле (3.22):




Где D ‑ критерий Дарбина-Уотсона; n – количество наблюдений; V – квадрат стандартной ошибки при лаговой факторной переменной Yt-1.

Например, в нашем случае критерий h Дарбина находится следующим образом:





При увеличении объёма выборки распределение h-статистики стремится к нормальному с нулевым математическим ожиданием и дисперсией, равной 1. Поэтому гипотеза об отсутствии автокорреляции в остатках отвергается, если фактическое значение h-статистики оказывается больше, чем критическое значение нормального распределения. Для проверки по критерию h Дарбина гипотезы о наличии автокорреляции в остатках проще воспользоваться следующим правилом.

1. Если h =1,96, то нулевая гипотеза об отсутствии положительной автокорреляции в остатках отклоняется.

2. Если h=-1,96, то нулевая гипотеза об отсутствии отрицательной автокорреляции в остатках отклоняется.

3. Если -1,96 < h >1,96, то нет основания отклонять нулевую гипотезу об отсутствии автокорреляции в остатках.

Поскольку в данном случае критерий h Дарбина получился равным -1,00368, то у нас нет основания отклонять нулевую гипотезу об отсутствии автокорреляции в остатках.

Следует иметь в виду, что у использования критерия h Дарбина есть определенная специфика. Во-первых, данный критерий нельзя применять, если произведение nV 1. Во-вторых, h –статистику Дарбина можно использовать лишь для больших выборок (n равно или более 30 наблюдений). В-третьих, критерий h Дарбина зависит только от V (квадрата стандартной ошибки) при лаговой факторной переменной Yt-1 и не зависит от числа лагов, используемых в уравнении авторегрессии.

В EViews для проверки статистических моделей на наличие автокорелляции в остатках целесообразно использовать LM– тест Бройша‑ Годфри (Breusch-Godfrey Serial Correlation LM Test), который в отличие от h –статистики Дарбина, может быть применим не только для авторегрессии первого порядка, но и для авторегрессии более высоких порядков.

Суть данного теста заключается в построении уравнения регрессии остатков с заранее заданной величиной лага, решение которого позволяет сделать вывод о наличии или отсутствии автокорреляции в остатках (3.23):




Где e – остатки, m – заданная величина лага, u – некоррелируемые остатки, то есть «белый шум».

При этом выдвигается нулевая гипотеза, что коэффициенты при остатках e: p1= p2= … pm=0, то есть автокорреляция в остатках с различным лагом отсутствует. Вполне естественно, что альтернативной гипотезой в данном случае является гипотеза о том, что они не равны нулю. По итогам решения уравнения регрессии (3.23) нулевая гипотеза либо принимается, либо отклоняется.

Поскольку LM– тест Бройша‑ Годфри проверяет остатки на автокорреляцию, то мы его проводим уже после того как решили основное уравнение авторегрессии, а следовательно нашли остатки, полученные на основе данной статистической модели.


Алгоритм действий № 7 «Как выполняется LM-тест Бройша-Годфри в EViews»


Шаг 1 Практическая реализация LM– теста Бройша‑ Годфри

В EViews реализации LM– теста Бройша‑ Годфри довольно проста. С этой целью необходимо в командной строке (1 Command) или в строке уравнение (3 EQUATION) выбрать следующие опции: View/Residual Tests/Serial Correlation LM Test… После чего появляется мини-окно LAG SPECIFICATION, в котором можно задать интересующую нас величину лага (см. рис. 3.5). В данном случае мы задаем величину лага=2, что обусловлено структурой лаговых переменных, включенных в уравнение авторегрессии ‑ см. формулу (3.13). В общем виде величина задаваемого лага для модели ARMA (p,q) = max(p,q), что для нашего случая приобретает следующий вид: ARMA (2,0) = max(2,0)=2.




Рис. 3.5. Мини-окно LAG SPECIFICATION, в котором задается величина лага


Шаг 2 Интерпретация результатов тестирования


В результате мы получаем следующие данные по результатам проведения LM– теста Бройша‑Годфри, которые занесем в табл. 3.4. EViews сообщает две тестовые статистики (см. две верхние строки в таблице 3.4, выделенные жирным шрифтом) При этом для оценки результатов тестирования в качестве основного используется критерий Obs*R-squared(Наблюдения*R2), который мы не только выделили жирным шрифтом, но и подчеркнули. Для нашего случая Obs*R-squared=0,024005*213=5,112998. Правда, если мы попробуем сами провести это вычисление, то из-за округления из-за округления R2 у нас получится некоторое расхождение с цифрой, выданной EViews.


При этом предполагается, что LM тестовая статистика (критерий Obs*R-squared) асимптотически распределена как χ 2 (хи-квадрат-распределение), о котором мы уже говорили выше. Поэтому значимость Obs*R-squared определяется с помощью табличного χ2 крит.


Таблица 3.4. Результаты LM– теста Бройша‑Годфри на выявление автокорреляции в остатках




В том случае, когда значимость (Probability) Obs*R-squared у нас оказывается 0,05, то нулевая гипотеза об отсутствии автокорреляции в остатках отклоняется. Если же Obs*R-squared 0,05, то нулевую гипотезу об отсутствии автокорреляции в остатках нельзя отклонить. Поскольку в нашем случае значимость Obs*R-squared=0,077576, то нулевая гипотеза об отсутствии автокорреляции в остатках не может быть отклонена с95% уровнем надежности.

В EViews приводится в качестве дополнительного F-критерий (F-statistic), который представляет собой тест на определение совокупной значимости всех лаговых остатков. Как мы уже убедились ранее, при построении уравнения авторегрессии у нас происходит уменьшение временного ряда данных, что ведет к пропуску, в том числе и части лаговых остатков. Согласно предложению, выдвинутому в 1993 году Давидсоном и Маккинном, в этом случае отсутствующие остатки следует приравнивать к нулю. По их мнению, это дает лучшую статистику, чем в случае пропуска этих остатков. Однако, по мнению большинства исследователей, в этом случае распределение F-статистики становится не совсем точным. Тем не менее EViews дает F-критерий для справочных целей.


Страницы книги >> Предыдущая | 1 2 3 4 5 | Следующая
  • 0 Оценок: 0

Правообладателям!

Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.

Читателям!

Оплатили, но не знаете что делать дальше?


Популярные книги за неделю


Рекомендации