Текст книги "Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews"
Автор книги: Владимир Брюков
Жанр: Личные финансы, Бизнес-Книги
Возрастные ограничения: +12
сообщить о неприемлемом содержимом
Текущая страница: 5 (всего у книги 14 страниц) [доступный отрывок для чтения: 5 страниц]
3.7. Оценка точности решения уравнения авторегрессии в EViews
Важным критерием для оценки эффективности статистической модели является уровень точности, получаемый с помощью данной модели при прогнозе курса доллара. Его в EViews можно оценить с помощью алгоритма действий № 8.
Алгоритм действий № 8 «Как оценить точность статистической модели в EViews»
Шаг 1. Выбор необходимой опции
Для того чтобы оценить точность данной статистической модели нужно в строке уравнение (3 EQUATION) выбрать опцию FORECAST.
Шаг 2. Заполнение мини-окна FORECAST
В результате у нас появился мини-окно FORECAST, которое следует заполнить таким образом (см. рис. 3.6).
Рис. 3.6. Заполнение мини-окна FORECAST
По умолчанию в опции FORECAST name (название файла с прогнозом) задается название файла с точечным прогнозом путем прибавления к исходному файлу латинской буквы f. Например, если у нас исходный файл – USDOLLAR, то название файла с прогнозом будет задано программой как USDOLLARf. В опции Forecast sample (выборка для прогноза) по умолчанию задается исходная выборка данных для прогноза, которую при необходимости можно изменить. В опции Method (метод прогноза) нам следует выбрать Static forecast (статичный прогноз), то есть мы оцениваем точность прогноза только на один следующий месяц. Если в опции Method выбрать вариант Dynamic forecast (динамичный прогноз), то это увеличило бы временной горизонт для прогноза, но его точность существенно снизилась бы. Дело в том, что при динамическом прогнозировании предсказание на следующий месяц составляется также как и при статичном, но прогнозы на более длительные сроки составляются на основе расчетных, то есть предсказанных, а не фактических значений независимой переменной.
В опции Output (вывод итогов) мы задали вариант Forecast evaluation (оценка прогноза) и получили таблицу с оценкой точности прогноза по данной статистической модели (см. табл. 3.6). При необходимости в последней опции можно задать еще и вариант Forecast graph (график прогноза), после чего мы получили бы еще и график прогноза.
Шаг 3. Интерпретация параметров, характеризующих уровень точности статистической модели
Для того чтобы по табл. 3.6 вынести суждение о качестве статистической модели сначала нужно ознакомиться с таблицей 3.5. Причем, в первую очередь следует обратить внимание на раздел этой таблицы «Идеальное значение параметра». Из этого раздела таблицы можно сделать вывод: чем ближе стремятся к нулю параметры, представленные в таблице 3.6., тем выше прогностическая ценность данной статистической модели. Единственным исключением из этого правила является параметр Covariance Proportion (доля ковариации, т.е. доля несистематической ошибки), для которого идеальным значением является единица.
Таблица 3.5. «Критерии для оценки точности прогноза и их идеальные значения»
В алгоритме действий № 8 «Как оценить точность статистической модели в EViews» мы в самом общем виде уже говорили об интерпретации параметров, характеризующих уровень точности статистической модели. Однако далее все желающие могут более подробно ознакомиться со спецификой параметров, содержащихся в табл. 3.6.
Таблица 3.6. Оценка точности уравнения регрессии (статистической модели) с параметрами USDOLLAR= 0,2260+1,2980 USDOLLAR(-1) -0,3047 USDOLLAR(-2)
В частности, Root Mean Squared Error (квадратный корень средней ошибки предсказания) представляет собой квадратный корень из суммы квадратов остатков (разницы между фактическим и предсказанным значением, деленной на общее количество наблюдений. Квадратный корень средней ошибки предсказания находят по следующей формуле (3.24):
Где Yt – фактические значения курса доллара; Ŷt – предсказанные значения курса доллара; n – количество наблюдений; e ‑ ошибки (остатки) или разница между расчетным и фактическим значением в данном случае курса доллара.
На основе имевшихся у нас данных квадратный корень средней ошибки предсказания по курсу доллара вычислен следующим образом:
При этом следует иметь в виду, что величина квадратного корня средней ошибки предсказания всегда чуть больше стандартной ошибки, представленной, например, в «Выводе итогов в Excel для уравнения авторегрессии второго порядка AR(2)» (см. табл. 3.2). Это объясняется тем, что квадратный корень средней ошибки предсказания находится путем деления суммы квадратов остатков на общее количество наблюдений. В то время как стандартная ошибка находится путем деления суммы квадратов остатков на число степеней свободы. Так, в нашем случае квадратный корень средней ошибки предсказания равен 0,805567 (при общем числе наблюдений =213), а стандартная ошибка равна 0,811301 (при 210 степенях свободы). Причем, число степеней свободы для нашей статистической модели мы нашли таким образом:
d.f.= n-k-1=213-2-1=210; где n – количество наблюдений; k – количество факторных переменных в статистической модели.
Mean Absolute Error (средняя ошибка) по модулю представляет собой абсолютную (без учета знака) сумму остатков (ошибок), деленную на общее количество наблюдений. Поскольку при сложении сумма остатков стремится к нулю, поэтому для нахождения средней ошибки приходится использовать их модульные значения. Средняя ошибка по модулю вычисляется по формуле (3.25):
Где где Yt – фактические значения курса доллара; Ŷt – предсказанные значения курса доллара; n – количество наблюдений.
Для нашей статистической модели среднюю ошибку по модулю нашли таким образом:
Mean Absolute Percentage Error (средняя ошибка по модулю, в %) равна сумме относительных ошибок (остатков), деленной на общее количество наблюдений. Средняя ошибка по модулю (в %) находится следующим образом (3.26):
Где Yt – фактические значения курса доллара; Ŷt – предсказанные значения курса доллара; n – количество наблюдений.
В данном случае средняя ошибка по модулю (в %) была рассчитана таким образом:
Как мы уже говорили, по трем перечисленным выше параметрам ‑ Root Mean Squared Error, Mean Absolute Error и Mean Absolute Percentage Error ‑ выбор обычно делается в пользу той статистической модели, у которой значениях этих параметров стремятся к нулю. Вполне очевидно, что чем меньше квадратный корень средней ошибки предсказания, средняя ошибка по модулю и средняя ошибка по модулю (в %), тем выше прогностическая ценность данной модели. При этом следует иметь в виду, что все три перечисленных выше параметра имеют диапазон значений от нуля до бесконечности.
Несколько особняком стоят четыре остальных параметра, представленных в таблице 3.6. Из них главным является Theil Inequality Coefficient (коэффициент неравенства Тейла), в то время как три другие можно назвать производными от первого. При этом значения этих четырех параметров изменяются в пределах от нуля до единицы.
Theil Inequality Coefficient (коэффициент неравенства Тейла) служит для общей оценки качества прогностической модели. Как мы уже говорили, идеальным для статистической модели считается значение коэффициента Тейла, равное нулю. Таким образом, чем ближе этот коэффициент к нулю, тем ценнее предсказание.
Коэффициент неравенства Тейла находится по следующей формуле (3.27):
Где Yt – фактические значения курса доллара; Ŷt – предсказанные значения курса доллара; n – количество наблюдений.
В нашем случае коэффициент Тейла рассчитан таким образом:
Квадратный корень средней ошибки предсказания может быть разложен на слагаемые по следующей формуле (3.28):
Где Yt с чертой сверху – средняя величина фактических значений курса доллара; Ŷt – предсказанные значения курса доллара; n – количество наблюдений;SŶ ‑ стандартное отклонение предсказанных значений курса доллара; SY ‑ стандартное отклонение фактических значений курса доллара; r – коэффициент корреляции между фактическими и предсказанными значениями курса доллара.
Если мы найдем долю (относительно квадратного корня средней ошибки) каждого из трех слагаемых (см. формулу ‑ 3.29), то в этом случае нам удастся вычислить еще три важных параметра, характеризующих качество прогноза, рассчитанного с помощью данной статистической модели.
Так, Bias Proportion (доля систематической ошибки прогноза) служит своего рода индикатором, показывающим, насколько средняя величина прогнозируемого значения, например, средняя величина прогноза по курсу доллара, отклоняется от средней величины его фактического значения. Причем, идеальной считается ситуация, когда доля систематической ошибки предсказания равна нулю. При этом доля систематической ошибки находится по следующей формуле (3.29):
Где Yt с чертой сверху – средняя величина фактических значений курса доллара; Ŷt – предсказанные значения курса доллара; n – количество наблюдений
Для того чтобы найти долю систематической ошибки в предсказаниях, сделанных данной прогностической модели, нам пришлось делать следующие вычисления:
Индикатор Variance Proportion (доля вариации) показывает насколько отличаются друг от друга вариация фактических и предсказываемых значений, например, курса доллара. Чем меньше доля этой вариации, тем лучше, а в идеале она должна быть равна нулю. Доля вариации находится по следующей формуле (3.30):
Где SŶ ‑ стандартное отклонение предсказанных значений курса доллара; SY ‑ стандартное отклонение фактических значений курса доллара, а все выражение в знаменателе формулы (3.30) представляет собой дисперсию ошибки предсказания. В Excel дисперсию и стандартное отклонение для генеральной совокупности данных можно вычислить с помощью соответствующих функций ДИСПР и СТАНДОТКЛОНП.
В нашей статистической модели доля вариации в предсказаниях оказалась равна:
Индикатор Covariance Proportion (доля ковариации) показывает долю несистематической ошибки в общей величине дисперсии ошибки предсказания. Поскольку этот индикатор показывает долю несистематической, остаточной ошибки в предсказаниях, которая присутствует во всех статистических моделях, то ее наличие не требует отказа от использования данного уравнения регрессии. Доля несистематической ошибки прогноза изменяется в диапазоне от 0 до 1. Причем, в идеале этот показатель должен быть равен единицы, чем он и отличается от всех остальных индикаторов, представленных в таблице 3.6.
В общем виде доля ковариации в предсказаниях находится следующим образом (3.31):
Где SŶ ‑ стандартное отклонение предсказанных значений курса доллара; SY ‑ стандартное отклонение фактических значений курса доллара; r – коэффициент корреляции между фактическими и предсказанными значениями курса доллара.
При этом по формуле (3.31) долю ковариаций в предсказаниях в нашем случае можно найти таким образом:
Следует также иметь в виду, что доля систематической ошибки прогноза, доля вариации и доля ковариации в сумме равняются единицы. В виде формулы это соотношение можно представить следующим образом:
Bias Proportion +Variance Proportion +Variance Proportion=1 (3.32)
Следовательно, когда доля ковариации равна 1, то это означает, что доля вариации и доля систематической ошибки в прогнозах равны 0. В этом случае можно было бы сделать вывод об идеальном качестве полученных прогнозов, чего на практике, как правило, не бывает. Используя преобразованную формулу (3.32), можно быстрее найти долю ковариации, чем по формуле (3.31). В результате долю ковариации в наших прогнозах можно также вычислить более простым способом:
Covariance Proportion =1– (Bias Proportion +Variance Proportion)=1-0-0,001166=0,998834
В заключение остановимся на содержательной интерпретации индикаторов, представленных в таблице 3.6. Судя по этой таблице можно сделать вывод, что квадратный корень средней ошибки предсказания по курсу доллара у нас после округления оказался равным 0,8056 рублям или 80,56 копейкам, в то время как средняя ошибка по модулю – 0,3607 рублям или 36,07 копейкам. В свою очередь, средняя ошибка предсказания по модулю равна 4,80 %. Напомним нашим читателям, что ошибка аппрокимации в пределах 5‑7 % свидетельствует о хорошем подборе статистической модели к исходным данным.
Коэффициент неравенства Тейла, фактически являющийся индексом, в данной таблице равен 0,0175, то есть его значение довольно близко подходит к нулю, что говорит о хорошем качестве предсказания. При этом доля систематической ошибки в предсказаниях равна 0 или 0%, в то время как доля вариации = 0,0012 или 0,12%, а доля ковариации=0,9988 или 99,88%.
Судя по таблице 3.6, с помощью двухфакторного уравнения регрессии со свободным членом нам удалось получить довольно качественную прогностическую модель. Тем не менее точность данной авторегрессионной модели можно повысить, причем, довольно существенно. Этим мы и будем заниматься в главе 4.
Контрольные вопросы и задания к главе 3
1. Какие уравнения называются уравнениями авторегрессии? Являются ли уравнения авторегрессии назвать частным случаем уравнений регрессии? В чем преимущество использования в прогнозах лаговой переменной с точки зрения теории эффективного рынка?
2. Какая предпосылка метода наименьших квадратов (МНК) не соблюдается в уравнениях регрессии? В каких случаях с помощью уравнения авторегрессии можно получать состоятельные и эффективные оценки?
3. Что означает англоязычная аббревиатура AR и ARMA Чем отличается модель AR от модели ARMA? Какие переменные входят в модель ARMA (2;1)?
4. Для чего необходима коррелограмма? В чем отличие автокорреляции от частной автокорреляционной функции? Что измеряет коэффициент автокорреляции уровней первого порядка?
5. Как производится идентификации моделей AR(p) и ARMA(p,q) с помощью коррелограммы? Как при этом используется автокорреляция и частная автокорреляция?
6. Почему критерий Дарбина – Уотсона нельзя использовать для тестирования уравнений авторегресии на наличие автокорреляции в остатках? Какой тест на наличие автокорелляции в остатках в уравнениях авторегрессии используется в EViews? Какой лаг нужно задать в этом тесте при тестировании уравнения авторегрессии второго порядка?
7. Как находится квадратный корень средней ошибки предсказания? Почему для нахождения средней ошибки приходится использовать их модульные значения. Как находится средняя ошибка по модулю, в процентах? Для чего используется коэффициент неравенства Тейла? Какое значение коэффициента неравенства Тейла считается идеальным для статистической модели?
Глава 4.
Подбор адекватного уравнения авторегрессии и составление точечных и интервальных прогнозов по курсу доллара
4.1. Повышение статистической значимости коэффициентов в уравнении авторегрессии
Одним из способов повысить точность статистической модели является увеличение количества переменных, включаемых в уравнение регрессии. Однако в табл. 3.1 «Коррелограмма исходных уровней временного ряда USDOLLAR с величиной лага от 1 до 36» хорошо видно, что коэффициент частной автокорреляции между рядами данных уже на лаге три месяца становится близким к нулю. Отсюда следует вывод, что нет никакого смысла добавлять в уравнение авторегрессии второго порядка AR(2) со свободным членом факторную лаговую переменную с лагом в три месяца и более.
Вместе с тем вывод итогов как в Excel, так и в EViews для данного уравнения свидетельствует о том, что величина р-значений, включенных в него коэффициентов, далеко не одинакова (см. табл. 3.2 и 3.3). Так, р-значения для коэффициентов регрессии факторных переменных USDOLLAR(-1) и USDOLLAR(-2) практически равны нулю, что свидетельствует об их статистической значимости с 99% уровнем надежности. А вот р-значение для коэффициента свободного члена (константы) данного уравнения регрессии равно 0,037226, что свидетельствует о его статистической значимости лишь с 95% уровнем надежности (точнее сказать с 96,28 % уровнем надежности =100%-3,72%).
Следовательно, для того чтобы повысить точность наших прогнозов, мы попробуем решить уравнение регрессии, исключив из формулы (3.14) статистически менее значимый свободной член. С этой целью необходимо воспользоваться алгоритмом действий № 6 «Как решить уравнение регрессии в EViews» (см. глава 3), но при выборе параметров оцениваемой статистической модели (см. шаг 3 данного алгоритма) мини-окно EQUATION SPECIFICATION нам нужно заполнить следующим образом:
USDOLLAR USDOLLAR(-1) USDOLLAR(-2) (4.1)
Фактически в буквенной форме формула (4.1) приобретет следующий вид:
USDOLLAR =a*USDOLLAR(-1) +b*USDOLLAR(-2) (4.2)
Причем, введя спецификацию (4.1) в EViews, мы тем самым дали задание программе оценить коэффициенты a и b из формулы (4.2). В результате EViews выдало итоги, который мы занесли в таблицу 4.1. На основе данных этой таблицы мы получили уравнение авторегрессии второго порядка AR(2) без константы со следующими параметрами:
USDOLLAR =1,321092*USDOLLAR(-1) -0,319415*USDOLLAR(-2); (4.3)
где USDOLLAR ‑ зависимая переменная курс доллара США; USDOLLAR(-1) ‑ независимая переменная курс доллара США с лагом один месяц; USDOLLAR(-2) ‑ независимая переменную курс доллара США с лагом в два месяца.
При этом экономическая интерпретация данного уравнения авторегрессии второго порядка следующая: во-первых, в период с августа 1992 по апрель 2010 г. рост на один рубль курса доллара в текущем месяце приводил к повышению прогнозируемого курса доллара в будущем месяце в среднем на 1,3210 руб.; во-вторых, одновременно с этим рост курса доллара в прошлом месяце приводил к снижению прогнозируемого кура доллара в будущем месяце в среднем на 0,3194 руб.
Судя по таблице 4.1, все коэффициенты в данном уравнении имеют р-значения (Prob.)=0, а, следовательно, можно сделать вывод, что они значимы с 99%-уровнем надежности. Вполне очевидно, что этого нам удалось добиться благодаря тому, что мы убрали из уравнения авторегрессии свободный член. Но как этот факт повлиял в целом на прогностические качества данной статистической модели?
Если посмотреть на коэффициент детерминации R2 (R-squared), то после удаления константы он уменьшился весьма незначительно: 99,53 %(0.9953) до 99,52% (0.9952) или на 0,01 процентный пункт. Еще меньше снизился скорректированный коэффициент детерминации R2 (Adjusted R-squared). Вместе с тем в уравнении авторегрессии без свободного члена незначительно снизился логарифм максимального правдоподобия (его более высокое значение, как правило, свидетельствует о более высоком качестве прогноза) и одновременно с этим незначительно повысилась величина информационного критерия Акаике (его более низкое значение, как правило, свидетельствует о более высоком качестве прогноза). Однако плюсом для уравнения без константы стал тот факт, что информационный критерий Шварца, который сильнее «штрафует» включение в уравнение регрессии дополнительных факторов, у него оказался ниже (его более низкое значение, как правило, свидетельствует о более высоком качестве прогноза).
Таблица 4.1. Вывод итогов в EViews для уравнения авторегрессии второго порядка без свободного члена
4.2. Оценка точности прогностической модели, проверка остатков на автокорреляцию и стационарность
Далее проверим уравнение AR(2) без константы на наличие автокорреляции в остатках с помощью LM– тест Бройша ‑ Годфри, используя при этом алгоритм действий № 7. При этом в мини-окне LAG SPECIFICATION зададим величину лага=2, поскольку мы тестируем уравнение авторегрессии второго порядка. Полученные результаты занесем в таблицу 4.2. Поскольку значимость (Probability) главного критерия этого теста наблюдения*R2 (Obs*R-squared) у нас равна 0,1069, то, следовательно, нулевая гипотеза об отсутствии автокорреляции в остатках не может быть отклонена с 95% уровнем надежности (а точнее сказать, с 89,31 % уровнем надежности). Если сравнить последнюю цифру с аналогичными данными таблицы 3.4, то об отсутствии автокорреляции в остатках в последнем случае можно говорить с большей уверенностью.
Таблица 4.2. Результаты LM– теста Бройша‑ Годфри на выявление автокорреляции в остатках для уравнения авторегрессии второго порядка без свободного члена
Таким образом сравнение параметров, с одной стороны, уравнения AR(2) с константой (см. табл. 3.3), а с другой стороны, уравнения AR(2) без константы (см. табл. 4.1), не помогло нам сделать окончательный вывод в пользу одного из них. Аналогичный результат у нас получился и по итогам проведения LM– тест Бройша– Годфри на наличие автокорреляции в остатках.
Поэтому мы решили оценить точность прогнозов, сделанных с помощью уравнения авторегрессии без константы, воспользовавшись алгоритмом действий № 8 «Как оценить точность статистической модели в EViews». В результате у нас получилась табл. 4.3.
Таблица 4.3. Оценка точности уравнения авторегрессии второго порядка без константы»
Если сравнить таблицу 4.3 с таблицей 3.6, то легко прийти к выводу, что шесть из восьми параметров, характеризующих точность прогнозов, свидетельствуют в пользу уравнения авторегрессии с константой. Правда, при этом разница между ними была весьма незначительной. Однако вполне естественно, что при прогнозировании курсов валют нас, в первую очередь, интересует точность предсказаний, которую можно получить с помощью той или иной статистической модели. И с этой точки зрения уравнение авторегрессии второго порядка без константы оказалось точнее. Так, средняя ошибка прогноза по модулю у последней модели оказалась (после округления) равна 33, 50 копейкам, а средняя ошибка по модулю (в %) – 2,78 %, то есть соответственно на 2,5 коп. и на 2,02 процентных пункта ниже, чем у уравнения авторегрессии с константой. Именно это обстоятельство и побудило нас сделать выбор в пользу уравнения авторегрессии без константы.
Мы уже писали, что для того чтобы сделать адекватный прогноз по курсу доллара необходимо учесть как тренд, так и случайную компоненту, поскольку оба эти фактора существенно влияют на динамику валюты (см. главу 1). Судя по таблице 4.3, нам удалось построить уравнение авторегрессии, с достаточно высокой степенью точности учитывающее тренд. Используя данную статистическую модель, можно делать точечные прогнозы, которые, правда… с фактическим курсом доллара очень редко совпадают. Объясняется это тем, что в ежемесячных колебаниях курса доллара достаточно большую роль играет не только тренд, но и случайная компонента. Судя по тому, что средняя ошибка по модулю у нас равна 2,78 %, то вполне очевидно, что эту цифру можно считать своего среднестатистическим индикатором вклада случайной компоненты в динамику курса доллара.
Поскольку точечный прогноз по определению не в состоянии указать нам диапазон вероятного отклонения фактического курса доллара от его предсказываемого значения, то с этой целью приходится использовать так называемый интервальный прогноз. Суть это интервального прогнозирования заключается в определении интервала значений, в которое прогнозируемое значение попадет с определенной долей вероятности. Чем выше интервал прогноза (разница между максимальным и минимальными значениями прогноза), тем больше вероятность (ее еще называют уровнем надежности) его реализации.
Однако прежде чем перейти к составлению интервальных прогнозов, нам необходимо: во-первых, проверить полученные остатки на стационарность; во-вторых, посмотреть, является ли нормальным распределение остатков.
В EViews проверить остатки на стационарность достаточно просто, для этого нужно только четко усвоить алгоритм действий № 9.
Алгоритм действий № 9 «Как в EViews проверить остатки на стационарность»
Шаг 1. Установка необходимых опций
С этой целью нужно выбрать строку 2 Workfile (рабочий файл), а затем открыть файл Resid (остатки), который у нас появляется в рабочем в файле после того как мы воспользовались опцией Forecast. (см. алгоритм действий № 8 «Как оценить точность статистической модели в EViews»).
Далее в файле Resid нам следует воспользоваться опцией Unit Root test (тест на единичный корень), в результате чего появится (см. рис. 4.1) мини-окно Unit Root test, в котором нам нужно выбрать следующие опции.
Шаг 2. Заполнение мини-окна Unit Root test
Так, параметр TEST TYPE (тип теста) установим на опции AUGMENTED DICKEY-FULLER (расширенный тест Дикки-Фуллера), поскольку этот тест чаще всего используется на практике, так как он учитывает возможную автокорреляцию в остатках. Параметр TEST FOR UNIT ROOT IN (тест на единичный корень для… ) следует установить на опции 1-ST DIFFERENCE (первых разностей), так как в исследовании остатков на стационарность не используются их исходные уровни. Параметр INCLUDE IN TEST EQUATION (включить в тестовое уравнение) установим на опции NONE (не включать тренд или тренд и константу), поскольку в остатках отсутствует тренд и свободный член уравнения (константа). Параметр LAG LENGTH (длина лага) установим на опции AUTOMATIC SELECTION (автоматический выбор), что позволит EViews самостоятельно выбрать длину лага. Вполне естественно, что при необходимости длину лага можно задать самому.
Рис. 4.1. Заполнение мини-окна UNIT ROOT TEST
Шаг 3. Интерпретация результатов теста
Теория тестирования стационарности временных рядов нами изложена ниже. А для того, чтобы просто сделать вывод о стационарности временного ряда на основе расширенного теста Дикки-Фуллера нужно знать следующее. После того как ранее мы заполнили мини-окно Unit Root test и щелкнули кнопку OK, то в результате у нас получилась таблица 4.4 с итогами теста. При этом главное внимание нужно обратить на верхнюю строчку теста, выделенную жирным шрифтом Augmented Dickey-Fuller test statistic (статистика расширенного теста Дикки-Фуллера). Поскольку статистика теста Дикки-Фуллера в данном случае равна -11.05764, а ее значимость (Prob.) равна 0.0000, то нулевая гипотеза о том, что D(RESID) имеет единичный корень, отвергается. Следовательно, мы можем принять альтернативную гипотезу о стационарности полученных остатков.
При этом в таблице 4.4 даются критические значения теста (Test critical values), на основе которых о стационарности остатков можно судить с различным уровнем надежности. Так, в том случае, когда статистика расширенного теста Дикки-Фуллера меньше -2,576127, то вывод о стационарности остатков можно сделать с 99% уровнем надежности, а если меньше -1,942361, но больше -2,576127, то 95 % уровнем надежности. Если интересующая нас статистика меньше -1,615684, но больше -1,942361, то уровень надежности вывода о стационарности остатков снижается до 90%.
В основе теории единичного корня лежит довольно простая формула, которая считается базовой для понимания стационарности в уравнениях авторегрессии (4.4):
Y t = ρY t-1 + e t
где Y t – результативная зависимая переменная; Y t-1 – независимая факторная переменная с лагом в один период (в нашем случае в один месяц); ρ ‑ коэффициент регрессии; e t
– остатки.
Уравнение авторегрессии первого порядка считается стационарным в том случае, когда коэффициент регрессии ρ <1. Соответственно, если ρ >1, то оно считается нестационарным, а, следовательно, волатильность с течением времени может нарастать и стремится к бесконечности. Следует заметить, что при необходимости в формулу (4.4) может быть добавлена константа, либо константа и тренд, если, конечно, они будут статистически значимыми.
Проверка авторегрессионного процесса на стационарность проводится следующим образом. Согласно нулевой гипотезе, предполагается, что если ρ=1, то временной ряд нестационарный, а в случае ее опровержения принимается альтернативная гипотеза, утверждающая, что ρ <1, а, следовательно, ряд стационарный.
В ходе решения обычного уравнения регрессии рассчитывается t– статистика для коэффициента регрессии ρ, совпадающая с расчетными значениями статистики Дикки-Фуллера, которая потом сравнивается с критическими значениями статистики Дикки-Фуллера (обычно даются в таблице, но в EViews,естественно мы их получим в готовом виде). Сравнение проводится по одностороннему критерию, но если бы альтернативная гипотеза состояла в утверждении, что ρ не равна 1, то тогда бы мы пользовались двусторонним критерием. Поскольку проверка гипотезы проводится по одностороннему критерию, то в этом случае, если расчетное значение t-статистики для коэффициента регрессии ρ будет меньше критического значения статистики Дикки-Фуллера (с поправкой на число наблюдений), то нулевая гипотеза о том, что ρ =1 отклоняется и принимается альтернативная гипотеза о том, что ρ < 1, а, следовательно, временной ряд Yt можно считать стационарным.
Стандартный тест Дикки-Фуллера проводится после вычитания Y t-1 из левой и правой части уравнения (4.4) . В результате мы получаем следующую формулу (4.5):
Y t – Y t-1 = ρY t-1 – Y t-1 + e t
Учитывая, что dY1= Y t – Y t-1, а ρY t-1 – Y t-1= (ρ-1) Y t-1 и приравняв a=(ρ-1), мы получим новое уравнение (4.6):
dY1= aY t-1+ e t
С учетом того, что при ρ=1 параметр a становится равным нулю, то соответственно в случае принятия нулевой гипотезы a=0, а если принимается альтернативная гипотеза, то соответственно, |a| < 0. И, следовательно, временной ряд считается стационарным.
Однако на практике большую популярность приобрел расширенный тест Дикки-Фуллера AUGMENTED DICKEY-FULLER , так как он учитывает возможную автокорреляцию в остатках, При этом в правую часть уравнения (4.6) включаются дополнительные лаговые переменные Y. В результате это уравнение приобретает следующий вид (4.7):
В дальнейшем эти знания нам потребуются для проверки авторегрессионного процесса второго порядка (см. уравнение 4.1) на стационарность, а пока мы применим данную теорию для проверки на стационарность остатков, полученных в результате решения данного уравнения. После того как в алгоритме № 9 мы заполнили мини-окно Unit Root test и щелкнули кнопку OK, то это фактически означает решение нами следующего уравнения регрессии (4.8):
В результате решения расширенного теста Дикки-Фуллера мы получили таблицу 4.4 с итогами теста, свидетельствующими о стационарности остатков. О том, как мы пришли к этому выводу, подробно рассказано выше (см. алгоритм действий № 9 «Как проверить в EViews остатки на стационарность модели»).
Таблица 4.4. Итоги решения расширенного теста Дикки-Фуллера для остатков, полученных по статистической модели USDOLLAR =1,321092*USDOLLAR(-1) +0,319415*USDOLLAR(-2)
Поскольку мы доказали, что остатки, полученные нами по модели авторегрессии второго порядка без константы, являются стационарными, то, следовательно, можно сделать вывод, что их распределение носит устойчивый характер.
Внимание! Это не конец книги.
Если начало книги вам понравилось, то полную версию можно приобрести у нашего партнёра - распространителя легального контента. Поддержите автора!Правообладателям!
Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.Читателям!
Оплатили, но не знаете что делать дальше?