Владимир Брюков - Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews
Несколько особняком стоят четыре остальных параметра, представленных в табл. 3.6. Из них главным является Theil Inequality Coefficient (коэффициент неравенства Тейла), в то время как три других можно назвать производными от первого. При этом значения этих четырех параметров изменяются в пределах от нуля до единицы.
Theil Inequality Coefficient служит для общей оценки качества прогностической модели. Как мы уже говорили, идеальным для статистической модели считается значение коэффициента Тейла, равное нулю. Таким образом, чем ближе этот коэффициент к нулю, тем ценнее предсказание.
Коэффициент неравенства Тейла находится по следующей формуле:
В нашем случае коэффициент Тейла имеет следующее значение:
Квадратный корень средней ошибки предсказания может быть разложен на слагаемые по следующей формуле:
где Ŷt — средняя величина фактических значений курса доллара;
Sŷ — стандартное отклонение предсказанных значений курса доллара;
Sy — стандартное отклонение фактических значений курса доллара;
r — коэффициент корреляции между фактическими и предсказанными значениями курса доллара.
Если мы найдем долю (относительно квадратного корня средней ошибки) каждого из трех слагаемых (см. формулу (3.30)), то в этом случае нам удастся вычислить еще три важных параметра, характеризующих качество прогноза, рассчитанного с помощью исследуемой статистической модели.
Так, Bias Proportion (доля систематической ошибки прогноза) служит своего рода индикатором, показывающим, насколько средняя величина прогнозируемого значения, например средняя величина прогноза по курсу доллара, отклоняется от средней величины его фактического значения. Причем идеальной считается ситуация, когда доля систематической ошибки предсказания равна нулю. При этом доля систематической ошибки находится по следующей формуле:
Чтобы найти долю систематической ошибки в предсказаниях, сделанных при помощи этой прогностической модели, нам пришлось проделать следующие вычисления:
Индикатор Variance Proportion (доля вариации) показывает, насколько отличаются друг от друга вариации фактических и предсказываемых значений, например курса доллара. Чем меньше доля этой вариации, тем лучше, а в идеале она должна быть равна нулю. Доля вариации находится по следующей формуле:
В Excel дисперсию и стандартное отклонение для генеральной совокупности данных можно вычислить с помощью соответствующих функций ДИСПР и СТАНДОТКЛОНП.
В нашей статистической модели доля вариации в предсказаниях оказалась равна:
Индикатор Covariance Proportion (доля ковариации) показывает долю несистематической ошибки в общей величине дисперсии ошибки предсказания. Поскольку этот индикатор показывает долю несистематической, остаточной ошибки в предсказаниях, которая присутствует во всех статистических моделях, то ее наличие не требует отказа от использования этого уравнения регрессии. Доля несистематической ошибки прогноза изменяется в диапазоне от 0 до 1. Причем в идеале этот показатель должен быть равен единице, чем он и отличается от всех остальных индикаторов, представленных в табл. 3.6.
В общем виде доля ковариации в предсказаниях находится следующим образом:
где r — коэффициент корреляции между фактическими и предсказанными значениями курса доллара.
При этом по формуле (3.31) доля ковариаций в предсказаниях равна:
Следует также иметь в виду, что доля систематической ошибки прогноза, доля вариации и доля ковариации в сумме равняются единице. В виде формулы это соотношение можно представить следующим образом:
Bias Proportion + Variance Proportion + Variance Proportion = 1. (3.32)
Следовательно, когда доля ковариации равна единице, это означает, что доля вариации и доля систематической ошибки в прогнозах равны нулю. В этом случае можно было бы сделать вывод об идеальном качестве полученных прогнозов, чего на практике, как правило, не бывает. Используя преобразованную формулу (3.32), можно быстрее найти долю ковариации, чем по формуле (3.31). В результате долю ковариации в наших прогнозах можно также вычислить более простым способом:
Covariance Proportion = 1 — (Bias Proportion + Variance Proportion) = 1 -0-0,001166 = 0,998834.
В заключение остановимся на содержательной интерпретации индикаторов, представленных в табл. 3.6. Из этой таблицы можно сделать вывод, что квадратный корень средней ошибки предсказания по курсу доллара после округления оказался равным 0,8056 руб., или 80,56 коп., в то время как средняя ошибка по модулю — 0,3607 руб., или 36,07 коп. В свою очередь средняя ошибка предсказания по модулю равна 4,80 %. Напомним, что ошибка аппроксимации в пределах 5–7 % свидетельствует о хорошем соответствии статистической модели исходным данным.
Коэффициент неравенства Тейла, фактически являющийся индексом, в этой таблице равен 0,0175, т. е. его значение довольно близко подходит к нулю, что говорит о хорошем качестве предсказания. При этом доля систематической ошибки в предсказаниях равна 0 или 0 %, в то время как доля вариации равна 0,0012, или 0,12 %, а доля ковариации — 0,9988, или 99,88 %.
Судя по табл. 3.6, с помощью двухфакторного уравнения регрессии со свободным членом нам удалось получить довольно качественную прогностическую модель. Тем не менее точность этой авторегрессионной модели можно повысить, причем довольно существенно.
Контрольные вопросы и задания1. Какие уравнения называются уравнениями авторегрессии? Являются ли уравнения авторегрессии частным случаем уравнений регрессии? В чем преимущество использования в прогнозах лаговой переменной с точки зрения теории эффективного рынка?
2. Какая предпосылка метода наименьших квадратов (МНК) не соблюдается в уравнениях регрессии? В каких случаях с помощью уравнения авторегрессии можно получать состоятельные и эффективные оценки?
3. Что означают англоязычные аббревиатуры AR и ARMA? Чем отличается модель AR от модели ARMA? Какие переменные входят в модель ARMA(2; 1)?
4. Для чего необходима коррелограмма? В чем отличие автокорреляции от частной автокорреляционной функции? Что измеряет коэффициент автокорреляции уровней 1-го порядка?
5. Как производится идентификации моделей AR(p) и ARMA(p, q) с помощью коррелограммы? Как при этом используются автокорреляция и частная автокорреляция?