[МУЗЫКА] [МУЗЫКА] [ШУМ] Всем привет! Тема сегодняшней лекции — «AR и Ma», не путать с ARMA. И мы начали говорить о временных рядах и прогнозировании в них. И сегодня мы рассмотрим две самые простые модели, которые способны прогнозировать либо описывать временные ряды. И первая модель — это AR-модель, либо авторегрессионная модель. Это модель временных рядов, в которой значения временного ряда в данный момент линейно зависят от предыдущих значений этого же ряда. Очень простая модель, и с помощью этого даже можно прогнозировать, если мы сможем правильно как-то ее определить. Обозначается она как AR(p), где p — это порядок регрессии, и может представлять в следующем виде, где a1, ..., ap — это параметры модели, коэффициенты авторегрессии, c — это некоторая постоянная, часто для упрощения применяют равное 0, и εt — это некоторый белый шум, то есть это такой процесс, матожидание которого равно 0, он симметричный. [НЕРАЗБОРЧИВО] И самый простой вариант, простейший вариант нашего AR-процесса — это AR(1), который выглядит следующим образом. То есть мы здесь предполагаем, что текущее значение нашего ряда зависит от предыдущего как-то. Что, как оценить параметры? Можно оценить параметры, например, с помощью [НЕРАЗБОРЧИВО], который мы уже проходили. Но также существуют и другие способы оценки параметров. Частым примером AR-модели может быть SAR-модель, а именно season autregression, то есть у нас может быть зависимость не от предыдущего, например, значения, а какого-то далекого. Допустим, если недельная сезонность, то это может быть семидневная, то есть мы пропускаем 6 элементов и говорим, что у нас зависимость от какого-то седьмого дня. Однако такая модель обычно не очень хорошая, потому что есть связь между и предыдущим и каким-то дальним днем, поэтому часто их комбинируют. Допустим, у нас может быть зависимость от предыдущего дня и от прошлого минус семь дней. Тогда модель будет выглядеть как как AR(1) и SAR(7). Мы покажем это на примере, если возьмем наши данные и здесь будем прогнозировать на день вперед, то есть мы возьмем семь точек, по ним построим регрессию — сначала SAR-регрессию с параметром 7, — и прогнозируем на нее день, посмотрим, что получится. И делаем то же самой, только потом с помощью модели AR(1) и SAR(7). Видно, что во втором случае у нас получилась лучшая модель, то есть она лучше описывает данные и лучше делает прогноз, что вполне очевидно. А вторая модель, которую мы сегодня рассмотрим, называется moving average, я думаю, все о ней слышали — «скользящее среднее». И здесь значение функции в каждой точке определяется как некоторое среднее за предыдущие периоды. И данная модель, скорее, подходит для анализа, чем для прогнозирования, потому что что мы здесь можем спрогнозировать? Довольно немного, потому что мы делаем какой-то первый прогноз, а дальше мы опираемся уже на этот же прогноз, когда будем сглаживать. Однако это скользящее среднее хорошо подходит для как раз сглаживания каких-то колебаний, для выделения каких-то тенденций, сезонности и циклов. Как вы помните из лекции STL, там как раз мы говорили о том, что с помощью скользящего среднего выделялась, по-моему, сезонность. В общем виде выглядит скользящее среднее вот таким вот образом. И здесь w — это нормированные веса, которые в сумме должны будут равны 1, а p, t и −i — это значения исходной функции в момент времени, отдаленное от текущего на i интервалов назад. Самый простой способ — это когда у нас все веса равны, самый простой случай — когда у нас все веса равны 1, и получаем простое арифметическое скользящее среднее. Здесь интересно, что несмотря на то что мы полученные значения скользящего среднего относятся к середине интервала, допустим, мы смотрим по пяти, и скользящее среднее относится, скорее, к третьему значению. Но обычно, традиционно его относят к последней точке интервала, то есть у нас получается некоторое смещение. И если мы попробуем построить скользящее среднее для наших данных, то получится вот такая вот картина. То есть мы что видим? Что, действительно, модель стала более как бы понятной, то есть здесь нет таких выбросов, все довольно сглажено. Однако она смещена вправо. То есть очевидно, что для анализа это подходит хорошо, однако прогнозировать с такой моделью нельзя. Кроме того, существуют различные виды скользящих средних, например, когда веса все равны 1 — это арифметическое скользящее среднее, я уже говорил об этом, но часто их берут и не делают разными, все веса, потому что как бы лучше получается. И здесь мы можем видеть линейно взвешенное скользящее среднее — это когда у нас текущий вес, предыдущий вес больший, чем предпредыдущий, и так далее потом — веса бывают линейны. Также, я думаю, все вы слышали о экспоненциальном взвешенном, то есть экспоненциальном сглаживании, когда у нас веса убывают экспоненциально. Итак, AR-модель у нас подходит для прогнозирования, MA-модель лучше подходит для описания данных, для сглаживания каких-то выбросов. И в следующей лекции мы поговорим о комбинации двух этих моделей, об ARMA-модели.