7.1 Simple exponential smoothing
De eenvoudigste van de exponential smoothing methoden wordt natuurlijk simple exponential smoothing (SES)genoemd 13. Deze methode is geschikt voor het voorspellen van gegevens zonder duidelijke trend of seizoensgebonden patroon. De gegevens in Figuur 7.1 vertonen bijvoorbeeld geen duidelijk trendgedrag of seizoensgebondenheid. (Er is een stijging in de laatste paar jaar, die zou kunnen wijzen op een trend., We zullen overwegen of een trendy methode beter zou zijn voor deze serie later in dit hoofdstuk.) We hebben al gekeken naar de naïeve en het gemiddelde als mogelijke methoden voor het voorspellen van dergelijke gegevens (paragraaf 3.1).
oildata <- window(oil, start=1996)autoplot(oildata) + ylab("Oil (millions of tonnes)") + xlab("Year")
figuur 7.1: olieproductie in Saudi-Arabië van 1996 tot 2013.
de tabel hieronder toont de gewichten die zijn gekoppeld aan waarnemingen voor vier verschillende waarden van \(\alpha\) bij het voorspellen met behulp van eenvoudige exponentiële smoothing., Merk op dat de som van de gewichten zelfs voor een kleine waarde van \(\alpha\) ongeveer één zal zijn voor elke redelijke steekproefgrootte.
We presenteren twee equivalente vormen van eenvoudige exponentiële smoothing, die elk leiden tot de voorspellingsvergelijking (7.1).
optimalisatie
voor de toepassing van elke exponentiële afvlakmethode moeten de afvlakparameters en de beginwaarden worden gekozen. In het bijzonder, voor eenvoudige exponentiële smoothing, moeten we de waarden van \(\alpha\) en \(\ell_0\) selecteren. Alle voorspellingen kunnen worden berekend uit de gegevens zodra we die waarden kennen., Voor de methoden die volgen is er meestal meer dan één smoothing parameter en meer dan één eerste component te kiezen.
in sommige gevallen kunnen de afvlakparameters op subjectieve wijze worden gekozen-de voorspeller specificeert de waarde van de afvlakparameters op basis van eerdere ervaring. Echter, een meer betrouwbare en objectieve manier om waarden voor de onbekende parameters te verkrijgen is om ze te schatten op basis van de waargenomen gegevens.
in rubriek 5.,2, we schatten de coëfficiënten van een regressiemodel door het minimaliseren van de som van de kwadraatresiduen (meestal bekend als SSE of “som van kwadraatfouten”). Evenzo kunnen de onbekende parameters en de beginwaarden voor elke exponentiële smoothing methode worden geschat door de SSE te minimaliseren. De reststoffen worden opgegeven als \(e_t=y_t – \hat{y}_{t|t-1}\) Voor \(t=1,\dots,T\)., Daarom vinden we de waarden van de onbekende parameters en de beginwaarden die\
minimaliseren in tegenstelling tot het regressiegeval (waar we formules hebben die de waarden van de regressiecoëfficiënten retourneren die de SSE minimaliseren), gaat dit om een niet-lineair minimalisatieprobleem, en we moeten een optimalisatietool gebruiken om dit op te lossen.