Regneark implementering av sesongjustering og eksponensiell utjevning Det er greit å utføre sesongjustering og passe eksponentielle utjevningsmodeller ved hjelp av Excel. Skjermbildene og diagrammene nedenfor er hentet fra et regneark som er satt opp for å illustrere multiplikativ sesongjustering og lineær eksponensiell utjevning på følgende kvartalsvise salgsdata fra Outboard Marine: Klikk her for å få en kopi av regnearkfilen selv. Utgaven av lineær eksponensiell utjevning som skal brukes her for demonstrasjonsformål er Brown8217s versjon, bare fordi den kan implementeres med en enkelt kolonne med formler, og det er bare én utjevningskonstant for å optimalisere. Vanligvis er det bedre å bruke Holt8217s versjon som har separate utjevningskonstanter for nivå og trend. Fremskrivningsprosessen fortløper som følger: (i) først er dataene sesongjustert (ii) så blir prognoser generert for sesongjusterte data via lineær eksponensiell utjevning og (iii) til slutt er de sesongjusterte prognosene kvoteres for å få prognoser for den opprinnelige serien . Sesongjusteringsprosessen utføres i kolonne D til G. Det første trinnet i sesongjustering er å beregne et sentrert glidende gjennomsnitt (utført her i kolonne D). Dette kan gjøres ved å ta gjennomsnittet av to ettårige gjennomsnitt som kompenseres av en periode i forhold til hverandre. (En kombinasjon av to offset-gjennomsnitt i stedet for et enkelt gjennomsnitt er nødvendig for sentrering når antall årstider er like.) Det neste trinnet er å beregne forholdet til glidende gjennomsnitt, dvs. De opprinnelige dataene divideres med det bevegelige gjennomsnittet i hver periode - som utføres her i kolonne E. (Dette kalles også quottrend-cyclequot-komponenten i mønsteret, forutsatt at trend og konjunktursykluser kan anses å være alt som forblir etter gjennomsnitt over en helårs verd av data. Selvfølgelig kan endringer i måned til måned som ikke skyldes sesongbestemte, bestemmes av mange andre faktorer, men gjennomsnittet på 12 måneder glatter seg over dem i stor grad.) Beregnet sesongindeks for hver sesong beregnes ved først å beregne alle forholdene for den aktuelle sesongen, som er gjort i celler G3-G6 ved hjelp av en AVERAGEIF formel. Gjennomsnittstallene blir deretter rescaled slik at de summerer til nøyaktig 100 ganger antall perioder i en sesong, eller 400 i dette tilfellet, som er gjort i celler H3-H6. Nedenfor i kolonne F brukes VLOOKUP-formler til å sette inn riktig sesongindeksverdi i hver rad i datatabellen, i henhold til kvartalet av året representerer den. Det sentrert glidende gjennomsnittet og de sesongjusterte dataene ser ut som dette: Merk at det bevegelige gjennomsnittet vanligvis ser ut som en jevnere versjon av den sesongjusterte serien, og den er kortere i begge ender. Et annet regneark i samme Excel-fil viser anvendelsen av den lineære eksponensielle utjevningsmodellen til sesongjusterte data, som begynner i kolonne G. En verdi for utjevningskonstanten (alfa) er angitt over prognosen kolonnen (her i celle H9) og For enkelhets skyld er det tildelt rekkeviddenavnet quotAlpha. quot (Navnet er tilordnet med kommandoen quotInsertNameCreatequot.) LES-modellen initialiseres ved å sette de to første prognosene tilsvarer den første virkelige verdien av sesongjusterte serien. Formelen som brukes her for LES-prognosen, er den recirkulære resirkulære formen av Brown8217s-modellen: Denne formelen er oppgitt i cellen som svarer til den tredje perioden (her, celle H15) og kopieres derfra. Legg merke til at LES-prognosen for den nåværende perioden refererer til de to foregående observasjonene og de to foregående feilene, samt til verdien av alfa. Således refererer prognoseformelen i rad 15 kun til data som var tilgjengelige i rad 14 og tidligere. (Selvfølgelig, hvis vi ønsket å bruke enkle i stedet for lineær eksponensiell utjevning, kunne vi erstatte SES-formelen her i stedet. Vi kunne også bruke Holt8217s i stedet for Brown8217s LES-modellen, som ville kreve to flere kolonner med formler for å beregne nivå og trend som brukes i prognosen.) Feilene beregnes i neste kolonne (her, kolonne J) ved å trekke prognosene fra de faktiske verdiene. Rotenes middelkvadratfeil beregnes som kvadratroten av variansen av feilene pluss kvadratet av gjennomsnittet. (Dette følger av den matematiske identiteten: MSE VARIANCE (feil) (AVERAGE (feil)). 2.) Ved beregning av gjennomsnitt og varians av feilene i denne formelen, er de to første periodene utelukket fordi modellen ikke faktisk begynner å prognose til den tredje perioden (rad 15 på regnearket). Den optimale verdien av alfa kan bli funnet enten ved å endre alfa manuelt til minimum RMSE er funnet, ellers kan du bruke quotSolverquot til å utføre en nøyaktig minimering. Verdien av alfa som Solver funnet er vist her (alfa0.471). Det er vanligvis en god ide å plotte feilene i modellen (i transformerte enheter) og også å beregne og plotte sine autokorrelasjoner på lags på opptil en sesong. Her er en tidsserier av de (sesongjusterte) feilene: Feilautokorrelasjonene beregnes ved hjelp av CORREL () - funksjonen for å beregne korrelasjonene til feilene med seg selv forsinket av en eller flere perioder - detaljer vises i regnearkmodellen . Her er et plot av autokorrelasjonene til feilene ved de fem første lagene: Autokorrelasjonene på lags 1 til 3 er svært nær null, men spissen ved lag 4 (hvis verdien er 0,35) er litt plagsom - det antyder at Sesongjusteringsprosessen har ikke vært helt vellykket. Men det er faktisk bare marginalt signifikant. 95 signifikansbånd for å teste om autokorrelasjoner er signifikant forskjellig fra null er omtrent pluss-eller-minus 2SQRT (n-k), hvor n er prøvestørrelsen og k er lagret. Her er n 38 og k varierer fra 1 til 5, slik at square-root-of-n-minus-k er rundt 6 for dem alle, og derfor er grensene for å teste den statistiske signifikansen av avvik fra null tilnærmet pluss - eller-minus 26 eller 0,33. Hvis du varierer verdien av alpha for hånd i denne Excel-modellen, kan du observere effekten på tidsseriene og autokorrelasjonsplottene av feilene, så vel som på den rotte-kvadratiske feilen, som vil bli illustrert nedenfor. På bunnen av regnearket er prognoseformelen kvotetatt i fremtiden ved bare å erstatte prognoser for faktiske verdier ved det punktet der de faktiske dataene går tom - det vil si. hvor quotthe futurequot begynner. (Med andre ord, i hver celle der en fremtidig dataværdi vil oppstå, settes en cellereferanse som peker på prognosen som er laget for den perioden.) Alle de andre formlene kopieres ganske enkelt ned fra oven: Legg merke til at feilene for prognoser for fremtiden er alle beregnet til å være null. Dette betyr ikke at de faktiske feilene vil være null, men det reflekterer bare det faktum at vi forutsetter at fremtidige data vil svare til prognosene i gjennomsnitt. De resulterende LES-prognosene for de sesongjusterte dataene ser slik ut: Med denne spesielle verdien av alfa, som er optimal for prognoser med en periode fremover, er den forventede trenden litt oppadgående, noe som gjenspeiler den lokale trenden som ble observert de siste 2 årene eller noe. For andre verdier av alfa, kan det oppnås en helt annen trendprojeksjon. Det er vanligvis en god ide å se hva som skjer med den langsiktige trendprojeksjonen når alfa er variert, fordi verdien som er best for kortsiktig prognose, ikke nødvendigvis vil være den beste verdien for å forutse den lengre fremtid. For eksempel er her resultatet som oppnås hvis verdien av alfa er manuelt satt til 0,25: Den projiserte langsiktige trenden er nå negativ, heller enn positiv. Med en mindre verdi av alfa, legger modellen vekt på eldre data i sin estimering av dagens nivå og trend, og langsiktige prognoser reflekterer den nedadgående trenden observert de siste 5 årene i stedet for den nyere oppadgående trenden. Dette diagrammet illustrerer også tydelig hvordan modellen med en mindre verdi av alfa er langsommere for å svare på quotturning pointsquot i dataene og derfor har en tendens til å gjøre en feil på det samme tegnet i mange perioder på rad. Dens 1-trinns prognosefeil er større i gjennomsnitt enn de som er oppnådd før (RMSE på 34,4 i stedet for 27,4) og sterkt positivt autokorrelert. Lag-1 autokorrelasjonen på 0,56 overstiger sterkt verdien av 0,33 beregnet ovenfor for en statistisk signifikant avvik fra null. Som et alternativ til å svekke verdien av alpha for å introdusere mer konservatisme i langsiktige prognoser, blir det noen ganger lagt til en quotrend dampeningquot-faktor i modellen for å gjøre den projiserte trenden flatt ut etter noen perioder. Det siste trinnet i å bygge prognosemodellen er å quotereasonizequot LES prognosene ved å multiplisere dem med de riktige sesongindeksene. De resesaliserte prognosene i kolonne I er således bare produktene av sesongindeksene i kolonne F og de sesongjusterte LES-prognosene i kolonne H. Det er relativt enkelt å beregne konfidensintervaller for en-trinns prognoser laget av denne modellen: først beregne RMSE (root-mean-squared-feilen, som bare er kvadratroten til MSE), og beregne deretter et konfidensintervall for sesongjustert prognose ved å legge til og trekke to ganger RMSE. (Generelt er et 95-konfidensintervall for en prognose for en periode fremdeles omtrent lik punktsprognosen pluss-eller-minus-to ganger estimert standardavvik for prognosefeilene, forutsatt at feilfordelingen er omtrent normal og prøvenes størrelse er stor nok, si 20 eller mer. Her er RMSE i stedet for standardfeilavviket for feilene det beste estimatet av standardavviket for fremtidige prognosefeil fordi det tar forvirring, samt tilfeldige variasjoner i betraktning.) Tillitgrensene for sesongjustert prognose blir deretter resesasonalized. sammen med prognosen, ved å multiplisere dem med de riktige sesongindeksene. I dette tilfellet er RMSE lik 27,4 og sesongjustert prognose for den første fremtidige perioden (desember 93) er 273,2. så sesongjustert 95 konfidensintervall er fra 273,2-227,4 218,4 til 273,2227,4 328,0. Multiplicere disse grensene med Decembers sesongindeks på 68,61. Vi oppnår lavere og øvre konfidensgrenser på 149,8 og 225,0 rundt prognosen på 93,9 prosent på 187,4. Forventningsgrenser for prognoser mer enn en periode framover vil generelt øke etter hvert som prognosehorisonten øker på grunn av usikkerhet om nivå og trend, samt sesongfaktorer, men det er vanskelig å beregne dem generelt ved hjelp av analytiske metoder. (Den riktige måten å beregne konfidensgrenser for LES-prognosen er ved å bruke ARIMA-teorien, men usikkerheten i sesongindeksene er en annen sak.) Hvis du vil ha et realistisk konfidensintervall for en prognose mer enn en periode framover, tar du alle kilder til Feil i betraktning, din beste innsats er å bruke empiriske metoder: for eksempel for å oppnå et konfidensintervall for en 2-trinns prognose, kan du opprette en annen kolonne på regnearket for å beregne en 2-trinns prognose for hver periode ( ved å starte opp en-trinns prognose). Beregn deretter RMSE for de to-trinns prognosefeilene og bruk dette som grunnlag for et 2-trinns konfidensintervall. Tagget med syklisk komponent (20 i en serie) Velkommen til vårt 20-talls prognose fredagspost. De siste fire månedene har vært ganske en reise, da vi gikk gjennom ulike tidsseriemetoder som å flytte gjennomsnittlige modeller, eksponensielle utjevningsmodeller og regresjonsanalyse, etterfulgt av grundige diskusjoner om forutsetningene bak regresjonsanalyse og konsekvenser og rettsmidler av bryter disse forutsetningene. I dag gjenopptar vi de mer praktiske aspektene av tidsserieanalyse, med en diskusjon om dekomponering av en tidsserie. Hvis du husker fra vårt 3 mai innlegg. en tidsserie består av fire komponenter: en trendkomponent en sesongkomponent en syklisk komponent og en uregelmessig eller tilfeldig komponent. I dag vil vi vise deg hvordan du kan isolere og kontrollere for disse komponentene, ved hjelp av det fiktive eksempelet på Billie Burton, en selvstendig næringsdrivende kurvmaker. Billie Burton har alltid elsket å lage gavekurver og pleiepakker, og har kjørt sin egen virksomhet de siste 10 årene. Billie vet at virksomheten ser ut til å øke år etter år, men hun vet også at hennes virksomhet er sesongmessig. Billie er også sikker på at folk don8217t kjøper så mange varepakker og gavekurver når økonomien er treg. Hun prøver å vurdere effekten av hver av disse komponentene på sin virksomhet. Siden Billie8217s virksomhet er en enmansbutikk, og alle hennes kurvkurver er håndlagde (hun gjør ikke kurvene eller innholdet deres, men samler dem, bryter dem dekorativt og sender dem), hun er mer opptatt nå med å prognose antall Gavekurvbestillinger, i stedet for salg, slik at hun kunne estimere sin arbeidsbelastning. Så Billie trekker sammen sine månedlige ordrer for årene 2005-2009. De ser slik ut: TOTAL GIFT BASKET ORDERS Når en variabel utviser en langsiktig økning eller reduksjon i løpet av tiden, sies det å ha en trend. Billie8217s gavekurvbestillinger for de siste fem årene viser en langsiktig oppadgående trend, som vist i tidsserien: Selv om grafen ser ganske opptatt og humpete ut, kan du se at Billie8217s månedlige ordrer ser ut til å bevege seg oppover over løpet av tiden. Legg merke til at vi passer en rett linje over Billie8217s tidsserier. Dette er en lineær trendlinje. De fleste ganger plotter vi dataene i en tidsserie, og deretter tegner en rettlinje frihånd for å vise om en trend øker eller avtar. En annen tilnærming til å tilpasse en trendlinje som den jeg brukte her, er å bruke enkel regresjonsanalyse, ved hjelp av hver tidsperiode, t, som den uavhengige variabelen, og nummerere hver periode i sekvensiell rekkefølge. Derfor vil januar 2005 være t1 og desember 2009 vil være t60. Dette ligner mye på tilnærmingen vi diskuterte i vårt 27 mai blogginnlegg da vi demonstrerte hvordan vår andre fiktive forretningskvinne, Sue Stone, kunne prognose hennes salg. Ved å bruke regresjonsanalyse, for å passe vår trendlinje, ville vi få følgende ligning: Siden trenden på trendlinjen er positiv, vet vi at trenden er oppadgående. Billie8217s ordrer ser ut til å øke med litt mer enn en halv ordre hver måned, i gjennomsnitt. Men når vi ser på R 2. får vi bare .313, noe som tyder på at trendlinjen doesn8217t passer de faktiske dataene godt. Men det er på grunn av den drastiske sesongbestemtheten i datasettet, som vi skal ta opp kort tid. For nå vet vi i hvert fall at trenden øker. Når en tidsserie viser et repeterende mønster over tid, vanligvis i løpet av samme tid på året, er dette mønsteret kjent som sesongkomponenten i tidsseriene. Noen tidsserier har mer enn en periode i året hvor sesongmessig er sterk, andre har ingen sesongmessighet. Hvis du ser på hvert av januarpoengene, merker du at det er betydelig lavere enn i desember og i februar. Også, hvis du ser på hver desember, ser du at det er det høyeste punktet på bestillinger for hvert år. Dette foreslår sterkt sesongmessighet i dataene. Men hva er effekten av sesongbestemningen Vi finner ut ved å isolere sesongkomponenten og lage en sesongbestemt indeks, kjent som forholdet til glidende gjennomsnitt. Beregning av forholdet til glidende gjennomsnitt er en fire-trinns prosess: Først tar du glidende gjennomsnitt av serien Siden våre data er månedlige, tar vi et 12 måneders glidende gjennomsnitt. Hvis våre data var kvartalsvis, ville vi gjøre et fjerde kvartals glidende gjennomsnitt. We8217ve har i hovedsak gjort dette i tredje kolonne i tabellen under. Deretter senterer vi de bevegelige gjennomsnittene ved å ta gjennomsnittet av hvert suksessivt par bevegelige gjennomsnitt, resultatet vises i fjerde kolonne. For det tredje, beregne forholdet til glidende gjennomsnitt For å oppnå forholdet til glidende gjennomsnitt, divisjon antall ordrer for en gitt måned med det sentriske 12-måneders glidende gjennomsnittet som tilsvarer den aktuelle måneden. Legg merke til at juli 2005 er den første måneden med et sentrert 12 måneders glidende gjennomsnitt. Det er fordi vi mister datapunkter når vi tar et bevegelige gjennomsnitt. For juli 2005 deler vi sitt antall ordre, 12, med sitt sentriske 12 måneders glidende gjennomsnitt, 21,38, og får .561 (tallet8217s multiplisert med 100 for prosenter, i dette eksemplet). Vi har nøyaktig 48 måneders forhold å undersøke. Lar plotte hvert år8217s forhold på en graf: Ved første øyekast ser det ut til at det kun er to linjer på grafene, de i år tre og fire. Imidlertid er alle fire årene representert på denne grafen. Det er bare at alle vendepunktene er de samme, og forholdet til glidende gjennomsnitt for hver måned er nesten identisk. Den eneste forskjellen er i år 3 (juli 2007 til juni 2008). Legg merke til hvordan den grønne linjen for år tre ikke følger samme mønster som de andre årene, fra februar til april. År 38217s forhold til glidende gjennomsnitt er faktisk høyere for mars enn i alle foregående år, og lavere for april. Dette skyldes at påskedagene falt i slutten av mars 2008, slik at påskedagskursongen ble flyttet et par uker tidligere enn i tidligere år. Til slutt beregner du gjennomsnittlig sesongindeks for hver måned. Nå har vi forholdet til glidende gjennomsnitt for hver måned. Let8217s gjennomsnittlige dem: RATIO FOR FLYTING AVERAGES Derfor ser vi at august er en vanlig måned (gjennomsnittlig sesongindeks 1). Men se på desember. Sesongens indeks er 1,75. Det betyr at Billie8217s ordrer generelt er 175 prosent høyere enn det månedlige gjennomsnittet i desember. Gitt juledagen som gir sesong, forventes at8217s i Billie8217s gavekurvvirksomhet. Vi ser også høyere sesongindekser i november (når juletidssesongen starter), februar (Valentine8217s Day), og i april (påske). De andre månedene har en tendens til å være under gjennomsnittet. Legg merke til at april isn8217t er utrolig høyt over grunnlinjen, og at mars hadde ett år hvor it8217s indeks var 1,25 (i andre år var det under 0,80). Det er fordi påske noen ganger faller i slutten av mars. Ting som dette er viktig å holde styr på, siden det kan dramatisk påvirke planleggingen. Også, hvis en gitt måned har fem helger ett år og bare 4 helger neste eller hvis springår legger til en dag i februar hvert fjerde år, avhengig av din virksomhet, kan disse hendelsene gjøre stor forskjell i nøyaktigheten av dine prognoser. De cykliske og uregelmessige komponentene Nå som vi har isolert trenden og sesongkomponenter, vet vi at Billie8217s ordrer viser en økende trend, og at ordrer tendens til å være over gjennomsnittet i november, desember, februar og april. Nå må vi isolere de sykliske og sesongbestandige komponentene. Sykliske variasjoner don8217t gjentar seg i et vanlig mønster, men de er heller ikke tilfeldige variasjoner. Sykliske mønstre er gjenkjennelige, men de varierer nesten alltid i intensitet (høyden fra topp til trough) og timing (frekvens som toppene og troughs forekommer). Siden de ikke kan forutses nøyaktig, analyseres de ofte med de uregelmessige komponentene. Måten vi isolerer de sykliske og uregelmessige komponentene ved, er først å isolere trenden og sesongkomponenter som vi gjorde ovenfor. Så vi tar vår trendregresjonsligning ovenfra, plugger inn hver måned8217s sekvensnummer for å få trendverdien. Da multipliserer vi den med den månedlige gjennomsnittlige sesongforholdet til gjennomsnittlig gjennomsnitt for å utlede statistisk normal. For å utlede den cyclicalirregulære komponenten deler vi de faktiske ordrene for den måneden av statistisk normal. Følgende tabell viser oss hvordan: Sesongindeksforholdet Syklisk 8211 uregelmessig komponent () For det meste ser Billie8217s ordre don8217t ut å ha mye syklisk eller uregelmessig oppførsel. I de fleste måneder er det konjunktur-uregelmessige komponentforholdet ganske nær 100. Gitt hennes type virksomhet, vet vi at dette ikke ville være sant eller et fluke, siden resesjonen fra 2008 til 2009 sannsynligvis ville ha betydet en reduksjon av ordrer. I mange av disse månedene vil vi forvente å se et forhold godt under 100. Vi ser at i mye av 2005 er den syklisk-uregelmessige komponenten for Billie8217s gavekurvordre godt over 100. Det er meget sannsynlig at i disse årene, Billie8217s virksomhet ser et positivt syklisk mønster. Vi ser da uregelmessige mønstre i mars og april i senere år, hvor den syklisk-uregelmessige komponenten også er godt over 100. Det er igjen uregelmessigheten når påske faller. Ikke overraskende har påsken både en sesongmessig og uregelmessig komponent. Det betyr ikke at Billie kan sparke opp føttene og være trygg på å vite at hennes virksomhet ikke lider mye av sykliske eller uregelmessige mønstre. En dypning av lavkonjunkturen kan til slutt synke hennes ordrer. En krig kan kutte av materialene som brukes til å produsere gavekurver, en mangel eller drastisk prisøkning i materialene hun bruker, kan også tvinge prisene høyere, noe som igjen senker hennes ordrer henne verkstedet kunne bli ødelagt i en flom eller brann og så videre. Å håndtere noen av disse uregelmessige mønstrene som er nesten umulig å planlegge for Billie ville kjøpe forsikring. Å vite sammensetningen av en tidsserie er et viktig element i prognosen. Dekomponering av tidsseriene hjelper beslutningstakere å vite og forklare variabiliteten i dataene sine og hvor mye av den som skal tilskrives trend, sesongmessige, sykliske og uregelmessige komponenter. I neste uke8217s Forecast Forecast Friday post, diskuterer vi8217ll hvordan du kan prognose ved å bruke data som er sesongjustert. La nye innlegg komme til deg CategoriesSeasonal komponent (for tidsserier data) Tidsserier data som har fjernet sesongkomponenten. I sesongjusterte data er effekten av regelmessige sesongfenomener fjernet. den glatte serien T C og den sesongjusterte serien T C I. Statistikken New Zealandrsquos Economic Survey of Manufacturing ga følgende data om faktiske driftsinntekter for industrisektoren i New Zealand. Sentrerte bevegelige midler er beregnet. For kvartaler med sentrert flytte betyr den enkelte sesongvirkningen beregnet av: Driftsinntekter (rå data) ndash (sentrert) bevegelige gjennomsnitt Den samlede sesongvirkningen for hvert kvartal er beregnet ved å gjennomsnittlig de enkelte sesongvirkninger. De to individuelle sesongvirkningen for mars kvartaler er ndash588.125 og ndash561.75. Middelet av disse 2 verdiene er ndash574.938. De andre estimerte samlede sesongvirkninger er vist i andre tabell nedenfor. Sesongjusterte data beregnes av: Driftsinntekter (rå data) ndash beregnet samlet sesongmessig effekt Beregningen for Mar-05 kvartalet er 17322 ndash (ndash574.938) 17896.938 17322 17696 17060 18046 17460 19034 18245 18866 18174 19464 18633 20616 17548.250 17732.750 18048.125 18298.750 18490.500 18633.500 18735.750 19003.000 17896.938 17097.875 17426.875 17773.125 18034.938 18435.875 18611.875 18593.125 18748.938 18865.875 18999.875 20343.125 Rådataene og de sesongjusterte dataene vises nedenfor. Merk at M, J, S og D angir kvartår som slutter i henholdsvis mars, juni, september og desember. Det er for tiden ingen innlegg i denne kategorien. En serie som viser en sesongbasert komponent, viser et mønster som gjentar hver så mange perioder. For eksempel, hvis vi vurderer gjennomsnittlig månedstemperatur i Iowa City, IA, forventer vi at serien skal ha et sesongmessig mønster. Temperaturen stiger og faller i et forutsigbart mønster i løpet av året. Siden mønsteret gjentas hver tolv måneder, er sesongperioden (eller sesongens lengde) 12. Det finnes mange forskjellige måter å lage en modell av en sesongmessig tidsserie på. Her beskriver jeg to forskjellige modeller, additivet og multiplikativmodellen. Tilsetningsmodell Her legger vi sesongkomponenten til trendkomponenten: Ta temperaturen som et eksempel, og antar at temperaturen ikke har en trend, så kan vi antar at gjennomsnittstemperaturen i Iowa City er 50 grader, så estimatet av konstant, er 50. Hvis sesongfaktoren i februar er -22, er februar 22 grader kaldere enn gjennomsnittet og den forventede temperaturen i februar er 50-22 28 grader. Hvis sesongfaktoren i juni er 12, er juni 12 grader varmere enn gjennomsnittet, og den forventede temperaturen i juni er 50 12 62 grader. Multiplikativ modell Modell uten trend: Modell med lineær trend: I en multiplikativ modell multipliserer sesongkomponenten avskjæringen dersom det ikke er noen trend, og multipliserer intercepttrend hvis det er en trend. For eksempel, tenk på temperatureksemplet. La oss anta at gjennomsnittstemperaturen i Iowa City er 50 grader, så intervallet er lik 50 og antar at det ikke er noen trend. Hvis sesongfaktoren i februar er 0,45, er den anslåtte verdien for februar 0,4550 fundamentalt, februar er 55 kaldere enn gjennomsnittet. Hvis sesongfaktoren i juni er 1,10, er juni 10 varmere enn gjennomsnittet, og den forventede temperaturen i juni er 501,10 55 grader. Det er mange forskjellige måter å estimere sesongfaktorer på. Minitab anslår sesongmessige faktorer i forhold til medianen (ikke gjennomsnittet) av serien. Jeg har et datasett med gjennomsnittlige månedlige temperaturer i Iowa, som begynner i januar 1930 og slutter i januar 2011. I løpet av denne perioden var median temperaturen i Iowa 49,8 grader. Jeg estimerte en multiplikativ sesongmodell for temperaturdataene (ingen trend) og fikk følgende estimerte sesongfaktorer:
Comments
Post a Comment