Monday, 13 November 2017

Använd of glidande medelvärde in time serieanalys


Hur man använder ett rörligt medelvärde för att köpa aktier Det rörliga genomsnittet (MA) är ett enkelt tekniskt analysverktyg som släpper ut prisdata genom att skapa ett ständigt uppdaterat genomsnittspris. Medelvärdet tas över en viss tidsperiod, som 10 dagar, 20 minuter, 30 veckor eller vilken tid som näringsidkaren väljer. Det finns fördelar med att använda ett glidande medelvärde i din handel, samt alternativ på vilken typ av rörligt medelvärde som ska användas. Flytta genomsnittliga strategier är också populära och kan skräddarsys till vilken tidsram som passar både långsiktiga investerare och kortfristiga handlare. (se de fyra främsta tekniska indikatorerna Trend Traders behöver veta.) Varför använda ett rörligt medelvärde Ett rörligt medelvärde kan hjälpa till att minska mängden brus på ett prisdiagram. Titta på riktningen för glidande medelvärde för att få en grundläggande uppfattning om hur långt priset rör sig. Vinklad upp och priset går uppåt (eller var nyligen) totalt, vinklat ner och priset förflyttas totalt och rör sig sidled och priset är sannolikt inom ett område. Ett rörligt medel kan också fungera som stöd eller motstånd. I en uptrend kan ett 50-dagars, 100-dagars eller 200-dagars glidande medelvärde fungera som en stödnivå, som visas i figuren nedan. Detta beror på att medelvärdet verkar som ett golv (stöd), så priset studsar upp av det. I en downtrend kan ett rörligt medelvärde fungera som motstånd som ett tak, priset träffar det och börjar sedan släppa igen. Priset brukar alltid respektera det rörliga genomsnittet på detta sätt. Priset kan gå igenom det något eller stoppa och vända innan du når det. Som en allmän riktlinje, om priset ligger över ett glidande medelvärde är trenden uppe. Om priset ligger under ett glidande medel är trenden nere. Flyttande medelvärden kan dock ha olika längder men (diskuteras inom kort), så man kan indikera en uptrend medan en annan indikerar en downtrend. Typer av rörliga medelvärden Ett rörligt medelvärde kan beräknas på olika sätt. Ett fem dagars enkelt glidande medel (SMA) lägger helt enkelt upp de fem senaste dagliga slutkurserna och delar upp det med fem för att skapa ett nytt genomsnitt varje dag. Varje genomsnitt är kopplat till nästa, vilket skapar singulär strömmande linje. En annan populär typ av rörligt medelvärde är exponentiell glidande medelvärde (EMA). Beräkningen är mer komplex men gäller i princip mer viktning till de senaste priserna. Markera en 50-dagars SMA och en 50-dagars EMA på samma diagram och du kommer märka att EMA reagerar snabbare på prisförändringar än SMA gör på grund av den extra viktningen på de senaste prisuppgifterna. Kartläggning av programvara och handelsplattformar gör beräkningarna, så ingen manuell matte krävs för att använda en MA. En typ av MA är inte bättre än en annan. En EMA kan fungera bättre på en aktie - eller finansmarknad för en tid, och vid andra tillfällen kan en SMA fungera bättre. Den tidsram som valts för ett glidande medel kommer också att spela en viktig roll i hur effektiv det är (oavsett typ). Flytta genomsnittlig längd Vanliga glidande medellängder är 10, 20, 50, 100 och 200. Dessa längder kan appliceras på någon tidsram för diagrammet (en minut, dagligen, veckovis, etc.) beroende på handlarens handelshorisont. Den tidsram eller längd du väljer för ett glidande medelvärde, även kallat backbackperioden, kan spela en stor roll i hur effektiv det är. En MA med en kort tidsram kommer att reagera mycket snabbare på prisändringar än en MA med en lång återblick. I figuren nedan följer det 20-dagars glidande genomsnittet det faktiska priset mer än 100 dagarna. 20-dagarna kan vara av analytisk nytta för en kortfristig näringsidkare, eftersom det följer priset snabbare och producerar därför mindre fördröjning än det långsiktiga glidande genomsnittet. Lag är den tid det tar för ett glidande medelvärde för att signalera en potentiell reversering. Återkalla, som en allmän riktlinje, när priset är över ett glidande medelvärde anses trenden vara uppe. Så när priset sjunker under det rörliga genomsnittet signalerar det en potentiell återföring baserat på den MA. Ett 20-dagars glidande medelvärde kommer att ge många fler reverseringssignaler än ett 100-dagars glidande medelvärde. Ett glidande medelvärde kan vara vilken längd som helst, 15, 28, 89 osv. Justering av glidande medel så att det ger mer noggranna signaler på historiska data kan bidra till att skapa bättre framtida signaler. Trading Strategies - Crossovers Crossovers är en av de viktigaste rörliga genomsnittliga strategierna. Den första typen är en prisövergång. Detta diskuterades tidigare, och är när priset korsar över eller under ett glidande medelvärde för att signalera en potentiell förändring i trenden. En annan strategi är att tillämpa två glidande medelvärden till ett diagram, en längre och en kortare. När den kortare MA korsar över längre sikt MA är det en köpsignal som det indikerar att trenden växlar upp. Detta kallas ett gyllene kors. När den kortare MA korsar under längre sikt MA är det en säljsignal som den indikerar att trenden går ner. Detta är känt som en deaddeath Cross Flytta medelvärden beräknas baserat på historiska data, och ingenting om beräkningen är förutsägbar i naturen. Därför verkar resultaten med hjälp av glidande medelvärden vara slumpmässiga - ibland verkar marknaden respektera MA supportresistance och handelssignaler. och andra gånger visar det sig ingen respekt. Ett stort problem är att om prisåtgärden blir hakig kan priset svänga fram och tillbaka som genererar flera trendbackaltrade signaler. När detta sker är det bäst att gå åt sidan eller använda en annan indikator för att klargöra trenden. Samma sak kan inträffa med MA crossovers, där MAsna blir trassliga under en tidsperiod som utlöser flera (gillade att förlora) affärer. Rörliga medelvärden fungerar ganska bra i starka trender, men ofta dåligt i hakiga eller varierande förhållanden. Justering av tidsramen kan hjälpa till här tillfälligt, men i vissa fall kommer dessa problem troligen att uppstå oberoende av vilken tidsram som valts för MA (erna). Ett glidande medel förenklar prisdata genom att utjämna det och skapa en strömmande linje. Detta kan göra isolerande trender enklare. Exponentiella glidande medelvärden reagerar snabbare på prisändringar än ett enkelt glidande medelvärde. I vissa fall kan det vara bra, och i andra kan det orsaka falska signaler. Flyttande medelvärden med en kortare kollapsperiod (t. ex. 20 dagar) svarar också snabbare på prisändringar än ett genomsnitt med en längre tittperiod (200 dagar). Flytta genomsnittliga övergångar är en populär strategi för både poster och utgångar. MAs kan också markera områden med potentiellt stöd eller motstånd. Även om detta kan förefalla prediktivt, är glidande medelvärden alltid baserade på historiska data och visar helt enkelt genomsnittspriset under en viss tidsperiod. En typ av skatt som tas ut på kapitalvinster som uppkommit av individer och företag. Realisationsvinster är vinsten som en investerare. En beställning att köpa en säkerhet till eller under ett angivet pris. En köpgränsorder tillåter näringsidkare och investerare att specificera. En IRS-reglering (Internal Revenue Service) som tillåter utbetalningar av straff från ett IRA-konto. Regeln kräver det. Den första försäljningen av lager av ett privat företag till allmänheten. IPOs utfärdas ofta av mindre, yngre företag som söker. Skuldkvotskvoten är skuldkvoten som används för att mäta ett företags ekonomiska hävstångseffekt eller en skuldkvot som används för att mäta en individ. En typ av ersättningsstruktur som hedgefondsförvaltare brukar använda i vilken del av kompensationen som är prestationsbaserad. Att jämföra medelvärden Flytta medelvärden Med vanliga dataset är medelvärdet ofta det första och en av de mest användbara sammanfattande statistiken att beräkna. När data är i form av en tidsserie är seriemärket en användbar åtgärd, men återspeglar inte dataens dynamiska natur. Medelvärden beräknade över korta perioder, antingen före den aktuella perioden eller centrerad under den aktuella perioden, är ofta mer användbara. Eftersom sådana medelvärden varierar eller flyttas, då den aktuella perioden går från tid t 2, t 3. etc. är de kända som glidande medelvärden (Mas). Ett enkelt glidande medelvärde är (vanligtvis) det obegripade medlet av k tidigare värden. Ett exponentiellt vägt rörligt medelvärde är väsentligen detsamma som ett enkelt rörligt medelvärde, men med bidrag till medelvärdet viktat av deras närhet till den aktuella tiden. Eftersom det inte finns en, men en hel serie av rörliga medelvärden för en given serie, kan maset själva vara ritat på diagram, analyserade som en serie och används vid modellering och prognoser. En rad modeller kan konstrueras med hjälp av glidande medelvärden, och dessa är kända som MA-modeller. Om sådana modeller kombineras med autoregressiva (AR) modeller är de resulterande kompositmodellerna kända som ARMA - eller ARIMA-modeller (jag är för integrerad). Enkla glidande medelvärden Eftersom en tidsserie kan betraktas som en uppsättning värden, kan t 1,2,3,4, n genomsnittet av dessa värden beräknas. Om vi ​​antar att n är ganska stor, och vi väljer ett heltal k som är mycket mindre än n. vi kan beräkna en uppsättning blockmedelvärden eller enkla glidande medelvärden (i ordning k): Varje åtgärd representerar genomsnittet av datavärdena över ett intervall av k-observationer. Observera att den första möjliga MA i ordningen k gt0 är den för t k. Mer generellt kan vi släppa det extra prenumerationen i ovanstående uttryck och skriva: Detta säger att det uppskattade medelvärdet vid tiden t är det enkla genomsnittet av det observerade värdet vid tiden t och de föregående k -1-stegen. Om vikter appliceras som minskar bidraget från observationer som är längre bort i tid, sägs det glidande medlet vara exponentiellt jämna. Flytta medelvärden används ofta som en form av prognoser, varvid det uppskattade värdet för en serie vid tiden t 1, S t1. tas som MA för perioden fram till och med tiden t. t. ex. Dagens uppskattning baseras på ett genomsnitt av tidigare inspelade värden fram till och med gårdagarna (för dagliga data). Enkla glidande medelvärden kan ses som en form av utjämning. I det exempel som illustreras nedan har luftföroreningens dataset som visas i introduktionen till detta ämne ökat med en 7-dagars glidande medelvärde (MA) - linje, som visas här i rött. Såsom kan ses, släpper MA-linjen ut topparna och trågen i data och kan vara till stor hjälp när det gäller att identifiera trender. Standarden framåtberäkningsformeln innebär att de första k -1 datapunkterna inte har något MA-värde, men därefter sträcker sig beräkningarna till den slutliga datapunkten i serien. PM10 dagliga medelvärden, Greenwich källa: London Air Quality Network, londonair. org. uk En anledning till att beräkna enkla glidande medelvärden på det sätt som beskrivs är att det gör det möjligt att beräkna värden för alla tidsluckor från tid tk fram till idag, och När en ny mätning erhålls för tid t 1 kan MA för tid t 1 läggas till den redan beräknade uppsättningen. Detta ger ett enkelt förfarande för dynamiska dataset. Det finns emellertid vissa problem med detta tillvägagångssätt. Det är rimligt att hävda att medelvärdet under de senaste 3 perioderna ska vara placerat vid tiden t -1, inte tiden t. och för en MA över ett jämnt antal perioder kanske det borde ligga mitt i punkten mellan två tidsintervaller. En lösning på denna fråga är att använda centrerade MA-beräkningar, där MA vid tiden t är medelvärdet av en symmetrisk uppsättning värden runt t. Trots dess uppenbara meriter används inte detta tillvägagångssätt allmänt eftersom det krävs att data är tillgängliga för framtida händelser, vilket kanske inte är fallet. I fall där analysen helt och hållet består av en befintlig serie, kan användningen av centrerad Mas vara att föredra. Enkla glidande medelvärden kan betraktas som en form av utjämning, avlägsna några högfrekventa komponenter i en tidsserie och markera (men inte ta bort) trender på ett sätt som liknar den allmänna uppfattningen av digital filtrering. Faktum är att glidmedel är en form av linjärt filter. Det är möjligt att tillämpa en glidande medelberäkning till en serie som redan har slätts, dvs utjämning eller filtrering av en redan slätad serie. Till exempel med ett glidande medelvärde av ordning 2 kan vi betrakta det som beräknat med vikter, så MA vid x 2 0,5 x 1 0,5 x 2. På samma sätt kan MA vid x 3 0,5 x 2 0,5 x 3. Om vi Applicera en andra nivå av utjämning eller filtrering, vi har 0,5 x 2 0,5 x 3 0,5 (0,5 x 2 0,5 x 3) 0,25 x 1 0,5 x 2 0,25 x 3 dvs 2-stegs filtrering process (eller convolution) har producerat ett variabelt viktat symmetriskt rörligt medelvärde, med vikter. Flera omvälvningar kan producera ganska komplexa viktade glidmedel, av vilka vissa har visat sig vara särskilt användningsområden inom specialiserade områden, t. ex. i livförsäkringsberäkningar. Flyttande medelvärden kan användas för att avlägsna periodiska effekter om de beräknas med periodens längd som känd. Exempelvis kan säsongsvariationer ofta avlägsnas (om detta är målet) med hjälp av ett symmetriskt 12 månaders glidande medelvärde med alla månader viktade lika mycket, med undantag för det första och det sista som vägs med 12. Detta beror på att det kommer att var 13 månader i den symmetriska modellen (aktuell tid, t. - 6 månader). Totalen är dividerad med 12. Liknande procedurer kan antas för vilken väldefinierad periodicitet som helst. Exponentiellt vägda glidmedel (EWMA) Med den enkla glidande medelformeln: alla observationer är lika viktiga. Om vi ​​kallade dessa lika vikter, alfa t. var och en av k-vikterna skulle motsvara 1 k. så summan av vikterna skulle vara 1 och formeln skulle vara: Vi har redan sett att flera tillämpningar av denna process resulterar i vikten varierande. Med exponentiellt vägda glidmedel är bidraget till medelvärdet från observationer som är mer borttagna i tiden minskat, vilket därmed understryker senare (lokala) händelser. I grunden introduceras en utjämningsparameter, 0lt al1, och formeln revideras till: En symmetrisk version av denna formel skulle vara av formen: Om vikterna i den symmetriska modellen väljas som villkoren för villkoren för binomial expansion, (1212) 2q. de kommer att summeras till 1, och när q blir stor kommer den att approximera normalfördelningen. Detta är en form av kärnviktning, med binomial som fungerar som kärnfunktionen. Den tvåstegsvalsning som beskrivs i föregående stycke är just detta arrangemang, med q 1, vilket ger vikterna. Vid exponentiell utjämning är det nödvändigt att använda en uppsättning vikter som summerar till 1 och som reducerar geometriskt i storlek. De använda vikterna är typiskt av formen: För att visa att dessa vikter uppgår till 1, överväga utvidgningen av 1 som en serie. Vi kan skriva och expandera uttrycket i parentes med binomialformeln (1- x) p. där x (1-) och p -1, vilket ger: Detta ger då en form av viktat glidande medelvärde av formuläret: Denna summering kan skrivas som en återkommande relation: vilket förenklar beräkningen kraftigt och undviker problemet att viktningsregimen bör strängt vara oändlig för vikterna sammanlagt till 1 (för små värden av alfa. detta är vanligtvis inte fallet). Notationen som används av olika författare varierar. Vissa använder bokstaven S för att indikera att formeln i huvudsak är en jämn variabel och skriv: medan kontrollteori litteraturen ofta använder Z snarare än S för exponentiellt viktade eller jämnda värden (se exempelvis Lucas och Saccucci, 1990, LUC1 , och NIST-webbplatsen för mer detaljer och fungerade exempel). De ovan angivna formlerna härstammar från Roberts arbete (1959, ROB1), men Hunter (1986, HUN1) använder ett uttryck av formen: vilket kan vara mer lämpligt för användning vid vissa kontrollförfaranden. Med alfa 1 är medelvärdet bara det uppmätta värdet (eller värdet av föregående dataobjekt). Med 0,5 är uppskattningen det enkla glidande medlet för nuvarande och tidigare mätningar. Vid prognosmodeller är värdet S t. används ofta som uppskattning eller prognosvärde för nästa tidsperiod, dvs som uppskattning för x vid tidpunkt t 1. Således har vi: Detta visar att prognosvärdet vid tid t 1 är en kombination av det tidigare exponentiellt vägda glidande medlet plus en komponent som representerar det vägda prediktionsfelet, epsilon. vid tiden t. Antag att en tidsserie ges och en prognos krävs, ett värde för alfa krävs. Detta kan beräknas från befintliga data genom att utvärdera summan av kvadrerade prediktionsfel erhållna med varierande värden av alfa för varje t 2,3. inställning av den första uppskattningen som det första observerade datavärdet, x 1. I kontrollapplikationer är värdet av alfa viktigt eftersom det används vid bestämning av de övre och nedre kontrollgränserna och påverkar den genomsnittliga körlängden (ARL) som förväntas innan dessa kontrollgränser bryts (under antagandet att tidsserierna representerar en uppsättning slumpmässiga, identiskt distribuerade oberoende variabler med gemensam varians). Under dessa omständigheter är variansen av kontrollstatistiken: (Lucas och Saccucci, 1990): Kontrollgränser fastställs vanligtvis som fasta multiplar av denna asymptotiska varians, t. ex. - 3 gånger standardavvikelsen. Om exempelvis alfa 0,25 och de data som övervakas antas ha en Normalfördelning, N (0,1), när den är i kontroll, kommer kontrollgränserna att vara - 1,134 och processen kommer att nå en eller annan gräns i 500 steg i genomsnitt. Lucas och Saccucci (1990 LUC1) härleda ARL för ett brett spektrum av alfa värden och under olika antaganden med användning av Markov Chain-förfaranden. De tabulerar resultaten, inklusive att tillhandahålla ARL, när medelvärdet av kontrollprocessen har skiftats med en del multipel av standardavvikelsen. Till exempel, med ett 0,5 skift med alfa 0,25 är ARL mindre än 50 tidssteg. Tillvägagångssätten som beskrivs ovan är kända som enda exponentiell utjämning. eftersom förfarandena appliceras en gång till tidsserierna och sedan utförs analyser eller kontrollprocesser på den resulterande utjämnade datasatsen. Om datasetet innehåller en trend och eller säsongsbetonade komponenter kan två - eller trestegs exponentiell utjämning användas för att avlägsna (explicit modellering) dessa effekter (se vidare avsnittet Prognoser nedan och NIST-exemplet). CHA1 Chatfield C (1975) Analysen av Times Series: Theory and Practice. Chapman och Hall, London HUN1 Hunter J S (1986) Det exponentiellt vägda glidande medlet. J av Quality Technology, 18, 203-210 LUC1 Lucas J M, Saccucci M S (1990) Exponentiellt viktade rörliga medelkontrollsystem: Egenskaper och förbättringar. Technometrics, 32 (1), 1-12 ROB1 Roberts S W (1959) Kontrolldiagramtester baserat på geometriska rörliga medelvärden. Technometrics, 1, 239-250Time Series Analysis och dess applikationer: med R exempel R tidsserie snabb fix Sidan använder JavaScript för syntaxmarkering. Det är inte nödvändigt att slå på det, men koden blir svårare att läsa. Detta är bara en kort promenad ner tiden seRies lane. Mitt råd är att öppna R och spela tillsammans med handledningen. Förhoppningsvis har du installerat R och hittat ikonen på skrivbordet som ser ut som en R. ja, det är en R. Om du använder Linux, sluta titta eftersom det inte finns där. öppna bara en terminal och skriv in R (eller installera R Studio.) Om du vill ha mer på tidsseriegrafik, speciellt med ggplot2. se snabbkorrigering för grafik. Snabbfixen är avsedd att exponera dig för grundläggande R-serier och är rankad kul för personer i åldrarna 8 till 80. Det här är INTE tänkt att vara en lektion i tidsserieanalysen, men om du vill ha en, kan du försöka så enkelt kort kurs: Loz Baby steg. Din första R-session. Kom bekväm och starta henne och försök med ett enkelt tillägg: Ok, nu är du en expert med R. skulle få astsa nu: Nu när du laddat, kan vi börja. Låt gå Först, spela bra med Johnson Amp Johnson dataset. Det ingår i astsa som jj. den dynOmite karaktären från Good Times. Först titta på det. och du ser att jj är en samling av 84 nummer som heter ett tidsserieobjekt. För att seeremove dina objekt: Om du är en Matlab (eller liknande) användare kanske du tror att jj är en 84 gånger 1 vektor, men det är det inte. Den har ordning och längd, men inga dimensioner (inga rader, inga kolumner). R ringer dessa typer av objekt vektorer så du måste vara försiktig. I R har matriser dimensioner men vektorer gör det inte - de är bara dängda i cyberspace. Nu kan vi göra ett månatligt tidsserieobjekt som börjar i juni år 2293. Vi går in i Vortex. Observera att Johnson och Johnson-data är kvartalsvisa vinst, så det har frekvens4. Tidsserien zardoz är månadsdata, så har den frekvens12. Du får också några användbara saker med ts-objektet, till exempel: Försök nu en plot av Johnson Johnson-data: Grafen som visas är lite snyggare än koden ger. Mer information finns på sidan Snabbfixering för grafik. Detta gäller för resten av tomterna som du kommer att se här. Prova dessa och se vad som händer: och medan du är här, kolla in plot. ts och ts. plot. Observera att om din data är ett tidsserieobjekt, kommer plot () att göra tricket (för en enkel tidpunkt, dvs). Annars kommer plot. ts () att tvinga grafiken till en tidsplan. Vad sägs om filtrering av Johnson Amp Johnson-serien med ett dubbelsidigt glidande medelvärde. Låt prova detta: fjj (t) 8539 jj (t-2) frac14 jj (t-1) frac14 jj (t) frac14 jj (t1) 8539 jj t2) och lägg till en lowess (lowess - du vet rutinen) passar för skojs skull. Låt oss skilja de loggade data och kalla det dljj. Därefter spela bra med dljj. Nu ett histogram och en Q-Q-plot, en ovanpå (men på ett bra sätt): Låt oss kolla in korrelationsstrukturen för dljj med hjälp av olika tekniker. Kolla först på ett räckvidd av scatterplots av dljj (t) jämfört med fördröjda värden. Linjerna är låga och passformen är blå i lådan. Nu kan vi ta en titt på ACF och PACF of dljj. Observera att LAG-axeln är frekvensen. så 1,2,3,4,5 motsvarar lags 4,8,12,16,20 eftersom frekvens4 här. Om du inte gillar denna typ av märkning, kan du ersätta dljj i något av ovanstående med ts (dljj, freq1) t. ex. acf (ts (dljj, freq1), 20) Vidare kan vi försöka strukturell sönderdelning av log-jj-trendsäsongfel med hjälp av lowess. Om du vill inspektera resterna, till exempel, är de i dogtime. series, 3. den tredje kolumnen i den resulterande serien (säsongs - och trendkomponenterna finns i kolumnerna 1 och 2). Kolla in ACF av resterna, ACF (dogtime. series, 3) Resterna arent vita - inte ens nära. Du kan göra lite (mycket lite) bättre med hjälp av ett lokalt säsongsfönster, i motsats till den globala som används genom att specificera per. Skriv stl för detaljer. Det finns också något som heter StructTS som passar parametriska strukturella modeller. Vi använder inte dessa funktioner i texten när vi presenterar strukturell modellering i kapitel 6 eftersom vi föredrar att använda våra egna program. loz Det här är en bra tid att förklara. I ovanstående är hunden ett föremål som innehåller en massa saker (teknisk term). Om du skriver hund. Du kommer att se komponenterna, och om du skriver sammanfattning (hund) får du en liten sammanfattning av resultaten. En av hundens komponenter är time. series. som innehåller den resulterande serien (säsong, trend, återstod). För att se den här delen av objekthunden. du skriver dogtime. series (och du kommer se 3 serier, den sista innehåller rester). Och det är historien om. Du kommer att se fler exempel när vi går vidare. Och nu gör du ett problem från kapitel 2. Skulle passa regressionstiden (jj) betatime alfa 1 Q1 alfa 2 Q2 alfa 3 Q3 alfa 4 Q4 epsilon där Qi är en indikator för kvartalet i 1,2,3,4 . Undersök sedan noggrannt rester. Du kan se modellmatrisen (med dummyvariablerna) så här: Kontrollera nu vad som hände. Titta på en plot av observationerna och deras monterade värden: vilket visar att en plot av data med passformen överlagd inte är värt den cyberspace det tar upp. Men en plot av rester och ACF av rester är värt sin vikt i joules: Visa dessa rester vit. Ignorera 0-lag korrelationen, det är alltid 1. Tips: Svaret är NEJ. så regression ovan är nugatory. Så vad är lösningen Tyvärr, du måste ta klassen eftersom detta inte är en lektion i tidsserier. Jag varnade dig på toppen. Du måste vara försiktig när du återkryssar en tidsserie på fördröjda komponenter i en annan med hjälp av lm (). Det finns ett paket som heter dynlm som gör det enkelt att passa fördröjda regressioner, och jag diskuterar det direkt efter det här exemplet. Om du använder lm (). då är det som du behöver göra att knyta serien tillsammans med ts. intersect. Om du inte knyter samman serierna, kommer de inte att anpassas ordentligt. Heres ett exempel som regresserar veckovis kardiovaskulär dödlighet (cmort) på partikelförorening (del) till nuvärdet och fördröjt fyra veckor (ungefär en månad). Mer information om datauppsättningen finns i kapitel 2. Se till att astsa är laddad. Obs! Det var inte nödvändigt att byta namn på lag (del, -4) till del4. det är bara ett exempel på vad du kan göra. Ett alternativ till ovanstående är paketet dynlm som måste installeras, naturligtvis (som vi gjorde för astsa där uppe i början). När paketet är installerat kan du göra det föregående exemplet enligt följande: Tja, det är dags att simulera. Arbetshästen för ARIMA-simuleringar är arima. sim (). Här är några exempel, ingen produktion visas här så du själv. Använda astsa är det enkelt att passa en ARIMA-modell: Du kanske undrar skillnaden mellan AIC och AIC ovan. För att du måste läsa texten eller bara oroa dig inte för det eftersom det inte är värt att förstöra din dag att tänka på det. Och ja, de rester ser vit ut. Om du vill göra ARIMA prognoser, sarima. for ingår i astsa. Och nu för viss regression med autokorrelerade fel. Skulle passa modellen M t alpha betat gammaP t e t där M t och P t är mortality (cmort) och partiklar (del) serien och e t är autokorrelerat fel. Först, använd en OLS och kontrollera resterna: Montera nu modellen. Den resterande analysen (inte visad) ser perfekt ut. Heres en ARMAX modell, M t beta 0 phi 1 M t-1 phi 2 M t-2 beta 1 t beta 2 T t 1 beta 3 P t beta 4 P t-4 e t. där e t är möjligen autokorrelerad. Först försöker vi och ARMAX (p2, q0), titta på resterna och inse att det inte finns någon korrelation kvar, så var det gjort. Slutligen, en spektralanalys quicky: Det är allt för nu. Om du vill ha mer på tidsseriegrafik, se sidan Graphics Quick Fix.2.1 Flytta genomsnittsmodeller (MA-modeller) Tidsseriemodeller som kallas ARIMA-modeller kan innefatta autoregressiva termer och eller rörliga genomsnittsvillkor. I vecka 1 lärde vi oss en autoregressiv term i en tidsseriemodell för variabeln x t är ett fördröjt värde av x t. Till exempel är en lag 1-autoregressiv term x t-1 (multiplicerad med en koefficient). Denna lektion definierar glidande medelvärden. En glidande medelfrist i en tidsseriemodell är ett tidigare fel (multiplicerat med en koefficient). Låt (wt overset N (0, sigma2w)), vilket betyder att wt är identiskt oberoende fördelat, var och en med en normal fördelning med medelvärde 0 och samma varians. Den första ordningens rörliga genomsnittsmodell, betecknad med MA (1) är (xt mu wt theta1w) Den andra ordens rörliga genomsnittsmodellen, betecknad med MA (2) är (xt mu wt theta1w theta2w) , betecknad med MA (q) är (xt mu wt theta1w theta2w punkter thetaqw) Not. Många läroböcker och programvara definierar modellen med negativa tecken före villkoren. Detta ändrar inte de allmänna teoretiska egenskaperna hos modellen, även om den vrider de algebraiska tecknen på uppskattade koefficientvärden och (unsquared) termer i formler för ACF och variationer. Du måste kontrollera din programvara för att kontrollera om negativa eller positiva tecken har använts för att korrekt beräkna den beräknade modellen. R använder positiva tecken i sin underliggande modell, som vi gör här. Teoretiska egenskaper hos en tidsserie med en MA (1) modell Observera att det enda nonzero-värdet i teoretisk ACF är för lag 1. Alla andra autokorrelationer är 0. Således är ett prov ACF med en signifikant autokorrelation endast vid lag 1 en indikator på en möjlig MA (1) modell. För intresserade studenter är bevis på dessa egenskaper en bilaga till denna handout. Exempel 1 Antag att en MA (1) modell är x t10 w t .7 w t-1. var (överskridande N (0,1)). Således är koefficienten 1 0,7. Den teoretiska ACF ges av En plot av denna ACF följer. Den visade ploten är den teoretiska ACF för en MA (1) med 1 0,7. I praktiken ger ett prov vanligen vanligtvis ett så tydligt mönster. Med hjälp av R simulerade vi n 100 provvärden med hjälp av modellen x t 10 w t .7 w t-1 där vikt N (0,1). För denna simulering följer en tidsserieplot av provdata. Vi kan inte berätta mycket från denna plot. Provet ACF för den simulerade data följer. Vi ser en spik vid lag 1 följt av allmänt icke-signifikanta värden för lags över 1. Observera att provet ACF inte matchar det teoretiska mönstret för den underliggande MA (1), vilket är att alla autokorrelationer för lags över 1 kommer att vara 0 . Ett annat prov skulle ha ett något annorlunda prov ACF som visas nedan, men skulle troligen ha samma breda funktioner. Terapeutiska egenskaper för en tidsreaktion med en MA (2) modell För MA (2) modellen är teoretiska egenskaper följande: Observera att de enda nonzero-värdena i teoretisk ACF är för lags 1 och 2. Autokorrelationer för högre lags är 0 . En ACF med signifikanta autokorrelationer vid lags 1 och 2, men icke-signifikanta autokorrelationer för högre lags indikerar en möjlig MA (2) modell. iid N (0,1). Koefficienterna är 1 0,5 och 2 0,3. Eftersom det här är en MA (2), kommer den teoretiska ACF endast att ha nonzero-värden endast på lags 1 och 2. Värdena för de två icke-oberoende autokorrelationerna är A-plot av den teoretiska ACF följer. Såsom nästan alltid är fallet kommer provdata inte att verka så perfekt som teori. Vi simulerade n 150 provvärden för modellen x t 10 w t .5 w t-1 .3 w t-2. var vet N (0,1). Tidsserierna av data följer. Som med tidsserien för MA (1) provdata kan du inte berätta mycket för det. Provet ACF för den simulerade data följer. Mönstret är typiskt för situationer där en MA (2) modell kan vara användbar. Det finns två statistiskt signifikanta spikar vid lags 1 och 2 följt av icke-signifikanta värden för andra lags. Observera att provet ACF på grund av provtagningsfel inte exakt matchade det teoretiska mönstret. ACF för General MA (q) Modeller En egenskap hos MA (q) modeller är generellt att det finns icke-oberoende autokorrelationer för de första q-lagsna och autokorrelationerna 0 för alla lags gt q. Icke-unikhet av koppling mellan värden på 1 och (rho1) i MA (1) Modell. I MA (1) - modellen, för något värde av 1. den ömsesidiga 1 1 ger samma värde. Använd exempelvis 0,5 för 1. och använd sedan 1 (0,5) 2 för 1. Du får (rho1) 0,4 i båda fallen. För att tillfredsställa en teoretisk restriktion kallad invertibility. vi begränsar MA (1) - modellerna till att ha värden med absolutvärdet mindre än 1. I exemplet just givet är 1 0,5 ett tillåtet parametervärde, medan 1 10,5 2 inte kommer att. Omvändbarhet av MA-modeller En MA-modell sägs vara omvändbar om den är algebraiskt ekvivalent med en konvergerande oändlig ordning AR-modell. Genom att konvergera menar vi att AR-koefficienterna minskar till 0 när vi flyttar tillbaka i tiden. Omvändbarhet är en begränsning programmerad i tidsserieprogramvara som används för att uppskatta koefficienterna för modeller med MA-termer. Det är inte något vi söker efter i dataanalysen. Ytterligare information om invertibilitetsbegränsningen för MA (1) - modeller ges i bilagan. Avancerad teorinotation. För en MA (q) modell med en specificerad ACF finns det bara en inverterbar modell. Det nödvändiga villkoret för invertibilitet är att koefficienterna har värden så att ekvationen 1- 1 y-. - q y q 0 har lösningar för y som faller utanför enhetens cirkel. R-kod för exemplen I exempel 1 ritade vi den teoretiska ACF av modellen x t10 wt. 7w t-1. och sedan simulerade n 150 värden från denna modell och plottade provets tidsserie och provet ACF för de simulerade data. R-kommandon som användes för att plotta den teoretiska ACF var: acfma1ARMAacf (mac (0.7), lag. max10) 10 lags av ACF för MA (1) med theta1 0,7 lags0: 10 skapar en variabel som heter lags som sträcker sig från 0 till 10. plot (lags, acfma1, xlimc (1,10), ylabr, typh, huvud ACF för MA (1) med theta1 0,7) abline (h0) adderar en horisontell axel till plottet Det första kommandot bestämmer ACF och lagrar det i ett objekt namnet acfma1 (vårt val av namn). Plot-kommandot (det tredje kommandot) plottar jämfört med ACF-värdena för lags 1 till 10. ylab-parametern markerar y-axeln och huvudparametern lägger en titel på plotten. För att se de numeriska värdena för ACF använder du bara kommandot acfma1. Simuleringen och diagrammen gjordes med följande kommandon. xcarima. sim (n150, lista (mac (0.7))) Simulerar n 150 värden från MA (1) xxc10 lägger till 10 för att göra medelvärdet 10. Simulering standardvärden betyder 0. plot (x, typeb, mainSimulated MA (1) data) acf (x, xlimc (1,10), mainACF för simulerad provdata) I exempel 2 ritade vi den teoretiska ACF av modellen xt 10 wt5 w t-1, 3 w t-2. och sedan simulerade n 150 värden från denna modell och plottade provets tidsserie och provet ACF för de simulerade data. De R-kommandon som användes var acfma2ARMAacf (mac (0,5,0,3), lag. max10) acfma2 lags0: 10 plot (lags, acfma2, xlimc (1,10), ylabr, typh, huvud ACF för MA (2) med theta1 0,5, theta20.3) abline (h0) xcarima. sim (n150, lista (mac (0,5, 0,3)) xxc10 plot (x, typeb, huvudsimulerad MA (2) serie) acf (x, xlimc (1,10) mainACF för simulerade MA (2) data) Bilaga: Bevis på egenskaper hos MA (1) För intresserade studenter, här är bevis för teoretiska egenskaper hos MA (1) modellen. Varians: (text (xt) text (mu wt theta1 w) 0 text (wt) text (theta1w) sigma2w theta21sigma2w (1theta21) sigma2w) När h 1, föregående uttryck 1 w 2. För varje h 2, föregående uttryck 0 . Orsaken är att, per definition av vägtons oberoende. E (w k w j) 0 för någon k j. Vidare, eftersom w t har medelvärdet 0, E (w jw j) E (wj 2) w 2. För en tidsserie, Applicera detta resultat för att få ACF ges ovan. En inverterbar MA-modell är en som kan skrivas som en oändlig ordning AR-modell som konvergerar så att AR-koefficienterna konvergerar till 0 när vi rör sig oändligt tillbaka i tiden. Visa väl omvändbarhet för MA (1) modellen. Vi ersätter sedan förhållandet (2) för w t-1 i ekvation (1) (3) (zt wt theta1 (z-tetww) wt theta1z-tetanw) Vid tid t-2. ekvationen (2) blir Vi ersätter sedan förhållandet (4) för w t-2 i ekvation (3) (zt wt theta1z-teteta21wt theta1z-teteta21 (z-tetww) wt theta1z-teteta12z theta31w) Om vi ​​skulle fortsätta oändligt) skulle vi få oändlig ordning AR-modellen (zt wt theta1z-theta21z theta31z-tetta41z punkter) Observera dock att om koefficienterna som multiplicerar lagren av z ökar (oändligt) i storlek när vi flyttar tillbaka i tid. För att förhindra detta behöver vi 1 lt1. Detta är förutsättningen för en inverterbar MA (1) modell. Oändlig ordning MA-modell I vecka 3 ser du att en AR (1) - modell kan konverteras till en oändlig ordning MA-modell: (xt - mu wt phi1w phi21w prickar phik1 w dots sum phij1w) Denna summering av tidigare vita ljudvillkor är känd som orsakssammanställning av en AR (1). Med andra ord är x t en special typ av MA med ett oändligt antal termer som går tillbaka i tiden. Detta kallas en oändlig ordning MA eller MA (). En ändlig ordning MA är en oändlig ordning AR och någon ändlös ordning AR är en oändlig ordning MA. Minns i vecka 1 noterade vi att ett krav på en stationär AR (1) är att 1 lt1. Låt beräkna Var (x t) med hjälp av kausalrepresentationen. Det här sista steget använder ett grundläggande faktum om geometriska serier som kräver (phi1lt1) annars skiljer serien. Navigering

No comments:

Post a Comment