Wednesday 15 November 2017

3 Mesi Mobile Media Stata


Questa struttura di dati è piuttosto inadatta allo scopo. Assumendo un id identificativo è necessario rimodellare. per esempio. Poi una media mobile è facile. Utilizzare tssmooth o semplicemente generare. per esempio. Più sul perché la struttura dei dati è del tutto inadatto: Non solo il calcolo di una media mobile hanno bisogno di un ciclo (che non prevedono necessariamente Egen), ma sarebbe la creazione di diverse nuove variabili aggiuntive. Utilizzando quelli in qualsiasi analisi successiva sarebbe da qualche parte tra scomodo e impossibile. EDIT Ill dare un loop del campione, mentre non si muove dalla mia presa di posizione che è la tecnica povera. Non vedo una ragione dietro la convenzione di denominazione per cui P1947 è un mezzo per 1943-1945 presumo questo è solo un errore di battitura. Consente di supporre che abbiamo i dati per il 1913-2012. Per mezzo di 3 anni, si perde un anno presso ogni estremità. Questo potrebbe essere scritto in modo più conciso, a scapito di una raffica di macro all'interno di macro. Utilizzando pesi disuguali è facile, come sopra. L'unica ragione per usare egen è che si pretende molto rinunciare se ci sono mancanze, che quanto sopra farà. Come una questione di completezza, si noti che è facile da gestire missings senza ricorrere a Egen. e il denominatore Se tutti i valori sono mancanti, questo si riduce a 00, o mancante. Altrimenti, se un valore è mancante, si aggiunge 0 al numeratore e 0 al denominatore, che è la stessa di ignorarlo. Naturalmente il codice è tollerabile come sopra per le medie di 3 anni, ma sia per quel caso o per una media su più anni, si dovrebbe sostituire le linee sopra da un loop, che è ciò che egen does. Stata: Analisi dei dati e statistica Software Nicholas J il comando più evidente. Cox, Durham University, UK Christopher Baum, Boston college Egen, ma () e le sue limitazioni Statarsquos per calcolare medie mobili è la funzione ma () di Egen. Data un'espressione, crea una media - periodo movimento di tale espressione. Per impostazione predefinita, viene preso come 3. deve essere dispari. Tuttavia, come l'inserimento manuale indica, Egen, ma () non può essere combinata con by-variabili:. e, per questo motivo, non è applicabile ai dati panel. In ogni caso, si erge al di fuori del set di comandi appositamente scritte per le serie temporali vedi serie storiche per i dettagli. approcci alternativi per calcolare le medie per i dati panel in movimento, ci sono almeno due scelte. Entrambi dipendono l'insieme di dati essendo stato tsset in anticipo. Questo è molto vale la pena di fare: non solo è possibile risparmiare più volte specificando variabile variabile e l'ora del pannello, ma Stata si comporta in modo elegantemente dato eventuali lacune nei dati. 1. Scrivi la tua definizione utilizzando generare Uso degli operatori di serie temporali, come L. e F.. dare la definizione della media mobile come argomento di una dichiarazione di generare. Se si esegue questa operazione, si sta, naturalmente, non limitato alla altrettanto ponderate (non ponderata) centrato medie calcolate da Egen in movimento, ma (). Ad esempio, ugualmente ponderato tre periodo medie mobili sarebbe dato da e alcuni pesi possono essere facilmente specificati: È possibile, ovviamente, specificare un'espressione come log (myvar) al posto di un nome di variabile, come myvar. Un grande vantaggio di questo approccio è che Stata fa automaticamente la cosa giusta per i dati panel: ingresso e uscita valori vengono elaborati all'interno di pannelli, così come la logica impone che dovrebbero essere. Lo svantaggio più evidente è che la linea di comando può ottenere piuttosto lungo se la media mobile coinvolge diversi termini. Un altro esempio è una media mobile unilaterale basata solo su valori precedenti. Questo potrebbe essere utile per generare un'aspettativa di adattamento di quello che una variabile sarà basato esclusivamente su informazioni aggiornate: ciò che qualcuno potrebbe prevedere per l'esercizio in corso sulla base degli ultimi quattro valori, utilizzando uno schema fisso di ponderazione (un ritardo di 4 periodo potrebbe essere soprattutto comunemente usato con timeseries trimestrali.) 2. Usare Egen, filtro () da SSC utilizzare il filtro funzione di egen scritto dall'utente () dal pacchetto egenmore su SSC. In Stata 7 (aggiornato dopo il 14 novembre 2001), è possibile installare questo pacchetto dopo che aiutano punti egenmore ai dettagli del filtro (). I due esempi sopra sarebbe resa (In questo confronto la generano approccio è forse più trasparente, ma vedremo un esempio del contrario in un attimo.) I ritardi sono un numlist. conduce essendo GAL negativi: in questo caso -11 espande a -1 0 1 o portare 1, lag 0, in ritardo 1. I ficients COEF, un'altra numlist, moltiplicare i corrispondenti elementi in ritardo di sviluppo o di leader: in questo caso, tali elementi sono F1.myvar . MyVar e L1.myvar. L'effetto dell'opzione normalizzare è in scala ogni coefficiente per la somma dei coefficienti in modo che coef (1 1 1) normalizzare equivale a coefficienti di 13 13 13 e coef (1 2 1) normalizzare equivale a coefficienti di 14 12 14 . È necessario specificare non solo i ritardi, ma anche i coefficienti. Perché Egen, ma () prevede il caso altrettanto ponderata, la motivazione principale per Egen, filtro () è quello di sostenere il caso ineguale ponderata, per i quali è necessario specificare coefficienti. Si potrebbe anche dire che obbliga gli utenti di specificare coefficienti è un po 'di pressione in più su di loro per pensare a quello coefficienti che vogliono. La giustificazione principale per pesi uguali è, immaginiamo, la semplicità, ma pesi uguali avere pessime proprietà del dominio della frequenza, per citare solo una considerazione. Il terzo esempio di cui sopra potrebbe essere uno dei quali è quasi complicato come l'approccio di generare. Ci sono casi in cui Egen, filtro () fornisce una formulazione più semplice di generare. Se si desidera un filtro binomiale di nove termine, che i climatologi trovano utile, poi guarda forse meno orribile di, e più facile da ottenere rispetto, proprio come con il generare approccio, Egen, filtro () funziona correttamente con dati panel. Infatti, come già detto, esso dipende il set di dati essendo stato tsset anticipo. Un consiglio grafica Dopo aver calcolato i tuoi medie mobili, probabilmente voler guardare un grafico. Il comando tsgraph scritto dall'utente è intelligente su set di dati tsset. Installarlo in un up-to-date Stata 7 da SSC tsgraph Inst. Che dire sottoinsiemi con se nessuno degli esempi di cui sopra fanno uso di se restrizioni. Infatti Egen, ma () non permetterà, se da specificare. Di tanto in tanto la gente vuole usare se il calcolo medie mobili, ma il suo uso è un po 'più complicato di quanto non sia di solito. Che cosa ci si può aspettare da una media mobile calcolata con se. Cerchiamo di identificare due possibilità: l'interpretazione debole: non voglio vedere nessun risultato per le osservazioni esclusi. Forte interpretazione: io non neanche voglia di utilizzare i valori per le osservazioni esclusi. Ecco un esempio concreto. Supponiamo come conseguenza di una condizione if, osservazioni 1-42 sono inclusi ma non osservazioni 43 su. Ma la media mobile per 42 dipenderà, tra l'altro, sul valore per l'osservazione 43 se la media estende avanti e indietro ed è di lunghezza almeno 3, e sarà simile dipenderà alcune osservazioni 44 in poi in alcune circostanze. La nostra ipotesi è che la maggior parte delle persone sarebbe andare per l'interpretazione deboli, ma se questo è corretto, Egen, filtro () non supporta se uno dei due. È sempre possibile ignorare ciò che donrsquot vuole o anche impostare valori indesiderati a mancare in seguito utilizzando sostituire. Una nota sui risultati alle estremità della serie mancante Perché medie mobili sono funzioni di ritardi e conduce, egen, MA () produce mancante in cui non esistono i ritardi e conduce, all'inizio e alla fine della serie. Un'opzione nomiss costringe il calcolo delle più brevi, medie mobili non centrati per le code. Al contrario, né generare nè Egen, filtro () lo fa, o consente, nulla di speciale per evitare risultati mancanti. Se uno dei valori necessari per il calcolo è mancante, quindi questo risultato è mancante. Spetta agli utenti di decidere se e quanto la chirurgia correttiva è richiesto per queste osservazioni, presumibilmente dopo aver guardato il set di dati e considerando ogni scienza sottostante che può essere portato a bear. Announcement E 'il mio primo post e cercherò di essere il più chiaro possibile. Il collegamento per il database principale è alla fine del post. Contesto Sto usando StataSE 12,0 sotto Windows 10. Ho iniziato con Stata solo poche settimane fa, e sto cercando di imparare da solo per un incarico a causa di qualche giorno (perché ogni tabella o figura mi portarono giorni e giorni) : replicare i quotDoes carta obbligatoria frequenza scolastica Affect Schoolig e Earningsquot: web. stanford. edu pistaangrist. pdf che consiste nel mostrare che le persone nate in ultimi trimestri degli anni hanno più l'educazione, in media, di quelli nati nei primi trimestri a causa della scuola dell'obbligo legislazione. I primi dati disegnare un grafico del numero medio di anni di istruzione (EDUC variabile) per tutte le persone nate un certo anno (YOB variabile per anno di nascita) durante un determinato trimestre (QOB). Vi è una crescente tendenza generale e detrend i dati, che utilizzano una media mobile (figura IV), che è dove sono stato bloccato per gli ultimi 5 giorni. Problema Nel database, ci sono 27 variabili tra i quali V4 rinominati EDUC, V27 rinominato YOB (anno di nascita), e V18 rinominato QOB (quarto di nascita). Ciò che è necessario per la media mobile è, per ogni gruppo di persone nate nell'anno C e quarto j, calcolando il numero medio di anni di istruzione non per questo anno e trimestre, ma per il trimestre appena prima, 2 quarti prima, un quarto più tardi e 2 quarti successivamente (spiegato p. 985 della carta). Ad esempio, se guardo gli uomini nati tra il 1930 e il 1939 come in questa figura (figura IV di questo articolo:. Onedrive. liveredirresi ntphoto2cpng), ho bisogno di iniziare con la coorte nata nel 1930, 3 ° trimestre e calcolare il numero medio di anni di istruzione di coloro che sono nati nel 1930, 2 ° trimestre (nato un quarto prima della data di coorte), lo stesso per i nati nel 1930, 1 ° trimestre (nato il 2 quarti prima della data di coorte), lo stesso per i nati nel 1930, 4 ° trimestre (un quarto dopo la data di coorte), e lo stesso per i nati nel 1931, 1 ° trimestre (2 trimestri dopo la data di coorte). Poi la media mobile è ottenuta sommando questi 4 valori e dividendo per 4. L'intero processo deve essere ripetuto per ogni coorte tra il 1930, 3 ° trimestre e il 1939, 2 ° trimestre. Do-File per il fai-lima (onedrive. liveredirresid6919D329B3BF1EF23227ampauthkeyAO2cxEN AGpZMgsMampithintfile2cdo), ho iniziato con il modello delle altre figure e ha cercato di usare ciclo foreach e molte altre cose (non ricordo l'errore non messagesdid so che stavo per postare qui) ma ancora non capire come dire Stata: quotfor ogni YOBQn. calcolare media (EDUC) del YOBQ n-1, YOBQ n-2, YOBQ n1, YOBQ n2quot. Per fare la somma e dividere per 4 dopo che dovrebbe essere più facile. Mi è stato dato un eccezionale suggerimento f rom nella assistente di insegnamento: quot provare il comando tssmooth. Per prima cosa è necessario creare una variabile di tempo per il quale il comando di gruppo egen sarà molto useful. quot, ma secondo la mia ricerca sulla quotegenquot e quottssetquot nei manuali di dati e nel libro di Cameron amplificatore Trivedi, quotEconometrics utilizzando Stataquot (ultimo link): statamanuals14degen. tfolder2cdta statamanuals14u11.p statamanuals14gsw11.pdf. statamanuals14u13.p Languagesyntax. itsubscripting onedrive. liveredirresi. intfile2cpdf dovrei tsset i dati prima tssmooth ma non ho ottenuto oltre questa fase dal momento che a quanto pare, la notazione n non è consentito con quotegenquot (errore R (101) quotweights non allowedquot) e sono ancora molto confuso con il modo di coniugare Egen, tsset e tssmooth. Sarebbe bello se qualcuno mi potrebbe aiutare con il modo di risolvere i quotweights non allowedquot errore e come combinare i comandi quotegenquot, quottssetquot, e quottssmoothquot. Grazie mille Postscript: qui è il database per la via onedrive. liveredirresi. tfolder2cdta Nota: ho il fai-file per i più importanti altre figure e tabelle di questo articolo, ad eccezione tabella I, ma questo file non è probabilmente necessaryjust per info: onedrive. liveredirresi. hintfile2cdo Ultima modifica di Amarylis Durand 25 Mar 2016, 01:55. 25 Mar 2016, 22:50 Ecco una versione più corta della mia domanda: come evitare l'errore sotto (R451 in grassetto) e come dire Stata che la media mobile di quotmedstay1quot deve essere calcolato per ogni valore di TPS da YOB QOB per tutti quelli nati nello stesso anno e nello stesso trimestre, sorta aumentando anni e quarti e calcolare il numero medio di anni di istruzione per YOB QOB. Ordina: Egen medstay1 media (EDUC) generano una variabile nuova YOBNew perché il comando YQ richiede il primo argomento ad essere tra il 1000 e il 9999 ei nostri dati per YOB nel 1980 censimento è tra il 30 e il 49 invece del 1930 e il 1949 Gen YOBNewYOB sostituire YOBNew YOB1900 se CENSUS80 generare un tempo variabile che ha il formato richiesto in aiuto tsset gen tpsyq (YOBNew, QOB) formato TQ TPS le seguenti istruzioni ritorna R451. ripetuti i valori di tempo in pannello, probabilmente perché ci sono migliaia di persone nate nello stesso anno e nello stesso trimestre, ovviamente con lo stesso numero medio di anni di istruzione. Come evitare questo errore tsset medstay1 tps istruzioni per avere la MA media mobile ma voglio lo spostamento della media di medstay1 da calcolare per ogni valore della quottpsquot timevariable. Quale comando mi avrebbe permesso di fare questo o si fa automaticamente tssmooth Ma Ma medstay1. finestra (2 0 2) Spero che qualcuno possa help. I Sto cercando di creare una media mobile a 3 mesi sulla base di alcuni dati che ho durante l'utilizzo RedShift SQL o Domo BeastMode (se qualcuno ha familiarità con questo). I dati sono in un giorno per giorno, ma deve essere visualizzato per mese. Così il quotesrevenue occorre riassumerla per mese, e poi un 3MMA deve essere calcolato (escluso il mese corrente). Quindi, se la citazione è stata nel mese di aprile, avrei bisogno la media di Jan, Feb, marzo I dati di input simile a questa: e ho bisogno l'uscita di simile a questa: Se qualcuno è in grado di aiutare, sarei estremamente grato sono stato bloccato su questo per un po 'di tempo e non hanno idea di cosa sto facendo quando si tratta di SQL lol. Ciao Gordon, grazie per la risposta :) Sembra che la sua sulla buona strada per fare quello che voglio, come mai l'uscita doesn39t 3MMA guardare 100 corretto. Questo è ciò che it39s attualmente in uscita. 2012-10-01 00:00:00 17777 17777 2013-01-01 00:00:00 182367 82466 2013-09-01 00:00:00 3120 324974 2013-12-01 00:00:00 291730 231895,33333333334. La data anche doesn39t guardare come se si sta ordinando correttamente come vado più in basso i dati. Tutti i suggerimenti sarebbero grandi acclamazioni, Logan. ndash user2427023 20 marzo 16 a 22:42

No comments:

Post a Comment