Unidad 1: Stata 12

27
1 STATA 12 para Economistas Pontificia Universidad Católica del Perú UNIDAD 1: STATA Y SUS RECURSOS

description

primera parte introductoria al curso de stata12 para economistas

Transcript of Unidad 1: Stata 12

1 STATA 12 para Economistas Pontificia Universidad Catlica del Per UNIDAD 1: STATA Y SUS RECURSOS 2 Jorge Valdivia INFOPUC Contenido UNIDAD 1: STATA Y SUS RECURSOS ................................................................................ 1 Tema 1: STATA 2012 ........................................................................................................ 3 1.1Qu puedo hacer con STATA 12? ......................................................................... 3 1.1.1Imputacin mltiple (MI) .................................................................................... 3 1.1.2Series de tiempo multivariadas ......................................................................... 5 1.1.3Datos de panel y modelos mixtos ..................................................................... 5 1.1.4ARFIMA ............................................................................................................ 5 1.1.5Nueva interfaz .................................................................................................. 5 1.1.6Filtros para series de tiempo ............................................................................. 6 1.1.7Mtodo de los momentos generalizado (GMM)................................................. 6 1.1.8Documentacin PDF. ........................................................................................ 6 1.1.9Anlisis marginales ........................................................................................... 7 1.1.10Fuentes en grficos .......................................................................................... 7 1.1.11Regresin para riesgos en competencia ........................................................... 7 1.1.12Variables factoriales ......................................................................................... 7 1.1.13Estadsticas exactas ......................................................................................... 8 1.1.14Otras funciones................................................................................................. 8 1.2Presentaciones de STATA ....................................................................................... 8 1.3Entorno de trabajo ................................................................................................... 9 1.4Recursos del STATA ............................................................................................. 17 1.5Ayuda en STATA: comandos help, search y findit ................................................. 18 Tema 2: Manejo de datos ............................................................................................... 20 2.1Iniciando una sesin de STATA ............................................................................. 20 2.1.1Creando un Log file ........................................................................................ 20 2.1.2Abrir y guardar una base de datos .................................................................. 21 2.1.3Comandos principales .................................................................................... 21 2.1.4Estructura de comandos ................................................................................. 25 2.1.5Ingresando nuevos datos a STATA ................................................................ 26 3 STATA 12 para Economistas Pontificia Universidad Catlica del Per Tema 1: STATA 2012 1.1Qu puedo hacer con STATA 12? STATA es un software de anlisis estadstico y economtrico que sirve de herramienta para el anlisis de informacin en diversas disciplinas tales como las ciencias sociales, lamedicinayotras.STATAesunpaquetedetratamientodedatosdeapariencia similaraotrossoftwaresestadsticos,enelsentidodequeseejecutandemanera secuencialcomandosdigitadosporelusuariodentrodeunasesin.Inicialmentese creconlafinalidaddeanalizarlosdatosdeseccincruzada.Sinembargo,enlos ltimosaoshaalcanzadonotoriedadypotencialidad,yhaabarcadocamposdela microymacroeconometra.Atravsdelapermanentedifusin(comoenelforono oficial Statalist) de nuevos comandos que incorporan complejas tcnicas estadsticas y economtricas,hacautivadoamuchosusuariosporsuversatilidadyconstante actualizacin. Entre las potencialidades del STATA, destaca la facilidad para manipular y describir con grandes bases de datos, donde la principal restriccin es el tamao de la memoria de la computadora. Posee diversas aplicaciones predefinidas: regresiones por mco, datos de panel, logit, probit, etc. Asimismo, posee una excelente herramienta para realizar grficos. En la versin 13 destacan las siguientes funcionalidades: 1.1.1Imputacin mltiple (MI)Proporcionaunaseriedemtodosquepermitenrealizaranlisisdedatos incompletos,datosenlosque faltanalgunosvalores,ybrindan funcionalidades para las etapas de imputacin y estimacin. Entre dichas funcionalidades estn las siguientes: Imputacin univariadaImputacin multivariada 4 Jorge Valdivia INFOPUC PaneldecontrolparaMI.-Permiteunificarlasfuncionalidadesdel comando MI y gua al usuario desde que inicia el anlisis hasta el trmino deeste;esdecir,desdelaetapadeexaminacindelosvaloresfaltantes hastalarealizacindeestimacioneseinferenciassobreimputaciones mltiples. Examine.-Seutilizaparachequearlospatronesdevaloresincompletosy determinar el mtodo de imputacin adecuado. Setup.-Seutilizaparaestablecerlascaractersticasdelosvaloresquese deseanimputar.Silosdatosyahansidoimputados,sedebeobviaresta etapa. Impute.-Seutilizaparacrearimputaciones.Sepuedenimputarunaoms variablessimultneamentemediantelaseleccinocombinacindelos mtodos regresin, ajuste de medias predictivas, regresiones logstica, ordinal logstica y multinomial logstica y MVN. Import.- Se utiliza para poder importar. Manage.- Se utiliza para realizar el manejo de los datos. Estimate.- Se utiliza para ajustar el modelo y combinar los resultados. Test.- Se utiliza para realizar test de hiptesis. Predict.- Se utiliza para hacer predicciones de los modelos. 5 STATA 12 para Economistas Pontificia Universidad Catlica del Per 1.1.2Series de tiempo multivariadas Representaoestimaunampliorangodeprocesosdeseriesdetiempo multivariable.STATA12,adiferenciadeotrosprogramas,nonecesitaqueel usuario especifique si el modelo es estacional o no, pues es automtico. Entredichosmodelosestn los siguientes: Modelosdeespaciode estados Modelosdefactor dinmico ModelosGARCH multivariadosdondelos usuariospueden analizarlas interaccionesdevarias series a la vez 1.1.3Datos de panel y modelos mixtos Estructuras de error en covarianzas Test de races unitarias Errores estndar y BLUP 1.1.4ARFIMA Procesos de memoria de largo plazo Integracin fraccional Prediccin esttica y dinmica Estimacin de varianza robusta 1.1.5Nueva interfazManejo de memoria automtica 6 Jorge Valdivia INFOPUC Hasta 1 terabyte de memoria Nueva interfaz para el sistema operativo Macintosh Manejador de variables Vista activa de los datos Filtros de datos y de variables Vista con tabs Plegado de cdigo Marcadores Importacin/exportacin de bases de datos a Excel Exportacin a PDF 1.1.6Filtros para series de tiempo Tendencia y ciclo FiltroChristiano-Fitzgerald Filtro Baxter-King Filtro Hodrick-Prescott Filtro Butterworth 1.1.7Mtodo de los momentos generalizado (GMM) Modelos lineares y no lineares Estimadores en una etapa, en dos etapas e iterativos Datos de seccin cruzada, series de tiempo y datos de panel Variables instrumentales para datos de panel1.1.8DocumentacinPDF.-Dondelosmanualesestnintegradosconel sistema de ayuda de STATA. Distribuida con cada copia de STATA 7 STATA 12 para Economistas Pontificia Universidad Catlica del Per Contiene todos los manuales Integrada con los archivos de ayuda 1.1.9Anlisis marginales Estimacinde medias marginales Mrgenes predictivos Efectosmarginales promedio 1.1.10Fuentes en grficos Itlica y negrita Letras griegas Smbolos matemticos Subndices y superndices Fuentes mltiples 1.1.11Regresinparariesgosencompetencia.-Permitemanejar modelos de duracin o supervivencia cuando los individuos se enfrentana ms de un tipo de riesgo.Variables que varan en el tiempo Grficos de incidencia acumulativa Razn de subrriesgo 1.1.12Variables factoriales Interacciones Trminos polinomiales 8 Jorge Valdivia INFOPUC Creacin automtica de indicadores 1.1.13Estadsticas exactasRegresin logstica para variable dependiente binariaRegresin de Poisson para datos de conteoPruebas exactas y pruebas conjuntasPredicciones con intervalos de confianza exactos 1.1.14Otras funciones Diez generadores de nmeros aleatorios Ms funciones de distribucin y de densidad DIFBETA, valores de desplazamiento de verosimilitud y estadsticos LMAX para regresin de Cox Errores normales, GED y t de Student en ARCH Tests multivariados Derivadas numricas Arreglos asociativos Funciones para cdigos Soundex Programacin orientada a objetos 1.2Presentaciones de STATA

LasdiferentespresentacionesdeSTATAsecaracterizansegneltipodeusuarioy recursosdelcomputador.LasversionesStata/SE,IntercooledStataySmallStata varan segn el tamao de la base de datos de anlisis. As tenemos:Stata/MP - Stata: para computadoras multiprocesador y de ncleo dual.Stata/SE - Stata: para grandes bases de datos.Intercooled Stata: versin estndar de Stata.Small Stata: comnmente utilizada por estudiantes. Es indiferente la interfaz para todas las presentaciones de STATA. 9 STATA 12 para Economistas Pontificia Universidad Catlica del Per 1.3Entorno de trabajo El despliegue de STATA 12 presenta cuatro ventanas diferentes: Ventanas de STATA ReviewAquaparecenloscomandosquehansidoutilizadosdurantelasesin. Solo los resultados ms recientes son visibles en esta pantalla.CommandSirve para utilizar STATA de forma interactiva; es decir, se emplea para crear las lneas de comandos y llevar a cabo las aplicaciones disponibles en el software.VariablesNosinformasobrelasvariablesqueestndisponiblesennuestrabase de datos para realizar las diversas aplicaciones.ResultsEstanospermitevisualizarlosresultados(outputs)delosestadsticos que pedimos calcular o de los modelos que solicitamos estimar.PropertiesEsta ventana nos permite editar las propiedades de las variables y de la base de datos, as como ver las propiedades generales. 10 Jorge Valdivia INFOPUC Entorno/Ventanas de STATA Eltamaoylaposicindelasventanaspuedenconfigurarsesegnlaspreferencias del usuario. Estas configuraciones se pueden realizar siguiendo los siguientes pasos:1.SeseleccionaelmenEdit;enlaopcinPreferences,seeligeGeneral Preferences. 2.En la pestaa Windowing se configuran e ingresan los valores que se desean.ReviewResultados Comandos Variables Propiedades 11 STATA 12 para Economistas Pontificia Universidad Catlica del Per TambinpodemosmodificarelcolordefondoolasfuentesdelaventanaStata Results siguiendo los siguientes pasos:1.En el men Edit se selecciona la opcin Preferences. 2.Se elige la opcin General Preferences. 3.Se elige la pestaa Result Colors y se personaliza el color que se desea en la casilla de Color Scheme. 12 Jorge Valdivia INFOPUC Otras ventanas importantes son:StataEditorpermitenavegarymodificarlosdatoscomosifueseunahojade Excel. Stata Editor (Browser) permite visualizar los datos, mas no modificarlos. StataViewerpermiteaccederainformacinenlnea,ascomoalaayudadel programa. 13 STATA 12 para Economistas Pontificia Universidad Catlica del Per Stata Graphs presenta el ltimo grfico realizado. 14 Jorge Valdivia INFOPUC Stata Variables Manager esunaventanaquefuncionacomouneditordelas variablesyendondesepuedemodificarelnombre,laetiqueta,elformato,las notas, etc. Stata Do-file Editor es una ventana separada en Windows y funciona como un editor de textos que permite ejecutar una lista de comandos. 15 STATA 12 para Economistas Pontificia Universidad Catlica del Per Desde la versin 8 de STATA, todos los comandos (excepto los de programacin) han sidoimplementadosconcuadrosdedilogo,ysepuedeaccederaellosdesdeel men principal, el cual est organizado por tpicos: Men de comandos de STATA Seleccionamos una opcin desde los mensData, Graphics o Statistics y llenamos la caja o cuadro de dilogo correspondiente. Por ejemplo, para acceder al cuadro de dilogo siguiente, el cual se encuentra en los mens desplegables, seguimos estos pasos: 1.Seleccionar el men Statistics y elegir la opcin Linear models and related. 2.Seleccionar la opcin Linear regression. Anlisis estadstico a travs del men desplegable: 16 Jorge Valdivia INFOPUC Esta forma de trabajar con el programa de manera interactiva es lo queSTATA llama GUI(GraphicUserInterface),locualesunamejoraconrespectoalasversiones anteriores(versionesanterioresaSTATA8).STATApermitetrabajardemanera interactiva y por medio de comandos (al igual que RATS 6, Eviews, SPSS, etc.) debido a que cada ventana se encuentra asociada a un comando. La barra de herramientas Adems, STATA presenta una barra de herramientas que permite realizar operaciones usuales como abrir un archivo, grabarlo, imprimir o ver alguna ventana en particular. 17 STATA 12 para Economistas Pontificia Universidad Catlica del Per 1.4Recursos del STATASTATApermitelaactualizacinconstantedesuscomandosatravsdeprogramas escritosenunlenguajellamadoado-file.Lospropiosusuariosrealizandichos comandos y las nuevas tcnicas, y estos se presentan a travs de StataList, la lista de STATA, de suscripcin gratuita. Desdeelsiguienteenlacehttp://www.stata.com/statalist/,sediscutenlasltimas tcnicasyrutinasprogramadasenSTATA.Dichainformacinmantieneunabasede datosdesde1997contodoslostemsposteadosenStataList,loscualeshansido ubicados en el Boston College Statistical Software Components (SSC). Algunos otros recursos en la red:http://www.stata.com/http://www.stata.com/support/faqs/ Portal del STATALIST 18 Jorge Valdivia INFOPUC 1.5Ayuda en STATA: comandos help, search y findit Comando helpEste es uno de los comandos ms importantes de STATA, pues presenta la sintaxis de loscomandos,ascomoejemplosdecmoseusan.ParapedirleayudaaSTATA sobreuncomando,seescribeenlaventanadecomandoshelpseguidodelnombre delcomandoquequeramosconocer.Tambinsepuedeaccederdirectamenteala ayuda. A continuacin se muestran los siguientes ejemplos:help ifhelp summarizehelp regressionhelp tabulate LaayudaenSTATAsevisualizaenelviewer.Sinembargo,todaslascopiasdel productocuentanconladocumentacinPDF,alacualsepuedeaccederdela siguiente manera: En el men Help, hacer clic en el botn PDF Documentation. 19 STATA 12 para Economistas Pontificia Universidad Catlica del Per Dentrodelaayudadelcomando,seobservaqueaveceslasprimerasletrasdel nombredelcomandoestnsubrayadas;estoindicaqueenlugardeescribirel comandocompleto,comosummarize,sepuedeescribirsolamentesu(ocualquier forma intermedia). Programando y ejecutando comandos en STATA Para poder trabajar en el entorno de STATA, se va a utilizar la ventana de comandos. En cuanto a la sintaxis, se va a utilizar la siguiente forma de ejecutar los comandos: Notemosquetodoloquevaentrecorchetesesopcional,yqueenlasintaxisdelos comandos primero se ponen los comandos seguidos de una explicacin (normalmente lasvariablesquequeremosejecutaroalgunaexplicacinrelativaacmoejecutarel comando), luego el peso (weigths), los condicionales (if) preceden a los rangos (in) y les siguen las opciones despus de un coma: [varlist] Es la lista de variables. [if] Debe estar seguida de una expresin lgica para que solo los datos que cumplan con la condicin puedan incluirse en dicho anlisis. [in] permite indicar el rango de los datos que se desea analizar. [weight] Son los pesos o ponderaciones. [options]Sonlasopcionesdecadacomandoqueseestutilizando.Siemprese antepone una coma antes de las opciones. 20 Jorge Valdivia INFOPUC Tema 2: Manejo de datos 2.1Iniciando una sesin de STATA 2.1.1Creando un Log file STATApermiteguardarunregistrodeloscomandosylosresultadosquevan apareciendoenlaventanaderesultados.Paracrearunarchivodebitcorase usa el comando log using: log using bitcora. Por defecto, se guarda en el directorio en uso y en formato SMCL (que es el que usa STATA) para presentar los resultados. Para parar momentneamente el registro de la bitcora: log off Para reanudar el registro de la bitcora:log on Este comando ser registrado:sysuse auto tab rep78 Para detener la bitcora:log close Para reanudar una bitcora:log using bitcora, append Para sobrescribir una bitcora:log using bitacora, replace Para ver una bitcora:type bitacora.smcl Nota: Si se quiere guardar los resultados en un archivo de texto, se debe escribir la siguiente sintaxis: log using bitcora, text Esta se guardara automticamente en este formato y se podr abrir con el bloc de notas. 21 STATA 12 para Economistas Pontificia Universidad Catlica del Per 2.1.2Abrir y guardar una base de datos LaformacomoSTATAcargalosdatosalamemoriaessimilaraladeun procesador de textos o a la de una hoja de clculo. No se realizan los cambios hasta que el usuario los guarda explcitamente. Cuandoseempleaelcomandouse,losdatossecarganalamemoriadel ordenador.Paraguardarlosdatossedebeemplearelcomandosave.Es recomendablenosobrescribirlosdatosytrabajarenundirectoriodiferentede dondeseencuentranlosdatosoriginales.Losdatospuedencargarseal programa utilizando el comando use seguido por la ruta en donde se encuentra la base de datos.sysuse autosave "auto.dta 2.1.3Comandos principales COMANDODESCRIPCIN help Ayuda de programa STATA para comandos log Uso de archivos de bitcorause Abrir una base de datos en STATA (extensin .dta)edit Ingreso de datos por medio de la ventana de Stata Editorcodebook Muestra variables con estadsticos descriptivosdescribe Describe contenido de datos en memoria o sobre el discosave Guarda los datos en disco con extensin *.dtalist Lista de valores de variableif Selecciona observaciones cumpliendo cierta condicin para la ejecucin del comandodrop Borra variable o dato en memoriakeep Borra variables o datos no seleccionadoslabel variable Comando de etiqueta de variableslabel define Primer paso para etiquetar valores de una variablelabel values Segundo paso para etiquetar valores de una variable 22 Jorge Valdivia INFOPUC Ejemplo:Elejercicioconsisteenabrirunabasededatosdenombreauto,lacualse puede abrir con el comando sysuse para luego guardarla en una ruta especfica y volver a abrirla. En la ventana de comandos, se debe escribir lo siguiente: sysuse auto 1. En primer lugar, se indica la ruta del directorio de trabajo a travs del comando cd:1

cd C:\Users\jvaldiviar\Desktop\STATA 12 2.Unavezquesehadefinidolacarpetadetrabajo,seguardarlabasede datos a travs del comando save:save auto.dta 3.Finalmente,cuandosetengaelarchivoguardado,seinvocaralabasede datos utilizando el comando use:use auto.dta 1 Es necesario indicar en el disco una ruta a STATA donde se van a almacenar y ubicar los archivos con los que se trabaje. Esto es necesario para poder abrir, guardar o utilizar archivos, grficos, bases de datos, etc. 23 STATA 12 para Economistas Pontificia Universidad Catlica del Per Alabrirlabasededatossecargarlaventanadevariables.Parapedirayuda sobre el comando se deber invocar la ayuda de STATA:help use Uso del comando use a travs del help 24 Jorge Valdivia INFOPUC 4. Para conocer el contenido de la base, se emplearn los comandos describe y codebook: Elcomandodescribeseemplea paradescribirelcontenidode datosenlamemoriadel computador.Brindalasiguiente informacin:Comando describe Contenido de la data de: (ruta del archivo)Nmerodeobservaciones, variablesFechaytamaodela memoria empleadaNombredelavariable, tipo de almacenaje (string onumrica),ylaetiqueta de la variableElcomandocodebookse empleaparadescribirel contenidodelasvariablesde maneradetallada,brindando informacincomorango, mximo,mnimo,media, varianza,missings,etc.El contenidomostradodepende de cada variable. Comando codebook 5. Otras formas de abrir una base de datos: Al digitar en la lnea de comandos la siguiente sintaxis: use auto.dta in 1/10 seleindicaalSTATAlaaperturadelos10primerosregistrosdelabasededatos. Estetipoderdenesseaplicarcuando sedeseerealizarunaexploracinalabase de datos, sin necesidad de cargar la base completa. 25 STATA 12 para Economistas Pontificia Universidad Catlica del Per De la misma manera, es posible aplicar filtros que indiquen qu parte de la base dedatosseutilizar.Enlabaseauto,lavariablepricerepresentaeltotalde miembrosdelhogar.Porello,siestinteresadoenconocersololosprecios mayores a 3000, se aplicar el siguiente condicional: use auto if price>3000 Enmuchasocasiones,soloserndenuestrointersalgunasdelasvariables contenidas en la base de datos. Para ello se emplear la siguiente sintaxis: use make price mpg rep78 using auto Donde los comandos empleados son use y using; mientras que las variables de inters son make, price, mpg y rep78. Como en los casos anteriores, la base de datos se denomina auto. Cabe mencionar que no ha sido necesario incorporar el nombre del directorio, debido a que eso fue establecido lneas arriba a travs del comando cd. 2.1.4Estructura de comandos En funcin al anlisis de datos que se desee realizar, la estructura de la sintaxis cambiarconlafinalidaddeelaborarreportessegnlasnecesidadesdel investigador. Porejemplo,elcomandosummarizebrindareportesdelosprincipales estadsticosdelabasededatos.Dichocomandoseempleadelassiguientes maneras: summarize price if price>3500 26 Jorge Valdivia INFOPUC by foreign: summarize price if price>3500 summarize price,detail 2.1.5Ingresando nuevos datos a STATA ParacrearointroducirdatosenSTATAygenerarnuevasvariables,sedebe utilizar el comando edit. Se puede acceder a la ventana emergente del comando enelmenDaraDataEditorDataEditor(Edit),ohaciendoclicenel botn edit: Unavezabierto,aparecelaventadaStataEditor,laquepermiteingresar informacinlibremente.Siseescribennmeros,sevagenerarunavariable 27 STATA 12 para Economistas Pontificia Universidad Catlica del Per numrica que va a aparecer de color negro; si se escriben palabras, la data va a aparecer en colorrojo. A este tipo de datos se les llamanvariables string. Los espacios en blanco van a estar representados por un punto (missing data).