2013-08-1120131534Apendice_ImportarDATA (1)
-
Upload
rodrigo-garay -
Category
Documents
-
view
214 -
download
0
description
Transcript of 2013-08-1120131534Apendice_ImportarDATA (1)
-
Apendice: Importar .XML, .TXT, .XLS, .XLSX,
.CSV
Analisis Distributivo de Microdatos usando Stata
Gonzalo Duran*, Marco Kremerman
Facultad de Economa y NegociosUniversidad de Chile
Agosto de 2013
1. Resumen de la clase
Formas de importar datos desde planillas de calculo, texto plano y otros formatos.
Stata permite importar datos desde planillas Excel con moderada facilidad. En las versiones 12y 13 se presentan cambios que facilitan mucho mas el procedimiento (ver comando import excel).Los instructores recomiendan el traspaso de informacion a traves del uso de comandos ad-hoc yno mediante la tecnica copy-paste en el edit window (puede haber perdida de datos, de precision,de formato).
Comando insheet
Insheet es un comando muy utilizado para importar datos que provienen de archivos planos (.txt)o que provienen de planillas de calculo y se han almacenado en formato texto. Tambien, es uncomando que funciona muy bien para importar datos separados por comas (.csv - comma-separatedvalues).
clear all
cd "C:\curso-fen\data\"
set mem 100m
insheet using "Cuadro_1.txt", names
En Stata, la coma (,) en la lnea de programacion indica que posterior a ella, vienen las opcionesque se han activado y que estan disponibles en el comando utilizado. En este caso el comando esinsheet y la opcion que se esta utilizando es names, que significa que considere la primera fila dela base de datos como nombre de las variables (para saber esto, previamente debera haber abiertoel archivo .txt). En caso de no haber declarado directorio al comenzar:
insheet using "C:\curso-fen\data\Cuadro_1.txt", names
*Economista Fundacion SOLEconomista Fundacion SOL
1
-
Comando xmluse
Xmluse es un comando utilizado para importar archivos excel, ya sea en el formato antiguo (.xls)o en el nuevo (.xlsx). Tambien se recomienda que antes de usarlo, se revise el archivo a importar,esto es, se abra, se inspeccione, y finalmente se vuelva a guardar, pero como archivo xml. Paraesto, se debe ir a guardar como: archivo xml.
clear all
cd "C:\curso-fen\data\"
set mem 100m
xmluse "Cuadro_1.xml", doctype(excel) sheet(ExportCuadro) cells(A1:B220) firstrow clear
En este caso luego de la coma, las opciones que le hemos dado al comando xmluse son:
a. Se declara el tipo de archivo en el doctype.
b. Se declara el nombre de la pestana u hoja del excel desde donde extraere los datos (sheet).
c. Se declara el rango donde se ubican los datos (cells). Este rango es la matriz completa,incluida la fila con los nombres de columnas.
d. Se activa la opcion firstrow cuya con lo cual considera la primera fila como nombres de lasvariables y no como datos.
e. la opcion clear al final en este caso es redundante ya que al comienzo del do se escribio unclear all. En caso de no haberlo hecho, el clear al final del xmluse es un sustituto.
Comando import excel (solo Stata 12 y Stata 13)
Muy similar al comando previo. La sintaxis es:
clear all
import excel "Cuadro_1.xls", sheet("ExportCuadro") cellrange(A3:B222) firstrow clear
2
Resumen de la clase