2013-08-1120131534Apendice_ImportarDATA (1)

2
Ap´ endice: Importar .XML, .TXT, .XLS, .XLSX, .CSV An´ alisis Distributivo de Microdatos usando Stata Gonzalo Dur´ an, Marco Kremerman Facultad de Econom´ ıa y Negocios Universidad de Chile Agosto de 2013 1. Resumen de la clase Formas de importar datos desde planillas de c´ alculo, texto plano y otros formatos. Stata permite importar datos desde planillas Excel con moderada facilidad. En las versiones 12 y 13 se presentan cambios que facilitan mucho m´ as el procedimiento (ver comando import excel ). Los instructores recomiendan el traspaso de informaci´ on a trav´ es del uso de comandos ad-hoc y no mediante la t´ ecnica copy-paste en el edit window (puede haber p´ erdida de datos, de precisi´ on, de formato). Comando insheet Insheet es un comando muy utilizado para importar datos que provienen de archivos planos (.txt) o que provienen de planillas de c´ alculo y se han almacenado en formato texto. Tambi´ en, es un comando que funciona muy bien para importar datos separados por comas (.csv - comma-separated values ). clear all cd "C:\curso-fen\data\" set mem 100m insheet using "Cuadro_1.txt", names En Stata, la coma (,) en la l´ ınea de programaci´ on indica que posterior a ella, vienen las opciones que se han activado y que est´ an disponibles en el comando utilizado. En este caso el comando es insheet y la opci´ on que se est´ a utilizando es names, que significa que considere la primera fila de la base de datos como nombre de las variables (para saber esto, previamente deber´ ıa haber abierto el archivo .txt). En caso de no haber declarado directorio al comenzar: insheet using "C:\curso-fen\data\Cuadro_1.txt", names Economista Fundaci´ on SOL Economista Fundaci´ on SOL 1

description

data

Transcript of 2013-08-1120131534Apendice_ImportarDATA (1)

  • Apendice: Importar .XML, .TXT, .XLS, .XLSX,

    .CSV

    Analisis Distributivo de Microdatos usando Stata

    Gonzalo Duran*, Marco Kremerman

    Facultad de Economa y NegociosUniversidad de Chile

    Agosto de 2013

    1. Resumen de la clase

    Formas de importar datos desde planillas de calculo, texto plano y otros formatos.

    Stata permite importar datos desde planillas Excel con moderada facilidad. En las versiones 12y 13 se presentan cambios que facilitan mucho mas el procedimiento (ver comando import excel).Los instructores recomiendan el traspaso de informacion a traves del uso de comandos ad-hoc yno mediante la tecnica copy-paste en el edit window (puede haber perdida de datos, de precision,de formato).

    Comando insheet

    Insheet es un comando muy utilizado para importar datos que provienen de archivos planos (.txt)o que provienen de planillas de calculo y se han almacenado en formato texto. Tambien, es uncomando que funciona muy bien para importar datos separados por comas (.csv - comma-separatedvalues).

    clear all

    cd "C:\curso-fen\data\"

    set mem 100m

    insheet using "Cuadro_1.txt", names

    En Stata, la coma (,) en la lnea de programacion indica que posterior a ella, vienen las opcionesque se han activado y que estan disponibles en el comando utilizado. En este caso el comando esinsheet y la opcion que se esta utilizando es names, que significa que considere la primera fila dela base de datos como nombre de las variables (para saber esto, previamente debera haber abiertoel archivo .txt). En caso de no haber declarado directorio al comenzar:

    insheet using "C:\curso-fen\data\Cuadro_1.txt", names

    *Economista Fundacion SOLEconomista Fundacion SOL

    1

  • Comando xmluse

    Xmluse es un comando utilizado para importar archivos excel, ya sea en el formato antiguo (.xls)o en el nuevo (.xlsx). Tambien se recomienda que antes de usarlo, se revise el archivo a importar,esto es, se abra, se inspeccione, y finalmente se vuelva a guardar, pero como archivo xml. Paraesto, se debe ir a guardar como: archivo xml.

    clear all

    cd "C:\curso-fen\data\"

    set mem 100m

    xmluse "Cuadro_1.xml", doctype(excel) sheet(ExportCuadro) cells(A1:B220) firstrow clear

    En este caso luego de la coma, las opciones que le hemos dado al comando xmluse son:

    a. Se declara el tipo de archivo en el doctype.

    b. Se declara el nombre de la pestana u hoja del excel desde donde extraere los datos (sheet).

    c. Se declara el rango donde se ubican los datos (cells). Este rango es la matriz completa,incluida la fila con los nombres de columnas.

    d. Se activa la opcion firstrow cuya con lo cual considera la primera fila como nombres de lasvariables y no como datos.

    e. la opcion clear al final en este caso es redundante ya que al comienzo del do se escribio unclear all. En caso de no haberlo hecho, el clear al final del xmluse es un sustituto.

    Comando import excel (solo Stata 12 y Stata 13)

    Muy similar al comando previo. La sintaxis es:

    clear all

    import excel "Cuadro_1.xls", sheet("ExportCuadro") cellrange(A3:B222) firstrow clear

    2

    Resumen de la clase