Introducción del Curso

Post on 14-Jan-2016

35 views 0 download

description

Introducción del Curso. Rafael de Arce Borda Profesor Economía Aplicada, UAM rafael.dearce@uam.es. La invasión de la información. La primera computadora programable fue inventada en 1947 y tenía la capacidad de almacenar 20 palabras. La invasión de la información. - PowerPoint PPT Presentation

Transcript of Introducción del Curso

Introducción del Curso

Rafael de Arce BordaProfesor Economía Aplicada, UAM

rafael.dearce@uam.es

La invasión de la informaciónLa invasión de la información

La primera computadora programable fue inventada en 1947 y tenía la capacidad de almacenar 20 palabras.

La invasión de la informaciónLa invasión de la información

“Se creará un sistema informático nacional con decenas de millones de terminales en las oficinas y en los hogares (....) que suministrarán servicios de biblioteca e información con posibilidades de compra, pedidos, facturación y cosas por el estilo”

“Comisión sobre el año 2000” AÑO 1965.

D.Bell, D. Muynihan, S.Brezizinsky, J.Q. Wilson, M. Meed.

La invasión de la informaciónLa invasión de la información

“La capacidad de proceso de un chip de silicona se doblará cada 18 meses....”

¿Qué es la econometría?¿Qué es la econometría?

• Valavanis (1959): "El objetivo de la econometría es expresar las teorías económicas bajo una forma matemática a fin de verificarlas por métodos estadísticos y medir el impacto de una variable sobre otra, así como predecir acontecimientos futuros y dar consejos de política económica ante resultados deseables. "

• Klein (1962): "El principal objetivo de la econometría es dar contenido empírico al razonamiento a priori de la economía."

• Malinvaud (1966): "... aplicación de las matemáticas y método estadístico al estudio de fenómenos económicos".

• Intriligator (1978): "Rama de la economía que se ocupa de la estimación empírica de relaciones económicas".

• Chow (1983): "Arte y ciencia de usar métodos para la medida de relaciones económicas".

"HAY TRES CLASES DE MENTIRAS: LAS MENTIRAS, "HAY TRES CLASES DE MENTIRAS: LAS MENTIRAS, LAS MALDITAS MENTIRAS Y LAS ESTADISTICAS" LAS MALDITAS MENTIRAS Y LAS ESTADISTICAS"

(MARK TWAIN)(MARK TWAIN)

• En estadística descriptiva, las medidas de resumen suponen una generalización normal.

• En estadística inferencial, al dar una estimación estoy cometiendo un error llamado error de muestreo debido a que no estoy considerando a toda la población, sino a una parte de ella.

• Tipos de errores:– Errores de observación (sobrecobertura, procesamiento o

medida)– Errores no de observación (no cobertura o sin respuesta)

FASES DEL PROCESAMIENTO Y ANÁLISIS DE DATOSFASES DEL PROCESAMIENTO Y ANÁLISIS DE DATOS

Necesidad de medir un fenómeno o de explotar una información “estadística”

Tabulación de los resultados Introducción de los datos en el software Validación de los datos Definición de los meta-datos Generación de nuevas variables derivadas Primeros estadísticos de resumen Selección de la técnica de análisis Procesamiento e interpretación de resultados Informe de resultados

Obtención de la informaciónObtención de la información

• Fuentes secundarias• Fuentes primarias

– Diseño de la encuesta– Selección de la muestra:

• Muestreo aleatorio sistemático• Muestreo por grupos• Muestreo por conglomerados

Tipos de variables (I)Tipos de variables (I)

• Según el significado de los valores que pueden tomar las variables (series), distinguimos diferentes tipos de variables.

• El tipo de variable es importante: afecta a lo que podemos hacer con ella, al tipo de análisis que podemos hacer.

• Los métodos estadísticos que usamos dependen del tipo de variable.

Tipos de variables (II)Tipos de variables (II)

• Variables Categóricas– Nominales: hombre (0), mujer (1)– Ordinales: alto (3), medio (2), bajo (1)

• Variables de escala– Intervalo (sin cero absoluto): ejemplo,

valoraciones subjetivas de 1 a 5; nota en un examen.

– Razón (completas) : ejemplo, renta

Selección del Análisis Selección del Análisis

• Resumen de información de las variables:– Categóricas: frecuencias y gráficos– Escala (intervalo o razón): medias, medianas, modas,

desviación típica, recorridos, percentiles, …• Agrupación de variables / sujetos:

– Análisis factorial– Análisis Cluster

• Relación entre variables– Tablas bivariadas: Correlaciones – tablas de

contingencia– Anova vs discriminante– Regresión/correlación

1. Conteo de datos: frecuencias y gráficos de sectores o barras. Creación de una “curva de Lorenz” a partir de las frecuencias.

2. Estadísticos descriptivos: media, mediana, desviación típica, moda. Primer acercamiento a los atípicos (diferencia entre media y mediana)

3. Est. Descriptivos sobre cocientes (razón): pruebas medias robustas, índices de regresibilidad (dif. Relativo al precio), coeficientes de concentración

4. Simetría y Curtosis5. Explorando la función de densidad de la serie:

1. Histograma2. Pruebas gráficas de la distribución (Q-Q y Q-Q sin tendencia)3. Pruebas de normalidad (Jarque-Bera, Saphiro-Wilks, Kolmogorov-

smirnof, corrección de Lillieford).

6. Generando valores atípicos a partir de la normalidad

Análisis individual de SeriesAnálisis individual de Series

Selección del Análisis (II)Selección del Análisis (II)

Depend.

Independ.

Cualitativa(categórica)

Cuantitativa(escala)

Cualitativa(categórica)

Tablas de contingencia

Fuma-no Fuma = f(Sexo)

AnovaVtas. Producto=

f(Localización Geográfica)

Cuantitativa(escala)

DiscriminanteMoroso (si-no)=f(renta,hijos,

antigüedad laboral,…)

Regresión /correlación

Vtas. Producto= f(renta pc, precio, publicidad)

LOGIT

• Técnicas autoproyectivas– Medias móviles– Estimación de la tendencia– Descomposición de componentes clásicas– Alisados exponenciales

• Modelos ARIMA o Box-Jenkins• Modelos Vectores Autorregresivos (VAR)• Modelos de regresión estructurales

– Corte transversal– Corte temporal– Datos de Panel

• Modelos no lineales

Análisis de Series TemporalesAnálisis de Series Temporales

La función NormalLa función Normal

La función NormalLa función Normal

Nota sobre el contraste de hipótesisNota sobre el contraste de hipótesis

Nota sobre el contraste de hipótesisNota sobre el contraste de hipótesis

Decisión Estadística

No significativo Significativo

Población

No diferencias Correcto Error Tipo II (falso +)

Diferencias Error Tipo I (falso -)

Correcto

Nivel de significación: Probabilidad de rechazar la hipótesis nula cuando es cierta (p-value, probability,…).