Introducción a inferencia básica

Post on 15-Jan-2016

14 views 0 download

description

Métodos de Análisis Aplicados a los Mercados de Suelo en América Latina

Transcript of Introducción a inferencia básica

Introducción a inferencia básica

Métodos de Análisis Aplicados a los Mercados de Suelo en América Latina

Daniel A. Rodríguez, Ph.D.University of North Carolina, Chapel Hill

danrod@unc.edu www.planning.unc.edu/rodriguez

Objetivos de aprendizaje

• Aplicar estadística descriptiva a muestras

• Entender el teorema del limite central y su importancia para describir poblaciones a partir de muestras

• Calcular normal estándar, área bajo curva normal e intervalos de confianza

Resumen de temas

• Estadística descriptiva– Medidas de tendencia central– Medidas de dispersión

• Estadística inferencial

Presentación• Medidas de tendencia central• Medidas de dispersión• Distribuciones muestrales• Teorema del Limite Central• Normal estándar• Formulación de hipótesis• Intervalos de confianza• T-de estudiante• Pruebas de hipótesis

Medidas de tendencia central

• Son indicadores que describen la situación de tendencia o hacia la que tienden a aglomerarse las observaciones de una variable aleatoria– Media– Mediana

Medidas de tendencia central: la media

• Ejemplo numérico: tenemos los siguientes precios del suelo (por m2) para una ciudad por barrios

• La media es el promedio aritmético = la suma de todas las observaciones, dividida por el número de observaciones

Barrio A B C D E FPrecios 6 13 5 15 3 2

3,76

23155136

Medidas de tendencia central: la media

• En términos matemáticos, la media aritmética es:

n

Xn

i i 1

n

XXXX n ...321

Medidas de tendencia central: la media

• Atributo interesante de la media– La suma de la diferencia entre cada

observación y la media es 0

0)(...)()()( 321 xXxXxXxX n

0)(1

xXn

ii

Medidas de tendencia central: la mediana

• Es el valor medio de un arreglo ordenado de datos– Ordenar los datos (ascendente o

descendente)– Encontrar el dato justo en medio de los

demás datos

Esta definición aplica para un número par o impar de observacionesmedianaladeposición

n

2

1

Medidas de tendencia central: la mediana

• Ejemplo numérico: tenemos los siguientes precios del suelo para una ciudad por barrios Barrio F E C A B DPrecios 2 3 5 6 13 15

Hay 6 observaciones. Luego la posición de la mediana es n+1 / 2 = 3.5. Quiere decir que la mediana esta entre el valor del dato en la posición 3 y el valor del dato en la posición 4.

Posición 3: barrio C Posición 4: barrio A Mediana, entre 5 y 6. Es decir: 5.5

Sesgo debido a observaciones extremas

• La mediana no es sensible a observaciones extremas– Es un indicador que no es sesgado por los

extremos por lo que se recomienda cuando las variables aleatorias tienen distribuciones amplias

• La media es sensible a observaciones extremas

Esta definición aplica para un número par o impar de observaciones

Distribución normal

115

=10

Distribución asimétrica

Presentación• Medidas de tendencia central• Medidas de dispersión• Distribuciones muestrales• Teorema del Limite Central• Normal estándar• Formulación de hipótesis• Intervalos de confianza• T-de estudiante• Pruebas de hipótesis

Medidas de dispersión

• Indican el grado de “separación” entre los datos numéricos de una variable aleatoria.– Rango– Varianza

Medidas de dispersión

• El rango describe los valores extremos entre los cuales se encuentra distribuida una variable– Se calcula restando el valor menor del valor

mayor; para el ejemplo del barrio 1, el rango es 8-6 = 2 Barrio 1 (n=9)

Medidas de dispersión

• La varianza

• Evalúa en qué medida las observaciones fluctúan con respecto a la media

1

1

2

n

XXn

i i

• La desviación estándar – Extrae la raíz cuadrada de la varianza para

de esta manera compensar la elevada al cuadrado

Medidas de dispersión

1

1

2

n

XXn

i i

Medidas de dispersión• La varianza y desviación estándar;

ejemplo numérico: tenemos los siguientes precios del suelo para una ciudad por barriosBarrio F E C A B DPrecios 2 3 5 6 13 15

EstándarDesviación 4,507,29

07.29

16

33.715.....33.7333.72 222

Presentación• Medidas de tendencia central• Medidas de dispersión• Distribuciones muestrales• Teorema del Limite Central• Normal estándar• Formulación de hipótesis• Intervalos de confianza• T-de estudiante• Pruebas de hipótesis

Introducción a la estadística inferencial

• La información muestral de tendencia central y dispersión permite hacer estimativos de dichos indicadores para la población– Incluso permite determinar el tamaño de

muestras óptimo para alcanzar buenas predicciones poblacionales

Estadística inferencial --conceptos básicos

• Población o marco muestral: grupo sobre el cual se quieren hacer generalizaciones

• Muestra: grupo menor al de la población que fue seleccionado para ser estudiado

• Diseño de muestra: Criterio que se utilizo para seleccionar las observaciones de la muestra

Distribución muestral de medias de muestras

Populacao; x =5 5 5 5 5 54 4 4 4 4 4 43 3 3 3 3 32 2 2 2 2 2 21 1 1 1 1 1

Poblacion

Muestras (c/u de tamaño igual a 3)

Medias muestralesx = x = x = x = x = x = x = x = x =

5 5 5 5 5 4 4 4 34 4 4 3 2 3 3 2 23 2 1 2 1 2 1 1 1

Media 4.0 3.7 3.3 3.3 2.7 3.0 2.7 2.3 2.0

0

0.5

1

1.5

2

2.5

0.0 1.0 2.0 3.0 4.0 5.0

Média

Fre

qu

ênci

a

Média: Frequência:4.0 1.03.7 1.03.3 2.03.0 2.02.7 2.02.3 1.02.0 1.0

Media Frecuencia

Ejemplo de distribución de medias de muestras

• Valor por m2 de locales comerciales en cierta zona a ser estimado por un grupo de estudiantes

• Cada estudiante tomará una muestra aleatoria de locales

ResultadosResultados

• Persona 1: P1, P2….Pn P1 media1, s1

• Persona 2: P1, P2….Pn P2 media2, s2

– Media Pi de cada estudiante es parte de la distribución muestral de la media

– Distribución de medias es normal

– Con menor dispersión que si

• La dispersión de la media de medias es menor que la dispersión de las variables crudas

• Cuánto menor? Raiz cuadrada de n (n= número de estudiantes)

ResultadosResultados

• Lo anterior es cierto SIN importar distribución del precio/m2 de todos los locales comerciales

Precio/m2

# de locales

Precio/m2

# de locales

Presentación• Medidas de tendencia central• Medidas de dispersión• Distribuciones muestrales• Teorema del Limite Central• Normal estándar• Formulación de hipótesis• Intervalos de confianza• T-de estudiante• Pruebas de hipótesis

Teorema del Límite Central

• Distribución de suma (o media) de variables aleatorias con varianza finita ~ Normal o Gaussiana, cuando n>30– Aleatoria– Distribución normal

Teorema del Límite Central

• Si tomamos muestras repetidas de un tamaño predefinido de una población – Distribución de medias será normal– Media de distribución muestral del promedio

promedio de población• Xbarra = μ

– Error estándar = desviación estándar/ √n• Si n es grande, error disminuye

Ejemplo Ejemplo

• Utilizar el programa climit para explorar las implicaciones del teorema central del limite– Hacer doble click en el ícono en esta lámina

(no contiene virus!)

Cenlimit.exe

Notación

• Muestra– (xbarra) es la media – s es la desviación estándar de la muestra– n es el tamaño de la muestra

• Población– es la media de la población– es la desviación estándar de la población– N es el tamaño de la población

x

Distribución muestral del promedio

• Variable cuantitativa– Xbarra = μ (promedio de población)– Error = σ/√n

• Variable proporcional– p= π (promedio de proporción de población)– Error = √ (p(1-p)/n)

Distribución normal

• Hay infinitas distribuciones normales (depende de la media, y la dispersión)– Dos ejemplos

Continuando con el teorema del límite central

• No solo la media de medias se aproxima a la media de la población– Sino que sabemos que 68.27% de las

muestras están entre y ; y 95.45% de las muestras están entre

y

x x

x 2x 2

Dicho de otro modo:34.134% de observaciones están entre la media y +1 desviación estándar47.725% de observaciones están entre la media y +2 desviaciones estándar

Continuando con el teorema del límite central

Área bajo la distribución normal

Xbarra

2-2 -

50%

50%

50%-34.13%

=15.87%

Área bajo la distribución normal

Xbarra Xbarra

2-2 - 2-2 -

50%

50%

15.87%

15.87% x 2 = 31.74%

50%-47.725%

=2.275%

=2.275% x 2

=4.55

Área bajo la distribución normal

Xbarra

El área rayada muestra los casos en que la muestra tuvo una media mayor a 115

115

SXbarra =10

Presentación• Medidas de tendencia central• Medidas de dispersión• Distribuciones muestrales• Teorema del Limite Central• Normal estándar• Formulación de hipótesis• Intervalos de confianza• T-de estudiante• Pruebas de hipótesis

Normal estándar

• La letra “z” se designa al valor de cada observación en términos de la desviaciones estándar de la muestra– Transformación:

– Nuevos valores tienen promedio 0, y desviación estándar 1 muy útil

ux

Normal estándar

• En el caso anterior del valor 115, su normal estándar sería 1.5, porque está a 1.5 desviaciones estándares de la media

Ejemplo de normal estándar

pop_acre std hu_acre std 1 10.02 0.63 8.38 2.21 2 42.39 5.72 20.62 6.84 3 18.46 1.96 9.48 2.63 4 14.48 1.33 9.95 2.81 5 23.53 2.76 12.30 3.70

Variable Obs Mean Std. Dev.

Min Max Mean Std. Dev.

Min Max

pop_acre 318 6.01 6.36 0 42.39 -1.23E-09 1 -0.95 5.72 hu_acre 318 2.51 2.65 0.02 20.62 -2.20E-10 1 -0.94 6.84 parkacre 318 0.00 0.01 0 0.04 -2.84E-09 1 -0.73 6.30 roadacre 318 0.02 0.01 0.00 0.07 3.21E-09 1 -1.67 3.89

Área bajo la distribución normal

Xbarra 115

SXbarra =10

• La pregunta original sobre el área a la derecha de 115– El valor normal estándar

de 115 es 1.5– Cuál es el área a la

derecha de 1.5?– Utilizar una tabla Z

Tabla Z

z 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

0 0 0.004 0.008 0.012 0.016 0.0199 0.0239 0.0279 0.0319 0.0359

0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753

0.2 0.0793 0.0832 0.0871 0.091 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141

0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.148 0.1517

0.4 0.1554 0.1591 0.1628 0.1664 0.17 0.1736 0.1772 0.1808 0.1844 0.1879

0.5 0.1915 0.195 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.219 0.2224

0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549

0.7 0.258 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852

0.8 0.2881 0.291 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133

0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3304 0.3365 0.3389

1 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621

1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.377 0.379 0.381 0.383

1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.398 0.3997 0.4015

1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177

1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319

1.5 0.4332 0.4345 0.4357 0.437 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441

1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545

1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633

1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706

1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.475 0.4756 0.4761 0.4767

2 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817

2.1 0.4821 0.4826 0.483 0.4834 0.4838 0.4842 0.4846 0.485 0.4854 0.4857

2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.489

2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916

2.4 0.4918 0.492 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936

2.5 0.4938 0.494 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952

2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.496 0.4961 0.4962 0.4963 0.4964

2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.497 0.4971 0.4972 0.4973 0.4974

2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.498 0.4981

2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986

3 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.499 0.499

3.1 0.499 0.4991 0.4991 0.4991 0.4992 0.4992 0.4992 0.4992 0.4993 0.4993

3.2 0.4993 0.4993 0.4994 0.4994 0.4994 0.4994 0.4994 0.4995 0.4995 0.4995

3.3 0.4995 0.4995 0.4995 0.4996 0.4996 0.4996 0.4996 0.4996 0.4996 0.4997

3.4 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4998

3.5 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998

3.6 0.4998 0.4998 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999

3.7 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999

3.8 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.499

La tabla es en Excel. Para acceder a los datos, hacer doble click en la tabla.

Muestra area entre 0 y la normal estandar

Ejemplo normal estándar

• Una muestra tiene un valor de 80– Cual es su valor normal estándar?

• (80-100)/10 = - 2.0

– Que % de las muestras son mayores que 80?• Utilizando -2.0, ir a la a tabla. Utilizar 2, ya que la

curva es simétrica. El valor es 0.4772. Es decir, que 0.5 + 0.477 = 97.7% de las muestras serían mayores que 80, y sólo

2.3% serian menores.

Presentación• Medidas de tendencia central• Medidas de dispersión• Distribuciones muestrales• Teorema del Limite Central• Normal estándar• Formulación de hipótesis• Intervalos de confianza• T-de estudiante• Pruebas de hipótesis

Hipótesis

• Bisagra ente problema y estudio empírico

• Fundamentada por teoría y praxis

• Ajustes y mejoras de acuerdo a evidencia

Ejemplos de Hipótesis

• Existe una relación entre regulación de usos de suelo y precios, tal que las ciudades mas reguladas presentan mayores precios de tierra

• Existe una relación entre la localización y el precio de la tierra, tal que los inmuebles mas próximos a centros de actividad y negocios tienen precios mas elevados que inmuebles mas distantes

• Existe una relación entre la informalidad y la pobreza, tal que las ciudades con mayores índices de pobreza presentan mayores domicilios informales que ciudades con menor índices de pobreza en su población

Prueba de hipótesis

• Recolectar información para determinar si la hipótesis es cierta o no– En muchos casos, no estaremos 100% seguros de

que la hipótesis sea cierta (o no), pero tendremos alta confiabilidad de que lo sea

Formulación de hipótesis para inferencia estadística

• Hipótesis nula (H0)

– Afirmación que indica que para la población, dos variables son iguales

• Hipótesis alternativa (H1)

– Afirmación que indica que para la población, dos variables difieren (>, <, < o >)

– Hipótesis de la investigación

• Queremos saber si alcaldes con tintes de izquierda adquieren tierra para proyectos de vivienda con métodos que están por fuera del mercado de tierra, en comparación a alcaldes con tintes de derecha

• Sabemos cantidad de tierra adquirida por via administrativa (expropiada) para todas las ciudades de Colombia

• Formulamos el test de hipótesis:– H0: izquierda = derecha

– H1: izquierda ≠ derecha

Ejemplo: adquisición de la tierra e ideología política

• Digamos que izquierda = 83.18%

derecha = 22.25%

• Como estas medidas son para la población de ciudades, no hay necesidad de hacer pruebas de significancia– izquierda > derecha , luego H0 es rechazada

Ejemplo: adquisición de la tierra e ideología política

• Caso más usual: dos muestras aleatorias• izquierda = ??• derecha = ?•

izquierda = 23.33%• derecha = 83.18%

x

Ejemplo: adquisición de la tierra e ideología política

x

• En el ejemplo anterior– Si no sabemos media en la población, tenemos error

de muestra, y el hecho que las muestras tienen medias distintas podría ser una coincidencia

– La hipótesis es la misma, queremos saber si la media en las dos poblaciones son diferentes

– Hay que incluir información no solo sobre la media, sino sobre la dispersión que existe en la media muestral –porque nos ayuda a saber que tan diferentes las medias son en realidad

Ejemplo: adquisición de la tierra e ideología política

Presentación• Medidas de tendencia central• Medidas de dispersión• Distribuciones muestrales• Teorema del Limite Central• Normal estándar• Formulación de hipótesis• Intervalos de confianza• T-de estudiante• Pruebas de hipótesis

Estimación de intervalos de confianza

• Un rango o intervalo de valores entre los cuales podemos afirmar que está la media poblacional

• Por ejemplo, si sabemos la media muestral, podemos decir con 95% de certeza que la media de la población esta entre el rango de y=

xx 96.1 xx 96.1

xx 96.1

Intervalos de confianza

• Retomando el ejemplo del precio/m2 de locales comerciales– Xbarra de precios= promedio de promedios– Error estándar = s/√n

• Puedo adivinar promedio, usando Xbarra

• No contiene información sobre el error

Intervalos de confianza

• Presentar la inferencia como intervalo– Contiene rango en el que el valor del parámetro

(la media) se encuentra– Probabilidad de que esté en ese intervalo a

cierto “nivel de confianza” • 95% nivel de confianza estándar en ciencias sociales

• Normalidad del TCL nos ayuda a construir intervalos a deseados niveles de confianza

Intervalos de confianza

• Valores críticos para población

• Declarar hechos– Tenemos 95% de confianza que promedio esta

dentro rango dado– 5% de los casos, media de la población esta por

fuera del intervalo de confianza del promedio

58.2,96.1

58.2,96.1

xx

ErrorEstxErrorEstx

Intervalos de confianza en MUESTRAS

n

sZx

ErrorEstZx

.

n

ppZp

ErrorEstZp

)1(

.

Ejemplo

• Considere una distribucion asimetrica, tirada hacia la derecha (right skewed)

– La media muestral es 14.46, n=40, y la desviacion estandar 1.34. Estimar un intervalo de confianza del 95%

Ejemplo

Presentación

• Repaso teorema del limite central

• Normal estándar

• Formulación de hipótesis

• Intervalos de confianza

• T-de estudiante

• Pruebas de hipótesis

T de estudiante

• William Gosset se dio cuenta que la distribución normal no describe muestras pequeñas– Más probable que valores lejos del promedio

ocurran– Hay que ajustar la distribución por el tamaño

de la muestra– No pudo usar su nombre “estudiante”

T de estudiante

• Como distribución normal pero con colas mas gruesas (probables)

• Si n ∞, t normal

• Ajuste al tamaño de la muestra se llama “grados de libertad”

T de estudiante

• Como distribución normal pero con colas mas gruesas (probables)

• Si n ∞, t normal

• Ajuste al tamaño de la muestra se llama “grados de libertad”– Mucho grados = bueno; pocos no tan bueno

• 1 grado de libertad, hay que irse 12 veces la desviación estándar para tener 95% de observaciones

• df=5, t.05=2.58; df=10, t.05=2.23; df=50, t.05=2.01

Pruebas de hipótesis

• Comparar valor por m2 de locales comerciales en zona con otro valor– Antes construimos intervalo de confianza

para promedio muestral (269k,291k)– Qué tan factible es que el promedio

verdadero en la población de locales sea 255k?

– No muy probable…

T1

Presentación• Medidas de tendencia central• Medidas de dispersión• Distribuciones muestrales• Teorema del Limite Central• Normal estándar• Formulación de hipótesis• Intervalos de confianza• T-de estudiante• Pruebas de hipótesis

Pruebas de hipótesis

• Usemos números!– 255,000 esta a 5.9 desviaciones del

promedio– Cual es la probablidad de que esto ocurra?

• Mirar curva de distribución normal (Tabla Z)– Casi 0

Pasos para examinar una hipótesis

1. Formular hipótesis nula (Ho) e hipótesis alternativa (Ha)

2. Identificar estadística a comparar

3. Probabilidad de observar promedio de muestra si Ho es verdad

4. Concluir

1. Formular hipótesis

• Nula – nada ocurre (en términos de parámetros poblacionales)– Π = valor– µ = valor– µ1- µ2 = valor

• Alternativa –lo que nos interesa!– Π > valor –una cola– µ ≠ valor –dos colas– µ1- µ2 < valor –una cola

2. Identificar estadística a comparar

• La estadística a comparar: qué tan lejos está el valor de la muestra del de la población –azar o no?– Prueba de una muestra o de dos?

Empecemos con una:

n

sx

ErrorEst

xZ

.

npp

pErrorEst

p

)1(

.

3. Valor p

• Probabilidad de que la estadística (t o Z) sea resultado de azar o no, si la hipótesis nula es verdad– Una probabilidad bien baja sugiere baja

posibilidad de azar– Usando distribución (t o Z) con valores

críticos (y para T, dependiendo de grados de libertad)

4. Conclusión

• Si p es cerca a 0, probabilidad de que sea resultado de azar es baja – rechazar Ho

• Si p es cerca a 1, probabilidad que sea resultado de azar es alta – no rechazar Ho

• Sugiero p<0.05

Ejemplo• Valor/m2 locales comerciales en cierta zona

– 280k, s=85000, n = 400– Un censo mostró que el valor de predios comerciales

es de 268k/m2. Es la diferencia significativa?– Ho: Xbarra estudio = µ censo– T= (280k-268k)/(85k/ √(400) = 2.82; df=?– http://www.socr.ucla.edu/Applets.dir/T-table.html– P~ 0– Rechazar Ho, que son iguales

Comparar dos muestras

• Frecuente en investigación – evaluar intervenciones– Aumento de precios– Ingresos – Tiempos de viaje– Calidad del aire

• Todo permanece igual en prueba de hipótesis, menos estadística a comparar

T2

Ejemplo

• Comparación de precios de predios residenciales, antes y después, TransMilenio

Estrategia de análisis

• Si no hay diferencia entre dos grupos (antes y después) en población (Ho) qué tan probable es que yo encuentre diferencia en mis (dos) muestras?– Estadística del test

• t= (diferencia en muestra – diferencia en población)/ se (diferencia en muestra)

Estrategia de análisis• Var(X1+X2)=Var(X1)+Var(X2)+2Cov(X1,X

2)

• Si X1, X2 son independientes, Cov = 0

BA xx

BABA

es

xxt

)(

B

x

A

xxxxx n

s

n

seseses BA

BABA

2222

Ejemplo

• = 7.32/2.31 = 3.05

• Si no hay diferencia, probabilidad de que encontremos una de 3.05 por azar es < 0.01

• Rechazar hipótesis nula

Antes (n=1055) Despues (n=874) Promedio Std. Dev. Promedio Std. Dev.

Precio 73.93 44.47 80.99 55.11

Objetivos de aprendizaje –el principio pero al final• Aplicar estadística descriptiva a

muestras• Entender el teorema del limite central

y su importancia para describir poblaciones a partir de muestras

• Calcular normal estándar, área bajo curva normal e intervalos de confianza

Ejercicio

• Consideren los datos de propiedades cercanas TransMilenio, recogidos entre el 2001 y el 2006.– Examinar los precios del suelo (price_000)

de propiedades ofrecidas en el 2002 y en el 2006 en la zona de intervencion

• Zona_int=1 &• Yr_2002 o yr_2006

Ejercicio

• Para cada agno– Media– Mediana– Desv Estandar – Intervalo de confianza de 95% para la media

poblacional– Prueba de hipotesis de que los precios son

diferentes para los dos agnos