Inferencia

21
31/10/2013 1 La inferencia estadística busca determinar características de la población en base a una muestra Muestra: subconjunto finito y representativo de la población INFERENCIA ESTADISTICA Problema: Estimar el total de habitantes en la comunidad: “Estudiantes de estadística de la Maestría en Ingeniería Vial”, para el efecto tomar una muestra representativa del 20 % de la población. 1 N n N fcpf N = Tamaño población n = Tamaño muestra Si (n/N)*100 > 10 % usar factor de corrección por población finita para la desviación estándar del total

description

Interesante

Transcript of Inferencia

  • 31/10/2013

    1

    La inferencia estadstica busca determinar caractersticas de la poblacin en base a una muestra

    Muestra: subconjunto finito y representativo de la poblacin

    INFERENCIA ESTADISTICA

    Problema: Estimar el total de habitantes en la comunidad: Estudiantes de estadstica de la Maestra en Ingeniera Vial, para el efecto tomar una muestra representativa del 20 % de la poblacin.

    1

    NnNfcpf

    N = Tamao poblacin

    n = Tamao muestra

    Si (n/N)*100 > 10 % usar factor de correccin por poblacin finita para la desviacin estndar del total

  • 31/10/2013

    2

    Muestreo, Mtodo para obtener un subconjunto REPRESENTATIVO de la poblacin

    Tamaos de muestra Para estimar el promedio poblacional por I.C. con m.a.s.

    Determinar el tamao de muestra requerido para estimar el promedio poblacional del numero de habitantes por vivienda de la comunidad de estudiantes de estadstica de la maestra en Ingeniera Vial. Los datos al respecto son:

    Tamao poblacin N=47Especificaciones de precisin para estimar :

    e = 0.5 habitantesNC= 95%

    En base a una muestra piloto de n=10, se conoce que:S=1.5 habitantes

  • 31/10/2013

    3

    vs Precision with C.C.=0.95 S=4.219 C.I. Mean

    N

    Precision

    5

    6

    7

    8

    9

    10

    0 1 2 3 4

    Tamaos de muestraPara estimacin de la proporcin poblacional por I.C. y m.a.s.

    Ejem: Se desea estimar la proporcin poblacional de personas de acuerdo con que se construya el camino por el Tipnis

    Las especificaciones previas de precisin son:

    N.C. = 95 %

    Error admisible 2 %

    Determinar el tamao de muestra

  • 31/10/2013

    4

    N vs P with Precision=0.02000 C.C.=0.95 C.I. Mean

    N

    P

    400

    500

    600

    700

    800

    0.1 0.3 0.5 0.7 0.9

    N vs P by Precision with C.C.=0.95 C.I. Mean

    0.020.040.060.080.10

    N

    Prec

    isio

    n

    P

    0

    200

    400

    600

    800

    0.1 0.3 0.5 0.7 0.9

    Precision 0.02 to 0.1 by 0.02

    P 0.1 to 0.9 by 0.1

  • 31/10/2013

    5

    Determinacin de p por I.C.

    En base a una encuesta a 500 personas(representativas de una determinada poblacin), seconoce que la proporcin de personas favorables a laconstruccin del camino por el tipnis es p=70 %, calcularel error de muestreo correspondiente, usar un NC=95 %

    PRUEBAS DE HIPOTESIS

    P.H. es una regla de decisin para aceptar o rechazar una hiptesis nula

    Mtodo de inferencia estadstica:El resultado esperado fue planteado como pregunta

    (Intervalo de confianza) o como respuesta (prueba de hiptesis)

    Ejem:R.E.: Estimar la proporcin de personas favorables a la

    construccion del camino por el Tipnis.

    R.E.: La proporcin de personas favorables a que se construya el camino por el Tipnis es mayor o igual a 70 %

  • 31/10/2013

    6

    TIPOS DE PRUEBAS DE HIPOTESIS

    P.H. de conformidad de un parmetro

    P.H. de comparacin de un parmetro de dos o mas poblaciones

    P.H. de bondad de ajuste

    P.H. de independencia de variables de tipo cualitativo

    PRUEBAS DE HIPOTESIS

    Procedimiento general para pruebas de hiptesis:

    a) Formular respuestas provisoriasb) Adoptar un alfac) Tomar muestrad) Calcular estadstico de prueba en base a distribucin

    muestral del estadstico de interse) Definir regin de aceptacin de H0f) Si pvalue > alfa =>aceptar H0g) Escribir conclusin

  • 31/10/2013

    7

    Prueba de hiptesis de conformidad de un promedio

    Ejem: Se estudia la contaminacin por lluvia acida en cierta regin de inters, para el efecto se cuenta con mediciones de los depsitos de sulfatos mostrados en el Cuadro adjunto. Verificar la aseveracin de que la muestra proviene de una poblacin con promedio mayor que 12 Kg/Ha.

    Ao 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990Depositos sulfatos (Kg/Ha) 17,59 12,84 11,55 12,72 14,33 12,23 15,16 14,08 10,85 11,87 12,93

    Depsitos de sulfatos por lluvia acida (Kg/Ha), observados en zona de estudio

    a) Formular respuestas provisorias

    Ho : 12 Kg/HaH1 : > 12 Kg/Ha

    SOLUCION

    b) Adoptar un nivel de significacin = 5%

    SOLUCION

    c) Tomar muestra, calcular estadsticos de resumen

    Promedio 13.29Desv Estandar 1.91

    d) Calcular estadstico de prueba en base a distribucin muestral del estadstico de inters

    Como n

    x

    x ~ N

    nSxt pru

  • 31/10/2013

    8

    Pruebas de comparacin de un parametro de dos poblaciones distintas

    P.H. de dos promedios: muestras independientes Datos pareados

    Viviendas Barrio A 50 55 42 35Viviendas Barrio B 32 45 50

    P1 P2 P3 P4pre dieta 90 80 92 85post dieta 85 72 86 79

    Consumo de agua mes (m3)

    Peso (Kg)

    Pruebas de comparacin del promedio, muestras independientes

    Ho : (A) = (B)H1 : (A) < (B)

    Las dos poblaciones al parecer tienen variancias poblacionales distintas y desconocidas

    2

    22

    1

    12

    21

    nn

    xxZ p

    2

    22

    1

    12

    21

    nS

    nS

    xxtp

    11

    )(

    2

    2

    1

    2

    2

    nB

    nA

    BA

    nS

    A1

    2

    1

    nS

    B2

    2

    2

  • 31/10/2013

    9

    Pruebas de comparacin del promedio, muestras independientes

    Las dos poblaciones al parecer tienen variancias poblacionales iguales y desconocidas

    2

    2

    1

    2

    21

    nS

    nS

    xxtpp

    p

    )2()1()1(

    21

    222

    2112

    nnSnSnSp

    221 nn

    Contraste de igualdad de Variancias

    22

    22

    21

    21

    //

    SSFpr

    22

    210 : H 2

    2

    21

    SSFpr

    22

    211 : H 2

    2

    21

    SSFpr

    21S Mayor variancia muestral

    22S Menor variancia muestral

    numeradordellibertaddegrados1 numeradordellibertaddegrados1

  • 31/10/2013

    10

    1) En un terrapln de prueba se ha estado midiendo el peso especifico seco obtenido en la compactacin de una capa de suelo A-2, de 30 cm de espesor, con dos compactadoras sobre neumticos con pesos diferentes. Segn el ejecutor, con el compactador # 1 y 5 pases se logra una adecuada compactacin. Segn el proyectista que realizaba el control de autor, era necesario usar el compactador # 2 tambin con 5 pases. Para el compactador #1 se tomaron 20 muestras, las cuales arrojaron d = 1790 kg/m3. Para el # 2 se tomaron 24 muestras con d = 1739 kg/m3 .Se debe decidir si existe o no diferencia significativa entre el resultado de un compactador y otro para un nivel de significacin del 95 %, las varianzas calculadas son respectivamente

    Pruebas de comparacin de un parametro de dos poblaciones distintas

    S1 = 10 Kg/m3

    S2 = 5 Kg/m3

    Pruebas de comparacin de un parametro de dos poblaciones distintas

    P.H. de dos promedios, muestras independientes

    Ejem. 1: Considerando que el consumo de agua en los barrios A, B y C corresponden a una muestra, determinar si se puede admitir que a nivel poblacional el barrio A tiene un consumo promedio inferior al del barrio C.

    En base a las observaciones muestrales, se calcularon los siguientes estadsticos:

    Estadsticos de grupo

    28 101.1250 9.15313 1.7297828 102.5714 14.75046 2.78758

    BARRIO 1=A, 2=B, 3=CAC

    concumo emnsualde agua en m3

    N MediaDesviacin

    tp.Error tp. de

    la media

    Ho : (A) = (B)H1 : (A) < (B)

  • 31/10/2013

    11

    Pruebas de comparacin de un parametro de dos poblaciones dependientes

    P.H. de dos promedios, muestras pareadas

    8892

    5859

    7677

    6676

    5757

    9499

    Pre cursoPost curso

    Calificaciones

    8892

    5859

    7677

    6676

    5757

    9499

    Pre cursoPost curso

    Calificaciones

    Ho : (d) = 0H1 : (d) > 0 nS

    dt

    d

    dp /

    Ejercicio 3: Se miden concentraciones de Zinc en (mg/l), con el fin de decidir si es conveniente plantear obras de captacin del agua subsuperficial, en base a una muestra de 6 puntos indicar si se puede admitir que a nivel poblacional el promedio de agua superficial tiene una concentracin de Zinc mayor que el agua subsuperficial.

    Ho : (d) = 0H1 : (d) > 0

    LocalAgua

    Superficial Agua

    Subsuperficial1 0,430 0,4152 0,266 0,2383 0,567 0,3904 0,531 0,4105 0,707 0,6056 0,716 0,609

    Concentracion de Zinc (mg/l)

    Pruebas de comparacin de un parametro de dos poblaciones dependientes

    P.H. de dos promedios, muestras pareadas

  • 31/10/2013

    12

    Pruebas de comparacin de un parmetro de mas de dos poblaciones, ANOVA

    Condiciones de aplicacin: muestras independientes, varianciaspoblacionales iguales, distribuciones poblacionales normales.

    Se estudia la resistencia a compresin del hormign (Mpa) a 28 das de4 tipos de dosificacin, los valores medidos en los cilindros de prueba,se muestran en el siguiente cuadro. Indicar si el factor dosificacininfluye en la resistencia promedio

    Ho : (A) = (B) = (C) = (D)H1 : alguna de las igualdades anteriores no se cumple

    Dosifi A Dosifi B Dosifi C Dosifi D42,00 45,00 64,00 56,0039,00 46,00 61,00 55,0048,00 45,00 50,00 62,0043,00 39,00 55,00 59,0044,00 43,00 58,00 60,00

    Variabilidad dentro grupos:

    11

    211 )(

    n

    ii xxSCD

    21

    222 )(

    n

    ii xxSCD

    .

    .

    SCD = SCD1+ SCD2 + + SCDk

    kn

    SCDCMD

  • 31/10/2013

    13

    Variabilidad entre grupos:

    k

    ii xxSCE

    1

    2)(

    k

    kk

    nnnxnxnxnx ...

    ...21

    2211

    1 K

    SCECME

    CMDCMEFpr

    Pruebas de comparacin de un parmetro de mas de dos poblaciones, ANOVA

    Se desea comparar el consumo promedio de gasolina para tresfabricantes de coches. Se cuenta con 20 conductores a quienes se lesasigna un coche de manera aleatoria, los datos obtenidos se muestranen el cuadro.

    Coches A Coches B Coches C22.2 24.6 22.719.9 23.1 21.920.3 22.0 23.221.4 23.5 24.121.2 23.6 22.121.0 22.1 23.420.3 23.5

    Rendimiento coches en (km/l)

    Ho : (A) = (B) = (C)H1 : alguna de las igualdades anteriores no se cumple

  • 31/10/2013

    14

    Ejercicio 4: El proceso de obtencin de papel necesita grandes cantidades de agua. Una vez preparada la madera, sta es normalmente calentada con agentes reductores y lcalis para disolver las fibras y obtener pulpa. Este proceso es muy contaminante. Se han tomado datos aleatorios a lo largo de un ao de la cantidad de agua usada en el paso inicial de la obtencin de pulpa por tonelada de madera en 4 trituradoras.

    Se desea verificar si en promedio las 4 trituradoras consumen la misma cantidad promedio de agua, analizar las diferencias si ellas existen

    TA TB TC TD 22,0 18,6 23,1 20,3 18,8 16,0 18,0 18,5 19,5 17,7 20,0 19,6 23,7 14,6 21,0 22,8 21,9 19,9 23,7 23,8 19,9 18,6 22,4 21,4

    Ho : (TA) = (TB) = (TC) = (TD)H1 : alguna de las igualdades anteriores no se cumple

    Inferencia estadstica prueba de independenciabidimensionales variables cualitativas

    herramienta tablas de contingencia

    Se consulto una muestra de pobladores de los distritos 1, 2 y 3, respecto a suopinin para implantar o no cierto proyecto en inmediaciones de sujurisdiccin, los datos se muestran en la tabla adjunta, indicar si la opinin delos pobladores es independiente del distrito.

    Opinion respecto ala implantacion del

    proyectoDistrito 1 Dsitrito 2 Distrito 3

    a favor 8 13 12en contra 52 67 48

    X2pr = (Oi-Ei)2/Ei

  • 31/10/2013

    15

    Inferencia estadstica prueba de independenciabidimensionales variables cualitativas

    herramienta tablas de contingencia

    Con los datos de la alcalda, verificar si el genero de las personas es independiente de su categora laboral

    Tabla de contingencia Genero * Categora laboral

    Recuento

    157 27 74 258206 0 10 216363 27 84 474

    HombreMujer

    Genero

    Total

    Administrativo Seguridad DirectivoCategora laboral

    Total

    Regresin desde un punto de vista de inferencia

    Profundidad(m)

    Oxigeno(mg/l)

    p1 15,00 5,50p2 20,00 5,30p3 30,00 4,00p4 40,00 3,00p5 50,00 2,50p6 60,00 1,40p7 70,00 ,50

  • 31/10/2013

    16

    Recordando que se esta trabajando con una muestra estadstica, estimar el contenido de oxigeno para una profundidad PROMEDIO de 43 m

    Determinar el contenido de oxigeno a una profundidad concreta y especifica de 43 m

  • 31/10/2013

    17

    Estimacin promedio y estimacin para un valor puntual, va regresin

    Modelo de regresin, desde un punto de vista de inferencia con estimaciones por intervalos de confianza

  • 31/10/2013

    18

    Preparar el SPSS para introducir datos de la siguiente boleta

    Identificador boleta: bm01

    Genero HM

    Educacion Formal aos

    Categoria laboral Directivo AdministrativoSeguridad

    Experiencia previa meses

    Filiacion politica sino

    Salario actual U$

    Salacio inicial U$

    GeneroEducacion formal

    (Aos)Categoria

    laboral

    Experiencia previa

    (meses)Filiacionpolitica

    Salario actual(U$)

    Salario inicial(U$)

    bm1 Hombre 15 Directivo 144 no $1,140.00 $540.00bm2 Hombre 16 Administrativo 36 no $804.00 $375.00bm3 Mujer 12 Administrativo 381 no $429.00 $240.00bm4 Mujer 8 Administrativo 190 no $438.00 $264.00bm5 Hombre 15 Administrativo 138 no $900.00 $420.00bm6 Hombre 15 Administrativo 67 no $642.00 $270.00bm7 Hombre 15 Administrativo 114 no $720.00 $375.00bm8 Mujer 12 Administrativo 0 no $438.00 $195.00bm9 Mujer 15 Administrativo 115 no $558.00 $255.00

    bm10 Mujer 12 Administrativo 244 no $480.00 $270.00

    DATOS ALCALDIA

  • 31/10/2013

    19

    Con datos de la alcalda, responder las siguientes preguntas

    1. Cual el porcentaje de trabajadores por categora laboral ?

    2. Existe una diferencia por genero en funcin de la categora laboral ?

    3. Hay diferencias por genero en cuanto al salario y la categora laboral ?

    Usar los datos del archivo Consumo_diesel

    En este archivo se cuenta con datos del consumo diario de diesel en 3 campamentos camineros, evaluar el comportamiento de esta variable en cuanto a los siguientes aspectos:

    a) Valor de la tendencia central

    b) Dispersin de los datos

    c) Valores extremos

    d) Forma de la distribucin

  • 31/10/2013

    20

    1 Cual el proyecto de su preferencia: Proyecto 1

    Proyecto 2

    Proyecto 3

    2 Ciudad en la que vive: Cochabamba

    La Paz

    Santa Cruz

    Anlisis de indepenencia de dos variables cualitativas (Archivo: AFCS_referendum)

    Prueba del Chi Cuadrado

    Indicar si hay independencia entre la preferencia por un proyecto y la ciudad en que vive

    Ho: El proyecto ES INDEPENDIENTE de la ciudad en que vive

    H1: El proyecto NO ES INDEPENDIENTE de la ciudad en que vive

  • 31/10/2013

    21

    Ho: El proyecto ES INDEPENDIENTE de la ciudad en que vive

    H1: El proyecto NO ES INDEPENDIENTE de la ciudad en que vive

    Que proyecto es mas o menos preferido por determinada ciudad ??

    Una respuesta al respecto es dada la tcnica del Anlisis Factorial de Correspondencias Simples (AFCS), que permite medir la dependencia entre las categoras de dos variables cualitativas.

    Regresin desde un punto de vista de inferenciausar archivo: dispersin _ oxigeno

    Profundidad(m)

    Oxigeno(mg/l)

    p1 15,00 5,50p2 20,00 5,30p3 30,00 4,00p4 40,00 3,00p5 50,00 2,50p6 60,00 1,40p7 70,00 ,50