Tarea N° 3 Confiabilidad Estadistica

19
Maestría en Ingeniería Geotécnica: Curso: Análisis Estadístico; Tarea N° 3, 14 de Mayo de 2014, Universidad Tecnológica de Panamá, Panamá 1 ¿Qué es la Estadística? y ¿Cuáles son sus Médicas Estadísticas? FERNANDO AYAX ALVARADO SAAVEDRA Facultad de Ingeniería Civil, Universidad Tecnológica de Panamá, Vía Centenario, Panamá. E-mail: [email protected] 1 Definición de la Estadística: La estadística es una ciencia formal y una herramienta que estudia el uso y los análisis provenientes de una muestra representativa de datos, busca explicar las correlaciones y dependencias de un fenómeno físico o natural, de ocurrencia en forma aleatoria o condicional. Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales, desde las ciencias de la salud hasta el control de calidad. Se usa para la toma de decisiones en áreas de negocios o instituciones gubernamentales. La estadística se divide en dos grandes áreas: La estadística descriptiva, se dedica a la descripción, visualización y resumen de datos originados a partir de los fenómenos de estudio. Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos de parámetros estadísticos son: la media y la desviación estándar. Algunos ejemplos gráficos son: histograma, pirámide poblacional, gráfico circular, entre otros. La estadística inferencial, se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas sí/no (prueba de hipótesis), estimaciones de unas características numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o modelamiento de relaciones entre variables (análisis de regresión). Otras técnicas de modelamiento incluyen anova, series de tiempo y minería de datos.

description

Tarea de Maestría

Transcript of Tarea N° 3 Confiabilidad Estadistica

  • Maestra en Ingeniera Geotcnica: Curso: Anlisis Estadstico; Tarea N 3, 14 de Mayo de 2014,

    Universidad Tecnolgica de Panam, Panam

    1

    Qu es la Estadstica? y Cules son sus Mdicas

    Estadsticas?

    FERNANDO AYAX ALVARADO SAAVEDRA

    Facultad de Ingeniera Civil, Universidad Tecnolgica de Panam, Va Centenario,

    Panam.

    E-mail: [email protected]

    1 Definicin de la Estadstica:

    La estadstica es una ciencia formal y una herramienta que estudia el uso y los anlisis provenientes de una muestra representativa de datos, busca explicar las correlaciones y dependencias de un fenmeno fsico o natural, de ocurrencia en forma aleatoria o condicional.

    Es transversal a una amplia variedad de disciplinas, desde la fsica hasta las ciencias sociales, desde las ciencias de la salud hasta el control de calidad.

    Se usa para la toma de decisiones en reas de negocios o instituciones gubernamentales.

    La estadstica se divide en dos grandes reas:

    La estadstica descriptiva, se dedica a la descripcin, visualizacin y resumen de datos originados a partir de los fenmenos de estudio. Los datos pueden ser resumidos numrica o grficamente. Ejemplos bsicos de parmetros estadsticos son: la media y la desviacin estndar. Algunos ejemplos grficos son: histograma, pirmide poblacional, grfico circular, entre otros.

    La estadstica inferencial, se dedica a la generacin de los modelos, inferencias y predicciones asociadas a los fenmenos en cuestin teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la poblacin bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas s/no (prueba de hiptesis), estimaciones de unas caractersticas numricas (estimacin), pronsticos de futuras observaciones, descripciones de asociacin (correlacin) o modelamiento de relaciones entre variables (anlisis de regresin). Otras tcnicas de modelamiento incluyen anova, series de tiempo y minera de datos.

  • Maestra en Ingeniera Geotcnica: Curso: Anlisis Estadstico; Tarea N 3, 14 de Mayo de 2014,

    Universidad Tecnolgica de Panam, Panam

    2

    Ambas ramas (descriptiva e inferencial) comprenden la estadstica aplicada.

    Hay tambin una disciplina llamada estadstica matemtica, la que se refiere a las bases tericas de la materia.

    La palabra estadsticas tambin se refiere al resultado de aplicar un algoritmo estadstico a un conjunto de datos, como en estadsticas econmicas, estadsticas criminales, entre otros.

    La Estadstica trata del recuento, ordenacin y clasificacin de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones.

    Un estudio estadstico consta de las siguientes fases:

    Recogida de datos.

    Organizacin y representacin de datos.

    Anlisis de datos.

    Obtencin de conclusiones.

  • Maestra en Ingeniera Geotcnica: Curso: Anlisis Estadstico; Tarea N 3, 14 de Mayo de 2014,

    Universidad Tecnolgica de Panam, Panam

    3

    Conceptos de Estadstica:

    Poblacin: Una poblacin es el conjunto de todos los elementos a los que se somete a un estudio estadstico.

    Individuo: Un individuo o unidad estadstica es cada uno de los elementos que componen la poblacin.

    Muestra: Una muestra es un conjunto representativo de la poblacin de referencia, el nmero de individuos de una muestra es menor que el de la poblacin.

    Muestreo: El muestreo es la reunin de datos que se desea estudiar, obtenidos de una proporcin reducida y representativa de la poblacin.

    Valor: Un valor es cada uno de los distintos resultados que se pueden obtener en un estudio estadstico. Si lanzamos una moneda al aire 5 veces obtenemos dos valores: cara y cruz.

    Dato: Un dato es cada uno de los valores que se ha obtenido al realizar un estudio estadstico. Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz.

    Una variable estadstica es cada una de las caractersticas o cualidades que poseen los individuos de una poblacin.

    Tipos de variable estadsticas:

    Variable cualitativa: Las variables cualitativas se refieren a caractersticas o cualidades que no pueden ser medidas con nmeros. Podemos distinguir dos tipos:

    Variable cualitativa nominal: Una variable cualitativa nominal presenta modalidades no numricas que no admiten un criterio de orden. Ejemplo: El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo.

    Variable cualitativa ordinal o variable cuasicuantitativa: Una variable cualitativa ordinal presenta modalidades no numricas, en las que existe un orden. Ejemplo: La nota en un examen: suspenso, aprobado, notable, sobresaliente. Puesto conseguido en una prueba

  • Maestra en Ingeniera Geotcnica: Curso: Anlisis Estadstico; Tarea N 3, 14 de Mayo de 2014,

    Universidad Tecnolgica de Panam, Panam

    4

    deportiva: 1, 2, 3, ... Medallas de una prueba deportiva: oro, plata, bronce.

    Variable cuantitativa: Una variable cuantitativa es la que se expresa mediante un nmero, por tanto se pueden realizar operaciones aritmticas con ella. Podemos distinguir dos tipos:

    o Variable discreta: Una variable discreta es aquella que toma valores aislados, es decir no admite valores intermedios entre dos valores especficos. Ejemplo: El nmero de hermanos de 5 amigos: 2, 1, 0, 1, 3.

    o Variable continua: Una variable continua es aquella que puede tomar valores comprendidos entre dos nmeros. Ejemplo: La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75. En la prctica medimos la altura con dos decimales, pero tambin se podra dar con tres decimales.

    2 Medidas Estadsticas:

  • Maestra en Ingeniera Geotcnica: Curso: Anlisis Estadstico; Tarea N 3, 14 de Mayo de 2014,

    Universidad Tecnolgica de Panam, Panam

    5

  • Maestra en Ingeniera Geotcnica: Curso: Anlisis Estadstico; Tarea N 3, 14 de Mayo de 2014,

    Universidad Tecnolgica de Panam, Panam

    6

  • Maestra en Ingeniera Geotcnica: Curso: Anlisis Estadstico; Tarea N 3, 14 de Mayo de 2014,

    Universidad Tecnolgica de Panam, Panam

    7

  • Maestra en Ingeniera Geotcnica: Curso: Anlisis Estadstico; Tarea N 3, 14 de Mayo de 2014,

    Universidad Tecnolgica de Panam, Panam

    8

  • Maestra en Ingeniera Geotcnica: Curso: Anlisis Estadstico; Tarea N 3, 14 de Mayo de 2014,

    Universidad Tecnolgica de Panam, Panam

    9

  • Maestra en Ingeniera Geotcnica: Curso: Anlisis Estadstico; Tarea N 3, 14 de Mayo de 2014,

    Universidad Tecnolgica de Panam, Panam

    10

    Las medidas de dispersin nos informan sobre cunto se alejan del

    centro los valores de la distribucin.

    Las medidas de dispersin son:

    Rango o recorrido: El rango es la diferencia entre el mayor y el

    menor de los datos de una distribucin estadstica.

    Desviacin media: La desviacin respecto a la media es

    la diferencia entre cada valor de la variable estadstica y la media

    aritmtica.

    Di = x - x

    La desviacin media es la media aritmtica de los valores absolutos

    de las desviaciones respecto a la media.

    La desviacin media se representa por

  • Maestra en Ingeniera Geotcnica: Curso: Anlisis Estadstico; Tarea N 3, 14 de Mayo de 2014,

    Universidad Tecnolgica de Panam, Panam

    11

    Ejemplo

    Calcular la desviacin media de la distribucin:

    9, 3, 8, 8, 9, 8, 9, 18

    Desviacin media para datos agrupados

    Si los datos vienen agrupados en una tabla de frecuencias, la

    expresin de la desviacin media es:

    Calcular la desviacin media de la distribucin:

    x

    i

    f

    i

    xi

    fi

    |x

    -

    x|

    |x

    -

    x|

    fi

    [

    1

    0

    1

    2

    .

    3

    3

    7.

    5

    9.

    28

    6

    27

    .8

    58

  • Maestra en Ingeniera Geotcnica: Curso: Anlisis Estadstico; Tarea N 3, 14 de Mayo de 2014,

    Universidad Tecnolgica de Panam, Panam

    12

    ,

    1

    5

    )

    5

    [

    1

    5

    ,

    2

    0

    )

    1

    7

    .

    5

    5

    8

    7.

    5

    4.

    28

    6

    21

    .4

    3

    [

    2

    0

    ,

    2

    5

    )

    2

    2

    .

    5

    7

    1

    5

    7.

    5

    0.

    71

    4

    4.

    99

    8

    [

    2

    5

    ,

    3

    0

    )

    2

    7

    .

    5

    4

    1

    1

    0

    5.

    71

    4

    22

    .8

    56

    [

    3

    0

    ,

    3

    5

    )

    3

    2

    .

    5

    2 6

    5

    10

    .1

    74

    21

    .4

    28

    2

    1

    4

    5

    98

    .5

  • Maestra en Ingeniera Geotcnica: Curso: Anlisis Estadstico; Tarea N 3, 14 de Mayo de 2014,

    Universidad Tecnolgica de Panam, Panam

    13

    7.

    5

    7

    Varianza

    La varianza es la media aritmtica del cuadrado de las desviaciones

    respecto a la media de una distribucin estadstica.

    La varianza se representa por .

    Varianza para datos agrupados

    Para simplificar el clculo de la varianza vamos o utilizar las siguientes expresiones que

    son equivalentes a las anteriores.

    Varianza para datos agrupados

    Ejercicios de varianza

    (a) Calcular la varianza de la distribucin:

  • Maestra en Ingeniera Geotcnica: Curso: Anlisis Estadstico; Tarea N 3, 14 de Mayo de 2014,

    Universidad Tecnolgica de Panam, Panam

    14

    (i) 9, 3, 8, 8, 9, 8, 9, 18

    (b) Calcular la varianza de la distribucin de la tabla:

    xi fi

    xi

    fi

    xi2

    fi

    [10,

    20)

    1

    5 1 15 225

    [20,

    30)

    2

    5 8

    20

    0

    500

    0

    [30,4

    0)

    3

    5

    1

    0

    35

    0

    12

    250

    [40,

    50)

    4

    5 9

    40

    5

    18

    225

    [50,

    60

    5

    5 8

    44

    0

    24

    200

    [60,7

    0)

    6

    5 4

    26

    0

    16

    900

    [70,

    80)

    7

    5 2

    15

    0

    11

    250

    4

    2

    1

    82

    0

    88

    050

  • Maestra en Ingeniera Geotcnica: Curso: Anlisis Estadstico; Tarea N 3, 14 de Mayo de 2014,

    Universidad Tecnolgica de Panam, Panam

    15

    Propiedades de la varianza

    1 La varianza ser siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.

    2 Si a todos los valores de la variable se les suma un nmero la varianza no vara.

    3 Si todos los valores de la variable se multiplican por un nmero la varianza queda multiplicada por el cuadrado de

    dicho nmero.

    4 Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas se puede calcular lavarianza total.

    o Si todas las muestras tienen el mismo tamao:

    o Si las muestras tienen distinto tamao:

    Observaciones sobre la varianza

    1 La varianza, al igual que la media, es un ndice muy sensible a las puntuaciones extremas.

    2 En los casos que no se pueda hallar la media tampoco ser posible hallar la varianza.

    3 La varianza no viene expresada en las mismas unidades que los datos, ya que las desviaciones estn elevadas al cuadrado.

    Desviacin tpica

    La desviacin tpica es la raz cuadrada de la varianza.

  • Maestra en Ingeniera Geotcnica: Curso: Anlisis Estadstico; Tarea N 3, 14 de Mayo de 2014,

    Universidad Tecnolgica de Panam, Panam

    16

    Es decir, la raz cuadrada de la media de los cuadrados de las puntuaciones de desviacin.

    La desviacin tpica se representa por .

    Desviacin tpica para datos agrupados

    Para simplificar el clculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.

    Desviacin tpica para datos agrupados

    Ejercicios de desviacin tpica

    o Calcular la desviacin tpica de la distribucin:

    9, 3, 8, 8, 9, 8, 9, 18

    o Calcular la desviacin tpica de la distribucin de la tabla:

  • Maestra en Ingeniera Geotcnica: Curso: Anlisis Estadstico; Tarea N 3, 14 de Mayo de 2014,

    Universidad Tecnolgica de Panam, Panam

    17

    xi fi xi

    fi

    xi2

    fi

    [10,

    20)

    1

    5 1 15 225

    [20,

    30)

    2

    5 8

    20

    0

    500

    0

    [30,4

    0)

    3

    5

    1

    0

    35

    0

    12

    250

    [40,

    50)

    4

    5 9

    40

    5

    18

    225

    [50,

    60)

    5

    5 8

    44

    0

    24

    200

    [60,7

    0)

    6

    5 4

    26

    0

    16

    900

    [70,

    80)

    7

    5 2

    15

    0

    11

    250

    4

    2

    1

    82

    0

    88

    050

    Propiedades de la desviacin tpica

    o La desviacin tpica ser siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.

  • Maestra en Ingeniera Geotcnica: Curso: Anlisis Estadstico; Tarea N 3, 14 de Mayo de 2014,

    Universidad Tecnolgica de Panam, Panam

    18

    o Si a todos los valores de la variable se les suma un nmero la desviacin tpica no vara.

    o Si todos los valores de la variable se multiplican por un nmero la desviacin tpica queda multiplicada por dicho nmero.

    o Si tenemos varias distribuciones con la misma media y conocemos sus respectivas desviaciones tpicas se puede calcular la desviacin tpica total.

    Si todas las muestras tienen el mismo tamao:

    Si las muestras tienen distinto tamao:

    Observaciones sobre la desviacin tpica

    o La desviacin tpica, al igual que la media y la varianza, es un ndice muy sensible a las puntuaciones extremas.

    o En los casos que no se pueda hallar la media tampoco ser posible hallar la desviacin tpica.

    o Cuanta ms pequea sea la desviacin tpica mayor ser la concentracin de datos alrededor de la media.

  • Maestra en Ingeniera Geotcnica: Curso: Anlisis Estadstico; Tarea N 3, 14 de Mayo de 2014,

    Universidad Tecnolgica de Panam, Panam

    19

    3 Referencias:

    http://www.ceibal.edu.uy/contenidos/areas_conocimiento/mat/estadisti

    ca/qu_es_la_estadstica.html

    http://es.wikipedia.org/wiki/Estad%C3%ADstica

    http://www.vitutor.com/estadistica/descriptiva/a_2.html

    http://www.slideshare.net/marcoyacila/medidas-estadsticas