2- Medidas de Tendencia Central y Dispersion

download 2- Medidas de Tendencia Central y Dispersion

of 44

Transcript of 2- Medidas de Tendencia Central y Dispersion

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    1/44

    MEDIDAS DE TENDENCIA CENTRAL

    Se utilizan cuando la variable es numrica

    La mayora de los conjuntos de datos de este tipo devariables tienden a agruparse en un punto central.

    Son tiles para describir de manera ms sinttica losdatos obtenidos y para poder comparar de forma ms

    precisa y eficiente las observaciones realizadas de dos

    o ms conjuntos de datos.

    Para cualquier conjunto de datos,

    es posible calcular una medida de

    tendencia central que represente

    el conjunto de estos datos

    Media

    Mediana

    Modo

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    2/44

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    3/44

    Media : suma de todas las observaciones

    dividido el nmero de observacionesEjemplo: nmero de visitas al ao

    por paciente

    13 7 9 15 11 2 4 4 4 7 9 6 6 5 (N=14)

    Media = 102 / 14 = 7.28

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    4/44

    Cuando los datos son agrupados

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    5/44

    Para estimarla:

    a) Ordenar los datos de menor a mayor

    2 4 4 4 5 6 6 7 7 9 9 11 13 15

    b) Observar posicin n + 1 / 2, es decir

    14 + 1 / 2 = 7.5

    La mediana estar entre las observaciones 7 y 8 ( porque da 7.5)

    Aqu seria entre los nmeros 6 y 7, (6+7)/2 = 6.5 visitas al ao

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    6/44

    Y qu diferencia hay entre media y

    mediana, la mediana es menos sensible a

    valores extremos

    Grupo A (visitas/ao)

    13 7 9 15 11 2 4 4 4 7 9 6 6 5

    Media = 7.28, Mediana = 6.5

    Grupo B (visitas/ao) 30 7 9 15 11 2 4 4 4 7 9 6 6 5

    Media = 8.5, Mediana = 6.5

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    7/44

    MEDIDAS DE TENDENCIA CENTRAL

    24 24 24 25 7526 26

    Edades de un grupo de egresados de la carrera de Sicologa

    Media

    Mediana

    Modo

    Medida Valor Comentarios

    32

    Es el valor que ms se presenta con mayor

    frecuencia en el conjunto de datos

    Si existen valores extremos, la media no es la

    medida ms representativa del conjunto de datos.Es la medida ms representativa en

    distribuciones simtricas

    25

    24

    Es la medida ms representativa cuando existen

    valores extremos De mayor utilidad para

    distribuciones asimtricas

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    8/44

    MEDIDAS DE ORDEN

    PercentilesCuartiles

    Son valores que dividen al

    conjunto de datos, dejando

    por debajo de ellos

    determinados porcentajes

    Son tres valores (Q1, Q2 y Q3),

    que dividen al conjunto de

    datos en cuatro partes iguales

    Q1 = P25 El 25 % de los datos quedan por debajo

    de este valorMediana = Q2 = P50 El 50 % de los datos quedan por debajo

    de este valor

    Q3 = P 75 El 75 % de los datos quedan por debajo

    de este valor

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    9/44

    Los cuartilos dividen en cuatro

    partes a la distribucin P25 = 1er cuartil, P50 = 2do cuartil o mediana,

    P 75= 3er cuartil , P100 =4to cuartil

    Q1 = (n+1)/4

    Q2 = (n+1)/2

    Q3 = Q1*3

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    10/44

    Varianza y desvo estndar

    Representan la dispersin de los datos

    alrededor de la media aritmtica.

    Resulta de restar cada observacin a la

    media y se obtiene el cuadrado de ladistancia promedio entre cada valor y la

    media de la distribucin

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    11/44

    Varianza poblacional y varianza

    muestral Se utilizan las medias

    De la muestra o de la

    Poblacin

    Principal problema: lainterpretacin del cuadrado deuna medida

    Importante para el anlisis de ladiferencias entre y dentro dedistribuciones: Anlisis deVarianza

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    12/44

    Pero qu significa una medida de

    dispersin el cuadrado? Para volver las unidades originales de

    medicin calculamos la raiz cuadrada de la

    varianza y obtenemos el Desvo Estndar

    Por ejemplo: 7.8 visitas +/- 3.7 Ds

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    13/44

    Desviacion estandar de una

    distribucin muestral y poblacional

    Muestral

    poblacional

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    14/44

    Qu significa que el percentilo 45 es = 24?

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    15/44

    Coeficiente de variacin

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    16/44

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    17/44

    MEDIDAS DE DISPERSION

    Rango

    Rango

    IC

    DesvoEstndar

    Medida Clculo ComentariosDiferencia entre el

    valor mayor y el

    menor

    Mide la dispersin de datos

    alrededor de la media.

    Por lo menos el 75% de losdatos quedan siempre entre la

    media menos

    2 DE y la media ms 2 DE.

    Se basa en slo dos valores que

    pueden ser muy extremos.

    Diferencia entre

    Q3-Q1

    Ver frmula

    Representa la distancia entre los

    valores entre los cuales se halla

    el 50% central de los datos

    Se utilizan para determinar como se distribuyen los datos

    alrededor de las medidas de tendencia central

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    18/44

    RESUMEN DE LOS DATOS DE

    ACUERDO AL TIPO DE VARIABLE

    Numrica Ordinal Nominal

    Medidas

    de frecuencia

    Medidas de

    tendencia

    central

    Medidas de

    dispersin

    Proporciones

    Porcentajes

    Razones

    Tasas

    Proporciones

    Porcentajes

    Razones

    TasasMedia

    Mediana

    Modo

    Mediana

    ModoModo

    Percentiles

    CuartilesRango

    Rango IC

    DE/Varianza

    Medidas de

    orden

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    19/44

    Amplitud o rango

    Diferencia entre el menor y mayor valor de

    una distribucin:

    7 8 9 10 11 12 ., rango = 7-12 = 5

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    20/44

    Como calcular con epi info ?

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    21/44

    Observar:

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    22/44

    Distribucin normal

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    23/44

    Caractersticas de la curva normal

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    24/44

    La distribucin normal, tambin

    llamada distribucin de Gauss o

    distribucin gaussiana, es la

    distribucin de probabilidad que con msfrecuencia aparece en estadstica y teora

    de probabilidades. Esto se debe a dos

    razones fundamentalmente:

    http://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_probabilidadhttp://es.wikipedia.org/wiki/Estad%C3%ADsticahttp://es.wikipedia.org/wiki/Teor%C3%ADa_de_probabilidadeshttp://es.wikipedia.org/wiki/Teor%C3%ADa_de_probabilidadeshttp://es.wikipedia.org/wiki/Teor%C3%ADa_de_probabilidadeshttp://es.wikipedia.org/wiki/Teor%C3%ADa_de_probabilidadeshttp://es.wikipedia.org/wiki/Estad%C3%ADsticahttp://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_probabilidad
  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    25/44

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    26/44

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    27/44

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    28/44

    Su funcin de densidad es simtrica y con forma de

    campana, lo que favorece su aplicacin como modelo a

    gran nmero de variables estadsticas.

    Es, adems, lmite de otras distribuciones y aparecerelacionada con multitud de resultados ligados a la teora

    de las probabilidades gracias a sus propiedades

    matemticas.

    http://es.wikipedia.org/wiki/Funci%C3%B3n_de_densidadhttp://es.wikipedia.org/wiki/Matem%C3%A1ticashttp://es.wikipedia.org/wiki/Matem%C3%A1ticashttp://es.wikipedia.org/wiki/Funci%C3%B3n_de_densidad
  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    29/44

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    30/44

    Asimetra

    Adems de la posicin y la dispersin de un

    conjunto de datos, es comn usar medidas deforma en la descripcin. Una de estas medidas

    es una estadstica que busca expresar la

    simetra ( o falta de ella ) que manifiestan los

    datos.

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    31/44

    Kurtosis

    Leptocurtica

    Mesocurtica

    Platicurtica

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    32/44

    Hay test adems de la vista

    grfica para determinar asimetra Veremos con SPSS y con Stata como

    determinarlo

    Epi info no permite

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    33/44

    Parmetros y estadsticos

    Supongamos que estamos interesados en

    determinar la prevalencia de Diabetes en la

    ciudad de Mar del Plata

    Es factible?

    Conoceremos la prevalencia en toda la

    poblacin?

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    34/44

    Parmetro

    Cantidad calculada sobre una poblacin

    Reunimos toda la informacion

    Estadstico

    Cantidad calculada sobre una muestra de lapoblacin

    Muestra representativa?

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    35/44

    La muestra, el error

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    36/44

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    37/44

    Investigaciones epidemiolgicas

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    38/44

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    39/44

    (1-p)

    Para medias

    Para

    proporciones

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    40/44

    Intervalo de confianza

    Con qu certeza estoy afirmando lo que

    estoy afirmando?

    Es decir, una vez obtenido un valor a partirde una muestra.con qu confianza puedo

    afirmar que el verdadero parmetro

    (poblacin) est incluido en la estimamuestral?

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    41/44

    Para medias

    prevalencias (1-p)

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    42/44

    El error estndar nos dice como varan los

    promedios de las diversas muestras tomadas de la

    misma poblacin respecto del promedio de lospromedios (mide el desvo de los promedios

    respecto del gran promedio o gran media)

    El desvo estndar nos dice como vara cada

    observacin individual respecto del promedio deuna muestra (mide el desvio de las observaciones

    individuales respecto del promedio)

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    43/44

    Intervalo de confianza y curva normalEn esta distribucin normal de medias se puede calcular el

    intervalo de conf ianza donde se encontrar la mediapoblacional si slo se conoce una media muestral, con

    una confianza determinada. Habitualmente se manejan

    valores de confianza del 95% y 99%. A este valor se le

    llamar 1 (debido a que es el error que se cometer).

    P ll it l l l t X / 2 j

  • 7/24/2019 2- Medidas de Tendencia Central y Dispersion

    44/44

    Para ello se necesita calcular el punto X / 2 o mejor

    dicho su versin estandarizada Z / 2junto con su

    "opuesto en la distribucin" X / 2. Estos puntos

    delimitan la probabilidad para el intervalo, como semuestra en la siguiente imagen:

    Recordando la tabla de

    reas bajo la curva

    normal

    Aproximaciones para el valor Z / 2 para los niveles de

    confianza estndar son 1,96 para 1 = 95% y 2,576

    para 1 = 99%.