Medidas de Dispersión

6
Bioestadística Consideraciones Teóricas Medidas de dispersión A continuación se presentan los indicadores más frecuentes para medir la dispersión de una variable estadística. Rango o Amplitud = Valor máximo de la muestra – Valor mínimo de la muestra. Recorrido intercuartílico = RiQ = Q 3 – Q 1 Varianza: para datos agrupados para datos sin agrupar Desviación estándar = Coeficiente de variación Cv(X) = Todos estos indicadores intentan dar cuenta de la dispersión que en una muestra (en una población) presenta la variable X. Las más sencillas de calcular tienen ciertas limitaciones, por lo que en general se prefiere el cálculo de la varianza y de los indicadores derivados de la varianza (desviación estándar y coeficiente de variación). El rango o amplitud mide la diferencia entre los valores máximo (M) y mínimo (m) observados en la muestra. Cuanto más grande la amplitud, mayor la dispersión. Tiene como limitación principal el hecho de no tomar en cuenta el peso de los diferentes valores observados. CASO 1 CASO 2 Profesora: Mª Elisa Rodríguez Infanzón

description

probabilidad y estadistica

Transcript of Medidas de Dispersión

BioestadsticaConsideraciones TericasMedidas de dispersinAcontinuacin se presentan los indicadores ms frecuentes para medir ladispersin de una variable estadstica.Rango o Amplitud = Valor mximo de la muestra Valor mnimo de la muestra.Recorrido intercuartlico = RiQ = Q3 Q

Varian!a" 2s = 2( ) .( )i iX X fX para datos agrupados 2s =nX Xnii =12) (para datos sin agrupar#esviacin estndar =s =2s$oeficiente de variacin$v%&' = sx(odos estos indicadores intentan dar cuenta de la dispersin )ue en una muestra%en una poblacin' presenta la variable &. *as ms sencillas de calcular tienen ciertaslimitaciones+ por lo)ueengeneral seprefiereel clculodelavarian!a,delosindicadores derivados de la varian!a %desviacin estndar , coeficiente de variacin'.-l rango o amplitud mide la diferencia entre los valores mximo %.' , mnimo %m'observados en la muestra. $uanto ms grande la amplitud+ ma,or la dispersin. (ienecomolimitacinprincipal el /ec/o de no tomar encuentael peso delos diferentesvalores observados.$A01 $A012m. m.#e acuerdo con elrango+ la distribucin del $A01 2 es bastante ms dispersa)ue la distribucin del$A01 + cuando en realidad+slo tienen diferente una 3nicaobservacin.4rofesora" .5 -lisa Rodrgue! 6nfan!nBioestadsticaConsideraciones Tericas-lrecorrido intercuartlico muestra la amplitud del intervalo )ue contiene el 78 9deladistribucinubicadaenel centrodelamisma. $uantomsgrande+ ma,orladispersin de la muestra+ pues se re)uiere un intervalo ms amplio para abarcar al789 central de la distribucin. -l rango intercuartlico+ como la amplitud+ se mide en lamismaunidaddemedidadelavariable+ lo)uedificultalacomparacinentredosvariables )ue se miden en unidades diferentes.*a varianzamide la dispersin respecto del promedio. $ada valor de la muestrase compara con elpromedio+se /ace la resta , la diferencia se eleva alcuadrado.*uego se promedian todas estas diferencias cuadrticas. 0e eleva alcuadrado paraevitar )ue las diferencias en ms , en menos se compensen. Al elevar al cuadrado+ lavarian!anopuedeser negativa+ ,estantomsgrandecuantoma,oressonlasdiferencias cuadrticas. *a varian!a no puede ser negativa por)ue resulta depromediar cuadrados perfectos. :-n )u; caso la varian!a podra dar cero< $uando ladistribucinesttotalmenteconcentradaenun3nicopunto+ entonces X Xi= paratodo i+ , la suma da cero. -ntonces+ una varian!a nula indica ausencia de dispersin.4or el contrario+ ama,or varian!a+ ma,or ladispersinalrededor del promedio. -lprincipal inconvenientedelavarian!a+ comoindicador dedispersin+ essudifcilinterpretacin+ por cuantosemideenunidadesdelavariableal cuadrado. 0i lavariable mide materias aprobadas+ entonces la varian!a se mide en materiasaprobadas al cuadrado.4ara levantar esta limitacin+ se define la desviacin estndar o desviacin tpica+como la ra! cuadrada de la varian!a. *a desviacin estndar tiene una interpretacininteresante. -ndistribucionesunimodales,aproximadamentesim;tricas%veremosms adelante'+ tales como la distribucin =ormal+ se cumplen las siguientes relacionesempricas">recuencia acumulada de la muestra alrededor del promedio-ntreX ? 0 ,X @ 0 AB9-ntreX ? 2.0 ,X @ 2.0 C79-ntreX ? 3.0 ,X @ 3.0 CC9>inalmente+ alosefectosdecompararladispersindedosdistribucionesconposicionesbiendiferentes%mediasbiendiferentes+ comopuedenser losaDosdeeducacin formal de los alumnos de un curso , los das de estada de los pacientes enun/ospital' peroacondicin )uelas variables solotomenvalores positivos+ elindicador de dispersin recomendado es el $oeficiente de Variacin"4rofesora" .5 -lisa Rodrgue! 6nfan!nBioestadsticaConsideraciones Tericas$v%&' = XX S ) (-xpresa la dispersin con relacin a la media en t;rminos de la propia media. Aun)ueno /a, un lmite superior para el coeficiente de variacin+ es raro encontrardistribuciones cu,o $v supere +2mientras )ue valores cercanos a cero tales como8+87+ 8+8 8+7 indican )ue se trata de distribuciones mu, poco dispersas+distribuciones mu, concentradas alrededor de la media. -Eemplo" 0e tiene unamuestra de 288 pacientes internados en un sanatorio. *os pacientes responden pordos variables" & = =3mero de das de internacin+ F = =3mero de veces )ue /abansido /ospitali!ados con anterioridad.& /%&' F /%F'23G7A8+88+288+G88+288+88

23G88+388+G88+288+878+8G8+8+88 +88:$uldelas dosdistribuciones esmsdispersa