Descripción de muestras
-
Upload
edgar-madrid -
Category
Education
-
view
231 -
download
0
Transcript of Descripción de muestras
Descripción de muestras y poblaciones
ParteI
MSc Edgar Madrid Cuello
Departamento de Matemática, UNISUCRE
Estadística I
2016
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 1 / 21
Distribución de frecuencias
De�nición
Una distribución de frecuencia es simplemente una presentación de lafrecuencia. Puede ser presentada en forma de tabla y/o mediante ungrá�co.
De�nición (Diagrama de Barras (barplot))
Este diagrama se emplea cuando la variable de estudio es categórica, estáconformado por barras rectangulares de longitudes proporcionales a losvalores representados. Los grá�cos de barras son usados para comparar doso más valores. Las barras pueden orientarse vertical u horizontalmente.
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 2 / 21
Distribución de frecuencias
De�nición
Una distribución de frecuencia es simplemente una presentación de lafrecuencia. Puede ser presentada en forma de tabla y/o mediante ungrá�co.
De�nición (Diagrama de Barras (barplot))
Este diagrama se emplea cuando la variable de estudio es categórica, estáconformado por barras rectangulares de longitudes proporcionales a losvalores representados. Los grá�cos de barras son usados para comparar doso más valores. Las barras pueden orientarse vertical u horizontalmente.
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 2 / 21
Distribución de frecuencias
De�nición
Una distribución de frecuencia es simplemente una presentación de lafrecuencia. Puede ser presentada en forma de tabla y/o mediante ungrá�co.
De�nición (Diagrama de Barras (barplot))
Este diagrama se emplea cuando la variable de estudio es categórica, estáconformado por barras rectangulares de longitudes proporcionales a losvalores representados. Los grá�cos de barras son usados para comparar doso más valores. Las barras pueden orientarse vertical u horizontalmente.
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 2 / 21
Ejemplo
Canis lupusEn la siguiente tabla se muestran las tres razas de perros más comunes ennuestro municipio:
Raza de perros
Raza Frecuencia
Labrador 40
Dóberman 25
Chaw Chaw 18
Total 83
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 3 / 21
Figure: Diagrama de Barras
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 4 / 21
Figure: Diagrama de Pastel
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 5 / 21
De�nición (Diagramas de puntos)
Es un grá�co sencillo que se puede utilizar para mostrar la distribución deuna variable numérica cuando el tamaño de la muestra es pequeño. Pararealizar un diagrama de puntos, se dibuja una recta numérica que abarqueel intervalo de los datos y después se pone un punto sobre la línea numéricaen el lugar correspondiente a cada observación.
Cuando dos o más observaciones tienen el mismo valor, se sitúan lospuntos del diagrama de barras uno encima de otro. Esto produce un efectosimilar al de las barras en un diagrama de barras.
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 5 / 21
De�nición (Diagramas de puntos)
Es un grá�co sencillo que se puede utilizar para mostrar la distribución deuna variable numérica cuando el tamaño de la muestra es pequeño. Pararealizar un diagrama de puntos, se dibuja una recta numérica que abarqueel intervalo de los datos y después se pone un punto sobre la línea numéricaen el lugar correspondiente a cada observación.
Cuando dos o más observaciones tienen el mismo valor, se sitúan lospuntos del diagrama de barras uno encima de otro. Esto produce un efectosimilar al de las barras en un diagrama de barras.
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 5 / 21
De�nición (Diagramas de puntos)
Es un grá�co sencillo que se puede utilizar para mostrar la distribución deuna variable numérica cuando el tamaño de la muestra es pequeño. Pararealizar un diagrama de puntos, se dibuja una recta numérica que abarqueel intervalo de los datos y después se pone un punto sobre la línea numéricaen el lugar correspondiente a cada observación.
Cuando dos o más observaciones tienen el mismo valor, se sitúan lospuntos del diagrama de barras uno encima de otro. Esto produce un efectosimilar al de las barras en un diagrama de barras.
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 5 / 21
Ejemplo
La Tabla 2.2.3 muestra la tasa de mortalidad infantil (muertes infantilespor cada 100 nacimientos vivos) en 12 países de Sudamérica en 2009. Ladistribución se muestra en la Figura
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 6 / 21
De�nición (Histograma)
Si creamos barras en vez de pilas de puntos, entonces tenemos unhistograma. Un histograma es como un diagrama de barras, exceptoporque un histograma muestra una variable numérica, lo que signi�ca quehay un orden natural y una escala para la variable.
En un diagrama de barras el espacio entre las barras (si existe) esarbitrario, ya que los datos que se muestran son categóricos. En unhistograma, la escala de la variable determina la situación de las barras.
El ejemplo que sigue muestra un diagrama de puntos y un histograma de
una distribución de frecuencias.
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 7 / 21
De�nición (Histograma)
Si creamos barras en vez de pilas de puntos, entonces tenemos unhistograma. Un histograma es como un diagrama de barras, exceptoporque un histograma muestra una variable numérica, lo que signi�ca quehay un orden natural y una escala para la variable.
En un diagrama de barras el espacio entre las barras (si existe) esarbitrario, ya que los datos que se muestran son categóricos. En unhistograma, la escala de la variable determina la situación de las barras.
El ejemplo que sigue muestra un diagrama de puntos y un histograma de
una distribución de frecuencias.
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 7 / 21
De�nición (Histograma)
Si creamos barras en vez de pilas de puntos, entonces tenemos unhistograma. Un histograma es como un diagrama de barras, exceptoporque un histograma muestra una variable numérica, lo que signi�ca quehay un orden natural y una escala para la variable.
En un diagrama de barras el espacio entre las barras (si existe) esarbitrario, ya que los datos que se muestran son categóricos. En unhistograma, la escala de la variable determina la situación de las barras.
El ejemplo que sigue muestra un diagrama de puntos y un histograma de
una distribución de frecuencias.
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 7 / 21
De�nición (Histograma)
Si creamos barras en vez de pilas de puntos, entonces tenemos unhistograma. Un histograma es como un diagrama de barras, exceptoporque un histograma muestra una variable numérica, lo que signi�ca quehay un orden natural y una escala para la variable.
En un diagrama de barras el espacio entre las barras (si existe) esarbitrario, ya que los datos que se muestran son categóricos. En unhistograma, la escala de la variable determina la situación de las barras.
El ejemplo que sigue muestra un diagrama de puntos y un histograma de
una distribución de frecuencias.
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 7 / 21
Ejemplo (Tamaño de camada de cerdas)
Un grupo de 32 cerdas de 2 años de edad de la misma raza (3/4 Duroc,1/4 Yorkshire) se aparearon con cerdos Yorkshire. Se apuntó el número decochinillos supervivientes de cada cerda tras 21 días. Los resultados semuestran en la Tabla 2.2.4 y en forma grá�ca
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 8 / 21
De�nición (Frecuencia relativa)
A veces es conveniente utilizar una escala de frecuencia relativa
frecuencia relativa =Frecuencia
n
Ejemplo (Color de �ores)
Color Frecuencia F relativa %
Rojo 108
Rosa 34
Blanco 40
Total
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 9 / 21
De�nición (Frecuencia relativa)
A veces es conveniente utilizar una escala de frecuencia relativa
frecuencia relativa =Frecuencia
n
Ejemplo (Color de �ores)
Color Frecuencia F relativa %
Rojo 108
Rosa 34
Blanco 40
Total
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 9 / 21
En los ejemplos anteriores, las distribuciones de frecuencia simples sin
agrupar han proporcionado resúmenes concisos de los datos. En muchos
conjuntos de datos, es necesario agrupar dichos datos para condensar la
información adecuadamente. (Generalmente, esto sucede en el caso de
variables continuas). El ejemplo que sigue muestra una distribución de
frecuencias agrupadas.
Ejemplo (CFK en el suero)
La creatina fosfoquinasa es una enzima relacionada con las funciones de losmúsculos y del cerebro. Como parte de un estudio para determinar lavariación natural de concentración de CFK, se extrajo sangre de 36voluntarios varones. La Tabla 2.2.6 muestra sus concentraciones en suerode CFK (medidas en U/l).
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 10 / 21
En los ejemplos anteriores, las distribuciones de frecuencia simples sin
agrupar han proporcionado resúmenes concisos de los datos. En muchos
conjuntos de datos, es necesario agrupar dichos datos para condensar la
información adecuadamente. (Generalmente, esto sucede en el caso de
variables continuas). El ejemplo que sigue muestra una distribución de
frecuencias agrupadas.
Ejemplo (CFK en el suero)
La creatina fosfoquinasa es una enzima relacionada con las funciones de losmúsculos y del cerebro. Como parte de un estudio para determinar lavariación natural de concentración de CFK, se extrajo sangre de 36voluntarios varones. La Tabla 2.2.6 muestra sus concentraciones en suerode CFK (medidas en U/l).
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 10 / 21
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 11 / 21
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 12 / 21
Interpretación de las áreas en un histograma
Un histograma se puede ver de dos formas. La parte superior de las barras
esboza la forma de la distribución. Pero las áreas dentro de las barras
tienen también un signi�cado. El área de cada barra es proporcional a la
correspondiente frecuencia. Por tanto, el área de una o varias barras se
puede interpretar que expresa el número de observaciones en las clases
representadas por las barras.
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 13 / 21
Interpretación de las áreas en un histograma
Un histograma se puede ver de dos formas. La parte superior de las barras
esboza la forma de la distribución. Pero las áreas dentro de las barras
tienen también un signi�cado. El área de cada barra es proporcional a la
correspondiente frecuencia. Por tanto, el área de una o varias barras se
puede interpretar que expresa el número de observaciones en las clases
representadas por las barras.
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 13 / 21
Interpretación de las áreas en un histograma
Un histograma se puede ver de dos formas. La parte superior de las barras
esboza la forma de la distribución. Pero las áreas dentro de las barras
tienen también un signi�cado. El área de cada barra es proporcional a la
correspondiente frecuencia. Por tanto, el área de una o varias barras se
puede interpretar que expresa el número de observaciones en las clases
representadas por las barras.
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 13 / 21
Interpretación de las áreas en un histograma
Un histograma se puede ver de dos formas. La parte superior de las barras
esboza la forma de la distribución. Pero las áreas dentro de las barras
tienen también un signi�cado. El área de cada barra es proporcional a la
correspondiente frecuencia. Por tanto, el área de una o varias barras se
puede interpretar que expresa el número de observaciones en las clases
representadas por las barras.
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 13 / 21
Interpretación de las áreas en un histograma
Un histograma se puede ver de dos formas. La parte superior de las barras
esboza la forma de la distribución. Pero las áreas dentro de las barras
tienen también un signi�cado. El área de cada barra es proporcional a la
correspondiente frecuencia. Por tanto, el área de una o varias barras se
puede interpretar que expresa el número de observaciones en las clases
representadas por las barras.
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 13 / 21
Ejemplo
Por ejemplo, la Figura 4 muestra un histograma de la distribución de CFK.El área sombreada es el 42% del área total de todas las barras. De acuerdocon esto, el 42% de los valores de CFK están en las clases correspondientes.Es decir, 15 de 36 o el 42% de los valores están entre 60 U/l y 100 U/l.
Figure: 4
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 14 / 21
Ejemplo
Por ejemplo, la Figura 4 muestra un histograma de la distribución de CFK.El área sombreada es el 42% del área total de todas las barras. De acuerdocon esto, el 42% de los valores de CFK están en las clases correspondientes.Es decir, 15 de 36 o el 42% de los valores están entre 60 U/l y 100 U/l.
Figure: 4
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 14 / 21
Formas de distribuciones La forma de una distribución se
puede indicar mediante una curva suave que se aproxime al histograma,
como se muestra en la Figura 5.
Figure: 5 Aproximación al histograma mediante una curva suave
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 15 / 21
Una forma común para datos biológicos es la unimodal, y está sesgada a
la derecha
Figure: 6 Unimodal sesgada a la derecha
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 16 / 21
Aparecen también distribuciones con forma aproximada de campana,
Figure: 7 Simétrica acampanada
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 17 / 21
Algunas veces una distribución es simétrica, pero se diferencia de una
campana porque tiene colas largas,
Figure: 8 Simétrica pero no acampanada
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 18 / 21
Las formas sesgadas hacia la izquierda (�g. 9) y exponencial (�g. 10) son
menos comunes.
Figure: 9. Sesgada a la izquierda
Figure: 10. Exponencial
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 19 / 21
La bimodalidad. como en (11), puede indicar la existencia de dos
subgrupos distintos de unidades observacionales.
Figure: 11. Bimodal
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 20 / 21
Ejemplo (Peso del cerebro)
En 1888, P. Topinard publicó datos sobre los pesos de los cerebros decientos de hombres y mujeres franceses.
Figure: 12
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 21 / 21
Figure: 13MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 22 / 21