Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística...

87
Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadístic a (Bioestadística) [email protected] l

Transcript of Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística...

Page 1: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Felipe Sepúlveda LópezBiólogo Marino

Estadística Biología Marina 2003

Estadística (Bioestadística)

Estadística (Bioestadística)

[email protected]

Page 2: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Sobre mi…Sobre mi…

• No soy un estadístico.»Tesis 2002 en…»Magíster en Cs. del Mar…

• El énfasis del curso esta en la práctica de la herramienta estadística y no en los teoremas y demostraciones.

Estadística Biología Marina 2003

Page 3: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

¿Porque deberíamos saber ¿Porque deberíamos saber “algo” de estadistica?“algo” de estadistica?

• Es necesario aprender las propiedades de la estadística, para utilizarla en diseños experimentales y análisis de datos.

• Como biólogos debemos desarrollar nuestra habilidad para discriminar argumentos científicos (o pseudo-científicos).

Estadística Biología Marina 2003

Page 4: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Que es lo que espero de Uds.Que es lo que espero de Uds.

• ATENCIÓN en la clases y Ayudantías

• Retroalimentación hacia mi con respecto a lo que les gusta y no les gusta del curso.

(criticas constructivas)

Estadística Biología Marina 2003

Page 5: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Objetivos del CursoObjetivos del Curso

• Entender los principales fundamentos de la estadística descriptiva e inferencial.

• Entender los principios generales sobre los cuales están basados los test estadísticos más comunes utilizados en biología.

Estadística Biología Marina 2003

Page 6: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

• Conocer los principales supuestos (pre-requisitos), de los test más comunes y entender el impacto de sus violaciones.

• Ser capaz de desarrollar variados análisis estadísticos utilizando las herramientas de Excel y SYSTAT.

Estadística Biología Marina 2003

Page 7: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Clases y AyudantíaClases y Ayudantía• Cátedra:

» Lunes 14:00 - 15:30 (Sala 12).» Martes 14:00 – 15:30 (Sala 10).

• Ayudantía:1) Miércoles 14:00 – 15:30 (Sala 1).

2) Miércoles 9:55 – 11:25 (Sala 1).

Laboratorio de Computación

Lunes – 14 – Abril Miércoles - 16 – Abril

Lunes – 12 – Mayo Miércoles 14 – Mayo

Lunes – 9 – Junio Miércoles 11 – Junio

Lunes – 14 – Julio Miércoles 16 – Julio

Page 8: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

EvaluaciónEvaluación

Estadística Biología Marina 2003

1° prueba = 30% 13 – Mayo – 2003

2° prueba = 30% 1 – Julio – 2003

Seminario = 40% 8 – Julio – 2003

Page 9: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

TextosTextos

Estadística Biología Marina 2003

• Guía del curso estadística de biología marina. UCN, 2003.

• Zar, J.H. 2000. Biostatistical Analysis (4th edition), Prentice-Hall, Upper saddle River, New Jersey.

• Spiegel, M.R. 1991. Estadística. McGrawHill.

• STEEL, R.G.D. and TORRIE, 1980, J.H. Principles and procedures of statistics: a biometrical approach. 2.ed. New York : McGraw-Hill,. 631p.

• Sokal, R.L. & F.J. Rohlf. 1995. Biometry (3rd edition), W.H. Freman & Co., New York, or

Page 10: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Preparación de clases.Preparación de clases.

• Leer el capítulo apropiado desde los textos mencionados y traer las preguntas clases.

• Si tienen alguna pregunta…¡Preguntar inmediatamente!. No existen las preguntas estupidas.

• Para las ayudantías, se debe manejar los contenidos para practicar con ejercicios.

Estadística Biología Marina 2003

Page 11: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

• Siempre venir a clases y ayudantías con:

– Guía de clases, con tablas

– CALCULADORA

Estadística Biología Marina 2003

• Por favor no sean participantes pasivos de la clase.

• Por favor no sean participantes pasivos de la clase.

• Y si quedan dudas….» Lunes 10:00 – 11:30.

» Martes 10:00 – 11.30.

Page 12: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

¿Qué es la Estadística?¿Qué es la Estadística?

• Estadísticas (plural): Datos recogidos de forma sistemática para obtener información sobre un tema (demográfico, social, económico, biológico, etc..)

Ejemplo: Captura de Anchovetas, goles del último clásico.

• Estadística (singular): Disciplina que comprende técnicas de recolección, presentación, análisis e interpretación. Permite poner a prueba de hipótesis y tomar decisiones en base a la teoría de probabilidades.

• Bio-Estadística: aplicación de herramientas de estadística en el área biológica

Estadística Biología Marina 2003

Page 13: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Algunas utilidades de la Algunas utilidades de la EstadísticaEstadística

Descripción Diseño Test de hipótesis

Provee de resúmenes de datos.Ayuda a descubrir patrones o tendencias.Evalúa la magnitud y dirección de los efectos experimentales.

Ayuda al diseño de experimentos y estudios de campo.

Permite tomar decisiones a priori sobre la utilidad de algún experimento.

Evalúa hipótesis biológicas a través de tests, para verificar si los patrones observados son consistentes con las predicciones.

Page 14: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Tipos de estadística (función):Tipos de estadística (función):

• Descriptiva:Analiza una población sin pretender sacar conclusiones generales (conclusiones validas para dicha población)

Ordenamiento y descripción de un conjunto de datos

Estadística Biología Marina 2003

• Inferencial:Tiene como propósito inducir leyes de comportamiento de una población a partir de muestras.

A partir de una muestra se obtienen conclusiones de toda la población

Page 15: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Usos de la estadística: Usos de la estadística: Descripción & Síntesis.Descripción & Síntesis.

• Generar un resumen de los datos.

• Ayuda a descubrir tendencias (inducción) a través de la examinación de resúmenes de patrones estadísticos

Para tener en cuenta: En un resumen estadístico mucha información se pierde. Por lo tanto, ¡SIEMPRE se debe conservar los datos crudos!

Estadística Biología Marina 2003

Page 16: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Usos de la estadística: Inferencial.Usos de la estadística: Inferencial.

• ¿Las diferencias observadas son “reales” o simplemente provocadas por accidente?

• Para responder esta pregunta, necesitamos conocer la probabilidad de que los resultados observados se deban efectivamente a un accidente o coincidencia?

• Los test estadísticos nos permiten calcular esta probabilidad y elaborar conclusiones

Estadística Biología Marina 2003

Page 17: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Usos de la estadística: Diseño Usos de la estadística: Diseño experimental.experimental.

• Focalización del esfuerzo

• Decidir a priori sobre la utilidad de un experimento

Estadística Biología Marina 2003

“Llamar a un estadístico después de que el experimento esta terminado, quizás no va a servir mas que para pedirle que realice una autopsia; seguramente el va a estar capacitado para decir de que murió el experimento”

Sir Ronald Fisher

Page 18: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Toma de muestras o “muestreo”Toma de muestras o “muestreo”

• Población o Universo: Corresponde a todo el grupo de cosas animales o personas sobre las que queremos obtener información. (esta definida en base a nuestros requerimientos)

• Unidad: Miembro individual de la población.

• Muestra: Porción de la población sobre la que tomamos información para obtener conclusiones sobre la población.

• Variable: Característica de una unidad, que es medida en todas la unidades de la muestra.

Estadística Biología Marina 2003

Page 19: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Estadística Biología Marina 200

3

Población Muestra Variable

Mujeres y hombres chilenos, entre 16 a 26 años.

100 hombres y mujeres jóvenes

de todas las capitales

regionales de Chile.

Nivel de nicotina medida en una

muestra sanguínea.

x

Población

muestra

Page 20: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Lo que la estadística puede y no Lo que la estadística puede y no puede hacer:puede hacer:

Estadística Biología Marina 2003

Puede NO Puede

•Proveer de criterios objetivos para evaluar hipótesis.•Ayuda a optimizar esfuerzos•Ayuda a evaluar críticamente argumentos

•Decir la verdad absoluta (solo una verdad probabilística)•Ayudar a un diseño pobre•Indicar significancia biológica: La significancia estadística no significa signifcancia biológica (vice versa)

Page 21: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Tipos de Variables (datos) Biológicas.Tipos de Variables (datos) Biológicas.• Datos en Escala Proporcional:

Existe un tamaño de intervalos constante, entre unidades adyacentes.

Existe un punto “0” que presenta significado físico.Ej: tamaños, conteos, pesos, volúmenes….

Estadística Biología Marina 2003

• Datos en Escala de Intervalos:Poseen un tamaño de intervalos constante, entre unidades

adyacentes.No tienen un punto “0” con valor físico.

Ej: temperatura en °C o °F.

Kelvin [K] Kelvin [K]0 absoluto tiene importancia física

Variables circulares

Page 22: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Estadística Biología Marina 200

3

Tipos de Variables (datos) Biológicas.Tipos de Variables (datos) Biológicas.

• Datos en Escala Ordinal (“orden”):Existe una diferencia relativa entre las magnitudes de

nuestras variables.

Ej: Tamaño celular 1,2 o 3; Color mas oscuro, mas claro, intermedio….

• Datos en Escala Nominal:– La variable se identifica por una cualidad “atributo” de esta.

Ej: Fenotipos como color de ojos, cabello. Machos o Hembras.

Page 23: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Datos Continuos y DiscretosDatos Continuos y Discretos

• Continuas: Permiten cualquier valor entre un determinado rango de mediciones observadas.Ej.: Altura de 35-36cm, entre ellas puede estar 35.2 o 35.1888 o 35.18878456….

• Discretas: Variables que pueden tomar solo valores enteros.Ej: Número de ostiones, personas.

Estadística Biología Marina 2003

Page 24: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Exactitud (accuracy):Exactitud (accuracy):

• ¿Qué tan cerca se encuentra nuestro valor observado del valor real?:

Estadística Biología Marina 2003

yx

observadoesperado

Modelos propuestos:

a) Y es una función lineal de X.

b) Y es una función no lineal de X.

Modelo mas exacto

Modelo menos exacto b es el modelo mas exacto:

Los valores observados están, en promedio, mas cerca de los observados

Page 25: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Precisión:Precisión:• ¿Qué tan cerca se encuentra, una de otra

medición, realizadas sobre una misma variable?– Se encuentra altamente influenciada por la

experiencia y rigurosidad de quien realiza la medición.

Estadística Biología Marina 2003

-5.56cm

-5.60cm

-5.58cm

-5.286cm

-5.749cm

-5.582cm

Page 26: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Precisión v/s Exactitud:Precisión v/s Exactitud:

Pobre

Buena

PobreBuena

Precisión

Exactitud

Page 27: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Tipos de Escalas de Datos:Tipos de Escalas de Datos:

• Escala Proporcional

• Escala Intervalos

• Escala Ordinal

• Escala Nominal

–Datos Continuos

–Datos Discretos

Estadística Biología Marina 2003

Page 28: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Estadística Biología Marina 200

3

Page 29: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Figuras Significativas y Figuras Significativas y Redondeo de Datos:Redondeo de Datos:

• Los dígitos de un número que denotan la exactitud la medición = Fig. Significativa.

Ejemplos:

7 cm = 1

7.04 cm = 3

7.14 cm = 3

7.90 cm = ?

Estadística Biología Marina 2003

21.00 parásitos = ?

321 parásitos = ?

44 parásitos = ?

Page 30: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Estadística Biología Marina 200

3

255

25.5

2.55

0.255

0.0255

2.55 x 102

2.55 x 101

2.55

2.55 x 10-1

2.55 x 10-2

Todos tienen3 cifras

significativas

Todos tienen3 cifras

significativas

En notación científica

Más Casos: Más Casos:

Page 31: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Rangos Implicados:Rangos Implicados:

Estadística Biología Marina 2003

•El largo del ala de una mariposa es de 5.4 cm.

“Esta medición implica una exactitud de 0.1cm”

•Por convención, teóricamente el largo del ala

de la mariposa está entre : 5.35 – 5.455.35 – 5.45

Rango implicado a nuestra exactitud

Page 32: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Otros ejemplos:Otros ejemplos:

Estadística Biología Marina 2003

Valor RangoFiguras

SignificativasExactitu

d

8 7.5 - 8.5 1 1

8.3 8.25 – 8.35 2 0.1

8.328.315 – 8.325

3 0.01

Page 33: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Aproximaciones y Redondeo:Aproximaciones y Redondeo:

78.3 = 79145.6 = 146

Estadística Biología Marina 2003

Pero: 56.5 ?

Si el ultimo digito anterior es par … aproximar hacia abajo

Si el último digito anterior es impar … aproximar hacia arriba

48.5 = 48

57.5 = 58

Page 34: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Distribuciones de Frecuencias:Distribuciones de Frecuencias:

• Tablas de frecuencias: Clasificación, ordenamiento y resumen de una gran cantidad de información.

• Consiste simplemente en:– Una lista de los valores observados en la

variable bajo estudio.– Cuantas veces este valor se repite.

Estadística Biología Marina 2003

Page 35: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Ubicación de nidos de gorriones:Ubicación de nidos de gorriones:

UbicaciónNúmero de

nidos observados

a- Canaletas 56

b- Balcones 60

c- Cavidades de Construcciones

46

d- Ramas de Árboles

49 a b c d

0

10

20

30

40

50

60

Ubicación de Nidos

Estadística Biología Marina 2003

Tabla de FrecuenciasTabla de FrecuenciasDistribución de Distribución de FrecuenciasFrecuencias

Page 36: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Confección de tabla:Confección de tabla:

¿Como construimos una tabla de frecuencias cuando nuestros datos

no son nominales?

¿Como construimos una tabla de frecuencias cuando nuestros datos

no son nominales?

Estadística Biología Marina 2003

Para empezar determinar:

Rango de datos

Número de clases

Amplitud de intervalo de clases

Determinar rango clase

Page 37: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Rango de datosRango de datos

• Distancia entre el dato máximo y mínimo

Estadística Biología Marina 2003

mínmáx XXR mínmáx XXR

Page 38: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Consumo de proteínas de 20 Consumo de proteínas de 20 ostiones de laboratorio.ostiones de laboratorio.

21 25 35 22 1824 21 23 16 2327 17 26 19 2920 19 20 23 22

Rango = 35-16 = 19

Page 39: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Número de ClasesNúmero de Clases

• Número de categorías o intervalos en el que se va a dividir la información

Estadística Biología Marina 2003

Se puede determinar arbitrariamente en base a la variación de nuestros datos.

Generalmente varía entre 5 a 20 categorías

Se puede determinar arbitrariamente en base a la variación de nuestros datos.

Generalmente varía entre 5 a 20 categorías

En este ejemplo se utilizarán 5 clases.En este ejemplo se utilizarán 5 clases.

Page 40: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Amplitud de intervaloAmplitud de intervalo

• Cantidad de datos que están comprendidos en un intervalo de clase.

Estadística Biología Marina 2003

clasesdeNúmero

RangoIntervAmpl ..

Del ejemplo: 19/5 = 3.8 ≈ 4

Solo se aproxima si los datos son discretos o enteros

Page 41: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Rango de claseRango de clase

• Significa hallar los límites inferiores y superiores de cada intervalo– Para ello al dato menor se le suma la

amplitud del intervalo (4 en este caso).

– La marca de clase corresponde al valor medio ubicado en cada rango de clase.

Estadística Biología Marina 2003

Page 42: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

21 25 35 22 1824 21 23 16 2327 17 26 19 2920 19 20 23 22

Rango de clase Marca clase

16 19 17.516, 17, 18 y 19 = 4

Amplitud de intervalo

Marca de clase

¿Cómo queda el resto de la

tabla?

Page 43: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Debería quedar así:Debería quedar así:

Rango de clase Marca clase

16 19 17.5

20 23 21.5

24 27 25.5

28 31 29.5

32 35 33.5

Page 44: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Frecuencia AbsolutaFrecuencia Absoluta• Es el número de veces que se repiten los

valores dentro de los diferentes intervalos en que se ha dividido la información

Estadística Biología Marina 2003

Rango de clase

Marca clase

Frecuencia Absoluta

16 19 17.5 5

20 23 21.5

24 27 25.5

28 31 29.5

32 35 33.5

Page 45: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Frecuencia RelativaFrecuencia Relativa• Es el valor que resulta al dividir cada una de las

frecuencias absolutas entre el total de frecuencias o datos y multiplicarlas por 100 para que sean expresadas en porcentaje

Estadística Biología Marina 2003

Rango de clase

Marca clase Frec. Abs. Frecuencia Relativa

16 19 17.5 5 25

20 23 21.5

24 27 25.5

28 31 29.5

32 35 33.5

Page 46: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Frecuencia Absoluta AcumuladaFrecuencia Absoluta Acumulada

• Se obtiene sumando y acumulando los valores absolutos clase por clase en orden ascendente

Estadística Biología Marina 2003

Rango de clase

Marca clase

Frec. Abs.

Frec. Rel.

Frec.Abs. Acumulada

16 19 17.5 5 25 5

20 23 21.5

24 27 25.5

28 31 29.5

32 35 33.5

Page 47: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Frecuencia Relativa AcumuladaFrecuencia Relativa Acumulada

• Se obtiene sumando y acumulando los valores relativos clase por clase en orden ascendente

Estadística Biología Marina 2003

Rango de clase

Marca clase

Frec. Abs.

Frec. Rel.

Frec.Abs. Acumulada

Frec.Rel. Acumulada

16 19 17.5 5 25 5 25

20 23 21.5

24 27 25.5

28 31 29.5

32 35 33.5

¿Cómo queda el resto de la tabla?

Page 48: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Estadística Biología Marina 200

3

Rango de clase

Marca clase

Frec. Abs.

Frec. Rel.

Frec.Abs. Acumulada

Frec.Rel. Acumulada

16 19 17.5 5 25 5 25

20 23 21.5 9 45 14 70

24 27 25.5 4 20 18 90

28 31 29.5 1 5 19 95

32 35 33.5 1 5 20 100

Debería quedar así:Debería quedar así:

Consumo de proteínas (grs.) de 20 ostiones Argopecten purpuratus

Page 49: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Representación gráfica de tablas Representación gráfica de tablas de frecuenciade frecuencia

• Histograma:– Se obtienen al graficar las

marcas de clase (abscisa) versus la frecuencia (ordenada).

Estadística Biología Marina 2003

0

2

4

6

8

10

17.5 21.5 25.5 29.5 33.5Proteinas consumidas

Fre

cu

en

cia

Page 50: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Polígono de FrecuenciasPolígono de Frecuencias

• Se produce fácilmente al conectar con una línea las marcas de clases adyacentes.

Estadística Biología Marina 2003

0

2

4

6

8

10

17.5 21.5 25.5 29.5 33.5Proteinas consumidas

Fre

cue

nci

a

Page 51: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

OjivasOjivas• Se obtienen al graficar las frecuencias

acumuladas absolutas o relativas

Estadística Biología Marina 2003

0

20

40

60

80

100

120

17.5 21.5 25.5 29.5 33.5

Proteinas consumidas

Fre

cue

nci

a

Page 52: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Tipos de distribuciones de Tipos de distribuciones de frecuenciafrecuencia

• En función de la forma:

Estadística Biología Marina 2003

Page 53: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

En función de la dispersiónEn función de la dispersión

Estadística Biología Marina 2003

Page 54: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Medidas Descriptivas NuméricasMedidas Descriptivas Numéricas

Estadística Biología Marina 2003

““A través de este tipo de estimaciones es posible A través de este tipo de estimaciones es posible hacer generalizaciones del todo a partir de una parte hacer generalizaciones del todo a partir de una parte del todo”del todo”

Conceptos para tener en cuenta:

• Población

• Muestra

• Muestras aleatorias

• Parámetros

• Estadísticos

Page 55: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

• Población o Universo: Corresponde a todo el grupo de cosas animales o personas sobre las que queremos obtener información. (esta definida en base a nuestros requerimientos)

• Muestra: Porción de la población sobre la que tomamos información para obtener conclusiones sobre la población.

Estadística Biología Marina 2003

Page 56: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Muestra aleatoriaMuestra aleatoria• Requisito clave:

““Cada miembro de la población debe Cada miembro de la población debe tener una opción igual e independiente tener una opción igual e independiente

de ser elegido”de ser elegido”

Estadística Biología Marina 2003

Asignar número a miembros de la población

Tablas de Números Aleatorios

Pero: En la mayoría de los casos no es posible asignar número aleatorios.

Es necesario tener en cuenta consideraciones biológicas mas que matemáticas.

Page 57: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

De esta manera:De esta manera:

• Una muestra tomada aleatoriamente, debe representar a la población.

• Si la muestra es representativa de mi población, entonces podemos “inferir cosas” de la población, con cierto nivel de seguridad y exactitud.

Estadística Biología Marina 2003

Page 58: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Parámetros y EstadísticosParámetros y Estadísticos

• Toda medición o estimación que este caracterizando y describiendo a nuestra población es llamada PARAMETRO.

Raramente es posible calcular parámetros

¿Porque?¿Porque?

Estadística Biología Marina 2003

Page 59: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

SoluciónSolución

• Realizar estimaciones de un parámetro poblacional mediante:

ESTADISTICOSESTADISTICOS

Estadística Biología Marina 2003

Todo buen estadístico debe ser:

Insesgado

Consistente

Eficiente

Page 60: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Medidas de Tendencia Central:Medidas de Tendencia Central:

• Representa a la suma de las observaciones divididas por el número de observaciones

Estadística Biología Marina 2003

La MediaLa Media

N

XiX

ni

i

1

N

XiX

ni

i

1

Ejemplo:

52.540.860.058.052.5

62.240.849.252.540.8

= 50.9

Page 61: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

• Con datos agrupados se calcula por:

Estadística Biología Marina 2003

921.52320

425.52724

129.53128

133.53532

5

Frec. Abs.

fi

17.5

Marca clase Xi

1916

Rango de

clase

N = 20

= 22.3 grs= 22.3 grs

ni

i

ni

i

fi

fiXiX

1

1

Marca Clase

Frecuencia Absoluta

Page 62: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Comentarios acerca de la media.Comentarios acerca de la media.

• La media es un número ÚNICO

• La media de la muestra ( ), es un buen estimador de

• Es un estadístico poco “resistente”, ya que es fuertemente influenciado por los valores extremos

Estadística Biología Marina 2003

X

Page 63: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Me La MedianaLa Mediana

• Es el valor medio. • Esto es el punto medio de las observaciones cuando estas han

sido ordenas en orden ascendente

Impares ParesMe= X(n+1)/2 Me=(Xn/2 + Xn/2+1)/2

11,13,15,16,17 11,13,15,16,17, 20

Estadística Biología Marina 2003

Me = 15 Me = 15.5

Page 64: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

• Con datos agrupados se calcula por:

Me = Límite inferior +0.5n – frec. acum.

ant.x Ancho intervalo

del intervaloNro. Obs en

Intervalo

Estadística Biología Marina 2003

Rango de clase

Marca clase

Frec. Abs.

Frec. Rel.

Frec.Abs. Acumulada

Frec.Rel. Acumulada

16 19 17.5 5 25 5 25

20 23 21.5 9 45 14 70

24 27 25.5 4 20 18 90

28 31 29.5 1 5 19 95

32 35 33.5 1 5 20 100

1.- Calculamos la posición: Me = X(n+1)/2 = X(20+1)/2 = X10.5

2.- Aplicamos la fórmula: Me = (20)+ ((0.5x20)-5)/9 x 4 = 22.2

Page 65: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

La ModaLa Moda

• La moda el valor mas frecuente.• Es decir, el valor que más se repite dentro de las

observaciones realizadas.

Estadística Biología Marina 2003

Ejemplo: Datos del coeficiente intelectual de un grupo de alumnos: 100, 95, 105, 110, 100.

Entonces la moda es 100

Page 66: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

• Para datos ordenados en una tabla de frecuencia:

• La moda corresponde a la marca de clase más frecuente

Estadística Biología Marina 2003

Rango de clase

Marca clase

Frec. Abs.

Frec. Rel.

Frec.Abs. Acumulad

a

Frec.Rel. Acumulada

16 19 17.5 5 25 5 25

20 23 21.5 9 45 14 70

24 27 25.5 4 20 18 90

28 31 29.5 1 5 19 95

32 35 33.5 1 5 20 100

Page 67: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

La Mediana y la Moda no son La Mediana y la Moda no son afectadas por valores extremos.afectadas por valores extremos.

Alemania 59

España 84

Inglaterra 78

Italia 41

Japón 47

Noruega 78

Nueva Zelanda 102

EEUU 61

Somalia 748

Analicemos el siguiente ejemplo:

Tasa de mortalidad infantil en diferentes países (muertes anuales/ 10000 habitantes)

Media = 144 muertes/10000

Mediana = 78 muertes/10000

Moda = 78 muertes/10000

Page 68: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Relaciones entre medidas de Relaciones entre medidas de tendencia centraltendencia central

Estadística Biología Marina 2003

Page 69: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

• Ahora que podemos describir nuestra población a partir de una medida central.

• ¿Qué mas sería interesante conocer y estimar?

Estadística Biología Marina 2003

Analicemos la siguiente figura:

Las MEDIAS y las MEDIANAS son iguales.

Pero las DISTRIBUCIONES son diferentes

Page 70: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Medidas de Dispersión o Medidas de Dispersión o VariabilidadVariabilidad

• Adicionalmente a la medición de tendencia central, es recomendable tener una medición de la dispersión de los datos.

– De esta manera es posible tener una idea de cuan esparcidos se encuentran las mediciones en torno al centro de la distribución

Estadística Biología Marina 2003

Page 71: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Existen variados estadísticos de Existen variados estadísticos de dispersión, los más utilizados dispersión, los más utilizados son:son:

• El Rango

• Suma de la desviaciones de la media al cuadrado (SS).

• Varianza (S)

• Desviación estándar (DE ó S2)

• Coeficiente de variación (CV)

• Los Cuantíles

Estadística Biología Marina 2003

Page 72: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

El RangoEl Rango

• Corresponde a la diferencia entre el dato mayor y el dato menor.

Estadística Biología Marina 2003

Rango = Xmax – Xmin

Page 73: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

S SSuma de las desviaciones de la Suma de las desviaciones de la

media al cuadradomedia al cuadrado

• Este valor entrega una idea de cuán lejos se encuentran los datos con respecto a la media.

• Su compresión es clave para entender el significado de cada una de las demás medidas de dispersión que existen

Estadística Biología Marina 2003

2)( XXiSS

Page 74: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Reflexione con las siguientes preguntas

• ¿Porqué se emplean desviaciones de la media al cuadrado?

• ¿Qué indica una SS grande?• ¿Qué indica una SS pequeño?• ¿Qué indica una SS igual a 0?

•Calcule la media y SS para el peso (grs) del músculo abductor de las siguientes almejas: 7.4, 8.1, 6.3, 8.6, 7.9, 6.9

Media = 7.5 SS = 3.08

Estadística Biología Marina 2003

Page 75: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

S2VarianzaVarianza

• Corresponde a la media de la suma de cuadrados (por eso es llamada media cuadrática)

Estadística Biología Marina 2003

N

Xi

22 )(

1

)( 22

n

XXiS

Población

Muestra

¿Cuál es la diferencia entre una y otra?

Page 76: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

• La varianza de una muestra esta dividida por n-1 (llamado “grados de libertad” o GL),

• Esto permite una estimación no segada y más conservadora ya que no sobreestima el valor de σ2 que presenta un N desconocido

Estadística Biología Marina 2003

Page 77: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

SDesviación EstándarDesviación Estándar

• Simplemente es estimada a través la raíz cuadrada de la varianza.

• Tener en cuenta que este valor tiene las mismas unidades que las mediciones originales.

Estadística Biología Marina 2003

2SS Calcular S2 y S a partir delos datos anteriores

Calcular S2 y S a partir delos datos anteriores

Page 78: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

C VCoeficiente de VariaciónCoeficiente de Variación

• Es el cuociente de la desviación estándar y la media aritmética, expresado en porcentaje.

Estadística Biología Marina 2003

100X

DSCV

Page 79: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

• La desviación estándar y la varianza tienen magnitudes que son dependientes de los datos.

El Coeficiente de variación NO

Ratones Elefantes

Media 0.78 cm 78.0 cm

DS 0.26 cm 26.0 cm

Estadística Biología Marina 2003

CV 33.3% 33.3%

• El coeficiente de variación expresa la variabilidad de la muestra relativa a la media de la muestra

Tamaño de las orejas de elefantes y ratones

En que especie varia más el

tamaño de orejas

Page 80: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Medidas de posición. Cuantíles

• Son estadísticos que dividen una distribución de frecuencias en cuatro, diez o cien partes iguales

• La mediana es el valor que se encuentra en la mitad de nuestra distribución (es decir es el 50avo percentil),

Estadística Biología Marina 2003

Otros cuantíles son:Cuartíles (4), Quintiles (5),

Decíles (10), Percentíles (100)

Page 81: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

• Los cuartíles son estadísticos que dividen en cuatro partes iguales nuestra información, donde cada parte incluye el 25% de las observaciones

Estadística Biología Marina 2003

1er cuartíl

2do cuartíl

3er cuartíl

25% 25% 25% 25%

Mediana

Rango Intercuartílico

Page 82: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

• Con la siguiente formula es posible calcular cualquier percentil, determinado la posición de la variable en un set de datos

Estadística Biología Marina 2003

100)1(

pX n

Percentil

buscado

5 5 7 8 9 9 910

12

1414

1517

1825

30

31

6472

88 8990

92

98

Ranking 4

5 6 7 8 9 1011

1213

1415

16

17

1819

20 2122

23

24

Ejemplo:

Calcular la media ± DS 34.6 34.1

¿Son estos los mejores estadísticos para este caso?

Page 83: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

• Mediana = ?

Estadística Biología Marina 2003

5 5 7 8 9 9 910

12

1414

1517

1825

30

31

6472

88 8990

92

98

Ranking 4

5 6 7 8 9 1011

1213

1415

16

17

1819

20 2122

23

24

Veamos con el Rango intercuartílico

En posición 12.5.

Valor = 16

• Rango intercuartílico

Primer cuartíl (25avo percentil)

Tercer cuartíl (75avo percentil)

100)1(

pX n

(24 + 1) x 0.25 = 6.25 (24 + 1) x 0.75 = 18.75

X6 y X7 = 9 entonces:

Valor = 9

X18= 64 y X19=72

entonces (72-64)x0.75 = 6

Valor = 64+6 = 70

Page 84: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Percentiles en tablas Percentiles en tablas de frecuenciade frecuencia

• Se procede de la misma forma con la que se calculó la mediana.

• Pero ahora no estamos interesados en 50avo de nuestra distribución.

• Debemos encontrar las posiciones 25avo y 75avo.

Estadística Biología Marina 2003

Cálculo de rangointercuartílico

Volvamos al ejemplo de los ostiones

Page 85: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Consumo de proteínas (grs.) de 20 ostiones Argopecten purpuratus

Estadística Biología Marina 2003

Rango de

clase

Marca de

clase

Frecuencia

Absoluta

Frec. absoluta

acumulada

16 19 17.5 5 5

20 23 21.5 9 14

24 27 25.5 4 18

28 31 29.5 1 19

32 35 33.5 1 20

Per.25 = Límite inferior +0.25n – frec. acum.

ant.x Ancho intervalo

del intervalo Nro. Obs en Intervalo

Per.75 = Límite inferior +0.75n – frec. acum.

ant.x Ancho intervalo

del intervalo Nro. Obs en Intervalo

Q1 (percentil 25): (20+1) (0.25)= 5.25

Q3 (percentil 75): (20+1) (0.75)= 15.75

= 20

= 25

Page 86: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

Tener PresenteTener Presente• Si los datos no se distribuyen en forma

normal, no se debe usar la DS y la Media como únicos y exclusivos estimadores.

• Para ello existen dos alternativas.• Usar la mediana y el rango intercuartílico• Mejor todavía, usar los “cinco estimadores“

Estadística Biología Marina 2003

Mínimo 1°cuartil Mediana 3°cuartil máximo

Page 87: Felipe Sepúlveda López Biólogo Marino Estadística Biología Marina 200 3 Estadística (Bioestadística) fsl001@ucn.cl.

• Una manera de presentar los 5 estimadores son los gráficos de caja o “BOX PLOT”

Estadística Biología Marina 2003

0 10 20 30 40 50 60 70 80 90 100datos