Tomar decisiones es una gran Para tomar decisiones...

25

Transcript of Tomar decisiones es una gran Para tomar decisiones...

Page 1: Tomar decisiones es una gran Para tomar decisiones …lcolladotor.github.io/courses/Courses/MEyAdDG/day2/Descriptiva.pdf · 0.10 0.20 0.30 9 6 310 2 84 Tiempo F r e c u e n c i a
Page 2: Tomar decisiones es una gran Para tomar decisiones …lcolladotor.github.io/courses/Courses/MEyAdDG/day2/Descriptiva.pdf · 0.10 0.20 0.30 9 6 310 2 84 Tiempo F r e c u e n c i a

rohen

Tomar decisiones es una granresponsabilidadresponsabilidad.

Para tomar decisiones se requiereINFORMACIÓN INFORMACIÓN disponibledisponible,esperanzadamente confiableconfiable y útilútil.

Generalmente se necesita una porciónde la base de datos o muestramuestra pararevelar un patrónpatrón lógicológico o realizar unanálisisanálisis estadísticoestadístico..

Page 3: Tomar decisiones es una gran Para tomar decisiones …lcolladotor.github.io/courses/Courses/MEyAdDG/day2/Descriptiva.pdf · 0.10 0.20 0.30 9 6 310 2 84 Tiempo F r e c u e n c i a

rohen

ObjetivoObjetivo

Poder concluir en base a la informaciónPoder concluir en base a la informacióncontenida en una muestra diferentescontenida en una muestra diferentesaspectos de la realidad (aspectos de la realidad (etimacietimaciónón de deparámetrosparámetros))

Identificar Identificar problemas; contrastar, aproblemas; contrastar, atravtravés de los és de los parámetros, diferentesparámetros, diferentesaspectos de la aspectos de la poblacipoblaciónón y tomar y tomardecisionesdecisiones..

El uso de la probabilidad es unaEl uso de la probabilidad es unaherramienta fundamental.herramienta fundamental.

Page 4: Tomar decisiones es una gran Para tomar decisiones …lcolladotor.github.io/courses/Courses/MEyAdDG/day2/Descriptiva.pdf · 0.10 0.20 0.30 9 6 310 2 84 Tiempo F r e c u e n c i a

rohen

Una característica importante de unamuestra es que sea RepresentativaRepresentativade la población de interés.

Cualquiera que sea nuestro objetivo:describir a la población, analizar opronosticar el comportamiento de lapoblación, la muestra, al serrepresentativa, será ConfiableConfiable

muestreo ...

Page 5: Tomar decisiones es una gran Para tomar decisiones …lcolladotor.github.io/courses/Courses/MEyAdDG/day2/Descriptiva.pdf · 0.10 0.20 0.30 9 6 310 2 84 Tiempo F r e c u e n c i a

Población

Muestra

TransformaciónSumarizaciónIlustración

Descrip

ción

Descrip

ción

Inferencia

Inferencia

AnálisisEstimaciónHipótesis

rohen

Page 6: Tomar decisiones es una gran Para tomar decisiones …lcolladotor.github.io/courses/Courses/MEyAdDG/day2/Descriptiva.pdf · 0.10 0.20 0.30 9 6 310 2 84 Tiempo F r e c u e n c i a

rohen

Los datosdatos son la materia prima del estadístico. Usalos números para interpretar la realidad.Todos los problemas estadísticos involucran o larecolecta, la descripción y el análisis de los datos, opensar cómo recolectar, describir y hacer elanálisis de los datos.

75

8

4

85

610

98

73

3

2

1

2

3

4 5

56

7

7

8

0

92

3 4784 6

3 2 31 5

5

03

9

Page 7: Tomar decisiones es una gran Para tomar decisiones …lcolladotor.github.io/courses/Courses/MEyAdDG/day2/Descriptiva.pdf · 0.10 0.20 0.30 9 6 310 2 84 Tiempo F r e c u e n c i a

rohen

Tengo un 98% de probabilidadde hacer algo que tenga sentido con estos números.

75

84

85

610

98

73

3

2

1

2

3

4 5

5

6

7

7

8

0

9

2

3 4784 6

3 2 31 5

5

03

9

Page 8: Tomar decisiones es una gran Para tomar decisiones …lcolladotor.github.io/courses/Courses/MEyAdDG/day2/Descriptiva.pdf · 0.10 0.20 0.30 9 6 310 2 84 Tiempo F r e c u e n c i a

rohen

Un parámetroparámetro es una medida numéricade un aspecto de la población µ, σ, ν, θ

Una estadísticaestadística es una medida numéricade un aspecto de la muestra X, S, n,

Una estadística consiste de un conjuntode mediciones de dicha característicaque varía de una observación (unidadunidadexperimentalexperimental) a otra, y a estasmediciones las llamaremos variablevariable

X~

Page 9: Tomar decisiones es una gran Para tomar decisiones …lcolladotor.github.io/courses/Courses/MEyAdDG/day2/Descriptiva.pdf · 0.10 0.20 0.30 9 6 310 2 84 Tiempo F r e c u e n c i a

¿Cómo presentar los datos?

La frecuencia absolutafrecuencia absoluta para unaclase particular es el número deobservaciones que caen en cada clase.

La frecuencia relativafrecuencia relativa o porcentajeporcentajepara una clase particular es sufrecuencia absoluta entre el número totalde observaciones

!

pi =fi

n

if

rohen

Page 10: Tomar decisiones es una gran Para tomar decisiones …lcolladotor.github.io/courses/Courses/MEyAdDG/day2/Descriptiva.pdf · 0.10 0.20 0.30 9 6 310 2 84 Tiempo F r e c u e n c i a

Esta frecuencia ayuda a sumarizar enforma ordenada la información contenidaen la muestra tanto en tablas como engráficas.

tabla de distribucióntabla de distribuciónde frecuenciasde frecuencias diagrama de barras

género frecuencia porcentaje0 19 0.631 11 0.37

Total 30 1

rohen

Page 11: Tomar decisiones es una gran Para tomar decisiones …lcolladotor.github.io/courses/Courses/MEyAdDG/day2/Descriptiva.pdf · 0.10 0.20 0.30 9 6 310 2 84 Tiempo F r e c u e n c i a

rohen

Gráfico de Pastel

Page 12: Tomar decisiones es una gran Para tomar decisiones …lcolladotor.github.io/courses/Courses/MEyAdDG/day2/Descriptiva.pdf · 0.10 0.20 0.30 9 6 310 2 84 Tiempo F r e c u e n c i a

Para variables cuantitativas discretas lastablas de frecuencias se realizan con lacreación de diferentes clases en base a losvalores que toma la variable.

edad frecuencia porcentaje

38 3 0.10

39 3 0.10

40 6 0.20

41 1 0.03

42 3 0.10

43 2 0.07

44 4 0.13

45 3 0.10

46 4 0.13

47 0 0.00

48 0 0.00

49 1 0.03

Total 30 1.00

rohen

Page 13: Tomar decisiones es una gran Para tomar decisiones …lcolladotor.github.io/courses/Courses/MEyAdDG/day2/Descriptiva.pdf · 0.10 0.20 0.30 9 6 310 2 84 Tiempo F r e c u e n c i a

Para variables cuantitativas continuas lastablas de frecuencias se realizan con lacreación de intervalos numéricos queformarán las diferentes clases.

tiempo frecuencia porcentaje

9331- 9931 1 0.03

9931-10531 1 0.03

10531-11131 3 0.10

11131-11731 6 0.20

11731-12331 5 0.17

12331-12931 5 0.17

12931-13531 6 0.20

13531-14131 3 0.10

Total 30 1.00

Histograma

0.00

0.05

0.10

0.15

0.20

0.25

933

1- 993

1

993

1-10

531

1053

1-11

131

1113

1-11

731

1173

1-12

331

1233

1-12

931

1293

1-13

531

1353

1-14

131

Tiempo

Fre

cu

en

cia

Histograma

0.00

0.10

0.20

0.30

9631 10231 10831 11431 12031 12631 13231 13831

Tiempo

Frecuencia

rohen

Page 14: Tomar decisiones es una gran Para tomar decisiones …lcolladotor.github.io/courses/Courses/MEyAdDG/day2/Descriptiva.pdf · 0.10 0.20 0.30 9 6 310 2 84 Tiempo F r e c u e n c i a

Medidas de DispersiónSon números que indican qué tan separados están losdatos entre si: rango, desviación estándar,rango, desviación estándar,rango intercuartilrango intercuartil

Medidas de Tendencia CentralSon números que se localizan cerca del centro ocerca de donde se encuentran los datos con mayorfrecuencia: media, mediana, modamedia, mediana, moda

rohen

Page 15: Tomar decisiones es una gran Para tomar decisiones …lcolladotor.github.io/courses/Courses/MEyAdDG/day2/Descriptiva.pdf · 0.10 0.20 0.30 9 6 310 2 84 Tiempo F r e c u e n c i a

rohen

MediaMedia

!

X = 1n

xi

i=1

n

"

!

l( ˜ X ) =n + 1

2

MedianaMediana se localiza el valorcentral de los datos y se observael valor que toma

ModaModa es el valor con la frecuenciamás alta

medidas de tendencia central ...

Page 16: Tomar decisiones es una gran Para tomar decisiones …lcolladotor.github.io/courses/Courses/MEyAdDG/day2/Descriptiva.pdf · 0.10 0.20 0.30 9 6 310 2 84 Tiempo F r e c u e n c i a

rohen

Medidas de Dispersión

rango se define como la diferencia entre el valormáximo y el mínimo:

Rango = max - min

Es una medida sensible a valores extremos y no es muyinformativa ya que es insensible a datos intermedios

amplitud intercuartílica es la distancia entreel porcentil 75 y el porcentil 25:

AI = P75 - P25

Nos da una idea de la distancia entre los valores quedeterminan el 50% de los datos centrales

Page 17: Tomar decisiones es una gran Para tomar decisiones …lcolladotor.github.io/courses/Courses/MEyAdDG/day2/Descriptiva.pdf · 0.10 0.20 0.30 9 6 310 2 84 Tiempo F r e c u e n c i a

rohen

VarianzaVarianza es una variación promedioalrededor de la media, definida como

!

S2 =

Xi" X( )

2

i=1

n

#n "1

un problema de la varianza es que tiene las unidadesal cuadrado y su interpretación no es fácil, por lo que

usamos su raiz: desviacióndesviación estándarestándar

!

S =Xi" X( )

2

i=1

n

#n "1

es sensible a valores extremos.

medidas de dispersión...

Page 18: Tomar decisiones es una gran Para tomar decisiones …lcolladotor.github.io/courses/Courses/MEyAdDG/day2/Descriptiva.pdf · 0.10 0.20 0.30 9 6 310 2 84 Tiempo F r e c u e n c i a

Creación de IntervalosCreación de Intervalos:

con y se pueden formar intervalos de laforma y obtener el número deobservaciones que caen dentro de ese intervalo.

Si nuestra distribución muestral tiene una forma mas omenos simétrica y acampanada podemos usar la reglaempírica:

alrededor del 69% de las observaciones cae dentro dealrededor del 69% de las observaciones cae dentro deuna desviación estándar de la mediauna desviación estándar de la media

alrededor del 95% de las observaciones cae dentro dealrededor del 95% de las observaciones cae dentro dedos desviaciones estándar de la mediados desviaciones estándar de la media

alrededor del 99.7% de las observaciones cae dentro dealrededor del 99.7% de las observaciones cae dentro detres desviaciones estándar de la mediatres desviaciones estándar de la media

S

!

X

!

X m kS

medidas de dispersión...

rohen

Page 19: Tomar decisiones es una gran Para tomar decisiones …lcolladotor.github.io/courses/Courses/MEyAdDG/day2/Descriptiva.pdf · 0.10 0.20 0.30 9 6 310 2 84 Tiempo F r e c u e n c i a

s s2s 2s

3s 3sX

Intervalos Intervalos alrededoralrededor

de la mediade la media

!

X m S

X m 2S

X m 3S

(7.57 , 15.75)

(3.48 , 19.84)

(-0.61 , 23.93)

n = 372X = 11.66 S = 4.089

264 obs. 70.96%

353 obs. 94.89%

372 obs. 100.00%

Monóxido de Carbono enel humo de los cigarros

medidas de dispersión...

rohen

Page 20: Tomar decisiones es una gran Para tomar decisiones …lcolladotor.github.io/courses/Courses/MEyAdDG/day2/Descriptiva.pdf · 0.10 0.20 0.30 9 6 310 2 84 Tiempo F r e c u e n c i a

rohen

Para hacer estadística diferente a ladescriptiva, podemos usar todas las técnicashasta ahora aprendidas y hacer algún análisiscomparativo o asociativo.

El problema de comparación consiste encontrastar las distribuciones de frecuenciade una variable de interés para dos o massubpoblaciones basándose en los datos de lamuestra.

Análisis Exploratorio de Datos

Page 21: Tomar decisiones es una gran Para tomar decisiones …lcolladotor.github.io/courses/Courses/MEyAdDG/day2/Descriptiva.pdf · 0.10 0.20 0.30 9 6 310 2 84 Tiempo F r e c u e n c i a

rohen

¿Hay alguna diferencia en las distribucionespoblacionales?

¿Cuál es la naturaleza de esas diferencias?

¿Qué tan grandes son esas diferencias?

En el problema de comparacióncomparación surgenalgunas preguntas:

El análisis exploratorio nos ayudará a darnos unaidea de las respuestas a estas preguntas

Page 22: Tomar decisiones es una gran Para tomar decisiones …lcolladotor.github.io/courses/Courses/MEyAdDG/day2/Descriptiva.pdf · 0.10 0.20 0.30 9 6 310 2 84 Tiempo F r e c u e n c i a

rohen

Comparación entre dos poblaciones

Control: muestra no expuesta a plomo ambiental

Expuestos: muestra expuesta a plomo ambiental

Page 23: Tomar decisiones es una gran Para tomar decisiones …lcolladotor.github.io/courses/Courses/MEyAdDG/day2/Descriptiva.pdf · 0.10 0.20 0.30 9 6 310 2 84 Tiempo F r e c u e n c i a

rohen

Muchas veces es importante saber si una variableinfluye sobre el comportaminto de otra variable.Con ello estudiamos el problema de asociaciónasociación.

Para este caso el diagrama de dispersión es muy útil.Consiste en graficar parejas de valores ( xi , yi )correspondientes a un solo individuo, sobre un planocartesiano.

Una medida de asociación que complementa estediagrama es el coeficiente de correlación (medida derelación lineal entre las variables) obtenido como

!

r(x,y) =Xi " X ( ) Yi "Y ( ) n "1( )i=1

n#

Xi " X ( )2

n "1( )i=1

n# Yi "Y ( )

2

n "1( )i=1

n#

=Sxy

SxSy

Page 24: Tomar decisiones es una gran Para tomar decisiones …lcolladotor.github.io/courses/Courses/MEyAdDG/day2/Descriptiva.pdf · 0.10 0.20 0.30 9 6 310 2 84 Tiempo F r e c u e n c i a

rohen

30

40

50

60

70

80

90

100

140 150 160 170 180 190 200

30

40

50

60

70

80

90

100

140 150 160 170 180 190 200

0

10

20

30

40

50

60

70

80

140 150 160 170 180 190 200

30

80

130

180

230

280

330

140 150 160 170 180 190 200

r = 0.8 r = 0.1

r = 0.99 r = - 0.7

asociación ...

Page 25: Tomar decisiones es una gran Para tomar decisiones …lcolladotor.github.io/courses/Courses/MEyAdDG/day2/Descriptiva.pdf · 0.10 0.20 0.30 9 6 310 2 84 Tiempo F r e c u e n c i a

Referencias:

http://www.hrc.es/bioest/M_docente.html

Triola, M. Elementary Statistics (9th Ed.) Addison-Wesley Longman, 2000

Zar, Jerrold H.- Biostatistical Analysis.- 4rd ed.-Prentice Hall, Inc

Rosner, B.- Fundamentals of Biostatistics. 6th Ed.Brooks/Cole Publishing Co., 2006

rohen