Clase de estadistica

52
Estadística y Probabilidad Enrique Sandoval

Transcript of Clase de estadistica

Estadística y Probabilidad

Enrique Sandoval

CONCEPTOS INICIALES

Definición de Estadística

• Recolectar• Organizar• Analizar • Presentar• Interpretar

Decisión

Población

Es la totalidad de elementos a los cuales está destinado un estudio o investigación. Es el conjunto completo de individuos, objetos o datos que el investigador está interesado en estudiar.

Muestra

Subconjunto de una población, es la porción representativa de la población que se seleccionará para su análisis.

Variable

Es una característica de interés que varía de individuo en individuo en una población. Puede tener valores o categorías.

Datos

Son las realizaciones de las variables. Medidas u observaciones que se realizan sobre los sujetos.

Parámetro

Número calculado sobre los datos de la población, que cuantifica una característica de ella.

Estadístico

Número calculado a partir de los datos de la muestra, que cuantifica una característica de ella.

Parámetro ( )q

Estadístico Unidad experimental o unidad de observación

VARIABLES

CUALITATIVAS O CATEGÓRICAS

CUANTITATIVAS O NUMÉRICAS

DISCRETAS CONTINUAS

ESCALAS DE MEDICIÓN

• Nominal• Ordinal• Intervalar• Razón

ORGANIZACIÓN DE DATOS

Los siguientes datos corresponden a los casos notificados de enfermedades vinculadas a adicciones en distintos centros de salud de la ciudad

5 6 7 5 6 12 69 5 7 5 6 7 89 7 7 6 7 7 11

10 10 9 8 8 5 7

¿Cuál es la población?¿Cuál es la muestra?¿Cuál es la unidad de observación?¿Cuál es la variable de estudio?¿Cómo es esa variable?

Ordenamos estos datos en una tabla de distribución de frecuencias simple

Xi fi fa fr fra56789

101112

Valo

res

de la

var

iabl

e

Xi fi fa fr fra5 5 5 0,18 0,186 5 10 0,18 0,367 8 18 0,29 0,648 3 21 0,11 0,759 3 24 0,11 0,86

10 2 26 0,07 0,9311 1 27 0,04 0,9612 1 28 0,04 1

28 1

Frecuencia absoluta Frecuencia relativa

Frecuencia acumulada Frecuencia relativa acumulada

n

• Frecuencia acumulada:

fa = fi + fa – 1

• Frecuencia relativa:

fr = fi/n• Frecuencia relativa acumulada:

fra = fr + fra-1

Tablas de distribución de frecuencias

Def: Una tabla de distribución de frecuencias es aquella en la cual a cada valor de la variable se le asigna el número de veces en que se presenta en la distribución (FRECUENCIA).

Tabla de distribución de frecuencias con intervalos de clase

Clases (años) fi fa fr fra5 - 10 2 2 0,03 0,03

10 - 15 1 3 0,01 0,0415 - 20 5 8 0,07 0,1120 - 25 9 17 0,13 0,2425 - 30 14 31 0,20 0,4430 - 35 18 49 0,26 0,7035 - 40 21 70 0,30 1,00

70 1

Cómo construir una tabla con intervalos

1. Decidir la cantidad de intervalos a construir (k)

5 < k < 152. Calcular el rango (R)

R=Xmax – Xmin

3. Calcular la amplitud de cada intervalo (h)

h = R/k (redondeado al entero inmediato superior)

Ejemplo: Los siguientes valores corresponden a las edades que sufrieron lesiones en accidentes de tránsito en el último año.

2 6 10 16 20 26 27 29

24 24 20 20 21 17 16 16

19 18 3 2 12 12 10 10

10 14 14 13 12 5 9 5

14 10 14 13 11 10 9 8

5 6 7 29 28 31 30 5

Construcción

Resumen

Tabl

as d

e di

strib

ució

n de

fr

ecue

ncia

s Simple

Con intervalos

Variable discreta

Variable continua

Variable discreta de gran recorrido

Gráficos

Histograma de frecuencias absolutas

-3 2 7 12 17 21 26 31 36

Columna1

0

3

6

9

13

fre

cue

nci

a a

bso

luta

22 27 32 37

Histograma de frecuencias acumuladas

-3 2 7 12 17 21 26 31 36

Columna1

0

13

25

38

50

fre

c. a

bs.

acu

mu

lad

a

Histograma y polígono de frecuencias

-3 2 7 12 17 21 26 31 36

Columna1

0

3

6

9

13

fre

cue

nci

a a

bso

luta

Histograma y ojiva

-3 2 7 12 17 21 26 31 36

Columna1

0

13

25

38

50

fre

c. a

bs.

acu

mu

lad

a

Ejemplos de interpretación de curvas de frecuencias

-0,80 1,00 2,80 4,60 6,40 8,20 10,00 11,80

Columna1

0,00

0,11

0,23

0,34

0,46

fre

cue

nci

a r

ela

tiva

Calificaciones Primer Parcial

-0,80 1,00 2,80 4,60 6,40 8,20 10,00 11,80

Columna1

0,00

0,12

0,24

0,36

0,48

fre

cue

nci

a r

ela

tiva

Calificaciones Segundo Parcial

Calificaciones Primer Parcial Calificaciones Segundo Parcial

Presentación de Datos

ORGANIZACIÓN DE DATOS CATEGÓRICOS

FACULTAD Cantidad de docentes

F.A.E.N. 157

Facultad de Humanidades 314

Facultad de Recursos Naturales 186

Facultad de Ciencias de la Salud 144

Encabezado del Talón(Clasificación A)

Encabezado principal(Clasificación B)

Rótulo de la columna (Clase B1)

Rótulo de la columna (Clase B2)

Rótulo de la fila (total de la Clasificación A)

Celda Celda

Rótulo de la fila (Clase A1) Celda Celda

Rótulo de la fila (Clase A2) Celda Celda

Rótulo de la fila (Clase A3) Celda celda

TítuloCo

lum

na m

atriz En

cabe

zado

s se

cund

ario

sCu

erpo

Notas al pie de la tablaNotas sobre fuente u origen

Facultad

Docentes

TotalDedicación Dedicación Dedicación

Exclusiva Semiexclusiva Simple

Total 801 79 217 505

F.A.E.N. 157 27 59 71

Facultad de Humanidades

314 18 72 224

Facultad de Recursos Naturales

186 21 44 121

Facultad de Ciencias de la Salud

144 13 42 89

Docentes de la Universidad Nacional de FormosaSegún Facultad y Dedicación

Año 1998

La Región Litoral (Misiones, Corrientes, Entre Ríos, Santa Fe, Chaco y Formosa) cuenta con 313 establecimientos hoteleros, de los cuales 109 son de una y dos estrellas, 147 de tres estrellas y 57 de cuatro y cinco estrellas.

Confeccione un cuadro con todas sus partes teniendo en cuenta la siguiente información.

Presentación Gráfica

Gráfico de barras simples

Utilidad:

Para representar cantidades clasificadas en forma cronológica, geográfica o cualitativa

Docentes de la U.Na.F. según Facultad y Dedicación - 1998

0

50

100

150

200

250

300

350

F.A.E.N. Facultad deHumanidades

Facultad de RecursosNaturales

Facultad de Cienciasde la Salud

Gráfico de barras agrupadas

Utilidad:

Para representar cantidades clasificadas en forma cronológica, geográfica o cualitativa y a su vez compararlas con otras en cada categoría o cada momento de tiempo considerado.

0

50

100

150

200

250

F.A.E.N. Facultad deHumanidades

Facultad de RecursosNaturales

Facultad de Ciencias dela Salud

Exclusiva

Semiexclusiva

Simple

Gráfico de barras apiladas

Utilidad:

Muestra la misma información que un gráfico de barras simples y uno de barras agrupadas, todo un solo gráfico.

0

50

100

150

200

250

300

350

F.A.E.N. HUMANIDADES RECURSOSNATURALES

CIENCIAS DE LASALUD

Simple

Semiexclusiva

Exclusiva

Gráfico de barras proporcionales

Utilidad:

Muestra una comparación porcentual de las distintas cantidades por categoría o momento de tiempo.

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

Human

idade

s

Recur

sos N

atur

ales

Econo

mía

y Neg

ocios

Salud Exclusiva

Semiexclusiva

Simple

Gráfico de sectores circulares

Docentes de la U.Na.F según Facultad Año 1998

Humanidades39%

Salud18%

Economía y Negocios

20%

Recursos Naturales

23%

Gráfico de líneas

Utilidad:

Muestra la variación de una cantidad a lo largo del tiempo, es decir muestra la variación cronológica de una cantidad.

Gráfico de líneas simple

Venta de pasajes en miles de pesos

enero

febrer

omarz

oab

rilmay

ojunio

julioag

osto

septiem

bre

octubre

noviembre

diciem

bre0

10

20

30

40

50

60

Gráfico de líneas múltiples

enero febrero marzo abril mayo junio julio agosto septiembre octubre noviembre diciembre0

10

20

30

40

50

60

70

80

90

100

AéreoTerrestre