Estadística y probabilidades cap i y ii
-
Upload
fernanda-huaman-sobrado -
Category
Documents
-
view
194 -
download
4
Transcript of Estadística y probabilidades cap i y ii
ESTADÍSTICA Y ESTADÍSTICA Y PROBABILIDADESPROBABILIDADES
UNHEVAL- 2009UNHEVAL- 2009
Mg. VARGAS RONCAL, RosarioMg. VARGAS RONCAL, Rosario
CAPÍTULO I. INTRODUCCIÓN A CAPÍTULO I. INTRODUCCIÓN A LA ESTADÍSTICALA ESTADÍSTICA
1.1 DEFINICIÓN DE ESTADÍSTICA1.1 DEFINICIÓN DE ESTADÍSTICA
• La Estadística es la ciencia que recopila, clasifica, presenta, describe e interpreta conjuntos de datos. Generalmente se ocupa de estudiar fenómenos aleatorios.
• La estadística puede dividirse en dos ramas: descriptiva e inferencial
Estadística descriptivaEstadística descriptiva
• es el conjunto de métodos estadísticos que se relacionan con el resumen y descripción de los datos, como tablas, gráficos, y el análisis mediante algunos cálculos.
Estadística inferencialEstadística inferencial
• Es una técnica mediante la cual se obtienen generalizaciones o se toman decisiones en base a una información parcial o completa obtenida mediante técnicas descriptivas.
1.2DEFINICIÓN DE TÉRMINOS 1.2DEFINICIÓN DE TÉRMINOS ESTADÍSTICOS BÁSICOS ESTADÍSTICOS BÁSICOS
• Población o Universo
• Unidad de análisis• Muestra• Muestra aleatoria• Variable
• Dato • Parámetro • Estadístico Censo • Encuesta • Escalas de medición
1.3 TIPOS DE VARIABLES1.3 TIPOS DE VARIABLES
A.Variables cualitativas
• Variables Nominales • Variables Ordinales
B. Variables cuantitativas• Variable Cuantitativa
Discreta • Variable Cuantitativa
Continúa
1.4 TÉCNICAS DE MUESTREO 1.4 TÉCNICAS DE MUESTREO
a) Muestreo Aleatorio
b) Muestreo Estratificado
c) Muestreo por conglomerados (¨Clusters¨)
d) Muestreo Sistemático
1.5 MANERAS DE RECOLECTAR 1.5 MANERAS DE RECOLECTAR DATOS DATOS
a) Haciendo entrevistas personales.
b) Haciendo entrevistas por teléfono.
c) Mediante cuestionarios emitidos por correo.
d) Por observación directa.
e) A través de Internet.
f) Usando simulación por computadoras
1.6 EJERCICIOS PROPUESTOS1.6 EJERCICIOS PROPUESTOS
¿Cual es la definición de la Estadística?
Tipos o ramas de la estadística
¿En que se diferencian los conceptos de Población y Muestra?
Ejemplos de variables (cuantitativa o cualitativa)
Inferencia estadística, ejemplos
Tipos de muestreo
Ventajas de los muestreos estratificado y por conglomerados
CAPÍTULO II: ORGANIZACIÓN Y CAPÍTULO II: ORGANIZACIÓN Y REPRESENTACIÓN DE DATOSREPRESENTACIÓN DE DATOS
2.1 DISTRIBUCIÓN DE 2.1 DISTRIBUCIÓN DE FRECUENCIASFRECUENCIAS
2.1.1 TIPOS DE DISTRIBUCIONES.
• Distribución categórica; es aquella que se aplica a la variable cualitativa, en donde sus valores son cualidades o categorías.
• Distribución numérica; es aquella que se aplica a la variable cuantitativa, en donde sus valores son números.
DISTRIBUCIÓN DE FRECUENCIAS: Variable cualitativa
Categoría de la variable Xi
Frecuencias
absolutas
Frecuencias relativas
Ci ni
C1 n1 f1
C2 n2 f2
Ck n2 fk
total n 1
EjemploEjemplo: En una encuesta de opinión acerca de las preferencias de : En una encuesta de opinión acerca de las preferencias de una tipo de platos de comida en un pueblito de Perú dieron las una tipo de platos de comida en un pueblito de Perú dieron las siguientes respuestas:siguientes respuestas: P: Pachamanca; L: lomo saltado; C: cebiche P: Pachamanca; L: lomo saltado; C: cebicheP, P, P, P, P, P, P, P, L, L, L, L, L, L, L, L, L, C, C, C; construir la P, P, P, P, P, P, P, P, L, L, L, L, L, L, L, L, L, C, C, C; construir la distribución de frecuencias distribución de frecuencias
Plato de comida Xi
Nº de personas % de personas
Pachamanca(P) 8 40
Lomo saltado(L) 9 45
Cebiche (c) 3 15
total 20 100
DISTRIBUCIÓN DE FRECUENCIAS: Variable cuantitativa discreta
n
N2
N1
Frec
absolutas acumuladas
100
F2
F1
Frecrelativas
acumuladas
f2 n2X2
1ntotal
fk nkxk
f1n1X1
niXi
Frecuencias relativas
Frecuencias
absolutas
Valores
de Xi
Ejemplo Ejemplo Ante la pregunta del número de hijos por familia Ante la pregunta del número de hijos por familia (variable x) una muestra de 20 hogares, marco las siguientes (variable x) una muestra de 20 hogares, marco las siguientes
respuestas: 2 ,0, 3, 1, 1, 1, 2, 2, 2, 2, 3, 3, 1, 3, , 2, 3, 3, 4, 4, 2respuestas: 2 ,0, 3, 1, 1, 1, 2, 2, 2, 2, 3, 3, 1, 3, , 2, 3, 3, 4, 4, 2Construir la distribución de la variable X.Construir la distribución de la variable X.
Número
de hijos Xi
Número de familias ni %Familias
fi
Número familias
acumuladas
% familias acumulada
s
0 1 5 1 5
1 4 20 5 25
2 7 35 12 60
3 6 30 18 90
4 2 10 20 100
total 20 100
DISTRIBUCIÓN DE FRECUENCIAS: Variable cuantitativa continua
n
N2
N1
Frec
absolutas acumuladas
100
F2
F1
Frecrelativas
acumuladas
f2 n2L2-L3
1ntotal
fk nkLk-1-Lk
f1n1L1-L2
niLo-L1
Frecuencias relativas
Frecuencias
absolutas
Intervalos
Li-1-Li
Ejemplo 3.Ejemplo 3. Los ingresos semanales en dólares (variable X) de 50 Los ingresos semanales en dólares (variable X) de 50 empleados son: empleados son: 4646 47 52 54 56 57 57 58 58 59 60 61 63 63 64 65 66 67 47 52 54 56 57 57 58 58 59 60 61 63 63 64 65 66 67 67 67 67 67 68 68 69 69 70 70 70 70 72 72 73 73 73 74 76 76 77 77 77 67 67 67 67 68 68 69 69 70 70 70 70 72 72 73 73 73 74 76 76 77 77 77 79 80 82 84 85 86 88 93 79 80 82 84 85 86 88 93 94 94 Construir una distribución de frecuencias. Construir una distribución de frecuencias.
• 1. Decidir cuantos intervalos usar, para eso usaremos la regla de Sturges;
• K=1+ 3,322 Log(n) = 1+ 3,322 Log (50) = 1+ 3,322 (1,69897) = 6.644≈7
• Por lo tanto el número de intervalos es K =7• NOTA: la aproximación es al entero inmediatamente superior;
se recomienda que el número de intervalos deba ser entero y entre 5 y 20.
• 2. Calcular el rango o recorrido de los datos• R = Valor máximo – Valor mínimo = 94-46+1 = 49• 3. Calcular la amplitud común del intervalo, usaremos un
indicador:• A=R/K=49/7=7 ; Luego la amplitud es: A= 7• Determinamos el exceso: E = AK-R = 7x7-49=0
Li-1-Li ni Ni fi Fi
45-53 3 3 6 6
53-60 8 11 16 22
60-67 11 22 22 44
67-74 14 36 28 72
74-81 7 43 14 86
81-88 5 48 10 96
88-95 2 50 4 100
total 50 100
Tabla 01: Ingresos semanales de Empleados ($) Tabla 01: Ingresos semanales de Empleados ($) . .
Interpretación.n3= 11; 11 empleados que ganan entre 46 y 53 $ semN4= 14 empleados que ganan semanalmente entre 67 y 74 $F6 = 96, el 96% de los empelados ganan entre 46 y 88 $ por semana.f5 = 14, el 14% de los empleados ganan entre 74 y 81 $ semanales
PROPIEDADES DE LAS FRECUENCIAS.PROPIEDADES DE LAS FRECUENCIAS.
• Sean el número total de observaciones realizadas de la variable X que toma los valores distintos X1,..., entonces, tenemos las siguientes propiedades:
1. n1+n2+n3+…nk=n
2. f1+f2+f3+…+fk=1
3. Nk=n
4. Fk=1
5. 0 ni n ; i = 1, 2, 3,..., k
6. 0 fi 1; i= 1,2, 3, ...,k
7. Ni=Ni-1+ni = Ni-Ni-1
8. El porcentaje correspondiente a un valor de la variable X se obtiene multiplicado la frecuencia relativa por 100 esto es (%)Xi = 100
2.2 REPRESENTACIONES GRAFICAS2.2 REPRESENTACIONES GRAFICASLa representación gráfica de una distribución de frecuencias depende del La representación gráfica de una distribución de frecuencias depende del tipo de variable. tipo de variable.
2.2.1 VARIABLES CUALITATIVAS2.2.1 VARIABLES CUALITATIVAS
Veremos dos tipos de representaciones: Veremos dos tipos de representaciones:
• Diagrama de sectores (tarta):
Está representación gráfica consiste en dividir un círculo en tantos sectores circulares como modalidades presente el carácter cualitativo, asignando un ángulo central a cada sector circular proporcional a la frecuencia absoluta ni, consiguiendo de esta manera un sector con área proporcional también a ni.
• El ángulo central se determina así:angulo=360ni/n
Ejemplo 4Ejemplo 4 Hacer el diagrama de sectores para tabla siguiente. Hacer el diagrama de sectores para tabla siguiente.
Causas Número de casos
Mala atención 20
Productos inconformes 3
Reclamos 10
Otras causas 1
Total 40
Causas Número de casos
Ángulo(grados)
Mala atención 26 234º
Productos inconformes
3 37º
Reclamos 10 90º
Otras causas 1 9º
Total 40 360º
360x26/40=234º360x3/4=27º360x10/40=90º360x1/40=9º Tabla 01. Número de Casos según causa
Grafico 01: Número de casos según CausasGrafico 01: Número de casos según Causas
Mala atención 26
Productos Inconformes
3
Reclamos, 10
Otros 1
Diagrama de rectángulos:Diagrama de rectángulos:
• Esta representación gráfica consiste en construir tantos rectángulos como categorías presente la variable cualitativa en estudio, todo ellos con base de igual amplitud. La altura se toma igual a la frecuencia absoluta o relativa (según la distribución de frecuencias que estemos representando), consiguiendo de esta manera rectángulos con áreas proporcionales a las frecuencias que se quieren representar.
Ejemplo.Ejemplo. Hacer el diagrama de rectángulos para tabla siguiente. Hacer el diagrama de rectángulos para tabla siguiente.
Causas Número de casos
Mala atención 20
Productos inconformes 3
Reclamos 10
Otras causas 1
Total 40
Grafico 01: Número de casos según CausasGrafico 01: Número de casos según Causas
Otras causasReclamosProductos inconformesMala atención
25
20
15
10
5
0
Causas
Ca
sos
Diagrama de rectángulos
2.2.2 VARIABLES CUANTITATIVAS: DATOS SIN 2.2.2 VARIABLES CUANTITATIVAS: DATOS SIN AGRUPARAGRUPAR
• Estudiaremos dos tipos de representaciones gráficas, correspondientes a distribuciones de frecuencias (absolutas o relativas) no acumuladas y acumuladas.
• Diagrama de barras:Consiste en levantar, para cada valor de la variable, una barra cuya altura sea su frecuencia absoluta o relativa, dependiendo de la distribución de frecuencias que estemos representando.
Ejemplo. Ejemplo. La tabla expresa el número de hijos de 25 familias, La tabla expresa el número de hijos de 25 familias, construya el diagrama de barras de las frecuencias relativas construya el diagrama de barras de las frecuencias relativas simples (fi) Nº de hijos(Xi) 0 1 2 3 4 Totalsimples (fi) Nº de hijos(Xi) 0 1 2 3 4 Total Nº de familias(ni) 5 6 8 4 2 25 Nº de familias(ni) 5 6 8 4 2 25
Numero de hijos
fi
Xi ni fi
0 5 0.20
1 6 0.24
2 8 0.32
3 4 0.16
4 2 0.08
25 1.00
Grafico 02. Número de hijos por familia
Diagrama de frecuencias acumuladas:Diagrama de frecuencias acumuladas:Esta representación gráfica se corresponde con la de una función Esta representación gráfica se corresponde con la de una función constante entre cada dos valores de la variable a representar, e constante entre cada dos valores de la variable a representar, e igual en cada tramo a la frecuencia relativa acumulada (o igual en cada tramo a la frecuencia relativa acumulada (o absoluta acumulada si se trata de representar una distribución de absoluta acumulada si se trata de representar una distribución de frecuencias absolutas) hasta el menor de los dos valores de la frecuencias absolutas) hasta el menor de los dos valores de la variable que construyen el tramo en el que es constante. variable que construyen el tramo en el que es constante. • Ejemplo . Graficar el diagrama de frecuencias relativas
acumuladas del ejemplo anterior
Xi ni fi
0 5 0.20
1 6 0.24
2 8 0.32
3 4 0.16
4 2 0.08
25 1.00
Número de Hijos
Fi
Grafico 03. Número de hijos por familia
2.2.3 VARIABLES CUANTITATIVAS: DATOS 2.2.3 VARIABLES CUANTITATIVAS: DATOS AGRUPADOS EN INTERVALOSAGRUPADOS EN INTERVALOS
• Existen dos tipos de representaciones gráficas dependiendo de si la distribución de frecuencias en estudio es de datos acumulados o de datos sin acumular.
• Histograma. Al ser esta representación una representación por áreas, hay que distinguir si los intervalos en los que aparecen agrupados los datos son de igual amplitud o no.
• Si la amplitud de los intervalos es constante, dicha amplitud puede tomarse como unidad y al ser
• Frecuencia (área) = amplitud del intervalo · altura,• la altura correspondiente a cada intervalo puede tomarse igual a la
frecuencia. • Si los intervalos tienen diferente amplitud, se toma alguna de ellas
como unidad (generalmente la menor) y se levantan alturas para cada intervalo de forma que la ecuación anterior se cumpla.
Ejemplo. Grafique los datos de la tablaEjemplo. Grafique los datos de la tabla
Ii ni fi
7.65 9.15 4
9.15 10.65 8
10.65 12.15 10
12.15 13.65 9
13.65 15.15 2
15.15-17.0 1
34
Polígono de frecuencias acumuladasPolígono de frecuencias acumuladas::Se utiliza para representar distribuciones de frecuencias (relativas o Se utiliza para representar distribuciones de frecuencias (relativas o absolutas) acumuladas. Consiste en representar la gráfica de una función absolutas) acumuladas. Consiste en representar la gráfica de una función que una por segmentos las alturas correspondientes a los extremos que una por segmentos las alturas correspondientes a los extremos superiores de cada intervalo, tengan o no todos igual amplitud, siendo superiores de cada intervalo, tengan o no todos igual amplitud, siendo dicha altura igual a la frecuencia acumulada, dando una altura cero al dicha altura igual a la frecuencia acumulada, dando una altura cero al extremo inferior del primer intervalo y siendo constante a partir del extremo inferior del primer intervalo y siendo constante a partir del extremo superior del último. extremo superior del último.
Ii ni fi Ni Fi
07.65 - 09.15 4 0.118 4 0.118
09.15 - 10.65 8 0.235 12 0.353
10.65 - 12.15 10 0.294 22 0.647
12.15 - 13.65 9 0.265 31 0.912
13.65 - 15.15 2 0.059 33 0.971
15.15 - 16.65 1 0.029 34 1
34 1
Polígono de frecuenciaPolígono de frecuencia
7.65 9.15 10.65 12.15 13.65 15.15 16.65
2.3 OTRAS REPRESENTACIONES GRAFICAS2.3 OTRAS REPRESENTACIONES GRAFICAS
2.3.1 DIAGRAMA TALLO- HOJA (STEM & LEAF)
De manera similar al histograma permite ver el lote como un todo y advertir aspectos como:
• Cuan aproximadamente simétricos son los datos.
• Cuan diversos están los valores.
• La aparición de los valores inesperadamente mas frecuentes,
• Si algunos valores están alejados del resto.
• Si hay concentraciones de valores.
• Si hay grupos separados.
CaracterísticasNo se pierde información.Divide el dato (número) en dos partes; tallo y hojaPuede haber 1, 2 o 5 líneas por tallo (el tallo se puede dividir en dos partes iguales o en 5 partes iguales)
Ejemplo 11. Ejemplo 11. Suponga que los siguientes datos representan el Suponga que los siguientes datos representan el salario anual de los obreros de la compañía Xsalario anual de los obreros de la compañía X20 14 21 29 43 17 15 26 08 14 39 23 16 46 28 11 26 35 26 28 30 20 14 21 29 43 17 15 26 08 14 39 23 16 46 28 11 26 35 26 28 30 22 23 07 32 19 22 18 27 0922 23 07 32 19 22 18 27 09Construya el diagrama tallo-hojaConstruya el diagrama tallo-hoja
• Ordenamos los datos
• 07 08 09 11 14 14 15 16 17 18 19 20 21 22 23 23 26 26 26 27 28 28 29 30 32 35 39 43 46
• Y separamos los datos en dos fracciones (dígitos), ejemplo el 07 se separa (0 y 7 ), el 08 (0 y 8) el 21(2 y 1) el 39(3 y 9)
• En este caso el tallo es el primer digito (decenas) y la hoja el ultimo (unidades)
Diagrama tallo - hojaDiagrama tallo - hoja
0 7 8 9
1 1 4 4 5 6 7 8 9
2 0 1 2 2 3 3 6 6 6 7 8 8 9
3 0 2 5 9
4 3 6
2.3.2 DIAGRAMA DE CAJA (BOX-2.3.2 DIAGRAMA DE CAJA (BOX-PLOT)PLOT)
• A diferencia de los otros gráficos ya vistos, los diagramas de caja hacen énfasis en las medidas de posición. Es muy útil para hacer comparaciones entre muestras de distintas poblaciones.
• Un diagrama de caja consiste en un rectángulo cuya longitud es el rango intercuartílico (IQR), dividido por un segmento a la altura de la mediana y complementado por dos líneas (llamadas bigotes) que parten de los extremos del rectángulo, cuya longitud no supera 1,5 veces el rango intercuartílico y que intentan alcanzar los valores mínimo y máximo observados.
• En un simple gráfico se suministra información sobre la mediana (o media), sobre el 50% y 90% de los datos, sobre la existencia de situaciones con datos atípicos, así como de la simetría de la distribución.
30
25
20
15
10
5
0
C1
3030
Diagrama Box-Plot
Q1=5
Q3=14
Q2=8
Li=Q1-1.5IQR
Ls=Q3+1.5IQR
IQR=9
Ejemplo. Ejemplo. Con base en una muestra de 20 entregas, Marco’s Pizza Con base en una muestra de 20 entregas, Marco’s Pizza determinó la siguiente información:determinó la siguiente información:Valor mínimo = 13 minutos, Q1 = 15 minutos, mediana = 18 minutos, Valor mínimo = 13 minutos, Q1 = 15 minutos, mediana = 18 minutos, Q3 = 22 minutos,Q3 = 22 minutos,Valor máximo = 30 minutosValor máximo = 30 minutosDesarrolle un diagrama de caja para los tiempos de entrega.Desarrolle un diagrama de caja para los tiempos de entrega.
Li = q1 - 1.5 IQR = 15 - 1.5 (22-15) = 15- 1.5(7) = 4.5, como min=13, el Li=13 y no 4.5
Ls = q3 + 1.5 IQR = 22 + 1.5 (22-15) = 22 + 1.5(7) = 32.5, como el máximo es 30 entonces Ls=30 y no 32.5
30
25
20
15
C3
Diagrama Box-Plot
2.3.3 DIAGRAMA DE PUNTOS (DOT-PLOT)2.3.3 DIAGRAMA DE PUNTOS (DOT-PLOT)
• Un Dotplot es una alternativa informal al Histograma para mostrar datos continuos. En el dotplot cada valor de los datos mostrado como un punto en el eje horizontal. Cuando dos valores se separan por menos de un cierto espacio se apilan en una columna. Si el incremento es muy pequeño es imposible ver la forma de la distribución. Sin embargo, si el incremento es muy grande entonces sólo se obtiene una columna de puntos.
Ejemplo. Los siguiente datos presenta los resultados observados del número de plántulas de malezas por m2 en una muestra de tamaño n=20.
5 3 4 7 5 9 8 4 7 4 5 1 4 5 8 4 7 5 3 5
Grafique el diagrama de punto o dot plot
2.3.4 DIAGRAMA DE PARETO2.3.4 DIAGRAMA DE PARETO
Se ordenan las categorías de mayor a menor frecuencia y se dibujan los rectángulos correspondientes. Es muy utilizado en controles de la calidad, donde cada clase representa un tipo de disconformidad o problema de producción.
Ejemplo 16.Ejemplo 16. Durante una jornada laboral el equipo de control de calidad Durante una jornada laboral el equipo de control de calidad decidió hacer un conteo de los defectos que se presentaban en los decidió hacer un conteo de los defectos que se presentaban en los elementos estructurales para puertas que se manufacturaban dentro de la elementos estructurales para puertas que se manufacturaban dentro de la empresa recabando los siguientes datos. Construir el diagrama de empresa recabando los siguientes datos. Construir el diagrama de Pareto de los defectos en elementos estructurales en puertas.Pareto de los defectos en elementos estructurales en puertas.
Defecto Cantidad Porcentaje del total
Fuera de perfil 30 37
Piezas desordenadas 21 26
Agujeros/ranuras perdidos 6 7
Fuera de secuencia 6 7
Partes no lubricadas 5 6
Piezas con rebabas 5 6
Abolladuras/Picaduras 4 5
Otros 4 5
Digama de paretoDigama de pareto
Cantidad 30 21 6 6 5 5 4 4Percent 37.0 25.9 7.4 7.4 6.2 6.2 4.9 4.9Cum % 37.0 63.0 70.4 77.8 84.0 90.1 95.1 100.0
Defecto
90
80
70
60
50
40
30
20
10
0
100
80
60
40
20
0
Canti
dad
Perc
ent
Pareto Chart of Defecto
Tabla de frecuenciaejercicios