Clase de estadistica 1ºparcial

13
Objetivo del curso Aplicar los conocimientos básicos esenciales de la estadística descriptiva y probabilística y las técnicas de inferencia estadística. Bibliografía Miller I., Freund J., Johnson R. Probabilidad y Estadística para Ingenieros. Prentice Hall. López R. Cálculo de Probabilidades e Inferencia Estadística. Universidad Católica Andrés Bello. Meyer P. Probabilidad y Aplicaciones Estadísticas. Fondo educativo interamericano. Spiegel M. Probabilidad y Estadística. McGraw-Hill. Sinopsis. Estadística descriptiva. Conjuntos. Subconjuntos. Espacios muestrales. Eventos. Algebra de conjuntos. Análisis combinatorio. Teoremas elementales de la probabilidad. Probabilidad condicional. Concepto de variable aleatoria. Variables aleatorias discretas. Algunas importantes distribuciones probabilísticas discretas: distribución binomial, distribución hipergeométrica, distribución de Poisson, distribución geométrica, variables aleatorias continuas. Algunas importantes distribuciones probabilísticas continuas: distribución uniforme, distribución exponencial, distribución gamma y distribución normal. Sinopsis Variables aleatorias: función de variables aleatorias, variables aleatorias bidimensionales, distribuciones probabilisticas condicionadas y marginales, variables aleatorias n dimensionales, distribución multinomial, Esperanza matemática: variables aleatorias discretas y continuas, momentos respecto al origen y respecto a la media, función generadora de momentos, teorema de Chevichav. Ley de los grandes números, teorema del límite central, la distribución de la suma de un número finito de variables aleatorias, muestras y poblaciones, distribución F, distribución t, distribución chi cuadrado. Estadística : “Ciencia de recoger, presentar, analizar e interpretar datos numéricos y constituye la rama del saber humano que tiene como objeto el estudio de ciertos métodos inductivos aplicables a fenómenos susceptibles de expresión cuantitativa”.(*)

Transcript of Clase de estadistica 1ºparcial

Page 1: Clase de estadistica 1ºparcial

Objetivo del curso

Aplicar los conocimientos básicos esenciales de la estadística descriptiva y probabilística y las técnicas de inferencia estadística.

Bibliografía

• Miller I., Freund J., Johnson R. Probabilidad y Estadística para Ingenieros. Prentice Hall.

• López R. Cálculo de Probabilidades e Inferencia Estadística. Universidad Católica Andrés Bello.

• Meyer P. Probabilidad y Aplicaciones Estadísticas. Fondo educativo interamericano.

• Spiegel M. Probabilidad y Estadística. McGraw-Hill.

 Sinopsis.

• Estadística descriptiva. Conjuntos. Subconjuntos. Espacios muestrales. Eventos. Algebra de conjuntos. Análisis combinatorio. Teoremas elementales de la probabilidad. Probabilidad condicional.

• Concepto de variable aleatoria. Variables aleatorias discretas. Algunas importantes distribuciones probabilísticas discretas: distribución binomial, distribución hipergeométrica, distribución de Poisson, distribución geométrica, variables aleatorias continuas. Algunas importantes distribuciones probabilísticas continuas: distribución uniforme, distribución exponencial, distribución gamma y distribución normal.

Sinopsis

• Variables aleatorias: función de variables aleatorias, variables aleatorias bidimensionales, distribuciones probabilisticas condicionadas y marginales, variables aleatorias n dimensionales, distribución multinomial, Esperanza matemática: variables aleatorias discretas y continuas, momentos respecto al origen y respecto a la media, función generadora de momentos, teorema de Chevichav.

• Ley de los grandes números, teorema del límite central, la distribución de la suma de un número finito de variables aleatorias, muestras y poblaciones, distribución F, distribución t, distribución chi cuadrado.

Estadística: “Ciencia de recoger, presentar, analizar e interpretar datos numéricos y constituye la rama del saber humano que tiene como objeto el estudio de ciertos métodos inductivos aplicables a fenómenos susceptibles de expresión cuantitativa”.(*)

(*) López R. Cálculo de Probabilidades e Inferencia Estadística con tópicos de econometría.

Estadística Descriptiva: Comprende los métodos de agrupamiento de datos numéricos y cálculo de ciertas magnitudes a partir de ellos con el objeto de describir al grupo. (*)

Page 2: Clase de estadistica 1ºparcial

Estadística Estimativa o Inferencia Estadística:

La estadística Inferencial, es el proceso por el cual se deducen (infieren) propiedades o características de una población a partir de una muestra significativa.

Población: es la colección de todas las posibles mediciones u observaciones que pueden hacerse de una variable bajo estudio.

Población Finita: Es aquella que incluye una cantidad limitada contable de observaciones, individuos o medidas. Siempre que sea posible alcanzar (contar) el número total de todas las posibles mediciones, se considera como finita la población.

 Población Infinita: Es aquella que incluye un gran conjunto de observaciones o mediciones que no pueden alcanzarse por conteo. Al menos, hipotéticamente, no existe límite en cuanto al número de observaciones que el experimento puede generar.

Page 3: Clase de estadistica 1ºparcial

Muestra: Es un conjunto de mediciones u observaciones tomadas a partir de una población. Es un subconjunto de una población.

Muestra Aleatoria: Se considera aleatoria siempre y cuando cada observación, medición o individuo de la población tenga la misma probabilidad de ser seleccionado.

Variables: Son las características o lo que se estudia de cada individuo de la muestra.

Datos: Son los valores que toma la variable en cada caso.

Datos cualitativos: Son datos que solo toman valores asociados a las cualidades o atributos, clasificándolos en una de varias categorías, es decir, no son valores numéricos.

Page 4: Clase de estadistica 1ºparcial

Datos cuantitativos: Provienen de variables que pueden medirse, cuantificarse o expresarse numéricamente.

Tipos de variables cuantitativas:

– Discretas: es aquella que solo puede tomar un número finito o infinito numerable de valores. Ejemplo: cantidad de hermanos.

– Continuas: es la variable que puede tomar cualquier valor en una escala continua. Ejemplo: cantidad de líquido contenido en un recipiente.

Escalas de medida:

Escala Nominal.• Escala Ordinal.• Escala de Intervalos.• Escala de Razón o Proporción.• Escala Absoluta.

Escala nominal: Los datos se pueden agrupar en categorías que no mantienen una relación de orden entre si, por lo tanto no están definidas las operaciones lógicas (>, <, £, ³) sino solo las de igualdad o diferencia. Ejemplos: color de ojos, sexo, profesión, estado civil, religión. Escala Ordinal: Existe un cierto orden o jerarquía entre las categorías (>, <, £, ³).Ejemplos: grados militares, organigrama de una empresa, escalafón de los profesores universitarios, grados de disnea, estadiaje de un tumor.

Escala de Intervalo: Valores numéricos de las variables y además de las relaciones de orden (>, <, £, ³), se pueden establecer distancias, es decir, tienen sentido las operaciones de suma y resta. Tiene dos propiedades:

• Existe una unidad de medida que se mantiene constante para todos los valores que toma la variable.• Existe un valor patrón u origen relativo que no significa la ausencia de valor en la variable.

Page 5: Clase de estadistica 1ºparcial

Escala de razón o proporción: Es la más completa y general de todas las escalas. Se caracteriza porque los valores de la variable son números entre los cuales, además de las relaciones de orden (>, <, £, ³) y distancia (+,-), se pueden establecer múltiplos y proporciones. Ejemplos: peso, altura, volumen…

Escala absoluta: Se caracteriza porque los valores que toma la variable son el resultado de contar y por lo tanto, está constituida por los enteros positivos y el cero. Ejemplos: número de hermanos, cantidad de autos vendidos, cantidad de accidentes en una intersección, cantidad de hijos,…

Abusos que se pueden cometer con la Estadística:• Conclusiones erróneas debido a que los datos son numéricamente insuficientes.• Representaciones gráficas engañosas (escalas).• Datos muestrales no representativos:

– Muestra que no incluye a elementos de toda la población.– Ciertas categorías de personas no responden correctamente.– Respuestas voluntarias (sesgadas).

Manejo de Datos: Los gráficos y estadísticos frecuentemente usados por la estadística descriptiva son:• Diagramas de Pareto • Diagrama de puntos• Distribuciones de frecuencias• Gráficas de las distribuciones de frecuencia• Diagramas de tallos y hojas• Medidas descriptivas• Cuartiles y percentiles.

Diagrama de Pareto. “Este diagrama describe gráficamente la ley empírica de Pareto que dice que cualquier conjunto de eventos consiste de unos pocos elementos principales y muchos secundarios.” (**)

Ejercicio 1.- Las pérdidas en una fábrica de papel, (en miles de dólares), debidos a la ruptura de la hoja se pueden dividir de acuerdo con el producto en: Papel higiénico 132 , toallas 85, servilletas 43, 12 productos mas 50.• Dibújese un diagrama de Pareto.• ¿Qué porcentaje de pérdidas se tiene al hacer papel sanitario y toallas?• ¿Qué porcentaje de los productos se corresponde aproximadamente con el 80% del porcentaje de

pérdidas”.

Diagrama de Puntos. Los diagramas de puntos sirven para presentar gráficamente tablas en las cuales se consideran únicamente una variable y una cantidad asociada a cada valor de la misma.

Page 6: Clase de estadistica 1ºparcial

Ejercicio 2.- A continuación se dan 15 mediciones del punto de ebullición de un compuesto de Silicio (en grados centígrados) 166, 141, 136, 153, 170, 162, 155, 146, 183, 157, 148, 132, 160, 175 y 150. Hágase un diagrama de puntos.

Distribución de Frecuencias. Es el ordenamiento tabular de los datos por clases conjuntamente con el número de elementos que pertenecen a cada clase (frecuencias de clases).

• frecuencias absolutas : es el número de veces que aparece en la muestra un valor de la variable y se representa por fi.

• frecuencias relativas: es el cociente entre la frecuencia absoluta y el tamaño de la muestra (N). La denotaremos por fri.

• frecuencias absoluta acumulada: La frecuencia absoluta acumulada de un valor de la variable, es el número de veces que ha aparecido en la muestra un valor menor o igual que el de la variable y lo representaremos por fa, se puede acumular, en la tabla estadística) en orden ascendente (fa↑) o descendente (fa↓).

• frecuencia relativa acumulada: al igual que en el caso anterior se calcula como el cociente entre la frecuencia absoluta acumulada dividido por el tamaño de la muestra (N) y la denotaremos por fra.

Clases P.M. Xi

fi fr fa↓ fa↑ fra↓ fra↑

7.420 – 21.835 14.628 10 0.33 10 30 0.33 1.00

21.835 – 36.250 29.043 4 0.13 14 20 0.46 0.6736.250 – 50.665 43.458 5 0.17 19 16 0.63 0.54

50.665 – 65.080 57.873 3 0.10 22 11 0.73 0.37

65.080 – 79.495 72.288 3 0.10 25 8 0.83 0.27

79.495 – 93.910 86.703 5 0.17 30 5 1.00 0.17Total XXX 30 1.00 XXX XXX XXX XXX

Distribución de frecuencias para variables discretas

Valores de la variable Xi

(datos)

frecuencias absolutas

fi

frecuencias relativas

fi/N

X1 f1 f1/N

X2 f2 f2/N

Page 7: Clase de estadistica 1ºparcial

… … …

… … …

Xn fn fn/N

Donde: N= fi y fi/N=1Σ Σ

Ejercicio 3.- Se realizó una encuesta entre un grupo de madres solteras, para analizar los problemas económicos que enfrentan, en determinada comunidad; y arrojó los siguientes resultados acerca del número de niños en el hogar.

1 4 2 3 5 3 5 3 3 5

1 1 2 1 4 1 2 1 4 1

2 1 1 2 1 2 3 2 3 3

3 1 3 4 1 1 3 5 4 2

2 3 1 4 2 3 1 2 5 1

Construya la tabla de distribución de frecuenciaDISTRIBUCIÓN DE FRECUENCIA DEL NÚMERO DE HIJOS EN EL HOGAR EN MADRES SOLTERAS.

Valores de la

variable Xi (N°

de hijos)

Frecuencia Absoluta

(fi)

Frecuencia Relativa

(fri)

Frecuencia Absoluta

Acumulada (fa)

Frecuencia Absoluta

Acumulada (fa)

Frecuencia Relativa

Acumulada (fra)

Frecuencia Relativa

Acumulada (fra)

1

2

3

4

5

Reglas generales para construir distribuciones de frecuencias por intervalos

1.- Efectuar el arreglo ordenado (Ascendente o Descendente) de la población o muestra.

2.- Encontrar el rango o recorrido (R) de los datos:

R = (valor mayor – valor menor) = Xn – X1

3.- Encontrar el número de clases o intervalos de clases (K). El número de clases debe ser tal que se evite el detalle innecesario, pero que no conduzca a la perdida de más información de la que puede ser convenientemente ignorada. Para este cálculo se utiliza la formula de Sturges.

K = 1 + 3.322(log. N)

Page 8: Clase de estadistica 1ºparcial

4- Determinar la amplitud de la clase ( C ):

C=R/K

Nota: el resultado siempre se aproxima al siguiente entero si excede al número entero obtenido, no importa el monto de la fracción excedida al entero.

El dato menor (X1) será el limite inferior de la primera clase. A él se le suma C y se obtiene el limite superior de la primera clase que también será el limite inferior de la segunda clase. Luego se suma nuevamente C y se obtiene el limite superior del segundo intervalo e inferior del tercero. Y así sucesivamente hasta que el limite superior corresponda o supere ligeramente el valor mayor ( Xn ), la cantidad de clases obtenidas deberá corresponder con el número K calculado mediante la formula de Sturges

Una vez construidos los intervalos se calculan, mediante tabulación de acuerdo a los límites inferiores y superiores de las clases, las frecuencias absolutas, relativas, porcentuales y acumuladas correspondientes.

Con los datos obtenidos se procede a construir la tabla de distribución de frecuencia.

Histograma de FrecuenciaUn histograma es un gráfico que sirve para representar una distribución de frecuencias. Este gráfico está formado por un conjunto de rectángulos (caso de variables continuas) que tienen como base un eje horizontal (generalmente el eje de las abscisas o de las X), y como centro los puntos medios de las clases. Los anchos de las clases y las áreas de los rectángulos son proporcionales a las frecuencias de las clases. En el caso de las variables discretas el gráfico consiste de un conjunto de barras verticales en lugar de rectángulos, hallándose cada barra sobre la observación respectiva y con una altura proporcional a la frecuencia de la observación.

Polígono de FrecuenciasEl polígono de frecuencias es un gráfico formado por líneas quebradas, que tiene los centros de las clases representadas en un eje horizontal (eje de las X) y las frecuencias de las clases en un eje vertical (eje de las Y). La frecuencia correspondiente a cada centro de clase se señala mediante un punto y luego los puntos consecutivos se unen por líneas rectas. Del correspondiente histograma se puede lograr el polígono de frecuencia uniendo los puntos medios de las bases superiores de cada rectángulos mediante líneas rectas.

Page 9: Clase de estadistica 1ºparcial

Ojivas.Las ojivas se refieren a los gráficos que se construyen utilizando una distribución acumulativa de frecuencias, el orden de acumulación se aplica al cuadro de distribución de frecuencia y puede ser descendente (fa↓, fra↓) o ascendente (fa↑, fra↑). La figura que se forma al unir los puntos del polígono de frecuencias acumulativas es lo contrario del orden anunciado (por ejemplo si se utilizó el orden descendente en la acumulación de los datos en el cuadro, la ojiva resulta ser ascendente).

Ejercicio 4.- Los siguientes datos son los tiempos de ignición de ciertos materiales de tapicería expuestos al fuego (en segundos). Agrúpense estos datos en una tabla con un número apropiado de clases iguales y constrúyase un histograma, el polígono de frecuencia y

2,58 2,51 4,04 6,43 1,58 4,32 2,20 4,19 4,79 6,20

1,52 1,38 3,87 4,54 5,12 5,15 5,50 5,92 4,56 2,46

6,90 1,47 2,11 2,32 6,75 5,84 8,80 7,40 4,72 3,62

2,46 8,75 2,65 7,86 4,71 6,25 9,45 12,8 1,42 1,92

7,60 8,79 5,92 9,65 5,09 4,11 6,37 5,40 11,25 3,90

5,33 8,64 7,41 7,95 10,60 3,81 3,78 3,75 3,10 6,43

1,70 6,40 3,24 1,79 4,90 3,49 6,77 5,62 9,70 5,11

4,50 2,50 5,21 1,76 9,20 1,20 6,85 2,80 7,35 11,75

Medidas de Tendencia Central• MEDIA• MODA• MEDIANA

Media Aritmética

Page 10: Clase de estadistica 1ºparcial

• La media aritmética es el valor obtenido al sumar todos los datos y dividir el resultado entre el número total de datos. es el símbolo de la media aritmética.

Media Aritmética para Datos Agrupados.• Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la media es:

  Ejemplo de Media Aritmética para datos Agrupados.

li - li+1 xi f

i x

i*f

i

[56 – 59) 54,5 2 109,0

[59 – 62) 57,5 5 287,5

[62 – 65) 60,5 9 544,5

[53 – 56) 63,5 15 952,5

[65 – 68) 66,5 12 798,0

[68 – 71) 69,5 5 347,5

[71 – 74) 72,5 2 145,0

Total 50 3184

Media Aritmética PonderadaA veces se asocia a los números de un conjunto de datos, ciertos factores o pesos y es por ello que la media aritmética ponderada es un promedio que se calcula a fin de tener en cuenta la importancia de cada valor para el total global.

Propiedades la media aritmética• La suma de las desviaciones de todas las puntuaciones de una distribución respecto a la media de la

misma igual a cero.

 • La media aritmética de los cuadrados de las desviaciones de los valores de la variable con

respecto a un número cualquiera se hace mínima cuando dicho número coincide con la media aritmética.

= 3184/50 = 63,68

Page 11: Clase de estadistica 1ºparcial

Propiedades de la media aritmética• Si a todos los valores de la variable se les suma un mismo número, la media aritmética queda

aumentada en dicho número.• Si todos los valores de la variable se multiplican por un mismo número la media aritmética queda

multiplicada por dicho número.

Observaciones de la Media Aritmética• La media se puede hallar sólo para variables cuantitativas.• La media es independiente de las amplitudes de los intervalos.• La media es muy sensible a las puntuaciones extremas. • La media no se puede calcular si hay un intervalo con una amplitud indeterminada.

Moda• La moda es el valor que tiene mayor frecuencia absoluta. • Se representa por Mo. • Se puede hallar la moda para variables cualitativas y cuantitativas.• Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la

máxima, la distribución es bimodal o multimodal, es decir, tiene varias modas.

Mediana• Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor a

mayor. • La mediana se representa por Me. • La mediana se puede hallar sólo para variables cuantitativas.

Cálculo de la Mediana• Ordenamos los datos de menor a mayor. • Si la serie tiene un número impar de medidas la mediana es la puntuación central de la misma.

2, 3, 4, 4, 5, 5, 5, 6, 6 Me= 5• Si la serie tiene un número par de puntuaciones la mediana es la media entre las dos puntuaciones

centrales. 7, 8, 9, 10, 11, 12 Me= 9.5