Estadistica 1-Folleto de Clase _2015

54
7/21/2019 Estadistica 1-Folleto de Clase _2015 http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 1/54 PONTIFICIA UNIVERSIDAD CATOLICA MADRE Y MAESTRA FACULTAD DE CIENCIAS DE LAS INGENIERIAS DEPARTAMENTO DE INGENIERIA INDUSTRIAL FOLLETO DE CLASE ASIGNATURA: Estadística I para ingenieros PREPARADO POR: Juan F. Féliz Peña Santiago de los caballeros República Dominicana 2015

Transcript of Estadistica 1-Folleto de Clase _2015

Page 1: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 1/54

PONTIFICIA UNIVERSIDAD CATOLICA MADRE Y MAESTRA

FACULTAD DE CIENCIAS DE LAS INGENIERIAS

DEPARTAMENTO DE INGENIERIA INDUSTRIAL 

FOLLETO DE CLASE

ASIGNATURA:

Estadística I para ingenieros 

PREPARADO POR:Juan F. Féliz Peña

Santiago de los caballeros

República Dominicana

2015

Page 2: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 2/54

  1

INDICE

Contenidos: Página 1. Definiciones de estadística. 4

2. Clasificación de la estadística.2.1 Estadística descriptiva.2.2 Estadística inferencial.

444

3. Variables.3.1 Variable cualitativa.3.2 Variable cuantitativa.

555

4. Tipos de población.4.1 Población grande.

4.2 Población pequeña.

55

5

5. Algunas simbologías a usar en estadística. 6

6. Recopilación de información.6.1 Censo.6.2 Muestreo.

666

7. Tipos de muestreos 7

8. Muestreo aleatorio simple. 7

9. Muestreo estratificado. 7

10. Muestreo sistemático. 8

11. Muestreo por conglomerados. 8

10. Gráficos estadísticos.10.1 Gráfico lineal.10.2 Gráfico de barras.10.3 Gráfico circular o de pastel.

89

1010

11. Distribución de frecuencia.11.1 Datos cualitativos.11.2 Datos cuantitativos.11.3 Frecuencia absoluta.

11111111

12. Tabla de frecuencia o distribución de frecuencia. 12

13. Intervalos de clase. 12

14. Pasos para construir una tabla de frecuencia para

Datos cuantitativos.

12

Page 3: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 3/54

  2

INDICE

Contenidos: Página

15. Representación gráfica de las distribuciones dede frecuencia.15.1 Histograma.15.2 Polígono de frecuencia.15.3 Ojiva.

14

141516

16. Distribución de frecuencia para datos cualitativos. 16

17. Medidas de tendencia central. 17

18. Medidas de tendencia central para no agrupados. 17

19. Medidas de tendencia central para datos agrupados. 19

20. Medidas de variabilidad o dispersión. 21

21. Medidas de dispersión para datos no agrupados. 21

22. Medidas de dispersión para datos agrupados. 23

23. Cuartiles. 24

24. Coeficiente de variación. 24

25. Coeficiente de sesgo. 24

26. Coeficiente de curtosis. 26

27. Media de medias. 28

28. Características de las medidas de tendencia central. 29

29. Características de las medidas de dispersión. 30

30. Probabilidad. 32

31. Experimento probabilístico. 32

32. Eventos mutuamente excluyentes. 32

33. Definiciones de probabilidad. 33

34. Eventos independientes. 34

35. Leyes elementales de la probabilidad. 34

Page 4: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 4/54

  3

INDICE

Contenidos: Página

36. Eventos conjuntos. 35

37. Diagrama de árbol. 36

38. Probabilidad condicional. 36

39. Teorema de Bayes. 37

40. Muestras ordenadas sin repetición. 37

41. Permutación con repetición. 37

42. Muestras no ordenadas sin repetición. 38

43. Distribución de probabilidad empírica. 38

44. Aplicación del valor esperado a cálculos de costo. 40

45. Distribución de probabilidad empírica continua. 41

46. Distribución de probabilidad teórica. 41

47. Distribución binomial. 42

48. Distribución multinomial. 43

49. Distribución hipergeométrica.49.1 Distribución hipergeométrica multivariada

4445

50. Distribución geométrica. 45

51. Distribución poisson. 46

52. Aproximación de la distribución poisson a la binomial 48

53. Distribución normal. 48

54. Distribución uniforme. 50

55. Distribución exponencial. 51

56. Distribución T o T-student.. 52

57. Distribución Chi-cuadrada. 52

Page 5: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 5/54

  4

Definiciones de estadística:

1- Es la ciencia, pura y aplicada, que crea, desarrolla y aplica técnicas de

modo que pueda evaluarse la incertidumbre derivada de inferencias

inductivas.

2- Campo de la ciencia que se encarga de la recopilación, organización,

presentación, análisis e interpretación de los datos o información.

3- Es el campo de la ciencia que trata de la recolección, presentación,

análisis y uso de los datos para tomar decisiones, solucionar problemas y

diseñar productos y procesos.

Clasificación de la estadística.

I- Estadística descriptiva.  Esta parte de la estadística trata del resumen

y descripción de los datos. Dicho resumen puede ser tabular, gráfico o

numérico. El análisis se limita en sí mismo a los datos coleccionados y no

se realiza inferencia alguna o generalizaciones acerca de la totalidad

(población) de donde provienen esas observaciones.

II- Estadística inferencial.  Esta parte se utiliza para hacer predicciones

acerca de un todo (población) o tomar decisiones basándose en la

información contenida en una muestra.

Page 6: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 6/54

  5

Variables.

Variable. Es una característica que puede asumir cualquier valor; las

variables pueden ser cuantitativas o cualitativas.

Cualitativa

Variable  Discreta

Cuantitativa

Continua

Variable cualitativa. Una variable es cualitativa cuando no es medible,

pero puede ser numerable. Tales como nivel educativo, estatus social,

entre otras.

Variable cuantitativa.  Es aquella que asume valores acompañados

por una unidad de medida. Pueden ser discretas o continuas; es

cuantitativa continua cuando admite decimales y es cuantitativa discreta

cuando no admite decimales. Ejemplo: peso, estatura.

Tipos de poblaciones.

Población pequeña (población finita).  Está compuesta o constituida por

una cantidad limitada o determinada de elementos.

Población grande (población infinita).  Está compuesta por una

cantidad ilimitada o indeterminada de elementos.

Page 7: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 7/54

  6

Algunas de las simbologías que se usan en estadística.

N : Tamaño de la población.

n : Tamaño de la muestra.

Si n ≥ 10% N, entonces el tamaño de la muestra se considera como

grande.

Si n ≥≥≥≥ 30, el tamaño de la muestra es grande.

Recopilación de información o datos. 

La recopilación de datos o información puede efectuarse a través de

censos o muestreos.

Censo. 

Es la recopilación de datos de una población “completa”. Se

recomiendan:

1- En poblaciones pequeñas.

2- Cuando no hay limitaciones de recursos.

3- Cuando la prueba no es destructiva.

Muestreo. 

Es la recopilación de datos de una parte de la población mediante la cual

se emiten conclusiones de la población total. Se recomiendan:

1- En poblaciones grandes o pequeñas.

2- Cuando hay limitaciones de recursos.

3- Cuando la prueba es destructiva.

4- Cuando la prueba es muy monótona. 

Page 8: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 8/54

  7

Tipos de muestreos.

1- Muestreo aleatorio simple.

2- Muestreo aleatorio estratificado.

3- Muestreo aleatorio sistemático.

4- Muestreo aleatorio por conglomerados o áreas.

Muestreo aleatorio simple. 

Es aquel en que cada elemento de la población tiene la misma

probabilidad de ser seleccionado en la muestra. Se recomienda:

1- En poblaciones homogéneas.

2- Para poblaciones pequeñas.

3- Cuando se tiene algún listado, una base de datos o un conocimiento

muy específico acerca de los elementos que constituyen la población.

Muestreo aleatorio estratificado.

Se utiliza en poblaciones heterogéneas, la cual se pueda subdividir por

categorías o estratos homogéneos entre sí. Dicho muestreo puede ser

proporcional o no proporcional. El muestreo es proporcional si cada estrato

aparece en la muestra en la misma proporción que se encuentra en la población;

el muestreo es no proporcional si no guarda dicha relación. Se recomienda:

1- En poblaciones heterogéneas.2- En poblaciones pequeñas.

3- Conocer la composición de la población, categorías o estratos, cantidad de

elementos en cada una.

Page 9: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 9/54

  8

Muestreo aleatorio sistemático. 

El muestreo sistemático es aquel en el cual cada k-ésimo se selecciona de

una lista que representa una población o un estrato de la población. El

primer elemento se escoge al azar de los primeros K elementos. Se utiliza

en poblaciones moderadamente homogéneas y pequeñas. El muestreo

sistemático asegura que los elementos muestreados se esparcirán de

manera uniforme en la población.

K = N / n.

Muestreo aleatorio por conglomerados.

Es el procedimiento por el cual la población se divide en varios grupos o

conglomerados. Luego se extraen muchos de esos conglomerados para

formar la muestra, y se selecciona una submuestra (posiblemente 100%)

de elementos componentes de cada uno de los conglomerados

especificados. En este tipo de muestreo se pueden combinar el muestreo

aleatorio estratificado y/o el aleatorio simple. Este muestreo por lo general

se realiza en varias etapas, se denomina bietápico si se efectúa en dosetapas y si se realiza en más de dos etapas se le llama multietápico.

Gráficos estadísticos.

Una forma de presentar los datos, bien sea recopilados mediante censo o

muestreo, son los gráficos estadísticos. Su objetivo principal es

provocar un impacto visual en los usuarios. Se recomiendan cuando

se desea obtener conclusiones rápidas, siempre y cuando la precisión

numérica no sea de extrema importancia.

Un gráfico estadístico está compuesto por tres partes o elementos:

1- Título.  Este debe responder a las preguntas ¿qué?, ¿cómo?,

¿cuándo? Y ¿dónde?

¿Qué? Lo que se está representando en el gráfico.

¿Cómo?  En que unidades están expresados los datos.

Page 10: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 10/54

  9

¿Cuándo?  La fecha a la que corresponde la información.

¿Dónde?  El lugar de procedencia de la información.

2- Cuerpo del gráfico.  Es el esqueleto o gráfico en sí.

3- La fuente.  De dónde se obtuvieron los datos o informaciones.

Clasificación de los gráficos estadísticos:

Gráfico lineal.

Se utiliza para variables cuantitativas, generalmente continuas, en él se

pueden representar una o más variables. En un sistema de coordenadas

cartesianas los puntos “x, y” se unen por segmentos de recta. A cada

variable “x” le corresponde un valor a una altura “y”. Pueden ser simples o

compuestos.

Variación en los vólumenes de ventas de unidades de cigarros

de la empresa "La Aurora" para el periodo del 2002 - 2004.

0

2000000

4000000

6000000

8000000

10000000

12000000

14000000

2002 2003 2004

Local

Extranjero

Fuente: La Aurora, Santiago. República Dominicana.

Page 11: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 11/54

  10

Gráfico de barras.

Está formado por una serie de rectángulos en el cual el ancho de la base

es arbitrario, pero la altura es proporcional al valor de la variable que se

quiere representar. Pueden ser simples, compuestos, verticales u

horizontales.

horizontales.

Los doce países con los Índice de Desarrollo Humano más altos en el año 2014

0.944

0.933

0.917

0.915

0.914

0.911

0.910

0.902

0.901

0.900

0.899

0.898

0.870 0.880 0.890 0.900 0.910 0.920 0.930 0.940 0.950

Noruega

Australia

Suiza

Países Bajos

Estados Unidos

Alemania

Nueva Zelanda

Canadá

Singapur

Dinamarca

Irlanda

Suecia

Fuente: informe de Desarrollo Humano 2014 (ONU) 

Gráfico circular.

Se utiliza cuando nos interesa resaltar la proporción (porcentaje) en queaparece una característica o atributo respecto al total. Para construir el

diagrama circular partimos del hecho de que un círculo encierra un total de

360 grados, luego repartimos los 360° en distintos sectores circulares de

acuerdo con cada porcentaje.

Page 12: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 12/54

  11

Distribución porcentual del nivel escolar de los empleados y trabajadores

de la "ABC Electronic Industries Inc." para el año 2006.

Básico

13%

Medio

37%Superior

29%

Tecnología

13%

Licenciatura3%

Con postgrado

5%

 

Fuente: Departamento de Recursos Humanos, ABC Electronic Industries Inc.

Distribución de frecuencia.

Es un arreglo ordenado para hacer más comprensible un conjunto de

observaciones y para que adquieran significado. Al agrupar los datos se

logra una mayor síntesis, los datos pueden ser cuantitativos y cualitativos.

Datos cuantitativos.  Son aquellos cuya determinación está asociada a

una unidad de medida.

Datos cualitativos.  Son aquellos que se refieren a atributos o

características no medibles; tales como gusto, sabor, religión, entre otras.

Frecuencia absoluta (fi).  Es el número de veces que se repite un dato

particular o fenómeno.

Page 13: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 13/54

  12

Tabla de frecuencia o distribución de frecuencia.

Es un arreglo de las frecuencias con que ocurre cada característica en

que se han dividido los datos. Esta característica puede estar

determinada por una cualidad o un intervalo, llamado intervalo de clase.

La tabla de frecuencia también es conocida con el nombre de distribución

de frecuencia. Cuando hacemos un resumen de este tipo se obtiene una

mayor aproximación en la identificación de las características

sobresalientes de los datos, pero se pierde información por el proceso

llamado condensación.

Intervalos de clase.

Es cada uno de los intervalos en que se ha decidido agrupar parcialmente

los datos con el propósito de hacer un resumen de ellos. El número de

mediciones que quedan dentro del intervalo se llama frecuencia del

intervalo y se denota fi. La diferencia entre extremo mayor y el extremo

menor de un intervalo se llama longitud o ancho del intervalo.

Pasos para construir una tabla de frecuencia para datos

cuantitativos:

1- Verificar que el conjunto posee 20 ó más observaciones.

2- El número de intervalo debe escogerse de acuerdo con el número de

datos del conjunto. El número K de intervalo que se aconseja, pero no

siempre resulta adecuado, tomar de acuerdo con el número de datos es el

dado por la fórmula de Sturges (Si n < 500):

K = 1 + (3.322 * log n)

5≤  K ≤ 15

Page 14: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 14/54

  13

3- Una vez escogido el valor K de intervalos, se determina la longitud L 

que deben tener los intervalos.

L = (DM – Dm) / K = R / K

R = DM – Dm

El número resultante de la diferencia entre el dato mayor y el dato menor

se llama amplitud o rango. El valor de la longitud se toma con un grado de

aproximación no mayor a aquel con el que se registran los datos.

Redondear L al impar más próximo (más cercano).

4- El primer intervalo debe contener o incluir al menor de los datos y el

último intervalo al dato mayor.

LSi = LIi + L – ∆ 

LSu = LS1 + (L * Km)

Frecuencia acumulada (Fi).  Es aquella que totaliza las frecuencias

absolutas anteriores al intervalo deseado incluyendo a él mismo.

Fi = Fi-1 + fi = ∑fi 

Frecuencia relativa absoluta (fri).  Es el cociente entre cada frecuencia

absoluta y el número total de observaciones (datos), puede expresarse en

decimal o porcentaje.

fri = fi / n

Frecuencia relativa acumulada (FRi).  Es el cociente entre cada

frecuencia acumulada y el número total de datos, puede expresarse en

decimal o porcentaje.

FRi = FRi-1 + fri = ∑fri = Fi / n

Page 15: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 15/54

  14

Marca de clase (Xi).

Es un valor representativo de un intervalo de clase, cuya magnitud

coincide con el punto medio de dicho intervalo.

Xi = (LIi + LSi) / 2

Donde:

LIi : límite de clase inferior.

LSi : límite de clase superior.

Límites reales de clase (LR).

Es otra manera de expresar los intervalos de clase, su característica

principal consiste en que el límite real superior de un intervalo dado

coincide con el límite real inferior del intervalo siguiente.

LRSi = (LSi + LIi+1) / 2.

LRIi = LRSi – L.

Representaciones gráfica de las distribuciones de frecuencia.

Existen tres tipos de gráficos mediante los cuales podemos representar

una distribución de frecuencia. Tales gráficos son: histograma, polígono

de frecuencia y ojiva.

Histograma.

Es una sucesión de rectángulos construidos sobre un sistema de

coordenadas cartesianas de la manera siguiente:

1- Las bases de los rectángulos (límites reales) se localizan en el eje

horizontal. El ancho de las bases es igual a la longitud de los intervalos.

2- Las alturas de los rectángulos se registran sobre el eje vertical y

corresponden a las frecuencias de las clases.

Page 16: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 16/54

  15

Las áreas de los rectángulos son proporcionales a las frecuencias de las

clases. Los histogramas se pueden construir con las frecuencias

absolutas, las acumuladas, las relativas absolutas o las relativas

acumuladas. Pero normalmente se construye con las frecuencias

absolutas.

Distribución de las calificaciones de estudiantes de ingeniería en Estadística I para ingenieros

5

8

16

21

15

7

3

0

5

10

15

20

25

1

50,5-57,5 57,5-64,5 64,5-71,5 71,5-78,5 78,5-85,5 85,5-92,5 92,5-99,5  

Polígono de frecuencia.

Se construye sobre un sistema de coordenadas cartesianas al colocar

sobre cada marca de clase, localizada en el eje “X”, un punto a una altura

igual al valor de la frecuencia absoluta o relativa absoluta asociada a esa

clase; luego se unen dichos puntos por segmentos de recta.

Distribución de las calificaciones de estudiantes de ingeniería en Estadística I para ingenieros

5

8

16

21

15

7

3

0

2

4

6

8

10

12

14

16

18

20

22

52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98

 

Page 17: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 17/54

  16

Ojiva.

Es un gráfico lineal en el que los puntos X, Y representan en el eje “X” los

límites reales superiores (LRSi) y en el eje “Y” las frecuencias acumuladas

en términos absolutas (Fi) o las relativas (FRi). Luego se unen los puntos

por una línea continua suavizada.

Distribución acumulada de las calificaciones de estudiantes de ingeniería en Estadística I para ingenieros

5

13

29

50

65

72

75

0

10

20

30

40

50

60

70

80

56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98 100

 

Distribución de frecuencia para datos cualitativos.

La construcción de una tabla de frecuencia para datos cualitativos

requiere sólo del conteo del número de elementos o individuos que caen

dentro de cierta clase o tienen determinadas características. La

distribución se construye de la manera siguiente:

1- En la primera columna se anotan las cualidades o características.

2- En la segunda columna se registran las frecuencias absolutas.

3- En la tercera columna se registran las frecuencias relativas absolutas.  

En una distribución de frecuencia para datos cualitativos no existen

intervalos de clase, ni frecuencia acumulada por carecer éstos de sentido.

Page 18: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 18/54

  17

Medidas de tendencia central.

Consiste en un valor único que representa a un conjunto de datos, el cual

tiende a localizarse en la posición media de dicho conjunto cuando éste ha

sido ordenado según su magnitud, generalmente en forma descendente.

Su principal ventaja consiste en que resume en un solo dato un conjunto

completo. Las medidas de tendencia central se harán acompañar por una

medida de dispersión la cual indicará que tan eficiente es la medida de

tendencia central como valor representativo de conjunto, es decir mide el

grado en el que los diferentes elementos del conjunto difieren de la

medida de tendencia central.

Algunas medidas de tendencia central.

Media aritmética.

Mediana.

Moda.

Media ponderada.

Medidas de tendencia central para datos no agrupados (datos

sueltos):

Media aritmética.

La media para un conjunto de datos sueltos representa el centro físico del

conjunto de datos, y se define como la suma de los valores observados

dividida entre el total de observaciones.

X = ∑∑∑∑xi . n

Page 19: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 19/54

  18

Mediana.

Es el valor que divide el conjunto de observaciones ordenadas respecto a

su magnitud, de tal manera que el número de datos por encima de la

mediana sea igual al número de observaciones por debajo de la misma.

∼∼∼∼ Xp = (n + 1) / 2

∧∧∧∧ Moda (X).

La moda es el valor o fenómeno que se repite con mayor frecuencia.

Media ponderada.

Se utiliza cuando se quiere destacar las diferencias que existen entre un

dato y otro para lo cual se utiliza un factor de ponderación o peso que

suele ser un valor cualquiera, pero con cierta lógica. A mayor coeficiente

de ponderación más relevante o importante es el dato asociado.

X = ∑∑∑∑(xi . wi)

∑∑∑∑wi 

Wi: factor de peso o de ponderación.

Page 20: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 20/54

  19

Medidas de tendencia central para datos agrupados.

Media muestral.

Cuando se trata de datos agrupados la media se calcula como sigue:

X = ∑∑∑∑(fi . xi )∑∑∑∑fi 

Mediana.

Para datos agrupados la mediana se obtiene mediante interpolación. Esta

interpolación se basa en el supuesto de que los datos en cada intervalo

están igualmente distribuidos. La mediana está dada por:

∼ 

X = Lm + [[[[(n/2) – FA)]]]] . Lfm 

Donde:

Lm: límite real inferior de la clase mediana.

n: número de datos observados.

FA: frecuencia acumulada anterior a la de la clase mediana.

fm: frecuencia absoluta de la clase mediana.

L: longitud del intervalo de la clase mediana.

Clase mediana:  Es el entero menor tal que

C. med. ≥≥≥≥ n/2.

Nota.  Cuando la clase mediana está contenida en el primer intervalo la

mediana tendrá como valor la marca de clase. 

Page 21: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 21/54

  20

Moda.

Cuando se trata de datos agrupados, para calcular la moda debemos

determinar antes que todo la clase modal en la cual se encuentra ésta.

Dicha clase modal corresponde a aquella que presente la mayor

frecuencia absoluta. La moda está dada por:

∧ 

1- X = Lm + ∆1 * L

∆1 + ∆2

∧ 

2- X = Lm + ∆1 * L * a

∆1 + ∆2 

Donde:

Lm: límite real inferior de la clase modal

∆1: diferencia entre la frecuencia absoluta de la clase modal y la de la

clase anterior.

∆2: diferencia entre la frecuencia absoluta de la clase modal y la siguiente.

L: longitud del intervalo de la clase modal.

a: número de intervalos modales consecutivos.

Notas:

1- Cuando la clase modal está contenida en el primero o el último de los

intervalos, la moda tendrá como valor la marca de clase de dicho intervalo,

respectivamente.

2- Si deseamos obtener dos valores o más para la moda en vez de uno

como resulta al aplicar la fórmula (Fórmula 2), se eligen las marcas de

clase de los intervalos modales consecutivos como valores de las modas.

Page 22: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 22/54

  21

Medidas de dispersión o variabilidad.

Una medida de variabilidad es un número que nos indica el grado de

dispersión en un conjunto de datos. Si este valor es pequeño, con

respecto a la unidad de medida (MTC), entonces existe una gran

uniformidad entre los datos. Por el contrario un gran valor nos indica poca

uniformidad; cuando es cero significa que todos los valores observados

son iguales.

Algunas medidas de dispersión. 

Rango.Desviación media.

Desviación estándar.

Varianza.

Medidas de dispersión para datos no agrupados.

Rango.

Para datos no agrupados o discretos el rango se toma como la diferencia

entre el valor máximo y el valor mínimo de los datos observados.

R = XM – Xm.

Page 23: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 23/54

  22

Desviación media.

Es la media aritmética de los valores absolutos de las desviaciones de las

mediciones del conjunto respecto a la media o la mediana. Pero su forma

general es respecto a la media.

DM = ∑(xi - x)n

DM = ∑(xi - x)n

Desviación estándar.

Es la medida de variabilidad de mayor uso. La desviación estándar para

datos sueltos está dada por:

S = √∑(xi – x)2 /n – 1

σ = √∑(xi – µ)2 /N

Varianza.

Para datos no agrupados la varianza se determina por medio de la

fórmula:

S2 = ∑(xi – x)2 /n – 1

σ2 = ∑(xi – µ)2 /N

Page 24: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 24/54

  23

Medidas de variabilidad para datos agrupados.

Rango.

Cuando se trata de datos agrupados el rango se toma como la diferencia

entre el límite superior de la última clase y el límite inferior de la primera

clase.

R = LSu – LI1

Desviación media.

Para datos agrupados la desviación media viene dada por:

DM = ∑[fi *xi – x ] ∑fi 

Desviación estándar.

Para datos agrupados la desviación estándar se expresa como:

S = √∑[fi(xi – x)2] / ∑fi 

Varianza.

Para datos agrupados la varianza está dada por:

S2 = ∑[fi(xi – x)2] / ∑fi 

Page 25: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 25/54

  24

Cuartiles.

Cuando un conjunto de datos se divide en cuartas partes, a los puntos de

división resultante se les llama los cuartiles de la muestra. El primer

cuartil, Q1, es un valor que tiene una cuarta parte, o 25% de las

observaciones menores que él.

Para datos no agrupados.

Q1P ≤ 25% de n.

Q2P ≤ 50% de n.

Q3P ≤ 75% de n.

El nonagésimo quinto percentil (P0.95).

P0.95 ≤ 95% de n.

Para datos agrupados.

Q1 = Lm + (n/4) – FA  * Lfm 

Q3 = Lm + (3/4 n) – FA * Lfm

Coeficiente de variación.

Es una variable que se utiliza para determinar el grado de homogeneidad

de un conjunto de datos. Su aplicación fundamental consiste en comparar

dos o más conjuntos para determinar cual de ellos es más homogéneo. A

menor coeficiente de variación mayor homogeneidad tiene el

conjunto de datos.

CV = S * 100X

Page 26: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 26/54

  25

Coeficiente de sesgo.

Es una medida de asimetría de un conjunto de datos. La asimetría se

calcula tomando como referencia la media de un conjunto de datos. Una

distribución es simétrica cuando su sesgo es igual a cero, en cuyo caso la

media, la mediana y la moda coinciden y su forma es como sigue:

x = x = x

Una distribución está sesgada hacia la izquierda si sesgo es negativo y

está sesgada hacia la derecha si sesgo es positivo.

x > x > x

Asimetría hacia la derecha. Sesgo positivo.

Page 27: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 27/54

  26

x > x > x

Asimetría hacia la izquierda. Sesgo negativo.

Para datos no agrupados el coeficiente de sesgo viene dado por:

∼ C. S = (3) (x – x) / S

Para datos agrupados el coeficiente de sesgo está dado por:

C.S = ∑[fi(xi – x)3] 

(∑fi) . S3 

Coeficiente de curtosis.

Mide el grado de concentración de los valores del conjunto alrededor de la

media. Es un número cuya magnitud nos indica la forma como sedistribuyen los datos:

a) en forma normal: Curva mesocúrtica. 

b) más elevados de lo normal: Curva leptocúrtica.

c) más aplanados de lo normal: Curva platicúrtica.

Page 28: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 28/54

  27

Curva mesocúrtica

K = 3

Curva platicúrtica.

K < 3

Page 29: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 29/54

  28

Curva leptocúrtica.

K > 3

El coeficiente de curtosis se denota y se expresa como sigue:

K = ∑(xi – x)4  Para datos no agrupados.n * S

K = ∑[fi(Xi – X)4]  Para datos agrupados.

(∑fi) * S4 

Media de medias.

Consiste en determinar la media global o total de un conjunto de medias.

Para datos sueltos o agrupados viene dada por:

X = ∑[fi . Xi] ∑fi 

Donde:

fi: cantidades de valores de la media X i.

xi: valor de la media i. 

Page 30: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 30/54

  29

Características de la media.

1- La media está afectada por todos los valores del conjunto. Cuando

este es heterogéneo la media no es realmente representativa.

2- La suma de las desviaciones de los valores del conjunto respecto a la

media es cero.

3- La suma de las diferencias cuadráticas de los valores muestrales con

respecto a la media es mínima.

4- Si cada valor del conjunto se suma, resta, multiplica o divide por una

constante; la media o la nueva variable queda sumada, restada,

multiplicada o dividida por esa constante, respectivamente.

Característica de la mediana.

1- Para calcular la mediana no se toman en cuenta los valores extremos,

por lo que un cambio sustancial en ellos no en su frecuencia no altera el

valor de la mediana.

2- La suma de las desviaciones de los valores del conjunto respecto a la

mediana y tomadas en sentido absoluto es mínima.

Característica de la moda.1- La moda de un conjunto de datos agrupados puede variar según la

distribución que se hagan con los mismos.

2- Una variación en uno de los datos puede hacer variar la moda, lo que la

hace demasiado sensible y poco útil.

Page 31: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 31/54

  30

Usos de las medidas de tendencia central.

La media es la más utilizada de las tres medidas de tendencia central. Se

recomienda en distribuciones simétricas basado en conjunto más o menos

homogéneos.

La moda se usará como medida de popularidad o cuando se desea

determinar el dato de mayor incidencia.

La mediana se recomienda para los casos en que la distribución de los

datos es asimétrica y además en el caso en que las distribuciones sean de

intervalos abiertos o semiabierto.

Característica del rango.

1- Sólo se basa en los valores extremos del conjunto, por lo que está

influenciado hasta tal punto que puede variar considerablemente al

cambiar uno de estos valores, por lo tanto no es una buena medida de

dispersión.

2- Es fácil de calcular por lo que en la práctica se prefiere a otras medidas

de dispersión.

3- A fin de asegurar su efectividad sólo se recomienda para conjuntos

pequeños. R ≤ 10.

Page 32: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 32/54

  31

Característica de la desviación media.

1- Es buena medida de dispersión debido a que toma en cuenta todos y

cada uno de los valores del conjunto.

2- Mide el grado de dispersión respecto a una medida de tendencia central

que puede ser la media y/o la mediana, aunque su forma normal es

respecto a la media.

Característica de la desviación estándar.1- Es la más usada de las medidas de dispersión.

2- Es la mínima medida de dispersión en cuanto a desviaciones

cuadráticas se refiere.

3- Se basa en todos los valores del conjunto por lo que describe muy bien

la dispersión de los datos.

4- Si a todos los valores muestrales se les suma o se les resta un mismo

valor la desviación estándar no varía, no cambia.

5- Si a todos los valores muestrales se les multiplica o divide por una

constante la nueva desviación estándar quedará multiplicada o dividida

por el valor de dicha constante.

Page 33: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 33/54

  32

Probabilidad.

Es el medio por el cual a partir de la información contenida en una

muestra tomamos decisiones o hacemos afirmaciones que se refieren a

toda una población mediante el proceso llamado inferencia estadística. 

Es un valor entre cero (0) y uno (1) que se le asigna a un fenómeno o

evento para indicar su posibilidad de ocurrir. Es cero si el evento nunca

ocurrirá, es uno si el evento ocurre con toda certeza, y es 0.50 si existe

igual posibilidad que el evento ocurra como que no ocurra.

Experimento probabilístico.Es un proceso o actividad que conduce a un resultado u observación.

Cada uno de los resultados de un experimento se denomina evento; al

conjunto que contiene todos los posibles resultados se le llama “espacio

muestral” y se representa por la letra S.

Las características que identifican un experimento probabilístico,

distinguiéndolo de cualquier otro tipo de experimento, son:

1- Se pueden enumerar todos los posibles resultados de dicho

experimento.

2- De ante mano se conoce el resultado que arrojará el experimento.

3- Existe un modelo matemático que describe el comportamiento del

experimento.

Eventos mutuamente excluyentes.

Dos o más eventos son mutuamente excluyentes si al ocurrir uno los

demás no pueden ocurrir. Dos o más eventos son exhaustivo si su unión

es igual al espacio muestral (S).

Page 34: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 34/54

  33

Definiciones de probabilidad:

1- Probabilidad clásica o a priori.

Si un experimento puede concluir de N maneras mutuamente excluyente eigualmente probables y m de estas N maneras poseen una característica

E, la probabilidad de E está dada por m/N. E se llama evento o suceso y

la probabilidad se denota IP(E).

IP(E) = mN

Nota.  Cuando los eventos no son igualmente probables la definición deprobabilidad a priori no se cumple, en tales casos se aplicará el concepto

de frecuencia relativa o probabilidad subjetiva.

2- Frecuencia relativa.

Suponga que un experimento estadístico se repite un número grande de

veces, digamos n, y sea m el número de veces que un evento E ocurrió; la

probabilidad de E está dada por m/n.

IP(E) = mn

3- Probabilidad subjetiva.

Es un número índice, asignado por una persona y que representa el grado

de conocimiento que ésta tiene sobre el suceso particular considerado.

Otra persona, con otros conocimientos, podría asignar un número índice

distinto.

Page 35: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 35/54

  34

Eventos independientes.

Dos o más eventos son independientes si la probabilidad de que uno

ocurra no depende de la ocurrencia de los demás; en caso contrario son

dependientes.

Propiedades elementales (leyes) de la probabilidad.

1- Si A es el evento, entonces la probabilidad de A representa un número

entre cero y uno.

0 ≤≤≤≤ IP(A) ≤≤≤≤ 1

2- Si S es el espacio muestral asociado a un experimento, entonces la

probabilidad de S es igual a uno.

IP(S) = 1

3- Si A es el evento vacío, entonces su probabilidad es cero.

IP( ) = 0

4- Si A es el evento y A’ su complemento, entonces la probabilidad de A’

es igual a uno (1) menos la probabilidad del evento A.

IP(A’) = 1 – IP(A)

5- Si A y B son eventos mutuamente excluyentes, la probabilidad de A o B

es igual a la suma de las probabilidades individuales.

IP(A ∪∪∪∪ B) = IP(A) + IP(B)  Caso particular de la adición.

Page 36: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 36/54

  35

6- Sean A y B dos eventos cualesquiera de un espacio muestral,

entonces:

i) IP(A ∪∪∪∪ B) = IP(A) + IP(B) – IP(A ∩∩∩∩ B) Ley general de la suma.

ii) IP(A ∪ B ∪ C) = IP(A) + IP(B) + IP(C) – IP(A ∩ B) – IP(A ∩ C) –

IP(B ∩ C) + IP(A ∩ B ∩ C) Caso ampliado.

7- Si A y B son dos eventos independientes, entonces la probabilidad de

A y B es igual a la multiplicación de sus probabilidades individuales.

IP(A ∩∩∩∩ B) = IP(A) *  IP(B) Caso particular de la multiplicación.

8- Sean A y B dos eventos cualesquiera de un espacio muestral,

entonces:

i) IP(A ∩ B) = IP(A) * IP(B/A).

ii) IP(A ∩ B ∩ C) = IP(A) * IP(B/A) * IP(C/AB) Ley general de la

multiplicación.

Eventos conjuntos.

Dos o más eventos constituyen un evento conjunto si están todos a la vez

(intersección). Si A, B y C son tres eventos cualesquiera, el evento

conjunto de los tres será A ∩ B ∩ C.

Page 37: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 37/54

  36

Probabilidad condicional.

Es cuando la probabilidad de un evento se halla sujeta a ciertas

condiciones. Si denotamos A el evento condicionado y B, el

condicionante; la probabilidad condicionada es IP(A/B).

IP(A/B) = IP(A∩∩∩∩B)IP(B)

Diagrama de árbol.

Es una representación gráfica de las diferentes posibilidades que pueden

ocurrir en una situación o problema dado.

Page 38: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 38/54

  37

Teorema de Bayes.

Si A1, A2, ..., Ai son eventos mutuamente excluyentes de los cuales uno

debe ocurrir, entonces

IP(Aj/B) = IP(Aj) * IP(B/Aj)∑∑∑∑[[[[IP(Ai) * IP(B/Ai)]]]] 

Para i = 1, 2, 3, ..., i.

Muestras ordenadas sin repetición.

Resultan cuando cada observación sólo se da una vez porque cada

unidad una vez observada no se retorna a la población y el orden en que

aparecen es importante. Este tipo de muestras se llama permutaciones.

NPn = N! . (N – n)!

Donde:

N: número de elementos distintos disponibles (población).

n: número de elementos distintos escogidos (muestra).

Permutación con repetición.

Cuando se presenta el caso de hacer permutaciones a partir de elementos

repetidos, la permutación está dada por

P(N, n1, n2, ..., nk) = N! . (n1!) (n2!) ... (nk!)

Donde:

N = ∑ni.

Page 39: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 39/54

  38

Muestras no ordenadas sin repetición.

Se obtienen cuando cada observación sólo se da una vez porque cada

unidad una vez observada no se retorna a la población y el orden en que

aparecen no es importante. Este tipo de muestras se llama combinación.

NCn = N! . (N – n)! n!

Muestras ordenadas con repetición.

Resultan cuando cada observación se da más de una vez, porque cada

unidad una vez observada se retorna a la población y el orden en que

aparecen es importante.

Nn 

Distribución de probabilidad empírica.

Variable aleatoria. 

Es un número generalmente arbitrario con el que identificamos los

diferentes eventos de un espacio muestral que nos servirán para operar

matemáticamente con él. Las variables aleatorias pueden ser discretas o

continuas. Una distribución de probabilidad es un arreglo tabular en el

que se muestra los valores de las variables aleatorias y sus respectivas

probabilidades.

Procedimiento:

1- Listar todos los eventos posibles de un experimento estadístico.

2- Listar los valores de las variables aleatorias que corresponde a cada

evento.

Page 40: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 40/54

  39

3- Asignar a cada evento el valor de la variable aleatoria y su

correspondiente probabilidad; IP(x) = f(x).

4- Determinar la suma de las probabilidades correspondiente al valor de

una misma variable aleatoria, a esta suma se le denomina f(x i).

5- El conjunto de pares ordenados X i, f(xi) constituye una distribución de

probabilidad que generalmente se expresa en forma tabular o mediante

una expresión matemática. Si la variable aleatoria es discreta, la

distribución de probabilidad se conoce como una distribución de

probabilidad discreta, y si es continua la distribución de probabilidad es

continua.

6- Verificar que la suma de los f(xi) sea igual a uno. ∑f(xi) = 1.

Distribución de probabilidad empírica acumulada.

Se identifica F(xi) a la suma parcial de las probabilidades de los diferentes

valores de las variables aleatoria.

Propiedades de la distribución de probabilidad empírica.

1- Valor esperado de una distribución de probabilidad. Su valor

esperado es igual a la media poblacional. E(x) = µ.

E(x) = ∑[ xi * f(xi)] 

2- Varianza para una distribución de probabilidad. Su varianza es igual a

la varianza de la población. V(x) = σ2.

V(x) = ∑ [(xi - µ)2 * f(xi)] 

Page 41: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 41/54

  40

Aplicación del valor esperado a cálculos de costo.

En la teoría de decisiones el valor esperado tiene múltiples aplicaciones

para calcular las ganancias o pérdidas esperadas de ciertas

negociaciones; lo cual servirá de base para la toma de decisiones. En

estas circunstancias la variable aleatoria suele expresarse en función de

costo (ganancia, pérdida, otra).

Distribución de probabilidad empírica continua.

∞ 

∫-∞ f(x) dx = 1

Donde:

X: expresión matemática.

f(x): función de densidad.

Propiedades:

1- Valor esperado.

∞ 

E(x) = ∫-∞ (x * f(x)) dx

2- Varianza.

∞ 

V(x) = ∫-∞  [(x – µ)2 * f(x)] dx

Page 42: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 42/54

  41

Distribución de probabilidad teórica.

Cuando se define un experimento estadístico una de sus características

consiste en la existencia de un modelo matemático que describe el

comportamiento del experimento. Una distribución de probabilidad teórica

consiste en la definición de un modelo matemático que describe un

experimento dado.

Existen distribuciones de probabilidad teórica discretas y continuas

dependiendo del tipo de variable aleatoria definida en el experimento.

1- Algunas distribuciones de probabilidad teórica discretas.a) Binomial.

b) Multinomial.

c) Hipergeométrica.

d) Geométrica.

e) Poisson.

2- Algunas distribuciones de probabilidad teórica continuas.

a) Normal.

b) Uniforme.

c) Exponencial.

d) T-student.

e) Chi cuadrada (Ji cuadrada).

Page 43: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 43/54

  42

Distribución Binomial.

Una gran cantidad de problemas estadísticos manejan situaciones que se

refieren a ensayos repetidos. En los juegos de azar se quiere conocer la

probabilidad de obtener x éxitos en n ensayos, es decir x éxitos y n–x 

fracasos en n intentos.

La distribución Binomial se usará cuando:

1- Existen solamente dos posibles resultados en cada ensayo.

Arbitrariamente denominado éxito o fracaso, sin implicar ello que un éxito

sea necesariamente deseable.

2- La probabilidad de éxito es la misma en cada ensayo.

3- Hay n ensayos, donde n es constante.

4- Los ensayos son independientes.

f(x) = nCx * Px * q

n-x 

Donde:

P: probabilidad de éxito (en la población).

q: probabilidad de fracaso (en la población).

x: número de éxitos en la muestra.

Propiedades de la distribución Binomial.

1- Su valor esperado es igual a n.P.

E(x) = n * P.

2- Su varianza es igual a nPq.

V(x) = n * P * q.

Page 44: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 44/54

  43

Distribución Multinomial.

Una generalización inmediata a la distribución Binomial surge cuando

cada ensayo tiene más de dos posibles resultados. Esto ocurre, por

ejemplo, cuando un producto manufacturado es calificado como de

“primera”, de “segunda” o “malo”.

La distribución Multinomial se usará cuando:

1- Existen tres posibles resultados o más en cada ensayo.

2- La probabilidad de éxito es la misma en cada ensayo.

3- Los n ensayos son constantes.

4- Los ensayos son independientes.

f(x1, x2, ..., xk, P1, P2,..., Pk, n) = n! * (P1)x

1 * (P2)x

2 * (Pk)xk 

(x1!) * (x2!) * (xk!)

Donde:

Pi: probabilidad de éxito correspondiente a cada posible resultado i.

xi: número de éxitos que se desean observar de cada posible resultado i.

n = ∑xi.

Propiedades de la distribución Multinomial.

1- El valor esperado es variable e igual a n.P i . Hay un valor esperado por

cada uno de los resultados. E(Xi) = n * Pi 

2- La varianza también es variable e igual a n.P i.qi. Hay una varianza por

cada uno de los resultados. V(Xi) = n * Pi * qi.

3- El rango va desde cero hasta n.

Page 45: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 45/54

  44

Distribución Hipergeométrica.

Si se desea conocer el número de elementos exitosos presentes en una

muestra aleatoria de n elementos o unidades extraídas de una población

que contiene un total de N elementos de los cuales k son los éxitos

deseados. Si la muestra es extraída en tal forma que, en cada extracción

sucesiva (sin reemplazo), cualquier elemento que haya quedado en la

población tenga la misma probabilidad de ser elegido, la probabilidad de

que en la primera extracción aparezca un elemento exitoso es k / N, pero

en la segunda extracción es k – 1 ó k ; dependiendo de que en la

N – 1 N – 1

primera extracción se haya obtenido o no un elemento exitoso. La

distribución Hipergeométrica se usará cuando:

1- Existe sólo dos posibles resultados en cada ensayo.

2- La probabilidad de éxito varía en cada ensayo.

3- Los n ensayos son constante.

4- Los ensayos son dependientes.

K N–kh(x, n, k, N) = x n–x

Nn

Donde:

N: tamaño de la población

k: número de éxitos en la población.

n: tamaño de la muestra.

x: número de éxitos deseados en la muestra.

Page 46: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 46/54

  45

Propiedades de la distribución Hipergeométrica.

1- El valor esperado es igual a n . k.N

E(x) = n * k.N

2- La varianza es igual a n . k . (N – k) (N – nN2 (N – 1)

V(x) = n . k . (N – k) (N – n)N2

* (N – 1)

Distribución Hipergeométrica multivariada.Si N resultados pueden dividirse en las k celdas A1, A2, ..., Ak con

a1, a2, ..., ak elementos, respectivamente; entonces la distribución de

probabilidad de las variables aleatorias x1, x2, ..., xk que representan el

número de elementos seleccionados de A1, A2, ..., Ak en una muestra

aleatoria de tamaño n, es:

a1  a2 ak f(x1, x2, ..., xk, a1, a2, ..., ak; N, n) = x1  x2  ... xk . 

Nn

Distribución Geométrica.

Si repetidos intentos independientes pueden resultar en un éxito con una

probabilidad p y un fracaso con una probabilidad q, y que los supuestos de

la distribución Binomial se cumplen excepto el tercero, es decir n no es

fijo, entonces la distribución de probabilidad de la variable aleatoria x, el

número del intento en el cual ocurre el primer éxito es:

G(x; p) = p * qx-1 ,

x = 1, 2, 3, ...

Page 47: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 47/54

  46

Propiedades de la distribución geométrica.

1- El valor esperado es igual 1/p.

E(x) = 1/p.

2- La varianza es igual a (1 – p)/p2.

V(x) = (1 – p)/p2.

Distribución Poisson.Esta distribución se aplica a numerosos procesos en los cuales ocurren

determinados sucesos por unidad (tiempo, volumen, espacio, área). Son

casos de este tipo:

a) Ingreso per-cápita.

b) Densidad poblacional.

c) Número de hijos por familia en una determinada ciudad.

Dado un intervalo de números reales, supóngase que el conteo de

ocurrencias es aleatorio en dicho intervalo. Si éste puede dividirse en

subintervalos suficientemente pequeños, tales que:

1. La probabilidad de más de una ocurrencia en el subintervalo es

cero.

2. La probabilidad de una ocurrencia en un subintervalo es la misma

para todos los subintervalos, y es proporcional a la longitud de

éstos.

3. El conteo de ocurrencias en cada subintervalo es independiente

del de los demás subintervalos.

Entonces el experimento aleatorio recibe el nombre de proceso Poisson.

Page 48: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 48/54

  47

Si el número promedio de ocurrencias en el intervalo es λ > 0, la

variable aleatoria X que es igual al número de ocurrencias en el intervalo

tiene una distribución Poisson con parámetro λ, y la función de

probabilidad de X es

f(x) = λx* e

-λ X!

Propiedades de la distribución de Poisson.

1- El valor esperado de la distribución Poisson es igual a lambda.

E(x) = λ.

2- La varianza para la distribución Poisson también es igual a lambda.

V(x) = λ.

Page 49: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 49/54

  48

Aproximación de la distribución de Poisson a la Binomial.

Cuando el tamaño de la muestra aleatoria (n) es relativamente grande y la

probabilidad de éxito (P) pequeña, las probabilidades binomiales a

menudo se aproximan por medio de la fórmula:

f(x) = λx * e-λ 

x! 

Si n ≥ 30 y np < 5, la distribución Binomial se sustituye por la distribución

Poisson con λ = n * P.

Distribución Normal.

Una variable aleatoria seguirá una distribución normal cuando:

1- La variable aleatoria es continua.

2- Su función de densidad de probabilidad f(x) viene dada por

f(x) = e -1/2((x – µ)/ σ)2

√2πσ 

Donde µ es el valor esperado o promedio de la distribución normal. Una

distribución normal estará definida entonces cuando se conocen a µ y σ.

Propiedades de la distribución normal.1- Es simétrica con respecto a un eje localizado en x = µ.

2- Es asintótica con respecto al eje de las “x”.

3- La función f(x) tiene un valor máximo en x = µ. Es unimodal.

4- Tiene dos puntos de inflexión localizados en x = µ ± σ.

Page 50: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 50/54

  49

5- De lo descrito anteriormente se deduce que la distribución normal

tiene forma de campana.

µ 

6- Si x1, x2, x3, ... son variables aleatorias con distribución normal, x = ∑xi 

también seguirá una distribución normal.

7- Si se comporta normalmente, entonces Z = (x – µ)/ σ también se

comportará según una distribución normal.

A Z se le conoce como variable normalizada o estandarizada y de suma

importancia.

8- Cuando se desea calcular la probabilidad de que x se encuentre entre

un rango dado, el procedimiento común sería integrar a f(x) en el rango

deseado. La solución por este método es extremadamente compleja, pero

existen tablas de distribución normal que facilitan el trabajo. El

procedimiento sería:

a) Graficar en una campana de Gauss el área deseada.

b) Estandarizar el o los valores de X.

c) Buscar en una tabla correspondiente las probabilidades.

9- Una función de densidad normal se dice que está estandarizada

cuando µ = 0 y σ = 1. Los valores que puede asumir Z serán positivos o

negativos.

Z = X – µµµµ 

σσσσ 

Page 51: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 51/54

  50

Aproximación de la distribución normal a la Binomial.

La distribución normal sirve para aproximar a la distribución Binomial si el

tamaño de la muestra aleatoria (n) es grande y la probabilidad de éxito (P)

relativamente alta.

Si n ≥ 30 y np > 5 la distribución Binomial se sustituye por la normal con

µ = n * P y σ = √n*P*q

Z = (x ±±±± ½) – µµµµ 

σ 

Distribución uniforme.

Una variable aleatoria seguirá una distribución uniforme si:

1- La variable aleatoria es continua.

2- Están definidos los extremos del intervalo (α, β) entre los cuales estará

comprendida la variable aleatoria X.

3- Su función de densidad de probabilidad es:

1/(β – α) α ≤ x ≤ β f(x) =

o De otra manera

4- Cada elemento tiene la misma probabilidad de ser seleccionado en

cada ensayo.

Page 52: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 52/54

  51

Propiedades de la distribución uniforme.

1- El valor esperado es igual a (α + β)/2.

µ = (α + β)/2.

2- La varianza es igual a (β −α)2 /12.

σ2 = (β −α)2 /12.

Distribución Exponencial.

La variable aleatoria comprendida entre la ocurrencia de dos eventos o

sucesos poissionanos consecutivos se dice que sigue una distribución

exponencial negativa con función de densidad de probabilidad:

f(x) = e-αx 

Donde:

α: es el inverso del valor esperado de X e igual al lambda (λ) de la

distribución de Poisson.

Propiedades de la distribución Exponencial.

1- Su valor esperado es igual 1/ α.

µ = 1/ α.

2- La varianza es igual a 1/ α2.

σ2 = 1/ α2.

3- Su rango va desde 0 hasta +∞.

Page 53: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 53/54

  52

Distribución T-Student.

Una variable aleatoria seguirá una distribución T-student cuando:

1- La variable aleatoria es continua.

2- La distribución de la población es aproximadamente Normal.

3- No se conoce el valor de la desviación estándar poblacional (σ) y el

tamaño de la muestra aleatoria es pequeño (n < 30).

4- Una distribución T-student estará definida si se conocen a µ, S y n.

Distribución Chi cuadrada (Ji cuadrada).

La distribución Chi cuadrada se utiliza para varianzas, cuando la variable

aleatoria es cuantitativa continua y la distribución de la población es

aproximadamente normal. Si el tamaño de la muestra aleatoria es

pequeño (n < 30), entonces:

χ2 = (n – 1) * S2 

σ2 

υυυυ = n – 1.

Propiedades de la distribución Chi cuadrada:

1- Es asimétrica hacia la derecha.

2- Su rango va desde 0 hasta +∞.

Page 54: Estadistica 1-Folleto de Clase _2015

7/21/2019 Estadistica 1-Folleto de Clase _2015

http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 54/54

  53

BIBLIOGRAFIA

Bonini, Charles P. y Spurr, William A. (1978). Toma de Decisiones en

Administración Mediante Métodos Estadísticos.

Editorial Limusa. Primera edición.

Chao, Lincoln. (1994). Estadística para las Ciencias Administrativas.

McGraw-Hill, inc. Tercera edición.

Devore, Jay L. (2012). Probabilidad y Estadística para ingeniería y

ciencias.

Cengage learning. Séptima edición.

Hays, William L. (1988). Statistics.

Holt, Rinehart and Winston, Inc. international edition. Fourth Edition.

Miller, Irwin; Freund, John y Johnson, Richard. (1997). Probabilidad yEstadística para ingenieros.

Prentice-Hall hispanoamericana, S.A. Quinta Edición.

Montgomery, Douglas C. y Runger, George C. (2001). Probabilidad y

Estadística.

McGeaw-Hill interamericana editors, S. A de C. V.

Walpole, Ronald E.; Myers, Raymond H.; Myers, Sharon L. y Ye, Keying

(2012). Probabilidad y Estadística para ingenieros.

Pearson. Novena Edición.