Probabilidad y Estadística

50
Tabla de contenido CAPÍTULO 1 1.I Introducción 1 1.II Probabilidad y Estadística 4 1.III Estadística Descriptiva 5 1.III.1 Universo 5 1.III.2 Población 5 1.III.3 Tamaño de la población 5 1.III.4 Muestra 5 1.III.5 Tamaño de la muestra 6 1.III.6 Frecuencia, frecuencia relativa y frecuencia relativa acumulada 6 1.III.7 Distribución empírica 8 1.III.8 Presentación de datos: Tabla de distribución de Frecuencias 8 1.III.9 Representaciones gráficas 10 1.III.9.1 Histograma 10 1.III.9.2 Polígono 11 1.III.10 Parámetros descriptivos 12 1.III.10.1 Media 13 1.III.10.2 Mediana 13 1.III.10.3 Moda 15 1.III.10.4 Cuartiles 16 1.III.10.5 Media geométrica 17 1.III.10.6 Rango 17 1.III.10.7 Varianza 18 1.III.10.8 Desviación estándar 19 1.III.10.9 Coeficiente de variación 19 1.III.10.10 Coeficiente de asimetría 20 1.III.10.11 Coeficiente de aplanamiento 22 1.III.11 Regresión lineal simple y correlación 29 1.III.11.1 Método de mínimos cuadrados 30 1.III.11.2 Línea de regresión 32 1.III.11.3 Limitaciones del método 35 1.III.11.4 Relaciones no lineales 35 1.III.11.5 Rectificaciones 35 1.III.11.6 Correlación CAPÍTULO 2 2.I Noción de conjunto 38 2.II Simbología y notación 39 2.III Cardinalidad 40 2.IV Conjuntos finitos e infinitos 40 2.V Conjunto universal 41 2.VI Conjunto vacío 41 2.VII Conjuntos equivalentes 41 2.VIII Conjuntos iguales 41 2.IX Subconjuntos 42 2.X Diagrama de Venn 43 2.XI Operaciones con conjuntos 44

Transcript of Probabilidad y Estadística

Page 1: Probabilidad y Estadística

Tabla de contenido

C A P Í T U L O 1

1.I Introducción 1

1.II Probabilidad y Estadística 4

1.III Estadística Descriptiva 5

1.III.1 Universo 5

1.III.2 Población 5

1.III.3 Tamaño de la población 5

1.III.4 Muestra 5

1.III.5 Tamaño de la muestra 6

1.III.6 Frecuencia, frecuencia relativa

y frecuencia relativa acumulada 6

1.III.7 Distribución empírica 8

1.III.8 Presentación de datos:

Tabla de distribución de

Frecuencias 8

1.III.9 Representaciones gráficas 10

1.III.9.1 Histograma 10

1.III.9.2 Polígono 11

1.III.10 Parámetros descriptivos 12

1.III.10.1 Media 13

1.III.10.2 Mediana 13

1.III.10.3 Moda 15

1.III.10.4 Cuartiles 16

1.III.10.5 Media geométrica 17

1.III.10.6 Rango 17

1.III.10.7 Varianza 18

1.III.10.8 Desviación estándar 19

1.III.10.9 Coeficiente de variación 19

1.III.10.10 Coeficiente de asimetría 20

1.III.10.11 Coeficiente de

aplanamiento 22

1.III.11 Regresión lineal simple y

correlación 29

1.III.11.1 Método de mínimos

cuadrados 30

1.III.11.2 Línea de regresión 32

1.III.11.3 Limitaciones del método 35

1.III.11.4 Relaciones no lineales 35

1.III.11.5 Rectificaciones 35

1.III.11.6 Correlación

C A P Í T U L O 2

2.I Noción de conjunto 38

2.II Simbología y notación 39

2.III Cardinalidad 40

2.IV Conjuntos finitos e infinitos 40

2.V Conjunto universal 41

2.VI Conjunto vacío 41

2.VII Conjuntos equivalentes 41

2.VIII Conjuntos iguales 41

2.IX Subconjuntos 42

2.X Diagrama de Venn 43

2.XI Operaciones con conjuntos 44

Page 2: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

11

Estadística descriptiva

1.I1.I INTRODUCCIÓNINTRODUCCIÓN Es un hecho bien conocido que para incrementar los conocimientos que se tienen acerca del mundo es necesario emplear cada vez más los métodos y las inferencias estadísticas. Casi todas las personas requieren tener conocimientos de estadística. Sin embargo, debido a la amplitud y profundidad de la materia, es conveniente seleccionar el campo de conocimiento y los métodos pertinentes según sea la finalidad que se persigue. Existen varias definiciones de estadística: Se la define como la ciencia que trata de los problemas que comprenden variaciones casuales, resultantes de un sinnúmero de influencias pequeñas e independientes que operan en cada resultado medido que se obtiene; asimismo, se dice que es la ciencia de la toma de decisiones a partir de datos, de manera que la confiabilidad de las conclusiones con base en éstos se valora mediante la probabilidad. De modo más general, la estadística es una ciencia que comprende la recopilación, tabulación, análisis e interpretación de los datos cuantitativos y cualitativos; este proceso incluye de-terminar los atributos o cualidades reales, al igual que realizar estimaciones y verificar hi-pótesis mediante las cuales se determinan valores probables o esperados. La estadística es una rama de la matemática y, no obstante, difiere de ésta de la siguiente manera. En la matemática pura, 105 valores son exactos, esto es, una variable tiene un valor particular (la probabilidad de que así ocurra es igual a la unidad, dado que estamos seguros de ello), o bien, no lo tiene (la probabilidad en este caso, es cero, ya que estamos seguros ahora de que la variable no tiene tal valor). Sin embargo, en estadística, la variable puede asumir muchos valores posibles, y existe una probabilidad definida de que adquiera tales valores. Dicha probabilidad puede comprender cualquier valor entre 0 y 1. Mediante la estadística se intenta definir y controlar el grado de incertidumbre que surge de la inevitable variabilidad de los datos.

Capítulo

1

Page 3: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

22

La estadística se enfrenta a dos tipos básicos de problemas: los problemas descriptivos y los problemas inferenciales. Los primeros se refieren a la presentación de conjuntos de ob-servaciones, de manera tal que se puedan comprender e interpretar. Las características nu-méricas empleadas para describir los conjuntos reciben el nombre de valores estadísticos. Los problemas inferenciales son los que comprenden generalizaciones inductivas, esto es, a partir de una muestra puesta a prueba en la realidad hasta el todo del cual se obtuvo la muestra. La inferencia estadística permite conseguir la máxima cantidad de información exacta de una prueba dada, en otras palabras, el empleo de valores estadísticos hace más eficientes las pruebas. En los campos de la ingeniería y de las ciencias experimentales, el empleo de valores es-tadísticos casi siempre es necesario cuando se efectúan pruebas rutinarias de laboratorio, al igual que en los trabajos de investigación y de producción y construcción. En una investigación experimental, quizá se quiera saber si las pruebas son "precisas", o si la variabilidad de los resultados es mayor que lo esperado, o mayor que en cualquiera otra prueba. En la investigación de productos, tal vez se desearía conocer si un cambio en los ingredientes afecta las propiedades del material resultante; comparar la eficacia de los procesos o la eficiencia de las máquinas de ensayo; determinar silos resultados se adaptan a una forma supuesta o postulada; o bien, idear un experimento que permita considerar la variación debida a diversas causas. Esto último también se requiere en la producción, dado que el conocimiento de la variación en las observaciones, causada por un cierto factor, nos capacita para saber si, por términos económicos, es conveniente controlar más estrechamente este factor. Además, quizá se desee averiguar la probabilidad de obtener una resistencia por encima o por debajo de cierto valor; verificar si la producción ha sufrido alteraciones que modifiquen esta probabilidad; determinar la proporción de elementos que presentan cierto atributo o cualidad; o saber qué tamaño de muestra es necesario emplear con el fin de que las conclusiones posean una confiabilidad específica. Existen dos tipos básicos de variables que resultan de interés para nuestro estudio: las variables continuas, las cuales difieren en cifras infinitesimales, y las variables discretas que sólo pueden tener valores específicos, pero no intermedios entre ellos. Tales conceptos deben ser ya conocidos, pues pertenecen a las matemáticas básicas y son útiles, dado que ambos tipos de variables, por lo regular, siguen diferentes distribuciones o leyes de comportamiento. El término distribución se refiere a la frecuencia con la que se presentan diversos valores observados. Dichos "diversos valores" pueden obtenerse de dos maneras. Se puede medir varias veces una cierta propiedad, por ejemplo, la dimensión de un objeto particular. Dados los errores de medición que se cometen, no siempre se obtendrán exactamente los mismos valores. El

Page 4: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

33

segundo caso ocurre cuando se fabrican artículos que deban tener una cierta propiedad en común, por ejemplo, la misma dimensión. Como por lo general se presentan variaciones en la fabricación, al igual que errores de medición, los valores registrados también varían. En ambos casos, si se realizan algunas observaciones, se obtienen resultados que difieren entre sí, y una de las principales funciones de la estadística es evaluar la información de este tipo, de modo que se pueda estimar el "mejor" valor de la cantidad sometida a medición y determinar la precisión del cálculo. La distribución de las variables discretas es de interés principalmente en el caso de problemas en los que intervengan objetos que posean o no una cierta característica: ser de color negro o no, con defectos o sin ellos, presentar o no una resistencia superior a un valor esperado, etc. Es pertinente mencionar que a fin de llevar a cabo un análisis estadístico, las variables discretas y las continuas no están separadas entre sí de manera inevitable. Si los valores de una variable que está distribuida continuamente se agrupan en intervalos y después se les da un tratamiento en grupos, el problema se convierte, en esencia, en uno de tipo de variables discretas. Por el contrario, cuando una de estas últimas variables está constituida por una gran cantidad de clases y se la determina muchas veces, su distribución se aproxima a la de una variable continua y a menudo resulta conveniente emplear dicha aproximación. En el análisis estadístico se denomina variable estadística o variante a la magnitud que varía, y puede ser la variable original o una cantidad derivada de ella como la media de muestras, su desviación estándar, etc. En múltiples problemas de tipo práctico es imposible probar u observar la totalidad de los elementos que intervienen (todos los cuales constituyen una población o universo) y, por consiguiente, es necesario recurrir al muestreo. Así pues, se miden o consideran las propiedades de una muestra con el objeto de estimar las características de todos los ele-mentos (población) de los cuales se extrajo la muestra. La inferencia a partir de muestras es de gran valor en muchos campos, y va desde comprobar si un embarque de mercancías cumple con las especificaciones, hasta predecir los resultados de unas elecciones. Las expe-riencias obtenidas de este último tipo de problemas nos hace percatamos de que no sólo es conveniente tomar la muestra representativa de la población subyacente, sino también de que la conclusión a la que lleguemos es sólo probablemente correcta, pues no se puede tener una certeza total con base en el muestreo. Esto se debe a que varían entre sí las muestras extraídas de la población o grupo de ele-mentos, y la variación es propia de todos los fenómenos naturales y de todas las operaciones de fabricación. Por este motivo, la inferencia estadística se presenta en términos de enunciados de probabilidad. Mediante un programa adecuado se puede obtener mayor información de un cierto trabajo experimental que si se llevaran a cabo pruebas al azar o por simple casualidad, y sólo después se emplearía la estadística. Por ello, debemos considerar a esta ciencia no sólo como un

Page 5: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

44

instrumento útil para la interpretación de resultados experimentales, sino como parte integrante del diseño de experimentos. 1.II1.II ESTADÍSTICA Y PESTADÍSTICA Y PROBABILIDADROBABILIDAD De lo anterior se deduce que los sujetos de estudio de la estadística y la probabilidad están fundamentalmente relacionados entre sí. En tanto que la estadística se interesa en gran medida en deducir conclusiones a partir de muestras alteradas por variaciones aleatorias o incertidumbres, sólo mediante la teoría de la probabilidad se pueden definir o expresar, así como controlar, tales incertidumbres en los resultados. Se dice que las variaciones son al azar cuando no presentan un determinado patrón de conducta o regularidad. La relación entre una muestra y la población puede servir para elucidar la diferencia existente entre la estadística y la probabilidad. Tal relación plantea dos problemas generales: la verificación de una hipótesis estadística y la estimación de uno o varios parámetros característicos de la población. En el primer caso nos interesa saber si a partir de los ensayos o pruebas se puede concluir que una muestra observada pertenece a una población particular (la hipótesis) o si no es posible servirse de ella para llegar a tal conclusión. Dadas las inherentes variaciones casuales existentes en una muestra, no se puede tener una completa seguridad acerca de nuestra conclusión y, por consiguiente, debemos vincularla a un enunciado probabilístico. Al considerar el problema de la estimación o cálculo estimativo, se intenta evaluar uno o varios parámetros de la población de una muestra mediante algunos de los valores "mejores"; una vez más, debido a la variación inherente de una muestra a otra, es imposible estar seguro de que el cálculo es correcto, de ahí que se deba asignarle una banda de probabilidad. Tal banda proporcionará un grado de confianza específico acerca del hecho de que el valor verdadero del parámetro de población caiga dentro de los límites de confianza. En determinados problemas es posible establecer una clara diferencia entre estadística y probabilidad. Por ejemplo, si se conocen los parámetros de la población a partir de un registro anterior, puede deducirse la conducta del componente, o muestra, que se supone forma parte de la misma, por lo tanto, se tiene así un problema de probabilidad. Sin embargo, si el parámetro (o parámetros) de la población es desconocido, y tiene que ser estimado a partir de la muestra, se tiene entonces un problema estadístico. Cabe mencionar que la teoría de la probabilidad se basa en leyes de casualidad o aleatoriedad; de ahí que, las muestras sean de naturaleza fortuita. Una muestra al azar o aleatoria es una seleccionada de manera que cada elemento de la población tenga la misma oportunidad de ser elegido. Obviamente, si se habrá de juzgar la población (el todo) a partir de una muestra (la parte), esta última deberá ser tan representativa de la población como sea posible.

Page 6: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

55

1.II1.IIII ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA La estadística descriptiva resuelve la etapa de tabulación y descripción de resultados de experimentos aleatorios de la investigación estadística. Se basa en el conjunto de definiciones siguientes: 1.III.1 UNIVERSO Es un grupo especifico de objetos de los que se trata de estudiar una característica particular. Por ejemplo, un universo puede ser el conjunto de estudiantes universitarios inscritos en la Facultad de Ingeniería durante cierto semestre. 1.III.2 POBLACION Es la totalidad de valores posibles de una característica particular de un universo. Para el universo de estudiantes universitarios citados existen varias poblaciones. Estas pueden ser el conjunto de sus estaturas, sus edades, el color de su tez, sus ingresos mensuales, el promedio de sus calificaciones, etc. 1.III.3 TAMAÑO DE LA POBLACION Es el número de elementos que tiene una población, es decir, el número total de valores posibles que puede tener la característica particular del universo que se estudia. Si el universo está formado por un dado con sus caras numeradas del 1 al 6, y se trata de ver el número de la cara que ve hacia arriba al tirar el dado, la población estará formada por el conjunto de números (1,2,3,4,5,6), y el tamaño de la población será 6. Si en este experimento se trata de ver la característica par o impar del número resultante, el tamaño de la población será 2. En el ejemplo del universo de estudiantes universitarios, el tamaño de la población de estaturas será igual al número de alumnos inscritos en la Facultad de Ingeniería durante el semestre en cuestión. 1.III.4 MUESTRA Es una parte de la población obtenida de acuerdo a una regla determinada. Por ejemplo, en el universo de estudiantes considerados, una muestra de la población de sus estaturas se puede obtener midiendo a todos los alumnos que asistan a cualquier curso de Probabilidad y Estadística que se dé a las 10 de la mañana de un día determinado del semestre. En el ejemplo del dado, una posible muestra de la población de los números de las caras que ven hacia arriba puede ser 3, 2, 3, 6, 1, 5, 3, 4, 6, 1,

Page 7: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

66

obtenida de tirar 10 veces al azar el dado. Si lo que se mide es la característica par e impar de esos números, la muestra estaría formada por los resultados impar, par, impar, par, impar, impar, impar, par, par, impar Obsérvese que los elementos de una muestra deben considerarse como los resultados de un experimento aleatorio obtenidos al realizar repetida e independientemente las pruebas correspondientes. Existen diferentes tipos de muestras y maneras de obtenerlas, como se verá en el siguiente capítulo. Ahí se establecerá que el trabajo estadístico que se realizará en este fascículo no sirve únicamente para describir la muestra, sino que también proporciona información sobre la población muestreada. 1.III.5 TAMAÑO DE LA MUESTRA Es el número de elementos que forman la muestra. En la tabla 1 se tiene una muestra de tamaño 100 de la población de estaturas de los estudiantes universitarios considerados antes. En el ejemplo recién mencionado del tiro de un dado, se tienen dos muestras de tamaño 10. De una muestra interesa que sea representativa de la población de donde fue obtenida. Para serlo, es necesario diseñar cuidadosamente su tamaño, de tal manera que sin contener a todos los elementos de la población, lo que daría lugar a un estudio exhaustivo de todos los elementos de la población, sí sea lo suficientemente grande para contener todas las variedades de la característica que se trata de estudiar. Por el contrario, generalmente una muestra de tamaño grande ocasiona costos altos en su obtención y, por economía, conviene que ésta sea de tamaño reducido. En la parte de la Estadística llamada Diseño de experimentos se analiza este problema, además de las maneras en que debe levantarse la muestra para asegurar su representatividad. 1.III.6 FRECUENCIA, FRECUENCIA RELATIVA Y FRECUENCIA RELATIVA ACUMULADA

Supóngase que se tienen los n elementos de una muestra de tamaño n obtenida de una población, y que en ésta hay

f1 resultados idénticos a x1 f2 resultados idénticos a x2 f3 resultados idénticos a x3

· · · · · · · · fk resultados idénticos a xk

en donde

Page 8: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

77

∑=

=k

ii nf

1

(1)

y x1, x2, x3, . . . , xk son k valores numéricos asociados a los eventos observados al realizar el experimento aleatorio que define la muestra, es decir, son valores observados de una variable aleatoria x asociada a la población. Los números f1, f2, f3, . . . , fk se llaman frecuencias de ocurrencia de los valores x1, x2, x3, . . . , xk, respectivamente. El cociente de una frecuencia fi entre el total de observaciones n (el tamaño de la muestra), se llama la frecuencia relativa de ocurrencia del valor xi correspondiente. Representando la frecuencia relativa de con fi*, se tiene que

kinf

f ii ,,3,2,1 ,*

K== (2)

Obsérvese el paralelismo entre los conceptos de frecuencia relativa y de probabilidad clásica. De la definición (2) de frecuencia relativa se obtiene de inmediato las condiciones para que un conjunto de números sean frecuencias relativas de los valores de una muestra. Estas son:

∑=

=

≤≤k

ii

i

f

f

1

*

*

1

10 (3)

Se llama frecuencia relativa acumulada de un valor xi, a la suma de frecuencias relativas de todos los valores menores o iguales al valor xi considerado. Si Fi es la frecuencia relativa acumulada de xi, se tiene

kifFi

jji ,,3,2,1 ,

1

*K== ∑

=

(4)

1.III.7 DISTRIBUCIÓN EMPÍRICA

Se llama distribución empírica de frecuencias de la variable aleatoria x, al conjunto de parejas (xi, fi*), en donde i = 1,2,3,... , n. Cabe decir que, como en el caso de la distribución de probabilidad, una distribución empírica describe completamente a la muestra de donde fue obtenida, ya que los valores de xi dan los valores observados de la característica de la población en la muestra, y sus correspondientes frecuencias relativas fi* proporcionan la forma como se presentan esos resultados.

Page 9: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

88

Para el ejemplo del tiro de un dado, en donde se trata de ver el número de la cara que queda hacia arriba, la distribución empírica es:

xi 1 2 3 4 5 6 fi* 0.2 0.3 0.1 0.1 0.2

Si se considera una variable aleatoria que tome el valor cero cuando el resultado del

tiro del dado es par, y el valor uno cuando es impar, la distribución empírica de esta variable es

xi 0 1 fi* 0.4 0.6

Para las mismas muestras consideradas del tiro de un dado, las distribuciones de frecuencias relativas acumuladas, es decir, el conjunto de parejas (xi, Fi) son, respectivamente, las siguientes:

xi 1 2 3 4 5 6 Fi 0.2 0.7 1.0

y

xi 0 1 Fi 0.4 1.0

Las distribuciones empíricas de frecuencias y de frecuencias relativas acumuladas tienen las representaciones gráficas que se verán más adelante.

1.III.8 PRESENTACIÓN DE DATOS: TABLA DE FRECUENCIAS

Considérese la muestra de tamaño 100 de las estaturas de los estudiantes universitarios mostrada en la tabla 1. Debido al número de datos y la variabilidad de los mismos, poca información se podrá deducir de la muestra si se forma una tabla con las distribuciones empíricas de frecuencias y de frecuencias relativas acumuladas. Entonces, cuando el tamaño n de la muestra es grande, conviene agrupar los datos de la muestra de alguna manera que sea menos confusa y permita establecer patrones de los valores ob-servados. Para resolver el problema apuntado, conviene condensar los datos tabulando las frecuencias asociadas a ciertos intervalos de los valores observados. Estos intervalos se llaman intervalos de clase, los que deben estar definidos por limites que permitan identificar plenamente si un dato particular pertenece a uno u otro intervalo de clase. Comúnmente se resuelve lo anterior haciendo que los limites de los intervalos de clase tengan una cifra decimal más que los datos originales, o usando adecuadamente los signos de igualdad y desigualdad en la definición de cada uno de los intervalos de clase. En la práctica se ha visto que es conveniente que el

Page 10: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

99

número de intervalos de clase sea de 5 a 15 y que en cada intervalo caigan por lo menos 5 observaciones.

De la tabla 1 se ve que la observación mayor en la muestra de estaturas de estudiantes universitarios es 1.87 y la menor 1.53. La diferencia entre estas dos observaciones, 1.87 - 1.53 = 0.34, indica que en un rango de 0.34 metros están todas las estaturas de los estudiantes muestreados. Si se consideran unos 7 intervalos de clase, la amplitud de cada uno de ellos será del orden de 0.34 / 7 ≅ 0.05 metros. De esta manera, y haciendo que la observación menor caiga en el primer intervalo de clase y la mayor en el último, los intervalos de clase pueden ser 1.525 ≤ x ≤ 1.575, 1.575 ≤ x ≤ 1.62 , ... , 1.825 ≤ x ≤ 1.875, en donde x representa a las estaturas observadas.

Los puntos medios de los intervalos de clase reciben el nombre de marcas de clase, y se admite que representan al conjunto de observaciones que caen en el intervalo de clase correspondiente. Para los intervalos de clase de la muestra de estaturas determinadas, las marcas de clase son 1.55, 1.60, ..., 1.85. El arreglo en una tabla de los intervalos de clase, marcas de clase, frecuencias, frecuencias relativas y frecuencias relativas acumuladas, se conoce con el nombre de tabla de frecuencias. Condensados los datos de una muestra en una tabla de frecuencias, el conjunto de parejas (ti, fi), en donde ti es la marca de clase, representa la distribución empírica de la muestra, y a través de ella podrá obtenerse mayor información de la misma muestra que de los datos dispersos.

Ejemplo 1

Dada la tabla 1 con los datos observados en una muestra de tamaño 100 de las estaturas de los estudiantes universitarios, formar una tabla de frecuencias.

Tabla 1 Muestra de estaturas de estudiantes universitarios 1.65 1.61 1.79 1.87 1.73 1.79 1.71 1.77 1.68 1.72 1.68 1.70 1.77 1.81 1.75 1.74 1.69 1.70 1.69 1.69 1.53 1.72 1.65 1.63 1.74 1.84 1.70 1.69 1.64 1.58 1.85 1.67 1.57 1.79 1.55 1.77 1.67 1.61 1.77 1.71 1.66 1.69 1.86 1.65 1.68 1.65 1.85 1.68 1.62 1.73 1.64 1.73 1.66 1.65 1.72 1.64 1.75 1.62 1.68 1.81 1.84 1.69 1.80 1.63 1.70 1.68 1.65 1.76 1.76 1.80 1.58 1.79 1.73 1.78 1.80 1.76 1.73 1.80 1.75 1.68 1.80 1.63 1.75 1.67 1.62 1.78 1.78 1.68 1.78 1.72 1.76 1.84 1.79 1.69 1.54 1.76 1.68 1.55 1.69 1.70

De la tabla 1 se obtiene: • Observación máxima: 1.87 • Observación mínima: 1.53 rango: 0.34

Page 11: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

1010

− Número de intervalos de clase: 7 − Amplitud de los intervalos de clase 0.34/7: 0.05 − Primer intervalo de clase (contiene a 1.53 y sus limites tienen tres decimales): 1.525

a 1.575. Con la información anterior se construye la tabla de frecuencias que aparece en la tabla 2. De esta se puede empezar a deducir información valiosa sobre la muestra estudiada. Por ejemplo, de aquí se obtiene que el 28% de los estudiantes muestreados tienen una estatura de 1.675 a 1.725 metros; que el 77% de los estudiantes tienen una estatura menor a 1.775 metros; que es muy remoto encontrar estudiantes con estatura superior a 1.875 metros, etc.

Tabla 2 Tabla de frecuencias de la muestra de estaturas de estudiantes universitarios.

Intervalo de clase

Marca de clase

ti

Conteo de frecuencias

Frecuencia fi

Frecuencia relativa

fi*

Frecuencia relativa

acumulada Fi

1.525 – 1.575 1.55 IIIII 5 0.05 0.05 1.575 – 1.625 1.60 IIIIIII 7 0.07 0.12 1.625 – 1.675 1.65 IIIIIIIIIIIIIIIII 17 0.17 0.29 1.675 – 1.725 1.70 IIIIIIIIIIIIIIIIIIIIIIIIIIII 28 0.28 0.57 1.725 – 1.775 1.75 IIIIIIIIIIIIIIIIIII 20 0.20 0.77 1.775 – 1.825 1.80 IIIIIIIIIIIIIIII 16 0.16 0.93 1.825 – 1.875 1.85 IIIIIII 7 0.07 1.00

1.III.9 REPRESENTACIONES GRÁFICAS DE LAS DISTRIBUCIONES EMPÍRICAS

En forma semejante a los polígonos de probabilidad y de probabilidad acumulada, existen representaciones gráficas de las distribuciones empíricas. Éstos son los histogramas y los polígonos de frecuencias acumuladas.

1.III.9.1 HISTOGRAMA Es una representación gráfica de la distribución empírica en un sistema de ejes coordenados rectangulares de referencia. En el eje de las abscisas se sitúan las marcas de clase, y en el de las ordenadas las frecuencias o las frecuencias relativas. La representación es a base de rectángulos de base igual al intervalo de clase y de altura la frecuencia o frecuencia relativa correspondiente. Dependiendo de que se grafiquen las frecuencias o las frecuencias relativas, el histograma se llama de frecuencias o frecuencias relativas, respectivamente. En la figura 1 se tiene el histograma de frecuencias relativas de la muestra de estaturas de los estudiantes universitarios. Los datos para construirlo se tomaron de la tabla 2. En la misma figura se han unido los puntos sucesivos (ti, fi*) por medio de rectas discontinuas; a este trazo se le llama el polígono de frecuencias relativas de la distribución empírica.

Page 12: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

1111

Figura 1 Histograma de frecuencias relativas correspondiente a la estatura de una muestra de 100 alumnos.Histograma de frecuencias relativas correspondiente a la estatura de una muestra de 100 alumnos.

1.III.9.2 POLIGONO DE FRECUENCIAS RELATIVAS ACUMULADAS El polígono de frecuencias relativas acumuladas, también llamado ojiva, es una representación poligonal abierta de las frecuencias relativas acumuladas en un sistema de ejes coordenados rectangulares de referencia. En el eje de las abscisas se sitúan los valores de los límites de los intervalos de clase, y en el de las ordenadas las frecuencias relativas acumuladas de los mismos valores. En la figura 2 se tiene el polígono de frecuencias relativas acumuladas de la misma muestra de estaturas de los estudiantes universitarios. También se construyó tomando los datos de la tabla 2. En un polígono de frecuencias relativas acumuladas, la abscisa de cualquier punto del polígono se llama el fractil, y la ordenada correspondiente la fracción, la que se maneja en forma porcentual. Esta representa precisamente la fracción de la totalidad de datos que tienen un valor menor o igual al del fractil correspondiente. Para referirse a un fractil en particular, se le asocia la fracción al cual corresponde. Por ejemplo, en la figura 2 se tiene trazado el fractil 70%, cuyo valor es 1.7575; significa que el 70% de los estudiantes medidos tienen una estatura menor a 1.7575 metros. Algunos fractiles tienen nombres particulares. Así, el fractil 1% se llama el primer percentil o percentil 1, el fractil 2% se llama el segundo percentil o percentil 2, etc. El fractil l0% se conoce como el primer decil o decil 1, el fractil 20% es el segundo decil o decil 2, etc. Los fractiles 25%, 50% y 75% se les denomina el primero, segundo y tercer cuartiles, respectivamente. Y el fractil 50% se le llama la mediana. Esta, como puede verse, es un valor tal que la mitad de los datos son menores que ella, y la otra mitad mayores que la misma. En la figura 2 también está trazada la mediana.

Page 13: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

1212

Figura 2 Polígono de frecuencias relativas acumuladas de estaturas de la muestra de estudiantes.Polígono de frecuencias relativas acumuladas de estaturas de la muestra de estudiantes.

1.III.10 PARÁMETROS DESCRIPTIVOS DE UNA DISTRIBUCIÓN EMPÍRICA

Como en las distribuciones teóricas de probabilidad, en las distribuciones empíricas existen diferentes parámetros descriptivos que resumen una gran cantidad de información sobre las muestras. Estos parámetros se clasifican en medidas de tendencia central, medidas de dispersión, medidas de asimetría y medidas de aplanamiento. Dentro de las medidas de tendencia central se tienen la media, la mediana y la moda; dentro de las medidas de dispersión se mencionarán al rango, la variancia, la desviación estándar y el coeficiente de variación. En general, las medidas de tendencia central representan valores promedios o medidas de posición de los datos de la muestra. Las de dispersión miden el grado de agregación, de concentración, de variabilidad de los datos. Como sus nombres lo dicen, las medidas de asimetría y de aplanamiento establecen criterios para comparar el histograma de la muestra con respecto a ciertas normas. A continuación se definen los diferentes parámetros descriptivos.

Page 14: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

1313

1.III.10.1 MEDIA La media es el más común de los parámetros descriptivos de tendencia central. Se define como el promedio aritmético de todos los datos de la muestra. De acuerdo a la definición anterior, si x1, x2, x3, . . . ,xn son valores observados de la variable aleatoria x correspondientes a una muestra de tamaño n obtenida de una población, la media, representada por x , es:

n

xx

n

ii∑

== 1 (5)

Si los datos de la muestra están concentrados en una tabla de frecuencias, en donde las marcas de clase son ti y las frecuencias fi con i = 1,2,3,... ,k, entonces la media de la muestra queda definida por:

n

ft

f

ftx

k

iii

k

ii

k

iii ∑

∑=

=

= == 1

1

1 (6)

1.III.10.2 MEDIANA Como ya se había mencionado, la mediana es un valor tal que la mitad de las observaciones son menores que ese valor y la otra mitad mayores que el mismo. Su valor puede determinarse ordenando los datos de la muestra de menor a mayor y tomando el elemento central cuando exista, el colocado en la posición (n + 1) / 2 para n impar; si no existe, se conviene tomar como mediana al promedio de los dos centrales. En el caso de la muestra del tiro de un dado, las observaciones ordenadas son: 1,1,2,3,3,3,4,5,6,6, por lo que su mediana es (3+3) / 2 = 3. Cuando los datos se encuentran agrupados en una tabla de frecuencias, la mediana puede obtenerse aproximadamente aceptando que las observaciones pertenecientes a cada intervalo de clase se distribuyen uniformemente en el mismo. El intervalo de clase en donde está alojada la mediana se determina de la columna de frecuencias relativas acumuladas de la tabla de frecuencias; aquel para el cual ocurre primero que Fi es mayor de 0.5. Para este intervalo supóngase que L1 es su límite interior, c la amplitud de ese intervalo, (∑ f )1 la suma de las frecuencias de los intervalos anteriores a aquel en

donde está alojada la mediana y fm la frecuencia del mismo intervalo de clase; entonces, la mediana será igual a L1 más una parte del intervalo de amplitud c que complete la mitad de las observaciones a la izquierda de la mediana, como se muestra en la figura 3. Como las

Page 15: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

1414

observaciones están uniformemente distribuidas en el intervalo de clase de la mediana, la parte de c que hay que sumar a L1 debe ser proporcional al número de observaciones faltantes a la derecha de L1 para llegar a la mitad, o sea:

( )mf

fn

12 ∑−

Por lo tanto, la mediana podrá calcularse aproximadamente por medio de:

( )

−+=

∑mf

fn

cLx1

12~ (7)

Si se tiene dibujado el polígono de frecuencias relativas acumuladas, se puede estimar la mediana gráficamente por medio del fractil 50%, como se hizo en la figura 2.

Figura 3 Histograma de frecuencias para el cálculo de la medianaHistograma de frecuencias para el cálculo de la mediana

Page 16: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

1515

1.III.10.3 MODA La moda de una muestra es la observación que se presenta con mayor frecuencia; por lo tanto, es el valor más representativo y descriptivo de la muestra. Desde luego que la moda puede ser única o tener varios valores, opacando un poco su propiedad de descripción. En la muestra del tiro de un dado formada por los números 3, 2, 3, 6, 1, 5, 3, 4, 6, 1, obviamente la moda es única y vale 3. Cuando los datos de una muestra se encuentran concentrados en una tabla de frecuencias, no es posible calcular exactamente el valor de la moda. En este caso se obtiene aproximadamente su valor resolviendo los triángulos semejantes que se muestran en la figura 4.

Figura 4 Histograma de frecuencias para el cálculo de la moda Histograma de frecuencias para el cálculo de la moda

De ésta se obtiene, teniendo en cuenta que L1 es el límite inferior del intervalo de clase que contiene a la moda (el de mayor frecuencia), c la amplitud de ese intervalo modal, d1 la diferencia en valor absoluto de la frecuencia del intervalo modal y la frecuencia del intervalo de clase anterior al modal, y d2 la diferencia en valor absoluto de la frecuencia del intervalo modal y la frecuencia del intervalo de clase que sigue al modal:

Page 17: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

1616

( )

( )

++=

+=−

+=

+=−

−−

=

−−−

=

−−=

21

11

21

11

1

21

1

1

2

1

11

2

1

1

1

2

2

1

1

1

ˆ

ˆ

ˆ

ˆ

ˆ

ˆˆ

ddd

cLx

ddd

cLx

ddd

Lxc

dd

Lxc

Lxc

dd

LxLxc

dd

dLxc

dLx

(8) Cuando el histograma de una distribución empírica es casi simétrica, se puede estimar el valor de la moda a partir de la relación que existe entre la media, mediana y moda que se analizará en la sección 1.III.10.9. Se ha encontrado que en distribuciones empíricas moderadamente asimétricas, la distancia entre la media y la mediana es un tercio de la distancia entre la media y la moda, es decir,

( )xxxx ˆ3

1~ −=−

Con esta relación se puede estimar la moda de la manera siguiente:

( )xxxx ~3ˆ −−=

1.III.10.4 PERCENTILES, DECILES Y CUARTILES Los percentiles, deciles y cuartiles vistos al final de la sección XX también son parámetros descriptivos de una distribución empírica. Estos establecen la localización de diversos valores que dividen a la muestra en grupos de acuerdo a las frecuencias de las observaciones. Los valores de los diferentes percentiles, deciles y cuartiles se pueden estimar gráficamente del polígono de frecuencias relativas acumuladas, como se hizo en la figura 2, o, preferiblemente, con un procedimiento analítico semejante al seguido para obtener la expresión (7). Se llega a:

Page 18: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

1717

( )

−×+= ∑

fractilf

ffracciónncLfractil 1

1 (9)

1.III.10.5 MEDIA GEOMÉTRICA Existe otro tipo de promedio que resulta de interés en los cálculos de Ingeniería. Se trata de la media geométrica, definida como la raíz enésima del producto de n observaciones. Así la media geométrica gx , de n observaciones x1, x2, ... , xn es:

n

ng xxxx ×××= K21 (10)

Generalmente se emplea este promedio cuando se trabaja con observaciones con las que cada una guarda una razón aproximadamente constante respecto a la anterior, y siempre la media será mayor que la media geométrica. El sesgo en la media es resultado de la magnitud absoluta de las razones. Por ejemplo, duplicar un valor representa una razón de 2, en tanto que dividirlo a la mitad origina una razón

de 21 . De este modo, si consideramos un valor de 100 que desciende a 50 y un poco

después se eleva a 100, las razones serán de 21 y 2 respectivamente. La media geométrica

es 1221 =+ , que es la tasa media de incremento. Esta respuesta es correcta en

términos intuitivos, dado que el cambio total registrado es nulo. Sin embargo, la media de las

razones es ( ) 25.1221

21 =+ . Si las razones fueran 3 y

31 , la media geométrica seguiría

siendo 1, en tanto que la media geométrica sería de 321 .

Se puede evitar el empleo de la media geométrica mediante la transformación de la variable original x en log x. La media aritmética de la nueva variable servirá para obtener una respuesta correcta, dado que, por la ecuación (10)

n

xx

n

ii

g

∑== 1

loglog (11)

1.III.10.6 RANGO La medida de dispersión más simple es el rango. Fue usado en la construcción de la tabla de frecuencias en el ejemplo 1 y se define como la diferencia entre la mayor y la menor observaciones de la muestra. Si xmax es la observación de mayor valor y xmin el valor de la observación mínima, el rango valdrá:

minmax xxrango −= (12)

Page 19: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

1818

Para la muestra del tiro de un dado que se ha venido analizando, las observaciones máxima y mínima son xmax = 6 y xmin = 1, respectivamente. Por lo tanto, el rango de la muestra será 6-1=5. El semi rango, definido por:

2 maxmin xxrangosemi

+= (13)

es una medida de tendencia central útil cuando interesa tener una aproximación rápida de las medidas de tendencia central en distribuciones casi simétricas. Sin embargo, es poco utilizado porque no considera la información contenida en los términos intermedios. 1.III.10.7 VARIANZA La media de dispersión más conocida y de mayor utilidad es la variancia. Se define como el promedio aritmético de los cuadrados de las desviaciones de las observaciones con respecto a su valor medio. Si x1, x2, x3,..., xn son los valores observados de la variable aleatoria x correspondientes a una muestra de tamaño n obtenida de una población, y x es la media de la muestra, la variancia, representada por s2x, es:

( )

n

xxs

n

ii

x

2

12∑

=

−= (14)

Algunos autores consideran como denominador de la expresión anterior a n - 1 en lugar de la n. Esto es debido a que así se obtiene un estimador insesgado de la variancia de la población. Sin embargo, cuando la muestra es grande, o sea n>30, no existen diferencias apreciables en considerar uno u otro denominador. Aquí se considerará la variancia como se define en la expresión (12). Desarrollando el cuadrado del segundo miembro de la expresión (12). se obtiene una expresión cómoda de usar para calcular la variancia de una muestra. Se tiene:

( )

n

xnxxx

n

xxxxs

n

ii

n

ii

n

iii

x

2

11

2

1

22

2

2

2

+−=

+−=

∑∑

==

=

Page 20: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

1919

pero

n

xx

n

ii∑

== 1

luego

2

11

2

2

2

1

2

11

2

2 2

−=

+

−=

∑∑

∑∑∑

==

===

n

x

n

xs

n

x

n

x

n

xs

n

ii

n

ii

x

n

ii

n

ii

n

ii

x

En el caso de que los datos de la muestra estén concentrados en una tabla de frecuencias, la variancia se calcula con

( ) ( )

n

xt

f

xts

k

ii

k

ii

k

ii

x

∑=

=

=

−=

−= 1

2

1

1

2

2 (15)

1.III.10.8 DESVIACION ESTANDAR Como en el caso de la desviación estándar de variables aleatorias con distribución de probabilidad conocida, la desviación estándar de la muestra de define como la raíz cuadrada de la variancia.

2xx ss = (16)

1.III.10.9 COEFICIENTE DE VARIACION En el estudio de las distribuciones de probabilidad del fascículo 2 se estableció el concepto de coeficiente de variación. En las distribuciones empíricas es el mismo, o sea, se vuelve a definir el coeficiente de variación como la razón de la desviación estándar a la media de la muestra.

100.. ×=xs

VC x (16)

Page 21: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

2020

1.III.10.10 COEFICIENTE DE ASIMETRÍA Se dice que una distribución empírica es simétrica, cuando su histograma tiene un eje vertical de simetría. En este caso, la media, mediana y moda coinciden con ese eje de simetría, como se muestra en la figura 5 (a). En una distribución empírica asimétrica, los valores de la media, mediana y moda son diferentes entre sí. En este caso, la moda subsiste en el rectángulo más alto del histograma, ya que no se ve afectada por las observaciones poco frecuentes que distorsionan la simetría del histograma. La posición de la mediana estará algo alejada de la moda, en la dirección de los valores inusuales, dividiendo en dos partes el área del histograma. Como la media es la que se ve más afectada por los valores extremos, quedará localizada más lejos de la moda en la misma dirección de los valores poco frecuentes.

Lo anterior se representa en los casos (b) y (c) de la figura 5, en donde se ha llamado asimetría positiva o derecha al caso de tener datos poco frecuentes a la derecha de la moda que hagan que se prolongue el histograma en esa dirección, y asimetría negativa o izquierda al caso contrario. De lo anterior puede establecerse que una medida de la asimetría de una distribución empírica puede ser la diferencia entre la media y la moda, ya que a mayor asimetría le corresponde una mayor diferencia. Dado que la medida de la asimetría se utiliza principalmente con fines comparativos, conviene que la propuesta sea adimensional, y que los valores grandes de la media sean debidos a gran asimetría y no a gran dispersión de los datos. Para resolver lo anterior, se dividirá la diferencia de la media y la moda entre la desviación estándar de la muestra. A este cociente se le llama el primer coeficiente de asimetría de Pearson; vale cero cuando la distribución es simétrica y diferente de cero cuando es asimétrica, dando directamente el sentido positivo o negativo de la asimetría.

xsxx

asimetríadeecoeficient ˆ −

= (17)

En el caso de distribuciones moderadamente sesgadas, existe una relación aproximada entre los diversos promedios:

( )xxxx ~3ˆ −=−

Es interesante destacar que en el caso de las distribuciones asimétricas con cúspide muy aguda, la mediana constituye a menudo una útil medida de tendencia central.

Page 22: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

2121

Figura 5 Histogramas de frecuencias relativas que muestran los tipos de simetríaHistogramas de frecuencias relativas que muestran los tipos de simetría

Existen otras formas de medir la asimetría de una distribución empírica. Es particularmente importante la que utiliza el concepto de momento de muestra que a continuación se establece: Se llama momento de orden r con respecto a la media de una muestra de valores x1, x2, x3, . . , xn de media x a

( )

n

xxm

n

i

ri

r

∑=

−= 1 (18)

Si la muestra está concentrada en una tabla de frecuencias, el momento de orden r con respecto a la media es:

( ) ( )

n

fxt

f

fxtm

n

ii

ri

n

ii

n

ii

ri

r

∑=

=

=

−=

−= 1

1

1 (19)

Una medida de la asimetría de una distribución empírica, llamada el coeficiente momento de asimetría, está dada por el tercer momento con respecto a la media expresado en forma adimensional. Esta es:

( )3

2

23

m

ma = (20)

Page 23: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

2222

en donde m3 es el tercer momento de la muestra con respecto a la media y m2 el segundo, o sea, la variancia. Este coeficiente también vale cero cuando la distribución empírica es perfectamente simétrica. 1.III.10.11 COEFICIENTE DE APLANAMIENTO El histograma de una distribución empírica puede tener la tendencia general de la gráfica de la distribución normal estudiada en el fascículo anterior (ver su figura 11), ser más estrecha y alta que esa tendencia, o más ancha y baja que la misma. A una distribución empírica cuyo histograma siga la tendencia de la gráfica de la distribución normal se dice que es mesocúrtica, si es más alta y estrecha que ésta es leptocúrtica, y si es más ancha y baja se le llama platocúrtica. En la figura 6 se muestran histogramas correspondientes a los tres tipos de aplaneamiento mencionados. El grado de aplanamiento de una distribución empírica se llama curtosis y se mide a través del cuarto momento con respecto a la media expresado en forma adimensional. La medida de aplanamiento, llamada coeficiente momento de curtosis, está definida por:

22

44 m

ma = (21)

el cual vale 3 en una distribución mesocúrtica, es mayor de 3 en distribuciones leptocúrticas y menor de 3 en platocúrticas.

Figura 6 Histogramas de frecuencias que muestran los tipos de aplanamiento Histogramas de frecuencias que muestran los tipos de aplanamiento

Page 24: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

2323

Ejemplo 2 En la tabla 1 se tienen las estaturas de 100 estudiantes universitarios. Determinar: Ø La tabla de distribución de frecuencias de las estaturas Ø El histograma de frecuencias relativas y la ojiva Ø La media, la mediana y la moda Ø La desviación estándar Ø Los cuartiles Ø Si la distribución empírica es o no simétrica Ø El grado de aplanamiento de la distribución empírica

Tabla 1 Muestra de estaturas de estudiantes universitarios

1.65 1.61 1.79 1.87 1.73 1.79 1.71 1.77 1.68 1.72 1.68 1.70 1.77 1.81 1.75 1.74 1.69 1.70 1.69 1.69 1.53 1.72 1.65 1.63 1.74 1.84 1.70 1.69 1.64 1.58 1.85 1.67 1.57 1.79 1.55 1.77 1.67 1.61 1.77 1.71 1.66 1.69 1.86 1.65 1.68 1.65 1.85 1.68 1.62 1.73 1.64 1.73 1.66 1.65 1.72 1.64 1.75 1.62 1.68 1.81 1.84 1.69 1.80 1.63 1.70 1.68 1.65 1.76 1.76 1.80 1.58 1.79 1.73 1.78 1.80 1.76 1.73 1.80 1.75 1.68 1.80 1.63 1.75 1.67 1.62 1.78 1.78 1.68 1.78 1.72 1.76 1.84 1.79 1.69 1.54 1.76 1.68 1.55 1.69 1.70

Solución: La tabla de distribución de frecuencias se construye de la siguiente manera:

34.053.187.1minmax =−=−= xxRango Si se forman 7 intervalos de clase, entonces la amplitud de cada uno está dada por:

049.07

34.0

#===

clasesdeRango

c

así, aproximando la amplitud del intervalo de clase a 0.05, la tabla queda como sigue:

Tabla 2 Tabla de frecuencias de la muestra de estaturas de estudiantes universitarios.

Intervalo de clase

Marca de clase

ti

Conteo de frecuencias

Frecuencia fi

Frecuencia relativa

fi*

Frecuencia relativa

acumulada Fi

1.525 – 1.575 1.55 IIIII 5 0.05 0.05 1.575 – 1.625 1.60 IIIIIII 7 0.07 0.12 1.625 – 1.675 1.65 IIIIIIIIIIIIIIIII 17 0.17 0.29 1.675 – 1.725 1.70 IIIIIIIIIIIIIIIIIIIIIIIIIIII 28 0.28 0.57 1.725 – 1.775 1.75 IIIIIIIIIIIIIIIIIII 20 0.20 0.77 1.775 – 1.825 1.80 IIIIIIIIIIIIIIII 16 0.16 0.93 1.825 – 1.875 1.85 IIIIIII 7 0.07 1.00

Page 25: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

2424

El histograma se construye graficando la columna de la frecuencia contra la estatura asociada a ella por medio de una barra. El gráfico resultante es el siguiente:

Histograma

0

5

10

15

20

25

30

1.55 1.6 1.65 1.7 1.75 1.8 1.85

Estatura (m)

frec

uen

cia

Figura 7 Histograma de la muestra de estaHistograma de la muestra de estaturas de estudiantes de la Tabla 2.turas de estudiantes de la Tabla 2.

La ojiva se construye graficando por medio de segmentos de recta la frecuencia acumulada relativa con respecto a la estatura. La gráfica es como sigue:

Ojiva

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

1.55 1.6 1.65 1.7 1.75 1.8 1.85

Estatura (m)

Fre

cuen

cia

acu

mu

lad

a

Figura 8 Ojiva de la muestra de estatuOjiva de la muestra de estatura de estudiantes de la Tabla 2.ra de estudiantes de la Tabla 2.

Page 26: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

2525

El cálculo de la media lo podemos efectuar tratando la muestra como datos dispersos, aunque ya construida la tabla de distribución de frecuencias se puede realizar el cálculo por medio de las ecuaciones para datos agrupados. Para datos dispersos tenemos:

7111.1100

11.171

100

100

1 ===∑

=iix

x

para datos agrupados:

( ) ( ) ( ) ( ) ( ) ( ) ( )

7135.1100

35.171

71620281775

785.11680.12075.12870.11765.1760.1555.17

1

7

1

=

=

++++++++++++

==

=

=

x

f

ftx

ii

iii

Si comparamos ambos resultados encontraremos una pequeña diferencia, lo cual es de esperarse, ya que al agrupar los datos perdemos algo de precisión. Sin embargo, si comparamos ambos resultados hasta la segunda cifra decimal, que sería lo más indicado, tenemos el mismo valor; el cual podemos interpretar como que la estatura promedio del grupo de estudiantes es de 1.71 m.

La mediana, para datos dispersos, se determina por el ordenamiento de menor a mayor de los datos, quedándonos la siguiente tabla:

Tabla 3 Tabla de datos dispersos ordenados de la muestra de estaturas de estudiantes universitarios.

1.53 1.54 1.55 1.55 1.57 1.58 1.58 1.61 1.61 1.62 1.62 1.62 1.63 1.63 1.63 1.64 1.64 1.64 1.65 1.65 1.65 1.65 1.65 1.65 1.66 1.66 1.67 1.67 1.67 1.68 1.68 1.68 1.68 1.68 1.68 1.68 1.68 1.68 1.69 1.69 1.69 1.69 1.69 1.69 1.69 1.69 1.70 1.70 1.70 1.70 1.70 1.71 1.71 1.72 1.72 1.72 1.72 1.73 1.73 1.73 1.73 1.73 1.74 1.74 1.75 1.75 1.75 1.75 1.76 1.76 1.76 1.76 1.76 1.77 1.77 1.77 1.77 1.78 1.78 1.78 1.78 1.79 1.79 1.79 1.79 1.79 1.80 1.80 1.80 1.80 1.80 1.81 1.81 1.84 1.84 1.84 1.85 1.85 1.86 1.87

La mediana se debe encontrar entre los datos 50 y 51, ya que tenemos un número de datos par, así que se determina por el promedio de esos dos datos:

70.12

70.170.1

22~ 5150122 =

+=

+=

+= + xxxx

x nn

Page 27: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

2626

para datos agrupados:

( ) ( )

7125.1~28

295005.0675.1

28

17752

100

05.0675.12~ 1

1

=

+=

++−+=

−+=

x

f

fn

cLxm

i

La moda para datos dispersos sería el dato que se repite el mayor número de veces, es decir, el de mayor frecuencia. De la tabla 3, tenemos que la moda sería:

68.1ˆ =x

Para datos agrupados, vemos que el intervalo con mayor frecuencia corresponde al de 1.675 – 1.725, siendo d1 y d2 las diferencias, en valor absoluto, entre las frecuencias de los intervalos anterior y posterior respectivamente:

( ) ( )

7039.1ˆ

811

1105.0675.1

20281728

172805.0675.1ˆ

21

11

=

++=

−+−

−+=

+

+=

x

ddd

cLx

Para el cálculo de la desviación estándar, primero debemos calcular la varianza (momento de segundo orden). Para datos dispersos tenemos:

( )0057.0

100

5748.0

100

100

12 ==−

=∑

=ii

x

xxs

y con datos agrupados:

( ) ( )

( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )( ) ( ) ( ) ( ) ( ) ( )

0057.0

100

5743.0

100

77135.185.1167135.180.1207135.175.1

287135.170.1177135.165.177135.160.157135.155.1

2

222

2222

7

1

2

7

1

7

1

2

2

=

=−+−+−+

−+−+−+−

=

−=

−=

∑=

=

=

x

iii

ii

iii

x

s

n

fxt

f

fxts

Page 28: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

2727

En este caso, la varianza tuvo el mismo valor numérico en ambos casos (hasta 4 cifras decimales), así que la desviación estándar será la misma independientemente de la forma de calcularla:

0758.00057.02 === xx ss

Podemos verificar la ecuación simplificada para el cálculo de la varianza cuando se trata de datos dispersos:

0057.0

9279.29336.2100

11.171

100

3611.293

100100

2

2

2100

1

100

1

2

2

=

−=

−=

−=∑∑

==

x

ii

ii

x

s

xxs

y en consecuencia, la desviación estándar será 0.0758, como se había calculado previamente a través de las diferencias entre los datos y la media.

Ya que tenemos los valores numéricos de la media y la desviación estándar, podemos calcular el coeficiente de variación:

% 43.41007111.1

0758.0100.. =×=×=

xs

VC x

El cálculo de los cuartiles sólo se hará para el caso de datos agrupados, y de hecho ya se ha hecho el cálculo de uno de ellos, la mediana. El primer cuartil se encuentra dentro del tercer intervalo de clase, por tanto, su cálculo es como sigue:

( ) ( )

( )

6632.1

17

75410005.0625.1

441

1

11

111

11

=

+−

+=

−+=

−×+= ∑∑

C

f

fncL

f

fncLC

CC

y el tercer cuartil se encuentra dentro del quinto intervalo de clase:

Page 29: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

2828

( ) ( )

( )

7700.1

20

281775430005.0725.1

4343

3

11

113

33

=

+++−

+=

−+=

−×+= ∑∑

C

f

fncL

f

fncLC

CC

Para determinar la simetría de la distribución empírica, calculamos el coeficiente de asimetría (coeficiente de Pearson):

127.00758.0

7039.17135.1ˆ3 =

−=

−=

xsxx

a

lo cual nos indica que la asimetría es ligeramente positiva, es decir, la curva está corrida hacia la derecha (véase la figura 1). ¿Por qué no calcular el coeficiente de asimetría con los datos dispersos?, porque la curva la construimos con base a la tabla de distribución de frecuencias, es decir, después de que hemos agrupado los datos, mientras que con datos dispersos no se construyó ningún histograma.

El grado de aplanamiento se determina por medio del cálculo del coeficiente de curtósis, y para ello debemos calcular previamente el momento de orden 4:

( ) ( )

( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )( ) ( ) ( ) ( ) ( ) ( )

000084.0100

0084.0100

77135.185.1167135.180.1207135.175.1

287135.170.1177135.165.177135.160.157135.155.1

4

444

4444

7

1

4

7

1

7

1

4

4

=

=

−+−+−+

−+−+−+−

=

−=

−=

∑=

=

=

m

n

fxt

f

fxtm i

ii

ii

iii

y el coeficiente de aplanamiento:

( )539.2

0057.0

000084.022

2

44 ===

mm

a

lo cual indica que la distribución empírica es platocúrtica.

Page 30: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

2929

1.III.11 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN En muchos problemas hay dos o más variables inherentemente relacionadas, y es necesario explorar la naturaleza de esta relación. El análisis de regresión es una técnica estadística para modelar e investigar la relación entre dos o más variables. Por ejemplo, en un proceso químico, supóngase que el rendimiento del producto se relaciona con la temperatura de operación del proceso. El análisis de regresión puede emplearse para construir un modelo que exprese el rendimiento como una función de la temperatura. Este modelo puede utilizarse luego para predecir el rendimiento en un nivel determinado de temperatura. También podría emplearse con propósitos de optimización o control del proceso. En general, supóngase que hay una sola variable o respuesta y independiente que se relaciona con k variables independientes o regresivas, digamos x1, x2, ..., xk. La variable de respuesta y es una variable aleatoria, en tanto que las variables regresivas x1, x2, . . . , xk se miden con error despreciable. Las xj se llaman variables matemáticas y con frecuencia son controladas por el experimentador. El análisis de regresión también puede utilizarse en situaciones en las que y, x1, x2, ..., xk son variables aleatorias distribuidas conjuntamente, tal como en el caso cuando los datos se recaban como mediciones diferentes en una unidad experimental común. La relación entre estas variables se caracteriza por medio de un modelo matemático llamado ecuación de regresión. De modo más preciso, hablamos de la regresión de y en x1, x2, ..., xk. Este modelo de regresión se ajusta a un conjunto de datos. En algunas situaciones, el experimentador conocerá la forma exacta de la relación función verdadera entre y y x1, x2 , ..., xk, por ejemplo, ( )kxxxfy ,,, 21 K= . Sin embargo, en la mayor parte de los casos, la verdadera relación funcional se desconoce, y el experimentador elegirá una función apropiada para aproximar f. Un modelo de polinomio suele emplearse como la función de aproximación. En trabajos elementales a menudo se establecen relaciones mediante la determinación de los valores de las variables en un cierto número de puntos igual al número total de variables. Por ejemplo, si se postula una relación lineal y = a + bx, , dos pares de valores (x1, y1) y (x2, y2) determinan las constantes en la ecuación. Esto resulta satisfactorio, tomando en cuenta que las cantidades observadas no presentan ningún error. En la práctica, hay errores en nuestras observaciones, y si se realizan algunas más, digamos (x3, y3), es posible obtener un punto que no se ajusta de manera exacta a la línea recta que pasa por los dos puntos originales. Desde luego, esto también se aplica a las curvas que comprenden potencias de x y de y. Los métodos estadísticos permiten ajustar la "mejor" línea a una serie de datos dada, en lugar de simplemente trazar una línea "a ojo". Nuestro principal interés radica en el estudio de la relación existente entre dos variables, más que en la estimación de una variable a partir de la otra.

Page 31: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

3030

1.III.11.1 MÉTODO DE MINIMOS CUADRADOS El principio en el que se basa el ajuste de la "mejor" línea es el de mínimos cuadrados, y establece que si y es una función lineal de una variable independiente x, la posición más probable de una recta y = a + bx es tal que la suma de los cuadrados de las desviaciones de todos los puntos (xi, yi) respecto de la línea es un mínimo; las desviaciones se miden en la dirección del eje y. Cabe destacar que el supuesto considerado consiste en que x está libre de errores (es la asignada), o bien, está sujeta sólo a errores insignificantes, en tanto que y es la cantidad observada o medida, sujeta a errores que deben ser "eliminados" por el método de mínimos cuadrados. La y observada es pues un valor aleatorio a partir de la población de valores de y que corresponden a una x dada. Dicha situación existe en los experimentos controlados, donde se tiene interés en obtener un valor medio de iy para cada valor dado de xi. Suponga que nuestras observaciones constan de n pares de valores:

n

n

yyy

xxx

,,,

,,,

21

21

K

K

e imagine que los diversos pares se representan como puntos según se muestra en la figura . Suponga además que, debido a la naturaleza física de la relación entre y y x, se sabe que la relación es lineal, o bien, se espera o sospecha que lo es. Por consiguiente, se expresa la relación como

bxay += (22)

Nuestro problema consiste en encontrar los valores de a y b para el caso de la línea de "mejor ajuste".

Figura 9 Obtención de la recta de regresión lineal por el método de mínimos cuadradosObtención de la recta de regresión lineal por el método de mínimos cuadrados

Page 32: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

3131

En lo referente a un punto i en esta línea:

( ) 0=+− ii bxay

pero si se presenta un error en la medición, habrá un residuo ei tal que

( ) iii ebxay =+−

Con n observaciones, se tienen n ecuaciones:

( )( )

( ) nnn ebxay

ebxay

ebxay

=+−

=+−

=+−

MMM 222

111

Mediante el uso de la notación de sumatoria, es posible expresar la suma de los cuadrados de los residuos como sigue:

∑= 2ieP

o bien,

( )[ ]∑ +−= 2bxayP i (23)

en la que la sumatoria se extiende desde i = 1 a i = n. Como se mencionó antes, se tiene que satisfacer la condición de que la suma de los cuadrados de los residuos es mínima, es decir, P es un mínimo. Esto ocurre cuando:

=∂∂

=∂∂

0

0

bPaP

o bien, ( )[ ]∑ =+− 0ii bxay (24)

y ( )[ ] 0=−−∑ iii bxayx (25)

Quitando el subíndice, se puede formular la ecuación (24) como

∑ ∑∑ =−− 0xbay

Page 33: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

3232

Dado que a es una constante, se tiene

∑ ∑+= xbnay (26)

o bien,

n

xba

n

y ∑∑ +=

Así pues,

xbay += (27)

La ecuación anterior señala que la línea que pasa por el punto ( )yx, esto es, por el punto cuyas coordenadas son las medias adecuadas de todas las observaciones, punto al que podemos dar el nombre de centroide de todas las observaciones. A partir del hecho de que el punto ( )yx, se halla en la recta, se dice que la ecuación (22) puede formularse como sigue

( )xxbyy −=−

Regresando a la ecuación (25) se tiene

∑ ∑ ∑+= 2xbxaxy

Las ecuaciones (24) y (25) reciben el nombre de ecuaciones normales.

1.III.11.2 LINEA DE REGRESION Al resolver las ecuaciones normales (24) y (25), se obtiene,

( )22

2

∑∑∑∑∑∑

−=

xxn

xyxyxa (28)

y

( )22 ∑∑∑∑∑

−=

xxn

yxxynb (29)

De ahí que la ecuación para la línea de mejor ajuste se pueda expresar así:

( ) ( )x

xxn

yxxyn

xxn

yxyxy

2222

2

∑∑∑∑∑

∑∑∑∑∑∑

−+

−= (30)

Page 34: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

3333

En la práctica es más conveniente calcular a y b de manera separada [valiéndose de las ecuaciones (28) y (29)] y emplear los valores numéricos de a y b directamente, al escribir y = a + bx. La recta dada por la ecuación (30) se denomina línea de regresión de y sobre x. En su obtención se supone que x es la variable asignada (es decir, sensiblemente libre de error) y que y es la cantidad observada. No obstante, si se invierten las propiedades de las variables, esto es, si y es la variable asignada y x, la cantidad observada, se calculan las constantes en la ecuación de la línea

ybax ′+′= (31)

al minimizar la suma de los cuadrados de los x residuos. La ecuación para la recta, conocida como línea de regresión de x sobre y, es

( ) ( )y

yyn

yxxyn

yyn

xyyxyx

∑ ∑∑∑∑

∑ ∑∑∑∑∑

−+

−=

2222

2

(32)

En general,

ba

a′′

−≠

y

bb

′≠

1

pero ambas líneas se cortan en ( )yx, . Un ejemplo de las dos líneas de regresión se muestra en la figura 10. Debe observarse que es posible calcular la regresión cuando ambas variables están sujetas a error.

Figura 10 Línea de regresión a) x sobre y, b) y sobre x. El ejemplo corresponde a una relación esfuerzo Línea de regresión a) x sobre y, b) y sobre x. El ejemplo corresponde a una relación esfuerzo –– resistencia. resistencia.

Page 35: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

3434

El cálculo de a y b puede resultar bastante laborioso y puede comprender números grandes. Tal esfuerzo puede reducirse sirviéndose del hecho de que ( )yx, es un punto sobre la línea.

Por tanto, se pueden transformar los ejes de las coordenadas a un nuevo origen ( )yx, . De este modo, las nuevas coordenadas (X, Y), serán:

−=−=

yyY

xxX

Como el origen de las coordenadas (X, Y) es el centroide, se dice que

∑ ∑ == 0YX

En consecuencia, de la ecuación (28) se tiene,

0=a

y de la (29),

∑∑=

2X

XYb (33)

Esto equivale a escribir la ecuación (29) en la forma:

( )( )( )∑

∑−

−−=

2xx

yyxxb

que tiene un interés más teórico. Valiéndose de la ecuación (33) se observa que la ecuación para la línea de regresión de y sobre x (o Y sobre X) se convierte en:

XX

XYY

∑∑=

2 (34)

Por supuesto, la utilización de (X, Y) requiere que se calculen los valores de ( )xx − y ( )yy − para todas las observaciones. Esto puede ser tedioso si x o y comprenden varios decimales, y el cálculo de los productos y cuadrados puede resultar más laborioso que la operación de (x, y) directamente cuando estos últimos valores sean enteros. 1.III.11.3 LIMITACIONES DEL MÉTODO Es pertinente establecer explícitamente que el método de los mínimos cuadrados sólo se puede aplicar cuando los valores observados de yi corresponden a los valores asignados (o

Page 36: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

3535

libres de errores) xi; además, el error en y (expresado como varianza de y) debe ser inde-pendiente del nivel de x. (Por supuesto, y y x se pueden invertir.)

Para el caso de inferencias y estimaciones que se deban hacer respecto a la regresión (pero no por el método de mínimos cuadrados), también es necesario que los valores de yi que corresponden a un xi dado, estén distribuidos de manera normal, y cuya media de distribución satisfaga la ecuación de regresión. Además, la varianza de los valores de y para un valor dado de x deberá ser independiente de la magnitud de x. En muchos problemas prácticos esto no ocurre así, y, por tanto, es necesario recurrir a la transformación; las transformaciones comunes se realizan obteniendo los logaritmos, raíces cuadradas, etc. La transformación estabiliza la variancia de y, y hace que las distribuciones estén más próximas a lo normal.

1.III.11.4 RELACIONES NO LINEALES

El método de ajuste de la línea de regresión puede extenderse al caso en el que la relación conocida, esperada o sospechada no se encuentra en la forma de una línea recta. El procedimiento consiste en formular la ecuación a la curva en su forma general, tabular las desviaciones de y a partir de la curva supuesta, y obtener las constantes en la ecuación que satisfaga la condición de que la suma de los cuadrados de las desviaciones es un mínimo.

1.III.11.5 RECTIFICACIÓN

La aplicación del método de los mínimos cuadrados a las relaciones no lineales, por lo general requiere una serie considerable de cálculos. No obstante, en muchos casos, una relación no lineal puede transformarse en una relación de línea recta, es decir "rectificada". Eso no sólo simplifica el manejo de los datos, sino que también da lugar a una presentación gráfica más reveladora en lo que a la evaluación de la dispersión se refiere. La extrapolación, si esto se justifica (y a menudo no lo hace), también resulta más sencilla, al igual que el cálculo de los diversos valores estadísticos, como la desviación estándar o los límites de confianza. Claramente, los valores estadísticos calculados para variables rectificadas se aplican a ellos y no a los datos originales. A continuación se ilustrarán algunos casos simples. La función exponencial xaby = puede rectificarse mediante la transformación logarítmica, esto es, obteniendo los logaritmos de ambos miembros de la ecuación:

bxay logloglog +=

Esto se representará como una línea recta si las ordenadas dan como resultado log y (es decir, están a una escala logarítmica), en tanto que las abscisas están a una escala lineal. log a y log b son las constantes de ajuste de la ecuación. De modo que log y y x son tratadas como variables nuevas (y lineales) a las cuales se aplica el principio de mínimos cuadrados. La función de potencia baxy = puede rectificarse aun de manera más simple, una vez más tomando logaritmos:

xbay logloglog +=

Page 37: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

3636

Las constantes de ajuste son ahora log a y b, y las nuevas variables log x y log y están rela-cionadas linealmente. La hipérbola xbay += se puede rectificar tratando ux =1 como la nueva variable. Por tanto, y y u se relacionan en forma lineal. Si la ecuación es de la forma

bxax

y+

=

se puede invertir a

bxa

y+=

1

En consecuencia, x1 y y1 se relacionan en forma lineal. Alternativamente, se pueden multiplicar ambos miembros de la ecuación anterior por x, obteniendo así:

bxayx

+=

Por tanto, se grafica yx respecto a x. La elección depende de la naturaleza del caso considerado. La función polinomial de la forma 2cxbxay ++= es cóncava hacia arriba o hacia abajo, dependiendo de los signos de los coeficientes. Se diferencian ambos miembros de la ecuación con respecto a x:

cxbdxdy

2+=

Una relación de línea recta se obtiene graficando dxdy respecto de x. Si no se dispone de información anticipada acerca de la forma de la curva que se ajusta a los datos experimentales, se requerirá de métodos de ensayo y error. Como primer paso, se deben graficar los datos usando las coordenadas lineales y y x; luego se dibujará una curva lisa, y se elegirá una función susceptible de ajuste a partir del conocimiento de las formas de las curvas que corresponden a funciones algebraicas simples. Es importante destacar que cuando se emplea la transformación, la desviación minimizada no se encuentra en y, sino en la variable transformada. Cabe recordar que al sacar conclusiones a partir de un experimento, como ocurre en algunos casos, la diferencia puede ser significativa. Si se tiene una razón para creer que a partir de consideraciones físicas de un experimento, es

Page 38: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

3737

la variable original y no la transformada la que debe reducir al mínimo su desviación, entonces la variable transformada debe ponderarse en proporción inversa de alguna función del error de la variable original. A menudo, la ponderación se considera como proporcional a

( )21 error . Si el ajuste de la línea recta se lleva a cabo "a ojo", el error estándar de cada punto que representa una media de un conjunto de observaciones se puede indicar por una barra, y, por tanto, se dibuja la curva de modo que cuanto menor sea el error asociado a un punto dado, mayor será la probabilidad del paso de la recta por el citado punto. Desde. luego, esto a menudo se realiza intuitivamente cuando se tienen razones para creer que las lecturas a, digamos, temperaturas bajas son menos confiables (es decir, tienen una menor ponderación) que a altas temperaturas. Se dispone de programas de computadora estándares para el ajuste de diversas curvas de mínimos cuadrados. Para el caso de funciones no lineales, la iteración que emplea una computadora es práctica.

Page 39: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

3838

Conjuntos

2.I NOCIÓN DE CONJUNTO La palabra conjunto es un término primitivo, es decir, un concepto que todos entendemos intuitivamente de la misma manera y que no requiere ser definido en términos de conceptos más elementales. Así, en lugar de intentar definir dicho concepto presentamos a continuación algunos ejemplos y observaciones que contribuyen a precisar lo que entenderemos por conjunto. El alfabeto español, por ejemplo, es un conjunto de letras, los alumnos presentes en una clase determinada integran también un conjunto. Se habla, asimismo, del conjunto de requisitos que se deben satisfacer para ingresar en la Universidad, o del conjunto de puntos de una línea recta. Las letras, los alumnos, los requisitos y los puntos son los elementos de los diversos conjuntos mencionados. Los conceptos “conjunto” y “elemento” se explican mutuamente y no es posible concebirlos por separado: un conjunto está formado por elementos, y a la vez, ciertos elementos constituyen un conjunto. Una característica importante de los conjuntos es la siguiente: siempre se debe poder afirmar, categóricamente, si un ente u objeto dado pertenece o no pertenece a un conjunto determinado. Así, para nuestros fines, definamos a un conjunto como la colección de elementos que poseen al menos una característica en común.

Capítulo

2

Page 40: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

3939

2.II2.II SIMBOLOGÍA Y NOTACIÓNSIMBOLOGÍA Y NOTACIÓN

Generalmente usamos las letras mayúsculas para denotar a los conjuntos y las minúsculas para sus elementos. Para simbolizar que un objeto, x, es elemento de un conjunto S (se dice también que el elemento x pertenece al conjunto S) escribimos:

Sx ∈

mientras que, para expresar que x no es elemento del conjunto S (no pertenece a S) se escribe:

Sx ∉

En general, la diagonal se emplea en Matemáticas como símbolo de negación. Por ello, bastará con definir un símbolo para una proposición determinada y su negación quedará expresada mediante dicho símbolo cruzado por una diagonal. De esta manera, si llamamos V al conjunto de las vocales del alfabeto español tendremos que:

etcétera ,,, ViVeVa ∈∈∈ mientras que:

etcétera ,,, VdVcVb ∉∉∉ . Para algunos conjuntos es posible hacer una lista completa de los elementos que lo integran. En estos casos se acostumbra poner entre llaves dicha lista, separando los elementos por medio de una coma, para describir al conjunto. Por ejemplo, para el conjunto V al que nos acabamos de referir, en lugar de explicar: “V es el conjunto de las vocales del alfabeto español”, podemos escribir simplemente:

{ }uoieaV ,,,,= que se lee “V es el conjunto cuyos elementos son a, e, i, o, u”. Cuando un conjunto está expresado de esta manera se dice que está descrito (o definido) por extensión. No siempre es posible, ni conveniente, describir un conjunto por extensión. En tales casos es frecuente recurrir a otro tipo de descripción, llamada por comprensión, que consiste en representar a los elementos que integran al conjunto por medio de una literal o elemento genérico, indicando en ésta las condiciones que deben satisfacer los elementos. Por ejemplo, el conjunto V del caso anterior puede quedar también definido de la siguiente manera:

Page 41: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

4040

{ }español alfabeto del vocaluna es xxV =

La barra que está a continuación del elemento genérico significa “tal que” y la expresión anterior debe leerse “V es el conjunto de las x tales que x es una vocal del alfabeto español”. El elemento genérico no es siempre una literal. Por ejemplo, el conjunto:

{ }positivo enteroun es y 12 nnxxI −==

puede quedar escrito más brevemente como:

{ }positivo entero es 12 nnI −=

donde el elemento genérico es una expresión. El conjunto al que acabamos de referirnos es el de los números impares positivos. 2.III2.III CARDINALIDADCARDINALIDAD

El número de elementos contenidos en un conjunto determina la cardinalidad del conjunto. En el caso del conjunto V, su cardinalidad será de 5, y la expresamos:

( ) 5=Vn

2.IV2.IV CONJUNTOS FINITOS E INFINITOSCONJUNTOS FINITOS E INFINITOS En el caso del conjunto V, hemos podido determinar con precisión el número de elementos que lo integran, pero en el caso del conjunto I no es fácil decir cual es el número de elementos que lo integran. Cuando sea posible determinar el número de elementos que forman un conjunto, diremos que se trata de un conjunto finito. Cuando no sea posible enumerar el número de elementos que contiene un conjunto, entonces nos referiremos a ellos como conjuntos infinitos. Los conjuntos infinitos generalmente se mencionan por medio de oraciones abiertas, y para presentarlos en forma enumerativa escribimos únicamente algunos de sus primeros elementos y a continuación tres puntos suspensivos que debemos entender como la sucesión de elementos que cumplen con el modelo de los primeros. Así, el conjunto V es un conjunto finito, mientras que I es infinito, y lo podemos expresar como:

{ }K,9,7,5,3,1=I

Page 42: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

4141

2.V2.V CONJUNTO UNIVERSALCONJUNTO UNIVERSAL La totalidad de los elementos considerados para determinada operación se denomina conjunto universal y se representa con la letra U. Así, para el caso del conjunto I, la totalidad de los números enteros positivos constituirá el universo, o bien en el caso de V, el alfabeto español. Por su definición, entonces, el conjunto universal equivale al conjunto de reemplazamiento, es decir, significan lo mismo. 2.VI2.VI CONJUNTO VACÍOCONJUNTO VACÍO Un concepto quizá no tan intuitivo, pero si indispensable, es el de conjunto vacío. Se llama así a un conjunto sin elementos, el cual se representa mediante unas llaves vacías { }, o también mediante el símbolo ∅. La cardinalidad de ∅ es 0. Es importante hacer notar que los términos conjunto vacío y número cero son dos conceptos distintos y además el conjunto vacío se considera un conjunto finito. 2.VII2.VII CONJUNTOS EQUIVALENTESCONJUNTOS EQUIVALENTES Si dos conjuntos poseen la misma cardinalidad, se dice que son conjuntos equivalentes, ya que tienen el mismo número de elementos, y puede establecerse entre ambos una correspondencia de uno a uno, o biunívoca. Así por ejemplo, los conjuntos

{ } { }3,2,1y rojo blanco, verde, == FC son equivalentes, ya que se puede establecer la correspondencia biunívoca:

{ }rojo blanco, verde,

{ } 3 , 2 , 1 2.VIII2.VIII CONJUNTOS IGUALESCONJUNTOS IGUALES Se dice que dos conjuntos A y B son iguales cuando cada elemento de A es elemento de B y cada elemento de B es elemento de A. En otras palabras, A y B son dos representaciones distintas del mismo conjunto. Se simboliza BA = que se lee “A es igual a B”. Por ejemplo, A representa al conjunto formado por las letras a, o, e, u, i. B representa al conjunto de vocales del alfabeto:

{ }{ }

BA

uoieaB

iueoaA

=∴==

,,,,

,,,,

Page 43: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

4242

Se considera que dos conjuntos son iguales cuando tienen los mismos elementos, sin importar el orden en que estos se encuentren expresados o que alguno de ellos esté considerado más de una vez. De acuerdo a esto último, los conjuntos:

{ } { }bcabaCcbaA ,,,,y ,, ==

son iguales, ya que no importa que se repitan los elementos a y b. Es muy importante que se entienda la diferencia entre conjuntos iguales y conjuntos equivalentes; dos conjuntos son equivalentes cuando tienen la misma cardinalidad aunque sus elementos sean diferentes, mientras que dos conjuntos iguales siempre son también equivalentes, pues teniendo los mismos elementos tendrán la misma cardinalidad. 2.IX2.IX SUBCONJUNTOSSUBCONJUNTOS Consideremos nuevamente el conjunto de todas las letras del alfabeto español, al que llamaremos A:

{ }español alfabeto del letra una es xxA =

y también el conjunto de vocales:

{ }uoieaV ,,,,=

Es claro que cada uno de los cinco elementos de V es también elemento de A, puesto que todas las vocales son letras del alfabeto. Se dice por ello que V es un subconjunto de A (o que está incluido en A), lo cual se representa mediante la expresión AV ⊆ . Con ayuda del símbolo ∀ (léase “para todo” o “para cualquier”), llamado cuantificador universal, podemos enunciar una definición de subconjunto en los siguientes términos: Sean A y B dos conjuntos, se dice que A es subconjunto de B, y se escribe BA ⊆ , si:

BaAa ∈∈∀ que cumple se

En el ejemplo anterior V es un subconjunto de A, pero además este último tiene otros elementos que no pertenecen a V, por lo que se dice que es un subconjunto propio. A continuación se presenta una definición de subconjunto propio haciendo uso del símbolo ∃ , llamado cuantificador existencial, que se lee “existe un” y se interpreta como “existe al menos un”. Debe tenerse cuidado de no interpretar dicho símbolo como “existe exactamente un”.

Page 44: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

4343

Sean A y B dos conjuntos, se dice que A es un subconjunto propio de B, y se escribe BA ⊂ , si:

AbBbBA ∉∈∃⊆ que tal y

Un subconjunto que no es propio se denomina impropio. Pero como es fácil darse cuenta, el único subconjunto impropio de un conjunto dado es el mismo conjunto. Por otra parte, el conjunto vacío se considera un subconjunto propio de cualquier otro subconjunto. Hay también que resaltar el hecho de que la cardinalidad de un subconjunto propio siempre es diferente de la cardinalidad del conjunto en el que está incluido. Apoyados en la definición de subconjunto, podemos definir la igualdad de conjuntos de la siguiente manera: Sean A y B dos conjuntos, se dice que A es igual a B, y se escribe BA = , si BA ⊆ y

AB ⊆ . La idea de subconjunto propio nos sirve también para establecer entre los conjuntos las ideas de “mayor que” y “menor que” pues si un conjunto A es subconjunto propio de B, entonces A está contenido en B, y B tiene por lo menos un elemento más y podemos decir con seguridad que el conjunto B es mayor que el conjunto A lo cual simbolizamos B > A o también que el conjunto A es menor que el conjunto B (A < B). 2.X2.X DIAGRAMAS DE VENNDIAGRAMAS DE VENN Los conjuntos pueden ser interpretados gráficamente por medio de los llamados diagramas de Venn. En tales diagramas los conjuntos están representados por regiones cerradas del plano, cuyos puntos interiores corresponden a los elementos del conjunto. Dichas regiones se dibujan usualmente dentro de un rectángulo que representa al conjunto universal. De esta forma, los conjuntos

{ } { }{ } { }positivo enteroun es 2 ,,,,

,,,, español alfabeto del letra una es

nnPedcbaC

uoieaVxxA

==

==

pueden quedar representados mediante el siguiente diagrama de Venn:

Page 45: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

4444

2.XI2.XI OPERACIONES CON CONJUNTOSOPERACIONES CON CONJUNTOS Se definen las siguientes operaciones entre conjuntos: unión, intersección, diferencia, complemento y producto cruz. Efectuar la unión de dos conjuntos es agrupar los elementos de ambos en un solo conjunto, llamado la unión de estos, como se establece a continuación. Sean dos conjuntos A y B, la unión de A y B es el conjunto

{ }BxAxxBA ∈∈=∪ o

En esta definición la “o” está empleada en un sentido no excluyente, es decir, en la unión se consideran tanto los elementos que pertenecen a alguno de los dos conjuntos como los que pertenecen a ambos. En el siguiente diagrama de Venn, la unión de A y B está representada por la región sombreada.

La intersección de dos conjuntos es el conjunto formado por los elementos que pertenecen a ambos, es decir por los elementos comunes. Sean dos conjuntos A y B, la intersección de A y B es el conjunto:

{ }BxAxxBA ∈∈=∩ y

En el siguiente diagrama la intersección A y B corresponde al área sombreada:

Page 46: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

4545

La diferencia “A menos B” de dos conjuntos A y B es el conjunto formado por todos los elementos de A que no pertenecen a B, como lo indica la siguiente definición: Sean dos conjuntos A y B, la diferencia A menos B es el conjunto

{ }BxAxxBA ∉∈=− y

Es importante observar que, en general, la diferencia A – B y la diferencia B – A son conjuntos diferentes. En el siguiente diagrama se representan ambas diferencias:

El complemento de un conjunto está constituido por todos los elementos que no pertenecen a dicho conjunto (y que pertenecen, claro está, al conjunto universal). Así, apoyándonos en la definición de diferencia podemos establecer el concepto de complemento de la siguiente manera: Sea A un conjunto cualquiera y U el conjunto universal, el complemento de A es el conjunto

AUA −=′

El complemento de A está representado en el siguiente diagrama por el área sombreada

Page 47: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

4646

Para ilustrar el empleo de las operaciones que acabamos de definir, consideremos los conjuntos A, V, C y P definidos en la sección X, y además consideremos al universo U como el conjunto de todas las letras y todos los números. Para tales conjuntos se tiene que:

{ }uoiedcbaCV ,,,,,,,=∪ { }

{ }{ }{ }

( )( ) ( ) { }uoiVACV

AACV

CA

PPA

APA

APA

AV

xxVA

dcbVC

uoiCV

PA

VVA

AVA

eaCV

,,

español alfabeto del consonante una es

,,

,,

ajenos) conjuntosson Py A que dice se que lo(por

,

=′−∩−

=∪∪∅=∩′

=∩′=∪′

=−∅=−

=−

=−=−

∅=∩=∩=∪=∩

A continuación se presenta un cuadro con las propiedades más importantes de las operaciones con conjuntos. Cada una de las siguientes igualdades se cumple para conjuntos A, B y C cualesquiera, por lo que dichas propiedades constituyen teoremas de la teoría de conjuntos.

( ) ∅=′=∅′=′′

′∩=−=∅−∅=−∅=′∩∅=′∪

=∩=∪=∩=∪

∅=∅∩=∅∪

UUAA

BABAAAAA

AAAA

AAAAAA

AUAUUA

AAA

, ,

, ,

Leyes conmutativas:

ABBAABBA ∩=∩∪=∪

Leyes asociativas:

Page 48: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

4747

( ) ( ) ( ) ( )CBACBACBACBA ∩∩=∩∩∪∪=∪∪

Leyes distributivas:

( ) ( ) ( ) ( ) ( ) ( )CABACBACABACBA ∩∪∩=∪∩∪∩∪=∩∪ Leyes de De Morgan:

( ) ( )( ) ( ) ( ) ( ) ( ) ( )CABACBACABACBA

BABABABA

−∪−=∩−−∩−=∪−

′∪′=′∩′∩′=′∪

Se llama conjunto producto BA× (léase A cruz B) de dos conjuntos A y B, al conjunto de todas las parejas ordenadas que pueden formarse con un elemento de A como primer elemento de la pareja y con uno de B como segundo. Recordemos que en una pareja ordenada son importantes tanto los elementos como el orden en el que están expresados, por lo que en la pareja ordenada (a,b) la componente a recibe el nombre de primer elemento y la componente b el de segundo. De esta manera, se considera que dos parejas ordenadas (a,b) y (c,d) son iguales cuando a = c y b = d. Sean A y B dos conjuntos, se llama conjunto producto A cruz B al conjunto

( ){ }BbAabaBA ∈∈=× y ,

Así por ejemplo, para los conjuntos

{ } { }baDuoieaV , ,,,, == se tiene que

( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ){ }buauboaobiaibeaebaaaDV ,,,,,,,,,,,,,,,,,,,=×

mientras que

( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ){ }ubobibebabuaoaiaeaaaVD ,,,,,,,,,,,,,,,,,,,=×

Observe que la pareja (a,b), por ejemplo, pertenece a DV × pero no a VD × , mientras que (a,a) es elemento de ambos conjuntos producto. Esto se debe a que el producto cruz no conmuta, y en este caso, como el primer elemento de ambos conjuntos es a, pues coincide que la primer pareja ordenada sea (a,a).

Page 49: Probabilidad y Estadística

E S T A D Í S T I C A Y P R O B A B I L I D A D

4848

El conjunto producto AA× suele denotarse en forma abreviada, con 2A . En forma análoga, se define el producto de tres conjuntos A, B y C como el siguiente conjunto de ternas ordenadas:

( ){ } y , ,, CcBbAacbaCBA ∈∈∈=××

y 3A representa al producto AAA ×× . En general, el producto de n conjuntos S1, S2, ..., Sn se define como:

( ){ }nnn SeSeSeeeeSSS ∈∈∈=××× ,, , ,,, 221132121 LLL

y nA representa el producto AAA ××× L (n factores). La representación gráfica de estos conjuntos producto no es sencilla, pero en el caso de tratarse del conjunto producto de dos conjuntos, se puede representar mediante un plano cartesiano x, y. Para el caso del producto de 3 conjuntos, una representación posible es el espacio tridimensional x, y, z.

Page 50: Probabilidad y Estadística

4949