Estadistica Inferencial 2 de Junio 2012

72
1 ESTADÍSTICA UNIDAD 1 GENERALIDADES OBJETIVOS DE LA UNIDAD 1.Saber qué significa estadística. 2. Explicar qué es estadística descriptiva y estadística inf 3. Diferenciar entre una variable cualitativa y una variable 4. Distinguir entre una variable discreta y una variable con 5.Diferenciar entre niveles de medición nominal, ordin de razón. 6.Definir los términos mutuamente excluyentes y exhaustivos Introducción: La palabra "estadística" suele utilizarse bajo dos significad 1º Como colección de datos numéricos.- Esto es el significado palabra estadística. Se sobrentiende que dichos datos numéric presentados de manera ordenada y sistemática. Una info cualquiera puede no constituir una estadística, para merecer datos han de constituir un conjunto coherente, establecido de y siguiendo un criterio de ordenación. Tenemos muchos ejemplos de este tipo de estadísticas. El Anua publicado por el Instituto Nacional de Estadística, El Anuari Trabajo,… 2º Como ciencia.- En este significado, La Estadística estudia de los fenómenos de masas. Como todas las ciencias, busca las generales de un colectivo y prescinde de las particulares de por ejemplo al investigar el sexo de los nacimientos, tomando un grupo numeroso de nacimientos y obtener después la de varones. Es muy frecuente enfrentarnos con fenómenos en lo difícil predecir el resultado; así, no podemos dar una lista van a morir con una cierta edad, o el sexo de un transcurra un determinado tiempo de embarazo,… Por tanto, el objetivo de la estadística es hallar l encuentran en los fenómenos de masa. ESTADISTICA.- Es la ciencia que usa métodos para reunir resumir y analizar datos, así como para obtener conclusiones tomar decisiones razonables, a base de tales análisis”.

Transcript of Estadistica Inferencial 2 de Junio 2012

ESTADSTICA UNIDAD 1 GENERALIDADES OBJETIVOS DE LA UNIDAD 1. 2. 3. 4. 5. Saber qu significa estadstica. Explicar qu es estadstica descriptiva y estadstica inferencial. Diferenciar entre una variable cualitativa y una variable cuantitativa. Distinguir entre una variable discreta y una variable continua. Diferenciar entre niveles de medicin nominal, ordinal, por intervalo y de razn. 6. Definir los trminos mutuamente excluyentes y exhaustivos.

Introduccin: La palabra "estadstica" suele utilizarse bajo dos significados distintos, a saber: 1 Como coleccin de datos numricos.- Esto es el significado ms vulgar de la palabra estadstica. Se sobrentiende que dichos datos numricos han de estar presentados de manera ordenada y sistemtica. Una informacin numrica cualquiera puede no constituir una estadstica, para merecer este apelativo, los datos han de constituir un conjunto coherente, establecido de forma sistemtica y siguiendo un criterio de ordenacin. Tenemos muchos ejemplos de este tipo de estadsticas. El Anuario Estadstico publicado por el Instituto Nacional de Estadstica, El Anuario de Estadsticas del Trabajo, 2 Como ciencia.- En este significado, La Estadstica estudia el comportamiento de los fenmenos de masas. Como todas las ciencias, busca las caractersticas generales de un colectivo y prescinde de las particulares de cada elemento. As por ejemplo al investigar el sexo de los nacimientos, iniciaremos el trabajo tomando un grupo numeroso de nacimientos y obtener despus la proporcin de varones. Es muy frecuente enfrentarnos con fenmenos en los que es muy difcil predecir el resultado; as, no podemos dar una lista ,con las personas que van a morir con una cierta edad, o el sexo de un nuevo ser hasta que transcurra un determinado tiempo de embarazo, Por tanto, el objetivo de la estadstica es hallar las regularidades que se encuentran en los fenmenos de masa. ESTADISTICA.- Es la ciencia que usa mtodos para reunir , organizar, resumir y analizar datos, as como para obtener conclusiones vlidas y tomar decisiones razonables, a base de tales anlisis.

1

TIPOS DE ESTADISTICA ESTADISTICA DESCRIPTIVA.- Conjunto de mtodos para organizar, resumir y presentar datos de manera informativa. Ejemplo 1:

2

ESTADISTICA INFERENCIAL.- Es el conjunto de mtodos que se utilizan para saber algo acerca de una poblacin, basados en una muestra. Es sacar conclusiones vlidas por medio de la deduccin e inferencia, de un grupo de datos para tomar decisiones sobre un fenmeno o hecho. Ejemplo 2 Un informe realizado por la Universidad Central, indica que el ingreso medio mensual de un egresado es de 550 USD. Para comprobar esa afirmacin se aplic una encuesta a una muestra aleatoria de 145 egresados, determinndose un ingreso medio mensual de 535 USD. Mediante una prueba de hiptesis, no se encontr diferencia estadstica entre esos dos valores, por lo que se puede inferir que estadsticamente el ingreso medio mensual de un egresado de la Universidad Central es de 550 USD POBLACION Y MUESTRA Poblacin, elementos y caracteres. Es obvio que todo estudio estadstico ha de estar referido a un conjunto o coleccin de personas o cosas. Este conjunto de personas o cosas es lo que denominaremos poblacin. Las personas o cosas que forman parte de la poblacin se denominan elementos. En sentido estadstico un elemento puede ser algo con existencia real, como un automvil o una casa, o algo ms abstracto como la temperatura, un voto, o un intervalo de tiempo. A su vez, cada elemento de la poblacin tiene una serie de caractersticas que pueden ser objeto del estudio estadstico. As por ejemplo si consideramos como elemento a una persona, podemos distinguir en ella los siguientes caracteres: Sexo, Edad, Nivel de estudios, Profesin, Peso, Altura, Color de pelo, etc. Luego por tanto de cada elemento de la poblacin podremos estudiar uno o ms aspectos cualidades o caracteres. La poblacin puede ser segn su tamao de dos tipos: Poblacin finita: cuando el nmero de elementos que la forman es finito, por ejemplo el nmero de alumnos de un centro de enseanza, o grupo clase. Poblacin infinita: cuando el nmero de elementos que la forman es infinito, o tan grande que pudiesen considerarse infinitos.. Como por ejemplo si se realizase un estudio sobre los productos que hay en el mercado. Hay tantos y de tantas calidades que esta poblacin podra considerarse infinita.

3

Ahora bien, normalmente en un estudio estadstico, no se puede trabajar con todos los elementos de la poblacin sino que se realiza sobre un subconjunto de la misma. Este subconjunto puede ser una muestra, cuando se toman un determinado nmero de elementos de la poblacin, sin que en principio tengan nada en comn; o una subpoblacin, que es el subconjunto de la poblacin formado por los elementos de la poblacin que comparten una determinada caracterstica, por ejemplo de los alumnos del centro la subpoblacin formada por los alumnos de 3 ESO, o la subpoblacin de los varones. VARIABLES Y ATRIBUTOS. Como hemos visto, los caracteres de un elemento pueden ser de muy diversos tipos, por lo que los podemos clasificar en: dos grandes clases: Variables Cuantitativas. Variables Cualitativas o Atributos. Las variables cuantitativas son las que se describen por medio de nmeros, como por ejemplo el peso, Altura, Edad, Nmero de Suspensos A su vez este tipo de variables se puede dividir en dos subclases:

Cuantitativas discretas. Aquellas a las que se les puede asociar un nmero entero, es decir, aquellas que por su naturaleza no admiten un fraccionamiento de la unidad, por ejemplo nmero de hermanos, pginas de un libro, etc. Cuantitativas continuas: Aquellas que no se pueden expresar mediante un nmero entero, es decir, aquellas que por su naturaleza admiten que entre dos valores cualesquiera la variable pueda tomar cualquier valor intermedio, por ejemplo peso, tiempo. etc.

No obstante en muchos casos el tratamiento estadstico hace que a variables discretas las trabajemos como si fuesen continuas y viceversa. Los atributos son aquellos caracteres que para su definicin precisan de palabras, es decir, no le podemos asignar un nmero. Por ejemplo Sexo Profesin, Estado Civil, etc. A su vez las podemos clasificar en:

Ordenables: Aquellas que sugieren una ordenacin, por ejemplo la graduacin militar, El nivel de estudios, etc. No ordenables: Aquellas que slo admiten una mera ordenacin alfabtica, pero no establece orden por su naturaleza, por ejemplo el color de pelo, sexo, estado civil, etc.

4

CONCEPTO Y CLASIFICACIN DE DATOS DATOS.- Caractersticas o nmeros que son recolectados por observacin. No son otra cosa que el producto de las observaciones efectuadas en las personas y objetos en los cuales se produce el fenmeno que queremos estudiar Los datos estadsticos pueden ser clasificados en cualitativos, cuantitativos, cronolgicos y geogrficos Datos Cualitativos: cuando los datos son cualitativos, la diferencia entre ellos es de clase y no de cantidad. Ejemplo: Si deseamos clasificar los estudiantes que cursan la materia de estadstica I por su estado civil, observamos que pueden existir solteros, casados, divorciados, viudos. Datos cuantitativos: cuando los valores de los datos representan diferentes magnitudes, decimos que son datos cuantitativos. Ejemplo: Se clasifican los estudiantes de una Universidad de acuerdo a sus notas, observamos que los valores (nota) representan diferentes magnitudes. Datos cronolgicos: cuando los valores de los datos varan en diferentes instantes o perodos de tiempo, los datos son reconocidos como cronolgicos. Ejemplo: Al registrar los promedios de notas de los Alumnos de una Universidad en los diferentes semestres. Datos geogrficos: cuando los datos estn referidos a una localidad geogrfica se dicen que son datos geogrficos. Ejemplo: El nmero de estudiantes de educacin superior en las distintas regiones del pas NIVEL DE MEDICION DE LOS DATOS Los datos se pueden clasificar de acuerdo con los niveles de medicin. Los niveles de medicin de los datos indican, con frecuencia, qu clculos se pueden realizar para resumir y presentar los datos y qu pruebas estadsticas pueden llevarse a cabo. Por ejemplo en una bolsa de dulces llamados lunetas hay dulces de seis colores. Supongamos que asignamos el valor 1 a los cafs, el 2 a los amarillos, el 3 a los azules, el 4 a los naranjas, el 5 a los verdes y el 6 a los rojos. Sumamos los valores asignados a los dulces de la bolsa y dividimos la suma entre el nmero de dulces y decimos que el color promedio es 3,56. Significa esto que el color promedio es azul o naranja? Damos el orden de los finalistas y decimos que el finalista promedio es de 4.5. Qu nos dice el finalista promedio? En estos dos ejemplos no hemos usado adecuadamente el nivel de medicin.

5

Hay cuatro niveles de medicin: nominal, ordinal, de intervalo y de razn. El nivel de medicin " ms bajo" o ms primitivo es el nominal. El ms alto o el que nos da ms informacin acerca de la observacin es el nivel de medicin de razn. Datos de nivel nominal El nivel nominal, las observaciones nicamente se pueden clasificar o contar. La clasificacin de los dulces llamados lunetas en seis colores es un ejemplo de nivel de medicin nominal. Clasificamos a los dulces slo por color. No hay un orden natural. Podemos tomar primero los dulces cafs o primero los naranjas, o los de cualquier otro color. El gnero es otro ejemplo de medicin nominal. Supongamos que contamos el nmero de alumnos con credencial que entran a un juego de ftbol y damos el nmero de mujeres y el nmero de hombres. El nivel de medicin nominal no incluye ninguna medicin, nicamente conteo. Datos de nivel ordinal El siguiente nivel de datos el ordinal. Las calificaciones que los alumnos dieron a la profesora Margarita espern en el curso de estadstica II. Cada estudiante en la clase contest a la pregunta " En general cmo califica usted a la profesora de esta clase? Esto ilustra el uso de la escala ordinal de medicin. Cada categora es ms alta o mejor que la siguiente. Esto es, "superior" es mejor que "bueno", "bueno" mejor que aceptable, y as sucesivamente. Sin embargo no podemos distinguir la magnitud de las diferencias entre grupos. En resumen las propiedades de los datos de nivel ordinal: Las categoras de datos son mutuamente excluyentes ( Un individuo, objeto o medicin pertenece nicamente a una categora) y exhaustiva ( cada individuo, objeto o medicin debe pertenecer a una de las categoras). Las categoras de datos estn clasificadas u ordenadas de acuerdo con la caracterstica especial que poseen.

Datos de nivel intervalo El nivel de intervalo es el siguiente nivel de medicin en orden ascendente. Tiene todas las caractersticas del nivel ordinal, pero, adems, la diferencia entre dos valores es de un tamao constante. Un ejemplo de medicin del nivel intervalo es la temperatura. Supongamos que las temperaturas en Nueva Loja en tres das consecutivos de verano sean 40, 38 y 35 C. Estas temperaturas se pueden ordenar fcilmente, pero tambin podemos determinar la diferencia de temperatura. Esto es posible porque un C representa una cantidad constante de medicin. Diferencias iguales entre dos temperaturas son las mismas, sin importar la

6

posicin que ocupan en la escala. Esto es, la diferencia entre 10 C y 15 C es 5, la diferencia entre 40 y 45 C es tambin 5 grados. Es importante notar que 0 es slo un punto en la escala. No representa la ausencia de condicin. (0C = 32F). Las propiedades de la escala de intervalo son : Las categoras de datos son mutuamente excluyentes y exhaustivas. Las categoras de datos estn ordenados de acuerdo con la cantidad de la caracterstica que poseen. Diferencias iguales en la caracterstica estn representadas por diferencias iguales en los nmeros asignados a las categoras.

Datos de nivel de razn Es el nivel de medicin ms alto. El nivel de razn tiene todas las caractersticas de nivel de intervalo, pero adems el punto 0 tiene significado y la relacin entre dos nmeros tiene sentido. Ejemplo salarios, unidades de produccin, peso y altura. El dinero nos da una ilustracin. Si usted tiene 0 dlares no tiene dinero. El peso es otro ejemplo, si la aguja marca cero en la escala, entonces hay una completa ausencia de peso. Las propiedades de la escala de razn son : Las categoras de datos son mutuamente excluyentes y exhaustivas. Las categoras de datos estn ordenados de acuerdo con la cantidad de la caracterstica que poseen. Diferencias iguales en la caracterstica estn representadas por diferencias iguales en los nmeros asignados a las categoras. El punto cero refleja la ausencia de esa caracterstica.

Ejercicios 1.- La directiva de un asentamiento humano quiere renovar el alumbrado pblico y construir 9 parques lo ms pronto posible. Pero como esto es muy costoso, se llev a cabo una encuesta entre los pobladores para saber su opinin. De las 650 encuestas enviadas, solo 360 fueron llenadas.

a) Indica la poblacin, el tamao de la muestra b) Determinar las variables y el nivel de medicin en la encuesta.

7

2.- A principios de la dcada del 60 se liber estroncio 90 durante pruebas atmosfricas de armas nucleares, siendo absorbidas por 100 personas vivas, y acumuladas en sus huesos. Se hace un estudio a 20 de ellos hoy para saber cunto estroncio queda en sus huesos. Identificar Muestra y Poblacin.

3.- Clasificar las siguientes variables e indicar su nivel de medicin:Variables a) Kilmetros recorridos por un tractor con 10 litros de gas oil. b) Milmetros de precipitacin cados en el mes de enero en Paran. c) Nmero de chauchas por planta de soja. d) Razas de ganado lechero en Argentina (Holando, Jersey, Pardo suizo). e) Calidad de grano de soja a cosecha. (1= Excelente, .., 5 = Malo). f) Longitud de entrenudos de trigo pan (cm.). g) Nmero de plantas de avena por metro cuadrado. h) Concentracin de cloruros disueltos en agua de pozo (ppm) i) Rendimiento en kg/ha de sorgo granfero. j) Presencia de gripe aviar en paises de la Union Europea k) Eficiencias de conversin en ganado lechero: Leche producida / Kg. Alimento Balanceado (l/kgMS) l) Porcentaje de Grasa Butirosa (%). ll) Nmero total de muertes fetales durante un ao / nmero total de alumbramientos durante un ao por 1000. m) Criaderos de semilla soja. (Pioneer, Monsanto, Nidera, La tijereta). n) Distancia entre surcos en el cultivo de soja. ) Das Emergencia Floracin de hbridos de girasol. o) Temperatura media mensual durante el ciclo de cultivo de trigo. p) Intensidad de verticilosis (escala de 0 a 5), segn la sintomatologa en hoja de hbridos de girasol. q) Nmero de vacas en ordee por tambo en la provincia de Entre Rios. r) Kilogramos de materia seca / ha / ao de un pastizal natural. s) Porcentaje de Protena Bruta (%). Clasificacin

4.- Clasifique las variables que aparecen en el siguiente cuestionario e indicar su nivel de medicin: 1. Cul es su edad? 2. Estado civil: a) Soltero b) Casado c) Separado d) Divorciado e) Viudo 3. Cunto tiempo emplea para desplazarse a su trabajo?

8

4. Tamao de su municipio de residencia: a) Municipio pequeo (menos de 2.000 habitantes) b) Municipio mediano (de 2.000 a 10.000 hab.) c) Municipio grande (de 10.000 a 50.000 hab.) d) Ciudad grande (ms de 100.000 hab.)

5. Est afiliado a la seguridad social? UNIDAD 2 ORGANIZACIN Y PRESENTACION DE LOS DATOS OBJETIVOS DE LA UNIDAD 1. Organizar y presentar datos informativos numricos mediante mtodos descriptivos visuales. 2. Desarrollar una representacin grfica de tallo y hoja. 3. Conocer los tipos de tablas estadsticas para presentacin de datos. 4. Organizar los datos en tablas de distribucin de frecuencias. 5. Presentar una distribucin de frecuencias en un histograma, polgono y ojiva de frecuencias. 6. Presentar datos mediante tcnicas de graficacin como graficas de lnea, de barras y circulares. LISTA DE VALORES NUMERICOS La organizacin y presentacin de un conjunto de informacin numrica es una de las primeras tareas para comprender un problema. Tomemos como ejemplo los valores que aparecen a continuacin, que representan el tiempo del trayecto al trabajo de un grupo de 50 estudiantes al edificio de la universidad. Los tiempos se expresan en minutos y cada valor representa el promedio de un estudiante en cinco das consecutivos. 44.0 36.2 15.8 29.2 35.2 35.4 38.4 28.8 40.6 56.4 28.4 49.2 31.0 47.8 18.3 46.0 31.8 44.0 30.4 53.6 35.4 86.4 38.4 12.2 125.4 18.2 12.6 74.0 123.8 13.2 20.4 27.4 23.0 42.0 39.0 56.4 14.0 11.4 47.0 34.6 43.2 39.4 39.8 32.4 22.2 38.4 39.4 30.2 39.2 60.0

La simple recoleccin de estos datos no es una tarea fcil, sin embargo es evidente que se debe hacer ms para que esa informacin numrica sea comprensible:

9

Qu se debera hacer para que esta informacin sea prctica? 1.- Algunas personas encuentran interesante analizar el valor ms alto y el valor ms bajo. El valor ms bajo es 11.4 El valor ms alto es 125.4 2.- Se puede ordenar los datos de forma ascendente o descendente, en este caso se tiene: 125.4 47.0 39.2 32.4 22.2 123.8 46.0 39.0 31.8 20.4 86.4 44.0 38.4 31.0 18.3 74.0 44.0 38.4 30.4 18.2 60.0 43.2 38.4 30.2 15.8 56.4 42.0 36.2 29.2 14.0 56.4 40.6 35.4 28.8 13.2 53.6 39.8 35.4 28.4 12.6 49.2 39.4 35.2 27.4 12.2 47.8 39.4 34.6 23.0 11.4

Luego de este ordenamiento se puede observar que hay muchos valores que se aproximan a 40 minutos. Adems hay tres estudiantes que emplean 38,4 minutos. Esta Lista de datos aun en su forma ordenada sigue siendo una informacin sumamente grande que todava presenta dificultades para su comprensin. Para esto se ha desarrollado otras tcnicas o mtodos para describirlos datos.

METODOS DESCRIPTIVOS VISUALES DIAGRAMA DE TALLO Y HOJA Es una tcnica estadstica para representar un conjunto de datos. Cada valor numrico se divide en dos partes. El o los dgitos principales forman el tallo y los dgitos secundarios las hojas. Los tallos estn colocados a lo largo del eje vertical, y las hojas de cada observacin a lo largo del eje horizontal. Para entender este mtodo consideremos el siguiente ejemplo: Ejemplo: Se realizo una prueba de coordinacin fsica a 20 estudiantes que haban ingerido una cantidad de alcohol equivalente al 0.1% de su peso, cuyos resultados se muestran a continuacin: 69 57 84 64 52 67 93 72 61 74 74 55 79 82 65 61 88 68 63 77

Para realizar el diagrama de tallo y hoja seguimos los pasos siguientes:

10

1.- Dividimos cada nmero en sus decenas y unidades, disponiendo juntos los valores que comparten las decenas, las decenas se dispondrn en forma vertical y formaran los tallos. 5 6 7 8 9 2.- Luego se debe marcar las hojas que sern los nmeros correspondiente a las unidades de las decenas respectivas. Despus de los tres primeros valores (69,84,52) la grfica de tallo quedara as: 5 6 7 8 9 2 9 4

3.- Se sigue es procedimiento hasta completar todos los datos. La grfica de tallo y hoja contiene la misma informacin original sino que de forma ms compacta. 5 6 7 8 9 275 91534718 49247 482 3

4.- Se puede ordenar tambin las hojas o hacer un ordenamiento previo de los datos en forma ascendente o descendente, con lo que la grfica de tallo y hoja quedara de la siguiente forma: 5 6 7 8 9 257 1 13 4 5 7 8 9 24479 248 3

En resumen se pueden indicar los siguientes pasos generales para realizar un diagrama de tallo y hojas Seleccionar uno o ms dgitos iniciales para los valores de tallo. El digito/s final/es se convierten en hojas. Hacer una lista de valores de tallo en una columna vertical (entre 5 y 20 tallos.) Registrar la hoja por cada observacin junto al valor correspondiente al tallo. 11

Indicar las unidades para tallos y hojas en algn lugar del diagrama.

Ejercicios: 1.- Las siguientes son las alturas en centmetros de diecisis estudiantes de bachillerato: 172,182,177,174,166,158,170,178,163,161,191,167,171,201,166,172. Elabore una grfica de tallo y hoja con las clasificaciones de tronco 15, 16, 17, 18,19, y 20. 2.- Las siguientes son las edades de treinta y dos jefes de familia de una comunidad 68,81,62,61,76,65,69,73,66,68,71,74,64,70,68,73,82,79,63,69,68, 66,73,74,77,80,73,66,67,81,77, y 66 aos. Realizar un diagrama de tallo y hoja. 3.- Realice un diagrama de tallo y hoja para los siguientes datos de distancias en metros de una cancha de golf 6435 6464 6433 6470 6526 6527 6506 6583 6605 6694 6614 6790 6770 6700 6798 6770 6745 6713 6890 6870 6873 6850 6900 6927 6936 6904 7051 7005 7011 7040 7050 7022 7131 7169 7168 7105 7113 7165 7280 7209 4.- Desarrollar un diagrama de tallo y hoja con los siguientes datos que representan los ndices mensuales de actividad econmica de los ltimos tres aos en el pas.251,84 255,74 260,72 265,30 266,94 266,98 271,53 271,98 273,27 275,51 278,76 281,58 303,16 303,89 303,37 304,17 307,11 310,35 267,49 268,85 269,93 269,85 270,11 271,09 283,65 286,74 291,01 295,09 298,44 301,14 314,07 319,07 324,40 328,32 329,60 328,80

5.- Desarrollar un diagrama de tallo y hoja con los siguientes datos que representan la concentracin de calcio en mg/lt en 40 muestras de agua.

6.-

La concentracin de slidos suspendidos en agua de ro es una caracterstica ambiental importante. En un artculo publicado en una revista se report sobre la concentracin (en partes por milln o ppm) para varios ros diferentes. Suponga que se obtuvieron las siguientes observaciones para un ro en particular. a) Construya y analice un diagrama de tallo y hojas.

12

TABLAS ESTADSTICAS Las tablas estadsticas se pueden clasificar segn el nmero de observaciones y segn el recorrido de la variable estadstica, as tenemos los siguientes tipos de tablas estadsticas: Tablas tipo I: Cuando el tamao de la muestra y el recorrido de la variable son pequeos, por ejemplo si tenemos una muestra de las edades de 5 personas, por lo que no hay que hacer nada especial simplemente anotarlas de manera ordenada en filas o columnas. Edad de los 5 miembros de una familia: 5, 8, 16, 38, 45 Tablas tipo II: Cuando el tamao de la muestra es grande y el recorrido de la variable es pequeo, por lo que hay valores de la variable que se repiten. Por ejemplo, si se considera el nmero de especies vegetales encontradas en 50 parcelas se tendra: Especies vegetales en 50 parcelas: 2 2 2 3 1 1 3 2 2 3 2 2 1 3 4 2 1 2 1 3 1 1 1 2 2 2 1 1 4 2 4 3 1 2 2 2 4 3 1 1 1 2 2 4 3 1 2 2 1 3

Podemos observar que la variable toma valores comprendidos entre 1 y 4, por lo que precisaremos una tabla en la que resumamos estos datos quedando la siguiente tabla:

13

CLASE (Especies ) 1 2 3 4 Total Tablas tipo III:

FRECUENCIA (Parcelas) 16 20 9 5 50

Cuando el tamao de la muestra y el recorrido de la variable son grandes, por lo que ser necesario agrupar en intervalos los valores de la variable. Por ejemplo si a un grupo de 30 personas les preguntamos el dinero que en ese momento tienen en una cuenta bancaria, nos encontramos con los siguientes datos:450 5 1152 180 250 200 300 675 175 500 80 375 25 1500 2680 205 605 985 785 185 1595 125 2300 315 5000 425 1200 560 100 1100

Evidentemente, la variable estadstica tiene un recorrido muy grande, 4998 dlares, por lo que s queremos hacer una tabla con estos datos tendremos que tomar intervalos. Para decidir la amplitud de los intervalos, necesitaremos decidir cuntos intervalos queremos?. Normalmente se suele trabajar con no ms de 10 o 12 intervalos. Debemos tener en cuenta las siguientes consideraciones: Tomar pocos intervalos implica que la "prdida de informacin" sea mayor. Los intervalos sern siempre Cerrados por la izquierda y Abiertos por la Derecha [ Li, Ls) Procuraremos que en la decisin de intervalos los valores observados no coincidan con los valores de los extremos del intervalo y si esto ocurre que no sea en ms de un 5% del total de observaciones. Los pasos para la construccin de una tabal estadstica de tipo III son mejor explicados con un ejemplo.

14

Ejemplo: Los siguientes datos son el nmero de meses de duracin de una muestra de 40 bateras para auto.22 34 25 33 47 41 16 43 31 38 35 31 34 37 32 45 33 36 44 26 32 38 29 32 39 37 31 33 41 30 30 47 39 19 42 26 37 31 34 35

Para elaborar una tabla estadstica de tipo III se puede seguir los siguientes pasos: 1. Determinar el rango (R) Rango = valor mx. Valor min= 47 16 = 31 2. Determinar el Nmero tentativo de clases o intervalos de clase El nmero clases o intervalos puede ser como mnimo 5 y como mximo 15 de acuerdo a la frmula 2 kNmero de clases 5 6 7 8 9 10 Nmero mximo de datos ( 2 ) 32 64 128 256 512 1024k

En este ejercicio, puesto que tenemos 40 datos el nmero de clases sugerido sera de 6. Tambin se puede determinar el nmero de clases sugerido aplicando la frmula: Numero de clases = 1,322logN; donde N es el tamao de la muestra. 3. Determinar el Tamao o amplitud de los Intervalos de Clase (i) Rango i = Nmero de clases = 6 31 = 5.16 se redondea a 5

Para facilitar la clasificacin de los datos, el tamao de los intervalos se redondea a una cifra ms o menos cerrada. 4. Determinar el Lmite inferior del primer intervalo o clase Usualmente, el lmite inferior del primer intervalo de clase es un mltiplo del tamao del intervalo (i) igual o menor que el valor mnimo. Si el tamao del 15

intervalo es ms grande que el valor mnimo, el primer lmite inferior es cero. En este problema el tamao del intervalo es de 5, entonces el primer lmite inferior ser el mayor mltiplo de 5 pero inferior o igual al dato menor, el 15. El lmite inferior de los siguientes intervalos se calcula sumando el tamao del intervalo al lmite inferior del intervalo anterior hasta llegar a un nmero no mayor al valor mximo. 5. Lmite superior del primer intervalo o clase El lmite superior se calcula con la siguiente frmula LS = LI + i 6. - Clasificacin de los datos y conteo de frecuencias Clasificar las observaciones en los intervalos. La prctica usual es marcar con una lnea ( / ) que representa una observacin. En el ejemplo la observacin 22 se clasifica en el intervalo 20 24 porque se encuentra entre el 20 y el 24 inclusive. Una vez clasificados todos los datos se cuentan las lneas de cada intervalo y el resultado es la frecuencia de cada intervalo de clase. LI LS 15 20 // 20 25 / 25 30 //// cuenta F 2 1 4

30 35 ///// ///// ///// 15 35 40 ///// ///// 40 45 ///// 45 50 /// 10 5 3

La tabla estadstica tipo III finalmente quedara de la siguiente forma:Clase 1 2 3 4 5 6 7 LI 15 20 25 30 35 40 45 LS 20 25 30 35 40 50 55 F 2 1 4 15 10 5 3

16

Ejemplo En un estudio para determinar el grado de conocimiento que tiene la poblacin de una determinada ciudad sobre el reciclaje de basura, se aplico un test de conocimientos el cual se calific en una escala de 1 a 100. Se seleccionaron aleatoriamente 30 personas cuyos resultados se muestran a continuacin: 77.97 13.02 17.97 89.19 12.18 8.15 34.40 43.13 79.61 90.99 43.66 29.75 7.42 93.91 20.64 21.10 17.64 81.59 60.94 43.97 32.67 43.66 51.69 53.40 68.13 11.10 12.98 38.74 70.15 25.68 Representar esos valores en una tabla estadstica tipo III

Efectuar el arreglo ordenado de la poblacin o muestra: A= (7.42, 8.15, , , , 90.99, 93.91 ) Donde: Valor mnimo = 7.42 y Valor mximo = 93.91

1. Encontrar el rango o recorrido de los datos: "R" R = valor mayor valor menor = Xn X1 = 93.91 7.42 = 86.49 2. Encontrar en nmero K=1+3.322(log N) de clases "K" , segn la frmula

Nota: en el ejemplo en estudio N=30 por cuanto que son 30 personas en la muestra: K = 1 + 3.322 (log 30) = 1 + 3.322 (1.477) = 1+ 4.9069 = 5.9069 ~6 aproximado al siguiente entero 3. Determinar la amplitud de la clase: "i" Rango i = Nmero de clases = 6 86.49 = 14.415

4. Determinar el Lmite inferior del primer intervalo o clase

17

En este problema el tamao del intervalo es de 14.415, mayor que el valor mnimo entonces el primer lmite inferior debera ser 0, pero al formar los seis intervalos el valor mximo queda fuera de la tabla, por lo que se puede modificar este valor y escoger un limite inferior que ser inferior o igual al dato menor, esto es 7.420 El lmite inferior de los siguientes intervalos se calcula sumando el tamao del intervalo al lmite inferior del intervalo anterior hasta llegar a un nmero no mayor al valor mximo. f. Lmite superior del primer intervalo o clase El lmite superior se calcula con la siguiente frmula LS = LI + i Nota: obsrvese que se va a trabajar con una cifra significativa ms cmoda, o sea como los datos estn dados en centsimos, se calculo i hasta los milsimos para evitar que algn dato coincida con el lmite de clases.

Clase 1 2 3 4 5 6

Li

Ls

ni 10 4 5 3 3 5 30

7.420 21.835 21.835 36.250 36.250 50.665 50.665 65.080 65.080 79.495 79.495 93.910 Total

Ejercicio: En un estudio para conocer la contaminacin generada por una industria, se realizaron anlisis a 40 muestras de agua, determinndose los siguientes niveles de pH. Construir una tabla estadstica de tipo III con los datos del anlisis.

TABLA DE DISTRIBUCION DE FRECUENCIAS

18

Una distribucin de frecuencias es la tabulacin de resultados, es decir, recoger la informacin de la muestra resumida en una tabla en la que cada valor de la variable se le asocia determinados nmeros que representan el nmero de veces que ha aparecido su proporcin respecto a otros valores de la variable, etc. Estos nmeros se denominan frecuencias: As tenemos las siguientes frecuencias: 1. 2. 3. 4. 5. 6. Frecuencia absoluta Frecuencia relativa Porcentaje Frecuencia absoluta acumulada Frecuencia relativa acumulada Porcentaje acumulado

Frecuencia absoluta: La frecuencia absoluta de una variable estadstica es el nmero de veces que aparece en la muestra dicho valor de la variable, la representaremos por ni Frecuencia relativa: La frecuencia absoluta, es una medida que est influida por el tamao de la muestra, al aumentar el tamao de la muestra aumentar tambin el tamao de la frecuencia absoluta. Esto hace que no sea una medida til para poder comparar. Para esto es necesario introducir el concepto de frecuencia relativa, que es el cociente entre la frecuencia absoluta y el tamao de la muestra. La denotaremos por fi

Donde N = Tamao de la muestra Porcentaje: La frecuencia relativa es un tanto por uno, sin embargo, hoy da es bastante frecuente hablar siempre en trminos de tantos por ciento o porcentajes, por lo que esta medida resulta de multiplicar la frecuencia relativa por 100. La denotaremos por pi.

Frecuencia Absoluta Acumulada: Para poder calcular este tipo de frecuencias hay que tener en cuenta que la variable estadstica ha de ser cuantitativa o cualitativa ordenable. En otro caso no tiene mucho sentido el clculo de esta frecuencia. La frecuencia absoluta acumulada de un valor de la variable, es el nmero de veces que ha aparecido 19

en la muestra un valor menor o igual que el de la variable y lo representaremos por Ni. Frecuencia Relativa Acumulada: Al igual que en el caso anterior la frecuencia relativa acumulada es la frecuencia absoluta acumulada dividido por el tamao de la muestra, y la denotaremos por Fi

Porcentaje Acumulado: Anlogamente se define el Porcentaje Acumulado y lo vamos a denotar por Pi como la frecuencia relativa acumulada por 100.

Distribucin de Frecuencias en Variables cuantitativas discretas:Categoras de la variable Frecuencia Frecuencia Absoluta Relativa Frecuencia Absoluta Acumulada Frecuencia Relativa Acumulada

...

...

...

...

...

...

...

...

...

...

1

Ejemplo: Tomamos para ello los datos relativos al nmero de encontradas en 50 parcelas.

especies

En este ejemplo se puede observar el clculo de cada una de las frecuencias.fi pi Ni Fi Pi 32% 72%

CLASE (Especies )1 2

ni (Parcelas)16 20

16/50 32% 16 16/50 20/50 40% 36 36/50

20

3 4

9 5

9/50 5/50

18% 45 45/50 10% 50 50/50

90% 100%

Total

50

0/50

100%

Distribucin de frecuencias en Variables cuantitativas continuas: El anlisis de la distribucin de frecuencias en las variables cuantitativas continuas es ms complejo y tiene el inters de que las categoras mediante las que se ordena la distribucin no viene determinado por la variable, sino que debe elegirse. El primer paso para construir la tabla de la distribucin de frecuencias es elaborar una tabla estadstica de tipo III. En tablas de distribucin de frecuencias para variables cuantitativas continuas (Con intervalos); es necesario calcular la marca de clase (Mc). La marca de clase, tambin llamada punto medio del intervalo es la mitad de la distancia entre los lmites inferior y superior de cada intervalo. La marca de clase es el valor ms representativo de los valores del intervalo LS +Li Xi = 2Intervalo Marca Frecuencia Frecuencia de Absoluta Relativa Clase Frecuencia Absoluta Acumulada Frecuencia Relativa Acumulada

X1... ... ... ... ... ...

Xj... ... ... ... ... ...

Xk1

Ejemplo: Realizar una tabla de distribucin de frecuencias para los datos del nmero de meses de duracin en una muestra de 40 bateras. Partimos de la tabla de tipo III ya elaborada y procedemos al clculo de las distintas frecuencias. En tablas de distribucin de frecuencias para variables 21

cuantitativas continuas (Con intervalos); es necesario calcular la marca de clase (Xi). La tabla de distribucin de frecuencias queda:Clase 1 2 3 4 5 6 7 Li 15 20 25 30 35 40 45 Ls 20 25 30 35 40 50 55 Total Xi 17.5 22.5 27.5 32.5 37.5 42.5 47.5 ni 2 1 4 15 10 5 3 40 fi .050 .025 .100 .375 .250 .125 .075 1.00 pi % 5.0 2.5 10.0 37.5 25.0 12.5 7.5 Ni 2 3 7 22 32 37 40 Fi .050 .075 .175 .550 .800 .925 1.00 Pi % 5.0 7.5 17.5 55.0 80.0 92.5 100

Ejemplo: Realizar una tabla de distribucin de frecuencias para los resultados obtenidos del test de conocimientos sobre reciclaje de basura aplicado a 30 personas de una determinada ciudad. Partimos de la tabla de tipo III del ejemplo antes mencionado y se tiene:Clase 1 2 3 4 5 6 Li Ls Xi 14.628 29.043 43.458 57.873 72.288 86.703 ni 10 4 5 3 3 5 30 fi 0.33 0.13 0.17 0.10 0.10 0.17 1.00 pi % Ni 10 14 19 22 25 30 100 Fi 0.33 0.46 0.63 0.73 0.83 1.00 Pi % 1.00 0.67 0.54 0.37 0.27 0.17

7.420 21.835 21.835 36.250 36.250 50.665 50.665 65.080 65.080 79.495 79.495 93.910 Total

REPRESENTACIONES GRFICAS Las tablas estadsticas muestran la informacin de forma esquemtica y estn preparadas para clculos posteriores. La misma informacin estadstica puede mostrarse de forma global y ms expresiva, utilizando los grficos estadsticos. Los grficos poseen un fuerte poder de comunicacin de los resultados de un estudio estadstico. TIPOS DE GRFICOS GRAFICOS DE BARRA Es un grfico sobre ejes cartesianos en el que distribuimos en un eje : Las categoras si el carcter es cualitativo Los valores si la variable es cuantitativa no agrupada

22

Sobre ellos se levantan barras o rectngulos de igual base (que no se solapen) cuya altura sea proporcional a sus frecuencias. Tambin se suelen utilizar para series cronolgicas y pueden, asimismo, representarse horizontalmente, intercambiando los ejes. Segn la orientacin de las barras se tiene: Grficos de barras verticales.- Representan valores usando trazos verticales, aislados o no unos de otros, segn la variable a graficar sea discreta o continua. Pueden usarse para representar una serie dos o ms series (tambin llamado de barras comparativas)

Grficos de barras horizontales.- Representan valores discretos a base de trazos horizontales, aislados unos de otros. Se utilizan cuando los textos correspondientes a cada categora son muy extensos.

Grficos de barras proporcionales.- Se usan cuando lo que se busca es resaltar la representacin de los porcentajes de los datos que componen un total. Las barras pueden ser:

23

Grficos de barras comparativas.- Se utilizan para comparar dos o ms series, para comparar valores entre categoras. Las barras pueden ser:

Grficos de barras apiladas.- Se usan para mostrar las relaciones entre dos o ms series con el total.

GRAFICOS DE LINEA En este tipo de grfico se representan los valores de los datos en dos ejes cartesianos ortogonales entre s. Se pueden usar para representar: Una serie Dos o ms series

24

GRAFICOS LOGARITMICOS Estos grficos se utilizan para representar valores con grandes incrementos entre s.

GRAFICOS CIRCULARES Estos grficos nos permiten ver la distribucin interna de los datos que representan un hecho, en forma de porcentajes sobre un total. Se suele separar el sector correspondiente al mayor o menor valor, segn lo que se desee destacar. Se pueden ser: En dos dimensiones En tres dimensiones.

GRAFICO DE AREAS En estos tipos de grficos se busca mostrar la tendencia de la informacin generalmente en un perodo de tiempo. Pueden ser: Para representar una serie o para representar dos o ms series En dos dimensiones En tres dimensiones

25

CARTOGRAMAS Estos tipos de grficos se utilizan para mostrar datos sobre una base geogrfica. La densidad de datos se puede marcar por crculos, sombreado, rayado o color.

GRAFICOS MIXTOS En estos tipos de grficos se representan dos o ms series de datos, cada una con un tipo diferente de grfico. Son grficos ms vistosos y se usan para resaltar las diferencias entre las series. Pueden ser: En dos dimensiones En tres dimensiones.

26

OTROS GRAFICOS En esta categora se encuentran la mayora de los grficos utilizados en publicidad. Se los complementa con un dibujo que est relacionado con el origen de la informacin a mostrar. Son grficos llamativos, atraen la atencin del lector. Dispersograma.- Los dispersogramas son grficos que se construyen sobre dos ejes ortogonales de coordenadas, llamados cartesianos, cada punto corresponde a un par de valores de datos x e y de un mismo elemento suceso.

Pictogramas.- Los pictogramas son grficos similares a los grficos de barras, pero empleando un dibujo en una determinada escala para expresar la unidad de medida de los datos. Generalmente este dibujo debe cortarse para representar los datos. Es comn ver grficos de barras donde las barras se reemplazan por dibujos a diferentes escalas con el nico fin de hacer ms vistoso el grfico, estos tipos de grficos no constituyen un pictograma. Pueden ser: En dos dimensiones

27

En tres dimensiones.

HISTOGRAMA, POLIGONO Y OJIVA DE FRECUENCIA El histograma.- El histograma es un grfico para representar la distribucin de una variable cuantitativa continua, que representa frecuencias mediante el volumen de las reas. Un histograma consiste en un conjunto de rectngulos con (a): bases en el eje horizontal, centros en las marcas de clase y longitudes iguales a los tamaos de los intervalos de clase y (b): alturas proporcionales a las frecuencias de clase. Caractersticas de los histogramas

Se prefiere para el tratamiento de datos cuantitativos. La columna (o barra) con mayor altura representa la mayor frecuencia. Suelen utilizarse para representar tablas tipo III. La sumatoria de las alturas de las columnas equivalen al 100% de los datos.

Polgono de frecuencia.- El polgono de frecuencia consiste de segmentos de lnea conectando los puntos formados por la interseccin de las marcas de clase y las frecuencias de clase. El polgono de frecuencia relativa es similar al anterior solo que en este se muestran porcentajes, es decir las frecuencias relativas de cada clase. Ojivas de Frecuencia Acumulada.- La misma idea de unir los centros de las bases superiores de los rectngulos de la distribucin del histograma de frecuencias acumuladas, da lugar al polgono de frecuencias acumuladas u ojiva. Ejemplos: Histogramas, polgonos y ojivas de frecuencia a partir de los datos de la duracin en meses de 40 bateras de auto.

28

HISTOGRAMA Duracin de baterias en mesesFrecuencia absoluta ni20 15 15 10 10 5 0 17.5 22.5 27.5 32.5 Marca de clase Xi 37.5 42.5 47.5 2 4 1 5 3

POLIGONO Duracin de baterias en mesesFrecuencia absoluta ni20 15 10 5 0 17.5 22.5 27.5 32.5 Marca de clase Xi 37.5 42.5 47.5

OJIVA Duracin de baterias en mesesFrecuencia absoluta Acumulada Ni

50 40 30 20 10 0 17.5 22.5 27.5 32.5Marca de clase Xi

37.5

42.5

47.5

Histogramas, polgonos y ojivas de frecuencia a partir de los datos de los resultados de un test de reciclaje de basura aplicado a 30 personas. 29

HISTOGRAMA Resultados test de evaluacin sobre reciclaje de basura. 12

Frecuencia absoluta ni

10

10 8 6 4 4 2 014.628 29.043 43.458 57.873 72.288 86.703

5 3 3

5

Marcas de Clase Xi

POLIGONO DE FRECUENCIAS Resultados test de evaluacin sobre reciclaje de basura.

Frecuencia absoluta ni

12 10 8 6 4 2 014.628 29.043 43.458 57.873 72.288 86.703

Marcas de Clase Xi

OJIVA Resultados test de evaluacin sobre reciclaje de basura. 35

Frecuencia absoluta ni

30 25 20 15 10 5 014.628 29.043 43.458 57.873 72.288 86.703

Marcas de Clase Xi

30

Ejercicios: Elabore la distribucin de frecuencias de las siguientes series de datos, con sus respectivas grficas. Realice cuatro conclusiones a las que puede llegar en cada caso.1. Los resultados siguientes representan las calificaciones del examen final de un curso de estadstica elemental. 23 80 52 41 60 34 60 77 10 71 78 67 79 81 64 83 89 17 32 95 75 54 76 82 57 41 78 64 84 69 74 65 25 72 48 74 52 92 80 88 84 63 70 85 98 62 90 80 82 55 81 74 15 85 36 76 67 43 79 61

2. Los siguientes datos representan el nmero de plantas de una determina especie encontrados en 30 localidades. 24 3 18 36 72 48 4 66 71 40 78 22 16 3 57 5 28 9 18 67 54 6 72 4 30 15 12 60 3 72

3. El gerente de una firma especializada en renta de condominios para vacacionistas, quiere saber cmo estn distribuidas los montos de las rentas mensuales de los departamentos de la firma. Seleccion una muestra de departamentos cuyas muestras son mostradas abajo. Rentas mensuales de los condominios 1581 1277 1305 1472 1077 1319 1949 1403 1744 1532 1219 896 1041 1379 821 1558 1118 1533 1426 1288 1394 1545 1032 1289 1329 1407 718 1457 1449 1455 1400 1442 1593 1962 1263 1788 1459 1823 1451 1138 1592 982

1170 1332 1471 1826 1440 1119 1352

1207 1418 1399 1309 1421 1020 1340

1537 1500 1510 695 2051 1501 1981

1849 1671 1760 803 1677 1668 1091

4. Los siguientes datos representan la duracin de la vida, en segundos, de 50 moscas sometidas a un nuevo atomizador en un experimento de laboratorio controlado. 17 12 16 13 7 20 14 18 7 10 10 6 8 18 5 9 9 13 7 14 23 13 3 10 15 13 6 32 4 10 12 7 9 27 9 19 10 7 19 6 18 13 10 16 7 24 7 11 8 15

5.- El gerente de una fundacin dedicada al cuidado del medio ambiente esta interesado en el nmero de veces que una persona ha visitado una reserva ecolgica un periodo de dos aos. Las respuestas de los 51 entrevistados fueron: 5 1 5 3 2 9 3 4 11 1 4 3 4 4 12 4 5 4 5 6 7 6 3 6 4 5 5 2 3 15 6 4 1 6 5 1 6 6 10 7 8 8 1 4 9 1 7 2 14 6 12

6. Se presentan a continuacin los ingresos semanales que obtiene una empresa dedicada al negocio de la venta de hamburguesas: Ingresos por venta (miles de Dlares)

31

7.- Se conduce un estudio sobre los efectos en el ambiente de determinado producto qumico utilizado por una industria. La medicin que se observa es el grado de impacto ambiental en una escala previamente establecida. 69 47 52 43 26 56 53 34 23 36 22 48 60 13 30 28 30 25 31 45 41 34 21 29 55 28 13 37 38 39

8.- El presidente de una agencia de viajes, quiere informacin sobre las edades de la gente que toma cruceros por el Caribe. Una muestra de 40 clientes que tomaron un crucero el ao pasado revel estas edades: 77 36 62 60 18 26 43 45 63 50 52 66 84 34 53 83 38 44 63 71 54 41 62 63 50 58 62 58 59 58 65 61 54 53 61 71 56 51 52 60

9. La siguiente informacin respresenta las temperaturas (F), obtenida en una determinada ciudad durante el mes de abril. Temperaturas (F)

10. Se presentan a continuacin los siguientes datos de estaturas de la poblacin femenina del pas: Estatura (metros)

32

11.- La siguiente informacin correspondiente a la cantidad de vitamina administrada (en mm ) mensualmente a una muestra de 63 animales en cautiverio, para determinar la dosis adecuada que minimice las infecciones respiratorias de los mismos. 7,0 4,5 1,3 7,7 8,9 3,1 7,2 7,1 5,1 9,0 3,8 4,4 6,8 2,5 5,7 6,5 5,2 5,9 4,4 5,1 5,8 8,3 9,0 4,3 4,0 6,0 8,3 6,4 1,3 3,9 5,5 6,5 8,7 7,6 9,8 2,7 5,8 5,2 6,2 6,6 7,3 1,5 5,6 6,3 5,2 4,5 2,8 6,1 2,2 8,2 6,3 6,3 5,4 6,2 5,8 5,8 7,7 6,1 1,6 5,7 5,1 5,7 9,2

3

12.- Una agencia de viajes ofrece precios especiales en ciertas travesas por el Caribe. Planea ofrecer varios de estos paseos durante la prxima temporada invernal en el hemisferio norte y desea enviar folletos a posibles clientes. A fin de obtener el mayor provecho por cada unidad monetaria gastada en publicidad, necesita la distribucin de las edades de los pasajeros de travesas anteriores. Se consider que si participaban pocas personas de un grupo de edad en los paseos no sera econmico enviar un gran nmero de folletos a personas de ese grupo de edad. La agencia seleccion una muestra de 40 clientes anteriores de sus archivos y se registr sus edades, como sigue: 77 54 58 63 45 18 56 58 62 66 63 36 53 62 83 84 50 62 61 63 38 50 62 61 63 54 34 43 52 58 50 44 52 60 61 59 41 53 60 713

13.- La siguiente informacin correspondiente a la cantidad de vitamina administrada (en mm ) mensualmente a una muestra de 63 animales en cautiverio, para determinar la dosis adecuada que minimice las infecciones respiratorias de los mismos. 7,0 4,5 1,3 7,7 8,9 3,1 7,2 7,1 5,1 9,0 3,8 4,4 6,8 2,5 5,7 6,5 5,2 5,9 4,4 5,1 5,8 8,3 9,0 4,3 4,0 6,0 8,3 6,4 1,3 3,9 5,5 6,5 8,7 7,6 9,8 2,7 5,8 5,2 6,2 6,6 7,3 1,5 5,6 6,3 5,2 4,5 2,8 6,1 2,2 8,2 6,3 6,3 5,4 6,2 5,8 5,8 7,7 6,1 1,6 5,7 5,1 5,7 9,2

14.- Una determinada especie de mamferos tiene en cada parto un nmero variable de cras. Se observa que las camadas de 35 hembras durante un ao han sido las que se recogen en la tabla adjunta. 8 2 2 4 7 8 7

33

4 2 5 3

5 9 5 2

4 6 8 4

2 5 3 5

4 2 6 5

2 5 4 6

5 5 2 6

UNIDAD 3 MEDIDAS ESTADSTICAS OBJETIVOS DE LA UNIDAD 1. Conocer los diferentes tipos de medidas estadsticas. 2. Definir y calcular las medidas de tendencia central media aritmtica, media ponderada, media geomtrica, media armnica, mediana y moda para datos sin agrupar y datos agrupados. 3. Calcular e interpretar la amplitud de variacin, desviacin media, variancia, desviacin estndar y coeficiente de variacin para datos sin agrupar y agrupados. 4. Entender el teorema de Chebyshev y la Regla Normal o emprica y su relacin con un conjunto de observaciones. 5. Calcular y explicar las medidas de localizacin cuarteles, deciles, percentiles.

MEDIDAS ESTADSTICAS TIPOS DE MEDIDA: 1. Medidas de Centralizacin: o Que sirven para determinar los valores centrales o medios de la distribucin 2. Medidas de Dispersin:

34

Nos van a dar una idea sobre la representatividad de las medidas centrales, a mayor dispersin menor representatividad. 3. Medidas de Localizacin: o tiles para encontrar determinados valores importantes, para una "clasificacin" de los elementos de la muestra o poblacin.o

ALGUNAS CONSIDERACIONES: El Estadstico Yule ha definido algunas propiedades deseables para una medida estadstica: 1. Debe definirse de manera objetiva: dos observadores distintos deben llegar al mismo resultado numrico. 2. Usar todas las observaciones y no algunas de ellas solamente, de manera que si varia alguna observacin la medida considerada debe reflejar esta variacin. 3. Tener un significado concreto: la interpretacin debe ser inmediata y sencilla. 4. Ser sencilla de calcular. 5. Prestarse fcilmente al clculo algebraico: Lo que permitir demostraciones mas elegantes. 6. Ser poco sensible a las fluctuaciones muestrales. Esta condicin es imprescindible en la Estadstica Matemtica y en la Teora de Sondeos. MEDIDAS DE CENTRALIZACION 1. Media 1. 2. 3. 4. 2. Mediana 3. Moda Media aritmtica Media ponderada Media geomtrica Media armnica

MEDIA ARITMETICA: Equivale al clculo del promedio simple de un conjunto de datos. Para diferenciar datos muestrales de datos poblacionales, la media aritmtica se representa con un smbolo para cada uno de ellos: si trabajamos con la poblacin, este indicador ser ; en el caso de que estemos trabajando con una muestra, el smbolo ser .

Media aritmtica ( o ): Es el valor resultante que se obtiene al dividir la sumatoria de un conjunto de datos sobre el nmero total de datos. Solo es aplicable para el tratamiento de datos cuantitativos. Propiedades:

35

1. Si multiplicamos o dividimos todas las observaciones por un mismo nmero, la media queda multiplicada o dividida por dicho numero. 2. Si le sumamos a todas las observaciones un mismo nmero, la media aumentar en dicha cantidad. 3. Adems de la media aritmtica existen otros conceptos de media, como son la media geomtrica, y la media armnica. Hay que entender que existen dos formas distintas de trabajar con los datos tanto poblacionales como muestrales; sin agruparlos o agrupndolos en tablas de frecuencias. Esta apreciacin nos sugiere dos formas de representar la media aritmtica.

Media aritmtica para datos no agrupadosPodemos diferenciar la frmula del promedio simple para datos poblaciones y muestrales:

Observe que la variacin de ambas frmulas radica en el tamao de los datos (N identifica el tamao de la poblacin, mientras que n el de la muestra).

Ejemplo: media aritmtica para datos no agrupadosEl profesor de la materia de estadstica desea conocer el promedio de las notas finales de los 10 alumnos de la clase. Las notas de los alumnos son: 3,2 3,0 3,1 3,5 2,4 3,8 4,0 4,2 3,5 4,0

Cul es el promedio de notas de los alumnos de la clase? SOLUCIN Cabe anotar que en el ejemplo estamos hablando de una poblacin correspondiente a todos los alumnos de la clase (10 alumnos en total). El promedio de las notas es de 3,47. Modifiquemos la primera nota por 0,0 y calculemos nuevamente la media aritmtica. En este caso la media pasa de 3,47 a 3,15. Esta variacin notoria se debi a que la media aritmtica es sensible a los valores extremos cuando tratamos con pocos datos. El 0,0 es una nota atpica comparada con las dems, que estn ubicadas entre 3,0 y 4,2. Media aritmtica para datos agrupados

36

Tablas tipo II En el capitulo anterior explicbamos dos tipos de tablas de frecuencias (II y III). Cuando los datos se agrupan en tablas tipo II, la media aritmtica es igual a la divisin de la sumatoria del producto de las clases por la frecuencia sobre el nmero de datos.

La sumatoria parte desde la primera clase (i = 1) hasta la ltima clase (i=n), siendo Xi la clase del intervalo i.

Ejemplo: media aritmtica para datos agrupados en tablas tipo IILa siguiente tabla de frecuencia muestra las calificaciones obtenidas por los estudiantes de un curso, sobre un test de matemticas calificado sobre 10. Determinar el promedio general.

Calificacin Xi 4 5 6 7 8 9 10 SOLUCIN

Nmero de Estudiantes (ni) 3 7 19 26 18 8 4

PASO 1: Realizar la sumatoria del producto resultante de las clases (Xi), por su frecuencia absoluta (ni). Para efectos del clculo de la media, deberamos sumar 3 veces el valor 4, 7 veces el valor 5, 19 veces el valor 6, hasta llegar a la ltima clase: PASO 2: Dividir la sumatoria sobre el nmero total de datos.

Calificacin

Nmero de Estudiantes

37

4 5 6 7 8 9 10

3 7 19 26 18 8 4 85

12 35 114 182 144 72 40 599

La media aritmtica as obtenida es 7,05 que representa el promedio de calificaciones de los estudiantes de ese curso Tablas tipo III Si los datos se presentan en una tabla de distribucin de frecuencias, no es posible conocer los valores individuales de cada una de las observaciones, pero si las categoras en las cuales se hallan. Para poder calcular la media, se supondr que dentro de cada categora, las observaciones se distribuyen uniformemente dentro alrededor del punto medio de la clase, por lo tanto puede considerarse que todas las observaciones dentro de la clase ocurren en el punto medio. Cuando los datos se agrupan en tablas tipo III, el clculo de la media vara un poco del valor real, ya que existe una prdida de informacin en el momento en que se trabaja con intervalos y no con los datos directamente (los datos se agrupan por intervalo, desconociendo el valor exacto de cada uno de ellos). Las marcas de clases (Xi) cumple la funcin de representar los intervalos de clase, , por lo expuesto la media aritmtica para datos agrupados puede definirse de la siguiente manera:

Representa el valor de la variable o en su caso la marca de clase.

Ejemplo: media aritmtica para datos agrupados en tablas tipo IIICalcular la media para los datos distribuidos en la siguiente tabla de frecuencia:

1

Li 40,1

Ls 48,1

ni 3

Xi 44,1

38

2 3 4 5 6 7 8

48,1 56,1 64,1 72,1 80,1 88,1 96,1

56,1 64,1 72,1 80,1 88,1 96,1 104,1

8 11 32 21 18 14 1

52,1 60,1 68,1 76,1 84,1 92,1 100,1

SOLUCIN Las marcas de clase representan a los intervalos de clase, por ejemplo, suponemos que la marca de clase para el primer intervalo (44,1) se repite 3 veces, al desconocer los 3 valores exactos que estn dentro de dicho intervalo. PASO 1: Realizar la sumatoria del producto resultante entre las marcas de clase por su frecuencia absoluta. PASO 2: Dividir la sumatoria sobre el nmero total de datos.

Ejemplo: comparativa entre el clculo de la media aritmtica para datos no agrupados y datos agrupados en tablas tipo IIICalcular la media aritmtica a los siguientes datos sin agrupar y agrupndolos en una tabla de frecuencia tipo III (suponga que los datos son poblacionales):

47,8 18,6 18,6 12,8 33,6 SOLUCIN

23,1 11,0 21,0 43,1 40,9

12,4 32,0 26,3 18,1 15,2

35,4 12,4 11,1 38,1 33,2

44,0 49,4 21,4 16,8 48,2

26,2 41,4 30,6 12,4 37,0

Calculemos la media para los datos sin agrupar: Rpta. =27,74 Luego construyamos la tabla tipo III y calculemos su media aritmtica con el fin de comparar ambos resultados:

1 2 3 4 5

Li 11,00 17,41 23,81 30,21 36,61

Ls 17,41 23,81 30,21 36,61 43,01

ni 8 6 2 5 4

Xi 14,21 20,61 27,01 33,41 39,81

39

6

43,01 49,40 Total

5 30

46,21

PASO 1: Realizar la sumatoria del producto resultante entre las marcas de clase por su frecuencia absoluta. PASO 2: Dividir la sumatoria sobre el nmero total de datos. Rpta. =28,29 Podemos ver claramente una diferencia entre ambas medias: 27,74 para los datos no agrupados y 28,29 para los datos agrupados. Esta diferencia radica que en la tabla tipo III existe una perdida de informacin, al agrupar los datos en los intervalos de clase. El valor de la media exacta es el calculado para los datos no agrupados, pero dada la proximidad de la media para los datos agrupados, se tomar esta ltima como cierta. Ventajas de la media aritmtica

Es la medida de tendencia central ms usada. El promedio es estable en el muestreo. Es sensible a cualquier cambio en los datos (puede ser usado como un detector de variaciones en los datos). Se emplea a menudo en clculos estadsticos posteriores. Presenta rigor matemtico. En la grfica de frecuencia representa el centro de gravedad.

Desventajas de la media aritmtica

Es sensible a los valores extremos. No es recomendable emplearla en distribuciones muy asimtricas. Si se emplean variables discretas o cuasi-cualitativas, la media aritmtica puede no pertenecer al conjunto de valores de la variable.

MEDIA PONDERADA La media aritmtica es en caso especial de la media aritmtica. Se presenta cuando hay varias observaciones del mismo valor que pueden ocurrir si los datos se han agrupado en una distribucin de frecuencias.

=

W X WI

I

Ejemplos: En el curso de estadstica la nota semestral se calcula como una media ponderada. Por cuanto que el promedio de pruebas mensuales representa el

40

30% de la nota semestral. El promedio de ejercicios parciales representa el 30% y el examen semestral el restante 40%. Si obtiene en este curso los siguientes promedios al final del semestre: pruebas 9,0 pts. Parciales 7,5 pts. Y en el examen semestral 7,0 pts.; el promedio semestral se calcula de la siguiente forma.:

9,0(0.30) + 7,5(0.30) + 70(0.40) 2,7 +2,25 + 2,8 =-------------------------------------------- = ----------------------------- = 7,75 0.30 + 0.30 + 0-40 1 La nota semestral de 7,75

Un local de comida rpida vendi refrescos medianos, grandes y extragrandes por 50, 75 y 90 centavo, respectivamente. De los ltimos 10 refrescos vendidos, 3 eran medianos, 4 eran grandes y 3 extragrandes. Determinar la cantidad media de ventas en los ltimos diez refrescos.

=

W X WI

I

=

$0.50 * 3 $0.75 * 4 $0.90 * 3 = $ 0.72 10

Una tienda de ropa vendi 95 trajes para caballero al precio normal de $400. Para la venta de primavera los trajes se rebajaron a $200y se vendieron 126. En la venta de liquidacin el precio se redujo a $100 y se vendieron los 79 trajes restantes. a.- Cul fue el precio medio ponderado de un traje para caballero? b.- La tienda pago $200 por cada uno de los 300 trajes. Comente acerca de la ganancia de la tienda en estos trajes, si un vendedor recibe una comisin de $25 por cada traje vendido. a.- $237

=

W X WI

I

=

$400 * 95 $200 *126 $100 * 79 = $ 237 95 126 79

b.- La ganancia es de $12 por traje Una empresa dedicada a la venta de alfombras ofrece a sus clientes tres tipos de alfombras. La alfombra tipo a tiene un costo de $5 dlares el metro, la tipo B cuesta $ 6,50 el metro y la tipo C un costo de $ 8,0 dlares el metro. El da de ayer se vendi 270 metros de la alfombra tipo A, 300 metros de la alfombra tipo B y 100 metros de la alfombra tipo C. Cul fue la media del costo por metro de alfombra?. Rta. $ 6.12 dlares.

41

MEDIA GEOMETRICA La media geomtrica es til para encontrar el promedio de porcentajes, razones, ndices o tasas de crecimiento. Se utiliza ampliamente en los negocios y la economa porque frecuentemente interesa encontrar el cambio porcentual en ventas, sueldos, cifras econmicas como el PIB, etc. La media geomtrica de N observaciones es la raz de ndice N del producto de todas las observaciones. La representaremos por G.

Propiedades de la media geomtrica La media geomtrica esta basada en todas las observaciones, por lo que est afectada por todos los valores de la variable. Sin embargo, da menos pesos a los valores extremadamente grandes que el que les da la media aritmtica. La media geomtrica es igual a cero si algunos de los valores es cero, y se puede volver imaginaria si ocurren valores negativos. Con la excepcin de estos dos casos, su valor siempre es definitivo y est rgidamente definido. La media geomtrica es la que se debe utilizar cuando lo que se va a promediar son tasas de cambios o proporciones, y se intenta dar igual peso a tasas de cambios iguales.

Ejemplos: Un empleado recibir un aumento de sueldo del 5% este ao y el prximo ao del 15% Cul es el aumento porcentual promedio? a.- 10% b.- 9.886%

Calculando la media armnica se tiene como resultado el literal b.MG 1.05 x1.150 = 1.09886

Lo anterior se puede verificar suponiendo que su ingreso mensual inicial era de $3000 y que recibi dos aumentos de 5% y 15%. Aumento 1 : 3000 x (0.05) = $ 150 Aumento 2 : 3150 x (0.15) = $ 472.5 . Total $ 622.50 Aumento 1 : 3000 x (0.09886) Aumento 2 : 3296 x (0.09886) Total = $ 296.58 = $ 325.90 $ 622.50

.

42

Las ganancias obtenidas por la constructora Naranjo, en cuatro proyectos recientes son 3%,2%,4% y 6%. Cul es el promedio porcentual de ganancia de esta constructora? Rpt. 3.46% Una segunda aplicacin de la media geomtrica es encontrar un aumento porcentual promedio en intervalo de tiempo. Por ejemplo si se gana $30.000 al ao en 1998 y $50.000 en el ao 2008 Cul es la tas de aumento anual en el periodo? La tasa de aumento se determina a partir de la siguiente frmula:

MG n

Valoralfin aldelperodo 1 Valoralprincipiodelperiodo

Ejemplos: Supngase que la poblacin de una comunidad para 1988 fue de 2000 personas y en 1998 fue de 22000. Cul es la tasa del incremento porcentual anual promedio para ese periodo?. Aplicando la frmula de la media geomtrica se tiene: Rta. 0.271. De modo que la tasa de incremento anual para ese perodo es de 27.1%. Los rendimientos anuales, en porcentajes, de cuatro acciones de petrleo son: 4.91, 5.75, 8.12, y 21,60. a.- Obtenga la media geomtrica de los rendimientos b.- Determine su media aritmtica c.- La media es igual o mayor que la media geomtrica. Rta. 8,39% Rta. 10.1%

La produccin de camiones HINO aumento 23000 unidades en 1988 a 120520 en el ao 2008. Obtenga un valor medio del incremento anual de esos camiones. MEDIA ARMNICA La media armnica de N observaciones es la inversa de la media de las inversas de las observaciones y la denotaremos por H

43

Se utiliza para promediar velocidades, tiempos, rendimiento, etc. (cuando influyen los valores pequeos). Su problema: cuando algn valor de la variable es prximo a cero no se puede calcular. Propiedades de la media armnica La media armnica se basa en todas las observaciones por lo que est afectada por todos los valores de la variable. Da a los valores extremadamente grandes un peso menor que el que les da la media geomtrica, mientras que a los valores pequeos les da un peso mayor que el que les da tanto la media aritmtica como la media geomtrica. La media armnica esta indeterminada si alguno de los valores es cero, pues hallar el recproco de cero implica dividir entre cero, lo cual no es excepto cuando uno de los valores es cero. La media armnica es el promedio que se ha de usar, cuando lo que se va a promediar son proporciones donde los numeradores de las razones son los mismos para todas las proporciones. La media armnica se presta a manipulaciones algebraicas posteriores

Ejemplo: Un automvil que hace viajes de ida y vuelta entre las ciudades de Quito y Ambato, realiza el viaje entre Quito y Ambato a razn de 80 Km por hora y el viaje entre Ambato y Quito a 120 Km por hora ,Determinar la velocidad promedio del viaje de ida y vuelta.

Rta. La velocidad media es de 96km/hora MEDIANA La mediana es el punto medio de los valores de los datos, despus de arreglarlos en orden creciente o decreciente, es el valor que divide en dos partes iguales a una poblacin o una muestra. Propiedades de la mediana Hay solo una mediana en una serie de datos. No es afectada por los valores extremos ( altos o bajos ) Puede ser calculada en distribuciones con escala de razn, de intervalos, y ordinal.

44

Clculo de la mediana para datos no agrupados Tendremos en cuenta el tamao de la muestra. Si N es Impar, hay un trmino central, el trmino que ser el valor de la mediana. que ocupe la posicin

Si N es Par, hay dos trminos centrales, media de esos dos valores

la mediana ser la

Ejemplo: mediana para datos no agrupados (cantidad de datos impar)Encontrar la mediana para los siguientes datos: 4 1 2 3 4 2 2 1 5 5 3 SOLUCIN PASO 1: Ordenar los datos. 11222334455 PASO 2: Localizar el dato XN/2 que divide en dos parte iguales el nmero de datos. 11222334455

Me = X (n+1)/2 = 3 La mediana es 3, dejando 5 datos a cada lado.

Ejemplo: mediana para datos no agrupados (cantidad de datos par)Modifiquemos el ejemplo anterior, eliminando el ltimo dato. Encontrar la mediana: 4123422155 SOLUCIN PASO 1: Ordenar los datos. 1122234455 PASO 2: Localizar cuya posicin sea Xn/2 y X(n/2)+1 ; la media de ellos es el valor que divide en dos parte iguales el nmero de datos. 1122234455 45

Xn/2 + X(n/2)+1 2+3 Me= ---------------------- = --------- = 2,5 2 2 El punto medio se encuentra entre dos valores: 2 y 3, por tanto, el valor de la mediana ser 2,5.

Determinar la mediana a partir de los siguientes datos: 1,4,6,7,8,9,12,16,20, 24,25,27 N=12 N par Trminos Centrales el 6 y 7 9 y 12 Me = 1,4,6,7,8,9,12,16,20, 24,25,27,30 N=13 N Impar Trmino Central el 7 , 12

Me=12

Clculo de la mediana Tablas de tipo II: Cuando los datos se agrupan en tablas de tipo II, identificamos la clase donde se ubica la mediana, esto es en aquella clase donde el porcentaje acumulado se igual o mayor al 50%. Una vez identificada la clase se aplica la siguiente frmula:

Donde:

N N i 1 Me X i 1 2 ( X i X i 1 ) N i N i 1

Me = es el valor de la mediana Xi = La clase donde reubica la mediana Xi 1 = L clase inmediatamente anterior a la clase donde se ubica la mediana. N = Nmero total de datos o frecuencia acumulada total Ni = Frecuencia absoluta de la clase donde se ubica la mediana Ni 1 = Frecuencia absoluta de la clase inmediatamente anterior a la clase donde se ubica la mediana

Ejemplo: mediana para datos agrupados en tablas tipo IICalcular la mediana a partir de la siguiente tabla de frecuencia:

1

Clase 10

ni 5

Ni 5

pi 10,4%

Pi 10,4%

46

2 3 4 5 6 7

20 30 40 50 60 70 Total

7 10 13 10 2 1 48

12 22 35 45 47 48

14,6% 20,8% 27,1% 20,8% 4,2% 2,1% 100,0%

25,0% 45,8% 72,9% 93,8% 97,9% 100,0%

SOLUCIN PASO 1: Localizar entre que clases se encuentra la mediana. Observe que la mediana se encuentra entre las clases 3 y 4, donde podremos encontrar una frecuencia relativa acumulada del 50%.

1 2 3 4 5 6 7

Clase 10 20 30 40 50 60 70 Total

ni 5 7 10 13 10 2 1 48

Ni 5 12 22 35 45 47 48

pi 10,4% 14,6% 20,8% 27,1% 20,8% 4,2% 2,1% 100,0%

Pi 10,4% 25,0% 45,8% 72,9% 93,8% 97,9% 100,0%

PASO 2: Aplicamos la frmula de la mediana y tenemos: Me = 31.53

48 22 Me 30 2 (40 30) 31.53 35 22

Clculo de la mediana Tablas de tipo III: Para datos agrupados en tablas estadsticas tipo III, el procedimiento de clculo de la mediana es similar al realizado en tablas de tipo II, la nica diferencia radica en que en lugar de trabajar con el valor de las clases, se trabaja con el valor de los lmites de intervalo. Aplicamos la siguiente frmula:

N N i 1 Me Li 2 .ai N i N i 147

Donde: Me = es el valor de la mediana Li = Lmite inferior de la clase donde se ubica la mediana. N = Nmero total de datos o frecuencia acumulada total Ni = Frecuencia absoluta de la clase donde se ubica la mediana Ni 1 = Frecuencia absoluta de la clase inmediatamente anterior a la clase donde se ubica la mediana

ai = Amplitud del intervalo de clase.

Ejemplo: mediana para datos agrupados en tablas tipo IIIDeterminar la mediana de la siguiente tabla de frecuencia: Li Ls ni Fi pi 1 21,20 29,21 5 5 12,50% 2 29,21 37,21 2 7 5,00% 3 37,21 45,21 10 17 25,00% 4 45,21 53,21 7 24 17,50% 5 53,21 61,21 12 36 30,00% 6 61,21 69,21 3 39 7,50% 7 69,21 77,20 1 40 2,50% Total 40 100,00% SOLUCIN PASO 1: Localizar entre que intervalos de clase se encuentra la mediana. Podemos observar que el punto que divide el 50% de los datos esta entre el intervalo de clase 3 y 4, para ser ms preciso, entre los valores 45,21 y 53,21 (hasta 45,21 hay agrupados el 42,50% de los datos, y hasta 53,21 se resume el 60,00% de los datos). Pi 12,50% 17,50% 42,50% 60,00% 90,00% 97,50% 100,00% Xi 25,21 33,21 41,21 49,21 57,21 65,21 73,21

1 2 3 4 5 6 7

Li 21,20 29,21 37,21 45,21 53,21 61,21 69,21 Total

Ls 29,21 37,21 45,21 53,21 61,21 69,21 77,20

ni 5 2 10 7 12 3 1 40

Ni 5 7 17 24 36 39 40

pi 12,50% 5,00% 25,00% 17,50% 30,00% 7,50% 2,50% 100,00%

Pi 12,50% 17,50% 42,50% 60,00% 90,00% 97,50% 100,00%

Xi 25,21 33,21 41,21 49,21 57,21 65,21 73,21

48

PASO 2: Aplicamos la frmula y se tiene: Me = 48.82

40 17 Me 45,21 2 .8 48.82 24 17

Ejemplo: A partir de la siguiente tabla determinar la mediana Li 45 55 65 75 85 Ls 55 65 75 85 95 ni 6 Ni 6

Como el tamao de la muestra es N=50, buscamos el intervalo en el que la Frecuencia acumulada es mayor que 10 16 50/2=25, que en este caso es el 3 y aplicamos la frmula anterior. Luego la Mediana ser 19 35 11 46 Me = 4 50

MODA A veces es importante conocer cul es el valor que ms prevalece en el conjunto de datos. El valor que ocurre con ms frecuencia se le conoce como moda. La moda es la medida de tendencia central especialmente til para describir mediciones de tipo ordinal, de intervalos y nominal. Por su propia definicin, la moda no es nica, pues puede haber dos o ms valores de la variable que tengan la misma frecuencia siendo esta mxima. En cuyo caso tendremos una distribucin unimodal, bimodal o polimodal segn el caso. Por lo tanto el clculo de la moda en distribuciones discretas o cualitativas no precisa de una explicacin mayor; sin embargo, debemos detenernos un poco en el clculo de la moda para distribuciones cuantitativas continuas.

49

Ejemplo: moda para datos no agrupadosLos siguientes datos provienen del resultado de entrevistar a 30 personas sobre la marca de gaseosa que ms consume a la semana: Marca 1 Marca 1 Marca 2 Marca 1 Marca 3 SOLUCIN PASO 1: Determinar las frecuencias de cada valor de la variable. La marca 1 se repite 15 veces La marca 2 se repite 6 veces La marca 3 se repite 9 veces PASO 2: La moda representa el valor que ms se repite. En este caso es la marca 1. Marca 2 Marca 3 Marca 1 Marca 1 Marca 1 Marca 1 Marca 1 Marca 3 Marca 1 Marca 3 Marca 1 Marca 2 Marca 3 Marca 3 Marca 3 Marca 1 Marca 1 Marca 2 Marca 1 Marca 2 Marca 3 Marca 1 Marca 1 Marca 2 Marca 3

Ejemplo: moda para datos agrupadosCalcular la moda a partir de la siguiente tabla de frecuencia: Ni 1 2 3 4 5 Li Ls 4 6 6 8 8 10 10 12 12 14 Total ni 2 4 4 5 5 20 Xi 5 7 9 11 13

SOLUCIN Las marcas de clase que ms frecuencias tienen son 11 y 13, por tanto decimos que es un caso donde aparecen dos modas (bimodal).

Calculo de la moda mediante frmulaAlgunos autores suelen aplicar una frmula para determinar la moda para tablas de frecuencia.

Mo Li

ni 1 .ai ni 1 ni 1

50

Donde: Mo = es el valor de la moda Li = Lmite inferior de la clase donde se ubica la moda ni = Frecuencia absoluta de la clase donde se ubica la moda ni + 1 = Frecuencia absoluta de la clase inmediatamente siguiente a la clase donde se ubica la moda ni - 1 = Frecuencia absoluta de la clase inmediatamente anterior a la clase donde se ubica la mediana ai = Amplitud del intervalo de clase. Veamos su clculo mediante un ejemplo, para ello usaremos los datos del apartado anterior Li 45 55 65 75 85 Ls 55 65 75 85 95 ni 6 Ni 6 Utilizando la frmula:

10 16 19 35 11 46 4 50

MEDIDAS DE DISPERSIN: 1. 2. 3. 4. 5. 6. 7. Breve Introduccin Rango Concepto de desviacin Desviacin Media Varianza Desviacin Tpica Coeficiente de Variacin

Breve Introduccin Hasta el momento hemos estudiado los valores centrales de la distribucin, pero tambin es importante conocer si los valores en general estn cerca o alejados de estos valores centrales, es por lo que surge la necesidad de estudiar medidas de dispersin. No solo basta con determinar las medidas de tendencia central para comprender el comportamiento de una serie de datos, es importante adems, conocer que tan alejados estn esos datos respecto a ese punto de concentracin. Las medidas de dispersin nos indican la distancia promedio de los datos respecto a las medidas de tendencia central. As podremos diferenciar dos

51

conjuntos de datos que poseen iguales medias, siendo los datos de uno ms dispersos del otro. RANGO: Es la primera medida que vamos a estudiar, se define como la diferencia existente entre el valor mayor y el menor de la distribucin,. Lo notaremos como R. Realmente no es una medida muy significativa e la mayora de los casos, pero indudablemente es muy fcil de calcular. Hemos estudiado varias medidas de centralizacin, por lo que podemos hablar de desviacin con respecto a cualquiera de ellas, sin embargo, la mas utilizada es con respecto a la media. DESVIACION: Es la diferencia que se observa entre el valor de la variable y la media aritmtica. La denotaremos por di. No es una medida, son muchas medidas, pues cada valor de la variable lleva asociada su correspondiente desviacin, por lo que precisaremos una medida que resuma dicha informacin.

(

)

DESVIACION MEDIA: Es la media de los valores absolutos de las desviaciones, y la denotaremos por

=|

|

|

|

Ejemplo: Desviacin media para datos no agrupados Tres alumnos son sometidos a una competencia para probar sus conocimientos en 10 materias diferentes, cada una sustentada con 10 preguntas. La idea del concurso es encontrar al alumno ms idneo para representar al colegio en un torneo a nivel nacional. El nmero de preguntas buenas por materia se muestra a continuacin: Materia 1 2 3 4 5 Carlos 2 9 10 2 3 Pedro 7 2 2 6 6 Juan 5 6 5 5 5 52

6 7 8 9 10 SOLUCIN

1 9 9 1 4

3 6 7 6 5

5 4 5 6 4

Lo primero que analizaremos es la media de los puntajes para cada uno de los alumnos, con el fin de determinar el alumno con mayor promedio de preguntas buenas. Las medias para los resultados de los alumnos coinciden: los tres alumnos tienen responden en promedio 5 preguntas correctas por prueba. Cul sera entonces el indicador diferenciador entre los alumnos?. Complementemos el anlisis anterior calculando la desviacin media: Carlos muestra una desviacin media de 3,9 indicando que los datos se alejan en promedio de la media en 3,9 preguntas buenas. Pedro disminuye su variacin (2,9), siendo Juan el que menos variacin presenta con 0,9 preguntas tanto por arriba como por debajo de la media aritmtica. Se recomienda al colegio elegir como ganador en este caso a Juan, presenta resultados ms constantes que los otros dos alumnos, Juan en promedio acierta 5 preguntas buenas con una variacin muy baja (rondando entre 4 y 6). Ejemplo: Desviacin media para datos agrupados Una maquina dispensadora de gaseosas esta programada para llenar un envase con 350 c.c. de un refresco popular. A partir de una muestra de prueba realizada sobre 30 envases se realiz la siguiente tabla de frecuencia: Ni 1 2 3 4 5 6 Li 130.0 140.1 150.1 160.1 170.1 180.1 Total Ls 140.1 150.1 160.1 170.1 180.1 190.0 ni 2 5 14 4 4 1 30 Xi 135.1 145.1 155.1 165.1 175.1 185.1

Calcular e interpretar la desviacin media. SOLUCIN PASO 1: Calcular la media aritmtica. PASO 2: Calcular la desviacin media.

53

La desviacin media es de aproximadamente 8,8 c.c. Concluimos que con datos suministrados de una muestra, el dispensador llen los 30 envases con un promedio de 157,095 c.c. con una desviacin media de 8,8 c.c. La desviacin media describe un rango de dispersin promedio de llenado del dispensador, ubicndolo entre 148,295 c.c. (equivale a restar la media a la desviacin media) y 165,895 c.c. (sumar una desviacin media a la media aritmtica).

VARIANZA: Es la media de los cuadrados de las desviaciones, y la denotaremos por: para datos poblacionales para datos muestreales Este estadstico tiene el inconveniente de ser poco significativo, pues se mide en el cuadrado de la unidad de la variable, por ejemplo, si la variable viene dada en cm. La varianza vendr en cm2. Clculo de la varianza para datos no agrupados: La varianza poblacional es igual a:

(La varianza muestreal es igual a:

)

(Ejemplo: Varianza para datos no agrupados

)

La siguiente muestra representa las edades de 25 personas sometidas a un anlisis de preferencias para un estudio de mercado. 25 20 18 26 31 Determinar la varianza. 19 27 30 24 18 21 32 19 28 17 35 38 29 39 30 44 33 33 31 27

54

SOLUCIN PASO 1: Calcular la media aritmtica. PASO 2: Calcular la varianza En este punto, la varianza es identificada por S2. La varianza equivale a 51,8567. Por elevar las unidades al cuadrado, carece de un significado contextual dentro del anlisis descriptivo del caso. Clculo de la varianza para datos agrupados: La varianza poblacional es igual a:

(La varianza muestreal es igual a:

)

(Ejemplo: Varianza para datos agrupados

)

Calcular la varianza a partir de la siguiente tabla de frecuencia (suponga que los datos son poblacionales). 1 2 3 4 5 Li [15 [17 [19 [21 [23 Total Ls 17) 19) 21) 23) 25] ni 2 5 13 4 1 25 Xi 16 18 20 22 24

SOLUCIN PASO 1: Calcular la media aritmtica. PASO 2: Calcular la varianza En este punto, la varianza es identificada por S2. DESVIACION TIPICA:

55

La varianza viene dada por las mismas unidades que la variable pero al cuadrado, para evitar este problema podemos usar como medida de dispersin la desviacin tpica que se define como la raz cuadrada positiva de la varianza La desviacin estndar es la raz cuadrada de la varianza, se denota por: para datos poblacionales para datos muestreales Este estadstico se mide en la misma unidad que la variable por lo que se puede interpretar mejor. Clculo de la desviacin estndar para datos no agrupados: La desviacin estndar poblacional es igual a:

(

)

La desviacin estndar muestreal es igual a:

(

)

Ejemplo: Desviacin tpica para datos no agrupados Calcular la desviacin estndar al siguiente conjunto de datos muestrales. 220 219 213 218 217 215 208 204 200 209 218 207 225 205 207 210 213 211 220 211 210 225 221 215 218

PASO 1: Calcular la media aritmtica. PASO 2: Calcular la varianza En este punto, la varianza es identificada por S2. 56

PASO 3: Calcular la desviacin estndar a partir de la raz cuadrada de la varianza. Los datos se alejan en promedio de la media aritmtica en 6,5516 puntos. Clculo de la desviacin estndar para datos agrupados: La desviacin estndar poblacional es igual a:

(La desviacin estndar muestreal es igual a:

)

(

)

Ejemplo: Desviacin tpica para datos agrupados Calcular la desviacin estndar a partir de la siguiente tabla de frecuencia. Considere los datos como poblacionales.Clase 1 2 3 4 5 6 7 Li 13,20 15,21 17,21 19,21 21,21 23,21 25,21 .Total Ls 15,21 17,21 19,21 21,21 23,21 25,21 27,20 ni 15 10 1 4 5 12 1 48 Xi 14,21 16,21 18,21 20,21 22,21 24,21 26,21

PASO 1: Calcular la media aritmtica. PASO 2: Calcular la varianza En este punto, la varianza es identificada por 2. PASO 3: Calcular la desviacin estndar a partir de la raz cuadrada de la varianza. Los datos se alejan en promedio de la media aritmtica en 7,6239 puntos.

57

COEFICIENTE DE VARIACION: Es un estadstico de dispersin que tiene la ventaja de que no lleva asociada ninguna unidad, por lo que nos permitir decir entre dos muestras, cual es la que presenta mayor dispersin. La denotaremos por C.V.

Para la poblacin:

( )Para la muestra:

( )

Ejemplo: Coeficiente de variacin para datos no agrupados En un juego de tiro al blanco con escopeta de perdigones por dos participantes a un tablero, obtienen el siguiente registro despus de 15 disparos cada uno. Determinar el coeficiente de variacin para ambos casos. Disparo 1 2 3 4 5 n 6 3 0 3 3 Disparo 1 2 3 4 5 n 0 7 7 1 0

PASO 1: Calcular las medias aritmticas: PASO 2: Calcular las varianzas En este punto, la varianza es identificada por S2. PASO 3: Calcular la desviacin estndar a partir de la raz cuadrada de la varianza. La puntuacin de los disparos se aleja en promedio de la media aritmtica en aproximadamente 1,6818 para el jugador 1 y 0,6325 para el jugador 2.

58

PASO 4: Calcular el coeficiente de variacin. El menor coeficiente de variacin indica que el jugador 2 presento una dispersin menor de sus puntuaciones respecto a la media, caso contrario al jugador 1 donde la dispersin fue mayor.

Ejemplo: Veamos por ltimo un ejemplo de cmo se calculan todas estas medidas.

Li Ls45 55 65 75 85 = 55 65 75 85 95 N= 6 10 19 11 4 50 6 16 35 46 50 50 60 70 80 90 300 600 1330 880 360 3470 -19,4 -9,4 0,6 10,6 20,6 116,4 94 11,4 116,6 82,4 420,8 2258,16 883,6 6,84 1235,96 1697,44 6082 15000 36000 93100 70400 32400 246900

=

=

C.V.=Ejercicios: 1.- Las siguientes son las alturas en centmetros de diecisis estudiantes de bachillerato: 172,182,177,174,166,158,170,178,163,161,191,167,171,201,166,172. Determinar la media, la mediana, la moda, rango, varianza desviacin estndar y coeficiente de variacin. 2.-La siguiente tabla muestra los saldos bancarios de 30 clientes de un banco. Determinar la media, la mediana, la moda, rango, varianza desviacin estndar y coeficiente de variacin Clase Li Ls ni 1 7.420 21.835 10

59

2 3 4 5 6

21.835 36.250 36.250 50.665 50.665 65.080 65.080 79.495

4 5 3 3

79.495 93.910 5 Total 30 3.- El peso en kilogramos de un grupo de estudiantes del sexo masculino en un curso de educacin fsica, son los siguientes: Clases 52.5 57.5 57.5 62.5 62.5 67.5 67.5 72.5 72.5 77.5 77.5 82.5. Total ni 8 9 6 4 2 1 30

Determinar la media, la mediana, la moda, rango, varianza desviacin estndar y coeficiente de variacin 4.- Un Centro de Recreacin y Aprendizaje CRA es una institucin elegible para recibir un subsidio destinado a los servicios sociales del Gobierno, a condicin de que la edad promedio de sus nios no llegue a 9 aos. Si los datos siguientes representan la edad de todos los nios que actualmente asisten a ella: 8 5 9 10 9 12 7 12 13 7 8

a) Llena el requisito para recibir el subsidio? b) El CRA del ejemplo anterior puede continuar siendo subvencionada por la oficina de servicios sociales del Gobierno, mientras el ingreso anual promedio de la familia cuyos asisten a esa institucin no llegue a $ 1250 dlares. El ingreso familiar de los padres de los nios es; 1450 650 1560 590 1250 1020 800 880 780 1430

c) Llena esta institucin los requisitos para recibir apoyo financiero del Gobierno? d) Si la respuesta del literal (c) es negativa, cunto debe disminuir el ingreso familiar para cumplir esa condicin? 5.- Un profesor ha decidido utilizar un promedio ponderado al calcular las calificaciones finales de los estudiantes que asistieron a su seminario. El promedio de las tareas hechas en casa representan el 20% de cada calificacin, el examen parcial, 25%; el examen final, 35%; el examen trimestral, 10% y los problemas de practica, 10%. Con los datos anexos calcule el promedio final de los cinco estudiantes que asistieron al seminario Alumno Tarea escolar Problemas Examen trimestral Examen parcial Examen final

60

1 2 3 4 5

85 78 94 82 95

89 84 88 79 90

94 88 95 83 92

87 91 86 84 82

90 92 89 93 88

6.- En 1996 se invirti un fondo de $.30,000.00 dlares y durante diez aos se reinvirtieron todos los intereses y dividendos. Al final de los diez aos el valor total del fondo era de $.49,783.64 dlares Cul fue la tasa de rendimiento promedio, computada anualmente sobre la inversin inicial? 7.- Los siguientes tres automviles obtuvieron el kilometraje por litro de gasolina que se indica abajo, despus de cubrir un trayecto de 600 km, en una pista de prueba. Cul es el promedio de kilmetros por litros para los tres automviles?

Automvil A Automvil B Automvil C

12.5 km/lt 15.6 km/lt 19.4 km/lt

8.- Determinar la media, la mediana, la moda, rango, varianza desviacin estndar y coeficiente de variacin a partir de la siguiente tabla, donde se muestran las ventas durante el 2007 de 50 empresas en el pas.Ventas (en miles de dlares) 100 a 120 120 a 140 140 a 160 160 a 180 180 a 200 200 a 220

Nmero de empresas 5 7 9 16 10 3

9. Se saca una muestra aleatoria de anlisis qumicos de compuestos de cloruros (Cl-) expresados en unidades de mg/L procedentes de una muestra de aguas residuales. Estos anlisis se hicieron usando el mtodo de nitrato de mercurio descrito en el texto Mtodos Estndares. Los valores de los cloruros son: 17.2, 17.1, 17.0, 17.1, 16.9, 17.0, 17.1, 17.0, 17.3, 17.2, 16.9, 17.0, 17.1, 17.3, 17.2, 17.4, 17.1, 17.1, 17.0, 17.1 Determinar la media, la mediana, la moda, rango, varianza desviacin estndar y coeficiente de variacin

10.- El siguiente cuadro muestra el nmero de especies vegetales encontradasen 50 parcelas. Determinar la media, mediana y moda.CLASE (Especies ) 1 2 3 FRECUENCIA (Parcelas) 16 20 9

61

4 Total

5 50

MEDIDAS DE ORDEN: Las medidas de orden o localizacin dividen la distribucin en partes iguales, sirven para clasificar a un individuo o elemento dentro de una determinada poblacin o muestra. As en psicologa los resultados de los test o pruebas que realizan a un determinado individuo, sirve para clasificar a dicho sujeto en una determinada categora en funcin de la puntuacin obtenida. 1. 2. 3. 4. Cuartiles. Deciles. Percentiles. Algunas medidas de dispersin asociadas

CUARTILES Medida de localizacin que divide la poblacin o muestra en cuatro partes iguales.

Q1= Valor de la variable que deja a la izquierda el 25% de la distribucin. Q2= Valor de la variable que deja a la izquierda el 50% de la distribucin = mediana. Q3= Valor de la variable que deja a la izquierda el 75% de la distribucin.

Al igual que ocurre con el clculo de la mediana, el clculo de estos estadsticos, depende del tipo de variable. Caso I: Datos no agrupados En este caso tendremos que observar el tamao de la muestra: N y para calcular Q1 o Q3 procederemos como si tuvisemos que calcular la mediana de la correspondiente mitad de la muestra. Cuando n es par la posicin de datos se determina por:

QK

kN 4

Cuando n es impar la posicin del dato se determina por:

QK

k ( N 1) 4Donde: k = el numero del cuartil buscado N = Tamao de la muestra o poblacin

62

Ejemplo: Determinar el primer y tercer cuartil de los siguientes datos, que representan las comisiones obtenidas durante un ao por 15 agentes de venta de una operadora de telefona celular. (Dlares americanos) 2038, 1758,1721, 1637, 2097, 2047, 2205, 1787, 2287, 1940, 2311, 2054, 2406, 1471, 1460 Solucin: El primer paso es ordenar los datos en forma ascendente: 1460, 1471, 1637, 1721, 1758, 1787, 1940, 2038, 2047, 2054, 2097, 2205, 2287, 2311, 2406 Luego se determina los cuartiles correspondientes mediante la frmula que nos indica que dato corresponde a dicho cuartil

QK Q1

k ( N 1) 4

1(15 1) 4Es decir el dato que ocupa la posicin 4

Q1 = 4

Q1 = 1721

Q3

3(15 1) 4

Q3 = 12 Es decir el datos que ocupa la posicin 12 Q3 = 2205 Caso II: Datos agrupados En este caso el clculo es ms simple se ubica el intervalo donde se encuentre el cuartel buscado y se aplica la frmula:

y

63

Donde: Li = Limite inferior del intervalo donde se ubica el cuartil correspondiente N = Tamao de la muestra o poblacin DECILES Medida de localizacin que divide la poblacin o muestra en 10 partes iguales dk = Decil k-simo es aquel valor de la variable que deja a su izquierda el k10 % de la distribucin. Caso I: Datos no agrupados En este caso tendremos que observar el tamao de la muestra: N y para calcular se procede de manera similar a lo efectuado en el clculo de cuartiles. Cuando n es par la posicin de datos se determina por:

dK

kN 10

Cuando n es impar la posicin del dato se determina por:

dK

k ( N 1) 10Donde: k = el numero del decil buscado N = Tamao de la muestra o poblacin

Ejemplo: Determinar el cuarto y sexto decil de los siguientes datos, que representan las comisiones obtenidas durante un ao por 14 agentes de venta de una operadora de telefona celular. (Dlares americanos) 2038, 1758,1721, 2097, 2047, 2205, 1787, 2287, 1940, 2311, 2054, 2406, 1471, 1460 Solucin: El primer paso es ordenar los datos en forma ascendente: 1460, 1471, 1721, 1758, 1787, 1940, 2038, 2047, 2054, 2097, 2205, 2287, 2311, 2406 Luego se determina los cuartiles correspondientes mediante la frmula que nos indica que dato corresponde a dicho decil

64

dK d4

kN 10 4(14) 10

d4 = 5,6 Es decir el decil cuarto se ubica entre el quinto y sexto dato, y se encuentra a 0.60 de la distancia entre ellos. La distancia entre estos dos datos es 1940 1787 = 153 Para ubicar el cuartil 4 debemos movernos 0.60 de la distancia entre el quinto y sexto valor, por lo que (0.60) (153) = 91.8 Esa distancia la sumamos a 1787 y se tiene el valor del cuartil 4: 1787 + 91.8 = d4=

1878.8

1878

Caso II: Datos agrupados En este caso el clculo es ms simple se ubica el intervalo donde se encuentre el decil buscado y se aplica la frmula:

k = 1 .. 9 Percentiles: Medida de localizacin que divide la poblacin o muestra en 100 partes iguales No tiene mucho sentido calcularlas para variables cuantitativas discretas. Por lo que lo vamos a ver slo para las variables continuas. pk = Percentil k-simo es aquel valor de la variable que deja a su izquierda el k % de la distribucin.

k=1 .. 99 EJEMPLO: Como se puede observar la forma de calcular estas medidas es muy similar a la del clculo de la mediana.

65

Veamos el clculo de algunas de estas medidas en el ejemplo que estamos estudiando. Vamos a calcular Q1,Q3, d3, y p45 Li-1 45 55 65 75 85 Li 55 65 75 85 95 ni 6 Ni 6

10 16 19 35 11 46 4 50

Clculo de Q1: Buscamos en la columna de las frecuencias Acumuladas el valor que supere al 25% de N=50, corresponde al 2 intervalo.(50/4=12.5)

Anlogamente calculemos Q3, Buscamos ahora en la misma columna el correspondiente al 75 %de N que en este caso es el 4 intervalo (3.50/4=37.5)

Veamos ahora el decil 3. (corresponde al 30 % 3 50 / 10 = 15) sera el 2 intervalo.

Por ltimo veamos el percentil 45 (4550/100 = 22.5) Corresponde al intervalo 3.