Estadstica General
Con Minitab y ExcelEstadstica Elemental19171614121120151050CAJAMARCA - 2013Mg. Miguel Angel Macetas Hernndez
NDICE
I.CAPITULO Qu es la Estadstica?41.1Introduccin41.2Qu se entiende por estadstica?41.3Por qu hay que estudiar Estadstica?51.4Tipos de estadstica71.5Elementos que caracterizan a los problemas estadsticos81.6Definiciones bsicas81.7Clasificacin de las Variables10A.Segn la Naturaleza de la Variable10B.Segn la Escala de Medicin11ESCALAS DE MEDICIN21C.Segn la Relacin Entre Variables22II.CAPITULO Presentacin de Datos242.1.Clasificacin y cmputo de datos uni. y bivariables:.24A.Codificacin y tabulacin24B.Presentacin tabular de los Datos: cuadros de distribucin de frecuencias24C.Cuadros estadsticos24D.Partes Principales de un Cuadro Estadstico252.2.Cuadros de Frecuencias de Variables Discretas30A.DISTRIBUCIN DE FRECUENCIAS DE LA VARIABLE CUALITATIVAS:36B.REPRESENTACIN GRAFICA DE LA VARIABLE CUALITATIVAS:37D.REPRESENTACIN GRAFICA DE LA CUANTITATIVAS DISCRETAS:432.3.Cuadros de Frecuencias de Variables Continuas46E.DISTRIBUCIN DE FRECUENCIAS, DE LA VARIABLE CUANTITATIVA CONTINUA:55F.REPRESENTACIN GRAFICA DE LA CUANTITATIVAS CONTINUA:60Grficos Estadsticos72Clasificacin De Los Grficos72III.CAPITULO Medidas de Resumen873.1Medidas de resumen para variables cualitativas873.2Razn e ndice. Definicin. Clculo e interpretacin873.3Medidas de resumen para variables cuantitativas.993.3.1Medidas de Posicin Centrales (Tendencia Central)991.La Media Aritmtica992.La Mediana (Me)1013.Moda (Mo) (Valor Modal o Promedio Tpico)105Caractersticas de las Medidas de Posicin Centrales107
4.Media Geomtrica: , 114
5.Media Armnica: , 118IV.CAPITULO Estadgrafos de Tendencia No central1214.1.Estadgrafos de Tendencia No central121A.Los Cuartiles121B.Para elaborar un diagrama de caja y bigotes es necesario saber:123C.Deciles127D.Percentiles o Centiles129V.CAPITULO Medidas de Dispersin1325.1.Medidas de dispersin132A.Recorrido o rango (R)132B.Recorrido Semi Cuartil (Q)132C.Varianza (s2)132D.Desviacin Estndar o Tpica (s)134E.Coeficiente de Variacin (CV)134VI.CAPITULO Estadgrafos de Deformacin135Asimetra.-135A.Relacin Entre La Media, Mediana y Moda135B.Distribucin Simtrica135C.Importancia de la Asimetra.-136D.Coeficiente de Asimetra.136E.Kurtosis o Apuntamiento.-136VII.CAPITULO Regresin y Correlacin Lineal142Regresin y Correlacin Lineal142
I. CAPITULO Qu es la Estadstica?
1.1 Introduccin
La importancia de la estadstica en la actualidad, no se pone en discusin. Casi todos los programas profesionales universitarios incluyen en su currculo, al menos un curso de estadstica. En muchos pases, inclusive en el Per, la estadstica forma parte del currculo de la educacin secundaria e inclusive se incluyen algunos tpicos en la educacin primaria.
La dinmica del mundo moderno, exige que todo ciudadano, para ejercer sus derechos y comprender su entorno, requiera de una alfabetizacin en estadstica.
1.2 Qu se entiende por estadstica?
Al revisar el texto, vemos que esta parte se encuentra desarrollada posteriormente a las razones por las que se debe estudiar estadstica, aqu lo hacemos primero, para iniciar entendiendo lo que significa la Estadstica.
Realice la lectura de este acpite e identifique las ideas principales al respecto. Le sugiero que subraye las ideas principales que encuentre.Est de acuerdo en que la idea central se relaciona con el tratamiento de informacin numrica?
Lo invito ahora a que enuncie su propia definicin sobre la estadstica.
Le parece a usted que podramos definir a la estadstica como la ciencia que nos proporciona los elementos de juicio necesarios para llegar a tomar decisiones adecuadas?, si est de acuerdo reflexione sobre las razones que le llevan a estarlo; si no lo est tambin reflexione sobre la definicin adecuada y regrese al texto para constatarlo.
De las diferentes formas de enunciar lo que significa la estadstica, realice ahora un cuadro sinptico en la que se resuman las ideas claves que se observan en cualquiera de las definiciones encontradas. Para ello lea detenidamente este acpite que se encuentra en el texto bsico y reflexione sobre los distintos ejemplos que se han planteado all.
1.3 Por qu hay que estudiar Estadstica?Si se revisa un catlogo de informacin de la universidad, se descubrir que la educacin estadstica se requiere en muchos Facultades. Por qu pasa esto?. Cules son las diferencias en los cursos de Estadstica impartidos en una Facultades de la Universidad. La mayor diferencia son los ejemplos utilizados.Bsicamente, el contenido del curso es el mismo; Por ejemplo en una Escuela Profesional de Administracin interesan cosas como las ganancias, horas de trabajo, y salarios. En un Departamento de Salud interesan los resultados de las pruebas, y en una Facultad de Ingeniera pueden interesar cuntas unidades son producidas por una mquina en especial. Sin embargo, las tres reas tienen inters en lo que es un valor tpico y en la cantidad de variacin existente en la informacin. Es posible que tambin exista una diferencia en el nivel de matemticas requerido. Un curso de Estadstica en ingeniera generalmente requiere del Clculo, los cursos de Estadstica en escuelas de administracin y en la educacin, generalmente ensean un curso orientado a aplicaciones. Entonces, por qu se requiere estudiar Estadstica en tantas carreras?.
La primera razn es que en todos lados encontramos informacin numrica. Si se revisan los peridicos, revistas de informacin, revistas de negocios, publicaciones de inters general, o revistas de deportes, uno estar bombardeado con informacin numrica.
Presentamos aqu algunos ejemplos:
Ford reporta que en 2011 sus ventas fueron de $146900 millones (de dlares), arriba en un 7,2%; sus ganancias fueron de $4400 millones, con ascenso en un 7,0%, y el efectivo neto circulante fue de S/.7200 millones. Los egresados de postgrado de la Universidad, contaron con un sueldo promedio inicial de $400 dlares y un 70% de ellos consiguieron trabajo a los tres meses de la graduacin. Para los futbolistas que gustan de jugar en campos deportivos, el alquiler de los campos promediaban S/.500 nuevos soles por semana.
Cmo podemos determinar si las conclusiones presentadas son razonables?, las muestras fueron suficientemente grandes?, cmo se seleccionaron las unidades de la muestra? Para poder ser un consumidor con conocimientos sobre esta informacin, necesitamos poder leer los cuadros, las grficas y entender la discusin de la informacin numrica. El entender los conceptos bsicos de la Estadstica ser de gran ayuda.
La segunda razn para tomar el curso de Estadstica es que las tcnicas estadsticas se utilizan para tomar decisiones que afectan nuestra vida diaria. Esto quiere decir que afectan a nuestro bienestar personal. He aqu algunos ejemplos:
Las compaas de seguros utilizan anlisis estadsticos para establecer las tarifas de los seguros de casa, automvil, vida y salud. Existen tablas que resumen la probabilidad de que una mujer de 25 aos de edad viva el ao siguiente, los siguientes cinco aos, etc. Las primas del seguro de vida se pueden establecer basndose en estas probabilidades. La Agencia de Proteccin al Medio Ambiente est interesada en la calidad del agua en el Lago Ene. Peridicamente toman muestras de agua para establecer el nivel de contaminacin y mantener el nivel de calidad. Los investigadores mdicos estudian las tasas de cura de enfermedades, basndose en el uso de diferentes medicamentos y distintas formas de tratamiento. Por ejemplo, cul es el efecto de tratar cierto tipo de dao a la rodilla con ciruga o con terapia fsica? Si se toma una aspirina diaria, se reducir el riesgo de sufrir un ataque cardiaco?
La tercera razn para tomar el curso de Estadstica es que el conocimiento de los mtodos estadsticos ayudar a entender por qu se toman ciertas decisiones, y le aportarn una mejor comprensin sobre la manera en la que lo afectan.Sin importar el tipo de trabajo que seleccione, encontrar que tiene que enfrentar la toma de decisiones con la ayuda del anlisis de datos. Para poder realizar una decisin basada en la informacin, necesitar:
1. Determinar si la informacin existente es adecuada o si se requiere informacin adicional.2. Reunir informacin adicional, si es necesario, de tal forma que no hayan resultados errneos.3. Resumir la informacin de una forma til e informativa.4. Analizar la informacin disponible.5. Sacar las conclusiones y realizar las deducciones necesarias, al tiempo que se evala el riesgo de llegar a una conclusin incorrecta.
1.4 Tipos de estadstica Por lo general, el estudio de la estadstica se divide en dos categoras
Estadstica Descriptiva: cuando se recoleccin, clasificacin resumen, procesamiento y representa un grupo de datos utilizando mtodos numricos y grficos que resumen y presentan la informacin contenida en ellos. No pretende ir ms all del conjunto de datos investigados.
Estadstica Inferencial: cuando apoyndose en el clculo de probabilidades y a partir de datos muestrales, efecta estimaciones, decisiones, predicciones y otras generalizaciones sobre un conjunto mayor de datos.
Figura N 01
1.5 Elementos que caracterizan a los problemas estadsticos La poblacin de inters y el procedimiento cientfico que se emple para tomar la muestra de la poblacin. La muestra y el anlisis matemtico de su informacin. Las inferencias estadsticas que resultan del anlisis de la muestra. La probabilidad de que las inferencias sean correctas.
1.6 Definiciones bsicas Poblacin o Universo (N) Est referido a un colectivo finito o infinito de elementos individuales. Poblacin es un conjunto completo de individuos u objetos que poseen alguna caracterstica comn observable. Poblacin es el nmero de elementos que definen la cobertura de un estudio. La poblacin es el universo de estudio que est integrado por la totalidad de todas las unidades de anlisis. Por ejemplo Alumnos de Ingeniera Civil matriculados en ciclo acadmico 2012 en la Universidad. Alumnos de IV ciclo de la Escuela Profesional de Ingeniera Civil de la Universidad. Ingenieros Civiles Colegiados en el departamento de Cajamarca en el ao 2012.
Muestra (n) Es la parte o subconjunto de una poblacin. La muestra est constituida de elementos seleccionados de una manera deliberada, con el objeto de investigar las propiedades de su poblacin. La muestra slo da informacin de aquella poblacin de la que ha sido extrada. POBLACIN (N) MUESTRA (n) Muestreo
Inferencia 2
Figura N 02 Unidad de Anlisis o Unidad de Observacin Es el objeto o elemento indivisible que ser estudiado en una poblacin sobre los cuales se va a obtener datos. La unidad de anlisis no es el fenmeno investigado sino el que genera el fenmeno y proporciona datos concretos. Por ejemplo El tipo de anlisis al que se someter la informacin es determinante para elegir la unidad de anlisis. Por ejemplo, si el objetivo es dar cuenta de la satisfaccin del usuario de un servicio mdico, la unidad de anlisis natural es el paciente atendido, o la persona que se atiende en ese servicio mdico.
La unidad de muestreo corresponde a la entidad bsica mediante la cual se acceder a la unidad de anlisis. En algunos casos, ambas se corresponden. Por ejemplo: Si se desea estimar la prevalencia de dao auditivo en relacin con niveles de ruido ambiental en una muestra de trabajadores de una fbrica, la unidad de muestreo puede corresponder a la entidad "sujeto", si se dispone de un registro detallado de cada sujeto. La unidad de anlisis es por cierto el trabajador de la fbrica.
Dato. Es el valor o respuesta que adquiere variable la en cada unidad de anlisis. Dato es el resultado de la observacin, entrevista o recopilacin en general. Los datos son. materia prima de la Estadstica.
Parmetro. Es una medida usada para describir algunas caractersticas de una poblacin, y para determinar su valor es necesario utilizar la informacin de la poblacin completa y por lo tanto, las decisiones se tomaran con certidumbre total. Por ejemplo:Media poblacional (), Varianza poblacional (2), Proporcin poblacional (p).
Estadgrafo. Es una medida usada para describir alguna caracterstica de la muestra y la toma de decisiones contiene un grado de incertidumbre. Por ejemplo:Media muestral (), Varianza muestral (), Proporcin muestral ()
Variable: Es una caracterstica que puede tomar diferentes valores o atributos. Las variables son caractersticas observables, susceptibles de adoptar distintos valores (cuantificado) o ser expresados en varias categoras
VariableValores o atributo
Rendimiento acadmico Genero Calidad de atencin de un restaurante Peso de alumnos Nmero de hijos 12, 14, 17, 20 Masculino, femenino Psimo, malo, regular bueno excelente
45,6 Kg. 57,8 Kg. 73,6 Kg 1, 2, 3,
1.7 Clasificacin de las Variables
Podemos considerar muchos criterios de clasificacin como:A. Segn la Naturaleza de la Variable
a) Variables Cualitativas o Estadsticas de Atributos.
Cuando expresan una cualidad, caracterstica o atributo, tienen carcter cualitativo sus datos se expresan mediante una palabra es no numrico. Por ejemplo:
Estado civil, los colores, lugar de nacimiento, profesiones, actividad econmica, causas de accidentes, etc.
b) Variables Cuantitativas.
Cuando el valor de la variable se expresa por una cantidad, es de, carcter numrico. El dato o valor puede resultar de la operacin de contar o de medir. Por ejemplo:
Edad nmero de hijos por familia, ingresos, viviendas por centro poblado, niveles de, desempleo, produccin, utilidades por empresas, etc.,
Las variables cuantitativas pueden ser: discreta y continua.
b.1. Variable Discreta.Cuando el valor de la variable resulta de la operacin de contar su valor est representado slo por nmeros naturales (enteros positivos). Por Ejemplos:
Hijos por familia nmero de accidentes por da, trabajadores por empresa; poblacin por distritos, habitaciones por vivienda. etc.
b.2. Variable Contina.Cuando la variable es susceptible de medirse es toda variable cuyo valor se obtiene por medicin o comparacin con una unidad o patrn de medida. Las variables continuas pueden tener cualquier valor dentro de su rango o recorrido por tanto se expresa por cualquier nmero real. Por ejemplos:
Ingresos monetarios, produccin de maz, peso, estatura, tiempo de servicios, horas trabajadas, niveles de empleo. etc.
B. Segn la Escala de Medicina) La escala nominal o categricaLa medicin en su nivel ms dbil existe cuando los nmeros u otros smbolos se usan simplemente para clasificar un objeto, una persona o una caracterstica. Cuando se emplean nmeros u otros smbolos para identificar los grupos a los cuales pertenecen varios objetos, estos nmeros o smbolos constituyen una escala nominal o categrica. Esta escala se conoce como escala clasificatoria. Por ejemplo: Se resumen en preguntas dicotmicas, o aquellas con dos opciones de respuesta, y de seleccin mltiple, o aquellas con tres o ms opciones de respuesta. Veamos algunos ejemplos:DicotmicasGnero:FemeninoMasculinoHas comprado el producto X?SINOSeleccin mltipleEn tus prximas compras incluirs el producto X? SINONo sabe
Propiedades FormalesTodas las escalas tienen ciertas propiedades formales, las cuales proporcionan definiciones casi exactas de las caractersticas de la escala; definiciones ms exactas que las que pueden darse en trminos verbales. Estas propiedades pueden ser formuladas de manera ms abstracta de lo que hemos hecho aqu, por un conjunto de axiomas que especifican las operaciones de la escala y las relaciones entre los objetos que han sido escalados.En una escala nominal, las operaciones de la escala dividen a una clase dada en un conjunto de subclases mutuamente excluyentes. La nica relacin implica- da es la de equivalencia; esto es, los miembros de cualquier subclase deben ser equivalentes en la propiedad que est siendo escalada. Esta relacin se simboliza por el signo familiar de "igual" (=). La relacin de equivalencia es reflexiva, simtrica y transitiva.Considrese un conjunto de objetos . . Supngase que el objeto x, tiene algn atributo verdadero, A (x). Entonces, para cualquier par de atributos en el conjunto
Operaciones AdmisiblesYa que en una escala nominal la clasificacin puede estar igualmente bien representada por cualquier conjunto de smbolos, se dice que la escala nominal es "nica hasta una transformacin de uno a uno". Los smbolos que designan las variadas subclases en la escala pueden ser intercambiados si esto se hace de manera cabal y consistentemente. Por ejemplo: Cuando se emiten nuevas placas para automviles, el cdigo que previamente perteneca a una ciudad puede ser intercambiado con el de otra ciudad. La escala nominal podra preservarse si este cambio se ejecutara cabal y consistentemente en la emisin de todas las placas.Ya que los smbolos que designan los variados grupos de una escala nominal pueden ser intercambiados sin alterar la informacin esencial en la escala, el nico tipo de estadsticos descriptivos admisibles son aquellos que pueden ser incambiables por tal transformacin: la moda, la cuenta de frecuencias, etc. En ciertas condiciones, podemos probar hiptesis considerando la distribucin de casos entre las categoras, usando pruebas no paramtricas tales como la ji cuadrada o una prueba basada en la distribucin binomial. Estas pruebas son adecuadas para da- tos escalados nominalmente debido a que se enfocan sobre la frecuencia en las categoras, es decir, sobre datos enumerativos. En suma, cuando los datos en una escala nominal, podemos rotular las categoras "1", "2", "3",.., en cualquier orden que el Vamos. En una muestra podemos contar el nmero de "1", el nmero de "2", etc. (Estas son cuentas de frecuencia) Podemos calcular el porcentaje de "1" en la muestra, el porcentaje de "2", etc. (Esta es la distribucin de frecuencia relativa.) Y podemos registrar qu categora tiene la frecuencia ms grande. (sta es la moda.) Pero en general, no podemos "sumar" las categoras "1" y "2" para formar la categora "3", ya que podramos violar las suposiciones de un sistema de clasificacin nominal. En captulos posteriores estudiaremos diferentes tcnicas estadsticas adecuadas para datos categricos o escalados nominalmente.
b) La escala ordinal o de rangosPuede suceder que los objetos en una categora de una escala no sean tan slo diferentes de los objetos en otras categoras de esa escala, sino que tambin exista algn tipo de relacin entre ellos. Las relaciones tpicas entre las clases son: ms alto, ms preferido, ms difcil, ms perturbador, ms maduro, etc. Tales relaciones se denotan por medio del smbolo >, el cual en general significa "mayor que". En referencia a escalas particulares, > puede ser usado para designar que es preferido a, es ms alto que, es ms difcil que, etc. Su significado especfico depende de la naturaleza de la relacin que define la escala.Dado un grupo de clases de equivalencia (esto es, dado una escala nominal), si la relacin > se sostiene entre algunos pero no todos los pares de clases, tenemos una escala parcialmente ordenada. Si la relacin > se sostiene para todos los pares de clases, de manera que es posible un rango completo ordenado de clases, tenemos una escala ordinal. Por ejemplo: Grado de Instruccin: Primaria Secundaria Superior Intensidad del dolor: Leve Moderado Intenso
Propiedades FormalesAxiomticamente, la diferencia fundamental entre una escala nominal y una ordinal es que esta ltima incorpora no slo la relacin de equivalencia (=), sino tambin la relacin "mayor que" (>). Esta ltima relacin es irreflexiva, asimtrica y transitiva.Considrese un conjunto de objetos . Supngase que existe alguna relacin en el atributo verdadero entre los objetos de cada categora, adems de la equivalencia dentro de las categoras. Esto es,
Es decir, la funcin de clasificacin ordena los objetos en el mismo modo en que de hecho estn ordenados los atributos.
Operaciones AdmisiblesYa que cualquier transformacin que preserve el orden no cambia la informacin contenida en la escala ordinal, se dice que la escala es "nica hasta una transformacin monotnica". Una transformacin monotnica es aquella que preserva el orden de los objetos. Esto es, no importa qu nmeros demos a un par de clases o a los miembros de esas clases, siempre que les sea asignado un nmero mayor a los miembros de la clase que es "mayor que" o "ms preferida". (Naturalmente, se pueden usar nmeros menores para las clases "ms preferidas". As nos referimos generalmente a una ejecucin excelente como "primera clase", y a ejecuciones progresivamente inferiores como "segunda clase" y "tercera clase". Siempre que seamos consistentes, no importa si se usan nmeros mayores o menores para denotar "mayor que" o "ms preferido".) Por ejemplo: En el ejrcito un cabo usa dos bandas en su manga y un sargento usa tres. Estas insignias denotan que el sargento > el cabo, y el smbolo > denota "mayor rango que". Esta relacin podra ser igualmente bien expresada si el cabo usara cuatro bandas y el sargento siete. Vale decir, una transformacin que no cambia el orden de las clases es completamente admisible ya que no implica prdida alguna de informacin. Cualesquiera o todos los nmeros que se aplican a las clases en una escala ordinal pueden ser cambiados de cualquier forma que no altere el orden (rango) de los objetos. Puede aplicarse cualquier transformacin montnica y an preservarse las propiedades de la escala, esto es, preservar la relacin entre los objetos.El estadstico ms, apropiado para describir la tendencia central de las puntuaciones en una escala ordinal es la mediana, ya que en relacin con la distribucin de puntuaciones, la mediana no es afectada por los cambios en cualesquiera de las puntuaciones que estn por arriba o por abajo de ella, siempre que el nmero de puntuaciones por arriba y por debajo permanezca constante. Con el escalamiento ordinal, las hiptesis pueden ser probadas usando el gran grupo de pruebas estadsticas no paramtricas que en ocasiones se llaman estadsticos de rango o estadsticos de orden.
c) La escala de IntervaloCuando una escala tiene todas las caractersticas de una escala ordinal y cuando adems tienen sentido las distancias o diferencias entre cualesquiera dos nmeros de la escala, se ha logrado una medicin considerablemente ms fuerte que la ordinal. En tal caso, la medicin ha sido lograda en el sentido de una escala de intervalo. Esto es, si nuestro mapeo de varias clases de objetos es tan preciso que conocemos cun grandes son los intervalos (distancias) entre todos los objetos de la escala, y estos intervalos tienen significado sustantivo, entonces hemos logrado una medida de intervalo. Una escala de intervalo est caracterizada por una unidad comn y constante de medida que asigna un nmero a todos los pares de objetos en el orden establecido. En esta clase de medicin, la razn de cualesquiera dos intervalos es independiente de la unidad de medida y del punto cero. En la escala de intervalo, el punto cero y la unidad de medida son arbitrarios. Por ejemplo Medimos la temperatura en una escala de intervalo. De hecho, comnmente se usan dos diferentes escalas: Celsius y Fahrenheit. Al medir la temperatura, la unidad de medida y el punto cero son arbitrarios; son diferentes en ambas escalas. Sin embargo, las dos escalas contienen la misma cantidad y la misma clase de informacin. Esto es as debido a que estn linealmente relacionadas. Es decir, una lectura en una escala puede ser transformada en la lectura equivalente de la otra por medio de una transformacin lineal.
DondeF = nmero de grados en la escala Fahrenheit C = nmero de grados en la escala CelsiusSe puede mostrar que las razones de las diferencias de temperatura (intervalos) son independientes de la unidad de medida y del punto cero. Por ejemplo, el punto de "congelacin" ocurre en 0 en la escala Celsius, y el punto de "ebullicin" ocurre en los 100. En la escala Fahrenheit, la "congelacin" ocurre en los 32 y la "ebullicin" en 212. Algunas otras lecturas de la misma temperatura en las dos escalas son las siguientes:Celsius 1801030100
Fahrenheit0325086212
Ntese que la razn de las diferencias entre las lecturas de temperatura en una escala, es igual a la razn entre las diferencias equivalentes en la otra escala. Por ejemplo, En la escala Celsius la razn de las diferencias entre 30 y 10, y 10 y 0 es (30 10) / (10 0) = 2. Para las lecturas comparables en la escala Fahrenheit, la razn es (86 50) / (50 32) = 2. En ambos casos las razones son las mismas; a saber, 2. En otras palabras, en una escala de intervalo, la razn de cualesquiera dos intervalos es independiente de la unidad usada y del punto cero, siendo ambos arbitrarios.
Muchos cientficos de la conducta aspiran a crear escalas de intervalo, y en pocas ocasiones tienen xito. Sin embargo, generalmente lo que es tomado como xito son suposiciones no probadas que el constructor de la escala voluntariamente cree. Una suposicin frecuente es que la variable que est siendo escalada est normalmente distribuida entre los individuos a los que se evala con base en esta suposicin, el constructor de la escala manipula las unidades de la escala hasta que se encuentre la supuesta distribucin normal de las puntuaciones de los individuos. Naturalmente, el procedimiento es slo tan bueno como la intuicin del investigador al elegir la distribucin que supone.
Otra suposicin que se hace a menudo para crear una escala de intervalo aparente es la suposicin de que las respuestas "afirmativas" de las personas en cualquier reactivo son exactamente equivalentes a responder de manera afirmativa en cualquier otro reactivo. Esta suposicin se hace para satisfacer el requisito de que una escala de intervalo debe tener una unidad de medida comn y constante. En escalas de habilidades o de aptitudes, la suposicin de equivalencia consiste en que dar la respuesta correcta a cualquier reactivo es exactamente equivalente (en la cantidad de habilidad mostrada) a dar la respuesta correcta a cualquier otro reactivo.
Propiedades FormalesAxiomticamente, se puede mostrar que las operaciones y relaciones que dan origen a la estructura de una escala de intervalo son tales que las diferencias en la escala son isomrficas a la estructura de la aritmtica. Los nmeros pueden ser asociados con las posiciones de los objetos en una escala de intervalo tal que las operaciones de la aritmtica pueden ser significativamente ejecutadas con las diferencias entre los nmeros.Al construir una escala de intervalo no slo se deben especificar equivalencias, como en la escala nominal, y relaciones "mayor que", como en la escala ordinal, sino tambin se debe ser capaz de especificar la razn entre dos intervalos cualesquiera.
Considrese un conjunto de objetos Supngase que los atributos verdaderos de los objetos existen en alguna relacin unos con otros, adems de sus equivalencias dentro de las categoras. Esto es:
Entonces, una escala de intervalo es un sistema clasificatorio de los objetos L (x) que tienen las propiedades de una escala ordinal y, adems
Ntese que en este caso, la diferencia entre los atributos de los dos objetos es proporcional a la diferencia entre las asignaciones de clasificacin:
Operaciones Admisibles
Cualquier cambio en los nmeros asociados con las posiciones de los objetos medidos en una escala de intervalo debe preservar no slo el orden de los objetos, sino tambin las diferencias relativas entre los objetos. Esto es, la escala de intervalo es "nica hasta una transformacin lineal". As, como hemos sealado, la informacin proporcionada por la escala no es afectada si cada nmero se multiplica por una constante positiva y despus se le suma a este producto una constante, esto es. (En el ejemplo de la temperatura, c = 9/5 y b = 32.)
Ya hemos notado que en una escala de intervalo el punto cero es arbitrario. Esto es inherente al hecho de que la escala est sujeta a transformaciones que consisten en agregar una constante a los nmeros que constituyen la escala.
La escala de intervalo es la primera escala verdaderamente "cuantitativa" que hemos encontrado. Todos los estadsticos paramtricos comunes (medias, desviaciones estndar, correlaciones producto-momento, etc.) son aplicables a los datos en una escala de intervalo. Si de hecho se ha logrado una medida en una escala de intervalo y si se han encontrado adecuadamente todas las suposiciones del modelo estadstico paramtrico (dadas en la seccin "El modelo estadstico"), entonces el investigador puede utilizar pruebas estadsticas paramtricas tales como la prueba t o la prueba F. En tal caso, los mtodos no paramtricos no aprovechan toda la informacin contenida en los datos de investigacin. Puede notarse que una escala de intervalo es una condicin necesaria, pero no suficiente, para usar una prueba estadstica paramtrica que incluya la distribucin normal.
d) La escala de raznCuando una escala tiene todas las caractersticas de una escala de intervalo y, adems, tiene un punto cero verdadero en su origen, se llama escala de razn. En una escala de razn, la razn de cualesquiera dos puntos es independiente de la unidad de medida. Por ejemplo Medimos la masa o el peso en una escala de razn. La escala de onzas y libras tiene un punto cero verdadero, al igual que la escala de gramos. La razn entre cualesquiera dos pesos es independiente de la unidad de medida. Por ejemplo, si de- terminamos los pesos de dos objetos diferentes no slo en libras sino tambin en gramos, encontraremos que la razn de los dos pesos en libras es idntica a la razn de los dos pesos en gramos.
Aunque es difcil identificar ejemplos significativos en las ciencias sociales y de la conducta, los contraejemplos abundan. Consideramos dos. Notamos anteriormente que las calificaciones se miden en una escala ordinal. Considrese a dos estudiantes, uno de los cuales recibe una A y el otro una C; y supngase que las asignaciones numricas fueron 4 y 2, respectivamente. Aunque la razn de las dos calificaciones es dos (4/2 = 2), no tiene sentido decir que el estudiante con una A posee el doble de "algo" del estudiante que recibe la C. (El estudiante puede obtener el doble de ciertos puntos, pero no es claro si esto tiene algn significado sustantivo en conocimiento, habilidad o perseverancia.) Finalmente, en el caso de la temperatura, considrese un cambio en la temperatura de 100 a 30 C. No podemos decir que el incremento representa que el calor se increment al triple. Para ver esto, ntese que el cambio en la temperatura es equivalente a un cambio de 500 a 86 F. Debido a que las razones de las temperaturas en las dos escalas son claramente diferentes, la razn no tiene sentido interpretable alguno.
Propiedades Formales
Las operaciones y relaciones que dan origen a los valores numricos en una escala de razn son tales que la escala es isomrfica a la estructura de la aritmtica. Por tanto, las operaciones de la aritmtica son permisibles con los valores numricos asignados a los objetos, as como a los intervalos entre los nmeros, como en el caso de la escala de intervalo.
Las escalas de razn, que se encuentran ms comnmente en las ciencias fsicas, se logran slo cuando son operacionalmente posibles de alcanzar todas las siguientes cuatro relaciones: 1. equivalencia; 2. mayor que; 3. razn conocida entre cualesquiera dos intervalos, y 4. razn conocida entre cualesquiera dos valores de la escala.Considrese un conjunto de objetos . Supngase que el atributo verdadero de los objetos existe con alguna relacin entre cada uno de ellos, adems de la equivalencia dentro de las categoras. Esto es
Entonces, una escala de razn es un sistema clasificatorio de los objetos L (x) si
y la razn de las clasificaciones asignadas es igual a la razn de los atributos verdaderos.Operaciones Admisibles
Los nmeros asociados con los valores de la escala de razn son nmeros "ver- daderos" con un cero verdadero: slo la unidad de medida es arbitraria. As, la es- cala de razn es nica hasta la multiplicacin por una constante positiva. Esto es, las razones entre cualesquiera dos nmeros se preservan cuando los valores de la escala son todos multiplicados por una constante positiva y, adems, tal transformacin no altera la informacin contenida en la escala.Cualquier prueba estadstica paramtrica puede usarse cuando se han logrado medidas de razn y se encuentran las suposiciones adicionales concernientes a la distribucin. Ms an, existen algunos estadsticos que se aplican slo a datos que descansan en una escala de razn; debido a la fuerza de las suposiciones que sub- yacen a la escala, la mayora de estas pruebas son pararntricas.
Estadstica General2013
C. 56Mg. Miguel Angel Macetas Hernndez
ESCALAS DE MEDICIN
TipoVariables CategricasVariables numricas
NaturalezaCUALITATIVASCUANTITATIVAS
Escala(0) NOMINAL Ningn atributo(1) ORDINAL Un atributo(2) INTERVALO Dos atributos(3) RAZN Tres atributos
Atributos de la escalaOrdenDistanciaOrigenOrdenDistanciaOrigenOrdenDistanciaOrigenOrdenDistanciaOrigen
CaractersticaPosee categoras a las que se asigna un nombre sin que exista ningn orden implcito entre ellas.Posee categoras ordenadas, pero no permite cuantificar la distancia entre una categora y otra.Tiene intervalos iguales y medibles, pero no tiene un origen real. Puede asumir valores negativos.Tiene intervalos constantes entre valores; adems de un origen real. El cero significa la ausencia de la variable.
EjemplosGneroEstado CivilInstruccinIntensidadTemperaturaHora del daPeso.Hijos
Valor FinalMasculinoFemeninoSolteroCasadoConvivientePrimariaSecundariaSuperiorLeveModeradoSevero-10 C0 C20 C00 Horas10 Horas20 Horas00.00 Kg10.24 Kg20.00 KgUnoDosTres
ObservacionesDicotmicas: Tienen solamente dos categoras Ejemplos de Ordinal Dicotmica: Nuevo - ContinuadorVivo Fallecido
Sano Enfermo
Politmicas: Tienen ms de dos categoras.Continuas: Provienen de medirSe pueden representar con nmeros enteros o fraccionarios
Entre dos valores siempre existe un nmero intermedio
Discretas: Provienen de contar
Solamente pueden ser representados con nmeros enteros
D. Segn la Relacin Entre Variablesa) Variables DependientesSon aquellas que se explican por otras variables, son los efectos o resultados respecto a los cuales hay que buscar su motivo, causas o razn de ser, Es la variable que traduce la consecuencia del efecto de una varias razones o causas.
b) Variables IndependientesSon las variables explicativas o predicativas, cuya asociacin, relacin o influencia en la variable dependiente se pretende escribir en la investigacin. Las variables independientes son los que traducen o explican las causas o razones de las variaciones en la variable dependiente. Simplificando, en la relacin de variables, las causas o antecedentes seran las variables independientes (VI) y la causa o consecuente es la variable dependiente (VD). Ejemplos: En el caso ms simple, para la relacin d dos variables. El presupuesto familiar (VD) depende de los ingresos (VI). El volumen de ventas (VD) se explica por la inversin en propaganda (V). El nmero de hijos por familia (VD) tiene relacin con el nivel educativo de los padres (VI).c) Variables Intervinientes o interferentesSon aquellas que coparticipan con la variable independiente condicionando el comportamiento de la variable dependiente. En el caso de la relacin entre presupuesto familiar (VD) y los ingresos (VI), algunas variables intervinientes serian la conducta de consumo, la edad de los miembros de la familia, etc.
Elementos de una VariableLa identificacin y definicin de variables es la tarea ms delicada de toda investigacin y del trabajo estadstico. En consecuencia, para tener xito en la seleccin de variables, es recomendable distinguir las siguientes cinco caractersticas. Un nombre o denominacin. de la variable. Alguna definicin o conceptualizacin. Un conjunto de categoras. que es definida por el investigador. Las categoras no son nicas. Procedimientos para categoras las unidades de anlisis. Algunas medidas de resumen o indicadores.Ejemplo 1:a) Nombre: Estado civil o conyugal.
b) Definicin: Es la situacin de la persona empadronada en relacin con las leyes y costumbres del pas.c) Categoras: 01) Sol tero (a).02) Casado (a).03) Conviviente. 04) Viudo (a).05) Divorciado (a).06) Separado (a).d) Categorizacin: Cul es su estado civil o conyugal?e) Medidas de PorcentajesResumen Tasa de nupcialidad que indica la frecuencia de matrimonios, etc.
Ejemplo 2:a) Nombre: Ingresosb) Definicin Son los recursos monetarios netos incluyendo todas las Bonificaciones que percibe una persona por su ocupacin principal y secundaria durante el perodo de referencia de la encuesta.c) Categoras : Puede proponerse en forma de niveles o simplemente intervalos.Niveles de ingreso: alto, medio, bajo Intervalos: Por ejemplo 8 intervalosMenos de 4000; 4001 l 8000; 8001 a 12000; 1 2001 a 1 6000; 16001 a 20000: 20001 a 25000; 25001 a 30000; 30001 y ms soles.d) Categorizacin: Cul fue su ingreso total en el ltimo mes?e) Indicadores : Ingreso promedio.Dispersin de los ingresos. etc.
II. CAPITULO Presentacin de DatosClasificacin y cmputo de datos uni. y bivariables:. A. Codificacin y tabulacin La codificacin facilita la tabulacin y el conteo. (obtencin de una buena informacin) La codificacin de las respuestas da lugar a categoras o modalidades. Es recomendable que los cuestionarios tengan las alternativas de respuesta pre codificadas. Si el cuestionario tiene preguntas abiertas (respuesta libre), estas previamente debe ser clasificadas en categoras.B. Presentacin tabular de los Datos: cuadros de distribucin de frecuencias Es necesario agrupar los datos y presentarlos en cuadros y diagramas sencillos. Un cuadro de frecuencias, son cuadros que indican la distribucin de un conjunto de datos en clases o categoras y muestran el nmero de elementos y la proporcin de cada uno de los valores de la variable. Un cuadro de frecuencias, permite una buena ayuda para formularse interrogantes acerca de los datos. Un cuadro de frecuencias, es un punto de partida en la bsqueda de un modelo terico para analizar la distribucin de los datos. En la cuadro se observa la frecuencia o repeticin de cada uno de los valores de la variable. Las observaciones o recopilaciones de datos denotaremos la variable por X y los datos originales: . donde Xi representan la i sima observacin de la variable con (i = 1, 2, 3, 4,..., N). Es decir que:X1 = dato de la primera observacinX2 = dato de la segunda observacinX3 = dato de la tercera observacin.XN = dato de la N sima observacinC. Cuadros estadsticos En una investigacin, despus que los datos han sido recogidos, revisados y almacenados en una base de datos, se procede a la presentacin de los resultados en forma tabular o grfica y al anlisis estadstico de la informacin. La facilidad de su construccin y el rpido efecto en la transmisin de los contenidos, han hecho de los cuadros estadsticos los recursos idneos para la presentacin de los resultados de las investigaciones en todas las reas cientficas. La presentacin tabular y el grfico no son competidores, sino ms bien elementos que se complementan. Los grficos deben agregarse a los cuadros o distribuciones de frecuencias para llamar la atencin y despertar el inters por los datos que se presentan, as como para reforzar las argumentaciones o conclusiones a las que se haya llegado. Como un principio muy conveniente, debe adoptarse el de que en ningn caso puede considerarse que el grfico sustituye a la presentacin tabular. La prctica seguida por algunas personas, de presentar grficos omitiendo los cuadros que contienen la informacin bsica, debe ser evitada y combatida por inconveniente y por limitar la calidad y la utilidad de las publicaciones y estudios. Slo en casos de verdadera excepcin, como cuando se trata de propaganda o de artculos meramente divulgadores, podra aceptarse la prctica comentada.Objetivo Un cuadro estadstico tiene como objetivo presentar datos numricos ordenados, en filas y columnas, de acuerdo a ciertos criterios de clasificacin.Ventajas Los cuadros permiten presentar en forma resumida y ordenada muchos datos Es un instrumento que clasifica, resume y comunica informacin estadstica Facilita el anlisis de los datos Su fcil comprensin, permite que sea utilizado por muchas personas Todo cuadro estadstico debe explicarse por s mismo, sin necesidad de texto o figuras anexas, y debe ser sencillo y claroD. Partes Principales de un Cuadro EstadsticoEn general, un cuadro estadstico completo, tal como el Cuadro N 01, por ejemplo, puede tener ocho partes:1. Nmero del cuadro. 2. Ttulo.3. Encabezamiento o conceptos.4. Cuerpo.5. Nota de pie o llamadas.6. Fuente.7. Nota de unidad de medida.8. Elaboracin.
2Es el cdigo o elemento de identificacin que permite ubicar el cuadro en el interior de un documentoCUADRO N 011
Es la descripcin resumida del contenido del cuadro. La redaccin del ttulo debe ser breve, claro y completo, de modo que se puedan deducir sin ambigedad qu tipo de informa. Debe indicar1. QUE2. DONDE3. COMO4. CUANDO
POBLACIN TOTAL ECONMICAMENTE ACTIVA DE 15 AOS Y MS, DEL DEPARTAMENTO DE CAJAMARCA: POR NIVEL EDUCATIVO SEGN RAMAS DE ACTIVIDAD. CENSO DE POBLACIN 2009
DondeQue
Cuando ComoDonde
Descripcin de las filas y columnas del cuadro estadsticoExpresa en qu unidades estn las variables7
(Distribucin porcentual)
Ramas de Actividad3
PEA de15 aosy msN i v e l d e Educacin
SinNivel*PrimariaSecundariaSup. NoUniver.SuperiorUniver.No Especificado
TOTAL100,05,8942,1135,875,678,661,80
1. Agricultura, Caza, Selvicultura y Pesca100,014,9764,0515,590,701,303,404
2. Explotacin de Minas y Canteras.100,00,7541,1339,595,7912,630,11
3. Industrias Manufactureras.100,03,6043,5741,602,946,701,59
4. Electricidad, Gas y Agua.100,00,0021,9548,298,2920,490,98Es el contenido numrico del cuadro
5. Construccin.100,04,7864,3624,991,053,541,28
6. Comercio, Restaurantes y Hoteles.100,06,9545,0439,662,064,391,91
7. Transportes, Almacenamiento y Comunicaciones.100,01,3445,1846,872,283,151,18
8. Establecimientos Financieros, Seguros, Bienes Inmuebles y Servicios a las Empresas100,00,6411,6048,719,2829,250,52
9. Servicios Comunales, Sociales y Personales.100,02,1026,5643,3511,4615,221,30
10. Actividades No bien especificadas.100,09,3544,7034,993,554,972,43
11. Buscan trabajo por primera vez.100,01,9425,7556,976,707,940,71
* Incluye PEA con educacin inicial o pre escolarFuente: INE Resultados definitivos de los Censos Nacionales IX de Poblacin y IV de ViviendaElaborado: Statistic MAH.
5) NOTA DE PIE O LLAMADAS, se usa para aclarar algunos trminos o siglas, y tambin para indicar qu elementos estn o no incluidos en algunos de los conceptos del cuadro.6) FUENTE, es la indicacin al pie el cuadro, que sirve para nombrar la publicacin, entidad, estudio o fuente de donde se obtuvieron los datos utilizados para construir el cuadro. La identificacin de la fuente permite, si fuera el caso, comprobar la informacin o para obtener informacin complementaria.Hay dos tipos de fuentes: i) primaria, cuando se obtiene directamente de la unidad de anlisis o cuando se recurre a los propios formularios de una encuesta: ii) secundaria, cuando se recurre a documentos boletines o cuadros estadsticos publicados.7) Nota Unida de Medida se escribe debajo del ttulo, se usa cuando se abrevia la escritura8) ELABORACIN, es una indicacin que se coloca debajo de la fuente, y sirve para mencionar el responsable, que utilizando datos originales o de la fuente elabor el cuadro estadstico final: indica la responsabilidad de la publicacin del cuadro. A veces resulta til indicar la fecha de elaboracin.QUE : Poblacin Total Econmicamente Activa De 15 Aos Y MsDONDE : Del Departamento CajamarcaCOMO : Por Nivel Educativo Segn Ramas de ActividadCUANDO : Censo de Poblacin 2009.
CUADRO 04
PACIENTES SEGN NMERO DE LEUCOCITOS /mm3.HOSPITAL REGIONAL DE CAJAMARCA - CAJAMARCA - 2007.Nmero de Leucocitos(miles)1/Nmero de Pacientes (ni )Porcentaje de Pacientes ( hi % )
5.0 - 5.96.0 - 6.97.0 - 7.98.0 - 8.99.0 - 9.910.0 - 11.031011131085.518.220.023.618.214.5
T o t a la/ 55100.0
- Nota de pie. a/. Muestra aleatoria sistemtica. 1/. Datos expresados en miles.- Fuente. H.R.C
E. Caractersticas:
1. La cuadro estadstica debe ser lo ms simple posible.2. Si se utilizan smbolos, abreviaturas, etc., debenexplicarse detalladamente en notas de pie de pgina.3. Deben ser incluidas las unidades especficas de medida que corresponden a los datos.4. Debern consignarse los totales.5. Si los datos no son originales debe quedar explcita la fuente de donde se ha tomado.6. Cuando se utilizan escalas cualitativas hay que tener cuidado si se desea comparar datos de una cuadro con otra, ya que en los criterios de clasificacin de la variable puede que el entendimiento nuestro de un concepto no coincida totalmente con el de otro investigador.7. Una cuadro estadstica puede ser completada con las frecuencias acumuladas, frecuencias relativas (porcentajes, promedios o razones), etc.
F. Tipos de cuadros.En su forma ms general los cuadros pueden dividirse en simples y compuestas.a) Cuadros Simples. Clasifican un fenmeno segn una nica variable. Ejemplo Cuadro 04.b) Cuadros Compuestos. Son las que recogen los datos de dos o ms variables, cada una de ellas con sus correspondientes criterios de clasificacin. Dentro de los cuadros compuestos las que se utilizan con mayor frecuencia son: Las cuadros dobles y las Maestras.
c) Cuadros Dobles. Resumen informacin clasificadas segn 2 variables, y estas se denominan: Cuadros de contingencia y cuadros de correlacin.
d) Cuadro de Contingencia. Cuando ambas variables son cualitativas o mixtas. Ejemplo. El cuadro siguiente muestra una distribucin bidimensional (Cuadro de contingencia) CUADRO 05REACCIN A LA VACUNACIN CONTRA EL SARAMPIN Y LA RUBOLA EN UNA MUESTRA DE 288 NIOS DE CAJAMARCA -1994.Vacunados contrasarampinVacunados contra rubolaT O T A L
Reaccin PositivaReaccin Negativa
Reaccin positivaReaccin negativa761207220148140
T O T A L19692288
La interpretacin a esta cuadro sera la siguiente: de una muestra de 288 individuos, 76 tuvieron reacciones positivas a las dos vacunaciones, 20 individuos tuvieron reaccin negativa a ambas pruebas, 120 individuos tuvieron reaccin positiva ante la vacuna contra la rubola, pero negativamente ante la vacuna contra el sarampin, y 72 nios tuvieron reaccin negativa a la vacuna contra la rubola y positiva en la vacuna contra el sarampin.
CUADRO DE CORRELACIN. Cuando ambas variables son cuantitativas. Por ejemplo
CUADRO 06
MUJERES EN EDAD FRTIL SEGN GRUPO ETREO Y NMERO DE HIJOS NACIDOS VIVOS - HOSPITAL REGIONAL DE CAJAMARCA - CAJAMARCA 2007
GRUPO ETREO(Aos Cumplidos)Nmero de Hijos Nacidos VivosT O T A L
012345 y +
15 - 1920 - 2425 - 2930 - 3435 - 3940 - 4445 - 49
T o t a l
2.Cuadro Maestra. En este tipo de cuadros todos los criterios de clasificacin de cada una de las variables son sometidos a una clasificacin cruzada. Esto da lugar a una perspectiva mucho ms amplia, ya que nos permite obtener datos de una nica variable o de cualquier combinacin de las variables que entran en juego en la cuadro.Ejemplo. El cuadro muestra la composicin por edad, sexo y trabajo de un grupo de personas con Tuberculosis pulmonar en Cajamarca (Esquema) durante 2007.
CUADRO 07PERSONAS CON TBC SEGN EDAD, CONDICIN LABORAL Y SEXO - DISTRITO DE CAJAMARCA - 2007EDADTRABAJADORESNO TRABAJADOREST O T A L
HombresMujeresTotalHombresMujeresTotalHombresMujeresTotal
15 19 20 2425 29...50 5455 5960 +
TOTAL
Nota:Con este tipo de cuadros podemos extraer datos de las personas que padecen Tuberculosis en un determinado intervalo de edad (A), tambin del total de personas que no trabajan y han contrado la TBC (B), y del total de mujeres, ya sean trabajadoras o no, que tienen tuberculosis (C).
Cuadros de Frecuencias de Variables DiscretasPara este tipo de variables cuyo valor slo se puede expresar por nmero enteros positivos, los datos que caen dentro de cada clase.Elementos de un cuadro de Frecuencia
Frecuencias Absolutas o Repetidas (fi o ni).- Es el nmero de veces que se repite un determinado valor de la variable.
Frecuencia Relativa (hi ).- Es el cociente de:
Frecuencia absoluta o Repeticiones Nmero de Observaciones
CUADRO N 7.8NUMERO DE NACIMIENTOS EN EL DEPARTAMENTO DE LAMBAYEQUE, POR PROVINCIAS 2004 ProvinciasNmero de NacimientosPorcentaje de Nacimientos
Lambayequen1 = 325
Chiclayon2 =330
Ferreafen3 = 289
Totaln = 944100,00
Ejemplo con variables cualitativas Ejemplo. El restaurante "Hay Que Rico" en la ciudad de Chiclayo, usa un cuestionario para conocer la opinin de sus clientes sobre el servicio, la calidad de los alimentos, los ccteles, los precios y el ambiente del restaurante en el mes de julio del 2005. Cada caracterstica se valora en una escala: notable (O), muy bueno (V), bueno (G), mediano (A) y malo (P). Elabore un cuadro estadstico GOVGAOVGOVAG
VOPVOGAOOOGO
VVAGOVPVOOGO
OVOGAOVOOGVA
Aplicacin de la funcin de Excel en la Elaboracin de Tablas con variables cualitativas
Figura N 03 Ingreso de los datos
Paso.- 1 Se ubica en la celda A1 (Calidad) Insertar se selecciona tabla dinmica
Figura N 04 Seleccin de la tabla dinmica
Paso.- 2 En la ventana de Crear tabla dinamica se elije donde se desea colocar el informe de la tabla dinamica
Figura N 05 Crear tabla dinamica
Paso.- 3 En la ventana de lista de campos de la tabla dinmica se selecciona la variable Calidad en Etiqueta de la fila y de columnas y en valores
Figura N 06 Seleccionar campos para agregar al informe Paso.- 4 Insertamos un grfico un dinmico de barras
Figura N 07 Insertar grafico
Paso.- 4 Presentacin del grfico de barras de la variable calidad
Grafico N 01: Grafico de Barras de la variable calidad
Ejemplo:En un estudio de mercado para determinar la aceptacin de un centro comercial Shopping Plaza por departamentos ubicada en la ciudad de Cajamarca, se eligi una muestra de 35 clientes para conocer sus impresiones. Los resultados son los siguientes:ClienteRazn de visitaGasto semanalIngreso MensualNmero de hijosForma de Pago
1Oferta permanente66.0012002Efectivo
2Guardera72.5015001Crdito
3Tarjeta de crdito79.1021003Crdito
4Oferta permanente82.7020003Efectivo
5Guardera55.3015001Efectivo
6Parking amplio100.1022002Crdito
7Aire acondicionado35.3014503Efectivo
8Tarjeta de crdito60.4013101Crdito
9Aire acondicionado57.2011502Efectivo
10Parking amplio140.0023200Crdito
11Tarjeta de crdito69.1013502Efectivo
12Parking amplio73.1016401Crdito
13Guardera75.3016803Crdito
14Aire acondicionado30.0011000Efectivo
15Parking amplio95.2018502Efectivo
16Guardera65.3014101Efectivo
17Tarjeta de crdito68.0015803Crdito
18Parking amplio115.3021100Efectivo
19Parking amplio130.2021802Crdito
20Aire acondicionado48.4016403Crdito
21Guardera86.0018402Crdito
22Parking amplio102.2019503Efectivo
23Oferta permanente50.1012302Efectivo
24Tarjeta de crdito101.2020002Crdito
25Parking amplio102.2028103Crdito
26Oferta permanente58.1015304Efectivo
27Tarjeta de crdito90.3019802Crdito
28Parking amplio119.1029004Crdito
29Oferta permanente125.1026803Efectivo
30Tarjeta de crdito70.2019702Crdito
31Parking amplio118.4025603Crdito
32Oferta permanente110.1021804Crdito
33Tarjeta de crdito84.3019803Efectivo
34Oferta permanente77.2020502Crdito
35Oferta permanente104.2025004Crdito
Se copia (Ctrl + C) y se pega (Ctrl + V) al Minitab las 35 observaciones
Figura N 08: Pantalla del Minitab ingresado los datos
A. DISTRIBUCIN DE FRECUENCIAS DE LA VARIABLE CUALITATIVAS: Realizamos la tabulacin de la variable Razn de visita procedemos a ejecutar en el Minitab
MINITAB: Tabla de frecuencias
1. Paso 1 .- Estadsticas/Tablas/cuenta de variables individuales
Figura N 09 Estadsticas/Tablas/cuenta de variables individuales
2. Paso 2.- En la ventana cuenta de variables individuales se selecciona la variable Razn de Visita. Mostrar Conteos/Porcentajes/ Conteos acumulados porcentajes acumulados. Aceptar
Figura N 10 Ventana cuenta de variables individualesResultado del procesamiento en Minitab
Figura N 11 Cuenta de la variable Razn de visita
B. REPRESENTACIN GRAFICA DE LA VARIABLE CUALITATIVAS: Realizamos la tabulacin de la variable Razn de visita procedemos a ejecutar en el Minitab
1. Grafico Circular.- Se trabaja con los valores de las frecuencias Absolutas (ni) frecuencias relativas (hi) como la variables seleccionada es variable cualitativa (Razn de Visita)
Paso 1 .- Grfica/Grfica Circular
Figura N 12 Grfico circular en minitab
Paso 2 .- En la ventana de Grafica circular se selecciona Variables Categrica: Razn de visita
Figura N 13 Grafica Circular
Paso 3 .- En la ventana de Grafica circular se selecciona EtiquetasSeleccionar la pestaa Etiqueta de divisin de la grfica circular con: Nombre de categora/ Porcentaje /Dibujar una lnea de la etiqueta a la divisin
Figura N 14 Etiqueta de divisin de la grfica circular
Grfico N 02 Grfico Circular de Razn de visita
2. Grfico de Barras.- En el eje horizontal representa los valores o las categoras y en el eje vertical se presentan los valores de las frecuencias Absolutas (ni) frecuencias relativas (hi) como la variables seleccionada es variable cualitativa (Razn de Visita)
Paso 1 .- Grfica/Grfica de barras
Figura N 15 Grfico barras en minitab
Paso 1 .- En la ventana Grfica de barrasLas barras representan: Conteos de valores nicosBarras simples/ Aceptar
Figura N 16: Grfica de barras
Paso 2.- En la ventana Grfica de barras Conteo de valores nicos, simples se selecciona la variable categrica: Razn de visita y se selecciona Opciones de grficas
Figura N 17: Grfica de barras Conteo de valores nicos, simples
Paso 3.- En la ventana Grfica de barras Opciones de grficasOrdenar grupos de X principal por Y descendente/Aceptar
Figura N 18: Grfica de barras Opciones
Paso 4.- En la ventana Grfica de barras Conteo de valores nicos, simples se selecciona EtiquetasEn Etiquetas de datos se selecciona Usar etiquetas de valor y /Aceptar/Aceptar
Figura N 19: Grfica de barras Etiquetas
Grfico N 03 Grfico de barras Razn de visita
C. DISTRIBUCIN DE FRECUENCIAS DE LA VARIABLE CUANTITATIVAS DISCRETAS: Realizamos la tabulacin de la variable Nmero de hijos procedemos a ejecutar en el Minitab
1. Paso 1 .- Estadsticas/Tablas/cuenta de variables individuales
Figura N 20 Estadsticas/Tablas/cuenta de variables individuales
2. Paso 2.- En la ventana cuenta de variables individuales se selecciona la variable Nmero de hijos. Mostrar Conteos/Porcentajes/ Conteos acumulados porcentajes acumulados. Aceptar
Figura N 21 Ventana cuenta de variables individuales
Resultado del procesamiento en Minitab
Figura N 22 Cuenta de la variable Nmero de hijos
D. REPRESENTACIN GRAFICA DE LA CUANTITATIVAS DISCRETAS: Realizamos la tabulacin de la variable Nmero de hijos procedemos a ejecutar en el Minitab
1. Grfico de Barras.- Se trabaja con los valores de las frecuencias Absolutas (ni) frecuencias relativas (hi) como la variables seleccionada es variable discreta Nmero de hijos
Paso 1 .- En la ventana Grfica de barrasLas barras representan: Conteos de valores nicosBarras simples/ Aceptar
Figura N 23: Grfica de barras
Paso 2.- En la ventana Grfica de barras Conteo de valores nicos, simples se selecciona la variable categrica: Nmero de hijos y se selecciona Opciones de grficas
Figura N 24: Grfica de barras Conteo de valores nicos, simples
Paso 3.- En la ventana Grfica de barras Opciones de grficasOrdenar grupos de X principal por Y descendente/Aceptar
Figura N 25: Grfica de barras Opciones
Paso 4.- En la ventana Grfica de barras Conteo de valores nicos, simples se selecciona EtiquetasEn Etiquetas de datos se selecciona Usar etiquetas de valor y /Aceptar/Aceptar
Figura N 26: Grfica de barras Etiquetas
Salida de Minitab
Grfico N 04 Grfico de barras Nmero de hijosCuadros de Frecuencias de Variables ContinuasLos sueldos mensuales en dlares de 60 empleados de la empresa Z.S.A., son los siguientes:440560335587613400424466565393
453650407376470560321500528526
570430618537409600550432591428
440340558460560607382667512492
450530501471660470364634580450
574509462380518480625507645382
Construir un cuadro de Frecuencias se aplica el procedimiento siguiente:Poblacin: Empleados de la empresa Z.S.A (n = 60)Variable: X = sueldo mensual en dlares.Datos: Xi = sueldo mensual en dlares Xi (i =1, 2, 3,.....,60) n =60 trabajadoresDeterminamos el mximo y mnimo de Xi, el sueldo ms alto (Xmax) y el sueldo mnimo (Xmin).X38 = Xmax = 667X17 = Xmin = 3211. Recorrido(R): Xmax Xmin = 667 321 =3462. Elegimos el nmero de Intervalos (m). Se puede considerar 5 15 intervalosSi aplicamos: Para calcular el nmero de clases de un cuadro de frecuencias podemos usar las siguientes expresiones frmulas:a) Raz cuadrada
b) Regla de Sturges m =1 + 3.322 Log(n)m=1 + 3.322 Log(60)m=7 intervalosc) Regla de Stockes
3. Determinar la amplitud de los intervalos (C)
Se puede redondear a 504. Construir los intervalos. Como Ci = 50, el recorrido se divide en 7 intervalos o segmentos, cuyo extremos son: I1 I2I3 I4 I5 I6 I7
320 370 420 470520 570 620 670
Utilizaremos un concepto matemtico de intervalo abierto (parntesis) y de intervalo cerrado (corchete). Donde (Li-1 Li] significa que est abierto por la izquierda y cerrado por la derecha, es decir que en cada intervalo no est incluida el extremo inferior (Li-1) pero si lo est el extremo superior (Li).Forma de expresar:Intervalo de clase(Li-1 Li]
320 370
370 420
420 470
470 520
520 570
570 620
620 670
Punto medio de cada intervalo, es la MARCA DE CLASE se denota con yi donde
5. Elementos de una cuadro de frecuencia, en toda cuadro de frecuencia se identifica los siguientes elementos:
a) Frecuencia absoluta (ni): Se denomina frecuencia absoluta del valor xi de la variable X, el nmero de veces ni que se repite ese valor.
b) Frecuencia relativa (hi): Se denomina frecuencia relativa del valor xi de la variable X la relacin por cociente entre el nmero de veces que aparece el valor xi y el nmero total de valores de la variable (N).
c)
Frecuencia absoluta acumulada (Ni): Se denomina frecuencia absoluta acumulada del valor a la suma de las frecuencias absolutas de los valores de la variable X anteriores o iguales a . Su valor es con j = 1......i
d)
Frecuencia relativa acumulada (Hi): Es la frecuencia absoluta acumulada dividida por el nmero total de valores de la variable. Su valor es =. De todas estas definiciones se extraen las siguientes deducciones: La suma de las frecuencias absolutas sin acumular es igual al nmero total de los (,= N) La ltima frecuencia relativa acumulada es el total de elementos (n). La suma de todos las frecuencias relativas acumular es igual La ltima frecuencia relativa acumulada es la unidad
La distribucin de frecuencias de una variable suele presentarse ordenadamente mediante la tabla de frecuencias siguiente:
Intervalos de clasesMarca de claseFrecuencia AbsolutasFrecuencias Absolutas Acumuladas Frecuencias RelativasFrecuencias Relativas Acumuladas
nKNk = n1+...+nK=n
Totalnni =n
Los intervalos son los siguientes: [Li-1 Li>
[L1 = obs. menor= 30.0L1 = L1 +IC = 48.4>
[L2 = 48.4L2 = 66.8>
[L3 = 66.8L3 = 85.2>
[L4 = 85.2L4 = 103.6>
[L5 = 103.6L5 = 122.0>
[L6 = 122.0L7 = 140.4>
Paso 5- Tabulacin de los datos (conteo de datos)Gasto mensual[Li-1 Li>Frecuencia absoluta niFrecuencia relativa hi %Frecuencia acumulada absoluta NiFrecuencia acumulada relativa Hi %
[ 30.0 48.4>25.7125.71
[ 48.4 66.8>822.861028.57
[ 66.8 85.2>1028.572057.14
[ 85.2 103.6>720.002777.14
[103.6 122.0>514.293291.43
[122.0 140.4]38.5735100.00
Nota: Creamos una nueva variable denominada Gastos en la columna C8 Paso 6- Tabulacin de los datos (conteo de datos) con Minitab. Seleccionamos Datos/ Codificar/ Numrico a numrico
Figura N 23: Codificar de Numrico a numrico
Pas 6- En la ventana Cdigo Numrico a numrico se ingresan los valores de los intervalos mencionando a que intervalo corresponde:
Figura N 24: En la ventana Cdigo Numrico a numrico se ingresan los valores
Pas 7- Mostrar los intervalos con sus respectivos frecuencias absolutas y relativas.Seleccionamos Estadsticas/Tablas/Cuentas de variables individuales seleccionamos C8: Gastos en la ventana de variables. Tambin Conteos/Porcentajes/Conteos acumulados y porcentaje acumulados.
Figura N 24: Cuentas de variables individuales
Figura N 25: Cuentas de variables: GastosF. REPRESENTACIN GRAFICA DE LA CUANTITATIVAS CONTINUA: Realizamos la tabulacin de la variable Gasto semanal procedemos a ejecutar en el Minitab
Calculo previos para tabular la variable 1. Histogramas Se utilizan para variables continuas o para variables discretas, con un gran nmero de datos, y que se han agrupado en clases. Paso 1.- Seleccionamos Grfica/Histograma
Figura N 25: Seleccionar Histogramas
Paso 2.- En la ventana Histograma seleccionamos simple/Aceptar
Figura N 26: Ventana Histogramas
Paso 3.- En la ventana Histograma simple en la ventana de Variables grficas: Gasto semanal
Figura N 27: Histograma simple
Paso 4.- Se selecciona Escala selecciona Tipo de escala Y
Figura N 28: Histograma Escala
Paso 5.- En la ventana Histograma Escala/tipo de escala Y/Porcentaje
Figura N 29: Histograma Escala
Paso 6.- Se ejecuta doble click en el Histograma en el eje de X
Grfico N 03: Histograma de Gasto semanal
Paso 7.- En la ventana Editar Escala se seccionamiento: Tipo de intervalo/Punto de corte. En Definicin de intervalo/posiciones de punto medio/punto de corte: 30:140.4/18.4/Aceptar
Amplitud del intervalo
Observacin Mxima
Observacin Mnima
Figura N 30: Histograma Escala
Grfico N 04: Histograma de Gasto semanal2. Histogramas Se construye con cada punto medio o marca de clase (Xi) de cada intervalo se levanta un segmento de altura igual a la respectiva Frecuencias Absolutas (ni hi).
Paso 1.- Se copia la marca de clase y frecuencia relativa
Frec. Relah = 0.00
Frec. Relah = 0.00
Se agrega una clase:131.2 + 18.4 = 149.6Se agrega una clase:39.2 18.4 =20.8
Figura N 31: Marca de clase y Frecuencia Relativa
Paso 2.- Seleccionamos Grfica/ Grfica de dispersin
Figura N 31: Grfica de dispersin
Paso 3.- En la ventana Grfica de dispersin con lnea de conexin
Figura N 32: Grfica de dispersin
Paso 4.- En la ventana Grfica de dispersin con lnea de conexin:Se agrega en la Variables Y: Frec. Rela y Variables X: Marca de Clase
Figura N 32: Grfica de dispersin con lnea de conexin
Pas 5.- En la Grfica de Frec. Rela vs Marca de ClaseDoble Crick en eje de Y en la frecuencia Relativa se muestra la venta Editar escala
Grfico N 05: Polgono de frecuencia de Gasto semanal
Pas 6.- En la venta Editar escala en el Rango de escala/Mnimo =0/ Aceptar
Figura N 32: Editar escala
Grfico N 05: Polgono de frecuencia de Gasto semanal
3. Polgonos Acumulativos de Frecuencias (Ojiva). Aquellos que se desarrollan mediante la marca de clase que tiene coincidencia con el punto medio de las distintas columnas del histograma. En el momento de la representacin de todas las frecuencias que forman parte de una tabla de datos agrupados, se genera el histograma defrecuencias acumuladasque posibilita la diagramacin del polgono correspondiente.
Paso 1.- Seleccionamos Grfica/Histograma
Figura N 33: Seleccionar Histogramas
Paso 2.- En la ventana Histograma seleccionamos simple/Aceptar
Figura N 34: Ventana Histogramas
Paso 3.- En la ventana Histograma simple en la ventana de Variables grficas: Gasto semanal
Figura N 35: Histograma simple
Paso 4.- Se selecciona Escala selecciona Tipo de escala Y
Figura N 36: Histograma Escala
Paso 5.- En la ventana Histograma Escala/tipo de escala Y/Porcentaje
Figura N 37: Histograma Escala
Pas 6.- Doble Click en eje de Gasto mensual donde se presenta la ventana Editar escala
Grfico N 06: Polgono de frecuencia Acumulada
Pas 7.- En la ventana de Editar Escala/Tipo intervalo/Punto de cortePosiciones de punto medio/punto de corte: 30:140.4/18.4 Aceptar
Figura N 38: Ventana de Editar Escala
Grfico N 06: Polgono de frecuencia Acumulada
4. Diagrama de Tallos y hojas: Permite obtener simultneamente una distribucin de frecuencias de la variable y su representacin grfica. Para construirlo basta separar en cada dato el ltimo dgito de la derecha (que constituye lahoja) del bloque de cifras restantes (que formar eltallo).
Paso 1.- Seleccionamos Tallo y Hoja.
Figura N 38: Seleccionar Tallo y Hoja
Grficos Estadsticos
Primero definir lo que es un grfico o diagrama en estadstica.
Un diagrama es una especie de esquemtico, formado por lneas, figuras, mapas, utilizado para representar, bien datos estadsticos a escala o segn una cierta proporcin, o bien los elementos de un sistema, las etapas de un proceso y las divisiones o subdivisiones de una clasificacin. Entre las funciones que cumplen los diagramas se pueden sealar las siguientes:
Hacen ms visibles los datos, sistemas y procesos Ponen de manifiesto sus variaciones y su evolucin histrica o espacial. Pueden evidenciar las relaciones entre los diversos elementos de un sistema o de un proceso y representar la correlacin entre dos o ms variables. Sistematizan y sintetizan los datos, sistemas y procesos. Aclaran y complementan las cuadros y las exposiciones tericas o cuantitativas. El estudio de su disposicin y de las relaciones que muestran pueden sugerir hiptesis nuevas.
Algunos de los diagramas ms importantes son el diagrama en rbol, diagrama de reas o superficies, diagrama de bandas, diagrama de barras, diagrama de bloques, diagrama circular, diagrama circular polar, diagrama de puntos, diagrama de tallo y hoja diagrama, histogramas y grficos de caja y bigote o boxplots.Clasificacin De Los GrficosLos grficos podemos clasificarlos en la siguiente forma:A. Grficos de coordenadas ortogonales. Con divisiones equidistantes: Cronodiagrama, historiograma, histograma y polgono acumulativo, grfico en Z, grfico en escalera, grfico de banderola, grfico mixto (La Banda Flaman), curva de frecuencia, estereograma, grfico de Gantt, grfico de barras, etc Con divisiones semi-equidistantes: Cuadriculado logartmico y semi-logartmico.
B. Grficos de coordenadas seudo-ortogonales.C. Grficos de coordenadas no ortogonales.Grficos de coordenadas polares, grfico en espiral, grfico triangular equiltero, etc.D. Grficos sin coordenadas. De superficies: Grficos de sectores, grficos geomtricos diversos. De volmenes: Cubo, esfera, etc. De figuras (pictrico). Cartograma de sealizacin y densidad.E. GRFICOS DE LA DISTRIBUCIN DE FRECUENCIASAbscisasOrdenadas
Las frecuencias (ni, hi, Ni, Hi) siempre son cantidades no negativas ( 0), por lo tanto el grafico de las frecuencias sean para variables discretas como para variables continuas, se construye en el primer cuadrante del plano cartesiano o rectangular. En eje de las abscisas (horizontal) se indican los valores de la variable (sean puntos o intervalos), y en el eje de las ordenadas (vertical) se anota el valor de la respectiva frecuencia.i. Frecuencias de variable DiscretaLa representacin grfica de las (ni hi) se hace mediante el Diagrama de Frecuencia. Par el efecto, en el eje horizontal se representan los valores Yi, y en el eje verticales representa los valores de las frecuencias (ni hi) Opinin de los ClientesFrecuencia AbsolutasAGOPV0510152061018212ni
Opinin de los ClientesFrecuencia absoluta niFrecuencia Relativa hi %
A612,5
G1020,8
O1837,5
P24,2
V1225,0
Total48100,0
Al considerar las frecuencias absolutas acumuladas o relativas acumuladas, la representacin grfica se hace mediante el GRFICO ACUMULATIVO DE FRECUENCIAS. En el eje horizontal se colocan los valores de la Marca de Clase (Xi), y en el eje vertical los valores Ni Hi, a continuacin, a partir de cada extremo de los segmentos se traza tramos horizontales formando una escalera como se aprecia en el siguiente grafico Intervalos de clases
(Li-1 L]Marca de claseXiFrecuencia AbsolutasniFrecuencias Absolutas AcumuladasNi
16 2721,533
27 3832,558
38 4943,51018
49 6054,5321
60 7165,5829
71 8276,5736
82 9387,5440
Total40
En el caso de Grficos de Barras, en el eje horizontal representa los valores de Yi, y en el eje vertical se presentan los valores de las frecuencias Absolutas (ni hi)
Opinin de los ClientesFrecuencia absoluta niFrecuencia Relativa hi %Convierten hi %A GradosEn Grados
A612,5
45.0
G1020,8
74.9
O1837,5135.0
P24,216.3
V1225,091.8
Total48100,0
Para los Grficos de Sectores Circulares Pastel, se convierten los valores de las frecuencias Absolutas (ni hi) a grados mediante
ii. Frecuencias de variable ContinuaEn el caso ms general, las variables continuas se agrupan en cuadros de frecuencias con intervalos, por lo tanto se trata de representar grficamente intervalos en el eje horizontal.La representacin grfica de las frecuencias (absolutas o relativas) se hace mediante el Histograma de Frecuencias, que est constituido por un conjunto de rectngulos, cuya base es igual a la amplitud de un intervalo y la altura igual a la respectiva frecuencia. Para construir el histograma de frecuencias, se indican en el eje horizontal Intervalos de clases
(Li-1 L]Frecuencia Absolutasni
16 273
27 385
38 4910
49 603
60 718
71 827
82 934
Total40
024681001627384960718293Lmite inferiorFrecuencia Absolutas
ni
Otro grfico que se usa para representar las frecuencias es el Polgono de Frecuencias, que se construye como sigue: en cada punto medio o marca de clase (Xi) de cada intervalo se levanta un segmento de altura igual a la respectiva frecuencias Absolutas (ni hi), luego une los extremos con una lnea poligonal, resultando el Polgono de Frecuencias. Para completar los extremos, se extiende el polgono en media amplitud de cada extremo.
Intervalos de clases
(Li-1 L]Marca de claseXiFrecuencia Absolutas024681012010.521.532.543.554.565.576.587.598.5Frecuencia AbsolutaMarca de clase
ni
10.50
16 2721,53
27 3832,55
38 4943,510
49 6054,53
60 7165,58
71 8276,57
82 9387,54
98.50
Total40
Por su parte, las frecuencias acumuladas (Absolutas o Relativas) se grafican mediante los Polgonos Acumulativos de Frecuencias (Ojiva). De igual manera, en el eje horizontal se ubican los extremos los intervalos y en el eje vertical lo valores de Ni, Hi. En el extremo superior de cada intervalo se levanta un segmento de altura igual a la respectiva frecuencia absoluta, luego partiendo del extremo inferior del primer intervalo se une, con segmentos de recta, los extremo de los segmentos verticales, obteniendo una lnea poligonal que, a partir de la ltima frecuencia acumulativa, se extiende paralelamente al eje horizontal, obtenindose la grfica del Polgono Acumulativo de Frecuencias Intervalos de clases05101520253035404501627384960Intervalo de ClaseFrecuencias Absolutas Acumuladas
718293
9715540,08330,9000
[1010 1088>10496600,10001,0000
Total601,0000
El Polgono de Frecuencias Absolutas.Para graficar el polgono de frecuencias se realiza algunos clculos
Vida til en horas
[Li-1 Li>Marca de claseNmero de Bombillas
xini
5810
[620 698>6594
[698 776>7377
[776 854>81523
[854 932>89315
[932 1010>9715
[1010 1088>10496
11270
Total60
GRAFICO N 01POLGONO DE FRECUENCIA DE LA VIDA TIL EN HORAS DE UNA MUESTRA ALEATORIA DE 60 BOMBILLAS DE LUZ DE 100 WATTS
b) Una vez clasificadas; determine el porcentaje de bombillas cuyas vidas tiles oscilan entre 700 y 1000 horas.Vida til en horas
[Li-1 Li>Nmero de BombillasFrecuencia RelativaFrecuencia Relativa
nihihi %
[620 698>40,06676,667
[698 776>70,116711,667
[776 854>230,383338,333
[854 932>150,250025,000
[932 1010>50,08338,333
[1010 1088>60,100010,000
Total601,0000100,000
Calculamos el nmero de observaciones pedido:698 a 77611,666677811,6667 698 a 700 x 2 xPara encontrar el valor 698 a 700 = 11,6666667 0,2991453 = 11,3675214932 a 10108,3333788,333932 a 1000 x 68 xPara encontrar el valor 700 y 1000 horas. = 11,368 + 38,333 + 25,000 + 7,265 = 81,966% El 15 % ms durables en la categora A Basta calcular el percentil 15 y el percentil 85
Ejemplo 2. En la siguiente distribucin de frecuencias relativas calcular:a) Las desviacin cuartillitab) Discutir el sesgo y la kurtosisTiempo 0 33 66 99 1212 1515 18
hi0,040,060,400,380,100,02
SolucinTiempoXihiHixi hixi2 hi
0 31,50,040,040,060,09
3 64,50,060,100,271,215
6 97,50,400,503,0022,5
9 1210,50,380,883,9941,895
12 1513,50,100,981,3518,225
15 1816,50,021,000,335,445
Total1989,37
Directamente de la tabla: media aritmtica
Varianza Desviacin estndar S = 2,89309523
a) Las desviacin cuartillita
b) Discutir el sesgo y la kurtosis
No podemos concluir que la distribucin sea simtrica. En efecto, como la media est a la derecha de la moda la distribucin es sesgada a la derecha y usando el primer Coeficiente de Pearson tenemos:
Como Sk > 0 la distribucin es ligeramente sesgada a la derecha
Como es K>0.263, puede considerarse la distribucin que es Leptocrtica
Ejemplo 3. Al investigar el nivel socioeconmico en los valores: Bajo (B), Medio (M), Alto (A),20 familias dieron las siguientes respuestas:M, B, B, M, A, B, B, M, M, B, M, B, B, A, M, B, M, A, M, B.Construir la distribucin de frecuencias y trazar su grfica.Nivel socioeconmicoFrecuencia AbsolutaFrecuencia Relativa
Medio840,0
Bajo945,0
Alto315,0
Total 20100
VII. CAPITULO Regresin y Correlacin Lineal
2. Regresin y Correlacin LinealSon dos herramientas para investigar la dependencia de una variable dependiente Y en funcin de una variable independiente X. Y = f(X)Y = Variable dependiente que se desea explicar o predecir, tambin se llama regresor o respuestaX = Variable independiente, tambin se llama variable explicativa, regresor o predictorRegresin lineal - La relacin entre X y Y se representa por medio de una lnea rectaRegresin curvilinea - La relacin entre X y Y se representa por medio de una curva.
La ecuacin de la recta es la siguiente:
El trmino de error es la diferencia entre los valores reales observados Yi y los valores estimados por la ecuacin de la recta. Se trata de que estos sean mnimos, para lo cual se utiliza el mtodo de mnimos cuadrados.Se trata de minimizar la suma de todos los errores o residuos:Las frmulas resultado de la minimizacin de lo cuadrados del error se aplicarn en el siguiente ejemplo por claridad. Se tienen los siguientes supuestos:
1. Los errores o residuos se distribuyen normalmente alrededor de la recta de regresin poblacional2. Las varianzas de los errores son las mismas en todos los valores de X (Homoscedasticidad) en caso contrario se tiene (Heteroscedasticidad)3. Los errores o residuos son independientes: No se muestra algn patrn definido.
El coeficiente de Correlacin r desarrollado por Carl Pearson es un indicador de la fuerza de la relacin entre las variables X y Y, puede asumir valores entre -1 y 1 para correlacin negativa y positiva perfecta respectivamente. Por ejemplo si se encuentra que la variable presin tiene una correlacin positiva con el rendimiento de una caldera, se deben buscar soluciones al problema mediante acciones asociadas con la variable presin; de lo contrario, sera necesario buscar la solucin por otro lado.
Se identifican tres medidas de desviacin como sigue:
Ejemplo: Se sospecha que el tiempo requerido para hacer un mantenimiento preventivo est relacionado con su nmero. Calcular el coeficiente de correlacin y graficar. Los datos de tiempo tomados para n = 25 servicios se muestran a continuacin:
X ServiciosY Tiempo(Xi-X)*(Yi-Y)(Xi-X) 2(Yi-Y)2YestError
29.95119.07667238.9376364.153310.91990.9408
824.451.0998720.057621.002128.336215.1022
1131.757.4994727.61767.383237.044328.0292
1035.0010.5022723.097635.607534.14160.7369
825.020.9630720.057616.102628.336210.9969
416.8651.61267217.9776148.177116.72530.0181
214.3891.43347238.9376214.704510.919911.9721
29.60121.26067238.9376377.633710.91991.7422
924.35-3.5589280.577621.928631.238947.4563
827.500.3678720.05762.349528.33620.6991
417.0850.67987217.9776142.869416.72530.1258
1137.0021.9894727.617663.476337.04430.0020
1241.9548.56867214.1376166.854139.94704.0121
211.66108.40627238.9376301.814210.91990.5477
421.6531.30307217.977654.505716.725324.2523
417.8947.24547217.9776124.162016.72531.3564
2069.00470.014272138.29761,597.377163.168634.0052
110.30135.62547252.4176350.91788.01725.2111
1034.9310.3790723.097634.777034.14160.6216
1546.59118.68667245.6976308.255348.65514.2646
1544.88107.12707245.6976251.133748.655114.2512
1654.12194.67667260.2176629.367651.55786.5649
1756.63241.75147276.7376761.605454.46054.7068
622.1315.4622725.017647.648622.53070.1606
521.1525.54027210.497662.138519.62802.3164
206725.822,027.7132698.56006,105.9447220.0926
SxySxxSyy = SSTSSE
X promedioY Promedio
SxySxxSyy
Si todos los puntos estuvieran completamente sobre la recta la ecuacin lineal sera y = a + bx. Como la correlacin no siempre es perfecta, se calculan a y b de tal forma que se minimice la distancia total entre puntos y la recta. Los clculos tomando las sumas de cuadrados siguientes se muestran a continuacin:
Sxy = 2027.71Sxx = 698.56Syy = 6105.94
Las ecuaciones para el clculo manual son las siguientes:
= 2.902704421
= 5.114515575
Las sumas de cuadrados son:
6,105.9447
220.0926
5,885.8521
El coeficiente de determinacin r2 y el coeficiente de correlacin r se calculan a continuacin:
= 0.9639
El coeficiente de determinacin indica el porcentaje de la variacin total que es explicada por la regresin.
= 0.9816
El coeficiente de correlacin proporciona el nivel de ajuste que tienen los puntos a la lnea recta indicando el nivel de influencia de una variable en la otra. El factor de correlacin r es un nmero entre 1 (correlacin negativa evidente) y +1 (correlacin positiva evidente), y r = 0 indicara correlacin nula.
El coeficiente de correlacin r = 0.98 por lo cual tenemos suficiente evidencia estadstica para afirmar que el tiempo de atencin est relacionado con el nmero de servicios atendidos.
EJERCICIOS:1. La energa consumida en un proceso depende del ajuste de mquinas que se realice, realizar una regresin cuadrtica con los datos siguientes y responder las preguntas.Cons_energaAjuste Mq.
YX
21.611.15
415.7
1.818.9
119.4
121.4
0.821.7
3.825.3
7.426.4
4.326.7
36.229.1
a. Trazar un diagrama de dispersinb. Obtener la ecuacin de regresin lineal y cuadrtica y compararc. Estimar el consumo de energa para un ajuste de mquina de 20 con regresin cuadrticad. Obtener los intervalos de prediccin y de confianza para un ajuste de mquina de 20e. Obtener el coeficiente de correlacin y de determinacin
2. En base al porcentaje de puntualidad se trata de ver si hay correlacin con las quejas en una lnea area. Las quejas son por cada 100000 pasajeros.%puntosQuejasa. Trazar un diagrama de dispersinb. Obtener la ecuacin de regresin lineal c. Estimar las quejas para un porcentaje de puntualidad de 80%d. Obtener los intervalos de prediccin y de confianza para una altura de 63"e. Obtener el coeficiente de correlacin y de determinacin
AerolneaXY
A81.80.21
B76.60.58
C76.60.85
D75.70.68
E73.80.74
F72.20.93
G70.80.72
H68.51.22