Unidad 1 Conceptos Básicos, Gráficos y Tablas de Frecuencia

download Unidad 1 Conceptos Básicos, Gráficos y Tablas de Frecuencia

of 27

Transcript of Unidad 1 Conceptos Básicos, Gráficos y Tablas de Frecuencia

  • 8/17/2019 Unidad 1 Conceptos Básicos, Gráficos y Tablas de Frecuencia

    1/27

    TECSUP - PFR Estadística y Probabilidades  

    55

    UUNNIIDD A ADD II 

    EESSTT A ADDÍÍSSTTIICC A A 

    1.  INTRODUCCIÓN

    El uso de los métodos estadísticos para analizar datos se ha convertido en unapráctica común en todas las disciplinas científicas. Este material de ayudapretende introducir métodos que utilizan los estudiantes en sus carreras deformación tecnológica.

    La exposición matemática es relativamente modesta. El uso sustancial delcálculo se hace sólo en el capítulo de probabilidades. No se utiliza álgebramatricial en absoluto. Por lo tanto, casi toda la exposición deberá ser accesiblepara aquellos estudiantes cuyo conocimiento en matemática es básico.

    La unidad 1 se inicia con algunos conceptos y terminología básicos (población,muestra, estadística descriptiva e inferencial, variables y tipos) y continúa con laelaboración de tablas de frecuencia para variables cualitativas y cuantitativas ygráficos importantes. La unidad 2 corresponde a las medidas resumen de

    posición y de dispersión. La unidad 3 se estudia el análisis de dos variables:cualitativas vs cualitativas, cualitativas vs cuantitativas y cuantitativas vscuantitativas, además de gráficos importantes. En el capítulo 4 se ofrece eldesarrollo un tanto tradicional de la probabilidad, la probabilidad condicional, laprobabilidad total y el teorema de Bayes.

    1.1  POBLACIÓN Y MUESTRA

     A fin de entender cómo se puede aplicar los métodos estadísticos, se debedistinguir entre población y muestra. Una población o universo escualquier colección finita o infinita de individuos o elementos, para cadauno de los cuales se tiene que contar o medir una o varias características.Los elementos son los objetos que poseen la información que busca elinvestigador y acerca del cual deben hacerse las inferencias. Entreposibles elementos se tiene: una sustancia, un compuesto, un mineral,etc.

     Aunque existe la libertad de llamar población a un grupo cualquiera deelementos definidos en el tiempo y el espacio, en la práctica depende delcontexto en el cual se observarán los elementos. Suponga, por ejemplo, el

    número de total de compuestos que pueden elaborarse con 5 sustancias,puede considerarse como una población.

  • 8/17/2019 Unidad 1 Conceptos Básicos, Gráficos y Tablas de Frecuencia

    2/27

    Estadística y Probabilidades TECSUP - PFR

    56

    Una muestra es un subconjunto de elementos de la población quepuede servir de base para generalizaciones válidas En trabajos

    químicos, se toman muestras de un material, se ensayan y se hacendeducciones para la totalidad de dicho material, a partir de losresultados obtenidos. La muestra no es exactamente la población,sino que se supone que la representa, y la validez de cualquierconclusión obtenida de ella depende de la verdaderarepresentatividad que tenga.

    La muestra debería ser seleccionada en forma aleatoria, es decir,ca- da elemento tiene una probabilidad conocida y no nula deselección. No siempre es posible obtener una muestra aleatoria.Esto es especialmente cierto cuando el estadístico puede confiar ensu propio “juicio” o “conveniencia” al seleccionar los elementos de lamuestra. Con la aleatoriedad se per- sigue que la muestra sea “representativa” de la población, para que concentre todas las

    características y particularidades de interés. Sin embargo, laaleatoriedad no garantiza necesariamente la representatividad.

    Los factores que determinan la selección de muestras son: costo,tiempo y la imposibilidad práctica (o destrucción de la unidad deestudio). En tanto, el tamaño de la muestra queda determinado porla variabilidad de la población, el nivel de confianza y el errormáximo permisible. Cuando los elementos de una población tienencierto grado de heterogeneidad entre ellos, el tamaño de la muestratiende a ser grande. Cabe destacar, que es completamente erróneoasegurar que la muestra depende del tamaño de la población.

    Cuando se hace una investigación con todos los elementos de la población,se llama censo o enumeración total. En tanto, cuando se ela- bora conbase en una muestra, se le denomina estudio por muestreo. En la mayoríade los casos los químicos no están interesados en los datos deenumeración total (o censo) sino en datos muestrales.

    1.2  ESTADÍSTICA

    Disciplina que nos proporciona un conjunto de métodos y procedimientosque nos permitan recopilar, clasificar, presentar y describir datos enforma adecuada para tomar decisiones frente a la incertidumbre opredecir o afirmar algo acerca de la población a partir de los datosextraídos de la misma.

  • 8/17/2019 Unidad 1 Conceptos Básicos, Gráficos y Tablas de Frecuencia

    3/27

    TECSUP - PFR Estadística y Probabilidades  

    57

     Esta definición nos permite distinguir la Estadística Descriptiva de laInferencial.

    La estadística descriptiva  se puede definir como los métodosestadísticos que pretenden describir las características más importantesde un conjunto de datos, sea que provenga de una muestra o de unapoblación. Utiliza técnicas estadísticas, como la representación gráfica,cuadros estadísticos, medidas de posición y de variabilidad.

    Uno de los propósitos fundamentales de los métodos estadísticos esutilizar estadísticos muestrales para estimar los parámetros de lapoblación. A este proceso de utilizar los estadísticos muestrales parallegar a conclusiones acerca de los verdaderos parámetros de la

    población, se le llama inferencia estadística.La estadística inferencial generaliza los resultados observados en unamuestra a toda la población bajo estudio, por medio del planteamiento ypruebas de hipótesis y cálculo de intervalos de confianza; se aplica a pro-blemas como estimar, mediante pruebas, el rendimiento promedio de unproceso químico, verificar las especificaciones de producción a partir demediciones efectuadas sobre muestras o predecir los residuos de cloro enuna piscina basándose en una muestra de datos tomados en ciertosperio- dos de tiempo.

    1.3  CICLO METODOLÓGICO DE UN TRABAJO ESTADÍSTICO

    Cuando no sea posible obtener una información completa de la población,se extraen muestras representativas de dicha población mediante lastécnicas de muestreo, y en base al estudio o información obtenidas de losdatos muestrales se afirma algo acerca de la población total o se tomandecisiones generales confiables con ayuda de la Estadística Inferencial.

    Este ciclo se cumple en la mayoría de las veces del quehacer estadístico

  • 8/17/2019 Unidad 1 Conceptos Básicos, Gráficos y Tablas de Frecuencia

    4/27

    Estadística y Probabilidades TECSUP - PFR

    58

    1.4   VARIABLES

    Se dice que algo varía si puede tomar por lo menos dos valores, gradoso formas o, incluso, cuando una característica puede estar presente oausente en una situación específica.

    Dicho esto, podríamos estar de acuerdo en que nociones como sexo,número de hijos por familia, color de automóvil, número de huelgas

  • 8/17/2019 Unidad 1 Conceptos Básicos, Gráficos y Tablas de Frecuencia

    5/27

    TECSUP - PFR Estadística y Probabilidades  

    59

    anuales, nivel de estudios, etc., son variables, ya que son característicasque admiten por lo menos dos valores, grados o formas dentro de ununiverso determinado.

    No obstante, la práctica docente enseña que, al empezar a familiarizarsecon este tema, los alumnos suelen confundir la característica que admitevariaciones con el universo o con los elementos del mismo. Compáresela lista del párrafo anterior con esta otra: persona, vivienda, lámpara,automóvil. Estos términos se refieren a objetos y no a características deobjetos; por lo tanto, no son variables. Variables serían lascaracterísticas que quisiéramos indagar de esos objetos. Por ejemplo, deun universo formado por personas podríamos conocer su edad, lugar denacimiento, nivel de escolaridad, clase social a que pertenecen, etc.Estas peculiaridades son variables. También son variables, de ununiverso formado por automóviles, su marca, modelo, color, potencia,

    etc., ya que son características que van cambiando de auto en auto.Otra confusión frecuente se da con los datos estadísticos.

    Consideremos estos ejemplos: "número de huelgas" y "producción deazúcar". Si decimos que el número de huelgas en una región y en unperiodo determinados es A, estamos aportando información global delfenómeno, que es un dato estadístico, no una variable. El número dehuelgas se convierte en variable si se estudia, digamos, en un periododeterminado y en diferentes regiones, o en una sola región y endiferentes periodos (anualmente, sexenalmente, etc.). Lo mismo pasa siafirmamos que la producción de azúcar en el ingenio X es B toneladas:se trata de un dato estadístico, no de una variable. La producción de

    azúcar se convertirá en variable cuando se indague en diferentesfábricas y en un mismo momento o en una misma fábrica y en distintosmomentos.

     Ahora bien, toda variable tiene dos niveles: uno conceptual o teórico yotro operacional o de medición. Si nos preguntaran qué se entiende poralcoholismo, por ejemplo, podríamos decir que se trata de unaenfermedad progresiva y mortal, exclusiva de los seres humanos, queconsiste en la ingestión de bebidas alcohólicas. De ser más o menoscorrecta esta definición, estaríamos en el nivel estrictamente conceptualo teórico, que no permite efectuar ninguna medición. Si, en cambio, a

    partir de este concepto definimos al alcoholismo como el grado dedependencia de los seres humanos respecto a la ingestión de bebidasalcohólicas, habremos pasado del nivel conceptual a otro donde esposible medir, pues en una población dada encontraríamos desde el queno ha bebido jamás una gota de alcohol, el abstemio, hasta el que nopuede dejar de beber.

    La correspondencia entre el nivel teórico y el operacional de una variablese consigue mediante un procedimiento llamado medición, que no debeentenderse como un procedimiento arbitrario de asignación de númerosu otros símbolos a las observaciones: esta asignación se efectúa enconcordancia con un conjunto de procedimientos admisibles para la

    variable conceptual que sé esté manejando.

  • 8/17/2019 Unidad 1 Conceptos Básicos, Gráficos y Tablas de Frecuencia

    6/27

    Estadística y Probabilidades TECSUP - PFR

    60

     A nivel operacional o de medición, variable es un conjunto de números uotros símbolo; asignados a las observaciones, que sirven paraclasificarlas con respecto a una variable conceptual Sin embargo, no

    ahondaremos en esta cuestión; será suficiente, por ahora, que sepamosidentifica] variables, ya que del tipo a que pertenezcan dependerá elprocedimiento estadístico con que se le; trate, tema que estudiaremosmás adelante.

    Tipos de variables

    Según su naturaleza las variables pueden clasificarse en:

    a) Variables cuantitativas, son aquellas que consisten de númerosque representan conteos o mediciones. Las variables cuantitativaspueden ser: Discreta, corresponde al conteo o numeración de sucesos.Ejemplos: número de computadores en un aula, número de artículosdefectuosos en un embarque, número de hijos por familia, etc.Continua, corresponde a “mediciones” y por tanto sus valores estáncomprendidosen un intervalo ya que entre dos valores existen infinitosvalores intermedios.Ejemplos: contenido neto en gramos en una lata de café, diámetro deun tornillo, ingreso familiar, etc.

    b) Variables cualitativas  se dividen en diferentes categorías que sedistinguen por alguna característica no numérica. Ejemplos: genero,nivel socio económico, grado de instrucción, etc.Observación: Los datos pueden estar “codificados” numéricamente, sinque ello signifique que sea una variable cuantitativa.Ejemplo. Clasifica las siguientes variables:

      Marca de detergente que una ama de casa usa.  El grado de instrucción.  Número de artículos defectuosos producidos por una máquina en

    un periodo de dos horas.  La longitud de 1000 tornillos con arandela y tuerca.

    Según la función que cumplen en el estudio:

    Una distinción de particular importancia es aquella entre variablesdependientes e independientes. Los términos “dependiente” eindependiente” se utilizan para representar una relación de “causalidad”entre dos variables.El problema de la determinación de causalidad (¿cuáles variables sondependientes y cuáles independientes?) es uno de los problemas másserios que enfrenta la estadística. El análisis empírico o estadístico sólo

  • 8/17/2019 Unidad 1 Conceptos Básicos, Gráficos y Tablas de Frecuencia

    7/27

    TECSUP - PFR Estadística y Probabilidades  

    61

    puede decirnos si dos variables parecen estar relacionadas, pero nopuede decirnos: (a) si de hecho existe una relación de dependencia y(b) cuál es la dirección de dicha relación (cuál es la “causa” y cuál el

    efecto o la variable “causada”).  Necesitamos una “teoría” para darplausibilidad a una relación empírica.

    Independiente (X):Una variable independiente es aquella cuyo valor no depende del de otravariable. La variable independiente se representa en el eje de abscisas.Son las que el investigador escoge para establecer agrupaciones en elestudio, clasificando intrínsecamente a los casos del mismo.Es aquella característica o propiedad que se supone ser la causa delfenómeno estudiado. En investigación experimental se llama así a lavariable que el investigador manipula.

    Dependiente (Y):Una variable dependiente es aquella cuyos valores dependen de los quetomen otra variable. La variable dependiente en una función se suelerepresentar por y. La variable dependiente se representa en el ejeordenadas. Son las variables de respuesta que se observan en el estudioy que podrían estar influidas por los valores de las variablesindependientes.Hayman (1974 : 69) la define como propiedad o característica que setrata de cambiar mediante la manipulación de la variable independiente.La variable dependiente es el factor que es observado y medido paradeterminar el efecto de la variable independiente.Considere la siguiente cuestión: ¿Es el aumento del ingreso per capita deun país que causa mejoras en el nivel de educación o la mejora en elnivel de educación que causa mejoras en el ingreso per capita? ¿O talvez un tercer factor es la causa de ambos? ¿Cultura? Este complejo yviejo debate no se puede resolver sólo sobre la base del análisisestadístico, aunque la estadística es un importante instrumento ennuestros continuos esfuerzos por dilucidar estas cuestiones. El debatemencionado ha persistido por décadas, además, porque muchas de lasteorías que han sido propuestas para explicar la relación entre educacióny desarrollo económico no pueden ser refutadas sólo sobre la base delanálisis empírico.

    ESCALAS DE MEDICIÓNLa medición de una variable consiste en asignar un “valor” a la característica opropiedad observada. Por ejemplo, si la característica observada es el génerode las personas, al clasificar a una persona como de sexo “femenino” leestamos asignando un valor, estamos haciendo una medición de lacaracterística.El proceso de medición utiliza diversas escalas: Nominal, Ordinal, Intervalo yRazón.Escala Nominal:  Sólo permite asignar un nombre, etiqueta o valor alelemento sometido a medición. Los números que se puedan asignar a las

    propiedades observadas en los elementos se utilizan sólo como “etiquetas” con

  • 8/17/2019 Unidad 1 Conceptos Básicos, Gráficos y Tablas de Frecuencia

    8/27

    Estadística y Probabilidades TECSUP - PFR

    62

    la finalidad de clasificarlos. Con esta escala no tiene sentido realizaroperaciones aritméticas.Por ejemplo:

    Género (femenino, masculino), nacionalidad (peruano, colombiano, etc.),marcas de gaseosa preferida (fanta, coca cola, pepsi etc).Escala Ordinal: Además de asignar un nombre, etiqueta o valor, esta escalapermite establecer un orden entre los elementos sometidos a medición. Conesta escala solo se puede establecer una relación de orden. Los números quese asignen a las propiedades deben respetar el orden de la característica que semide.Cada categoría puede ser comparada con otra en relación de “mayor que” o “menor que”. Por ejemplo:Grado de satisfacción (alto, medio, bajo), estado de salud (bueno, regular,

    malo), grado de instrucción (primaria, secundaria, superior).Escala de Intervalo: Además de asignar un nombre o etiqueta y establecerun orden entre los elementos, esta escala permite calcular diferencias entre losnúmeros asignados a las mediciones (el intervalo entre observaciones que seexpresa en términos de una unidad fija de medida).Los datos de intervalo siempre son numéricos.En esta escala el cero es relativo, es decir, no indica la ausencia de lacaracterística medidaPor ejemplo:Temperatura (se puede medir en grado Celsius ó grado Fahrenheit), añocalendario (el año puede referirse al calendario gregoriano ó calendario chino),en el caso de la escala de intervalos podemos asignar el cero a cualquier valorposible (el cero es arbitrario).

    Escala de Razón: Una variable está medida en escala de razón si los datostienen todas las propiedades de los datos de intervalo y el cociente de los dosvalores es significativa. La escala de medición de razón tiene las propiedades dela escala de intervalo con la propiedad adicional de tener un punto de partidanatural o cero (cero absoluto), que indica que ausencia de la variable (no existenada para una variable).Para esta escala de medición, es posible establecer una relación deproporcionalidad entre sus distintos valores, es decir el cociente de los valoreses significativo.

    Por ejemplo:Costo de un automóvil, número de aprobados, número deartículos defectuosos.

  • 8/17/2019 Unidad 1 Conceptos Básicos, Gráficos y Tablas de Frecuencia

    9/27

    TECSUP - PFR Estadística y Probabilidades  

    63

    2. 

    ESTADÍSTICA DESCRIPTIVA

    La estadística descriptiva se ocupa de la recopilación, clasificación, presentación y

    descripción de los datos.RECOPILACIÓN

    Los datos pueden recopilarse de dos maneras fundamentales:

    a)  Si se consideran todos los elementos de la población y se registransus características se denomina censo.

    b) 

    Si se seleccionan algunos elementos de la población, pero no todos,se denomina muestra y la información obtenida por este

    procedimiento se llama por muestreo; si la recopilación de loselementos muestrales se efectúa al azar se dice que el muestreo esaleatorio y la muestra se denomina muestra aleatoria.

    Un ejemplo de una recopilación completa o censo es el Censo Poblacionaldel Perú realizado en el año 1993.

    CLASIFICACIÓN

    Los datos obtenidos por observación o medición suelen ser registrados enel orden en que se recopilan. Para facilitar su interpretación y el análisiscorrespondiente deben ser clasificados y esto equivale a que los datos

    deben ser organizados de alguna manera sistemática o particionado enclases bien definidas y una manera sencilla de hacerlo es ordenar losdatos según su magnitud o agruparlos de acuerdo a sus características.

    PRESENTACIÓN DE DATOS

    Una vez recolectados los datos y optado por su posible clasificación esnecesario presentarlos en forma tal que se facilite su comprensión y suposterior análisis. Para ello se ordenan en cuadros numéricos llamadosTABLAS (Tablas de frecuencias) y luego se presentan mediante GRÁFICAS(de barras, sectores circulares, histograma, polígono de frecuencias, ojiva,

    pictograma, etc.)

    ELABORACIÓN DE TABLAS SEGÚN LAS NORMAS APA

    Cualquier forma de presentación empleada en el trabajo tendrá que ser denominadaTabla o Figura. Según las normas APA, “generalmente las tablas exhiben valoresnuméricos exactos y los datos están dispuestos de forma organizada en líneas ycolumnas, facilitando su comparación" (APA, 2001, p. 133). Ya las figuras son “cualquier tipo de ilustración que no sea tabla. Una figura puede ser un cuadro, un

    gráfico, una fotografía, un dibujo u otra forma de representación”  (APA, 2001, p. 149).

  • 8/17/2019 Unidad 1 Conceptos Básicos, Gráficos y Tablas de Frecuencia

    10/27

    Estadística y Probabilidades TECSUP - PFR

    64

    Título de la tablaEl título de la tabla debe ser breve, claro y explicativo. Debe ser puesto arriba de latabla, en el margen superior izquierdo, debajo de la palabra Tabla (con la inicial en

    mayúscula) y acompañado del número con que la designa (las tablas deben serenumeradas con números arábigos secuencialmente dentro del texto y en sutotalidad). Ej.: Tabla 1, Tabla 2, Tabla 3, etc.

    Citar tablas en el cuerpo del texto Al citar tablas en el cuerpo del texto, escriba apenas el número correspondiente a latabla, por ejemplo: Tabla 1, Tabla 2, Tabla 3, etc. (la palabra Tabla tendrá que serpresentada con la inicial mayúscula)Nunca escriba "tabla abajo/arriba o tabla de la página xx, pues la numeración de laspáginas del trabajo puede ser alterada.

    Cuerpo de la fuente de la tablaTimes New Roman, tamaño 10.

    Fuente de las notas de la tablaTimes New Roman, tamaño 9.

    Notas de la tablaLas tablas presentan tres tipos de notas: notas generales, notas específicas y notas deprobabilidad. “Las notas son útiles para eliminar la repetición en el cuerpo de unatabla” (APA, 2001, p. 147). Ellas son presentadas en el margen izquierdo (sin sangría)debajo de la tabla (entre la tabla y la nota hay que inserir dos espacios). Y deben serordenadas en esta secuencia: nota general, nota específica y nota de probabilidad, ycada tipo de nota debe ser puesta en una línea nueva.

    Notas generales:   “Una nota general cualifica, explica u ofrece informacionesrelacionadas a la tabla como un todo y finaliza con una explicación de abreviaturas,símbolos y afines” (APA, 2001, p. 145).

    Nota específica se refiere a una columna, línea o ítem específico y debe ser indicadapor letra minúscula sobrescrita (a, b, c).

    Nota de probabilidad indica los resultados de pruebas significativos y se indican conasterisco sobrescrito (*).

  • 8/17/2019 Unidad 1 Conceptos Básicos, Gráficos y Tablas de Frecuencia

    11/27

    TECSUP - PFR Estadística y Probabilidades  

    65

     

    I.  TABLA DE FRECUENCIAS PARA VARIABLES CUALITITATIVAS 

    Se deberá representar en la tabla los diferentes valores que asume la variablecualitativa y en la columna de las frecuencias absolutas simples la cantidad de veces

    con las que aparece esta categoría de la variable. Si la variable cualitativa está medidaen escala ordinal, tendrá sentido mostrar las frecuencias acumuladas absolutas orelativas. Si la medición está hecha en escala nominal sólo deberá mostrarse lasfrecuencias absolutas simples y/o relativas.

    Por ejemplo:

  • 8/17/2019 Unidad 1 Conceptos Básicos, Gráficos y Tablas de Frecuencia

    12/27

    Estadística y Probabilidades TECSUP - PFR

    66

    Tabla 3. Calidad en el servicio en el servicio de atención al cliente. 

    Opinión Frecuencia Frecuencia relativa PorcentajeDeficiente 20 20/160 = 0.1250 0.125*100 = 12.50 %

    Bueno 35 35/160 = 0.2188 21.88 %

    Excelente 65 0.4063 40.63 %

    Otros 40 0.2500 25.00 %

    Total 160 1

    Fuente: Sabadini, (2013)

    II.  ELABORACIÓN DE FIGURAS SEGÚN LAS NORMAS APA

    Según la APA, “una figura es cualquier tipo de ilustración que no sea tabla. Una figurapuede ser un cuadro, un gráfico, una fotografía, un dibujo u otra forma derepresentación” (APA, 2001, p. 149).

    Tanto para las figuras como para las tablas el interlineados que se utiliza es sencillo(1,0) o de uno punto cinco (1,5). Esto en el contenido de las tablas y figuras como enlas notas de las tablas, título de tablas o figuras y leyendas. Según sea el caso.

    Título de la figura

    El título explica la figura de forma concisa, pero de forma discursiva. Debe ser puestodebajo de la figura, con números arábigos secuencialmente dentro del texto como untodo, precedido por la palabra Figura (con la inicial en mayúscula). Ej.: Figura 1, Figura2, Figura 3, etc.

    Cualquier otra información necesaria para elucidar la figura (como la unidad demedida, símbolos, escalas y abreviaturas) que no están incluidas en la leyenda,tendrán que ser colocadas luego del título.

    Cuerpo de la fuente de la figura

    Times New Roman, tamaño 10.

  • 8/17/2019 Unidad 1 Conceptos Básicos, Gráficos y Tablas de Frecuencia

    13/27

    TECSUP - PFR Estadística y Probabilidades  

    67

    Leyenda

    Se trata de la explicación de los símbolos empleados en la figura y debe ser puestodentro de los límites de la figura.

    Citar figuras en el cuerpo del texto

     Al citar figuras en el cuerpo del texto, escriba apenas el número correspondiente a lafigura, por ejemplo: Figura 1, Figura 2, Figura 3, etc. (la palabra Figura tendrá que serpresentada con la inicial mayúscula)

    Nunca escriba "figura abajo/arriba o figura de la página xx, pues la numeración de laspáginas del trabajo puede ser alterada.

    Figuras reproducidas de otra fuente

    Las figuras reproducidas de otra fuente deben presentar, debajo de la figura, lareferencia del autor original, aunque se trate de una adaptación.

    Ejemplos

    Nota Fuente: Sabadini, A. A. Z. P., Sampaio, M. I. C., & Koller, S. H. (2009). Publicarem psicologia: um enfoque para a revista científica (p.175). São Paulo: AssociaçãoBrasileira de Editores Científicos de Psicologia/Instituto de Psicologia da Universidadede São Paulo.

    Nota Fuente: Adaptado de Sabadini, A. A. Z. P., Sampaio, M. I. C., & Koller, S. H.(2009). Publicar em psicologia: um enfoque para a revista científica (p. 176). SãoPaulo: Associação Brasileira de Editores Científicos de Psicologia/Instituto de Psicologiada Universidade de São Paulo.

    III.  REPRESENTACIÓN GRÁFICA DE VARIABLES CUALITATIVAS

    1.  Diagrama de barras

    Un diagrama de barras es una gráfica para representar un conjunto de datoscualitativos que se han resumido en una distribución de frecuencias absolutas, relativaso porcentuales. En uno de los ejes de la gráfica, por lo general el eje horizontal, secolocan las categorías de la variable y en el otro eje de la gráfica (por lo general el ejevertical) se pueden usar las frecuencias absolutas, relativas o porcentuales. Luego, seconstruye una barra de ancho fijo en cada categoría y cuya altura corresponda a la

    frecuencia utilizada en el gráfico. Las barras deben estar separadas para enfatizar elhecho que las categorías no se superponen. 

  • 8/17/2019 Unidad 1 Conceptos Básicos, Gráficos y Tablas de Frecuencia

    14/27

    Estadística y Probabilidades TECSUP - PFR

    68

    Ejemplo:

    10.20%

    9.60%

    9.20%

    8.50%

    Horizonte Integra Unión vida Profuturo

     

    Figura 1. Rentabilidad por AFP del Sistema Privado de Pensiones. Fuente: Sabadini,

    (2013)

    2.  Diagrama circular

    El diagrama circular, también llamado diagrama de pie, es otra forma de representar ladistribución de frecuencias relativas o porcentuales. Para su construcción primero setraza un círculo y luego se divide en sectores circulares de forma proporcional a lafrecuencia relativa de cada categoría. Puesto que todo el círculo representa un ángulode 360º en total cada sector es el porcentaje correspondiente de dicho total, es decir,el ángulo del sector que le corresponde a cada categoría se obtiene multiplicando 360º

    por la respectiva frecuencia relativa.

    Ejemplo:

  • 8/17/2019 Unidad 1 Conceptos Básicos, Gráficos y Tablas de Frecuencia

    15/27

    TECSUP - PFR Estadística y Probabilidades  

    69

    TABLAS DE FRECUENCIA PARA VARIABLES CUANTITATIVAS

    Haremos algunas definiciones en base a un ejemplo: Clasificar los

    siguientes datos recopilados del número de cabezas de ganado vacunoque posee cada una de las 40 familias de las comunidades campesinas dela Sierra Central del Perú, tomados al azar.

    1 2 0 3 5 1 0 8 1 24 3 3 5 12 10 4 3 0 10

    0 0 4 9 0 1 3 13 1 35 4 6 8 11 0 1 3 8 0

       Alcance (A): es el intervalo definido por los datos de mayor y menorvalor.

    En el ejemplo:  A 0;13  

      Intervalos de clase ( Ii  ) y Límites de clase ( Li  ):  clasificar losdatos en k grupos equivale a particionar el alcance A en k clases o kintervalos Ii  ,donde: i=1, 2, ...,k y determinar cuántos datospertenecen a cada uno.

      1,   iii   L L I   , i=1, 2, ...,k

    Los intervalos semi-abiertos por la derecha I i   se denominan intervalos de

    clase.Los L i  , i=1, 2, ...,k+1 se denominan los límites de clase.

    El valor entero de k, fundamentalmente, depende del estadístico y/oinvestigador, pero es recomendable utilizar la regla de Sturges paradeterminar un valor aproximado de k:

    Donde “n” es el número total de datos disponibles. 

    La fórmula es un poco conservadora y nos da un número de intervalosun poco menor del que se utiliza en la práctica. Cuando el número dedatos es menor que 100, el número de intervalos se debe tomar menorque 10. Para un número de datos bastante grande, el número deintervalos es mayor que 10, la práctica aconseja los siguientes límites: 5 k  15 .

    En el ejemplo:

    k = 1 + 3,3 log(40) = 6,286

    3,3logn1k     

  • 8/17/2019 Unidad 1 Conceptos Básicos, Gráficos y Tablas de Frecuencia

    16/27

    Estadística y Probabilidades TECSUP - PFR

    70

    Luego k podrá tomar valores enteros: 5, 6 o 7

    Tomemos: k = 7 .

       Ancho de Clase ( Wi ): es la longitud de un intervalo de clase.

    iiii   L L I l W      1)(  

    Para conseguir anchos de clase iguales (W ), como es deseable; se usala siguiente relación:

    ,)(

     Al W    donde )( Al   es la longitud del alcance.

    En el ejemplo:

    13W 1,857

    7     tomamos W  = 2

      Frecuencia Absoluta (ni ): una vez decidido el valor de k y calculadoel ancho de clase. Mediante la tabulación se determina el número dedatos contenidos en cada clase y este número entero se denominafrecuencia absoluta( n i  )

    n i : frecuencia absoluta de i – ésima clase .

      Distribución de Frecuencias Absolutas:

    Tabla Nº1

    Cabezas de ganado Tabulación Nº de familias porclases

    Intervalos de clase oclases: I i  

    Frecuencias Absolutas:n i  

    [0; 2> 14[2; 4> 9

    [4; 6> 7

    [6; 8> 1

    [8; 10> 4

  • 8/17/2019 Unidad 1 Conceptos Básicos, Gráficos y Tablas de Frecuencia

    17/27

    TECSUP - PFR Estadística y Probabilidades  

    71

    [10; 12> 3

    [12; 14> 2

    TOTAL 40En el ejemplo: n = 40 , k = 7

    Se verifica que:

    1   in  14k

    n n n n n n n n 14 9 7 1 4 3 2 40 ni 1 2 3 4 5 6 7i 1

     

    n3= 3 , se lee: “la frecuencia absoluta de la tercera clase es”  Los intervalos de clase son:

                      I 0;2 , I 2;4 , I 4;6 , I 6;8 , I 8;10 , I 10;12 , I 12;141 2 3 4 5 6 7  Los límites de clase son:

    L 0, L 2, L 4, L 6, L 8, L 10, L 12, L 141 2 3 4 5 6 7 8  

    Tabla Nº2

    Cabezasde ganado

    Nº defamilias

    Marcasde clase

    Frecuenciasrelativas

    Frecuenciasrelativas

    acumuladas

    Frecuenciasabsolutas

    acumuladas

    Frecuenciasrelativas

    porcentuales

    Frecuenciasrelativas

    acumuladasporcentuales

    Clases n i x i h i H i N i 100h i % 100H i %[0; 2> 14 1 0,350 0,35 14 35 35

    [2; 4> 9 3 0,225 0,575 23 22,5 57,5

    [4; 6> 7 5 0,175 0,750 30 17,5 75

    [6; 8> 1 7 0,025 0,775 31 2,5 77,5

    [8; 10> 4 9 0,100 0,875 35 10 87,5

  • 8/17/2019 Unidad 1 Conceptos Básicos, Gráficos y Tablas de Frecuencia

    18/27

    Estadística y Probabilidades TECSUP - PFR

    72

    [10; 12> 3 11 0,075 0,950 38 7,5 95

    [12; 14> 2 13 0,050 1 40 5 100

    TOTALES 40 1 100

    Sigamos con las definiciones, observando la tabla Nº2:

      Marcas de Clase ( xi ): son los puntos medios de los intervalos declase.

    2

    1   iii L L

     x ; i = 1, 2, ....., k

    L L   0 21 2x 11 2 2

       

    L L   2 42 3x 322 2

        ; ......

    x 3  = 5 , se lee: “la marca de clase del tercer intervalo de clase es 5 ”  

      Frecuencias Relativas ( hi ): se define:n

    nh   ii     ; i = 1, 2, ....., k  

    n   141h 0,3501n 40

     

    n   92h 0,2252n 40

      ; .....

    Se verifica que:

    0     ih 1

    kh h h h h h h h 0,350 0,225 0,175 0,025 0,100 0,075 0,050 1i 1 2 3 4 5 6 7

    i 1

     

    h3= 0,175, se lee: “la frecuencia relativa de la tercera clase es 0,175 ”  

      Frecuencia Relativa Porcentual (100 hi%)

    Nos permite contestar preguntas del siguiente tipo: ¿Qué porcentajede familias, de las 40 bajo estudio, tienen 4 ó 5 cabezas de ganado?

  • 8/17/2019 Unidad 1 Conceptos Básicos, Gráficos y Tablas de Frecuencia

    19/27

    TECSUP - PFR Estadística y Probabilidades  

    73

    Respuesta: 17,5 %

      Frecuencia Absoluta Acumulada ( Ni ):

    Se define:

    Ni = n1 + n2 + .... + ni ; i = 1, 2, ....., k

    En el ejemplo:

    N n 141 1

    N n n 14 9 232 1 2

    N 30,.... N 403 7

     

    Se verifica:

    0 N 40i  

    N N 40k 7  

    4 N  31, se lee: “la frecuencia absoluta acumulada hasta la cuartaclase es 31 ”  

      Frecuencia Relativa Acumulada ( Hi ):

    Se define:

    k in

     N  H óhhh H    iiii   ,...,2,1;...21  

     

    H h 0,3501 1

    H h h 0,5752 1 2

    H 0,750,..... H 13 7

     

    Se verifica:

    0 H 1i  

    H H 1k 7  

    2 H    0,575, se lee: “la frecuencia relativa acumulada hasta la2da.clase es 0,575”  

      Frecuencia Relativa Acumulada Porcentual (100 Hi%):

  • 8/17/2019 Unidad 1 Conceptos Básicos, Gráficos y Tablas de Frecuencia

    20/27

    Estadística y Probabilidades TECSUP - PFR

    74

    Nos permite contestar preguntas del siguiente tipo: ¿Qué porcentajede familias, de las 40 bajo estudio tienen menos de 8 cabezas deganado?

    Respuesta: 77,5 %

    GráficasLas distribuciones de frecuencias pueden ser representadas gráficamentemediante:

    a)  HistogramasSon gráficas de barras o rectángulos cuyas bases representan losintervalos de clase y las alturas las frecuencias absolutas o relativas.

    ó (Fig. Nº 2)

    b)  Polígonos de frecuencias 

    Son polígonos construidos uniendo los puntos iiii   h xón x   ,,  mediante segmentos de recta, o uniendo los puntos medios de los “techos” de los rectángulos del histograma. (Fig. N° 3)

    c)  Diagramas escalonados o funciones escalonadas

    ii   nvs I    .  

    ii   nvs I    .  

    ii   hvs I    .  

    15

    10

    5

    0 2 4 6 8 10 12 14

    n i 

    I i 

    Histograma

    Fig. N°215

    10

    5

    0 2 4 6 8 10 12 14

    n i 

    I i 

    Polígono de Frecuencias

    Fig. N°3

  • 8/17/2019 Unidad 1 Conceptos Básicos, Gráficos y Tablas de Frecuencia

    21/27

    TECSUP - PFR Estadística y Probabilidades  

    75

    Son gráficas de barras o rectángulos cuyas bases representan losintervalos de clase y las alturas las frecuencias absolutas o relativasacumuladas.

    ó (Fig. Nº 4)

    d)  Ojivas

    Son poligonales asociadas a distribuciones de frecuencias absolutas orelativas acumuladas construidas como aparece en la Figura Nº5

    PROBLEMAS PROPUESTOS

    1.  En un artículo se reportó las siguientes observaciones, listadas en orden crecientesobre la duración de brocas (número de agujeros que una broca fresa antes de quese rompa) cuando se fresaron agujeros en una cierta aleación de latón.

    11 14 20 23 31 36 39 44 47 5 59 61 65 67 68 71 74 76 78 7 81 84 85 89 91 93 96 99 101 10

     105 105 112 118 123 136 139 141 148 15 161 168 184 206 248 263 289 322 388 51 a. ¿Por qué una distribución de frecuencia no puede estar basada en los intervalos

    de clase 0-50, 50-100, 100-150 y así sucesivamente?

    ii   N vs I    .   ii   H vs I    .  

    10

    20

    30

    40

    0 2 4 6 8 10 12 14

    N i 

    I i 

    Fig. N°4

    Función Escalonada

    10

    20

    30

    40

    0 2 4 6 8 10 12 14

    N i 

    I  i 

    Fig. N°5

    Ojiva

  • 8/17/2019 Unidad 1 Conceptos Básicos, Gráficos y Tablas de Frecuencia

    22/27

    Estadística y Probabilidades TECSUP - PFR

    76

    b. Construya una distribución de frecuencia e histograma de los datos con loslímites de clase 0, 50, 100, . . . y luego comente sobre las característicasinteresantes.

    c. Construya una distribución de frecuencia e histograma de los logaritmosnaturales de las observaciones de du- ración y comente sobre característicasinteresantes.d. ¿Qué proporción de las observaciones de duración en esta muestra son menoresque 100? ¿Qué proporción de las observaciones son de por lo menos 200?

    2.  Un diagrama de Pareto es una variación de un histograma de datos categóricosproducidos por un estudio de control de calidad. Cada categoría representa un tipodiferente de no conformidad del producto o problema de producción. Lascategorías se ordenaron de modo que la categoría con la frecuencia más grande

    aparezca a la extrema izquierda, luego la categoría con la segunda frecuencia másgrande, y así sucesivamente. Suponga que se obtiene la siguiente informaciónsobre no conformidades en paquetes de circuito: componentes averiados, 126;componentes incorrectos, 210; soldadura insuficiente, 67; soldadura excesiva, 54;componente faltan- te, 131. Construya un diagrama de Pareto.

    3.  Los accidentes en una planta de papas fritas se clasifican de acuerdo con la partedel cuerpo lesionada.

    Dedos: 17  Ojos: 5 Brazos: 2  Piernas: 1 

    Trace un diagrama de barras

    4.  Los siguientes datos constituyen las vidas útiles en horas de una muestra aleatoriade 60 bombillas de luz de 100 watts: 

    807 811 620 650 815 725 743 703 844 907660 753 1050 918 850 876 1027 889 878 890881 872 869 841 863 842 851 837 822 811766 787 923 792 799 937 816 758 817 7531056 1076 958 970 765 896 740 891 1075 1074

    832 863 852 788 968 817 678 865 759 923

    a) 

    Constrúyase una distribución de frecuencias con anchos de clases iguales

    b)  Trácese el polígono de frecuencias sobre un Histograma de intervalos declases vs. frecuencias relativas.

  • 8/17/2019 Unidad 1 Conceptos Básicos, Gráficos y Tablas de Frecuencia

    23/27

    TECSUP - PFR Estadística y Probabilidades  

    77

    c) 

    Trácese la ojiva asociada a la función escalonada representando intervalos declases vs. frecuencias absolutas acumuladas.

    5.  La siguiente tabla muestra la distribución de los empleados de una compañía

    aseguradora por sueldos mensuales en nuevos soles (año 2001)Clases Frecuencias

    menos de 450 32450 a menos de 900 47900 a menos de 1350 751350 a menos de 1800 891800 a menos de 2500 1262500 a menos de 4250 384250 a mas 10

    TOTAL 417

    a)  ¿Qué porcentaje de empleados ganan sueldos mensuales inferiores a 900nuevos soles?. ¿Qué porcentaje ganan 2500 nuevos soles o más?

    b) 

    ¿Qué porcentaje de empleados ganan entre 1350 y 4250 nuevos soles?

    c)  Determinar los anchos y las marcas de clase.

    Nota.-  Se averiguó que el máximo haber percibido en la compañía es de 5500

    nuevos soles. Si no se tiene ninguna información se asume un máximo valorde acuerdo al problema en cuestión; así como se supondrá cero, como elhaber mínimo.

    6.  Para un estudio sobre resistencia de un metal, se han realizado cien experienciasde rotura frente a la carga de un hilo del mismo grosor, y han sido anotados lospesos límites en cada caso.

    Cargas de rotura de un hilo en gramos

    711 862 851 912 922 791 825 935 895 758915 873 926 864 800 931 722 774 903 925853 700 885 857 844 907 917 786 820 930

  • 8/17/2019 Unidad 1 Conceptos Básicos, Gráficos y Tablas de Frecuencia

    24/27

    Estadística y Probabilidades TECSUP - PFR

    78

    789 790 753 910 847 784 936 706 758 887941 909 784 882 859 903 925 704 792 888

    890 925 895 768 869 892 895 912 850 920763 805 796 759 916 853 789 943 712 764892 893 915 890 888 865 909 931 710 798914 794 931 701 772 935 887 880 933 905889 791 782 713 724 868 842 892 905 792

    a)  Reagrupar estos datos en 7 intervalos de clase de igual longitud.

    b)  Trácese el histograma y el polígono de frecuencias.

    c)  Trácese la ojiva correspondiente, y conteste:

    ¿Qué porcentaje presentan una carga no menor de 770 gramos?¿Qué porcentaje presentan una carga entre 800 y 900 gramos?

    7. 

    Las distribuciones cualitativas o por categorías se suelen presentar en diagramasde sectores en la que un círculo aparece dividido en sectores proporcionales en suabertura a las frecuencias de las categorías que representan:

    a)  Construir un diagrama de sectores para trasmitir la información de que (según las cifrasmás recientes disponibles) en el Perú el número total de botellas de vino

    consumidas provienen el 69% de ICA, el 18% de otras partes del país, el 5%se importan de Francia y el resto de otros países.

    b)  Dibujar un diagrama de sectores para mostrar que en un hospital de una granciudad la distribución de su presupuesto es como sigue: 73% de sueldos,honorarios profesionales médicos y bonificaciones a los empleados; 13% ensuministros y equipo médico y quirúrgico; 8% en mantenimiento, alimentacióny energía y el 6% en gastos administrativos.

    8.  En 1972, la población activa de Francia estaba compuesta de:

    11,1% de agricultores,10,6% de patronos,16,5% de ejecutivos,16,7% de empleados,38,6% de obreros,6,5% de personal de servicios y otras categorías.Representar esta distribución mediante el gráfico que parezca más adecuado.

  • 8/17/2019 Unidad 1 Conceptos Básicos, Gráficos y Tablas de Frecuencia

    25/27

    TECSUP - PFR Estadística y Probabilidades  

    79

    9. 

    Las pérdidas en una fábrica de papel (en miles de dólares) debidas a rasgaduraspueden dividirse según el producto:

    Papel higiénico: 132 Toallas desechables: 85Servilletas: 43 Otros: 12 productos

    a)  Trace un diagrama en barras.

    b)  ¿Qué porcentaje de las pérdidas ocurre en la elaboración de papel higiénico?.

    c) 

    ¿Qué porcentaje de las pérdidas ocurre en la elaboración de papel higiénico otoallas desechables?

    10. Los pesos de ciertos especimenes minerales, dados en la décima más cercana deuna onza, se agrupan en una tabla con los intervalos: 10,5  – 11,4; 11,5  – 12,4;12,5 – 13,4; y 13,5 – 14,4 onzas.

    a)  Determine las marcas de clase.b)  ¿Es posible determinar a partir de los datos agrupados cuántos especimenes

    minerales pesan?:

      Menos de 11, 5 onzas.  Más de 11,5 onzas.  Al menos 12,4 onzas.  Cuando mucho 12,4 onzas.  De 11,5 a 13,5 onzas?

    11. Los siguientes datos son las velocidades (en km/h) de 80 carros que pasaron porun punto de control de velocidad:

    60 30 31 60 45 20 34 29 35 2040 54 38 35 27 45 40 55 45 6049 49 85 83 30 40 46 105 29 38102 60 80 35 28 60 82 72 63 3670 60 31 65 34 73 68 81 65 8025 70 108 26 24 27 40 75 43 85120 45 39 83 65 72 46 62 43 6360 70 100 55 50 63 64 65 61 69

    Clasifique estos datos convenientemente y:

    a)  Muestre el histograma y el polígono de frecuencias correspondiente.

    b) 

    Diseñe la función escalonada y la ojiva respectiva.

    c)  Los carros con velocidades mayores a 80 km/h, son multados por exceso de

  • 8/17/2019 Unidad 1 Conceptos Básicos, Gráficos y Tablas de Frecuencia

    26/27

    Estadística y Probabilidades TECSUP - PFR

    80

    velocidad. ¿Qué porcentaje serán multados?

    d)  Los carros con velocidades entre 45 y 70 km/h, van a ser considerados en

    premios organizados por una compañía. ¿Qué porcentaje serán premiados?12. El gráfico muestra el impuesto mensual (en soles) que debe pagar una persona,

    según su sueldo mensual (en soles):

    ¿Cuánto de impuesto mensual paga una persona que gana s/.1500?. ¿Cuánto ganauna persona que paga mensualmente s/.300 de impuesto?

    13. La siguiente tabla de frecuencias muestra los haberes mensuales de 200 obrerosde cierta fábrica, en nuevos soles (año2000)

    Haberes mensuales Número de obreros

    Menores a 500 4

      700,500   60   900,700   40

      1100,900   48

      1300,1100   24

      1500,1300   14

    IMPUESTO

    SUELDO2200 3400 40001000

    120

    360

    900

  • 8/17/2019 Unidad 1 Conceptos Básicos, Gráficos y Tablas de Frecuencia

    27/27

    TECSUP - PFR Estadística y Probabilidades  

      1700,1500   8más de 1700 2

    TOTAL 200

    Con referencia a esta tabla, contestar:

    a)  ¿Qué porcentaje de obreros tienen haberes inferiores a s/.1000 mensuales?

    b)  ¿Qué porcentaje de obreros tienen haberes superiores a s/.1100 mensuales?

    c)  ¿Qué porcentaje de obreros tienen haberes entre 1000 a 1500 solesmensuales?

    d)  Graficar el histograma, el polígono de frecuencias y la ojiva correspondientes.