Sesion 3organizacion y Presentacion de Datos
-
Upload
emanuelrojasalcalde -
Category
Documents
-
view
216 -
download
0
Transcript of Sesion 3organizacion y Presentacion de Datos
-
8/18/2019 Sesion 3organizacion y Presentacion de Datos
1/14
F CULT D DE CIENCI S ECONÓ Departamento cadémico de Ciencias EST DÍSTIC DESCRIPTIV
1Docente: Mg. Blanca Flor Robles Pastor.
SESIÓN 3: Organización y presentación de datos
Aprendizaje esperado: Elabora tablas de distribución de frecuencias y gráficos estadísticos
apropiadas a los tipos de variables estadísticas.
Contenidos Tablas estadísticas
Partes principales de una tabla estadística
Construcción de tablas de frecuencias
Propiedades de las frecuencias
Los gráficos estadísticos
-
8/18/2019 Sesion 3organizacion y Presentacion de Datos
2/14
F CULT D DE CIENCI S ECONÓ Departamento cadémico de Ciencias EST DÍSTIC DESCRIPTIV
2Docente: Mg. Blanca Flor Robles Pastor.
I SITUACIÓN PROBLEMÁTICA/RECOJO DE SABERES PREVIOS
Lee y analiza…!
Preguntas de análisis y reflexión
Los cuadros estadísticos constituyen la parte fundamental de informes provenientes de encuestas
y otras investigaciones. En este contexto:
1. ¿Para qué crees que sirve un cuadro o tabla estadística?
2. ¿Crees que es importante manuales o guías para la elaboración de cuadros o tablas
estadísticas?
3. ¿Cuál es el objetivo del cuadro o tabla estadística?
4.
¿Qué es un cuadro o tabla estadística?
5. ¿Qué partes debe tener un cuadro o tabla estadística?
La información que se muestra en una publicación estadística deberá contar conciertas características que reflejen la realidad que se pretende medir. Deberá
entenderse por información al conjunto de datos obtenidos a través de la medición,
cuantificación y registro de los fenómenos y hechos demográficos sociales y
económicos que suceden en un espacio y tiempo determinados.
Es bueno recordar que esta información puede ser usada como un instrumento
básico para la planeación y la toma de decisiones, soporte para la investigación o
para el conocimiento en general, por lo que debe cumplir las siguientes
características:
Veracidad, el dato deberá ser obtenido directamente de las unidades
generadoras de información.
Oportunidad, el tiempo entre el suceso, el registro del dato y la difusión de la
información, deberá ser el mínimo posible, a fin de que esta no pierda
vigencia respecto de la realidad que describe o explica.
Integralidad, los cuadros con información estadística deberán contener
todos los elementos básicos para facilitar su consulta e interpretación,
relación precisa entre cifras y conceptos, uso de totales, incorporación de
notas y utilización de simbología homogénea.
Extraído de: Manual para la presentación de cuadros estadísticos. INEI, Perú.
-
8/18/2019 Sesion 3organizacion y Presentacion de Datos
3/14
F CULT D DE CIENCI S ECONÓ Departamento cadémico de Ciencias EST DÍSTIC DESCRIPTIV
3Docente: Mg. Blanca Flor Robles Pastor.
II DESARROLLO DEL MARCO TEÓRICO
En el trabajo estadístico, siempre se dispone de muchos datos que, definitivamente tienen
que ser clasificados, ordenados y presentados adecuadamente, de tal manera que facilite la
comprensión, descripción y análisis del fenómeno estudiado, y obtener conclusiones
válidas para la toma de decisiones.
Fundamentalmente se usa la forma tabular y los gráficos se utilizan complementariamente
para ilustrar mediante figuras el comportamiento de las variables y facilitar la
comprensión de los fenómenos estudiados.
Las Tablas Estadísticas
Las tablas estadísticas, llamados también cuadros estadísticos; presentan ordenadamente
los datos estadísticos en filas y columnas, clasificados y agrupados de acuerdo a un
criterio específico, que permiten leer, comparar e interpretar las características de una o
más variables. En las tablas, metodológicamente, conviene distinguir las “tablas de
frecuencia o de distribución” y los “cuadros estadísticos o de análisis”.
1.
Partes principales de una tabla estadística
En general una tabla o cuadro estadístico completo puede tener las siguientes partes:1)
Número de la tabla
2) Título: describe el contenido conceptual de la tabla en forma ordenada,
clara y breve. Se recomienda que corresponda a 4 preguntas básicas:
¿Dónde? ¿Qué? ¿Cómo? Y ¿Cuándo? El título debe estar redactado en
mayúscula y con tildes y debe especificar la unidad de medida de la
variable.
3)
Cuerpo: es el contenido numérico de la tabla.4) Nota de pie: se usa para aclarar algunos términos o siglas.
5) Fuente: es la indicación al pie de la tabla o cuadro que sirve para nombrar
la publicación, entidad, estudio o fuente de donde se obtuvieron los datos
utilizados para construir la tabla o cuadro.
-
8/18/2019 Sesion 3organizacion y Presentacion de Datos
4/14
F CULT D DE CIENCI S ECONÓ Departamento cadémico de Ciencias EST DÍSTIC DESCRIPTIV
4Docente: Mg. Blanca Flor Robles Pastor.
6) Elaboración: es una indicación que se coloca debajo de la fuente, y sirve
para para mencionar el responsable, que elaboró la tabla o cuadro
estadístico.
Ejemplo
Tabla 1
Mediciones de viscosidad de un producto químico
Intervalos de clase fi Fi hi Hi
41.5 - 43.5 4 4 0.13 0.1343.5 - 45.5 12 16 0.40 0.5345.5 - 47.5 8 24 0.27 0.8047.5 - 49.5 6 30 0.20 1.00
Total 30 1.00Nota: Fuente: Ficha de registro de datos.
2. Construcción de Tablas de frecuencias
Las tablas de frecuencias son el producto de la operación de tabulación, en las que se
registra cuantos elementos (frecuencia o repetición) hay en cada categoría, valor o
intervalo de la variable. Estas tablas presentan diversos tipos de frecuencias (absolutas,
relativas o acumuladas).
Frecuencia absoluta simple (fi): es el número de veces que se repite un determinado
valor de la variable, en el caso de intervalos es el número de observaciones comprendido
en dicho intervalo.
∑fi = n
Frecuencia absoluta acumulada (Fi): que resulta de acumular sucesivamente las
frecuencias absolutas simples. Donde:
F1= f1
F2= f1 + f2
F3= f1 + f2 +f3 ….
Frecuencia relativa simple (hi): es el cociente de la frecuencia absoluta simple entre el
tamaño de muestra o total de datos.
hi= fi/n
∑ hi = 1
-
8/18/2019 Sesion 3organizacion y Presentacion de Datos
5/14
F CULT D DE CIENCI S ECONÓ Departamento cadémico de Ciencias EST DÍSTIC DESCRIPTIV
5Docente: Mg. Blanca Flor Robles Pastor.
Frecuencia relativa acumulada (Hi): que resulta de acumular o sumar sucesivamente
las frecuencias relativas, tal que:
H1= h1
H2= h1 + h2
H3= h1 + h2 +h3 ….
A) CONSTRUCCIÓN DE TABLA DE FRECUENCIA PARA VARIABLE
CUALITATIVA
Veamos cómo se construye las tablas de frecuencia de estadísticas de atributos.
Ejemplo: Los resultados de una encuesta de opinión sobre la preferencia en marca de
detergente a un grupo de amas de casa del distrito Moche-2015, fueron:
ARIEL MARSELLA ARIEL BOLIVAR BOLIVAR MARSELLA BOLIVAR
ACE BOLIVAR ARIEL INVICTO OPAL OPAL BOLIVAR
INVICTO ARIEL ACE MARSELLA ACE ARIEL BOLIVAR
OPAL ARIEL ARIEL BOLIVAR ARIEL ARIEL BOLIVAR
PATITO ACE ARIEL ARIEL ARIEL ACE ARIEL
ACE ACE ACE ACE ARIEL ARIEL ARIEL
OPAL OPAL ARIEL OPAL ACE ARIEL OPAL
Como resultado de la clasificación y tabulación se tiene:
Tabla 2
Preferencia en marca de detergente de las amas de casa del Distrito Moche-2015
Marca de detergente fi %ACE 10 20.41ARIEL 19 38.78BOLIVAR 8 16.33INVICTO 2 4.08MARSELLA 3 6.12OPAL 6 12.24PATITO 1 2.04Total 49 100.00
Nota: Los datos fueron recogidos mediante una Encuesta de opinión realizada por Consultora B&R.
INTERPRETACIONES:
f2 = 19 el número de amas de casa de Moche que tienen preferencia por la marca de detergente
ARIEL es 19.
El 38.78% de las amas de casa de Moche prefieren la marca de detergente ARIEL.
-
8/18/2019 Sesion 3organizacion y Presentacion de Datos
6/14
F CULT D DE CIENCI S ECONÓ Departamento cadémico de Ciencias EST DÍSTIC DESCRIPTIV
6Docente: Mg. Blanca Flor Robles Pastor.
El 20.41% de las amas de casa de moche prefieren la marca de detergente ACE.
B) CONSTRUCCIÓN DE TABLA DE FRECUENCIA PARA VARIABLE
CUANTITATIVA DISCRETA
Ejemplo: Los siguientes datos corresponden al Número de cursos desaprobados que presentan
los estudiantes de Ingeniería Industrial-Julio 2011.
2 0 2 4 4 1 2 2
3 1 2 2 4 0 2 2
4 2 2 3 4 0 2 3
5 3 3 3 2 1 3 1
Como resultado de la clasificación y tabulación se tiene:
Tabla 3
Número de cursos desaprobados de los alumnos de Ing. Industrial UPAO-Julio 2011.Número de Cursos
desaprobados fi Fi hi Hi
0 3 3 0.094 0.094
1 4 7 0.125 0.219
2 12 19 0.375 0.594
3 7 26 0.219 0.813
4 5 31 0.156 0.969
5 1 32 0.031 1
Total 32 1Nota: Datos extraídos de las Actas de evaluación de la Oficina de Registro Técnico UPAO.
INTERPRETACIONES:
f3=12 El número de alumnos que presentan 2 cursos desaprobados es 12.
F4=26 El número de alumnos que presentan menos de 4 cursos desaprobados es 26.
h3=0.375 El 37,5% de los alumnos tienen 2 cursos desaprobados.
H4=0.813 El 81,3% de los alumnos tienen menos de 4 cursos desaprobados.
C) CONSTRUCCIÓN DE TABLAS DE FRECUENCIAS PARA VARIABLE
CUANTITATIVA CONTINUAConsiderando que la variable continua toma valores racionales, se acostumbra presentar los datos
utilizando INTERVALOS DE CLASE en las tablas de frecuencias. Por lo tanto la clasificación
consistirá en construir los intervalos de clase. Para ellos seguiremos el siguiente procedimiento:
• Rango (R): Diferencia entre el máximo y el mínimo valor de una variable.
-
8/18/2019 Sesion 3organizacion y Presentacion de Datos
7/14
F CULT D DE CIENCI S ECONÓ Departamento cadémico de Ciencias EST DÍSTIC DESCRIPTIV
7Docente: Mg. Blanca Flor Robles Pastor.
R = Valor máximo – Valor mínimo
• Número de intervalos(m): representa el número de filas o clases que tendrá la tabla, para
su determinación se utiliza la fórmula de Sturges:
m = 1+3.322log(n)
El resultado de esta operación siempre se aprox ima al número entero superior .
• Amplitud de un intervalo (C): Es el cociente entre el valor del rango y la cantidad de
intervalos que se desea obtener.
C=R/m
Se recomienda que el resultado de esta operación debe ser concordante con la forma como
están expresados los datos, es decir, si la base de datos considera número enteros, un
decimal o dos decimales; la amplitud deberá concordar con esta forma de expresión. El
resultado de la amplitud (C), siempr e se aprox ima por exceso .
• Nuevo Rango (R’): por efecto de las aproximaciones realizadas en el cálculo del número
de intervalos y la amplitud del mismo, el rango original ha sufrido una pequeña
ampliación, por lo que es necesario calcular el nuevo rango.
R’ = m * C
• Exceso (E): es la diferencia entre el nuevo rango y el rango original.
E = R’ – R
El exceso se debe distribuir hacia los dos extremos, es decir al primer límite inferior y al
último límite superior.
• Construcción de intervalos: para la construcción de los intervalos de clase se inicia con el
valor mínimo de la base de datos y a este se le resta el exceso. Este resultado corresponde
al límite inferior del primer intervalo; luego al sumar la amplitud se obtiene el límite
superior del primer intervalo. Al seguir sumando la amplitud se van formando los demás
intervalos de clase.
• Marca de clase (Yi): Representante de un intervalo, y corresponde al promedio entre los
extremos de éste.
• Límite inferior del intervalo (Li)
• Límite superior del intervalo (Ls)
• En estadística es bastante usual los intervalos semiabiertos, tal como se muestra
[ Li – Ls )
-
8/18/2019 Sesion 3organizacion y Presentacion de Datos
8/14
F CULT D DE CIENCI S ECONÓ Departamento cadémico de Ciencias EST DÍSTIC DESCRIPTIV
8Docente: Mg. Blanca Flor Robles Pastor.
Ejemplo : Se tiene el registro de los sueldos semanales ($), de administradores de la ciudad de la
ciudad de Trujillo en diciembre de 2015.
201 300 455 561 482
230 320 472 610 475
256 350 495 680 420298 380 500 720 410
267 400 535 790 469
Para este conjunto de datos que han sido extr aídos de las plani l las de pago, procederemos a
construi r intervalos de clase:
1°) Calculamos el Rango: R = 790 – 201 = 589
2°) Determinamos el número de intervalos: m= 1+3.322 log (25) = 5.64 ≈ 6
3°) Calculamos la amplitud del intervalo: C = 589/6 = 98.16 ≈ 99
4°) Calculamos el nuevo rango: R’ = 99*6 = 594
5°) Calculamos el exceso: E = 594 – 589 = 5 por lo que al distribuirlo al inicio y final se tiene
Ei=2 y Ef= 3
6°) Construimos los siguientes intervalos de clase:
Primer intervalo: Li =201 – 2 = 199 Ls= 199 + 99 = 298
Segundo intervalo: Li= 298 Ls= 298 + 99 = 397
Tercer intervalo: Li= 397 Ls= 397 + 99 = 496
Cuarto intervalo: Li= 496 Ls= 496 + 99 = 595
Quinto intervalo: Li= 595 Ls= 595 + 99 = 694
Sexto intervalo: Li= 694 Ls= 694 + 99 = 793
Luego construimos la tabla de frecuencias
Tabla 4
Sueldos semanales ($) de administradores de la ciudad de Trujillo-Diciembre 2015
[Li – Ls) Yi fi hi Fi Hi
[199 – 298) 248.5 5 0.20 5 0.20
[298 – 397) 347.5 4 0.16 9 0.36
[397 – 496) 446.5 9 0.36 18 0.72
[496 – 595) 545.5 3 0.12 21 0.84
[595 – 694) 644.5 2 0.08 23 0.92
[694 – 793) 743.5 2 0.08 25 1
Total 25 1Nota: Datos extraídos de Planillas de pago por Consultora B&R.
-
8/18/2019 Sesion 3organizacion y Presentacion de Datos
9/14
F CULT D DE CIENCI S ECONÓ Departamento cadémico de Ciencias EST DÍSTIC DESCRIPTIV
9Docente: Mg. Blanca Flor Robles Pastor.
INTERPRETACIONES:
f3=9 El número de administradores con sueldo semanal de 397 a menos de 496 dólares es 9.
F4=21 El número de administradores con sueldo semanal de 199 a menos de 595 dólares es 21.
h3=0.36 El 36% de los administradores tienen sueldo semanal de 397 a menos de 496 dólares.
H4=0.84 El 84% de los administradores tienen sueldo semanal menos de 596 dólares.
Los Gráficos Estadísticos
Un gráfico o diagrama es una representación pictórica (figura geométricas o de superficie) con el
objeto de ilustrar los cambios o dimensión de una variable, como para comparar dos o más
variables similares o relacionadas.
1. Partes principales de un gráfico:
1) Número
2)
Título, como en las tablas, es la descripción del contenido del gráfico.
3) Diagrama, es el dibujo del gráfico y allí están representados los datos
indicados en el título.
4)
Leyenda, son indicaciones donde se precisa la correspondencia entre los
elementos del gráfico y la naturaleza de las medidas representadas.
5)
Fuente, indica la precedencia de los datos estadísticos.
6) Elaboración, indica el responsable de la elaboración del gráfico.
2.
Tipos de gráficos. A continuación se presenta un esquema resumen de los diferentes tipos de gráficos según
los tipos de variable:
Continua
Gráfico circular
Gráfico de Barras
Histo rama de frecuencias
Polí ono de frecuencias
Para variable
Cuantitativa
Para variable
Cualitativa
Discreta Tipos de
Gráficos
Gráfico de Bastones
Gráfico de Barras
-
8/18/2019 Sesion 3organizacion y Presentacion de Datos
10/14
F CULT D DE CIENCI S ECONÓ Departamento cadémico de Ciencias EST DÍSTIC DESCRIPTIV
10Docente: Mg. Blanca Flor Robles Pastor.
La mayoría de las personas han visto o analizado y hasta construido figuras o gráficos y
posiblemente han notado que hay una gran variedad de ellos. Una presentación detallada
de todos los tipos excede los propósitos de esta sesión, por ello sólo se hará referencia a
los de mayor uso.
a)
Gráficos de barras: Constituyen uno de los tipos más simples y quizás de mayor uso.
Resultan de especial utilidad en la presentación de datos cualitativos o cuantitativos.
Se emplean tipos muy variados de gráficos de barras, sin embargo todos reúnen
ciertas características o requisitos esenciales.
Figura 1. Estado civil de los trabajadores de la Empresa S&R
b) Gráficos de círculos o de pastel: En este tipo el área de cada una de los sectores
refleja la importancia de la categoría que representa. Se trata de un gráfico en dos
dimensiones. El gráfico de pastel consiste en un círculo el cual se divide en sectorescomo categorías se tienen de manera que el área que corresponde a cada categoría sea
proporcional a su importancia relativa o porcentual.
Figura 2. Sexo de los trabajadores de la Empresa S&R
-
8/18/2019 Sesion 3organizacion y Presentacion de Datos
11/14
F CULT D DE CIENCI S ECONÓ Departamento cadémico de Ciencias EST DÍSTIC DESCRIPTIV
11Docente: Mg. Blanca Flor Robles Pastor.
c) Gráfico de Bastones: Consiste en una serie de líneas separadas, más delgadas que la
barra, levantadas sobre las clases, o valores sin agrupar, de la serie.
Figura 3. Número de cursos desaprobados por los alumnos de Ing. Industrial
d) Histogramas de frecuencia: Son gráficos que presentan la información de cada una
de las categorías de la variable en forma de rectángulos proporcionales y
consecutivos. Se utilizan generalmente para representar datos de una variable continua
con nivel de medición por intervalos.
Figura 4. Mediciones de viscosidad (m2.s-1) de un producto químico
Fuente: Ficha de registro de datos. Informe de investigación 2015.
-
8/18/2019 Sesion 3organizacion y Presentacion de Datos
12/14
F CULT D DE CIENCI S ECONÓ Departamento cadémico de Ciencias EST DÍSTIC DESCRIPTIV
12Docente: Mg. Blanca Flor Robles Pastor.
e) Polígonos de frecuencias: Son gráficos en la forma de una serie de líneas rectas
conectadas entre sí y que unen unos puntos medios ó de intervalo a lo largo del eje
horizontal. Se utilizan para representar distribuciones de frecuencias propias de un
nivel de medición por intervalos.
Figura 5. Mediciones de viscosidad (m2.s-1) de un producto químicoFuente: Ficha técnica de laboratorio. Elaborado por el equipo investigador.
-
8/18/2019 Sesion 3organizacion y Presentacion de Datos
13/14
F CULT D DE CIENCI S ECONÓ Departamento cadémico de Ciencias EST DÍSTIC DESCRIPTIV
13Docente: Mg. Blanca Flor Robles Pastor.
III ACTIVIDADES DE APLICACIÓN
1.
MONTOS DE VENTAS MENSUALES (MILES DE SOLES) DE LAS EMPRESASINDUSTRIALES MANUFACTURERAS DE TRUJILLO-ENERO 2013
127.5 119.9 236.4 445.7 236.0 224.3 541.0 233.0126.6 222.3 330.1 449.0 536.0 521.3 443.2 336.0134.6 321.5 431.0 349.3 438.0 426.5 446.6 325.0249.9 323.6 133.2 350.0 539.2 328.7 547.9 419.0241.3 224.6 239.7 419.0 225.0 228.6 548.0 423.0243.6 325.5 338.9 320.0 524.0 539.5 349.1 345.0232.6 326.8 436.5 424.0 326.3 238.0 350.0 247.0
FUENTE: Oficina de contabilidad.2. NÚMERO DE SUCURSALES DE EMPRESAS INDUSTRIALES DE LA CIUDAD DETRUJILLO – AGOSTO 2015
3 1 2 4 2 2 2 23 0 2 4 3 2 3 24 5 2 3 4 2 5 25 5 3 2 2 2 1 3
FUENTE: Registros públicos.3.
PREFERENCIA EN MARCA DE GRIFERÍA DE LOS PROPIETARIOS DECONDOMINIOS DE LA CIUDAD TRUJILLO- DICIEMBRE 2010
BOSH VAINSA VAINSA ITALGRIF EDESA ITALGRIFVAINSA VAINSA ITALGRIF VAINSA TREBOL EDESAITALGRIF ITALGRIF VAINSA VAINSA EDESA VAINSATREBOL TREBOL BOSH BOSH EDESA VAINSAEDESA TREBOL BOSH ITALGRIF VAINSA BOSHBOSH TREBOL TREBOL EDESA VAINSA VAINSAFUENTE: Encuesta de opinión.
4. Se presenta a continuación el porcentaje de algodón en el material usado para fabricar
camisas para caballero.
35.2 39.6 34.8 37.2 36.9 34.4 37.6
34.1 38.8 31.1 36.8 34.7 34.7 37.3
35.5 37.6 34.1 35.1 33.6 34.6 34.6
36.6 35.4 33.6 35.3 32.9 35.2 35.5
38.3 34.6 34.7 32.6 33.5 35 32.8
35.1 33.8 35 33.1 33.8 34.9 32.1
34.7 37.1 35.4 34.6 34.2 35.8 34.5
Fuente: Ficha de verificación.
INSTRUCCIONES: Con la siguiente información construye tablas de distribución defrecuencias y gráficos estadísticos de acuerdo al tipo de variable. Realiza interpretaciones.
-
8/18/2019 Sesion 3organizacion y Presentacion de Datos
14/14
F CULT D DE CIENCI S ECONÓ Departamento cadémico de Ciencias EST DÍSTIC DESCRIPTIV
14Docente: Mg. Blanca Flor Robles Pastor.
IV AUTOEVALUACIÓN
1. La suma de las frecuencias absolutas simple correspondientes a todos los valores de unavariable, equivale a:
a) 1 b) 100 c) El tamaño de la muestra n d) N.A.2. Para construir un histograma de frecuencias en el eje de las abscisas se considera:
a) Las marcas de clase
b)
Los intervalosc) Las frecuencias absolutas simplesd) Los porcentajes.
3. El gráfico circular es adecuado para representar datos de una variable de tipo:a)
Cuantitativa discreta b) Cuantitativa continuac) De relaciónd)
Cualitativa
4. Para un conjunto de datos de tamaño n=80 el número de intervalos de clase adecuado es:
a)
9 intervalos de clase b) 8 intervalos de clasec) 7 intervalos de clased)
6 intervalos de clase
5. La suma de las frecuencias relativas simples correspondientes a todos los valores de unavariable, equivale a:
a) 1 b) Tamaño de la muestra “n”
c)
100 %d) hi
INSTRUCCIONES: Lee cuidadosamente cada enunciado y responde a
los cuestionamientos, haciendo un círculo en la letra de la opción que consideres correcta.