TRATAMIENTO DE DATOS - · PDF fileCONALEP!TEHUACÁN.!PTB!EN!MECC...

30
CONALEP TEHUACÁN. PTB EN MECC Tratamiento de Datos y Azar. Ing. Jonathan QuirogaTinoco. http://www.zonaEMEC.tk 1 TRATAMIENTO DE DATOS Y AZAR UNIDAD I MANEJO DE DATOS USANDO ESTADÍSTICA DESCRIPTIVA PARA LA SOLUCIÓN DE PROBLEMAS TUTORIAL: INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA

Transcript of TRATAMIENTO DE DATOS - · PDF fileCONALEP!TEHUACÁN.!PTB!EN!MECC...

Page 1: TRATAMIENTO DE DATOS -  · PDF fileCONALEP!TEHUACÁN.!PTB!EN!MECC TratamientodeDatos!y!Azar.Ing.Jonathan"Quiroga/Tinoco." "

    CONALEP  TEHUACÁN.  PTB  EN  MECC

Tratamiento  de  Datos  y  Azar.  Ing.  Jonathan  Quiroga-­‐Tinoco.  http://www.zonaEMEC.tk  

1

TRATAMIENTO DE DATOS Y AZAR

UNIDAD I

MANEJO DE DATOS USANDO ESTADÍSTICA DESCRIPTIVA PARA LA

SOLUCIÓN DE PROBLEMAS

TUTORIAL:

INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA

Page 2: TRATAMIENTO DE DATOS -  · PDF fileCONALEP!TEHUACÁN.!PTB!EN!MECC TratamientodeDatos!y!Azar.Ing.Jonathan"Quiroga/Tinoco." "

    CONALEP  TEHUACÁN.  PTB  EN  MECC

Tratamiento  de  Datos  y  Azar.  Ing.  Jonathan  Quiroga-­‐Tinoco.  http://www.zonaEMEC.tk  

2

INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA La palabra estadística se emplea con dos significados distintos: a) Estadísticas (en plural) selecciones de datos numéricos presentados en forma esquemática y ordenada. b) Estadística como ciencia. Para el alumno la estadística debe tener el significado de la opción b) y desde este punto podemos dar la definición de estadística como:"la ciencia que estudia la técnica o método que se sigue para recoger, organizar, resumir, representar, analizar, generalizar y predecir resultados de las observaciones de fenómenos aleatorios." Partes de la estadística, en esquema:

DEFINICIÓN DE ESTADÍSTICA DESCRIPTIVA Tradicionalmente se han distinguido dos campos manifiestamente separados en la disciplina Estadística: la Estadística Descriptiva y la Estadística Inferencial. La Estadística Descriptiva, a la que hemos dedicado toda la primera parte de la asignatura, tiene como objetivo representar de la forma más fiel posible los datos de un conjunto de individuos en lo que se refiere a una serie de variables que hemos medido sobre ellos. Suele decirse que la Estadística Descriptiva tiene como fin “obtener fotografías” de la realidad. Son técnicas propias de la Estadística Descriptiva la obtención de frecuencias absolutas, relativas, acumuladas y no acumuladas, el cálculo de medidas resumen (de posición, de dispersión, de asimetría,...), la elaboración de gráficos (de barras, de sectores, histogramas,...). Por su parte, la Estadística Inferencial tiene un objetivo más ambicioso, que consiste en tratar de obtener información sobre un amplio grupo de individuos a partir de los datos recogidos sobre un colectivo más pequeño adecuadamente seleccionado de aquél. Dos son las técnicas fundamentales que se estudian dentro de la Estadística Inferencial: la estimación de parámetros y el contraste de hipótesis.

Page 3: TRATAMIENTO DE DATOS -  · PDF fileCONALEP!TEHUACÁN.!PTB!EN!MECC TratamientodeDatos!y!Azar.Ing.Jonathan"Quiroga/Tinoco." "

    CONALEP  TEHUACÁN.  PTB  EN  MECC

Tratamiento  de  Datos  y  Azar.  Ing.  Jonathan  Quiroga-­‐Tinoco.  http://www.zonaEMEC.tk  

3

OBJETO MATERIAL DE LA ESTADÍSTICA Los fenómenos aleatorios. OBJETO FORMAL: EL MÉTODO ESTADÍSTICO Prescinde de lo individual y de los razonamientos de tipo causal, para considerar regularidades o propiedades aplicables a un conjunto de datos e inferir propiedades sobre la totalidad del fenómeno estudiado. IMPORTANCIA DEL MÉTODO ESTADÍSTICO Permite la inducción incompleta. Es decir, permite la obtención de conclusiones acerca de un conjunto sin necesidad de estudiar todos y cada uno de los elementos que lo componen. El método estadístico permite abordar el estudio de fenómenos abarcan casi todas las áreas del conocimiento y, al tener un carácter genérico, puede incorporarse como parte del método del resto de las ciencias. EL MÉTODO CIENTÍFICO Y EL MÉTODO ESTADÍSTICO ETAPAS DEL MÉTODO CIENTÍFICO

• Observación de un fenómeno. • Planteamiento de hipótesis que expliquen el fenómeno observado. • Deducción, a partir de las hipótesis propuestas, de consecuencias que puedan

ser verificadas mediante experimentos. • Verificación experimental de las consecuencias. • Resolución sobre la idoneidad de las hipótesis según los resultados de la

experimentación. ETAPAS DEL MÉTODO ESTADÍSTICO. 1. PLANIFICACIÓN.

• Definición de OBJETIVOS. • Definición de UNIVERSO y MUESTRA. • Definición de TÉRMINOS y UNIDADES de medida. • Determinación de los DATOS necesarios.

2. EJECUCIÓN.

• Recolección de los datos. • Elaboración de los datos. • Descripción, análisis e interpretación de los datos.

Page 4: TRATAMIENTO DE DATOS -  · PDF fileCONALEP!TEHUACÁN.!PTB!EN!MECC TratamientodeDatos!y!Azar.Ing.Jonathan"Quiroga/Tinoco." "

    CONALEP  TEHUACÁN.  PTB  EN  MECC

Tratamiento  de  Datos  y  Azar.  Ing.  Jonathan  Quiroga-­‐Tinoco.  http://www.zonaEMEC.tk  

4

3. CONCLUSIÓN. FENÓMENOS ALEATORIOS Y DETERMINÍSTICOS. FENÓMENO ALEATORIO. Las experiencias que, al ser repetidas en condiciones que estimamos similares, nos llevan a resultados diferentes constituyen los llamados fenómenos aleatorios. Ejemplos: - el lanzamiento de un dado. - el número de pacientes que acuden a urgencias en un determinado intervalo horario. - consecuencias de la administración de una medicación. CARACTERIZACIÓN DE LOS FENÓMENOS ALEATORIOS.

1. Se pueden repetir en condiciones esencialmente análogas. 2. Existe un conjunto que contiene todos los resultados posibles (universo o

espacio muestral). Antes de realizar el experimento no se puede predecir el resultado exacto.

3. La frecuencia relativa de cada resultado tiende a estabilizarse al repetir indefinidamente el experimento.

¿PORQUE EXISTEN FENÓMENOS ALEATORIOS?

1. Imposibilidad de controlar todos los factores y condiciones iniciales que influyen en el resultado del experimento.

2. Existencia de un número indeterminado de variables que pueden afectar al resultado

3. Complejidad o desconocimiento de las leyes que rigen el fenómeno. Decimos que un fenómeno o experimento es aleatorio si reúne las siguientes características: a) Podemos realizarlo el número de veces que deseemos sin alterar las condiciones del experimento. b) No se puede predecir el resultado. Ejemplos: lanzar una moneda al aire, un dado, extraer una carta de la baraja, hallar el número de tornillos defectuosos entre 10 elegidos al azar en una caja. Si no cumple alguna de las condiciones establecidas, estamos ante un fenómeno o experimento determinístico. Son ejemplos de este tipo: tirar una piedra al vacío y medir su aceleración. Se caracteriza por que podemos prever su resultado, en contra de los fenómenos aleatorios.

Page 5: TRATAMIENTO DE DATOS -  · PDF fileCONALEP!TEHUACÁN.!PTB!EN!MECC TratamientodeDatos!y!Azar.Ing.Jonathan"Quiroga/Tinoco." "

    CONALEP  TEHUACÁN.  PTB  EN  MECC

Tratamiento  de  Datos  y  Azar.  Ing.  Jonathan  Quiroga-­‐Tinoco.  http://www.zonaEMEC.tk  

5

FENÓMENO DETERMINISTA. Se denomina fenómeno determinista a toda experiencia que, al ser repetido en condiciones que nosotros consideramos similares, produce siempre el mismo resultado, dentro de unos límites razonables de precisión. Ejemplos: La mayoría de los fenómenos macroscópicos estudiados por la física. Los fenómenos que estudia la estadística son los aleatorios. Otros conceptos como población estadística, unidad estadística, muestra, tamaño muestral, son estudiados con más profundidad en Métodos Estadísticos. VARIABLE ESTADÍSTICA MONODIMENSIONAL: TIPOS Consideramos un experimento o muestra de una población cualquiera y realizamos 'n' pruebas o 'n' observaciones, de esta forma obtenemos un conjunto de observaciones que llamaremos muestra aleatoria de tamaño 'n'. Los valores o cualidades que representan los 'n' resultados de las 'n' pruebas realizadas le llamaremos variable estadística. CLASIFICACIÓN DE LAS VARIABLES ESTADÍSTICAS: CUALITATIVAS Y CUANTITATIVAS (DISCRETAS Y CONTINUAS). Hemos visto que un carácter estadístico es una propiedad que permite clasificar a los individuos de la población. Hay dos tipos: a) Caracteres estadísticos cuantitativos: Se dice que un carácter estadístico es cuantitativo cuando sus modalidades son medibles (expresables como números y cumpliendo unas propiedades de medida.). Ejemplos: peso, talla, pulso, edad, etc. b) Caracteres estadísticos cualitativos: Se dice que un carácter estadístico es cualitativo cuando sus modalidades no pueden ser medidas. Ejemplos: raza, sexo, profesión, estado civil, etc. Nota: Es evidente, por ejemplo, que si el carácter es el estado civil, podíamos asignarle a sus modalidades los siguientes números: a los casados 1 , solteros 0 , viudos un 2, etc, pero este carácter no es medible en el sentido de que el 1>0 por ejemplo , expresión que no tiene sentido. Ejemplos: La profesión es un carácter cualitativo. Dentro de él podemos tener modalidades: profesor, peón, abogado, etc.

Page 6: TRATAMIENTO DE DATOS -  · PDF fileCONALEP!TEHUACÁN.!PTB!EN!MECC TratamientodeDatos!y!Azar.Ing.Jonathan"Quiroga/Tinoco." "

    CONALEP  TEHUACÁN.  PTB  EN  MECC

Tratamiento  de  Datos  y  Azar.  Ing.  Jonathan  Quiroga-­‐Tinoco.  http://www.zonaEMEC.tk  

6

Lo anterior determina un atributo que puede ser observado pero no medido. Podemos contar el número de abogados o profesores, pero no medirlos. En cambio, un carácter cuantitativo determina una variable que llamaremos variable estadística. Atributos: se le suele llamar a las variables cualitativas. La talla es un carácter cuantitativo. Es por lo tanto una variable estadística que podemos medir, puede tomar diversos valores: 1.60 , 1.62 , ......., 1.92 , ....etc . Las variables estadísticas cuantitativas pueden ser: continuas o discretas. DISCRETA: es aquella que solo puede tomar un número finito o infinito numerable de valores. Dicho con otras palabras: cuando no puede tomar cualquier valor entre dos valores dados. O bien solo toma valores aislados, generalmente enteros. Ejemplo: el número de libros en una estantería, las tiradas de un dado, el número de pétalos de una flor, etc. CONTINUA: cuando puede tomar, al menos teóricamente, todos los valores posibles dentro de un cierto intervalo de la recta real. Ejemplo: la temperatura de los enfermos entre 35 y 40 grados, aunque en la práctica sea imposible medir temperaturas aproximando hasta la cuarta o quinta cifra decimal. En la práctica son variables estadísticas continuas aquellas que fijamos como suceso elemental las que entren en un intervalo. POBLACIÓN O UNIVERSO Conjunto de elementos que poseen una característica o propiedad común, y que constituyen la totalidad de los individuos de interés para nuestro estudio. POBLACIÓN TANGIBLE. Se define como tal aquella población que puede ser medida o contada con métodos que nos ayuden a certificar el número total exacto de elementos que la componen. POBLACIÓN CONCEPTUAL. Es aquella donde el número total de elementos es un dato imposible de medir o de contar por métodos conocidos, por lo que se recurre a mecanismos que nos permitan tener un “concepto” del número final de elementos, lo anterior lógicamente es un apróximado que dependerá de la exactitud del método. INDIVIDUO Cada uno de los elementos de la muestra o de la población. No tienen por que ser objetos físicos. Vgr: el lanzamiento de un dado. Al realizar un estudio estadístico, no solo es necesario definir la población de referencia y la muestra que se va a utilizar, también hay que especificar qué características

Page 7: TRATAMIENTO DE DATOS -  · PDF fileCONALEP!TEHUACÁN.!PTB!EN!MECC TratamientodeDatos!y!Azar.Ing.Jonathan"Quiroga/Tinoco." "

    CONALEP  TEHUACÁN.  PTB  EN  MECC

Tratamiento  de  Datos  y  Azar.  Ing.  Jonathan  Quiroga-­‐Tinoco.  http://www.zonaEMEC.tk  

7

aleatorias de los individuos vamos a tener en cuenta. Por ejemplo: intención de voto, resultado de un tratamiento, puntuación de un dado, ... Las características aleatorias suelen corresponder a variables numéricas y si no es así, siempre pueden codificarse numéricamente. Una característica aleatoria definida numéricamente es lo que denominamos variable aleatoria. MUESTRA Cualquier subconjunto de la población sobre el que se realizan los estudios para obtener conclusiones acerca de las características de la población. MUESTREO El principal objetivo de la mayoría de los estudios, análisis o investigaciones, es hacer generalizaciones “acertadas” con base en muestras de poblaciones de las que se derivan tales muestras. Obsérvese la palabra “acertadas” porque no es fácil responder cuándo y en que condiciones las muestras permiten tales generalizaciones. Por ejemplo si queremos calcular la cantidad de dinero que se gasta una persona en vacaciones, ¿tomaríamos como muestra lo que gastan los viajeros que lo hacen en primera clase? es obvio que no, pero saber a que tipo de personas debemos incluir en nuestra muestra no es algo intuitivo ni evidente. En la mayor parte de los métodos de muestreo que estudiaremos, supondremos que estamos manejando las llamadas muestras aleatorias. Hacemos énfasis en las muestra aleatorias porque son las que nos van a permitir generalizaciones válidas o lógicas. a) MUESTREO ALEATORIO: Para comenzar, empezaremos distinguiendo entre las dos clases de poblaciones, Poblaciones finitas y poblaciones infinitas. Una población es finita si consta de un número finito o fijo de elementos, medidas u observaciones. Por ejemplo los pesos netos de 2000 latas de atún, las calificaciones de todos los estudiantes del instituto... A diferencia de las poblaciones finitas, las poblaciones infinitas contienen una infinidad de elementos. Este es el caso de cuando observamos una variable continua y hay una infinidad de resultados distintos. También es el caso del lanzamiento indefinido de dos dados,... Para ver la idea de muestreo aleatorio en una población finita de tamaño N, primero veamos cuantas muestras distintas se pueden tomar de tamaño n. El número de

Page 8: TRATAMIENTO DE DATOS -  · PDF fileCONALEP!TEHUACÁN.!PTB!EN!MECC TratamientodeDatos!y!Azar.Ing.Jonathan"Quiroga/Tinoco." "

    CONALEP  TEHUACÁN.  PTB  EN  MECC

Tratamiento  de  Datos  y  Azar.  Ing.  Jonathan  Quiroga-­‐Tinoco.  http://www.zonaEMEC.tk  

8

muestras distintas es Nn⎛

⎝⎜⎞

⎠⎟ Por ejemplo si N=12 y n= 2

122

12 112

66⎛

⎝⎜

⎠⎟= =

•!

muestras

distintas.

Con base en el resultado de que hay Nn⎛

⎝⎜⎞

⎠⎟ muestras distintas de tamaño n de una

población finita de tamaño N, podemos definir como muestra aleatoria o muestra aleatoria simple de una población finita: “Una muestra de tamaño n de una población finita de tamaño N es una variable

aleatoria si se selecciona de manera tal que cada una de las Nn⎛

⎝⎜⎞

⎠⎟ muestras posibles

tienen la misma probabilidad 1Nn⎛

⎝⎜

⎠⎟

de ser seleccionada.

Por ejemplo si una población consistente en lo N= 5 elementos A, E ,I , O, U (que podrían ser los ingresos anuales de cinco personas, los pesos de 5 vacas,.....) hay 53

10⎛

⎝⎜⎞

⎠⎟= muestras posibles de tamaño n = 3 estas constan de los elementos:

AEI AEO AEU AIO AIU AOU EIO EIU EOU IOU

si seleccionamos una de esas muestras de forma que esta muestra tenga probabilidad 1/10 de ser elegida, decimos que dicha muestra es aleatoria. En la práctica el describir todas las posibles muestras seria complicado si N y n son grandes. Por ejemplo si n = 4 y N = 200 tendríamos 64,684,950 muestras distintas. Por suerte podemos realizar una muestra aleatoria, sin necesidad de describirlas todas. Basta con numerar los N elementos de la población y retirar una a una hasta completar

los n- elementos de la muestra. Este procedimiento también da una probabilidad de 1Nn⎛

⎝⎜

⎠⎟

de ser seleccionada la muestra por los que sería aleatoria. Ahora bien si la población es infinita: diremos que: Una muestra de tamaño n de una población infinita es aleatoria si consta de valores de variables aleatorias independientes que tienen la misma distribución. Por ejemplo si lanzamos un dado 12 veces y obtenemos 2, 5, 5, 3, 3, 3, 5, 1, 6, 1,4, 1. Estos números constituyen una variable aleatoria si son valores aleatoria independientes que tienen la misma distribución de probabilidad f(x) = 1/6 para x= 1,2,3,4,5,6

Page 9: TRATAMIENTO DE DATOS -  · PDF fileCONALEP!TEHUACÁN.!PTB!EN!MECC TratamientodeDatos!y!Azar.Ing.Jonathan"Quiroga/Tinoco." "

    CONALEP  TEHUACÁN.  PTB  EN  MECC

Tratamiento  de  Datos  y  Azar.  Ing.  Jonathan  Quiroga-­‐Tinoco.  http://www.zonaEMEC.tk  

9

b) DISEÑOS DE MUESTRAS: La única clase de muestras estudiadas hasta ahora son las aleatorias, y no hemos considerado siquiera la necesidad de que en ciertas condiciones pueda haber muestras que sean mejores (digamos más fáciles de obtener, más económicas o mas formativas) que las aleatorias, y no hemos entrado en detalles sobre la pregunta de cuando un muestreo aleatorio es imposible. En estadística un diseño de una muestra es un plan definitivo, determinado por completo antes de recopilar cualquier dato, para tomar una muestra de una población de referencia. Vamos a estudiar las más comunes: 1.- Muestreo Sistemático: En algunos casos la manera más práctica de realizar un muestreo consiste en seleccionar, un primer elemento al azar y luego ir cogiendo cada x-término de una lista, o dejar pasar a x- individuos y preguntar al que sigue y así sucesivamente. Aunque un muestreo sistemático puede no ser aleatorio de acuerdo con la definición, a menudos es razonable tratar las muestras sistemáticas como si fueran aleatorias. El riesgo de los muestreos sistemáticos es el de las periodicidades ocultas. Supongamos que queremos testar el funcionamiento de una máquina, para lo cuál vamos a seleccionar una de cada 15 piezas producidas. Si ocurriera la desgracia de que justamente 1 de cada 15 piezas fuese defectuosa y el error de la máquina fuera defectuoso periódicamente, tendríamos dos posibles resultados muéstrales: - Que falla siempre - Que no falla nunca. 2.- Muestreo Estratificado: Si tenemos información a cerca de una población (es decir de su composición) y esta es importante para nuestra investigación, podemos mejorar el muestreo aleatorio por medio de la estratificación. Este es un procedimiento que consiste en estratificar o dividir la población en un numero de subpoblaciones o estratos. Y seleccionamos de cada estrato una muestra aleatoria. Este procedimiento se conoce como muestreo aleatorio (simple) estratificado. Supongamos una población de tamaño N que se divide en k estratos cuyos tamaños son: N1, N2, .....,Nk (N1 +N2 +.....+Nk =N) Para obtener una distribución proporcional hemos de tener en cuenta que :

Page 10: TRATAMIENTO DE DATOS -  · PDF fileCONALEP!TEHUACÁN.!PTB!EN!MECC TratamientodeDatos!y!Azar.Ing.Jonathan"Quiroga/Tinoco." "

    CONALEP  TEHUACÁN.  PTB  EN  MECC

Tratamiento  de  Datos  y  Azar.  Ing.  Jonathan  Quiroga-­‐Tinoco.  http://www.zonaEMEC.tk  

10

1

1

2

2

nN

nN

nN

nN

k

k

= = = =. . . . . . . de donde se obtiene que iin N

N n= • para

y=1,2,3,4,.... k donde n= tamaño de la muestra. Esta seria una distribución proporcional, pero hay otras formas de distribuir porciones de una muestra entre los distintos estratos, que serían: - Distribución óptima. - Estratificación cruzada. - Muestreo por cuotas. Distribución óptima: En la Distribución optima, no sólo se maneja el tamaño del estrato, como en la distribución proporcional, sino que también se maneja la variabilidad (o cualquier otra característica pertinente) del estrato. La idea de la Distribución óptima, trata de jugar no sólo con el tamaño del estrato, sino que también pretende jugar con la variabilidad del mismo, de forma que parece lógico que los estratos de mayor variabilidad le correspondan muestras mayores. Si σ1, σ2, σ3, ...., σk son las desviaciones típicas de los k-estratos podemos explicar tanto los tamaños de los estratos, así como su variabilidad.

1

1 1

2

2 2

3

3 3 1

nN

nN

nN

nN

k

k k• • •........

•σ σ σ σ= = = =

de donde se obtienen los tamaños muestrales de la distribución óptima o Distribución de Neyman (su inventor) que se obtienen por la fórmula:

ii i

k kn n NN N N=

+ + +• •

• • ....... •σ

σ σ σ1 1 2 2 para y=1,2,...., k

n= n1+n2+.......+nk Estratificación cruzada: La estratificación no se limita a una variable única de clasificación o una característica y las poblaciones a menudo se estratifican atendiendo a diversos criterios de ordenación o clasificación. Así por ejemplo si queremos realizar un estudio entre los alumnos de distintos centros de EE. MM. podríamos estratificar la muestra atendiendo al nivel de estudios, al sexo, a la especialidad,.... Así parte de la muestra se dedicaría a los alumnos de sexo femenino del 1º de Bachillerato técnico, otra parte a los alumnos de sexo masculino de 1º Bachillerato artístico, y así sucesivamente. Así y hasta cierto punto una estratificación de este tipo, llamada estratificación cruzada, incrementará la

Page 11: TRATAMIENTO DE DATOS -  · PDF fileCONALEP!TEHUACÁN.!PTB!EN!MECC TratamientodeDatos!y!Azar.Ing.Jonathan"Quiroga/Tinoco." "

    CONALEP  TEHUACÁN.  PTB  EN  MECC

Tratamiento  de  Datos  y  Azar.  Ing.  Jonathan  Quiroga-­‐Tinoco.  http://www.zonaEMEC.tk  

11

precisión de las estimaciones y otras generalizaciones que se usan comúnmente en el muestreo de opinión y las investigaciones de mercado. Muestreo por cuotas: En el muestreo estratificado, el costo de la toma de muestras aleatorias de los estratos individuales es tan alto, que a los encuestadores sólo se les dan cuotas que deben cubrir de los diferentes estratos, con alguna restricciones (si no es que ninguna) Por ejemplo si se quiere hacer un sondeo sobre la mejora de los servicios de salud, por ejemplo se le pide que encueste a 10 mujeres de entre 35 y 45 años que sean asalariadas, 20 hombres de entre 30 y 45 años que vivan en pisos de 3 o 4 habitaciones, a 3 hombres de mas de 60 años que estén jubilados.... esto es lo que se determina un muestreo por cuotas y es relativamente económico, lo único es que las muestras resultantes no cumplen las características esenciales de las muestras aleatorias. Por tanto estos muestreos, por cuotas en esencia son muestras de opinión, pero no son válidos para realizar un estudio estadístico formal. 3- Muestreo Por Conglomerados: Para ilustrar esta clase de muestreo, supongamos que una gran empresa quiere estudiar los patrones variables de los gastos familiares de una ciudad como Sevilla. Al intentar elaborar los programas de gastos de una muestra de 1200 familias, nos encontramos con la dificultad de realizar un muestreo aleatorio simple, (es complicado tener una lista actualizada de todos los habitantes de una ciudad). Una manera de tomar una muestra en esta situación es dividir el área total (Sevilla en este caso) en áreas más pequeñas que no se solapen (Por ejemplo Distritos postales, manzanas etc..) En este caso seleccionaríamos algunas áreas al azar y todas las familias (o muestras de éstas) que residen en estos distritos postales o manzanas, constituirían la muestra definitiva. En este tipo de muestreo, llamado muestreo por conglomerados, se divide la población total en un número determinado de subdivisiones relativamente pequeñas y se seleccionan al azar algunas de estas subdivisiones o conglomerados, para incluirlos en la muestra total. Si estos conglomerados coinciden con áreas geográficas, este muestreo se llama también muestreo por áreas. Aunque las estimaciones basadas en el muestreo por conglomerados, por lo general no son tan fiables como las obtenidas por muestreos aleatorios simples del mismo tamaño, son más baratas. Volviendo al ejemplo anterior, es mucho más económico visitar a familias que viven en el mismo vecindario, que ir visitando a familias que viven en un área muy extensa. En la práctica se pueden combinar el uso de varios de los métodos de muestreo que hemos analizados para un mismo estudio.

Page 12: TRATAMIENTO DE DATOS -  · PDF fileCONALEP!TEHUACÁN.!PTB!EN!MECC TratamientodeDatos!y!Azar.Ing.Jonathan"Quiroga/Tinoco." "

    CONALEP  TEHUACÁN.  PTB  EN  MECC

Tratamiento  de  Datos  y  Azar.  Ing.  Jonathan  Quiroga-­‐Tinoco.  http://www.zonaEMEC.tk  

12

DISTRIBUCIONES DE FRECUENCIA Y TABLAS ESTADISTICAS. Sea cual sea el tipo de variable, lo que se tiene como información de una variable en una muestra es un número finito n de datos, es decir, de valores o de anotaciones sobre qué modalidad (cualitativas) o qué valor (cuantitativas) tiene cada elemento de la muestra; a este conjunto de datos se le llama distribución y, salvo cuando el tamaño de muestra n sea muy pequeño, se debe resumir para que el lector pueda comprender bien los resultados. Un primer y obligado paso de ese resumen de datos es el simple recuento de las repeticiones de un mismo valor o modalidad; ello nos conduce al concepto fundamental de frecuencia, con dos enfoques: - Frecuencia absoluta es el número de veces que una modalidad o un valor de una variable aparece entre los datos de una muestra; si en una muestra de la variable “nivel de estudios” aparecen 148 personas con nivel de estudios “superiores”, diremos que 148 es la frecuencia absoluta de la modalidad “superiores”. Naturalmente, el número total de datos es n y, por tanto, la suma de las frecuencias absolutas de todas las modalidades o valores debe ser igual al tamaño muestral n. - Frecuencia relativa de una modalidad o valor de una variable es su frecuencia absoluta dividida entre el tamaño muestral, es decir, la proporción de veces que aparece esa modalidad o valor entre todos los datos de la muestra; si la frecuencia absoluta 148 del ejemplo anterior corresponde a una muestra de 2000 personas, diremos que la frecuencia relativa de la modalidad AB es 148/2000 = 0.074. Es claro que la suma de las frecuencias relativas de todas las modalidades o valores debe ser 1, ya que las absolutas suman n y estamos dividiendo entre n. Es muy habitual expresar las frecuencias relativas como porcentajes (multiplicándolas por cien) y entonces la frecuencia relativa del ejemplo sería 7.4 % y la condición de la suma sería que deben sumar 100 %, lo que se entiende mejor (la frecuencia relativa es la parte del total de datos que corresponde a cada valor o modalidad). Las frecuencias absolutas y relativas son aplicables a cualquier tipo de variable, y de ahí su importancia; además, pese a su simplicidad, dan lugar a conceptos muy importantes, como el de proporción, y son la base sobre la que se construye cualquier resumen de los datos. Usando como ejemplo el grupo sanguíneo en una muestra de doscientas personas, la tabla siguiente sirve para resumir lo que, si no, sería una tediosa lista de doscientos grupos sanguíneos:

Grupo sanguíneo de una muestra de 200 personas. Modalidades Frecuencia absoluta Frecuencia relativa (%) O 85 0.425 (42.5%) A 53 0.265 (26.5%) B 48 0.240 (24.0%) AB 14 0.070 ( 7.0%) Totales 200 1.000 (100%)

Page 13: TRATAMIENTO DE DATOS -  · PDF fileCONALEP!TEHUACÁN.!PTB!EN!MECC TratamientodeDatos!y!Azar.Ing.Jonathan"Quiroga/Tinoco." "

    CONALEP  TEHUACÁN.  PTB  EN  MECC

Tratamiento  de  Datos  y  Azar.  Ing.  Jonathan  Quiroga-­‐Tinoco.  http://www.zonaEMEC.tk  

13

Una tabla como esta se denomina distribución de frecuencias, y puede incluir también las llamadas frecuencias acumulativas, que son la suma de las frecuencias del valor o modalidad que se considere y de todos los anteriores; puede haber frecuencias acumulativas absolutas o relativas, y en todo caso sólo tienen sentido con variables cuantitativas o cualitativas ordinales, ya que hay que poder fijar cuales son los valores o modalidades “anteriores”. Así, por ejemplo, las frecuencias acumulativas no son definibles en el ejemplo del grupo sanguíneo, que es una variable cualitativa pura. Veamos un ejemplo donde sí lo son, de una variable cuantitativa discreta. En este segundo ejemplo, cuya tabla se encuentra a continuación, el número n de datos es 500 y la variable toma seis valores distintos (0,1,2,3,4 y 5) en la muestra. No se deben confundir los valores de la variable, que son el número de visitas (ninguna, una, dos, etc.) de cada persona a la biblioteca en ese mes, con las frecuencias absolutas, que son el número de personas cuyo número de visitas es uno determinado: que 210 sea la frecuencia absoluta del valor 0 quiere decir que de entre las 500 personas consideradas en el estudio 210 no han ido ninguna vez a la biblioteca en ese mes, es decir, que el valor de la variable es "cero" para ellas; esta frecuencia absoluta 210 supone el 42% de 500, por lo que 0.42 ó 42% es la frecuencia relativa del valor 0 de la variable.

1. Visitas mensuales a una biblioteca de una muestra de 500 usuarios inscritos

Valores Frec. absoluta Frec. relativa Frec. absol.

acumulativa Frec.

relat.acumulativa 0 210 42.0% 210 42.0% 1 178 35.6% 388 77.6% 2 68 13.6% 456 91.2% 3 24 4.8% 480 96.0% 4 14 2.8% 494 98.8% 5 6 1.2% 500 100.0%

Totales 500 100% Por lo que se refiere a las frecuencias acumuladas o acumulativas (es lo mismo), y usando como ejemplo las que se recogen en la tabla, podemos observar que las frecuencias acumuladas del primer valor coinciden con las 210 y 42% ya comentadas para ese valor, lo que es lógico porque no hay ningún valor anterior con cuyas frecuencias sumarlas; a partir del segundo renglón sí tenemos acumulación (388=210+178 y 77.6% = 42.0% + 35.6%), para el tercer valor se suman tres sumandos y así sucesivamente. Nótese que las últimas frecuencias acumuladas tienen que coincidir con el número de datos válidos total (en este ejemplo 500) y con el 100%, ya que se han sumado todas las frecuencias absolutas y relativas, respectivamente.

Page 14: TRATAMIENTO DE DATOS -  · PDF fileCONALEP!TEHUACÁN.!PTB!EN!MECC TratamientodeDatos!y!Azar.Ing.Jonathan"Quiroga/Tinoco." "

    CONALEP  TEHUACÁN.  PTB  EN  MECC

Tratamiento  de  Datos  y  Azar.  Ing.  Jonathan  Quiroga-­‐Tinoco.  http://www.zonaEMEC.tk  

14

En el caso de las variables continuas, el número de valores distintos que puede tomar la variable es infinito, teóricamente, y en la práctica puede ser bastante grande: piénsese que si medimos, por ejemplo, la estatura en centímetros de una muestra de personas adultas podemos tener fácilmente sesenta o setenta valores distintos. Esto provoca que a menudo las tablas tuvieran que ser muy extensas, con muchísimos renglones, lo que las haría inútiles por incomprensibles. Para evitarlo, se hacen agrupaciones de varios valores ( por ejemplo, las estaturas 160, 161, 162, 163 y 164 se pueden agrupar en el intervalo 160-164); de esta forma, se pueden encontrar tablas construídas agrupando los valores en intervalos cuando hay muchos valores entre el mínimo y el máximo; el concepto importante es entonces el de marca de clase o valor medio del intervalo, que es, por ejemplo, 162 en el caso citado del intervalo 160-164. Además, es muy conveniente que los intervalos tengan todos la misma longitud. En las tablas así, con clases, las frecuencias se dan para cada intervalo, pero no para cada valor de la variable; podemos saber, por ejemplo, que en una muestra hay 32 personas que miden entre 160 y 164 cm., pero no cuántas de ellas miden en particular 163 cm.; hay, por tanto, una pérdida de información con respecto a lo que sería una tabla detallada. Por esta razón, y gracias a los avances de la Informática que permiten almacenar muchos valores y trabajar con ellos rápidamente, las tablas con intervalos ya no se usan, como hasta hace pocos años, para realizar cálculos sobre la variable, sino que su utilidad queda reducida a la mejor comprensión de las tablas y a la elaboración de gráficos. Todo ello significa que las ganancias en comprensión al hacer intervalos se corresponden necesariamente con pérdidas de información (se pierde el detalle) y por ello para los cómputos numéricos se usan los datos originales de uno en uno, mientras que para tablas y gráficas es frecuente usar intervalos.

Page 15: TRATAMIENTO DE DATOS -  · PDF fileCONALEP!TEHUACÁN.!PTB!EN!MECC TratamientodeDatos!y!Azar.Ing.Jonathan"Quiroga/Tinoco." "

    CONALEP  TEHUACÁN.  PTB  EN  MECC

Tratamiento  de  Datos  y  Azar.  Ing.  Jonathan  Quiroga-­‐Tinoco.  http://www.zonaEMEC.tk  

15

TIPOS DE GRÁFICOS

Gráficos lineales

En este tipo de gráfico los valores de los datos se representan en dos ejes cartesianos. Se pueden usar para representar una, dos o más series, o para representar cambios en relación al tiempo; son apropiados para comparar un rasgo a lo largo del tiempo. Generalmente, se utilizan cuando se cuenta con una o varias series de datos largos, con muchos puntos ya que permite observar los cambios en las tendencias.

Las líneas se diferencian mediante el uso de distintos colores o trazos. Se representan en el eje horizontal para una mejor lectura.

La variable independiente (X) se coloca en el eje de abscisas y la variable dependiente (Y) en el eje de ordenadas.

VARIABLES DISCRETAS

Para el caso de variables discretas, estos son los tipos de gráficos más utilizados:

Gráficos circulares

Diagrama de sectores o superficies representativas

Los gráficos circulares son los más útiles para mostrar como se relacionan las partes con el todo. Expresan la proporción de un todo dividido en partes. Se sirven del círculo

Page 16: TRATAMIENTO DE DATOS -  · PDF fileCONALEP!TEHUACÁN.!PTB!EN!MECC TratamientodeDatos!y!Azar.Ing.Jonathan"Quiroga/Tinoco." "

    CONALEP  TEHUACÁN.  PTB  EN  MECC

Tratamiento  de  Datos  y  Azar.  Ing.  Jonathan  Quiroga-­‐Tinoco.  http://www.zonaEMEC.tk  

16

para expresar las diferentes magnitudes. Se recomienda no utilizar más de siete sectores y así como que la porción más pequeña no debe ser menor del 5%.

En este gráfico, los tamaños de los sectores le muestran una rápida impresión de los tamaños relativos - cuales porciones son más grandes, más pequeñas, o de casi el mismo tamaño y qué partes integran la mayor parte del total -, se obtienen los valores de esas dimensiones de forma más exacta si se incluyen porcentajes como parte de las etiquetas de los datos.

Este gráfico es recomendable cuando no existen muchas divisiones, ya que de lo contrario dificultaría su visualización.

Gráficos de barras

Los gráficos de columnas o barras son útiles para mostrar como los puntos de los datos están relacionados uno con el otro. Es mucho más fácil de ver como se compara cada columna con las otras, que los sectores de un gráfico circular.

Un gráfico de columna tiene más características que las que tiene un gráfico circular.

Es una representación muy usada por su versatilidad. Las barras deben estar separadas para evidenciar que los valores recogidos en la abscisa son categorías discontinuas. Normalmente, se utilizan para comparar distintos grupos. Con el propósito de facilitar su legibilidad, es recomendable no sobrecargar el gráfico con demasiadas barras o columnas. Se sugiere utilizar colores, sombras o rayados para diferenciar.

Page 17: TRATAMIENTO DE DATOS -  · PDF fileCONALEP!TEHUACÁN.!PTB!EN!MECC TratamientodeDatos!y!Azar.Ing.Jonathan"Quiroga/Tinoco." "

    CONALEP  TEHUACÁN.  PTB  EN  MECC

Tratamiento  de  Datos  y  Azar.  Ing.  Jonathan  Quiroga-­‐Tinoco.  http://www.zonaEMEC.tk  

17

La diferencia con los de líneas es que son mejores para períodos más cortos de tiempo y cuando hay grandes cambios entre un período y el siguiente.

Existen diversos tipos de gráficos de barras:

Gráficos de barras verticales

Representan valores usando trazos verticales, aislados o no unos de otros, según la variable a graficar sea discreta o continua. Pueden usarse para representar: una, dos o más series (también llamado de barras comparativas).

Gráficos de barras horizontales

Representan valores discretos a base de trazos horizontales, aislados unos de otros. Se utilizan cuando los textos correspondientes a cada categoría son muy extensos.

Page 18: TRATAMIENTO DE DATOS -  · PDF fileCONALEP!TEHUACÁN.!PTB!EN!MECC TratamientodeDatos!y!Azar.Ing.Jonathan"Quiroga/Tinoco." "

    CONALEP  TEHUACÁN.  PTB  EN  MECC

Tratamiento  de  Datos  y  Azar.  Ing.  Jonathan  Quiroga-­‐Tinoco.  http://www.zonaEMEC.tk  

18

Gráficos de barras comparativas

Se utilizan para comparar dos o más series, para comparar valores entre categorías.

Page 19: TRATAMIENTO DE DATOS -  · PDF fileCONALEP!TEHUACÁN.!PTB!EN!MECC TratamientodeDatos!y!Azar.Ing.Jonathan"Quiroga/Tinoco." "

    CONALEP  TEHUACÁN.  PTB  EN  MECC

Tratamiento  de  Datos  y  Azar.  Ing.  Jonathan  Quiroga-­‐Tinoco.  http://www.zonaEMEC.tk  

19

Gráficos de barras apiladas o compuestas

Se usan para mostrar las relaciones entre dos o más series con el total. Los gráficos de columnas apiladas muestran cada serie de datos como un porcentaje del total. Permiten estudiar cómo cambian a lo largo del tiempo los componentes de un elemento.

VARIABLES CONTINUAS

Histograma

El área de los rectángulos es proporcional a la frecuencia representada. Habitualmente figuran en el eje de abscisas en intervalos fijos, siempre iguales.

Un histograma es un gráfico de barras de una distribución de frecuencia. En el eje “X”se escribe normalmente el intervalo de clases y en la “Y” el número de observaciones.

Page 20: TRATAMIENTO DE DATOS -  · PDF fileCONALEP!TEHUACÁN.!PTB!EN!MECC TratamientodeDatos!y!Azar.Ing.Jonathan"Quiroga/Tinoco." "

    CONALEP  TEHUACÁN.  PTB  EN  MECC

Tratamiento  de  Datos  y  Azar.  Ing.  Jonathan  Quiroga-­‐Tinoco.  http://www.zonaEMEC.tk  

20

Se construye uniendo los puntos medios altos de los intervalos del histograma y da lugar a una línea quebrada que delimita un área de la misma extensión que esté definida por el histograma.

Page 21: TRATAMIENTO DE DATOS -  · PDF fileCONALEP!TEHUACÁN.!PTB!EN!MECC TratamientodeDatos!y!Azar.Ing.Jonathan"Quiroga/Tinoco." "

    CONALEP  TEHUACÁN.  PTB  EN  MECC

Tratamiento  de  Datos  y  Azar.  Ing.  Jonathan  Quiroga-­‐Tinoco.  http://www.zonaEMEC.tk  

21

OTROS TIPOS DE GRÁFICOS

Gráficos de dispersión

Los diagramas de dispersión o gráficos de correlación permiten estudiar la relación entre dos variables. Dadas dos variables “X” e “Y”, se dice que existe una correlación entre ambas si cada vez que aumenta el valor de “X” aumenta proporcionalmente el valor de “Y” (correlación positiva) o si cada vez que disminuye el valorde “X” disminuye en igual proporción el valor de “Y” (correlación negativa).

En un gráfico de correlación se representa cada par (X, Y) como un punto donde se cortan las coordenadas de “X” e “Y .

Semilogarítmicos

Se denominan semilogarítmicos cuando la escala vertical es logarítmica y la horizontal es aritmética, es útil cuando es preciso destacar las variaciones relativas, más que las absolutas.

Ventajas de los gráficos semilogarítmicos:

• Una curva de tipo exponencial se convierte en una línea recta cuando se construye en papel semilogarítmico.

• El diagrama correspondiente a toda serie cuyo tanto por ciento de aumento o de disminución sea constante, es también una línea recta.

• Las variaciones relativas iguales están representadas por líneas de igual inclinación. Por lo tanto, dos series cuyos valores aumentan o disminuyen de igual modo vendrán representadas por dos líneas paralelas.

Page 22: TRATAMIENTO DE DATOS -  · PDF fileCONALEP!TEHUACÁN.!PTB!EN!MECC TratamientodeDatos!y!Azar.Ing.Jonathan"Quiroga/Tinoco." "

    CONALEP  TEHUACÁN.  PTB  EN  MECC

Tratamiento  de  Datos  y  Azar.  Ing.  Jonathan  Quiroga-­‐Tinoco.  http://www.zonaEMEC.tk  

22

• Para comparar las razones de variabilidad de dos o más series basta comparar las inclinaciones de las líneas que las representan.

• La división semilogarítmica permite la construcción de las magnitudes absolutas y, simultáneamente, la comparación de las variaciones relativas.

• Mediante dicho trazado, puede realizarse la comparación de series que solamente se diferencian en la magnitud propia de los valores de cada una.

Sobre esta clase de diagramas puede leerse directamente el porcentaje de variación y determinarse directamente también la relación en porcentaje de las magnitudes.

El gráfico semilogarítmico por medio de sus líneas guía (que son las que representan los porcentajes), muestra la tasa de crecimiento o disminución de la gráfica y en que porcentaje.

Diagrama de siluetas o gráfica de saldos

Este tipo de gráfico indica las desviaciones ( positivas o negativas), respecto a una base (línea del 0 o del 100), como el área comprendida entre la poligonal y la línea base. En esta forma se destacan fácilmente los datos que implicanuna fuerte variación.

Se usan especialmente para destacar los resultados del ejercicio fiscal o comercial (déficit o superávit), los de la balanza de pagos o comercial, y otros similares.

Page 23: TRATAMIENTO DE DATOS -  · PDF fileCONALEP!TEHUACÁN.!PTB!EN!MECC TratamientodeDatos!y!Azar.Ing.Jonathan"Quiroga/Tinoco." "

    CONALEP  TEHUACÁN.  PTB  EN  MECC

Tratamiento  de  Datos  y  Azar.  Ing.  Jonathan  Quiroga-­‐Tinoco.  http://www.zonaEMEC.tk  

23

Gráfico de máximos y mínimos

Este gráfico generalmente se utiliza para señalar variaciones de precios o temperaturas, indica las fluctuaciones máximas y mínimas del fenómeno, e incluso alguna otra característica, como valor medio y precio de cierre de las cotizaciones bursátiles, etc.

Page 24: TRATAMIENTO DE DATOS -  · PDF fileCONALEP!TEHUACÁN.!PTB!EN!MECC TratamientodeDatos!y!Azar.Ing.Jonathan"Quiroga/Tinoco." "

    CONALEP  TEHUACÁN.  PTB  EN  MECC

Tratamiento  de  Datos  y  Azar.  Ing.  Jonathan  Quiroga-­‐Tinoco.  http://www.zonaEMEC.tk  

24

Gráficos polares

Este tipo de gráfico se emplea generalmente para representar fenómenos de los que se poseen cifras mensuales constantemente crecientes.

Para interpretar este tipo de gráfico, se fija una meta y luego se analiza cuáles están más cerca y cuáles más alejados de dicha meta. Por ejemplo, en el gráfico que se muestra a continuación, la meta sería, que países están más cerca o más lejos de tener una tasa de mortalidad infantil igual a cero, y se puede observar que los más cercanos son Costa Rica y Panamá, luego le seguiría Belice, México, El Salvador y el más alejado sería Guatemala.

Page 25: TRATAMIENTO DE DATOS -  · PDF fileCONALEP!TEHUACÁN.!PTB!EN!MECC TratamientodeDatos!y!Azar.Ing.Jonathan"Quiroga/Tinoco." "

    CONALEP  TEHUACÁN.  PTB  EN  MECC

Tratamiento  de  Datos  y  Azar.  Ing.  Jonathan  Quiroga-­‐Tinoco.  http://www.zonaEMEC.tk  

25

Pictogramas

Los pictogramas son similares a los gráficos de barras, pero empleando un dibujo en una determinada escala para expresar la unidad de medida de los datos. Generalmente, este dibujo debe cortarse para representar los datos. Es común ver gráficos de barras donde las barras se reemplazan por dibujos a diferentes escalas con el único fin de hacerlos más vistosos, pero esto no los convierte en un pictograma. Pueden ser: en dos o en tres dimensiones.

POBLACIÓN A NIVEL ESTADO CENSOS ANUALES

CENSO 2010 3.0 millones de habitantes

CENSO 2011 4.4 millones de habitantes

CENSO 2012 5.2 millones de habitantes

CENSO 2013 6.1 millones de habitantes

Page 26: TRATAMIENTO DE DATOS -  · PDF fileCONALEP!TEHUACÁN.!PTB!EN!MECC TratamientodeDatos!y!Azar.Ing.Jonathan"Quiroga/Tinoco." "

    CONALEP  TEHUACÁN.  PTB  EN  MECC

Tratamiento  de  Datos  y  Azar.  Ing.  Jonathan  Quiroga-­‐Tinoco.  http://www.zonaEMEC.tk  

26

Reglas fundamentales para la construcción de los pictogramas estadísticos:

• Los símbolos deben explicarse por si mismos. • Las cantidades mayores se indican por medio de un número mayor de símbolos. • Los diagramas comparan cantidades aproximadas, no detalles minuciosos. • Los pictogramas sólo deben utilizarse para hacer comparaciones, no

afirmaciones aisladas.

Gráficos de áreas

En estos tipos de gráficos se busca mostrar la tendencia de la información, generalmente en un período de tiempo. Pueden usarse para:

• Representar una serie. • Representar dos o más series. • Representar en dos o tres dimensiones.

Page 27: TRATAMIENTO DE DATOS -  · PDF fileCONALEP!TEHUACÁN.!PTB!EN!MECC TratamientodeDatos!y!Azar.Ing.Jonathan"Quiroga/Tinoco." "

    CONALEP  TEHUACÁN.  PTB  EN  MECC

Tratamiento  de  Datos  y  Azar.  Ing.  Jonathan  Quiroga-­‐Tinoco.  http://www.zonaEMEC.tk  

27

ACTIVIDADES DE EVIDENCIA NÚMERO 2

1. Síntesis de información. De las hojas previas elabore un apunte en su libreta, de manera individual que contenga la información más relevante con respecto a:

a) Definiciones y conceptos descritos durante el tutorial b) Fórmulas desarrolladas c) Tablas importantes d) Ejemplos relevantes e) Gráficos indispensables

2. Ejemplificación de casos. Por cada ejemplo que haya ubicado dentro del tutorial proceda a desarrollar cinco casos similares propios, pueden ser de cualquier situación de la vida cotidiana. 3. Ejemplos de graficación. Por cada tipo distinto de gráfico proponga otros cinco ejemplos similares de cualquier situación de la vida cotidiana. 4. Actividades de evaluación. Complete los siguientes reactivos:

4.1 Ubique alguna situación de la vida diaria referente a información estadística. Lo podrás reconocer por la presencia de gráficos de números, como promedios, porcentajes, etcétera. Analice los recortes obtenidos y escriba en tu cuaderno las siguientes observaciones:

a) ¿Qué variables se estudian de la población? b) ¿Qué características se reportan? c) ¿Cómo crees que se obtuvo la información? d) ¿Qué inferencia o conclusión se desprende del trabajo estadístico reportado?

4.2 Iván es un alumno de la UNAM y ha participado en los concursos deportivos que la Institución organiza cada año. Iván es un corredor de los cien metros planos y cada vez que corre se impone un nuevo récord. Los tiempos que ha establecido se muestran en la siguiente tabla:

Participación Tiempo en segundos 1 11.2 2 10.8 3 10.7 4 10.5 5 10.3 6 10.2 7 10.1

Page 28: TRATAMIENTO DE DATOS -  · PDF fileCONALEP!TEHUACÁN.!PTB!EN!MECC TratamientodeDatos!y!Azar.Ing.Jonathan"Quiroga/Tinoco." "

    CONALEP  TEHUACÁN.  PTB  EN  MECC

Tratamiento  de  Datos  y  Azar.  Ing.  Jonathan  Quiroga-­‐Tinoco.  http://www.zonaEMEC.tk  

28

Analice el ejemplo de los maestros y en base a los conceptos estudiados, conteste en la línea las siguientes preguntas de este ejemplo:

a) ¿Cuántas observaciones se tienen? b) ¿Cuántos datos son del problema? c) ¿Cuántos elementos tiene la muestra? d) ¿Cuál sería la población?

4.3 Con sus propias palabras defina:

a) Variable cualitativa nominal: b) Variable cualitativa ordinal: c) Escribe en tu cuaderno cinco ejemplos donde la variable que se analiza sea: “Cualitativa nominal”. d) Escribe cinco ejemplos donde la variable que se investiga se: “Cualitativa ordinal”.

4.4 El director del hospital del ISSSTE desea saber el número de pacientes atendidos en la sala de Urgencias, en el mes de septiembre, y para ello se obtuvieron los siguientes datos:

18, 25, 15, 30, 22, 27, 15, 18, 21, 19, 28, 27, 16, 19, 18, 30, 17, 16, 20, 15, 14, 19, 23, 27, 17, 14, 16, 20, 21, 28,

a) ¿Cuál es la variable que se investiga? b) ¿Qué tipo de variable es? c) Si solamente hay dos doctores en la sala, ¿qué decisión tomarías si tu fueras el Director? ¿Por qué?

4.5 Analiza el siguiente problema y establece todas las variables que consideres importantes, clasifícalas y determina el tipo de escala que se usaría en cada una. El 16 de septiembre del año pasado, se llevó a cabo el maratón de la libertad; en él participaron 15 mil maratonistas, quienes por su esfuerzo todos recibieron una medalla de participación y los premios que se repartieron fueron los siguientes:

• 1er. lugar: $ 1,000,000.00 en efectivo • 2do. lugar: una residencia • 3er. lugar: un auto de lujo • 4to. lugar: un auto compacto • 5to. lugar: una motocicleta

4.6 La maestra de orientación de una Universidad pública dio una conferencia al grupo de Conalep sobre las características y bondades de las carreras de Ingeniería (I), Química (Q), Metalúrgica (M) y Actuaría (A). Al final de la conferencia pidió que llenaran un cuestionario donde especificaron además de

Page 29: TRATAMIENTO DE DATOS -  · PDF fileCONALEP!TEHUACÁN.!PTB!EN!MECC TratamientodeDatos!y!Azar.Ing.Jonathan"Quiroga/Tinoco." "

    CONALEP  TEHUACÁN.  PTB  EN  MECC

Tratamiento  de  Datos  y  Azar.  Ing.  Jonathan  Quiroga-­‐Tinoco.  http://www.zonaEMEC.tk  

29

los datos personales, la carrera de preferencia. Se obtuvieron los siguientes resultados:

I, A, M, Q, Q, M, A, I, M, Q, A, Q, I, Q, M, Q, M, M, A, Q, I, Q, M, I, I, Q, M, M, A, I,

M, A, A, Q, I, M, Q, Q, A, M, A, Q, M, A, Q En base a los datos del problema contesta lo siguiente:

a) Establece la variable que se analiza b) ¿Qué tipo de variable es? c) ¿Qué tipo de escala define la variable?

4.7 El gerente de una Empresa, Kimberly preocupado por el pago de energía consumida solicito al jefe de planta, un estudio del consumo diario durante el mes de agosto. Los resultados obtenidos. KW/hr (kilowatts por hora) son los siguientes:

Del problema anterior contesta las siguientes preguntas:

a) Define la variable del problema: b) ¿Qué tipo de variable es? c) ¿Qué valores toma la variable? d) ¿Qué tipo de escala define la variable? e) ¿Cuál es la mayor frecuencia de la variable? f) ¿Qué frecuencia tiene la variable cuya categoría es 10?

4.8 El siguiente estudio muestra los resultados del examen aplicado a 100 obreros de la fábrica de vidrio "El Fanal". Analiza la tabla que se muestra a continuación y contesta las siguientes preguntas:

a) ¿Cuál es la variable del problema? b) ¿Qué escala define a la variable? c) ¿Qué puntuación tiene la mayor frecuencia?

Page 30: TRATAMIENTO DE DATOS -  · PDF fileCONALEP!TEHUACÁN.!PTB!EN!MECC TratamientodeDatos!y!Azar.Ing.Jonathan"Quiroga/Tinoco." "

    CONALEP  TEHUACÁN.  PTB  EN  MECC

Tratamiento  de  Datos  y  Azar.  Ing.  Jonathan  Quiroga-­‐Tinoco.  http://www.zonaEMEC.tk  

30

d) ¿Qué porcentaje de obreros reprobó el examen si la calificación aprobatoria es de 6 a 10? e) De este resultado, ¿qué puede inferir el jefe del departamento de capacitación?

4.9 Del siguiente problema representa los datos en una gráfica circular indicando el porcentaje correspondiente a cada categoría. Un transporte cargó su camión con los siguientes productos:

• Producto A - 450 kg. • Producto B - 300 kg. • Producto C - 500 kg. • Producto D - 1600 kg. • Producto E – 1750 kg.

4.10 Representa el mismo problema en una gráfica de barras horizontales y contesta las siguientes preguntas:

a) ¿Cuál es la variable del problema? b) ¿Qué tipo de variable es? c) ¿En cuántas categorías se clasificó la variable? d) ¿Cuál es la frecuencia de la más alta calificación? e) ¿Qué gráfico es más útil para este problema? ¿por qué?

5. De manera personal, elabore en forma de ensayo una cuartilla a manera de conclusión sobre el presente tutorial dónde explique con sus propias palabras elementos como:

a) Importancia y utilidad de la Estadística b) Conceptos más importantes del tutorial c) ¿Dónde podemos utilizar a la Estadística en nuestra vida diaria