Problemario de Estadística y Probabilidad · 6. Indice de precios al consumidor. 7. Cifras...

38
Estadística y Probabilidad La Estadística estudia las reglas para recopilar, organizar, procesar, presentar e interpretar datos; es un conjunto de técnicas que, partiendo de la observación de fenómenos, permiten al investigador obtener conclusiones útiles sobre ellos; es el arte y la ciencia de aprender a partir de los datos. Toda persona que toma decisiones debe hacerlo bajo condiciones de incertidumbre, en mayor o menor grado. El propósito central del análisis estadístico moderno es la toma de decisiones en condiciones de incertidumbre. Los datos no faltan, la manera de almacenarlos ha cambiado con el uso de las computadoras. Pero los datos por si solos no sirven si no somos capaces de obtener información y conocimiento a partir de ellos. La información y el conocimiento obtenido de los datos sirven para la toma de decisiones estratégicas, tácticas y operativas. En su metodología de estudio, la Estadística, repite varias veces el siguiente ciclo:

Transcript of Problemario de Estadística y Probabilidad · 6. Indice de precios al consumidor. 7. Cifras...

Estadística y Probabilidad La Estadística estudia las reglas para recopilar, organizar, procesar, presentar e interpretar datos; es un conjunto de técnicas que, partiendo de la observación de fenómenos, permiten al investigador obtener conclusiones útiles sobre ellos; es el arte y la ciencia de aprender a partir de los datos.

Toda persona que toma decisiones debe hacerlo bajo condiciones de incertidumbre, en mayor o menor grado. El propósito central del análisis estadístico moderno es la toma de decisiones en condiciones de incertidumbre. Los datos no faltan, la manera de almacenarlos ha cambiado con el uso de las computadoras. Pero los datos por si solos no sirven si no somos capaces de obtener información y conocimiento a partir de ellos. La información y el conocimiento obtenido de los datos sirven para la toma de decisiones estratégicas, tácticas y operativas. En su metodología de estudio, la Estadística, repite varias veces el siguiente ciclo:

Aplicaciones de la Estadística. Las primeras aplicaciones de la estadística fueron los asuntos de gobierno y los juegos de azar, posteriormente la utilizaron las compañías de seguros, después siguieron los comerciantes, los empresarios y los educadores. Actualmente es difícil indicar profesiones o actividades donde no se pueda aplicar la estadística. La estadística es aplicable a cualquier campo científico o tecnológico en el que se puedan hacer observaciones, a continuación se presenta una lista de campos de aplicación más específico:

1. Demanda de energía (series temporales). 2. Capacidad hidrológica de un país. 3. Tolerancia y control de calidad de un producto. 4. Fiabilidad y duración de equipos y maquinaria. 5. Mejora de cultivos agrícolas. 6. Indice de precios al consumidor. 7. Cifras macroeconómicas de un país. 8. Texturas y coloración de telas. 9. Predicción meteorológica. 10. Proyecciones demográficas. 11. Ensayos clínicos de medicamentos. 12. Procesos de transmisión de señales. 13. Valoración docente. 14. Procesos de difusión. 15. Censos de población y vivienda. 16. Investigación social y económica. 17. Contraste de hipótesis. 18. Análisis de supervivencia. 19. Diseño de experimentos. 20. Simulación en cualquier ciencia. 21. Ensayo de materiales. 22. Procesos de mejora industrial. 23. Muestreos de aceptación. 24. Cambios climáticos y ecología. 25. Epidemiología. 26. Nutrición. 27. Evolución de precios, demandas y costos. 28. Consumo y marketing.

29. Encuestas electorales. 30. Estudios de opinión. 31. Climas laborales y sociales. 32. Pruebas de psicología. 33. Estudios biotecnológicos. 34. Migración de la población. 35. Estudio de la población laboralmente activa. Etcétera.

La Estadística se divide en dos grandes ramas: la Estadística Descriptiva o Deductiva y la Inferencia Estadística o Estadística Inferencial:

La Estadística Descriptiva o Estadística Deductiva es el método para obtener, de un conjunto de datos, conclusiones sobre los mismos. Incluye las técnicas para recolectar, presentar y analizar datos.

La Inferencia Estadística o Estadística Inferencial es el método y conjunto de técnicas para obtener conclusiones sobre un conjunto de datos (población) utilizando una parte de ellos (muestra).

Cuestionario: 1. Subraya la respuesta correcta: Es el arte y la técnica de aprender a partir de los datos. a. La Informática b. La Teoría c. La Tecnología d. La Estadística

2. Escribe el número que corresponda para ordenar los pasos del proceso metodológico de la Estadística: Obtención de los datos para resolver el problema. ( ) Obtención y formulación de conclusiones. ( ) Diseño de un plan de solución. ( ) Definición del Problema. ( ) Análisis de los datos. ( ) 3. Subraya la respuesta correcta: ¿Qué debemos obtener a partir de los datos? a. Trabajo y entretenimiento. b. Pérdida de tiempo e incertidumbre. c. Cultura y arte. d. Información y conocimiento. 4. Subraya la respuesta correcta: Primeras aplicaciones de la Estadística. a. Estudios de opinión y encuestas electorales. b. Asuntos de gobierno y juegos de azar. c. los cambios climáticos y ecología. d. El control de calidad y la aceptación de un producto.

5. Subraya la respuesta correcta: Conjunto de Técnicas que permiten obtener conclusiones útiles sobre los datos. a. La Comunicación b. La Sabiduría c. La Estadística d. La Información. 6. Subraya la palabra que completa correctamente la siguiente expresión: La Estadística ______________ es el método para obtener, de un conjunto de datos, conclusiones sobre los mismos. Incluye las técnicas para recolectar, presentar y analizar datos. a. Informal b. Inferencial c. Descriptiva d. Detallada

7. Subraya la respuesta correcta: ¿Cuál es el propósito central del Análisis Estadístico Moderno? a. El almacenamiento oportuno de los datos. b. La toma de decisiones en condiciones de incertidumbre. c. La recopilación completa de los datos. d. El procesamiento de mucha información. 8. Subraya la palabra que completa correctamente la siguiente expresión: La _______________ Estadística es el método y conjunto de técnicas para obtener conclusiones sobre un conjunto de datos (población) utilizando una parte de ellos (muestra). a. Competencia b. Ocupación c. Analogía d. Inferencia 9. Subraya la respuesta correcta: Estudia las reglas para recopilar, organizar, procesar, presentar e interpretar datos. a. La Informática b. La Estadística c. La Probabilidad d. La Tecnología

Datos y Variables Si seleccionamos un grupo de 5 personas podemos observar que tienen características comunes: altura, peso, edad, color de ojos, color de pelo, grado de escolaridad, sexo, etc. Estas características aunque son comunes no son iguales para todos, por lo que se les llaman variables y al valor cuantitativo o cualitativo de estas variables, en cada persona, se llama dato. Esto se puede apreciar en la siguiente tabla, donde se muestran algunas variables y algunos datos:

Nombre Altura

(m)

Peso

(kg)

Color de

Ojos

Edad

(años)

Sexo

Juan 1.73 82 Café 30 Masculino

Pedro 1.68 77 Verde 17 Masculino

Irma 1.66 64 Café 19 Femenino

José 1.69 75 Café 23 Masculino

Matilde 1.67 63 Azul 21 Femenino

Como puede observarse, las características comunes de un grupo de personas, animales o cosas, se llaman variables y los valores cuantitativos o cualitativos que pueden tomar son los datos.

Variables

Datos (Correspondientes a la altura)

Datos (Correspondientes al peso)

Datos (Correspondientes al color de ojos)

Por el tipo de valores que pueden tomar las variables (y sus datos) se clasifican en cualitativas y cuantitativas, las cuantitativas a su vez se dividen en variables continuas y discretas y las cualitativas en nominales y ordinales.

Variables Cualitativas. Sus valores son nombres o cualidades de personas animales o cosas, no se pueden hacer operaciones aritméticas con ellos.

Variables nominales. Son las más simples y abundantes, sirven para clasificar (su propiedad más importante), sus valores son nombres o cualidades, no se pueden hacer operaciones aritméticas con ellas.

Ejemplos:

Variable Valores

Estado Civil soltero, casado, viudo, divorciado, unión libre

Género masculino, femenino

Variables Ordinales. Son variables nominales, pero su propósito es establecer un orden, no se pueden hacer operaciones aritméticas con ellas.

Variable Valores

Grado de Quemadura 1º grado, 2º grado, 3º grado

Alcoholismo abstemio, bebedor ocasional, bebedor regular, bebedor consuetudinario

Variables cuantitativas. Toman valores numéricos, podemos hacer operaciones aritméticas con ellas (su propiedad más importante). Se dividen en variables continuas y en variables discretas.

Variables continuas. Pueden tomar cualquier valor entre dos valores extremos (intervalo) y pueden tomar valores intermedios entre dos de ellos.

Ejemplos: peso, estatura, edad

Variables Discretas. Toman solo algunos valores entre dos valores extremos, no pueden tomar los valores intermedios entre dos de ellos.

Ejemplos: número de hijos (por familia), número de alumnos (por grupo).

Cuestionario:

1. Clasifica las variables Candidato e Intención del Voto que se muestran en la tabla:

Preferencias Electorales Mayo del 2006

Candidato Intención del Voto

Andrés M. López obrador 34 %

Felipe Calderón Hinojosa 34 %

Roberto Madrazo Pintado 28 %

Dora Patricia Mercado Castro 3 %

Roberto Rafael Campa Cifrián 1 %

Fuente: Consulta Mitofsky

Candidato __________________ Intención del Voto _________________

Discreta Continua Ordinal Nominal

2. Relaciona correctamente:

A. Variables Continuas ( ) Su propósito es establecer orden, no se pueden hacer operaciones aritméticas con ellas.

B. Variables Ordinales ( ) Pueden tomar valores intermedios entre dos de ellos, se pueden hacer operaciones aritméticas con ellas.

C. Variables Discretas ( ) Sirven para clasificar, sus valores son nombres o cualidades, no se pueden hacer operaciones aritméticas con ellas.

D. Variables Nominales ( ) No pueden tomar valores intermedios entre dos de ellos, se pueden hacer operaciones aritméticas con ellas.

3. Clasifica las variables Banda de Frecuencia y Número de Radiodifusoras que se muestran en la tabla:

Radiodifusoras por Banda de Frecuencia México, 1991

Banda de Frecuencia

Número de Radiodifusoras

Amplitud Modulada 712 Frecuencia Modulada 242 Onda Corta 11

Banda de Frecuencia ______________

Número de Radiodifusoras ______________

Discreta Continua Ordinal Nominal

4. Selecciona la respuesta correcta: ¿Cómo se llaman las características comunes de un grupo de personas (animales o cosas)?

a. Intervalos b. Datos c. Variables d. Cualidades

5. Clasifica las variables Género y Porcentaje que se muestran en la tabla:

Distribución de Usuarios Internet Género Porcentaje

Masculino 59 Femenino 41

Total 100 Género ________________ Porcentaje _________________

Discreta Continua Ordinal Nominal

6. Selecciona la respuesta correcta. ¿Cómo se llaman los valores, cualitativos o cuantitativos que pueden tomar las variables?

a. Significados b. Características c. Evaluaciones d. Datos 7. Clasifica la variable Número de Estudiantes que se muestra en la tabla:

Distribución de Edades Grupo 1º A

Edad (Años Cumplidos)

Número de Estudiantes

12 10 13 20 14 12 15 5

Total 47 Número de Estudiantes __________________

Ordinal Nominal Discreta Continua

8. Escribe la palabra que completa correctamente: Las Variables ___________________ toman valores que son nombres o cualidades de personas, animales o cosas, no se pueden hacer operaciones aritméticas con ellas.

Indicativas Alternativas Cuantitativas Cualitativas 9. Conforme a la tabla

Radiodifusoras por Banda de Frecuencia México, 1991

Banda de Frecuencia

Número de Radiodifusoras

Amplitud Modulada 712 Frecuencia Modulada 242 Onda Corta 11

relaciona correctamente: A. Datos Cuantitativos ( ) Amplitud Modulada, Frecuencia Modulada, Onda

Corta B. Variables ( ) Banda de Frecuencia, Número de Radiodifusoras C. Datos Cualitativos ( ) 712, 242, 11 10. Clasifica las variables Sexo y Nivel Salarial que se muestran en la tabla:

Muestra de 4800 Funcionarios Públicos

Sexo Nivel Salarial Total Bajo Medio Alto

Mujeres 600 400 200 1200 Hombres 1500 1800 300 3600 Total 2100 2200 500 4800

Sexo _________________ Nivel Salarial ___________________

Ordinal Nominal Discreta Continua 11. Escribe la palabra que completa correctamente la expresión: Las Variables ________________ toman valores numéricos, Podemos hacer operaciones aritméticas con ellas. Se dividen en continuas y discretas.

Propias Cuantitativas Cualitativas Ordinarias

Conceptos Básicos Los siguientes son algunos conceptos básicos o fundamentales a los que se hace referencia en Estadística: Población o Universo: es la totalidad de personas (animales o cosas), con una o varias características (variables) comunes, sobre las que se desea obtener información en un estudio estadístico. Al número de elementos o individuos que la integran, representado por N, se le llama tamaño de la población. Las poblaciones pueden ser finitas o infinitas: Población finita: es aquella en la que es posible contar sus elementos y terminar el proceso de contar. Ejemplos. 1. El total de focos producidos en una fábrica en un día. 2. El total de vacas productoras de leche en un establo. 3. El total de alumnos de una escuela. Población Infinita. Tiene un número ilimitado de elementos, se pueden contar pero el proceso no termina. En la vida real no existen poblaciones infinitas, a menos que sean de tipo matemático, pero tienen un número tan grande de elementos que para propósitos prácticos se les consideran infinitas. Ejemplos:

1. El conjunto de todos los habitantes en México en el 2010 (107.5 millones de personas).

2. La cantidad de moléculas en una mol de un gas ( 236.022 10 moléculas). (Existe una rama de la Física, la Mecánica Estadística, que estudia este tipo de poblaciones.)

Muestra: es todo subconjunto o parte de una población. Al número de elementos o individuos que la integran, representado por n, se le llama tamaño de la muestra. Elemento o Individuo: se llama así a cada integrante de una muestra o de una población. En la siguiente figura se muestra la relación entre elemento, muestra y población:

Tamaño de la población: N=24 Tamaño de la muestra: n=4

Censo: es la recopilación de la información tomando en cuenta a todos los integrantes de una población. Muestreo: es la recopilación de la información a partir de una muestra.

Parámetros: son valores numéricos calculados tomando en cuenta a todos los elementos de una población, se representan con letras griegas minúsculas (por ejemplo, para la media aritmética, para la desviación estándar). Estadísticos o Estadígrafos: son valores numéricos calculados considerando únicamente los elementos de una muestra, se representan

con letras latinas minúsculas (por ejemplo, x para la media aritmética, s para la desviación estándar).

Existen dos tipos de estudios estadísticos, los Estudios Observacionales y los Estudios Experimentales. Estudios Observacionales: consisten en observar los elementos de una población o muestra midiendo las características de interés, procurando no alterar sus condiciones o situación. No hay interés en manipular las variables consideradas en el estudio, solo observarlas y medirlas.

Ejemplos: las encuestas de opinión, los estudios de mercado, los censos de población y vivienda, el control de calidad. Estudios Experimentales: en este caso se establecen a propósito ciertas condiciones sobre los elementos de una población o muestra y se observa cómo cambian ciertas variables. Existe el interés de manipular intencionadamente unas variables para observar cómo responden otras.

Ejemplos: 1. Estudio del efecto de la radiación emitida por las antenas de telefonía celular en la salud de las personas que viven cerca de ellas. 2. Estudio del efecto de un nuevo fármaco en el tratamiento de una enfermedad. 3. Estudio de la resistencia y durabilidad de maquinaria o equipo sometiéndolo a condiciones extremas.

MUESTREO En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los elementos de una población), se selecciona una muestra, entendiendo por tal una parte representativa de la población. El procedimiento para elegir la muestra se le llama muestreo. El muestreo es por lo tanto una herramienta de la investigación científica, cuya función básica es determinar que parte de una población debe examinarse, con la finalidad de hacer inferencias (deducciones) sobre dicha población. La muestra debe lograr una representación adecuada de la población, en la que se reproduzca de la mejor manera los rasgos esenciales de dicha población que son importantes para la investigación.

Para que una muestra sea representativa, y por lo tanto útil, debe reflejar las similitudes y diferencias encontradas en la población, es decir ejemplificar las características de ésta.

Los errores más comunes que se pueden cometer son: 1. Hacer conclusiones muy generales a partir de la observación de sólo una parte de la Población, se denomina error de muestreo. 2. Hacer conclusiones hacia una Población mucho más grandes de la que originalmente se tomó la muestra. Error de Inferencia. En la estadística se usa la palabra población para referirse no sólo a personas sino a todos los elementos que han sido escogidos para su estudio y el término muestra se usa para describir una porción escogida de la población.

TIPOS DE MUESTREO Existen diferentes criterios de clasificación de los diferentes tipos de muestreo, aunque en general pueden dividirse en dos grandes grupos: métodos de muestreo probabilísticos y métodos de muestreo no probabilísticos.

1. Muestreo probabilístico Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de equiprobabilidad, es decir, aquellos en los que todos los individuos tienen la misma probabilidad u oportunidad de ser elegidos para formar parte de una muestra y, por consiguiente, todas las posibles muestras de tamaño n tienen la misma probabilidad de ser seleccionadas. Sólo estos métodos de muestreo probabilísticos nos aseguran la representatividad de la muestra extraída y son, por tanto, los más recomendables. Dentro de los métodos de muestreo probabilísticos encontramos los siguientes tipos: 1.1. Muestreo aleatorio simple: El procedimiento empleado es el siguiente: a. Se asigna un número a cada individuo de la población y b. A través de algún medio mecánico o electrónico (bolas dentro de una bolsa, tablas de números aleatorios, números aleatorios generados con una calculadora o computadora, etc.), se eligen tantos sujetos como sea necesario para completar el tamaño de muestra requerido. Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la población que estamos manejando es muy grande. Ejemplo. Se desea seleccionar una muestra de tamaño n = 12 a partir de una población de tamaño N = 50 utilizando la siguiente tabla de números aleatorios, comenzando en el 5º renglón, columna 6.

4251 5149 4751 4847 4249 4648 5047 4847 5156 8789 4849 5051 5046 4756 4738 5350 4746 4847 4846 2346 5692 9870 3583 8997 1533 6466 8830 7271 3809 4256 2080 3828 7880 0586 8482 7811 6807 3309 2729 2235 1039 3382 7600 1077 4455 8806 1822 1669 7501 8330

6477 5289 4092 4223 6454 7632 7577 2816 9002 2365 4554 6146 4846 4647 5034 4646 5139 5355 5249 2224 0772 2160 7236 0812 4195 5589 0830 8261 9232 0902 0092 1629 0377 3590 2209 4839 6332 1490 3092 2390 7315 3365 7203 1231 0546 6612 1038 1425 2709 3092

a. Enumeramos a los integrantes de la población con los números 01, 02, 03, 04, 05, … , 47, 48, 49 y 50 (con dos dígitos porque el tamaño de la población, N=50, tiene dos dígitos.

b. A partir del 5º renglón, columna 6 vamos tomando números de 2 dígitos:

8806 1822 1669 7501 8330

6477 5289 4092 4223 6454 7632 7577 2816 9002 2365 4554 6146 4846 4647 5034 4646 5139 5355 5249 2224 0772 2160 7236 0812 4195 5589 0830 8261 9232 0902

Seleccionamos para la muestra doce números, desde el 01 hasta el 50, descartando los números que sean mayores que 50 y los números repetidos; los integrantes de la muestra serán entonces los siguientes elementos:

06, 18, 22, 16, 01, 30, 40, 42, 23, 32, 28 y 02 1.2. Muestreo aleatorio sistemático: Este procedimiento exige, como el anterior a. Enumerar todos los elementos de la población, y b. En lugar de extraer n números aleatorios sólo se extrae uno. Se parte de ese número aleatorio, que llamaremos, i, un número elegido al azar, y los elementos que integran la muestra son los que ocupa los lugares

i, i+k, i+2k, i+3k, ... , i+(n-1)k es decir se toman los individuos de k en k, siendo k el entero más cercano que resulta de dividir el tamaño de la población entre el tamaño de la muestra: k= N/n. El número i que empleamos como punto de partida será un número al azar entre 1 y k. El riesgo este tipo de muestreo está en los casos en que se dan periodicidades o grupos en la población ya que al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una homogeneidad que no se da en la población. Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos en las que los 5 primeros son varones y los 5 últimos mujeres, si empleamos un muestreo aleatorio sistemático con k=10 siempre seleccionaríamos o sólo hombres o sólo mujeres, no podría haber una representación de los dos sexos.

Se descarta porque está repetido

Ejemplo. Se desea obtener una muestra de 10 individuos a partir de una población de tamaño 1000, empezando en el renglón 2, columna 3, de la siguiente tabla de números aleatorios:

5775 7517 8974 3961 2183 5295 3096 8536 9442 2392 5500 2276 6307 2346 1285 7000 5306 0414 3383 2303 3251 8902 8843 2112 8567 8131 8116 5270 5994 9092 4675 1435 2192 0874 2897 0262 5092 5541 4014 2113 3543 6130 4247 4859 2660 7852 9096 0578 0097 1324

3521 8772 6612 0721 3899 2999 1263 7017 8057 3443 5573 9396 3464 1702 9204 3389 5678 2589 0288 6343 7478 7569 7551 3380 2152 5411 2647 7242 2800 3432 3339 2854 9691 9562 3252 9848 6030 8472 2266 3255 5505 8474 3167 8552 5409 1556 4247 4652 2953 9854

Solución: a. Enumeramos a la población desde el 0001 hasta el 1000 (con cuatro dígitos porque el tamaño de la población tiene 4 dígitos). b. Calculamos

1000 10010

Nkn

Verificamos si el primer número (6307) está entre 0001 y 0100 (entre 1 y k=100), si no es así vamos tomando números de 4 dígitos hasta que encontremos un número que esté entre 0001 y 0100, este número será el número i, en nuestro ejemplo i=0097, por lo que los elementos en la muestra serán: i=0097 i+k=0097+100=197 i+2k=0097+2(100)=297 i+3k=0097+3(100)=397 (obsérvese que van de 100 en 100) los demás elementos de la muestra son: 497, 597, 697, 797, 897, 997, 1097, 1197, 1297, 1397 y 1497 1.3. Muestreo aleatorio estratificado: Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos y suelen reducir el error muestral para un tamaño dado de la muestra. Consiste en considerar categorías típicas diferentes entre sí (estratos) que poseen gran homogeneidad respecto a

alguna característica (se puede estratificar, por ejemplo, según la profesión, el municipio, ciudad o colonia de residencia, el sexo, el estado civil, etc.). Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de interés estarán representados adecuadamente en la muestra. Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple para elegir los elementos concretos que formarán parte de la muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues exige un conocimiento detallado de la población (distribución geográfica, sexos, edades,...). La distribución de la muestra en función de los diferentes estratos se denomina afijación, y puede ser de diferentes tipos: Afijación Simple: A cada estrato le corresponde igual número de elementos muestrales. Afijación Proporcional: La distribución se hace de acuerdo con el peso (tamaño) de la población en cada estrato. Afijación Optima: Se tiene en cuenta la previsible dispersión de los resultados, de modo que se considera la proporción y la desviación típica. Tiene poca aplicación ya que no se suele conocer la desviación típica. Ejemplo. Un grupo de 48 alumnos se divide en dos estratos por género, como se muestra en la tabla:

Alumnos Género Número

Masculino 21 Femenino 27

Total 48 a. Se desea obtener una muestra de tamaño 10 con afijación proporcional, ¿qué porcentaje de la población corresponde a cada género? b. ¿Cuántos elementos se deben elegir por estrato? c. Para el género masculino, iniciando en el primer renglón, columna 1, de la siguiente tabla de números aleatorios, ¿cuáles elementos forman parte de la muestra?

6381 2086 5457 7703 2758 2963 8167 6712 9820 5324 0935 5565 2315 8030 7651 5189 0075 9353 1921 0222 2605 3973 8204 4143 2677 0034 8601 3340 8383 3243 7277 9889 0390 5579 4620 5650 0210 2082 4664 5643 5484 3900 3485 0741 9069 5920 4326 7704 6525 1249

d. Para el género femenino, iniciando en el 3º renglón, columna 2, de la siguiente tabla de números aleatorios, ¿cuáles elementos forman parte de la muestra?

7274 9512 0074 6677 8676 0222 3335 1976 1645 3203 9192 4011 0255 5458 6942 8043 6201 1587 0972 0243 0554 1690 6333 1931 9433 2661 8690 2313 6999 3094 9231 5627 1815 7171 8036 1832 2031 6298 6073 9044 3995 9677 7765 3194 3222 4191 2734 4469 8617 3233

Solución: a. Porcentajes:

Género masculino: 100 21 100 43.75%48

partetotal

Género femenino: 100 27 100 56.25%48

partetotal

b. Elementos por estrato en la muestra: Hombres: 0.4375 10 4.375 4porcentaje elementos en la muestra

Mujeres: 0.5625 10 5.625 6porcentaje elementos en la muestra

c. Los hombres se enumeran del 01 al 21 y se seleccionan 4, empezamos con el 63, descartando los mayores de 21 y los repetidos

6381 2086 5457 7703 2758 2963 8167 6712 9820 5324 0935 5565 2315 8030 7651 5189 0075 9353 1921 0222 2605 3973 8204 4143 2677 0034 8601 3340 8383 3243 7277 9889 0390 5579 4620 5650 0210 2082 4664 5643 5484 3900 3485 0741 9069 5920 4326 7704 6525 1249

Los hombres elegidos en su estrato son los que tienen los números: 20, 03, 12 y 09. d. Las mujeres se enumeran del 01 al 27 y se seleccionan 6, empezamos con el 16 descartando los mayores que 27 y los repetidos

7274 9512 0074 6677 8676 0222 3335 1976 1645 3203 9192 4011 0255 5458 6942 8043 6201 1587 0972 0243 0554 1690 6333 1931 9433 2661 8690 2313 6999 3094 9231 5627 1815 7171 8036 1832 2031 6298 6073 9044 3995 9677 7765 3194 3222 4191 2734 4469 8617 3233

Las mujeres elegidas en su estrato son las que tienen los números: 16, 19, 26, 21, 13 y 27. 1.4. Muestreo aleatorio por conglomerados: Los métodos presentados hasta ahora están pensados para seleccionar directamente los elementos de la población, es decir, que las unidades muestrales son los elementos de la población. En este muestreo, las unidades muestrales no son simples, sino que son colectivos. Cada uno de estos colectivos reciben el nombre de conglomeraciones o conglomerados. Los hospitales, las facultades universitarias o los grupos por especialidad de una escuela, una caja de determinado producto, etc., son conglomerados naturales. En otras ocasiones se pueden utilizar conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando los conglomerados son áreas geográficas suele hablarse de "muestreo por áreas". El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto número de conglomerados (el necesario para alcanzar el tamaño muestral establecido) y en investigar después todos los elementos pertenecientes a los conglomerados elegidos. Ejemplo. El Departamento de Control de Calidad de una empresa desea estudiar la merma de producto en las barras de chocolate que fabrica. El peso de las barras se recopilará a partir de una producción de 100 cajas (conglomerados) que a su vez contienen 20 barras de chocolate cada una y seleccionando aleatoriamente 8 de ellas. Se enumeran las cajas del 001 a la 100 y se utiliza la siguiente tabla de

números aleatorios, iniciando en la renglón 5 y columna 4, ¿cuáles serán las cajas seleccionadas?, ¿de qué tamaño es la muestra seleccionada?

6905 7127 5933 1137 7583 6450 5658 7678 3444 3754 8387 5323 3753 1859 6043 0294 5110 6340 9137 6323 4094 4957 0163 9717 4118 4276 9465 8820 4127 0202 4951 3781 5101 1815 7068 6379 7252 1086 8919 2093 9047 0199 5068 7447 1664 9278 1708 3625 2864 0204

7274 9512 0074 6677 8676 0222 3335 1976 1645 3203 9192 4011 0255 5458 6942 8043 6201 1587 0972 0243 0554 1690 6333 1931 9433 2661 8690 2313 6999 3094 9231 5627 1815 7171 8036 1832 2031 6298 6073 9044 3995 9677 7765 3194 3222 4191 2734 4469 8617 3233

2402 6250 9362 7373 4757 1716 1942 0417 5921 5345 5295 7385 5474 2123 7035 9983 5192 1840 6176 5756 5177 1191 2106 3351 5057 0967 4538 1246 3374 0304 4344 4044 4549 4443 4249 4948 4151 5152 4240 4737 7343 4706 4440 4646 4548 4742 4746 5253 4749 4689

Solución. Como puede verse en la tabla, iniciando en el número 744, descartando aquellos que sean mayores que 100 y los repetidos, las cajas (conglomerados) serán las que tienen los números: 020, 007, 022, 039, 055, 023, 036 y 035. El tamaño de la muestra es n = 8 x 20 = 160 (barras de chocolate). 2. Métodos de muestreo no probabilísticos A veces, para estudios exploratorios, el muestreo probabilístico resulta excesivamente costoso y se acude a métodos no probabilísticos, aun siendo conscientes de que no sirven para realizar generalizaciones (estimaciones inferenciales sobre la población), pues no se tiene certeza de que la muestra extraída sea representativa, ya que no todos los sujetos de la población tienen la misma probabilidad de ser elegidos. En general se seleccionan a los sujetos siguiendo determinados criterios procurando, en la medida de lo posible, que la muestra sea representativa. En algunas circunstancias los métodos estadísticos y epidemiológicos permiten resolver los problemas de representatividad aun en situaciones de muestreo no

probabilístico, por ejemplo los estudios de caso-control, donde los casos no son seleccionados aleatoriamente de la población. Entre los métodos de muestreo no probabilísticos más utilizados en investigación encontramos: 1. Muestreo por cuotas: También denominado en ocasiones "muestreo accidental". Se asienta generalmente sobre la base de un buen conocimiento de los estratos de la población y/o de los individuos más "representativos" o "adecuados" para los fines de la investigación. Mantiene, por tanto, semejanzas con el muestreo aleatorio estratificado, pero no tiene el carácter de aleatoriedad de aquél. En este tipo de muestreo se fijan unas "cuotas" que consisten en un número de individuos que reúnen unas determinadas condiciones, por ejemplo: 50 individuos (cuota) de 25 a 40 años, de sexo femenino y residentes en Ario de Rayón, Michoacán. Una vez determinada la cuota se eligen los primeros que se encuentren que cumplan esas características. Este método se utiliza mucho en las encuestas de opinión. 2. Muestreo intencional o de conveniencia: Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras "representativas" mediante la inclusión en la muestra de grupos supuestamente típicos. Es muy frecuente su utilización en sondeos preelectorales de zonas que en anteriores votaciones han marcado tendencias de voto, o cuando se desea la opinión de expertos, en estos casos se acude al lugar donde frecuentemente se encuentran (hospitales, universidades, centros comerciales, lugares de culto religioso, etc.). También puede ser que el investigador seleccione directa e intencionadamente los individuos de la población. El caso más frecuente de este procedimiento el utilizar como muestra los individuos a los que se tiene fácil acceso (los profesores de universidades emplean con mucha frecuencia a sus propios alumnos y las empresas a sus trabajadores). 3. Bola de nieve: Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y así hasta conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos, preferencias sobre un producto o sobre un programa de televisión o de radio, etc. 4.- Muestreo Discrecional. A criterio del investigador los elementos son elegidos sobre lo que él cree que pueden aportar al estudio.

Distribuciones de Frecuencia

1. Datos no Agrupados en intervalos

El proceso presentado a continuación, a través de un ejemplo, se utiliza para describir una cantidad relativamente pequeña de datos. Supongamos que los pesos, en kg, de 20 personas son los siguientes:

64 70 68 68

73 62 60 67

68 67 65 71

68 71 68 66

76 69 66 72

La forma como se presentan estos datos no es conveniente para su interpretación, sería más sencillo si se organizaran de manera adecuada, utilizando el Orden de Rango: Orden de Rango: es el orden ascendente o descendente de los datos.

Orden de Rango 60 62 64 65

66 66 67 67

68 68 68 68

68 69 70 71

71 72 73 76

Peso (en kg) de 20 Personas Así podemos ver fácilmente que el peso más pequeño es 60 kg y el mayor 76 kg, un valor intermedio es más o menos 68 kg y también podemos apreciar que el dato que más se repite es 68 kg. Veamos ahora las siguientes dos definiciones: Rango: es la diferencia entre el dato mayor y el dato menor.

Rango Dato Mayor Dato Menor

Frecuencia: es el número de veces que se repite cada dato. Moda: es el dato que más se repite, el dato de mayor frecuencia.

Si hay dos datos que se repiten con la mayor y la misma frecuencia se dice que los dos datos son moda y el conjunto de datos se dice que es una distribución bimodal. Si hay tres datos que se repiten con la mayor y la misma frecuencia se dice que los tres datos son moda y el conjunto de datos se dice que es una distribución trimodal. Si todos los datos que se repiten con la misma frecuencia se dice que todos los datos son moda o que no hay moda. Para el ejemplo que estamos siguiendo: 76 60 16Rango Dato Mayor Dato Menor kg kg kg

El rango representa la distancia que hay entre el dato menor y el mayor, además, todos los datos se encuentran contenidos dentro de él. 68Moda kg

La presentación de los datos, en forma de tabla o de gráfica, de modo que podamos apreciar la frecuencia de los mismos, se conoce como distribución de frecuencia. Una distribución de frecuencia es el orden de rango que ya mostramos anteriormente. Una forma más conveniente de organizar y presentar los datos es por medio de una Tabla de Frecuencia, la cual muestra en la primera columna los datos y en la segunda su correspondiente frecuencia:

Tabla de Frecuencia Peso de 20 Personas

Peso (kg)

Frecuencia Peso (kg)

Frecuencia

60 62 64 65 66 67 68

1 1 1 1 2 2 5

69 70 71 72 73 76

1 1 2 1 1 1

Otra manera de presentar los datos es por medio de un Diagrama de Frecuencia de Puntos: Diagrama de Frecuencia de Puntos: el diagrama nos indica como se encuentran distribuidos los datos en el rango. Se dibuja una línea recta horizontal sobre la cual se hacen divisiones iguales a partir del dato menor y terminando en el dato mayor. Localizamos cada dato y dibujamos tantos puntos, como lo indica la frecuencia, igualmente espaciados hacia arriba.

En el ejemplo, se puede observar que los pesos se agrupan alrededor de 68 kg. El orden de rango, la tabla de frecuencia y el diagrama de frecuencia de puntos son las distribuciones de frecuencia para datos no agrupados en intervalos. Existe otra manera de presentar los datos conocida como Tabla de Frecuencia Acumulada. En la Tabla de Frecuencia añadimos tres columnas correspondientes al Porcentaje, a la Frecuencia Acumulada y al Porciento Acumulado (en algunos textos al porciento y al porciento acumulado se les conoce como Frecuencia Relativa y Frecuencia Relativa Acumulada, respectivamente).

Tabla de Frecuencia Acumulada

Peso (kg)

Frec. Por Ciento

Frec. Acum.

Por Ciento Acum.

60 62 64 65 66 67 68 69 70 71 72 73 76

1 1 1 1 2 2 5 1 1 2 1 1 1

5 5 5 5 10 10 25 5 5 10 5 5 5

1 2 3 4 6 8 13 14 15 17 18 19 20

5 10 15 20 30 40 65 70 75 85 90 95 100

Total 20 100 Las frecuencias acumuladas se calculan de la siguiente manera: 1ª frecuencia acumulada = 1ª frecuencia = 1 2ª frecuencia acumulada = 1ª frecuencia acumulada + 2ª frecuencia = 1 + 1 = 2 3ª frecuencia acumulada = 2ª frecuencia acumulada + 3ª frecuencia = 2 + 1 = 3 4ª frecuencia acumulada = 3ª frecuencia acumulada + 4ª frecuencia = 3 + 1 = 4 5ª frecuencia acumulada = 4ª frecuencia acumulada + 5ª frecuencia = 4 + 2 = 6 6ª frecuencia acumulada = 5ª frecuencia acumulada + 6ª frecuencia = 6 + 2 = 8 7ª frecuencia acumulada = 6ª frecuencia acumulada + 7ª frecuencia = 8 + 5 = 13 Etc. Otra manera de calcular las frecuencias acumuladas es la siguiente: 1ª frecuencia acumulada = 1ª frecuencia = 1 2ª frecuencia acumulada = 1ª frecuencia + 2ª frecuencia = 1 + 1 = 2 3ª frecuencia acumulada = 1ª frecuencia + 2ª frecuencia + 3ª frecuencia 1+1+1=3 Etc.

Los porcientos acumulados se calculan de una manera similar. Cada frecuencia acumulada nos indica cuantos datos son menores o iguales que su dato correspondiente y cada porciento acumulado nos indica que porcentaje de datos son menores o iguales que su dato correspondiente. Veamos los siguiente ejemplos, en cada uno debe observar la tabla de frecuencia acumulada. Ejemplo 1. La octava frecuencia acumulada tiene un valor de 14 y su dato correspondiente es 69 kg, entonces podemos decir que hay 14 personas con un peso menor o igual que 69 kg. Ejemplo 2. El décimo porciento acumulado tiene un valor de 85 y su dato correspondiente es 71 kg, entonces decimos que el 85 % de las personas tiene un peso menor o igual que 71 kg. Ejemplo 3. La quinta frecuencia acumulada tiene un valor de 6 y su dato correspondiente es 66 kg, entonces decimos que hay 6 personas que tienen un peso menor o igual que 66 kg. Ejemplo 4. ¿Cuántas personas tienen un peso menor o igual que 72 kg? La frecuencia acumulada correspondiente a 72 kg es 18, la respuesta es 18 personas. Ejemplo 5. ¿Qué porcentaje de personas tienen un peso menor o igual que 67 kg? El porcentaje correspondiente a 67 kg es 40 %, la respuesta es 40 %. La información de la tabla de frecuencia acumulada se puede representar en forma gráfica siguiendo los siguientes pasos: 1. Trazamos un sistema de coordenadas cartesianas, en el eje horizontal localizamos el dato menor y trazamos divisiones iguales hasta concluir con el dato mayor.

2. En el eje vertical, por el lado izquierdo, empezando con la frecuencia acumulada menor hacemos divisiones iguales hacia arriba, hasta la frecuencia acumulada mayor; por el lado derecho localizamos el 25 %, el 50 %, el 75 % y el 100 % de las frecuencias acumuladas. 3. Fijándonos en la tabla de frecuencia acumulada formamos parejas ordenadas (dato, frecuencia acumulada) que se representan por puntos en el sistema de coordenadas, en este ejemplo sería (peso, frecuencia acumulada). 4. Unimos los puntos entre sí por medio de segmentos horizontales y verticales. El primer punto se une con el eje horizontal por medio de un segmento vertical.

El dato que se corresponde con un porciento acumulado se le llama percentil, hay cien de ellos, se representan con la letra P y un subíndice que indica el número de percentl, así 18P es el 18º percentil; algunos percentiles tienen nombre propio:

El dato que corresponde al 25 % acumulado se le llama Cuartil Inferior y corresponde a 25P .

El dato que corresponde al 50 % acumulado se le llama Mediana y corresponde a

50P .

El dato que corresponde al 75 % acumulado se le llama Cuartil Superior y corresponde a 75P .

Para el ejemplo de los pesos, de la gráfica se tiene que

25

50

75

90

6668

7072

Cuartil Inferior P kgMediana P kg

Cuartil Superior P kgP kg

El cuartil inferior se interpreta diciendo que el 25% de las personas tienen un peso menor o igual a 66 kg. La Mediana nos indica que el 50 % de las personas tienen un peso menor o igual a 68 kg. El Cuartil Superior indica que el 75 % de las personas tienen un peso menor o igual a 70 kg. El 90º percentil o 90P indica que el 90 % de las personas tiene un peso menor o

igual a 72 kg. Problemas: 1. Una empresa de alimentación se dedica a enviar pizzas a domic i l i o . E l número de p i zzas env iadas en cada uno de lo s 30 d ía s de l mes de Abril son:

Número de Pizzas Enviadas a Domicilio Mes de Abril

47 63 66 58 32 61 57 44 44 56 38 35 76 58 48 59 67 33 69 53 51 28 25 36 49 72 78 48 42 52

a. Elabora el Orden de Rango de los datos. b. Calcula el Rango de los datos. c. ¿Cuál es la moda de los datos? d. Elabora la Tabla de Frecuencia de los datos. e. Dibuja el Diagrama de Puntos de los datos. f. Elabora la Tabla de Frecuencia Acumulada de los datos. g. Dibuja la Gráfica Acumulativa de los datos.

h. Calcula e interpreta el Cuartil Inferior. i. Calcula e interpreta la Mediana. j. Calcula e interpreta el Cuartil Superior. k. Calcula e interpreta 10P .

l. Calcula e interpreta el 80º percentil. 2. El Presidente de Administración de las líneas aéreas KLM tiene principal interés en estudiar el comportamiento del número de pasajeros en los vuelos diarios y para ello ha obtenido los siguientes datos de los “diarios de vuelo” de los últimos 40 días y ha reflejado esta información:

Número de Pasajeros Vuelos Diarios

68 72 50 70 65 84 77 78 71 84 60 84 72 84 73 84 77 57 70 59 84 74 78 79 83 67 66 75 79 82 93 90 79 69 76 84 71 97 95 84

a. Elabora el Orden de Rango de los datos. b. Calcula el Rango de los datos. c. ¿Cuál es la moda de los datos? d. Elabora la Tabla de Frecuencia de los datos. e. Dibuja el Diagrama de Puntos de los datos. f. Elabora la Tabla de Frecuencia Acumulada de los datos. g. Dibuja la Gráfica Acumulativa de los datos. h. Calcula e interpreta el Cuartil Inferior. i. Calcula e interpreta la Mediana. j. Calcula e interpreta el Cuartil Superior. k. Calcula e interpreta 60P .

l. Calcula e interpreta el 90º percentil.

3. Los datos que figuran a continuación corresponden a los puntos anotados por un jugador de baloncesto a lo largo de 30 partidos:

34, 11, 19, 13, 20, 20, 33, 43, 22, 30, 25, 17, 28, 21, 22, 40, 40, 27, 41, 39, 39, 31, 18, 27, 35, 33, 35, 21, 19, 44.

a. Elabora el Orden de Rango de los datos.

b. Calcula el Rango de los datos. c. ¿Cuál es la moda de los datos? d. Elabora la Tabla de Frecuencia de los datos. e. Dibuja el Diagrama de Puntos de los datos. f. Elabora la Tabla de Frecuencia Acumulada de los datos. g. Dibuja la Gráfica Acumulativa de los datos. h. Calcula e interpreta el Cuartil Inferior. i. Calcula e interpreta la Mediana. j. Calcula e interpreta el Cuartil Superior. k. Calcula e interpreta 30P .

l. Calcula e interpreta el 60º percentil. 4. Los siguientes datos corresponden al número de hermanos de un grupo de 35 personas: 1, 3, 5, 6, 5, 5, 2, 3, 7, 5, 4, 5, 3, 2, 6, 5, 3, 0, 4, 4, 5, 1, 4, 7, 5, 3, 6, 5, 5, 3, 1, 5, 3, 5, 4 a. Elabora el Orden de Rango de los datos. b. Calcula el Rango de los datos. c. ¿Cuál es la moda de los datos? d. Elabora la Tabla de Frecuencia de los datos. e. Dibuja el Diagrama de Puntos de los datos. f. Elabora la Tabla de Frecuencia Acumulada de los datos. g. Dibuja la Gráfica Acumulativa de los datos. h. Calcula e interpreta el Cuartil Inferior. i. Calcula e interpreta la Mediana. j. Calcula e interpreta el Cuartil Superior. k. Calcula e interpreta 20P .

l. Calcula e interpreta el 40º percentil. 5. Los siguientes datos corresponden al número de días que trabaja un grupo de 30 vendedores ambulantes:

Días Trabajados Vendedores Ambulantes 7, 4, 6, 3, 3, 6, 6, 7, 7, 5 5, 6, 4, 6, 3, 6, 7, 5, 7, 7 6, 2, 7, 7, 6, 3, 3, 4, 6, 6

a. Elabora el Orden de Rango de los datos.

b. Calcula el Rango de los datos. c. ¿Cuál es la moda de los datos? d. Elabora la Tabla de Frecuencia de los datos. e. Dibuja el Diagrama de Puntos de los datos. f. Elabora la Tabla de Frecuencia Acumulada de los datos. g. Dibuja la Gráfica Acumulativa de los datos. h. Calcula e interpreta el Cuartil Inferior. i. Calcula e interpreta la Mediana. j. Calcula e interpreta el Cuartil Superior. k. Calcula e interpreta el 70º percentil. 6. Los siguientes datos corresponde al precio, en pesos, de planchas de la misma marca y modelo, que se investigaron en 36 tiendas de una ciudad:

Precio de las Planchas (en pesos)

690 750 720 710 690 700 680 690 710 700 700 690 700 690 700 720 680 690 740 710 670 740 700 710 700 680 720 710 690 720 720 710 690 700 740 720

a. Elabora el Orden de Rango de los datos. b. Calcula el Rango de los datos. c. ¿Cuál es la moda de los datos? d. Elabora la Tabla de Frecuencia de los datos. e. Dibuja el Diagrama de Puntos de los datos. f. Elabora la Tabla de Frecuencia Acumulada de los datos. g. Dibuja la Gráfica Acumulativa de los datos. h. Calcula e interpreta el Cuartil Inferior. i. Calcula e interpreta la Mediana. j. Calcula e interpreta el Cuartil Superior. k. Calcula e interpreta el 30º percentil.

7. La presión arterial sistólica normal de una persona adulta, de 31 a 40 años de edad, es de 140 mm de Hg. Los siguientes valores se obtuvieron en una muestra de 40 personas dentro del rango de edad señalado:

Presión Arterial Sistólica (en mm de Hg) Adultos de 31 a 40 años

115 121 123 120 110 120 120 118 105 118 121 115 117 121 115 123 118 120 110 121 115 118 120 123 120 120 118 121 123 115 123 120 110 123 121 120 115 119 120 118

a. Elabora el Orden de Rango de los datos. b. Calcula el Rango de los datos. c. ¿Cuál es la moda de los datos? d. Elabora la Tabla de Frecuencia de los datos. e. Dibuja el Diagrama de Puntos de los datos. f. Elabora la Tabla de Frecuencia Acumulada de los datos. g. Dibuja la Gráfica Acumulativa de los datos. h. Calcula e interpreta el Cuartil Inferior. i. Calcula e interpreta la Mediana. j. Calcula e interpreta el Cuartil Superior. k. Calcula e interpreta el 20º percentil. 8. El técnico responsable del funcionamiento de una empaquetadora automática la ajustó para 450 gramos. Cinco horas después del principio de la producción se apartaron 30 paquetes para verificar su peso. Los resultados fueron:

Peso (g) 448 450 453 451 447 449 446 451 448 447 449 447 451 452 447 450 450 451 449 453 446 451 448 453 450 451 450 446 447 450

a. Elabora el Orden de Rango de los datos. b. Calcula el Rango de los datos. c. ¿Cuál es la moda de los datos? d. Elabora la Tabla de Frecuencia de los datos. e. Dibuja el Diagrama de Puntos de los datos. f. Elabora la Tabla de Frecuencia Acumulada de los datos. g. Dibuja la Gráfica Acumulativa de los datos. h. Calcula e interpreta el Cuartil Inferior. i. Calcula e interpreta la Mediana. j. Calcula e interpreta el Cuartil Superior.

k. Calcula e interpreta el 60º percentil.