“NOCIONES DE ESTADÍSTICA” · 2019-06-19 · Frecuencia absoluta, absoluta acumulada y relativa...

14
1 “NOCIONES DE ESTADÍSTICA” Prof. Carlos Feirrer Contenidos Conceptuales: Conceptos generales (población, muestra, datos). Variables cuantitativas y cualitativas (Discretas y Continuas). Frecuencia absoluta, absoluta acumulada, relativa y porcentual Parámetros de centralización: media, moda y mediana. Tablas y gráficos de distribución de frecuencias (Barras, circular e histograma). Introducción La palabra estadística tiene su raíz del latín status que significa estado o situación. La estadística se encarga de la recolección, organización y análisis de datos para explicar una determinada situación o para predecir con algún grado de certeza lo que pueda ocurrir, a esto último se lo denomina “inferencia estadística”. Actualmente la estadística se aplica para realizar investigaciones pertenecientes a distintas ciencias y disciplinas, como por ejemplo, medicina del deporte, biología, ciencias sociales, sus aportes nos proporcionan una herramienta muy útil, a la hora de tomar decisiones. Conceptos generales Cuando se hace un trabajo estadístico, se analizan datos de un determinado grupo de individuos; cada uno de estos grupos encuestados es una población estadística, por ej. los alumnos del colegio CIEU. Pero para investigar sobre un determinado tema, muchas veces sólo conviene recolectar datos de una parte de la población estadística, a esa parte del total se la llama muestra. La muestra debe ser representativa, es decir debe estar elegida de modo tal que represente al total de la población estadística. Entonces vamos con las dos primeras definiciones: COLEGIO INTEGRAL DE EDUCACIÓN USHUAIA “LIBERTADOR GENERAL SAN MARTÍN” Población estadística: se denomina “población” al conjunto de individuos (personas, animales, plantas, etc.) que se pretende estudiar estadísticamente. Muestra: se denomina “muestra” a un grupo de la población convenientemente elegido para que represente al total de la población estadística.

Transcript of “NOCIONES DE ESTADÍSTICA” · 2019-06-19 · Frecuencia absoluta, absoluta acumulada y relativa...

1

“NOCIONES DE ESTADÍSTICA”

Prof. Carlos Feirrer

Contenidos Conceptuales:

Conceptos generales (población, muestra, datos). Variables cuantitativas y cualitativas (Discretas y Continuas). Frecuencia absoluta, absoluta acumulada, relativa y porcentual Parámetros de centralización: media, moda y mediana. Tablas y gráficos de distribución de frecuencias (Barras, circular e histograma).

Introducción La palabra estadística tiene su raíz del latín status que significa estado o situación. La estadística se encarga de la recolección, organización y análisis de datos para explicar una determinada situación o para predecir con algún grado de certeza lo que pueda ocurrir, a esto último se lo denomina “inferencia estadística”. Actualmente la estadística se aplica para realizar investigaciones pertenecientes a distintas ciencias y disciplinas, como por ejemplo, medicina del deporte, biología, ciencias sociales, sus aportes nos proporcionan una herramienta muy útil, a la hora de tomar decisiones.

Conceptos generales Cuando se hace un trabajo estadístico, se analizan datos de un determinado grupo de individuos; cada uno de estos grupos encuestados es una población estadística, por ej. los alumnos del colegio CIEU. Pero para investigar sobre un determinado tema, muchas veces sólo conviene recolectar datos de una parte de la población estadística, a esa parte del total se la llama muestra. La muestra debe ser representativa, es decir debe estar elegida de modo tal que represente al total de la población estadística. Entonces vamos con las dos primeras definiciones:

COLEGIO INTEGRAL DE EDUCACIÓN USHUAIA

“LIBERTADOR GENERAL SAN MARTÍN”

Población estadística: se denomina “población” al conjunto de individuos (personas, animales, plantas, etc.) que se pretende estudiar estadísticamente. Muestra: se denomina “muestra” a un grupo de la población convenientemente elegido para que represente al total de la población estadística.

2

Variables estadísticas Cada uno de los temas sobre los que se consulta a una determinada población o muestra es una variable estadística. Por ej. podríamos estar recolectando información sobre la edad, peso o música de preferencia de los alumnos del CIEU y cada respuesta obtenida sería un dato estadístico. Otra definición

El asunto es que la variables, son muy variadas, así que vamos a tener que clasificarlas en:

Tipos de variables

: ( )

: ( ):

: int ( )

Cualitativas Las respuestas indican una cualidad o característica color de cabello

Discretas números enteros edadCuantitativas Las respuestas son números

Continuas números dentro de un ervalo peso

Frecuencia absoluta, absoluta acumulada y relativa

Para comprender bien esto vamos a plantear un ejemplo antes de definir formalmente. Vamos a suponer que preguntamos a 60 alumnos del EGB 3 de un colegio en La Plata si tienen o no hermanos. La población analizada sería todos los alumnos de EGB 3 de ese colegio de La plata, de los cuáles tomamos una muestra de 60. La variable estadística es: tener o no hermanos. ¿Qué tipo de variable es?................................ Cuando se hace un relevamiento de datos, puede pasar que algunos de ellos se repitan. Vean el cuadro.

Valores de la variable

Cant. de respuestas obtenidas

Sí 40

No 20

Total 60

La respuesta “Si”, se repitió 40 veces, mientras que la respuesta “No” se repitió 20 veces. Entonces en nuestro caso, la frecuencia absoluta para el valor “Sí” es 40 y para el “No” es 20. Ahora vamos con la frecuencia relativa.

Variable estadística: se denomina “variable” a la característica de interés que se estudia en una población o muestra. Cada valor que toma la variable es un “dato”.

Frecuencia absoluta: se llama “frecuencia absoluta” (se escribe f i ) al número de veces

que se repite cada valor de la variable.

3

Ahora, supongamos que hemos recolectado la siguiente información correspondiente al peso de 33 personas.

X: Peso Frec. Absoluta (fi)

Frec. Acumulada (fa)

36 2 2

38 2 4

43 3 7

45 2 9

48 4 13

54 3 16

60 3 19

62 2 21

64 4 25

70 3 28

72 5 33

Total 33 -------------

Esta nueva columna nos permite visualizar información rápidamente sin necesidad de volver a contar. Por ej. ¿Cuántas personas tienen un peso menor o igual a 62 kg? Rta: 21 personas ¿Cuántas personas tienen un peso mayor a 48 kg? Rta: 33-13 = 20 personas Entonces:

En el ejemplo, 40 de un total de 60 alumnos respondieron que tienen hermanos, es

decir40 2

60 3 , y 20 respondieron que no tienen hermanos, es decir

20 1

60 3 , lo que hemos

hecho es calcular la frecuencia relativa.

Finalmente si multiplicamos por 100 la frecuencia relativa expresada como decimal, se obtiene el porcentaje de la variable (también la llaman frecuencia porcentual o simplemente porcentaje)

0,6 100 66,6 ; el 66,6% de los alumnos encuestados tienen hermanos.

0,3 100 33,3 ; el 33,3% de los alumnos no tienen hermanos.

Las tablas nos permiten organizar los datos de una encuesta y facilitan el análisis de la información. Armemos una con estos datos.

Frecuencia relativa: se llama “frecuencia relativa” (se escribe fr ) al cociente entre la

frecuencia absoluta y el total de elementos que forman la muestra. La frecuencia relativa siempre es un valor entre 0 y 1.

ffr

n ( n es el número de elementos que forman la muestra)

Frecuencia absoluta acumulada: se llama “absoluta acumulada” (se escribe fa ) a aquella

que se obtiene sumando a la frecuencia de un valor cualquiera de la variable, las frecuencias anteriores a ese valor.

4

X: Variable

Frecuencia absoluta

( f i )

Frecuencia relativa

( fr ) Porcentaje de la

variable

Tiene hermanos

40

40 2

60 3 0, 6 66,6%

No tiene

20

20 1

60 3 0,3 33,3%

Total 60 1 1 100%

Parámetros de centralización

Cuando hacemos un trabajo estadístico hay una tendencia de los datos que obtenemos a agruparse en torno a un valor central, por este motivo algunos autores también llaman a los parámetros de centralización, medidas de tendencia central. Los parámetros son 3 (dos de ellos ya los conocen, los usan todos los días)

Ejemplo: ¿Cómo saben si promocionan una materia o no? Rta: Lo que hacen es calcular una media aritmética...bah... calculan el promedio de las notas obtenidas en el cuatrimestre.

Busquemos un ejemplo cotidiano, supongamos que le preguntamos a los alumnos de 9º año del CIEU, que espacio (materia) les gusta más estudiar, no cabe duda de que por lo menos 15 de los 22 alumnos del curso va a responder ¡¡¡Matemática!!!, porque el profesor es re-piola, porque nos enseña cosas fáciles, etc; entonces la moda sería estudiar Matemática. Nos queda el último parámetro, este dudo que lo conozcan.

Lo calculamos con el siguiente criterio:

Si la cantidad de datos es un número impar, el lugar central es 1

2

n ( n es la

cantidad de datos)

Si la cantidad de datos es un número par, no existe un valor que ocupe el lugar central entonces la mediana es el promedio de los valores centrales.

Media aritmética o promedio ( )x : Es el cociente entre la suma de los valores de

los datos y la suma de las frecuencias absolutas

Moda ( )Mo : Es el valor que se registra más veces, es decir el de mayor

frecuencia absoluta.

Mediana ( )Me : Es el valor ubicado en el lugar central al ordenar todos los datos

de menor a mayor

5

Gráficos estadísticos Así como las tablas de frecuencias nos permiten organizar rápidamente los datos estadísticos, para leer con facilidad la información obtenida, se utilizan los gráficos estadísticos. Vamos a considerar por ahora 3 posibilidades. Gráfico de barras: permiten observar el comportamiento de la variable en estudio, está compuesto por rectángulos que tienen igual base y cuyas alturas coinciden con la frecuencia absoluta de cada valor que toma la variable. En general se utiliza para representar variables de tipo cualitativo. Para confeccionar este tipo de gráfico se trazan dos ejes perpendiculares entre sí. En el eje horizontal se representa la variable analizada, y en el vertical, las distintas frecuencias absolutas. El ancho de cada barra (rectángulo) es arbitrario, eso sí, las barras deben estar separadas una de otra. Ejemplo 1. Un profesor de historia hizo una encuesta a sus alumnos para averiguar cuál de los siguientes tres países les gustaría visitar. Los resultados fueron:

X: Nombre del país Frecuencia absoluta Grecia 5

Egipto 10

Italia 5

España 9

Total 29

El gráfico respectivo correspondiente a esta tabla sería:

Gráfico de torta o circular: Se utiliza cuando se quiere mostrar como es la distribución de datos en relación con toda la muestra y nos presenta la información en forma de porcentaje. Para confeccionar este tipo de gráfico, en primer lugar dibujamos un círculo, luego dividimos al círculo en sectores circulares. Cada sector circular representa el porcentaje de cada valor de la variable. Ahora la pregunta es ¿Qué ángulo le damos a cada sector? A ojo...no !!!

6

Tenemos que calcular el ángulo central para cada sector, calcular este ángulo es resolver un problema de proporcionalidad directa. Para Egipto Para Grecia e Italia

360º 100% 360º 100% x 50% x 25%

360º 50%180º

100%x

360º 25%90º

100%x

Retomando el ejemplo 1 la tabla quedaría así:

X: Nombre del país Frecuencia absoluta Porcentaje de la variable ángulo central

Grecia 5 17,25% 62°

Egipto 10 34,5% 124°

Italia 5 17,25% 62°

España 9 31% 112°

Total 29 100% 360°

Ahora construimos el gráfico con ayuda del compás, transportador y una regla.

Para tratar el último gráfico primero necesitamos definir que es un intervalo de clase. (la palabra intervalo ya debería resultarles familiar)

Intervalos de clase Se utilizan fundamentalmente cuando la variable de estudio es del tipo cuantitativa continua (aquellas en las cuales los datos toman cualquier valor dentro de un intervalo) o cuando la variable es discreta pero la cantidad de datos es muy grande, en estos casos es conveniente agruparlos en intervalos reales llamados intervalos de clase.

7

Vale la pena aclarar que, si la variable en estudio es el peso de las personas tendremos intervalos de peso, si la variable que estamos estudiando es la velocidad de algún móvil entonces tendremos intervalos de velocidad. Observen la siguiente tabla: Es un registro de los pesos de 50 personas entre 18 y 25 años, dividimos los pesos en intervalos de igual amplitud, en este caso 10 kg. Intervalos de clase

(Peso en Kg.) f

40;50 10

50;60 15

60;70 8

70;80 11

80;90 4

90;100 2

La marca de clase resulta útil para estimar la media aritmética, según la siguiente expresión:

estimada

Mc fx

Total

Importante: Se debe tener en cuenta al agrupar los datos:

Que los intervalos tengan todos la misma longitud en incluyan a todos los valores de la muestra.

En general se toma como límite menor, el valor más chico de la muestra (mínimo). Está permitido que el último límite sea mayor que el valor más grande de la muestra

(máximo). Está permitido incluir en el último intervalo, el extremo superior del intervalo, y en ese

caso se escribe ,a b .

Histogramas: Se utiliza siempre que tengamos una variable cuantitativa continua o cuando la variable es discreta pero la cantidad de datos es grande y las frecuencias se repiten poco. Los intervalos de clase se representan en gráficos llamados histogramas que son rectángulos contiguos del mismo ancho y cuya altura es la frecuencia absoluta del intervalo. Un histograma cuenta con:

Una escala horizontal, en la cual se indican el límite inferior y el superior de cada intervalo.

Una escala vertical, en la cual se indican las frecuencias absolutas de cada clase

La amplitud de cada intervalo de clase es la diferencia entre los extremos del intervalo. En general, conviene que todos los intervalos tengan la misma amplitud. Por ej.

40 40;50 50incluye al no incluye al

Amplitud= 50 40 10

El punto medio de cada intervalo se denomina marca de

clase. En ;a b , la marca de clase se obtiene haciendo:

2

a b

8

9

ACTIVIDADES UNIDAD Nº 2

Ejercitación 1: Escriban para cada enunciado la población estadística, la muestra y la variable de estudio.

a) Se realizó una encuesta en tres escuelas del partido de Quilmes, para averiguar cuántas horas

semanales estudian los alumnos.

Población: Muestra: Variable en estudio:

b) Se realizó una encuesta a 100 personas de un barrio de la provincia de Tierra del Fuego, para averiguar

cuántas habitaciones tiene la casa donde vive cada uno. c) Se efectuó una encuesta a 50 alumnos de un colegio para averiguar, cuál es la materia preferida de

cada uno. d) Se hizo una encuesta a los habitantes de Capital Federal, para conocer la cantidad de hijos que había

por familia. Para ello encuestaron los barrios de Saavedra, Flores, Devoto y La Boca. e) Se confeccionó una encuesta entre los espectadores de los cines que se encuentran en los Shoppings,

para averiguar los géneros de películas preferidas. Las encuestas se realizaron en los Shoppings de Avellaneda, Pilar y Munro.

Ejercitación 2: Con la intención de diferenciar los tipos de variables. Clasifique convenientemente la siguiente lista, aclarando en el caso de ser cuantitativa, si es discreta o continua.

a) Peso de los niños al nacer. b) Ingreso (sueldo) del jefe de hogar. c) Cigarrillos fumados por día. d) Nivel de educación. e) Número de televisores producido por una fábrica por mes. f) Velocidad del viento de una zona geográfica. g) Estado civil de una persona. h) Altura de las viviendas de una ciudad. i) Palabras escritas por minuto. j) Contenido de latas de tomate. k) Número de escuelas por provincia. l) Llamadas telefónicas por hora. m) Número de habitaciones en los hoteles de Ushuaia. n) Litros de combustible gastados por un automóvil en un día.

Ejercitación 3: Se realizó una encuesta a un grupo de chicos para averiguar, cuántos hermanos tienen

y los resultados fueron.

0 2 1 2 0 2 0 1 3 0

2 1 2 2 2 3 0 5 2 1

Completar la siguiente tabla y responde:

X: variable

F. absoluta (fi)

F. relativa (fr)

En fracción

En decimales

Totales

a) ¿Cuál es la variable de estudio y qué tipo de variable es?

b) ¿Qué porcentaje de los

encuestados tiene dos hermanos?

10

Ejercitación 4: Completar la tabla interpretando la información del texto.

“ El servicio metereológico dio la siguiente información sobre el estado del tiempo en la ciudad de Bs. As., durante el primer semestre del año 2009.”

Enero: 10 días nublados, 5 días de lluvia y el resto de sol. Febrero: 12 días nublados, 3 días de lluvia y el resto de sol. Marzo:20 días de sol, 3 días nublados y el resto de lluvia. Abril: 12 días de sol, 15 días nublados y el resto de lluvia. Mayo:11 días de lluvia, 12 días de sol y el resto nublados. Junio: 17 días de lluvia, 11 días de sol y el resto nublados.

X: variable

F. absoluta ( fi )

F. relativa ( fr ) F. porcentual

( fp ) En

fracción En

decimales

Totales

Ejercitación 5: Completar la siguiente tabla referida a 25 modelos de una agencia.

X: Color de cabello

F. absoluta

( fi )

F. relativa ( fr ) F. porcentual

( fp ) En

fracción En

decimales

Castaño claro

Castaño oscuro

0,08

Pelirrojo

3/25

Rubio dorado

4%

Rubio ceniza

2/5

Totales 25

Ejercitación 6: En la planilla se muestra la cantidad de celulares vendidos por día en un negocio durante 20 días.

X: variable

F. absoluta ( fi )

F. acumulada ( fa )

F. relativa ( fr ) F. porcentual

( fp ) En

fracción En

decimales

3

4

5

6

7

8

Totales

Contesten:

1. ¿Durante cuántos días se vendieron menos de 6 celulares? 2. ¿Durante cuántos días se vendieron 7 celulares? 3. ¿Durante cuántos días se vendieron a lo sumo 4 celulares?

4 3 6 7 7 5 6 6 7 8

5 4 7 6 7 5 8 6 4 6

11

Ejercitación 7: Observen la siguiente tabla.

Las longitudes de los mayores puentes

Tipo Nombre País Longitud (en m)

Puente suspendido Akashi-Kaykyo Japón 1.750

Puente suspendido Humber Inglaterra 1.410

Puente suspendido Verrazano Narrows EE.UU. (Nueva York) 1.298

Puente suspendido Golden Gate EE.UU. (California) 1.280

Puente suspendido Mackinac EE.UU. (Michigan) 1.158

Puente con arco de acero Fayetteville EE.UU. (Virginia) 518

Puente con arco de acero Bayonne EE.UU. (Nueva Jersey) 504

Puente con arco de acero Sydney Australia 503

Calculen:

1. La moda de los tipos de puente y países. 2. La longitud promedio de los puentes. 3. La mediana de la longitud de los puentes.

Ejercitación 8: Emiliano tiró 2 dados y anotó la suma de los valores de las caras que salieron en cada

jugada. Calculen:

1. Calculen el promedio de las sumas anteriores. 2. Escriban la moda de las sumas.

Ejercitación 9: Las temperaturas máximas en ºC en Tandil del 25 de Junio al 4 de Julio del 2009, son: Respondan:

1. ¿Cuál es la variable de estudio? 2. ¿Qué tipo de variable es?

Calculen:

1. La media aritmética ( x )

2. La moda (Mo) 3. La mediana (Me)

Ejercitación 10: En el aeroparque Jorge Newbery, se realizan 5 vuelos los días sábado y 4 vuelos los

días domingo a Uruguay. Los sábados viajan 78 personas por vuelo en los 3 primeros vuelos y 59 personas por vuelo en los 2 siguientes. Los domingos viajan 63 personas por vuelo en los 2 primeros vuelos y 59 personas por vuelo en los 2 siguientes.

Calculen: a) El promedio de personas por vuelo los días sábados. b) El promedio de personas por vuelo los días domingos. c) El promedio de personas por vuelo el fin de semana.

7 7 5 3 11 7 2 4 7

7 12 10 8 8 5 7 7 7

8 9 8 3 11 12 10 8 10 11

12

Ejercitación 11: En Ushuaia se realizó una prueba de atletismo. Se confeccionó una tabla con los

datos de los participantes y el tiempo que tardaron en llegar a la meta.

Participante Edad Profesión Sexo Tiempo (min)

1 15 Estudiante F 15

2 21 Estudiante F 20

3 32 Comerciante M 18

4 45 Comerciante M 26

5 33 Operario M 31

6 32 Operario M 16

7 20 Estudiante M 18

8 21 Empleado F 25

9 15 Estudiante F 24

10 15 Estudiante M 31

11 32 Empleado M 15

12 20 Operario M 31

13 32 Comerciante F 25

14 32 Comerciante M 30

Ejercitación 12: Los siguientes datos corresponden a las inasistencias de los alumnos de un

curso registradas durante todo un año.

2 3 8 2 7 4 5 9 10 2 4 3

10 11 4 1 2 4 5 1 2 1 1 1

3 3 4 3 1 2 6 7 8 11 11 2

8 1 3 9 2 3 5 6 2 1 2 3

a) ¿Cuál es la variable estadística ?. Clasifícala. b) Armar una tabla con intervalos de clase de amplitud =2, que incluya: frecuencias absolutas,

frecuencias absolutas acumuladas, frecuencias relativas (fracción y decimales) , porcentaje y marca de clase.

c) ¿Cuántos alumnos tuvieron por lo menos 7 faltas? d) Ordenar los datos de menor a mayor y calcular la media aritmética. e) Escribir la moda y la mediana de los datos. f) Realizar el histograma correspondiente a las frecuencias absolutas.

Ejercitación 13: En un colegio se pregunta a los alumnos de 2 divisiones por su estatura en

centímetros, y se obtiene el siguiente resultado.

138 130 140 128 145 133 129 143 137 138

129 133 140 145 128 138 140 146 142 148

132 130 146 135 138 143 133 130 140 135

143 138 137 135 133 132 137 138 140 142

a) ¿Cuál sería la población estadística? ¿Cuál es la variable estadística ?. Clasifícala. b) Armar una tabla con intervalos de clase de amplitud =3, que incluya: frecuencias absolutas,

frecuencias absolutas acumuladas, frecuencias relativas (fracción y decimales) y porcentaje. c) ¿Qué porcentaje de alumnos tiene a lo sumo 1,30 metros? d) ¿Cuántos alumnos podrían ingresar al equipo de natación si para ello deben medir más de 1,40

metros? e) Ordenar los datos de menor a mayor y calcular la media aritmética. f) Escribir la moda y la mediana de los datos. g) Realizar el histograma correspondiente a las frecuencias absolutas.

Calculen: a) La moda de las edades,

profesiones, sexo y tiempo. b) La mediana de la edades y

del tiempo. c) La media aritmética de la

edades y del tiempo.

13

ACTIVIDADES CON GRÁFICOS

Ejercitación 14: El gráfico muestra el resultado de una encuesta que se realizó a un grupo de personas para averiguar qué tipo de programas ven en la televisión entre las 20 y las 22 horas.

05

101520253035404550556065707580859095

100105110115120125130135

Noticieros Películas Musicales Series Deportes Otros

Fre

cu

en

cia

ab

so

luta

X: ( f i) ( fr ) Fracción Dec.

( fp ) % Ángulo central

correspondiente

Ejercitación 15: Completen el siguiente cuadro referido a la bebida que ingieren en su desayuno

60 personas y confeccionen el gráfico circular correspondiente.

( fi )

( fr ) Fracción Dec.

( fp ) % Ángulo central

correspondiente

Mate 18

Té 12

Té con leche 8

Café 15

Café con leche 7

Total 60

a) Completen la tabla con los datos del gráfico.

b) ¿Cuál es la variable? Clasifíquenla.

c) Escriban la moda. d) ¿Qué porcentaje de los

encuestados miran programas deportivos?

e) Realicen un gráfico circular

14

Ejercitación 16 : El gráfico muestra la venta de pizzas en un negocio durante el día sábado.

Clases de pizzas

0 5 10 15 20 25 30 35 40 45

Muzzarella

Calabresa

Jamón

Napolitana

Fr. absoluta

a) Realicen un tabla con las siguientes columnas: clase de pizza, cantidad vendida, frecuencia relativa y frecuencia porcentual.

b) Realicen un gráfico circular. c) ¿Cuál fue el gusto de pizza más vendido? ¿Qué medida estadística proporciona este dato?

d) ¿Qué porcentaje de las pizzas vendidas agrupó la napolitana?