Elementos de estadistica_descriptiva

73
ELEMENTOS DE ESTADÍSTICA DESCRIPTIVA Profr. Eliud Quintero Rodríguez

Transcript of Elementos de estadistica_descriptiva

Page 1: Elementos de estadistica_descriptiva

ELEMENTOS DE ESTADÍSTICA DESCRIPTIVAProfr. Eliud Quintero Rodríguez

Page 2: Elementos de estadistica_descriptiva

Introducción

La Estadística es una ciencia que facilita la solución de problemas en los cuales necesitamos conocer características sobre el comportamiento de algún suceso o evento.

Nos permite inferir el comportamiento de sucesos iguales o similares sin necesidad de que estos ocurran.

Page 3: Elementos de estadistica_descriptiva

Esto nos da la posibilidad de tomar decisiones acertadas y a tiempo, así como realizar proyecciones del comportamiento del suceso.

Sólo se realizan los cálculos y el análisis con los datos obtenidos de una muestra de la población y no con toda la población.

Page 4: Elementos de estadistica_descriptiva

Actualmente el INEGI es el encargado de concentrar y publicar la información estadística del estado y del país.

Page 5: Elementos de estadistica_descriptiva

Conceptos básicos Estadística:

Es la ciencia que se encarga de recolectar, organizar, resumir y analizar datos para después obtener conclusiones. Se divide en Estadística Descriptiva y Estadística Inferencial.

Estadística descriptiva:

Se encarga de la recolección, organización, presentación y análisis de los datos de una población.

Page 6: Elementos de estadistica_descriptiva

Estadística inferencial:Se encarga de analizar la información presentada por la estadística descriptiva mediante técnicas que nos ayuden a conocer, con determinado grado de confianza, a la población. Lo que nos permite tomar decisiones.

Page 7: Elementos de estadistica_descriptiva

Población:Conjunto definido de TODOS los INDIVIDUOS, de donde se observa cierta característica.

Al número de integrantes de la población se llama tamaño de la población y se representa con la letra N.

Las poblaciones pueden ser finitas o infinitas.

Page 8: Elementos de estadistica_descriptiva

Población Estadística:Conjunto de TODOS los DATOS que se obtienen al realizar la medición de una variable en los elementos de una población.

Muestra:Subconjunto de una población, que intenta reflejar las características de la población lo mejor posible.El número de individuos que integran la muestra, llamado tamaño de la muestra se representa con la letra n.

Page 9: Elementos de estadistica_descriptiva

Individuo:Es el elemento de la población o de la muestra que aporta información sobre lo que se estudia.

Variable:Característica o propiedad de los individuos que se desea estudiar y se puede medir o calificar; cambia o varía con el tiempo en un individuo dado, o cambia o varía de elemento a elemento.

Ej. Edad, peso, sexo, estado civil, número de hijos, etc.

Page 10: Elementos de estadistica_descriptiva

Dato:Valor que se obtiene al realizar la medición de la característica de la variable en estudio.Pueden ser univariados, bivariados o multivariados.

La naturaleza de los datos pueden ser datos cuantitativos o datos cualitativos.

Page 11: Elementos de estadistica_descriptiva

Datos Cuantitativos (números):Valores obtenidos al medir peso, estatura, temperatura, número de hijos.

Datos Cualitativos (categorías):Se obtienen al calificar la característica en cuestión como el sexo, estado civil, grado máximo de estudios.

Page 12: Elementos de estadistica_descriptiva

Variable Dicotómica:Sólo puede tomar dos valores (sí – no, 0 – 1, hombre – mujer, bueno – malo, encendido – apagado).

En la variable CUANTITATIVA se pueden distinguir dos tipos: continua y discreta.

Page 13: Elementos de estadistica_descriptiva

Variable Continua:Si la variable puede tomar cualquier número real entre dos valores dados (decimal o entero). Ej. El peso de un individuo.

Variable Discreta:Si la variable sólo puede tomar números enteros.Ej. El número de hijos de un individuo.

Page 14: Elementos de estadistica_descriptiva

Escalas de Medición Escala Nominal

Escala Ordinal Escala de

Intervalo Escala de

Razón

Page 15: Elementos de estadistica_descriptiva

Escala Nominal:Está asociada a variables cualitativitas y es denominada de este modo si no se pueden hacer operaciones aritméticas entre sus valores, pues éstos son únicamente ETIQUETAS.

Ejemplo: sexo, código postal, estado civil, número telefónico, número al correr en un maratón, deporte favorito, carrera a estudiar, etc.

Page 16: Elementos de estadistica_descriptiva

Escala Ordinal:Los valores de la variable que tienen un ORDEN con un nivel específico, pero no se pueden hacer operaciones aritméticas entre ellas.

Ejemplo: Pésimo – Malo – Regular – Bueno – ExcelentePrimaria – Secundaria – Preparatoria - Licenciatura

Page 17: Elementos de estadistica_descriptiva

Escala de Intervalo:En ella existe un orden entre los valores de la variable y además una NOCIÓN DE DISTANCIA aunque no se puedan realizar operaciones. El cero o punto de inicio no es único, es más bien un punto de referencia.

Ejemplo: Escalas de temperatura, la edad de la Tierra, la línea del tiempo de la humanidad.

Page 18: Elementos de estadistica_descriptiva

Escala de Razón:La magnitud tiene SENTIDO FÍSICO, existe el cero absoluto, existe orden, se puede determinar cuántas veces es mayor uno que otro.

Ejemplo: peso, estatura, edad, distancia, dinero, etc.

Page 19: Elementos de estadistica_descriptiva

Fuentes de información

Encuesta:Recopilar los datos mediante el uso de cuestionarios o entrevistas.

Experimento:Procedimiento utilizado en la investigación científica para obtener información que permita conocer el comportamiento de algún proceso.

Page 20: Elementos de estadistica_descriptiva

Fuentes de Información

Investigación Documental:Procedimiento para obtener datos mediante la consulta de información ya escrita y concentrada en documentos que se localicen en libros o revistas en bibliotecas, hemerotecas, o en centros virtuales.

Page 21: Elementos de estadistica_descriptiva

Redondeo de datos, notación científica y cifras

significativas. Redondeo:

El redondeo de datos es un procedimiento que consiste en escribir un número que representa a una cantidad con menos cifras de las que tiene realmente para tener una idea rápida de la cantidad.

Page 22: Elementos de estadistica_descriptiva

Notación Científica Es una manera de escribir en forma breve

cifras muy grandes o pequeñas. La forma general es a x 10 , en donde “a” es un número entre 1 y 9, “n” es un número entero.

Ejemplo:El número 25 000 se escribe 2.5 x 10 , o el número 0.00025 se escribe como 2.5 x 10 .

n

4- 4

Page 23: Elementos de estadistica_descriptiva

Cifras Significativas A los dígitos exactos que se utilizan para escribir

una cifra, a parte de los ceros para localizar el punto decimal, se les llama cifras significativas.

Ejemplos: 3.22 tiene 3 cifras significativas.

0.0032 = 3.2 x 10 tiene 2 cifras significativas.

0.00320 = 3.20 x 10 tiene 3 cifras significativas.- 3

- 3

Page 24: Elementos de estadistica_descriptiva

La cifra 3.22 se encuentra realmente entre 3.215 y 3.225.

La cifra 0.0032 es un valor que se encuentra entre 0.00315 y 0.00325.

La cifra 0.00320 se encuentra entre las cifras 0.003195 y 0.003205

Page 25: Elementos de estadistica_descriptiva

Orden de datos La ordenación es el proceso mediante el

cual los datos están acomodados de tal manera que se establece un orden (ascendente o descendente) entre ellos.

Hay dos métodos comunes:• Listado en orden

ascendente• Método de tallo y hojas

Page 26: Elementos de estadistica_descriptiva

Ejemplo Considera que la variable de estudio es

el peso de 25 estudiantes. Los pesos se encuentran en la siguiente tabla:

Peso de 25 estudiantes (en kg)

40 43 48 51 4956 44 42 55 5252 62 44 50 5963 50 56 55 4557 66 63 51 58

Page 27: Elementos de estadistica_descriptiva

Listado en orden ascendente

El proceso consiste en ordenarlos de menor a mayor

Peso de 25 estudiantes (en kg)

42 40 48 51 4956 44 43 55 5252 62 44 50 5963 50 56 55 4557 66 63 51 58

Peso de 25 estudiantes (en kg)

40 42 43 44 4445 48 49 50 5051 51 52 52 5555 5656 57 5859 62 63 63 66

Page 28: Elementos de estadistica_descriptiva

Método de tallo y hojas Si los números de los datos están

formados por dos dígitos, se hace una columna con el primer dígito (decenas) y a la derecha de cada uno de ellos se escribe, en fila, sólo el segundo dígito (unidades) de cada uno de los datos que tengan el mismo primer dígito.

Page 29: Elementos de estadistica_descriptiva

Datos sin ordenar:

Datos ordenados:

456

456

0,2,3,4,4,5,8,90,0,1,1,2,2,5,5,6,6,7,8,92,3,3,6

Peso de 25 estudiantes (en kg)

42 40 48 51 4956 44 43 55 5252 62 44 50 5963 50 56 55 4557 66 63 51 58

2,0,8,9,4,3,4,51,6,5,2,2,0,9,0,6,5,7,1,82,3,6,3

Page 30: Elementos de estadistica_descriptiva

Doble tallo Una variante de este método es en lugar de

dividir en un grupo las decenas, se divide en dos grupos. El primero abarcando los dígitos del 0 al 4 y el segundo del 5 al 9.

El ejemplo anterior queda:

4 0,2,3,4,44 5,8,95 0,0,1,1,2,2,5 5,5,6,6,7,8,96 2,3,36 6

Page 31: Elementos de estadistica_descriptiva

Caso de variables cualitatitivas El procedimiento es:

Se identifican todos los valores diferentes y se acomodan en columna.

Se agrega una segunda columna en donde se van registrando, mediante una línea vertical, la veces que aparece el valor dado.

Page 32: Elementos de estadistica_descriptiva

Ejemplo Considera que la variable de estudio es

el color de playera de 25 estudiantes. Los colores se encuentran en la siguiente tabla:

rosa azul blanco azul rosagris blanco café negro blancorosa azul café blanco blancogris azul blanco rosa grisgris blanco café negro verde

Page 33: Elementos de estadistica_descriptiva

rosa azul blanco

azul rosa

gris blanco

café negro blanco

rosa azul café blanco

blanco

gris azul blanco

rosa gris

gris blanco

café negro verde

Color Frecuencia

AzulBlancoCaféGrisNegroRosaVerde

I I I II I I I I II I II I I II II I I II

Page 34: Elementos de estadistica_descriptiva

Tabla de Frecuencia de Datos Una vez que se tenga ordenados los

datos, se acomodan en la “Tabla de distribución de frecuencias o tabla de frecuencias”.

La tabla es básicamente una tabla de valores x-y, dónde “x” representa el dato y “y” representa la frecuencia.

Page 35: Elementos de estadistica_descriptiva

La frecuencia es el número de veces que aparece cada dato.

Hay dos clases de tablas de frecuencias: Para datos NO agrupados. Para datos agrupados.

Page 36: Elementos de estadistica_descriptiva

Tabla de frecuencias para datos NO agrupados

Está formada por dos columnas: una para la variable “xi” y la otra para su frecuencia “f”, a esta frecuencia se le llama frecuencia absoluta o frecuencia observada.

Page 37: Elementos de estadistica_descriptiva

Ejemplo Tabla de frecuencias de los pesos en kg

de 25 alumnos.Peso de 25 estudiantes (en kg)

40 42 43 44 4445 48 49 50 5051 51 52 52 5555 5656 57 5859 62 63 63 66

xi f404243444548495051

xi f525556575859626366

Total

1

1

12

1

1

1

2

2

2

2

2

11

1

1

21

25

Page 38: Elementos de estadistica_descriptiva

Frecuencia relativa y acumulada Por lo regular, se agregan dos columnas:

la de la frecuencia relativa “fr” y la de la frecuencia acumulada “fa”.

La frecuencia relativa se obtiene mediante el cociente de la frecuencia y el número total de datos, esto es fr = f/n.

La frecuencia acumulada se obtiene sumando las frecuencias anteriores a las frecuencias de un dato dado.

Page 39: Elementos de estadistica_descriptiva

Ejemplo

xi f fr fa40 142 143 144 245 148 149 150 251 2

xi f fr fa52 255 256 257 158 159 162 163 266 1Total

25

0.04

0.04

0.04

0.040.040.04

0.040.040.040.040.04

0.08

0.080.08

0.080.080.08

0.08

1/25

2/25

1

2

3

5

6

78

10

12

14

1618

1920

21

22

2425

1

Siempre es el

número total

Siempre es 1

Page 40: Elementos de estadistica_descriptiva

Intervalo de clase En ocasiones es conveniente acomodar los datos en

pequeños grupos de igual tamaño, llamados intervalos de clase.

El punto medio o marca de clase “xi”, se obtiene con:

El tamaño del intervalo se obtiene mediante la diferencia de los límites superior e inferior.

Marca de clase =

Límite inferior + límite superior 2

Page 41: Elementos de estadistica_descriptiva

Ejemplo

Intervalo de clase Punto medio “xi”38 – 42 4043 – 47 4548 – 52 5053 – 57 5558 – 62 6063 – 67 65

Límite inferior Límite superior Lím inf + Lim sup2

Page 42: Elementos de estadistica_descriptiva

Límite verdadero del intervalo Frontera de clase o límite verdadero del

intervalo:Intervalo de clase Punto medio “xi”37.5 – 42.5 4042.5 – 47.5 4547.5 – 52.5 5052.5 – 57.5 5557.5 – 62.5 6062.5 – 67.5 65

40 – 2.5 40 + 2.5

Page 43: Elementos de estadistica_descriptiva

Tabla de intervalos con límites verdaderos

Usando símbolos de desigualdad

Usando paréntesis y corchetesIntervalo

de clasePunto medio

“xi”37.5 ≤ x <

42.540

42.5 ≤ x < 47.5

45

47.5 ≤ x < 52.5

50

52.5 ≤ x < 57.5

55

57.5 ≤ x < 62.5

60

62.5 ≤ x < 67.5

65

Intervalo de clase

Punto medio

“xi”[37.5 , 42.5) 40[42.5 , 47.5) 45[47.5 , 52.5) 50[52.5 , 57.5) 55[57.5 , 62.5) 60[62.5 , 67.5) 65

Está incluido No está incluido Está incluido No está incluido

El tamaño del intervalo es de 5

Page 44: Elementos de estadistica_descriptiva

Si por alguna razón no es fácil decidir el ancho del intervalo y el número de ellos, se pueden utilizar las siguientes fórmulas:

K = 1 + 3.3 log (n) Donde K = número aproximado de

clasesn = número de datos. Amplitud de los intervalos = Rango / K

Donde Rango = diferencia entre el dato mayor y el dato menor.

Page 45: Elementos de estadistica_descriptiva

Ejemplo Para el ejemplo de los datos de los pesos

de 25 alumnos, el valor de K:

Y la amplitud de los intervalos sería:

K = 1 + 3.3 log (n) = 1 + 3.3 log (25) = 5.6.Por lo tanto se requieren aproximadamente 6 intervalos.Amplitud = Rango / K = (66 – 40) / 5.6 = 4.64.Aproximadamente 5 unidades es la amplitud de los intervalos.

Page 46: Elementos de estadistica_descriptiva

Tabla de distribución de frecuencias para datos

agrupados Se elabora con los intervalos de clase, sus

puntos medios y las frecuencias correspondientes para cada uno de los intervalos.xi f40 142 143 144 245 148 149 150 251 2

52 255 256 257 158 159 162 163 266 1

Total

25

Dato

s sin

ag

rupa

r

Intervalo de clase

Punto medio “xi”

f

38 – 42 4043 – 47 4548 – 52 5053 – 57 5558 – 62 6063 - 67 65

Total

Datos agrupados

24853325

Page 47: Elementos de estadistica_descriptiva

Se agregan las columnas de frecuencia relativa “fr” y frecuencia acumulada “fa”:Interva

lo de clase

Punto medio “xi”

f fr Fa

38 – 42 40 243 – 47 45 448 – 52 50 853 – 57 55 558 – 62 60 363- 68 65 3

Total 25

0.080.160.320.200.120.12

1

2614192225

2/25

4/25

8/25

Page 48: Elementos de estadistica_descriptiva

Por último se agregan las columnas: Frecuencia porcentual, “f%” ó “%f”, se

obtiene multiplicando la frecuencia relativa “fr” x 100.

Frecuencia relativa acumulada “fra”, se obtiene sumando las frecuencias relativas anteriores a un dato dado.

Frecuencia porcentual acumulada, “f%a”, se obtiene sumando las frecuencias porcentuales acumuladas a un dato dado.

Page 49: Elementos de estadistica_descriptiva

Tablas de frecuencias absoluta, relativa y

acumuladaIntervalo de clase

Punto medio “xi”

f fr f% fa fra f%a

38 – 42 40 2 0.08

2

43 – 47 45 4 0.16

6

48 – 52 50 8 0.32

14

53 – 57 55 5 0.20

19

58 – 62 60 3 0.12

22

63- 68 65 3 0.12

25

Total 25 1

81632201212

100

0.080.240.560.760.881

824567688

100

0.08 x 100

2/25

0.08 x 100

Page 50: Elementos de estadistica_descriptiva

Gráfica de Datos Existen dos tipos de gráficas mas usuales:

Polígono de Frecuencias Histograma

Otros gráficos: Gráfica de barras Pictograma Gráfico Circular o de pastel.

Page 51: Elementos de estadistica_descriptiva

Polígono de Frecuencias Es la representación mediante un

gráfico de línea. En él se muestra la distribución de frecuencias y está formado por segmentos de línea que unen los puntos correspondientes a la frecuencia de cada una de las clases.

El eje “x” representa el dato “xi” y el eje “y” las frecuencias.

0

10

20

30

40

50

60

Page 52: Elementos de estadistica_descriptiva

Ejemplo

Intervalo de clase

Punto medio “xi”

f

38 – 42 40 2

43 – 47 45 4

48 – 52 50 8

53 – 57 55 5

58 – 62 60 3

63 - 68 65 3

Total 25

Page 53: Elementos de estadistica_descriptiva

El eje “y” puede ser sustituido por las frecuencias relativas o porcentuales.

fr

xi

Polígono de Frecuencia Relativa

Page 54: Elementos de estadistica_descriptiva

% f

xi

Polígono de Frecuencia Porcentual

Page 55: Elementos de estadistica_descriptiva

Histograma Es la representación gráfica de los datos mediante una sucesión

de rectángulos. Está formado por rectángulos cuya anchura

representa a cada uno de los intervalos y la altura corresponde a la frecuencia.

En el eje “x” estarán los límites verdaderos, los puntos medios y en el eje “y” las frecuencias.

0.95 2.95 4.950

2

4

6

8

10

12

14

Page 56: Elementos de estadistica_descriptiva

Intervalo de clase

Punto medio “xi”

f

38 – 42 40 2

43 – 47 45 4

48 – 52 50 8

53 – 57 55 5

58 – 62 60 3

63 - 68 65 3

Total 25

Ejemplo

Page 57: Elementos de estadistica_descriptiva

También podemos usar la frecuencia relativa y la frecuencia porcentual.

fr

xi

Page 58: Elementos de estadistica_descriptiva

% f

xi

Page 59: Elementos de estadistica_descriptiva

Pirámide Poblacional Una variante en el histograma es colocar

en el eje “x” de tal manera que las columnas quedarán en forma horizontal, es muy común en datos poblacionales.

Page 60: Elementos de estadistica_descriptiva

Ojiva Es la representación gráfica de las

frecuencias acumuladas mediante un gráfico de línea. Se muestra la distribución de frecuencias acumuladas de los datos.

En el eje “x” estarán los puntos medios y en el eje “y” las frecuencias acumuladas.

Page 61: Elementos de estadistica_descriptiva

Ejemplo

Intervalo de clase

Punto medio “xi”

f fr fa

38 – 42 40 2 0.08 243 – 47 45 4 0.16 648 – 52 50 8 0.32 1453 – 57 55 5 0.20 1958 – 62 60 3 0.12 2263- 68 65 3 0.12 25

Total 25 1

Page 62: Elementos de estadistica_descriptiva
Page 63: Elementos de estadistica_descriptiva

Usando la frecuencia acumulada y la frecuencia porcentual.

Intervalo de clase

Punto medio “xi”

f fr f% fa fra f%a

38 – 42 40 2 0.08

8 2 0.08

8

43 – 47 45 4 0.16

16 6 0.24

24

48 – 52 50 8 0.32

32 14 0.56

56

53 – 57 55 5 0.20

20 19 0.76

76

58 – 62 60 3 0.12

12 22 0.88

88

63- 68 65 3 0.12

12 25 1 100

Total 25 1 100

Page 64: Elementos de estadistica_descriptiva
Page 65: Elementos de estadistica_descriptiva
Page 66: Elementos de estadistica_descriptiva

Gráfico Circular También es llamado gráfico de pastel.

Sólo se representan datos de frecuencias relativas o frecuencias porcentuales.

Se debe dividir el área del círculo de manera proporcional a las frecuencias.

13%17%

57%

13%PERROPAJAROHAMSTERGATO

Page 67: Elementos de estadistica_descriptiva

Agregaremos una columna a nuestra tabla de frecuencias “Frecuencia relativa al círculo”, multiplicando (fr)(360°), para mostrar la parte proporcional de círculo medida en grados que corresponde a cada intervalo.

Page 68: Elementos de estadistica_descriptiva

Ejemplo 1

Intervalo de clase

Punto medio “xi”

f fr (fr ) (360°)

38 – 42 40 2 0.0843 – 47 45 4 0.1648 – 52 50 8 0.3253 – 57 55 5 0.2058 – 62 60 3 0.1263- 68 65 3 0.12

Total 25 1

28.8°

0.08 x 360°

0.16 x 360°

57.6°115.2°72°43.2°43.2°360°

Page 69: Elementos de estadistica_descriptiva
Page 70: Elementos de estadistica_descriptiva

Ejemplo 2Color Frecuen

ciaConteo

Azul 4Blanco 7Café 3Gris 4Negro 2Rosa 4Verde 1

I I I II I I I I II I II I I II II I I II

Page 71: Elementos de estadistica_descriptiva

Otros Gráficos La gráfica de barras se traza similar

al Histograma, sólo que las barras se dibujan separadas unas de otras.

La escala en el eje “x” es para mostrar categorías o intervalos de números NO consecutivos.

0

10

20

30

40

50

60

PERRO PAJARO HAMSTER GATO

Frec

uenc

ia a

bsol

uta

Page 72: Elementos de estadistica_descriptiva

Carrera Alumnos

Medicina 8Mecánica 11

Civil 8Agronomía 3

Físico - Matemáticas 3

Leyes 6Contaduría 11

Page 73: Elementos de estadistica_descriptiva

Pictograma Similar al de barras, sólo que se

sustituyen por figuras, generalmente relacionadas con la variable estudiada.