Clase 2 - CDF y Estadística Gráfica

35
CUADROS DE DISTRIBUCIÓN DE FRECUENCIA ESTADÍSTICA GRÁFICA Ing. Alina Valverde Urtecho

Transcript of Clase 2 - CDF y Estadística Gráfica

Page 1: Clase 2 - CDF y Estadística Gráfica

CUADROS DE DISTRIBUCIÓN DE FRECUENCIA

ESTADÍSTICA GRÁFICA

Ing. Alina Valverde Urtecho

Page 2: Clase 2 - CDF y Estadística Gráfica

En la estadística se trabaja generalmente con una gran cantidad de datos los cuales por facilidad de análisis y cálculos se organizan y resumen en cuadros o tablas estadísticas. Aún cuando un cuadro o tabla de datos se construye a libre criterio de quien lo ejecuta, generalmente es común el seguir algunas pautas que de alguna forma homogenizan criterios y ayudan a los fines didácticos.

1. TABLAS O CUADROS DE DISTRIBUCIÓN DE FRECUENCIAS (CDF)

Page 3: Clase 2 - CDF y Estadística Gráfica

2. PARTES DE UNA TABLA O CUADRO DE DISTRIBUCION DE FRECUENCIAS (CDF)

Las partes de un CDF son las siguientes:

1. Número del cuadro de frecuencias en forma correlativa.2. Título: Especificar la variable y la muestra en estudio.

(Distribución de “muestra” según “variable de estudio”)3. Encabezado o conceptos.4. Cuerpo o contenido del cuadro de frecuencias5. Pie de Cuadro: Nota de pie (no siempre es necesaria), Fuente,

Elaboración.

Page 4: Clase 2 - CDF y Estadística Gráfica

2. PARTES DE UNA TABLA O CUADRO DE DISTRIBUCION DE FRECUENCIAS: (CDF)

Page 5: Clase 2 - CDF y Estadística Gráfica

3. ELEMENTOS PARA CONSTRUIR UN CDF:

Para construir un cuadro de frecuencias se utilizan los siguientes elementos:

1. Valor de la variable Xi: Los valores de la variable o datos se representan por Xi. Ejm: Si se tienen 50 datos sus valores correspondientes no agrupados se representan como X1, X2, X3, ....., X50

2. Intervalos de clase: Los intervalos son subconjuntos de la recta real que están definidos por un límite menor o inferior Li y un límite mayor o superior Ls.

3. Frecuencia absoluta simple (fi):Está constituida por el número de veces que se repite un valor. En el caso de intervalos es el número de observaciones comprendidas en dicho intervalo. Estas frecuencias siempre son enteros positivos y además la suma de todos ellos es el tamaño de la muestra “n”.

Page 6: Clase 2 - CDF y Estadística Gráfica

3. ELEMENTOS PARA CONSTRUIR UN CDF:

n

fihi

4. Frecuencia Relativa hi ó hi%: Indica la relación o proporción existente entre la frecuencia absoluta simple y el número total de datos. e expresa en tanto por uno (hi) o en tanto por ciento (hi%). Así:

5. Frecuencia absoluta acumulada (Fi): Resulta de la suma de las frecuencias cuyas marcas de clase son iguales o menores a la marca de clase del intervalo dado o considerado, es decir:

F1 = f1

F2 = f1 + f2

F3 = f1 + f2 + f3

.........................Fk = f1 + f2 + f3 + ....... + fk

100(%) xn

ifhi

Page 7: Clase 2 - CDF y Estadística Gráfica

3. ELEMENTOS PARA CONSTRUIR UN CDF:

6. Frecuencia Relativa Acumulada Hi ó Hi%: Resulta de la suma de las frecuencias relativas simples hasta la frecuencia del intervalo considerado. Así:

H1 = h1

H2 = h1 + h2

…….H5 = h1 + h2 + h3 + h4 + h5

7. Marca de Clase (Xi): Es el promedio de los valores correspondientes a los límites inferior y superior de cada uno de los intervalos determinados.

Page 8: Clase 2 - CDF y Estadística Gráfica

Tipos de Cuadros de acuerdo a la variable

Page 9: Clase 2 - CDF y Estadística Gráfica

Gráfico Estadístico

Un gráfico o diagrama es una representación pictórica con el objeto de ilustrar los cambios que se realizan en una variable.

Sirve también para comparar visualmente dos o más variables similares o relacionadas.

Un gráfico transmite de manera casi instantánea: hechos, cantidades y comportamientos de variables.

Los gráficos estadísticos son representaciones de información que existe en el mundo, en ningún caso es una ficción que surge de la imaginación del artista, el gráfico es la expresión artística de datos reales y observados.

Page 10: Clase 2 - CDF y Estadística Gráfica

Partes de un Gráfico

1. Numeración:Para dar una numeración ordenada de los gráficos.

2. Título:Expresa el contenido del gráfico y por lo general, es igual o parecido al título del cuadro estadístico que sirvió de referencia. Aquí se señala la muestra en estudio y la variable.

3. Diagrama:Esta dado por el propio dibujo, y representa el comportamiento de los datos.

4. Escalas y/o leyendas:Son indicadores donde se precisa la correspondencia entre los elementos del gráfico y la naturaleza de las medidas representadas.

5. Fuente:Indica el origen de los datos estadísticos que se están presentando en el gráfico

6. Elaboración

Page 11: Clase 2 - CDF y Estadística Gráfica

TIPOS DE GRÁFICOS DE ACUERDO A LA VARIABLE

Page 12: Clase 2 - CDF y Estadística Gráfica

1. Gráfico de Barras

o Este gráfico es utilizado para describir datos referentes a una variable CUALITATIVA (Nominal u Ordinal).

o También se utiliza para representar data de variables tipo cuantitativo discreto.

o Está constituido por un conjunto de rectángulos separados convenientemente.

o No tienen un ancho apropiado, depende del investigador y tiene como altura la respectiva frecuencia (fi, hi%).

o Dentro de estas tenemos:Barras Simples (cuadros simples)Barras dobles (cuadro de doble entrada)Barras múltiples (cuadros de múltiple entrada)

Page 13: Clase 2 - CDF y Estadística Gráfica

2. Gráfico Sectorial o Circular

o Se utilizan cuando se tiene información de una variable cualitativa.

o Se trata de un círculo, cuya área se divide en sectores proporcionales a las

partes integrantes de un total.

o Para la representación es necesario establecer primero el porcentaje de

cada elemento, respecto del total.

Page 14: Clase 2 - CDF y Estadística Gráfica

o Se utilizan cuando se tiene información de una variable cualitativa.

o Fáciles de entender.

o El área de cada modalidad debe ser proporcional a la frecuencia.

3. Pictograma

Page 15: Clase 2 - CDF y Estadística Gráfica

4. Gráfico de Bastones

Este gráfico es utilizado para describir datos referentes a una variable discreta.

Está constituido por un conjunto de segmentos perpendiculares al eje de la variable, en cada uno de los valores discretos de la variable y con una altura proporcional a su frecuencia (absoluta fi o relativa hi%).

También es utilizado para graficarlas con las frecuencias Fi y Hi.

Page 16: Clase 2 - CDF y Estadística Gráfica

5. Gráfico de Escalones

Este gráfico es utilizado para describir datos referentes a una variable discreta.

Está constituido por un conjunto de segmentos horizontales al eje de la variable, con una altura proporcional a su frecuencia acumulada (absoluta Fi o relativa Hi%).

Page 17: Clase 2 - CDF y Estadística Gráfica

6. Histograma de Frecuencias

o Este gráfico es utilizado para describir datos referentes a variables continuas, que por lo general se agrupan en tablas de frecuencias con intervalos.

o Está formado por un conjunto de rectángulos continuos cuya base es la amplitud interválica y como la altura la respectiva frecuencia (fi, Fi, hi%, Hi%)

Page 18: Clase 2 - CDF y Estadística Gráfica

7. Polígono de Frecuencias

o Este gráfico sirve para representar datos de variables continuas.o Se construye uniendo con una línea poligonal los puntos medios

o marcas de clase (Xi) superiores de cada intervalo.o Esta se grafica teniendo en cuenta las frecuencias simples y las

acumuladas.o Si se considera la Fi o Hi% se obtiene la OJIVA.

Polígono de frecuencias para el Nº de Años de Funcionamiento de 48 Estaciones Hidrométricas.

0

2

4

6

8

10

12

14

16

*1 *7 *13 *19 *25 *31 *37 *43 *49

Años de funcionamiento

Ojiva del Nº de años de funcionamiento de 48 Estaciones Hidrométricas

0

10

20

30

40

50

60

[-2 - 4> [4 - 10> [10 - 16> [16 - 22> [22 - 28> [28 - 34> [34 - 40> [40 - 46]

Años de funcionamiento

Nº d

e es

taci

ones

4 10 16 22 28 34 40 46 46

Page 19: Clase 2 - CDF y Estadística Gráfica

EJEMPLO 1:

Con la finalidad de mejorar la calidad de atención en una clínica local, se ha formulado la siguiente pregunta a 45 pacientes atendidos durante una semana: “¿Cómo califica Ud. la calidad de atención recibida: muy buena, buena, aceptable, mala o muy mala. Se realiza el conteo de las variables: o Muy buena ///// o Buena ///// ///// ///// / o Aceptable ///// ///// // o Mala ///// /// o Muy mala ////

a) Construir un cuadro de distribución de frecuencias completo.b) Interprete f2, F3, h1%, H2%

c) Construya los gráficos pertinentes

Page 20: Clase 2 - CDF y Estadística Gráfica

1ro Identificar la variable de estudio: calidad de atención recibida.2do Tipo de variable: cualitativa ordinal.3ro Construir el CDF

Pasos parte a):

Número de TasaPacientes (fi) Porcentual (hi%)

Muy Buena 5 5 11.11 11.11

Buena 16 21 35.56 46.67

Aceptable 12 33 26.67 73.33

Mala 8 41 17.78 91.11

Muy Mala 4 45 8.89 100.00

Total 45 100.00

Calidad de Atención

Fi Hi%

Cuadro N°1: Distribución de 45 pacientes atendidos durante una semana según la calidad de atención recibida.

Fuente: Información obtenida de las encuestasElaboración: Estudiantes

b) Interpretar:f2: De los 45 pacientes atendidos, 16 de ellos califican la calidad de atención recibida como buena.

H2%: Del total de los pacientes atendidos, el 46.67% califican la calidad de atención recibida como muy buena y buena.

Page 21: Clase 2 - CDF y Estadística Gráfica

10/04/2023 Ing. Alina Valverde Urtecho 21

5

16

12

8

4

02468

1012141618

Muy Buena Buena Aceptable Mala Muy Mala

Nro

de

paci

ente

s

Categoría

Gráfico N°1.1: Distribución de 45 pacientes atendidos durante una semana según la calidad de atención recibida

Fuente: Información obtenida de los testElaboración: Estudiantes

Parte c) Gráfico de Barras

Page 22: Clase 2 - CDF y Estadística Gráfica

10/04/2023 Ing. Alina Valverde Urtecho 22

11%

36%

27%

18% 9%

Gráfico N°1.2: Distribución de 45 pacientes atendidos durante una semana según la calidad de atención recibida

Muy Buena

Buena

Aceptable

Mala

Muy Mala

Fuente: Información obtenida de los testElaboración: Estudiantes

Gráfico Circular

Page 23: Clase 2 - CDF y Estadística Gráfica

EJEMPLO 2:

A continuación se presenta una base de datos respecto al número de hijos en una muestra de 20 familias residentes en la ciudad de Cajamarca.

6 5 4 4 3 3 4 4 5 5 4 5 6 2 4 3 4 6 5 3

a) Construir un cuadro de distribución de frecuencias completo.b) Interprete f2, F3, h1%, H2%

c) Construya los gráficos pertinentes

Page 24: Clase 2 - CDF y Estadística Gráfica

1ro Identificar la variable de estudio: número de hijos.2do Tipo de variable: cuantitativa discreta.3ro Construir el CDF

Pasos parte a):

Fuente: Información obtenida de las encuestasElaboración: Estudiantes

b) Interpretar:F3: De las 20 familias residentes en la ciudad de Cajamarca, 12 de ellas tienen entre 2 y 4 hijos.

h1%: Del total de las familias residentes en la ciudad de Cajamarca, el 20% de ellas tienen 3 hijos.

Cuadro N°2: Distribución de 20 familias residentes en la ciudad de Cajamarca según el número de hijos

Número de

Familias (fi)

2 1 1 5.00 5.00

3 4 5 20.00 25.00

4 7 12 35.00 60.00

5 5 17 25.00 85.00

6 3 20 15.00 100.00

Total 20 100.00

N° Hijos Fi Hi%hi%

Page 25: Clase 2 - CDF y Estadística Gráfica

1

4

7

5

3

0

1

2

3

4

5

6

7

8

2 3 4 5 6

Nro

de

fam

ilias

Nro de hijos

Gráfico N°2.1: Distribución de 20 familias residentes en la ciudad de Cajamarca según el número de hijos

Fuente: Base de datosElaboración: Estudiantes

Parte c) Gráfico de BASTONES

Frecuencias Absolutas Simples

1

5

12

17

20

0

5

10

15

20

25

2 3 4 5 6

Nro

de

fam

ilias

Nro de hijos

Gráfico N°2.2: Distribución de 20 familias residentes en la ciudad de Cajamarca según el número de hijos

Frecuencias Absolutas Acumuladas

Fuente: Base de datosElaboración: Estudiantes

Page 26: Clase 2 - CDF y Estadística Gráfica

10/04/2023 Ing. Alina Valverde Urtecho 26

Fuente: Base de datosElaboración: Estudiantes

Gráfico de BARRAS

0

1

2

3

4

5

6

7

8

2 3 4 5 6

Nro

de

fam

ilias

Nro de HIjos

Gráfico N°2.3: Distribución de 20 familias residentes en la ciudad de Cajamarca según el número de hijos

Page 27: Clase 2 - CDF y Estadística Gráfica

EJEMPLO 3:

A continuación se presentan los montos en soles correspondientes a las compras de 40 clientes de la Distribuidora Regional del Norte.

370 445 320 460 540 379 420 570 348 470 315 365 470 390 430 303 437 530 380 540 305 475 598 382 310 320 415 590 490 580 355 475 570 395 560 330 360 530 405 485

a) Construir un cuadro de distribución de frecuencias completo.b) Interprete f2, F3, h1%, H2%, X3

c) Construya los gráficos pertinentes

Page 28: Clase 2 - CDF y Estadística Gráfica

Pasos:1ro Identificar la variable de estudio: montos de las compras.2do Tipo de variable: cuantitativa continua. INTERVALOS

R = Valor máximo - Valor mínimo

K = 1 + 3.322 log ( n )

A = R / K

Este valor siempre es un número entero (Redondeo)

3) Determinar la amplitud interválica “A”

Este valor está en función de la estructura de la base de datos (tomar el inmediato superior)

1) Hallar el Rango ( R):

2) Determinar el número de intervalos( K)

Page 29: Clase 2 - CDF y Estadística Gráfica

4. Calcular las marcas de clase :

5. Determinar los intervalos y finalmente construir el cuadro

Page 30: Clase 2 - CDF y Estadística Gráfica

Fuente: Información obtenida de los testElaboración: Estudiantes

Intervalos Número de

soles Clientes (fi)

[ 303 - 353 > 8 8 20.00 20.00 328.00

[ 353 - 403 > 9 17 22.50 42.50 378.00

[ 403 - 453 > 6 23 15.00 57.50 428.00

[ 453 - 503 > 7 30 17.50 75.00 478.00

[ 503 - 553 > 4 34 10.00 85.00 528.00

[ 553 - 603 ] 6 40 15.00 100.00 578.00

Total 40 100.00

Fi Hi%hi% Xi

Cuadro N°3: Distribución de 40 clientes de la Distribuidora “Regional del Norte” de acuerdo al monto de su compra en soles

Rango: R = 598 – 303 = 295 soles

Nro de intervalos: Amplitud:K = 1 + 3.322*log(40) = 6.322 A = R/K = 295/6 = 49.16K = 6 (redondeo matemático) A = 50 (redondeo al mayor)

Page 31: Clase 2 - CDF y Estadística Gráfica

b) Interpretar

o f2: De los 40 clientes, 9 de ellos realizaron una compra por un monto entre 353 y menos de 403 soles.

o F3: De los 40 de clientes, 23 de ellos realizaron una compra por un monto entre 303 y menos de 453 soles.

o h1%: Del total de clientes, el 20% de ellos realizaron una compra por un monto entre 303 y menos de 353 soles.

o H2%: Del total de clientes, el 42.5% de ellos realizaron una compra por un monto entre 303 y menos de 403 soles.

o X3: 6 clientes realizaron una compra promedio por un monto de 428 soles.

10/04/2023 Lic. Anhelí Ramírez Mendocilla 31

Page 32: Clase 2 - CDF y Estadística Gráfica

10/04/2023 Ing. Alina Valverde Urtecho 32

20% 23%

15% 18%

10%

15%

0%

5%

10%

15%

20%

25%

353 403 453 503 553 603

303 353 403 453 503 553

% d

e cli

ente

s

Intervalo (monto de su compra)

Gráfico N°3.1: Distribución de 40 clientes de la Distribuidora "Regional del Norte" de acuerdo al monto

de su compra en soles

Fuente: Información obtenida de los testElaboración: Estudiantes

Frecuencias Relativas

Page 33: Clase 2 - CDF y Estadística Gráfica

10/04/2023 Ing. Alina Valverde Urtecho 33

20%43%

58%75%

85%100%

0%

20%

40%

60%

80%

100%

120%

353 403 453 503 553 603

303 353 403 453 503 553

% d

e cli

ente

s

Intervalo (monto de su compra)

Gráfico N°3.2: Distribución de 40 clientes de la Distribuidora "Regional del Norte" de acuerdo al monto

de su compra en soles

Fuente: Información obtenida de los testElaboración: Estudiantes

Frecuencias Relativas Acumuladas

Page 34: Clase 2 - CDF y Estadística Gráfica

10/04/2023 Ing. Alina Valverde Urtecho 34

20%23%

15%

18%

10%

15%

0%

5%

10%

15%

20%

25%

278 328 378 428 478 528 578 628

% d

e cl

ient

es

Marca de Clase

Gráfico N°3.3: Distribución de 40 clientes de la Distribuidora "Regional del Norte" de acuerdo al monto

de su compra en soles

Frecuencias Relativas

Fuente: Información obtenida de los testElaboración: Estudiantes

Page 35: Clase 2 - CDF y Estadística Gráfica

20%

43%58%

75% 85% 100%

0

0.2

0.4

0.6

0.8

1

1.2

303 353 403 453 503 553 603

253 303 353 403 453 503 553

% d

e cli

ente

s

Intervalo (monto de su compra)

Gráfico N°3.4: Distribución de 40 clientes de la Distribuidora "Regional del Norte" de acuerdo al monto

de su compra en soles

Fuente: Información obtenida de los testElaboración: Estudiantes

Frecuencias Relativas Acumuladas