Esta Di Stica

150
ESTADISTICA. INTRODUCCIÓN La estadística o los métodos estadísticos, como se denomina a veces, están jugando un papel importante en casi todas las facetas del comportamiento humano. Ocupada inicialmente en asuntos de Estado, y de ahí su nombre, la influencia de la Estadística se ha extendido ahora a la agricultura, biología, negocios, comunicaciones, economía, y otros muchos campos de la ciencia y la ingeniería. El propósito de esta materia, es presentar los principios básicos de la Estadística que serán de utilidad para todo tipo de calculo sea este empresarial o personal. Cada capítulo viene con definiciones claras, junto con problemas resueltos y suplementarios que en muchos casos se utilizan datos obtenidos en situaciones estadísticas reales. Los problemas resueltos sirven para ilustrar y ampliar la teoría, proporcionan la oportunidad de repetir los principios básicos, vital para un aprendizaje eficaz. OBJETIVOS GENERALES: 1.- Hacer que la estadística sea más fácil de aprender, iniciar con lo que los estudiantes ya conocen a partir de su experiencia personal 1

Transcript of Esta Di Stica

Page 1: Esta Di Stica

ESTADISTICA.

INTRODUCCIÓN

La estadística o los métodos estadísticos, como se denomina a veces, están jugando un papel importante en casi todas las facetas del comportamiento humano. Ocupada inicialmente en asuntos de Estado, y de ahí su nombre, la influencia de la Estadística se ha extendido ahora a la agricultura, biología, negocios, comunicaciones, economía, y otros muchos campos de la ciencia y la ingeniería.

El propósito de esta materia, es presentar los principios básicos de la Estadística que serán de utilidad para todo tipo de calculo sea este empresarial o personal.

Cada capítulo viene con definiciones claras, junto con problemas resueltos y suplementarios que en muchos casos se utilizan datos obtenidos en situaciones estadísticas reales. Los problemas resueltos sirven para ilustrar y ampliar la teoría, proporcionan la oportunidad de repetir los principios básicos, vital para un aprendizaje eficaz.

OBJETIVOS GENERALES:

1.- Hacer que la estadística sea más fácil de aprender, iniciar con lo que los estudiantes ya conocen a partir de su experiencia personal

2.- Cubrir todos los temas estadísticos para poder resolver cualquier caso ya sea en la vida empresarial, profesional o personal.

3.- Utilizar una notación matemática comprensiva para los estudiantes.

4.- Se tratará en lo máximo de utilizar ejemplos del mundo real y actualizado para así saber sobre la situación de nuestro medio y del país en general.

1

Page 2: Esta Di Stica

CAPITULO I

VARIABLES Y REPRESENTACIONES.

ESTADÍSTICA.-

La estadística esta ligada por los métodos científicos que permiten la toma, organización, recopilación, presentación y análisis de datos, tanto para la deducción de conclusiones como para tomar decisiones razonables de acuerdo al análisis.

El objeto fundamental de la estadística es presentar un fenómeno a través de un conjunto de datos llamados estadísticas, así se habla de la estadística de empleos, de salarios, de accidentes, etc.

POBLACIÓN Y MUESTRA.-

Población o Universo: Es la recolección completa de todas las observaciones: individuos, objetos o medidas de interés para el investigador.

Muestra: Es una parte representativa de la población que se selecciona para ser estudiada ya que la población es demasiado grande y analizarla es muy costoso o demanda mucho tiempo.

Cuando se lo quiere analizar a todo un grupo, población o universo se utiliza el SISTEMA O MÉTODO DE CENSO y cuando se analizan las características de un grupo menor o reducido se llama MUESTRA.

2

Page 3: Esta Di Stica

VARIABLES: Es una característica de la población que se analiza en un estudio estadístico. Puede ser:

a) CUALITATIVA O ATRIBUTO si se mide de manera no numérica, por ejemplo: el sexo de los estudiantes, la raza, el color de cabello, etc.

b) CUANTITATIVA O NUMERICA: Si las observaciones pueden expresarse numéricamente, por ejemplo: los ingresos salariales, las notas de los estudiantes.

Además las variables cuantitativas pueden ser discretas y continuas:

VARIABLES DISCRETAS: Son aquellas que no permiten valores intermedios, ejemplo: número de hijos, número de edificios

VARIABLES CONTINUAS: Son aquellas que pueden tomar teóricamente cualquier valor entre dos valores, ejemplo: temperatura, estatura, peso, etc.

Una variable no es más que un símbolo que representa cada caso de un conjunto observado y que esta representado generalmente por las últimas letras del abecedario X, Y, Z.

EJERCICIOS DE VARIABLES

* Decir cuáles de los que siguen representan datos discretos y cuáles continuos.

a.- Centímetros de lluvia en una ciudad durante varios meses(continua)

b.- Velocidad de un coche Km./h (Continua)

c.- Número de billetes de veinte en circulación en EE.UU. en cada momento. (Discreta)

d.- Volumen de negocio diario en la Bolsa de Tokio(discreta)

REDONDEO DE DATOS.-

El redondeo de datos no es más que la aproximación de un valor numérico con exactitudes de miles, millones, decimales, etc. Y en estadística se utiliza el siguiente mecanismo para

3

Page 4: Esta Di Stica

redondear datos para una determinada exactitud presentándose tres casos:

1) Cuando el número o cantidad a redondearse es más que 5, se redondea al entero o cantidad que le antecede más próximo; ejemplo

73.8 =74 70.277 =70,28

2) Si la cantidad a redondearse es menos a 5, se elimina la cantidad; ejemplo:

73.4 = 73 68.2 = 68

3) Cuando la cantidad a redondearse es 5, se redondea al par más próximo; ejemplo:

72.5 = 72 83.5 = 84

Nota: Por ser también el sistema que utilizan las computadoras en la entrega de datos: USAR COMA PARA SEPARAR CENTENAS Y PUNTOS PARA SEPARAR CIFRAS DECIMALES.

EJERCICIOS

Redondear cada número con la precisión indicada:

a.- 3,256 centenas 3,300b.- 5,781 decenas 5,780c.- 0.0045 milésimas 0.004d.- 46.7385 centésimas 46.74e.- 125.9995 dos cifras decimales 126.00f.- 3,502,378 millones 4,000,000

ECUACIONES:

Probar que: a) el producto y b) el cociente de 72.48 y 5.16, supuesto que tienen cuatro y tres dígitos significativos, respectivamente, no admiten más de tres dígitos significativos. Escribir los resultados con la mejor precisión posible.

4

Page 5: Esta Di Stica

a.- 72.48 x 5.16 72.48 X 5.16 43488 Respuesta a) 374

7248 36440 373,9968

b.- 72.48 / 5.16 72.48 |5.16 2088 14.04 Respuesta 14.0

c.- 0.36 x 781.4 = 281.304 Respuesta 280

Evaluar lo que sigue sabiendo que: U = -2, V = ½, W = 3, X = - 4 Y = 9, Z= 1/6, donde todos los números son exactos.

a.- 4U + 6V – 2W = 4(-2) + 6 (½) – 2 (3) = -8 + 3 – 6 = R= -11

b.- = = = R= 2

FUNCIONES.-

Si a cada valor de una variable X le corresponde uno o más valores de otra variable Y, decimos que Y esta en función de X

Y = f (X)

A la variable X se le conoce como variable independiente y a la variable Y como variable dependiente; ejemplo:

P = f (T)

P = PoblaciónT = Tiempo

La dependencia o relación de una función se expresa en una tabla de valores pero puede también ser expresado en forma de una ecuación; ejemplo:

2

2X – 3 = Y 3X – 5X + 4 = Y

5

Page 6: Esta Di Stica

COORDENADAS RECTANGULARES.-

RECOLECCIÓN DE DATOS Y FORMAS DE PRESENTAR LA INFORMACIÓN.

REPRESENTACION GRAFICA: La presentación de la información en gráficos y dibujos es un verdadero arte, que no solo sirve para representar datos si no también para expresar ideas que se desee destacar.

La representación gráfica debe tener presente lo siguiente:

1.- Recuérdese que en álgebra se considera un plano coordenado con cuatro cuadrantes que forman una cuadrilla. Obsérvese en la ilustración siguiente que tanto los valores X como los Y son positivos en el cuadrante I. Puesto que la mayoría de los datos de administración o negocios son positivos, es el que se usa con más frecuencia.

2.- Elegir escala más adecuada.3.- Hacer constar, en un gráfico de pastel: Título, gráfico y leyenda.

+1 +2 +3

+X

-1-2-3

- X

+1

+2

+3

-1

-2

-3

+Y

-Y

Cuadrante IX PositivaY Positiva

Cuadrante IIIX NegativaY Negativa

Cuadrante IVX PositivaY Negativa

Cuadrante IIX NegativaY Positiva

6

Page 7: Esta Di Stica

4.- El ancho de las barras debe ser uniforme, en un gráfico de barras.

Los gráficos que tienen mayor funcionalidad en el campo estadístico son:

a) Pictogramas, Pictógrafos o Diagramas de Figuras.b) Gráficos de barrasc) Histogramasd) Polígono de frecuenciae) Gráficos circulares.

FUNCIONES, TABLAS Y GRÁFICOS

Una variable Y queda determinada por otra X mediante Y=10 – 4x

a.- Hallar Y tal que X = -3, -2, -1, 0, 1, 2, 3, 4 y 5 y poner los resultados en una tabla.

b.- Hallar Y tal que X = -2.4, -1.6, -0.8, 1.8, 2.7, 3.5 y 4.6.

c.- Expresar X explícitamente como función de Y

X Y-3 22-2 18-1 140 101 62 23 -24 -65 -10

X Y- 2.4 19.6- 1.6 16.4- 0.8 13.21.8 2.82.7 - 0.83.5 - 44.6 - 8.4

7

Y = 10 – 4(-3)Y = 10 +12Y = 22

Y = 10 – 4(-2)Y = 10 +8Y = 18

Y = 10 – 4(-1) Y = 10 +4Y = 14

Y = 10 – 4(0)Y = 10 + 0 Y = 10

Y = 10 – 4(1) Y = 10 -4 Y = 6

Y = 10 – 4(2) Y = 10 – 8 Y = 2

Y = 10 – 4(3) Y = 10 -12 Y = -2

Y = 10 – 4(4) Y = 10 -16 Y = - 6

Y = 10 – 4(5)Y = 10 - 20Y = -10

Y = 10 – 4(-2.4)Y = 10 + 9.6 Y = 19.6

Y = 10 – 4(-1.6)Y = 10 +6.4 Y = 16.4

Y = 10 – 4(-0.8) Y = 10 + 3.2 Y = 13.2

Y = 10 – 4(1.8) Y = 10 -7.2 Y = 2.8

Y = 10 – 4(2.7)Y = 10 – 10.8 Y = - 0.8

Y = 10 – 4(3.5) Y = 10 – 14 Y = - 4

Y = 10 – 4(4.6) Y = 10 – 18.4Y = - 8.4

Page 8: Esta Di Stica

X= (10 - Y)

4X = 10 – Y

X=

D .- Si W = 3XZ - 4Y2 + 2XY, calcular W cuando: (a) X= 1, Y=- 2, Z= 4, y (b) X= - 5, Y= - 2, Z= 0 (c) Con la notación funcional W = F (X, Y, Z), calcular F (3, 1, -2)

(a) W = 3(1)x(4)-4(-2)2+2(1)(-2) W= 12 – 16 – 4 W = - 8

(b) W = 3(-5)(0) – 4(-2)2+2(-5)(-2) W = 0 – 16 + 20 W = 4e.- Localizar en un sistema de coordenadas rectangulares los puntos de coordenadas:

)a (3, 2); (2, 3); (-4, 4); (4, -4); (-3,-2); (-2, -3); (-4.5, 3); (-1.2, 2.4); (0,-3); (1.8, 0)

8

Page 9: Esta Di Stica

Representar las ecuaciones

a.- Y= 10 – 4x

a.- PICTOGRAMAS, PICTOGRAFOS O DIAGRAMAS DE FIGURAS.-

Son símbolos que se utilizan para representar datos estadísticos de tal forma que llame la atención a toda clase de público que lo vea, para realizar esta clase de gráficos se

X Y-3 22-2 18-1 140 101 62 23 -24 -65 -10

9

-3; 22

-2; 18

-1; 14

0; 10

1; 6

2; 2

3; -2

4; -6

5; -10

-15

-10

-5

0

5

10

15

20

25

-4 -3 -2 -1 0 1 2 3 4 5 6

Y = 10 – 4(-3)Y = 10 +12Y = 22

Y = 10 – 4(-2)Y = 10 +8Y = 18

Y = 10 – 4(-1) Y = 10 +4Y = 14

Y = 10 – 4(0)Y = 10 + 0 Y = 10

Y = 10 – 4(1) Y = 10 -4 Y = 6

Y = 10 – 4(2) Y = 10 – 8 Y = 2

Y = 10 – 4(3) Y = 10 -12 Y = -2

Y = 10 – 4(4) Y = 10 -16 Y = - 6

Y = 10 – 4(5)Y = 10 - 20Y = -10

3; 2

2; 3

-4; 4

4; -4

-3; -2

-2; -3

-4,5; 3

-1,2; -2,40; -3

1,8; 0

-5

-4

-3

-2

-1

0

1

2

3

4

5

-5 -4 -3 -2 -1 0 1 2 3 4 5

Page 10: Esta Di Stica

necesita que ponga en juego su originalidad, creatividad o ingeniosidad.

Ejemplo: Si se trata de vivienda se puede diseñar gráficos de casas, si es de maíz, trigo se podrá utilizar gráficos de sacos, quintales, etc.

b.- GRAFICO DE BARRAS.-

b.1. GRAFICOS DE BARRAS VERTICLAES.-

Son un conjunto de rectángulos que se encuentran ubicados en el primer cuadrante de un sistema de coordenadas y cuyas áreas son proporcionales a los datos de un fenómeno.

Para su construcción se procede de la siguiente manera:

* En el eje de las abscisas o eje de las “X” los datos de la variable vendría a ser la base de los rectángulos.

* En el eje de las ordenadas o eje de las “Y” se localizan las frecuencias.

Ejercicio: Represente en un gráfico de barras verticales la producción de trigo de los años 1992 a 1999.

PRODUCCION DE TRIGO

TON. DE TRIGO

AÑOS (X) (Y)1992 80001993 82001994 85001995 70001996 75001997 95001998 100001999 4000

10

Page 11: Esta Di Stica

b.2. GRAFICOS DE BARRAS HORIZONTALES.-

Estos gráficos tienen la particularidad de que en el eje de las abscisas o eje de las “X” se colocan las frecuencias y en el eje de las ordenadas o eje de las “Y” los datos de la variable que vendrían a ser la base de los rectángulos.

PAISES INCREMENTO PORCENTUAL

JAPON 2,7EEUU 5,5

CANADA 7,4

NUEVA ZELANDA 12

GRECIA 20,7

PORTUGAL 23,2

TURQUIA 37,8

PRODUCCION

0

2000

4000

6000

8000

10000

12000

1 2 3 4 5 6 7 8

AÑOS

T O N.

T R I G O

TON. DE TRIGO

199

21993 1994 1995 1996 1997 1998 1999

INCREMENTOS PORCENTUALES EN PRECIOS AL CONSUMIDOR

0 10 20 30 40

JAPON

CANADA

GRECIA

TURQUIA

P A I S E S “Y

INCREMENTO “X”

2,7

5,5

7,4

12

20,7

23,2

37,8

11

Page 12: Esta Di Stica

b.3. GRAFICOS DE BARRAS COMPUESTAS.-

Esta clase de gráfico se utiliza cuando tenemos dos o más series de datos y queremos realizar una comparación entre dichos valores.

EJERCICIO: Una cadena de tiendas de descuento está organizada en tres grupos para ventas y compras. Cada grupo está dirigido por el gerente general. El cambio de ventas totales para los años 1987, 1988, 1989, y el cambio para cada grupo en relación con el total se han de presentar en una gráfica de barras compuestas.

Las ventas de cada grupo son:

VENTAS(EN MILLONES DE DÓLARES)

GRUPO 1987 1988 1989

ROPA $2 $3 $4

MEDICINAS Y ARTICULOS 10 8 8

AUTOMOVILES Y ARTICULOS

4 8 18

TOTAL 16 19 23

Para elaborar una gráfica de barras compuestas, primero se grafican las ventas de ropa por $ 2 millones (dólares) del año 1987

VENTAS EN MILLONES DE DOLARES

0

5

10

15

20

25

1987 1988 1989

AÑOS

AR

TIC

UL

OS

Automoviles

Medicinas

Ropa

Las ventas para los tres años se presentan en el diagrama anterior. Obsérvese que para cada año, primero se marcaron las ventas de ropa en la parte inferior de la barra, en la parte

12

Page 13: Esta Di Stica

superior de las ventas de ropa se marcaron las ventas de medicina y artículos domésticos, y el último componente o sección que se marcó fue el de las ventas de automóviles y artículos deportivos. La interpretación de la gráfica de barras seccionada es:

* Las ventas totales aumentaron durante los tres años.* Las ventas de ropa permanecieron relativamente

constantes durante el periodo de tres años.* Las ventas de medicina y artículos domésticos

disminuyeron como un componente del total.* Las ventas de automóviles y artículos deportivos

aumentaron con rapidez como un componente del total.

c.- HISTOGRAMAS.- También utilizan barras para la representación de la información estadística, estos nos dan una apreciación visual de la distribución de frecuencias. Es la representación gráfica de una distribución de frecuencias de variables cuantitativas y continúas.

Para construir un histograma empleamos el primer cuadrante de un sistema de coordenadas, en el eje de las “X” las marcas de clase o puntos medios y en el eje de las “Y” la frecuencia respectiva, las barras se dibujan sin dejar espacio entre ellas.

EJEMPLO.- El siguiente cuadro contiene las calificaciones de matemáticas de cuarto curso de un colegio de la ciudad de Azogues. Construya un histograma.

CALIFICACIONES

f X

6 – 8 12

7

9 – 11 10

10

12 – 14 18

13

15 – 17 14

18

18 - 20 6 19

Ojo (Las barras van unidas y no separadas como están en la representación)

13

Page 14: Esta Di Stica

d.- POLIGONO DE FRECUENCIA.- Es un gráfico lineal cerrado que se obtiene por la intersección de la variable con la frecuencia, en el eje de las abscisas o eje de las “X” se ubican los puntos medios y en el eje de las ordenadas o eje de las “Y” las frecuencias respectivas.

EJEMPLO: Para este ejemplo el trazo o elaboración de un polígono de frecuencias se ilustra utilizando de nuevo las rentas mensuales de condominios. Se necesitan los puntos medios de clase que se ubican en el eje X, y las frecuencias de clase, que están eje el eje Y. (Recuerde que un punto medio de clase es un valor que se obtiene sumando el límite inferior más el superior dividido para dos).

Limites Establecidos

Marca de clase(X)

Frecuencias

$ 600 – 799 699,5 3800 – 899 899,5 7

1000 – 1199 1099,5 111200 – 1399 1299,5 221400 – 1599 1499,5 401600 – 1799 1699,5 241800 – 1999 1899,5 92000 – 2199 2099,5 4

TOTAL 120

Obsérvese que en la figura que para completar el polígono de frecuencia, se agregaron puntos medios de 499,5 y 2299,5 a los dos extremos, y el polígono se “ancló” al eje horizontal a la frecuencia cero. Estos dos valores se obtuvieron restando el intervalo de clase de 200 al punto medio mayor (2099,5), al anclar los dos extremos del polígono de frecuencias al eje X,

CALIFICACIONES- HISTOGRAMA

0

2

4

6

8

10

12

14

16

18

20

1 2 3 4 5

PUNTOS MEDIOS (Marca de clase)

F R E C U E N C I A S

7 10 13 18 19

14

Page 15: Esta Di Stica

el área total bajo el polígono es ahora al total de las frecuencias

d.- GRAFICOS CIRCULARES O DE SECTORES (PASTEL).-

Este tipo de gráficos es adecuado para aquellos casos en que deseen que los datos estadísticos lleguen a todo tipo de personas, incluso aquellos que no tienen una formación científica.

Este gráfico consiste en repartir los 360 grados de la circunferencia en forma proporcional a las frecuencias de cada una de las variables.

EJEMPLO: En la biblioteca de la Municipalidad de Azogues, entre los libros que existen hay 100 de Estadística, 200 de Matemática, 220 de Historia, 500 de Economía y 380 de inglés, elaborar un gráfico circular.Desarrollo: Primeramente determinamos cuantos grados de los 360 corresponden a cada materia.

Estadística

LIBROS FRECUENCIA

ANGULO

Estadística

100 25,71 grados

Matemática

200 51,43

Historia 220 56,57Economía 500 128,57

Inglés 380 97,71------------ --------------- -------------

Total 1400 360

15

Page 16: Esta Di Stica

Matemática

Historia

EJEMPLOS:La tabla muestra el número de trabajadores, agrícolas o no, en Brasil, durante 1940- 1980. Representar los datos usando:

AÑOTRABAJADORES AGRÍCOLAS (MILLONES)

TRABAJADORES NO

AGRÍCOLAS (MILLONES)

1840 3,72 1,701860 6,20 4,331880 8,59 8,801900 10,90 18,171920 11,46 30,971940 9,22 43,751960 4,19 65,701980 2,33 103,76

a.- Gráfico de trazos

LIBROS DE BIBLIOTECA Estadística

Matemática

Historia

Economía

Inglés

ESTADISTICA 25,71

MATEMATICA 51,43

HISTORIA 56,57

ECONOMIA 128,57

INGLES 97,71

16

Page 17: Esta Di Stica

b.- Gráfico de barras

c.- Gráfico de barras componentes

GRAFICO DE TRAZOS

020406080

100120

1800 1850 1900 1950 2000

Trabajadores Agrícolas (millones)

Trabajadores no agrícolas (millones)

GRÁFICO DE BARRAS

0,00

20,00

40,00

60,00

80,00

100,00

120,00

1840 1860 1880 1900 1920 1940 1960 1980

Año

Millo

nes

TRABAJADORESAGRICOLAS (MILLONES)

TRABAJADORES NOAGRICOLAS (MILLONES)

17

Page 18: Esta Di Stica

GRAFICOS DE BARRAS EN COMPONENTES

0,00

20,00

40,00

60,00

80,00

100,00

120,00

1 2 3 4 5 6 7 8

AÑOS

MIL

LO

NE

S

TRABAJADORES NOAGRICOLAS (MILLONES)

TRABAJADORESAGRICOLAS (MILLONES)

EJERCICIOS PROPUESTOS:

1. Decir cual de los que siguen representa datos discretos y cuales continuos.

a) Número de estudiantes matriculados en una Universidad en varios años:

b) Número de sacos de trigo producido por hectárea en un campo en varios años.

c) Número N de miembros en una familia.d) Estado civil de una personae) Tiempo de vuelo T de un misil.f) Número de pétalos de una flor.

2.- REDONDEO DE DATOS, NOTACIÓN CIENTÍFICA Y DÍGITOS SIGNIFICATIVOS.

a) 148.475 unidadesb) 0.000098501

millonésimasc) 2184.73 décimasd) 43.87500 centésimas

4.- Evaluar manualmente lo que sigue, sabiendo que: u = -2, v=½, w = 3, x = -4, y = 9, z = 1/6.

a) 3 =

b) =

18

Page 19: Esta Di Stica

c) 3x (4y + 3z) – 2y (6x-5y) – 25=

5.- FUNCIONES, TABLAS Y GRÁFICOS.

1.- Si calcular z cuando:

a) x = -2, y = 3.b) x = 1, Y = 5.c) En notación funcional z = f(x,y), cuando f(-3.-1).

2.- Si W = 3XZ - 4 + 2XY, calcular W cuando:

a) X = 1, Y = -2, Z = 4.b) X = -5, Y = -2, Z = 0.c) Con la notación funcional W=F(X, Y, Z), calcular (3,1,-

2)

6.- REPRESENTAR LAS ECUACIONES.

Localizar en un sistema de coordenadas rectangulares los puntos de coordenadas.a) Y = 10 -4X.

X -3 -2 -1 0 1 2 3 4 5

b) Y = 2X + 5.

X -3 -2 -1 0 1 2 3 4

c) 2X + 3Y = 12.

X -3 0 3 6 9

d) .

X -3 -2 -1 0 1 2 3

e)

X 0 1 2 3 -1

7.- PICTOGRAMAS, HISTOGRAMAS

19

Page 20: Esta Di Stica

1.- Con los datos de la tabla construir un gráfico que muestre el porcentaje de trabajadores a) agrícolas, b) no agrícolas y c) Construir otro que las muestre a la vez.

AÑOTrabajadores agrícolas

Trabajadores no

agrícolas

% Trab. Agrícolas

% Trab. No Agrícolas

1840 3,72 1,71860 6,2 4,331880 8,59 8,81890 10,9 18,171920 11,46 30,971940 9,22 43,751960 4,19 65,71980 2,33 103,76

TOTAL 56,61 277,18

2.- En la tabla se ven los números (en millones) de estudiantes en enseñanza primaria, media y superior en América del Sur. Representar los datos, usando: a.-) gráfico de trazos, b.-) gráfico de barras y c.-) gráfico de barras en componentes.

AÑO 1960 1965 1970 1975 1980ELEMENTAL

32.4 35.5 37.1 33.8 30.6

MEDIA 10.2 13.0 14.7 15.7 14.6SUPERIOR 3.6 5.7 7.4 9.7 10.2

3.- La tabla muestra el estado civil de hombres y mujeres en Ecuador el 2007. Representar los datos mediante: a) Dos gráficos circulares de igual diámetro y b) Uno de diseño propio.

a) Dos gráficos circulares de igual diámetro

Estado Civil

Varones (% total)

Mujeres (% total)

Varones grados

Hembras grados

soltero 25,1 18,4

Casado 66,7 64,3

Viudo 2,4 12,4

Divorciado 5,8 7,9

TOTAL 100 100

4.- En la tabla se ven las áreas de los océanos en millones de millas cuadradas. Representar los datos usando: a.-) un gráfico de barras horizontales y verticales; y b.-) gráfico circular.

Océano Área Grados

20

Page 21: Esta Di Stica

(millones demillas

cuadradas)PacíficoAtlántico

IndicoAntártico

Ártico

63.831.528.47.64.8

Total 136.1

8.- ECUACIONES

1.- Resolver las siguientes ecuaciones manualmente:

a) 16-5C=36b) 2Y-6=4-3Yc) 4(X-3)-11=15-2(X +4)d) 3(2U+1)=5(3-U)+3(U-2)e) 3(2(X +1)-4)=10-5(4-2X)

CAPITULO II

DISTRIBUCIONES DE FRECUENCIA.

21

Page 22: Esta Di Stica

TOMA DE DATOS: Es la obtención de datos de un fenómeno, el mismo que se desea analizarlo estadísticamente, ejemplo; edades de los estudiantes matriculados en el primer año de la “Universidad Técnica José Peralta”. Estos datos no pueden estar ordenados.

ORDENACIÓN: Es la colocación de los datos numéricos del fenómeno en relación a un orden ascendente o descendente. A la diferencia entre el mayor y el menor de los datos se le denomina rango o recorrido.

Rango o recorrido (R= X máxima – X mínima). Ejemplo: Si la altura mayor de 100 estudiantes es 1,74 metros y la menor es 1.60 metros, su rango será igual a 0.14 centímetros.

DISTRIBUCIÓN DE FRECUENCIAS: Es una técnica que nos permite ordenar los datos en una tabla si estos se dividen en clases, debiéndose registrar el número de observaciones en cada clase.

Ejemplo:ALTURA DE LOS ESTUDIANTES DE LA UNIVERSIDAD:

ALTURA NUMERO DE

PULGADAS ESTUDIANTES

60 – 62 563 – 65 1866 – 68 4269 – 71 2772 – 74 8TOTAL 100

INTERVALOS DE CLASE: El símbolo que define una clase se conoce con el nombre de intervalo de clase, ejemplo 63 – 65 son los límites de la segunda clase de la distribución.

LIMITES DE CLASE: El número menor de la clase es 63 y se lo llama LIMITE INFERIOR DE CLASE, y al 65 se le denomina LIMITE SUPERIOR. Los términos clase o intervalo de clase se utiliza indistintamente. Un intervalo de clase que al menos teóricamente no tiene límite superior o inferior se conoce

22

Page 23: Esta Di Stica

como intervalo de clase abierto. Ejemplo: Al referirse a la población los mayores de 65 años es un intervalo de clase abierto.

LIMITES REALES DE CLASE: Se denomina así a los valores que teóricamente incluyen valores o cantidades representadas por sus medidas exactas y que corresponden a 5 décimas menos del limite de clase inferior cuando son enteros, y cuando se trata de decimales hay que restar el número que le corresponde; y, 5 décimas más al del limite de clase superior; se aplica la misma teoría para el limite inferior, denominándoseles a cada uno de ellos como LIMITE REAL INFERIOR Y LIMITE REAL SUPERIOR respectivamente. Una manera de determinar el intervalo de clase (C) es restando el limite real superior del limite real inferior.

TAMAÑO O ANCHURA DE UN INTERVALO DE CLASE: Es la diferencia entre los limites reales de clase y en la mayoría de las distribuciones, el intervalo de clase es igual en todas las clases.

MARCA DE CLASE: Es el punto medio o media aritmética entre los limites superior o inferior de clase de cada grupo. Ejemplo:

PULGADAS

Número de

estudiantes X

60 – 62 5 61

63 – 65 18 64 66 – 68 42 6769 – 71 27 7072 – 74 8 73TOTAL 100

REGLAS GENERALES PARA FORMAR DISTRIBUCIONES DE FRECUENCIA:

1.- Determinar el rango o recorrido de las observaciones:R = X máxima - X mínima.

23

Page 24: Esta Di Stica

2.- Dividir el rango en un número conveniente de intervalos de clase del mismo tamaño y de no ser posible utilizar intervalos de clase de diferente tamaño o intervalos de clase abiertos. El número de intervalos no deberá ser ni menor que 5 ni mayor que 20 dependiendo de los datos. Los intervalos de clase se rigen también de forma que las marcas de clase o puntos medios coincidan con los datos observados realmente para de esta manera evitar el error de agrupamiento de datos.

3.- Número de clases: Se la representa por “C” o “k”. En una tabla de frecuencias es algo arbitrario. Se puede seguir una regla simple para aproximar el número de clases a utilizar, c o k, es:

En donde:

n = Es el número de observacionesC o K = Es un número entero positivo, que representa el número de clases a utilizar.

El número de clases es la menor potencia a la cual se eleva la base 2, de manera que el resultado sea igual o mayor que le número de observaciones.

PARA NÚMEROS ENTEROS PARA NÚMEROS DECIMALES

Nota: Para números decimales hay que tomar en cuenta que si se esta trabajando como por ejemplo 3.94 y 1.00; entonces el valor de 1 se convierte en 0.001 ya que el ejercicio esta en centésima, por lo tanto tiene que tener un número más, como en este caso es 0.001

4.- Rango del intervalo que es igual a

24

Page 25: Esta Di Stica

Ejemplo:Puntuación de 80 estudiantes en el primer ciclo de administración:

68 84 75 82 68 90 62 88 76 9373 79 88 73 60 93 71 59 85 7561 65 75 87 74 62 95 78 63 7266 78 82 75 94 77 69 74 68 6096 78 89 61 75 95 60 79 83 7179 62 67 97 78 85 76 65 71 7565 80 73 57 88 78 62 76 53 7486 67 73 81 72 63 76 75 85 77

1) Ordenar los datos sea en forma ascendente o en forma descendente; en este ejemplo aplicamos en forma ascendente del menor al mayor.

53 57 59 60 60 60 61 61 62 6262 62 63 63 65 65 65 66 67 6768 68 68 69 71 71 71 72 72 7373 73 73 74 74 74 75 75 75 7575 75 75 76 76 76 76 77 77 7878 78 78 78 79 79 79 80 81 8282 83 84 85 85 85 86 87 88 8888 89 90 93 93 94 95 95 96 97

2) Rango o recorrido:X max = 97X min = 53

R = X max – X min 97 – 53 = 443)

a) Número de clases tomado en este ejemplo de 9 “Decisión personal”, tratar de que salgan datos exactos y no con decimales, en el mejor de los casos, y en el caso de que salgan con decimales aplicar el redondeo de datos:

b)

O sea se puede trabaja con 9 o con 7 para este ejercicio.

4) a) ; b)

25

Page 26: Esta Di Stica

HISTOGRAMAS: Consisten en una serie de barras tipo rectángulo que tienen sus bases sobre los ejes horizontal con centros en las marcas de clase o medias aritméticas y longitud igual al tamaño del intervalo de clase.

Las alturas de los rectángulos son proporcionales a las frecuencias de clase, generalmente y en caso de que las frecuencias sean numéricamente grandes se acostumbra a utilizar escala.

POLIGONO DE HISTOGRAMA O BARRAS

AÑOSSACOSDE TRIGO

1950 2001951 1851952 2251953 2501954 2401955 1951956 2101957 2251958 2501959 2301960 235

POLÍGONO DE FRECUENCIA: Es un gráfico de línea trazada sobre las marcas de clase y se lo obtiene uniendo los puntos medios de los techos de los rectángulos del histograma.POLIGONO DE PICTOGRAMA O PUNTOS

AÑOSSACOS DE MAIZ

1950 751951 901952 100

CALIFICACIONES f i X r53 - 57 2 5558 - 62 10 6063 - 67 8 6568 - 72 9 7073 - 77 20 7578 - 82 12 8083 - 87 6 8588 - 92 6 9093 - 97 7 95TOTAL 80

26

Page 27: Esta Di Stica

1953 851954 801955 1001956 1101957 1051958 951959 1101960 100

DISTRIBUCIÓN DE FRECUENCIAS RELATIVAS: Se llama frecuencia relativa de una clase al valor de la frecuencia de clase (frecuencia absoluta) dividido para el total de las observaciones, y expresado generalmente en porcentajes.

CALIFICACIONES f i X

Fre Absoluta o Relativa Fre % o menos o más

      Fi Ac Fi Ac

53 - 57 2 55 0.025 2.5 2 8058 - 62 10 60 0.125 12.5 12 7863 - 67 8 65 0.1 10 20 6868 - 72 9 70 0.1125 11.25 29 6073 - 77 20 75 0.25 25 49 5178 - 82 12 80 0.15 15 61 3183 - 87 6 85 0.075 7.5 67 1988 - 92 6 90 0.075 7.5 73 1393 - 97 7 95 0.0875 8.75 80 7TOTAL 80 1 100    

X = 53 - 57 = 110 / 2 = 55

Fre. = 2 / 80 = 0.025 Frecuencia Relativa O Frecuencia absoluta

Fre % = 0.025 * 100 = 2.5 Frecuencia porcentual

Fi Ac = Frecuencia acumulada o menos = 2 +10 = 12

Fi Ac = Frecuencia acumulada o más = 80 - 2 = 78

Si las frecuencias de la tabla o gráfico de frecuencias se sustituyen por las correspondientes frecuencias relativas, la tabla se llama “DISTRIBUCIÓN DE FRECUENCIAS RELATIVAS O DISTRIBUCIÓN PORCENTUAL DE FRECUENCIAS RELATIVAS.”

27

Page 28: Esta Di Stica

DISTRIBUCIÓN DE FRECUENCIAS ACUMULADAS: La frecuencia total de todos los valores menores que el límite real superior de clase de un intervalo se conoce como FRECUENCIA ACUMULADA HASTA ESE INTERVALO INCLUSIVE, DENOMINADO TAMBIÉN FRECUENCIA ACUMULADA O MENOS.

En algunos casos es preferible considerar una distribución de frecuencias acumuladas de todos los valores mayores o iguales al límite real inferior de clase, denominándose a este tipo de “DISTRIBUCIÓN ACUMULADA O MÁS”. Los gráficos de dichas distribuciones de frecuencias acumuladas se denominan ojivas.

DISTRIBUCIÓN DE FRECUENCIAS RELATIVAS ACUMULADAS: Son las frecuencias acumuladas divididas para el total de observaciones, para que se conviertan en frecuencia relativa porcentual acumulada, se multiplica por 100. Los criterios para distribuciones relativas acumuladas más o menos son los expresados para distribuciones acumuladas. LOS GRÁFICOS DE DICHAS DISTRIBUCIONES DE FRECUENCIAS ABSOLUTAS O RELATIVAS SE LES DENOMINAN OJIVAS.

80 Ojiva “O Menos”

70 60 50 40

30 20 10 Ojiva “O Más”

55 60 65 70 75 80 85 90 95

X

28

Y

Page 29: Esta Di Stica

CURVAS DE FRECUENCIA U OJIVAS SUAVIZADAS: Una ojiva o un polígono de frecuencias se forma por el conjunto de puntos obtenidos por la unión de una distribución de frecuencias (marca de clase), mientras el intervalo entre las marcas de clase sea menor a la unión del conjunto de puntos nos dará una curva, por lo que todo polígono es necesario suavizarlo (curva a mano alzada).

Las curvas de frecuencias presentan determinadas formas, características que las distinguen:

a) CURVA SIMÉTRICA: O bien formada se caracteriza porque las observaciones equidistan del máximo central.

b y c) CURVA DE FRECUENCIAS MODERADAMENTE ASIMÉTRICAS: O sesgada hacia la derecha sesgo positivo, o hacia la izquierda llamada sesgo negativo.d y e ) CURVAS EN FORMA DE J. O DE J INVERTIDA: Con máximos a los extremos corresponden generalmente a curvas de frecuencias acumuladas.f) CURVA DE FRECUENCIAS EN FORMA DE U: Con el máximo en sus extremos (curva parabólica).g) CURVA DE FRECUENCIA BIMODAL: Porque tiene 2

máximos.h) CURVA DE FRECUENCIA MULTIMODAL: Aquella que tiene más de tres puntos máximos.

a) b) c) d)

e) f) g) h)

29

Page 30: Esta Di Stica

EJERCICIOS PROPUESTOS:

1.- ORDENAR LOS NÚMEROS

a) Ordenar los números en forma ascendente y descendente de: 12,56,42,21,5,18,10,3,61,34,65 y 24

Ascendente, descendente:

b) Hallar el rango.2.- LA TABLA MUESTRA UNA DISTRIBUCIÓN DE FRECUENCIAS DE LAS VIDAS DE 400 FOCOS DE LA EMPRESA XYZ. DETERMINAR DE ÉSTA TABLA.

Tabla 2

Vida de media(horas)

Número de tubos

300-399400-499500-599600-699700-799800-899900-999

1000-10991100-1199

14465876686248226

TOTAL 400

a) El límite superior de la quinta clase =b) El límite inferior de de la octava clase =1000c) Marca de la sexta clase = Las fronteras de clase de la última

clase d) La anchura de intervalos de clase = Frecuencia cuarta clase e) Frecuencia relativa sexta clase = f) Porcentajes de tubos de la vida media no pasa de 600 horas g) Porcentaje de tubos cuya vida media es mayor o igual a 900

horas = h) Porcentaje de tubos cuya vida media es de al menos 500 horas,

pero menor que 1000 horas =

3.- CON LOS DATOS CORRESPONDIENTES A LA DISTRIBUCIÓN DE FRECUENCIAS DE LA SIGUIENTE TABLA CONSTRUIR:

30

Page 31: Esta Di Stica

Vida de media(horas)

Número de tubos

300-399 14400-499 46500-599 58600-699 76700-799 68800-899 62900-999 48

1000-1099 221100-1199 6

TOTAL 400

a) Un histogramab) Un polígono de frecuencias

4.- PARA LOS DATOS DE LA TABLA CONSTRUIR:

a) Una distribución de frecuencias relativas.

Vida de media(horas) Número de tubos x Frecuencia relativa

300-399 14400-499 46500-599 58600-699 76700-799 68800-899 62900-999 48

1000-1099 221100-1199 6

TOTAL 400

b) Un histograma de frecuencias relativasc) Polígono de frecuencias relativasd) Una distribución de frecuencias acumuladase) Una distribución acumulada en porcentajesf) Una ojivag) Una ojiva de porcentajesh) Frecuencias del modo o más y o menos

5.- LOS DIÁMETROS INTERNOS DE LOS TUBOS FABRICADOS POR UNA EMPRESA SE MIDE CON PRECISIÓN DE MILÉSIMAS DE PULGADA. SI LAS MARCAS DE CLASE DE UNA DISTRIBUCIÓN DE FRECUENCIAS DE ESOS DIÁMETROS VIENEN DADAS POR 0.321, 0.324, 0.327, 0.330, 0.333, 0.336, HALLAR:

31

Page 32: Esta Di Stica

a) Anchura de intervalo de clase o limite real superior menos limite real inferior

b) Fronteras de clase o limites reales superiores o inferiores

6.- LA TABLA ADJUNTA MUESTRA LOS DIÁMETROS EN CENTÍMETROS DE UNA MUESTRA DE 60 BOLAS DE MANUFACTURA DE UNA FÁBRICA. CONSTRUIR UNA DISTRIBUCIÓN DE FRECUENCIA CON INTERVALOS DE CLASE APROBADOS.

1,738 1,729 1,743 1,740 1,736 1,7411,735 1,731 1,726 1,737 1,728 1,7371,736 1,350 1,724 1,733 1,742 1,7361,739 1,735 1,745 1,736 1,742 1,7401,728 1,738 1,725 1,733 1,734 1,7321,733 1,730 1,732 1,730 1,739 1,7341,738 1,739 1,727 1,735 1,735 1,7321,735 1,727 1,734 1,732 1,736 1,7411,736 1,744 1,732 1,737 1,731 1,7461,735 1,735 1,729 1,734 1,730 1,740

7.- PARA LOS DATOS DEL PROBLEMA DEL EJERCICIO 6 CONSTRUIR.

a) Un histogramab) Un polígono de frecuencia.c) Un histograma de frecuencias relativasd) Un polígono de frecuenciase) Una ojivaf) Una ojiva de frecuencia acumulada.

8.- LA TABLA MUESTRA LA DISTRIBUCIÓN DE PORCENTAJES DE VENTAS TOTALES PARA PLANTACIONES DE TIPO FAMILIAR EN EUROPA EN 1982. USANDO ESA TABLA, RESPONDER LAS SIGUIENTES CUESTIONES.

VENTAS (DÓLARES)

EXPLOTACIONES (%)

Menos de 2500 25,92500 – 4999 13,25000 – 9999 13,0

10000 – 19999 11,7

32

Page 33: Esta Di Stica

20000 – 39999 11,040000 – 99999 14,4

100000 – 249999 8,5250000 – 499999 1,8500000 – o más 0,6

a) Cuál es la anchura del segundo intervalo de clase ¿y del séptimo?

b) ¿Cuántos tamaños diferentes de intervalos de clase hay?c) ¿Cuántos intervalos de clase abiertos hay?d) ¿Cómo habría que escribir el primer intervalo de clase para que

su anchura sea igual a la del segundoe) ¿Cuál es la marca de clase del segundo intervalo de clase? ¿y del

séptimo?f) ¿Cuáles son las fronteras de clase del cuarto intervalo de clase?g) ¿Qué porcentaje de las plantaciones tuvo ventas de $20.00 a

más? ¿y por debajo de $ 10.000?

h) ¿Qué porcentaje logró ventas de al menos $ 10.000 pero mayores que $ 40.000?

i) ¿Qué porcentaje tuvo entre $15.000 y $ 25.000? ¿Qué hipótesis se han hecho en ese cálculo?

j) ¿Por qué los porcentajes de la tabla no sumas 100%?

9.- CALCULAR LO SIGUIENTE DEL CUADRO:

vida de media(horas)

Número de

tubos300-399400-499500-599600-699700-799800-899900-999

1000-10991100-1199

14465876686248226

TOTAL 400

a) Un histogramab) Un polígono de frecuencia.c) Una ojivad) Una ojiva de frecuencia acumulada.

33

Page 34: Esta Di Stica

10. UN CONJUNTO DE DATOS CONSTA DE 38 OBSERVACIONES ¿CUANTAS CLASES RECOMENDARÍA PARA LA DISTRIBUCIÓN DE FRECUENCIAS?

DATOS ORDENADOS10 13 15 17 19 1919 22 23 24 25 2729 30 32 35 37 4243 47 52 55 56 5658 58 58 60 60 6061 62 63 72 76 7885 86

11.- Un conjunto de datos esta integrado por 45 observaciones que van desde 0 hasta 39 dólares ¿Qué tamaño de intervalo de clase recomendaría?

DATOS DESORDENADOS0 1 12 15 14

25 0 29 28 2611 4 5 9 1012 14 17 13 1625 8 5 2 01 3 4 5 7

17 39 25 18 154 9 10 20 25

14 12 2 18 14   

34

Page 35: Esta Di Stica

CAPITULO III

MEDIDAS DE CENTRALIZACIÓN.

REDUCCIÓN DE DATOS: Generalmente una muestra o fenómeno a estudiarse contiene gran cantidad de datos los mismos que requieren ser presentados en cuadros llamados de distribuciones, cuya característica es presentar en forma resumida la situación de la muestra o fenómeno y de los que es necesario todavía reducirlos a medidas que representen la situación promedio de dicha muestra o fenómeno. A este procedimiento se lo conoce con el nombre de reducción de datos expresados en valores o parámetros de formas diferentes llamadas medias y que son:

MEDIDAS DE CENTRALIZACIÓN: Las medidas de tendencia central son las más conocidas y utilizadas en nuestras vidas diarias. Estas nos proporcionan un valor alrededor del cual se distribuyen las observaciones.

Las medidas de centralización mas utilizadas son: media aritmética, media geométrica, media armónica, mediana, moda o valor modal, cuartilas, decílas y centilas.

35

Page 36: Esta Di Stica

A continuación describiremos la simbología o notación a utilizarse para las fórmulas de las medidas de centralización:

= Representa la media aritmética de una muestra = Representa la media aritmética de una población

= Sumatoria de un conjunto de valoresXj = X1 + X2 + X3 + ......Xn

f = Frecuencia de claseX = Marca de claseA = Media supuestadj = Desviación de la marca de clase con respecto a una media cualquiera (x-A).n = Indica el número de elementos de la muestraN = Indica el número de elementos de la población

Nota: Es aconsejable presentar los resultados redondeados a dos decimales.

PROMEDIO O MEDIDAS DE CENTRALIZACIÓN: Un promedio es un valor que es típico o representativo de un conjunto de datos y generalmente están situados en el centro del conjunto de datos ordenados. A estos promedios se los denomina como medidas de centralización.

1.- MEDIA ARITMÉTICA: Es posible que usted este familiarizado con la media aritmética pues se trata del valor que halla al promediar algo. Por ejemplo si usted desea saber el número promedios de horas al día que ha trabajado durante los últimos 15 días, basta sumar las horas que ha trabajado cada día y dividir para 15. Al realizar esto usted estará calculando la media aritmética.

FORMULA DE LA MEDIA ARITMÉTICA: Como la media aritmética no es más que el promedio de un conjunto de observaciones su fórmula queda definida:

Para datos originales

36

Page 37: Esta Di Stica

En caso de existir una distribución de frecuencias o datos agrupados su fórmula se expresa de la siguiente manera:

Para datos agrupados

MEDIA PONDERADA: Es aquella expresión de la media aritmética en la que se emplea la frecuencia de los datos para expresarla de forma comprimida. La fórmula a utilizarse es la siguiente:

Ejemplo: Calcular la media de la siguiente serie de calificaciones de exámenes en la asignatura de estadística: 6, 8, 3, los mismos que tienen un valor del 30%, 60% y del 10% respectivamente, de la nota final.

Este ejercicio se puede interpretar como una media aritmética en la que el valor 6 aparece 30 veces; es decir, la frecuencia absoluta correspondiente al valor 6 es de 30. La que corresponde al valor 8 es de 60 y la frecuencia absoluta del valor 3 es de 10

PROPIEDADES DE LA MEDIA ARITMÉTICA:

1.- Es una medida de tendencia central que depende de todos los valores de la serie y se encuentra afectada por el recorrido demasiado amplio de los valores extremos, con respecto a la media.

2.- De la fórmula de la media aritmética puede despejar cualquiera de sus elementos:

3.- Podemos calcular la de un conjunto de promedios.

APLICACIONES DE LA MEDIA ARITMETICA:

37

Page 38: Esta Di Stica

1.- Obtener un promedio que tenga representatividad en la serie2.- Comparar 2 o más series3.- Obtener otros tipos de medidas, como por ejemplo: medidas de dispersión, de correlación y para verificar hipótesis.

Ejemplo 1 Media aritmética para datos originales:

8, 3, 5, 10, 12

dj = 0

dj= (3 – 7,6) + (5 – 7,6) + (8 – 7,6) + (10 – 7,6) + (12 – 7,6) = 0

Ahora con una media supuesta, preferentemente uno de los valores de las observaciones del mismo ejemplo:

A= 3

dj = (3 – 3) + (5 – 3) + (8 – 3) + (10 – 3) + (12 – 3)

dj = 0+2+5+7+9 = 23

PARA DATOS AGRUPADOSEjemplo 2

Altura Frecuenci

38

Page 39: Esta Di Stica

enpulgad

as

as(f)

60 – 62 563 – 65 1866 – 68 4269 – 71 2772 – 74 8---------- ------------TOTAL 100

Altura en

pulgadas

Frecuencias(f)

Marca de clase(X)

fX A=67dj(X-A)

fdj

60 – 62 5 61 305 - 6 - 3063 – 65 18 64 1152 - 3 - 5466 – 68 42 67 2814 0 069 – 71 27 70 1890 3 8172 – 74 8 73 584 6 48---------- ------------ --------- --------TOTAL 100 6745 45

Primera fórmula (Método de compilación) para calcular la media aritmética:

Segunda fórmula (Método largo) para calcular la media aritmética: De la marca de clase (tomamos el valor central en caso de que sean impares; mientras que cuando son pares se toma cualquiera de los valores centrales, en este caso es A = 67)

A = 67

39

Page 40: Esta Di Stica

Tercera fórmula (Método Clave) para calcular la media aritmética:

U = Unidades de intervaloC = Intervalo diferencia de limites reales de clase

Altura en

pulgadas

Frecuencias(f)

Marca de clase(X)

A=67dj(X-A)

Udj/C(X-

A)/C

f U

60 – 62 5 61 - 6 - 2 - 1063 – 65 18 64 - 3 - 1 - 1866 – 68 42 67 0 0 069 – 71 27 70 3 1 2772 – 74 8 73 6 2 16--------- ----------- ------TOTAL 100 15

U= LIMITE REAL SUPERIOR (se suma 5 décimas al limite superior, dependiendo si se esta trabajando con decimales, caso contrario si se esta trabajando con decimales hay que sumar de acuerdo a los decimales que tengamos); y se resta del LIMITE REAL INFERIOR (se realiza de la misma manera de lo que se explico anteriormente con el limite real superior, pero en este caso se resta).

U = 62,5 – 59,5 = 3

C = (X-A)/U (61-67)/3 = - 2(64-67)/3 = - 1

2.- LA MEDIANA:

CONCEPTO: Es el valor que queda ubicado justo en el medio de un conjunto de datos, cuando están ordenados ya sea en sentido ascendente o descendente.

FORMULAS DE LA MEDIANA:

40

Page 41: Esta Di Stica

1) Para datos originales puede presentarse 2 casos:

a) Que las n observaciones sea impar siendo el valor de la mediana el valor central de las observaciones una vez ordenada la muestra

Ejemplo: Dadas las siguientes observaciones:

3, 10, 12, 1, 7.

Se ordena: 1, 3, 7, 10, 12. El valor central es = 7, Md = 7 MEDIANA

b) Si el número de observaciones es par entonces habrá 2 observaciones centrales y la mediana será la media aritmética de esas 2 observaciones centrales.

Ejemplo: 3, 8, 12, 10, 7, 1

Se ordena: 1, 3, 7, 8, 10, 12. El valor central es 7 + 8 / 2 = 7,5 Mediana.

2) La fórmula de la mediana para datos agrupados: Para el cálculo de la mediana es necesario utilizar una columna para las frecuencias acumuladas, y en la clase en donde se incluyen el 50% de las observaciones se deberá determinar por interpolación el valor de la mediana siendo su fórmula.

Md = MedianaLri = Limite real inferior de la clase medianan = Número total de observaciones

fai = Sumatoria de las frecuencias acumuladas inferiores a la medianaf m = Frecuencia de la clase medianac = Intervalo de clase, pero de la clase mediana.

PROPIEDADES DE LA MEDIANA:

41

Page 42: Esta Di Stica

1.- Es una medida de tendencia central que ocupa el lugar central de la serie.2.- Es un valor central y para su cálculo no es necesario conocer todos los elementos de la serie3.- Los valores de la variable, grandes o pequeños no influyen en el cálculo de la mediana.

APLICACIONES DE LA MEDIANA:

1.- Se emplea para determinar el valor central de la serie2.- Se emplea para dividir el área del polígono de frecuencia en dos partes iguales.

Ejemplo:

Altura en

pulgadas

Frecuencias(f)

X fafrecuencias acumuladas

60 – 62 5 61 563 – 65 18 64 2366 – 68 42 6

765

69 – 71 27 70 9272 – 74 8 73 100--------- -----------TOTAL 100

Lri = Limite real inferior de la clase mediana = 65,5n = Número total de observaciones = 100

fai = Sumatoria de las frecuencias acumuladas inferiores a la mediana = 23fm = Frecuencia de la clase mediana = 42C = Intervalo de clase pero de la clase mediana = 3

3.- LA MODA O MODO:

DEFINICIÓN: Es el dato que más veces se repite. Esta última medida de tendencia central es la más sencilla de las 3 medidas y para su determinación, no necesita cálculo alguno,

42

Page 43: Esta Di Stica

basta observar en la columna de las frecuencias el dato que tiene mayor frecuencia, o que más se repite.

2.2; 5.7; 9.99; -10; -10; -11; -12; 18. En este caso el número que más veces se repite es el número -10, por lo tanto éste es la moda.

Por lo general las distribuciones son uní modales, es decir sólo tienen una moda, sin embargo es posible que una distribución tenga varias modas como por ejemplo si tenemos la serie:

5, 6, 6, 6, 7, 8, 8, 9, 8. Es bimodal, ya que la moda fuera el (6 y 8)

La moda se utiliza para distribuciones de frecuencias con gran concentración de datos en la región, cercana al centro de la distribución, esta medida de centralización carece de significación para distribuciones de pocos datos, la fórmula para datos centralizados es:

Mo = Moda o modoLri = Limite real inferior de la clase modal

= Incremento 1 = Diferencia la frecuencias de la clase modal y la frecuencia de inmediata inferior.

= Incremento 2 = Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase inmediata superior.C = Intervalo de la clase modal.

PROPIEDADES DE LA MODA:

1.- Es el valor que más se repite en una serie.2.- La moda no se altera por valores muy grandes que existan en la serie.3.- La moda no tiene ninguna significación en una serie de pocos elementos y que no se repite ninguno de ellos.

43

Page 44: Esta Di Stica

4.- Cuando calculamos la moda en una serie de intervalos de clase, como lo realizamos anteriormente, solo se obtienen un valor aproximado.

APLICACIONES DE LA MODA:

1.- Es una medida muy fácil de calcular, pero solo se obtiene un valor aproximado.2.- En algunas distribuciones puede no existir, pero en otras aplicaciones puede haber dos, tres modas, etc. En dichos casos la distribución se denomina bimodal, trimodal y multimodal respectivamente.3.- Se la emplea para identificar el salario más común, la calificación que más se repite, pero en otros casos se tiene muy poca aplicabilidad.

Altura en

pulgadas

Frecuencia(f)

Marca de clase(X)

60 - 62 5 6163 – 65 18 6466 – 68 42* 6769 – 71 27 7072 – 74 8 73

------------ ----------TOTAL 100

CARACTERISTICAS DE LA MEDIA, LA MEDIANA Y LA MODA.=

a. INTRODUCCION.-

En las partes anteriores hemos aprendido que la media es una medida de tendencia central en la que la suma de las desviaciones respecto a ella es cero; que la mediana es la medida de tendencia central que divide el área de un histograma o el área bajo la curva de distribución en dos partes iguales, de manera que el número de observaciones

44

Page 45: Esta Di Stica

por debajo de la mediana es igual al número de observaciones por encima de ella y, por último, que la moda es el valor que se presenta con mayor frecuencia. En esta parte nos referimos al uso de estas medidas de tendencia central, a algunas de sus características y las relaciones más importantes que hay entre ellas.

b.- TRATAMIENTO ALGEBRAICO.-

De las tres medidas de tendencia central, la media es la única que se presta a tratamientos algebraicos. Así, de la expresión

de la media , se desprenden las siguientes relaciones:

.

Utilizando desarrollos algebraicos se demuestran varias propiedades de la media, algunas de las cuales se utilizan para calcular el valor de la media por el llamado método corto o método clave, que es de gran importancia cuando no se dispone de una calculadora electrónica.

La mediana, al igual que la moda, no se presta para tratamientos algebraicos como la media aritmética.

c.- EFECTO DE LOS VALORES EXTREMOS.-

De las tres medidas tendencia central, la media aritmética es muy sensible a los valores extremos, en tanto que la mediana y la moda no son afectadas por los valores de los extremos.

EJEMPLO: En la serie 3, 5, 7, 7, 8 la media es ; si cambiamos el valor

extremo 8 por 18, se tiene la serie 3, 5, 7, 7, 18, cuya media es , es

decir, la media varia de 6 a 8. La mediana, por ser insensible a los valores extremos, no varió al cambiar 8 por 18 y es 7 en ambas series. La moda en ambas series es 7 por ser el valor más frecuente.

Debido a la gran sensibilidad de la media aritmética a los valores extremos, muchas veces resulta que su valor produce efectos engañosos. Por ejemplo, si se está

45

Page 46: Esta Di Stica

estudiando el ingreso diario de un grupo de personas y, se tienen los valores $320, 400, 400, 450, 500, 550, 2000, y 2900, a esta serie le corresponde:

Media = $ 880Mediana = $ 450Moda = $ 400

Observe que sólo dos personas tiene ingresos altos y las siete restantes tienen salarios de $ 550 o menos, o sea que en este caso la media resultó atípica (no típica). La mediana de $ 450 y la moda de $ 400 resultan más representativas para esta distribución. El conocimiento de las tres medidas de tendencia central da una buena apreciación de la distribución de los valores. Pero si se debe hacer una apreciación con una sola de las medidas, es mejor usar la mediana que corresponde al valor del medio.

d.- EFECTO DE LA ASIMETRÍA.-

En una distribución simétrica las tres medidas de la tendencia central son idénticas, y si la distribución se torna asimétrica no se produce cambio en la moda; la mediana y la media se corren en la dirección de la asimetría. La asimetría es positiva hacia la derecha y negativa hacia la izquierda. En la asimetría positiva la mediana aumenta por el mayor número de frecuencias hacia la derecha y la media aumenta más, ya que hay un incremento en la frecuencia y en el valor de las observaciones. En las asimetrías negativas ocurre lo contrario; la mediana disminuye y la media se reduce más que la mediana.

En el siguiente ejemplo se muestra el polígono de frecuencias de la distribución de frecuencias agrupadas que se da en el cuadro. El polígono se construyo utilizando las ordenadas correspondientes a las marcas de cada clase y en él se muestra la posición de la media, la mediana y la moda. Para la moda se consideró la marca de la clase de mayor frecuencia; en realidad esta manera de calcular la moda es una forma aproximada y para su exacta ubicación en la clase modal existen métodos de interpolación en los que

46

Page 47: Esta Di Stica

intervienen las frecuencias de las clases vecinas a la clase modal.

INTERVALO DE CLASE

f

16, 5 – 19,5 119,5 – 22,5 522,5 – 25, 5 925,5 – 28,5 628,5 – 31,5 531,5 – 34,5 434,5 – 37,5 2

---------------------- -------TOTAL 32

0

1

2

3

4

56

7

8

9

10

1 2 3 4 5 6 7 8 9

Marca de clase

frec

uec

ias

Serie1

18 21 24 27 30 33 36

Media (X) = 26,7

Mediana (Me) = 26

Moda (Mo) = 24

Mo Me X

e.- ¿Qué MEDIDA DE TENDENCIA CENTRAL ESCOGER?

La medida de tendencia central que debe utilizarse depende de la información que se tenga y del objetivo que se persigue.

Si la distribución es casi simétrica, pueden utilizarse indistintamente las tres medidas, que resultan aproximadamente iguales.

Si los datos no están ordenados, puede resultar más fácil el cálculo de la media aritmética que el de la mediana; la moda se encuentra por simple búsqueda del valor más frecuente.

47

Page 48: Esta Di Stica

Si los datos son irregulares y hay algunas en los valores de la clase de la mediana, esta medida de tendencia central no es buena, ya que su ubicación puede resultar falsa.

Si se desea calcular totales, la única medida utilizable es la media aritmética. Así, si basados en una experiencia deseamos conocer en una empresa el posible gasto de energía eléctrica para un periodo futuro, la única medida que puede usarse es la media.

Si desea ubicarse las condiciones de una persona en una clase, la mediana resulta la medida más indicada, ya que por comparación pone en evidencia si la persona está por sobre la mitad o por debajo de ella.

4.- MEDIA GEOMÉTRICA: DEFINICIÓN.- Se lo define como media geométrica al estadígrafo de centralización que es igual a la raíz enésima del producto de las Xj observaciones. Esta medida de centralización se caracteriza por dar mayor importancia a los valores menores o por estar influenciada por dichos valores en una distribución, es una que trata de reducir la importancia de los valores con relación a los valores menores.

La media geométrica no es aplicable para el caso en el que uno o unos de los valores de una muestra sean igual a cero.

FORMULAS PARA DATOS ORIGINALES:

Para facilitar la utilización de la formula de la media geométrica es conveniente convertir a la misma en operaciones con logaritmos de manera que las fórmulas anteriores expresadas en logaritmos se describan a continuación:

PARA DATOS ORIGINALES

48

Page 49: Esta Di Stica

PARA DATOS AGRUPADOS

Ejemplo:

Altura enpulgadas

Frecuencia(f)

Marca de clase(X) Log X f logX

         60 - 62 5 61 1.79 8.9363 - 65 18 64 1.81 32.5166 - 68 42 67 1.83 76.6969 - 71 27 70 1.85 49.8272 - 74 8 73 1.86 14.91

------------------ -----------------

total 100     182.86

La media geométrica es útil en el cálculo de tasa de crecimiento.

5.- MEDIA ARMONICA.-

Se lo define como el estadígrafo que es igual al reciproco de la media aritmética del reciproco de los números a semejanza de la media geométrica, es una medida que esta influenciada por los valores pequeños de la distribución e igual que la medida geométrica cuando uno de los valores de la variable es igual a cero, la media armónica deja de ser representativa, esta medida es utilizada especialmente para la determinación de velocidades medias, así como también en el consumo o gasto del presupuesto familiar.

H= media armónica.

Datos simples

49

Page 50: Esta Di Stica

Datos agrupados.

Ejemplo:

Altura pulg. f x f/x       

60 - 62 5 61 0.08263 - 65 18 64 0.2866 - 68 42 67 0.6369 - 71 27 70 0.3972 - 74 8 73 0.11

total 100   1.49

6.- CUANTILAS: CUARTILES, DECÍLES Y PERCENTILES O (centiles):

La fórmula general para hallar su ubicación es:

En donde:

Es el sitio, lugar o la posición del percentil buscado en una serie ordenada.n = Es el número de observacionesp = es el percentil buscado.

CUARTILES, PARA DATOS ORIGINALES:

Es la serie que dividen en cuatro partes, sus fórmulas son:

=

=Me=

=

DECILES, PARA DATOS ORIGINALES:

50

Page 51: Esta Di Stica

Es la serie que divide en 10 partes iguales, sus fórmulas son:

=

=

=Me=

=

PERCENTILES O CENTILES, PARA DATOS ORIGINALES:

Es la serie que divide en 100 partes iguales, sus fórmulas son:

=

=

=Me=

=

Ejemplo: Ordenar los siguientes datos que corresponden a una serie simple y calcular los cuartìles uno, dos y tres, los deciles uno, tres y nueve:; y, los percentiles diez, cincuenta y noventa.

La edad de los trabajadores es: 33, 26, 66, 45,28, 59, 33, 36, 26, 45, 62, 45. n=12

Primeramente ordenamos los números:

X= 26

26

28

33

33

36

45

45

45

59

62

66

Posición

1 2 3 4 5 6 7 8 9 10

11

12

Calcular los cuartìles: uno, dos y tres:

51

Page 52: Esta Di Stica

Cuartil 1:

Observamos que la respuesta es 3,25; o sea esta entre la 3 y la 4 posición. Esta a 0,25 de la distancia entre ellos. Como el tercer valor es 28, y el cuarto es 33, obtenemos restando el valor de 33 – 28 = 5. Para obtener el valor lo que realizamos es una multiplicación entre la diferencia que salio (5) y la distancia entre la tercera y la cuarta posición que es (0,25); entonces, (5)*(0,25) = 1,25. Para determinar el cuartil 1 lo que tenemos que hacer es sumar la tercera posición que es (28) más 1,25 que salio de la multiplicación entonces el cuartil 1 es igual a:

Cuartil 2:

O sea 45 – 36 = 9; luego 9*(0,50) = 4,5.

Luego se suma la posición 6 que es igual a 36 + 4,5 = 40,5

Cuartil 3:

O sea 59 – 45 = 14; luego 14*(0,75) = 10,50

Luego se suma la posición 9 que es igual a 45 + 10,50 = 55,5

Calcular los deciles: uno, tres y nueve:

Decil 1:

O sea 26, aquí se da un caso que entre 1 y 2 son las mismas cantidades por lo tanto el decil 1 es igual a 26.

Decil 3:

52

Page 53: Esta Di Stica

O sea 33 – 28 = 5; luego 5 * (0,90) = 4,5

Luego se suma la posición 3 que es igual a 28 + 4,5 = 32,5

Decil 9:

O sea entre las posiciones 12 y 11 que es 66 – 62 = 4; luego 4 * (0,70) = 2,80.

Luego se suma el valor de la posición 11 que es igual 62 + 2,80 = 64,8

Calcular los centiles o percentiles: diez, cincuenta y noventa

Centil o percentil 10:

Igual que en el decil entre la posición 1 y la 2 es la misma cantidad por lo tanto el centil es igual a 26.Centil o percentil 50:

O sea entre la posición 6 y 7, 45 – 36 = 9; luego 9 * (0,50) = 4,5.

Luego se suma el valor de la posición 6 que es 36 + 4,5 = 40,5

Centil o percentil 90:

O sea entre la posición 11 y 12, 66 – 62 = 4; luego 4 * (0,70) = 2,8

Luego se suma el valor de la posición 11 que es 62 + 2,8 = 64,80

CUARTILES, DECILES Y PERCENTILES PARA DATOS AGRUPADOS CON FRECUENCIAS:

53

Page 54: Esta Di Stica

Se calculan de la misma manera que la mediana, solo que se cambia la fórmula de posición, por la que corresponda.

Se encuentra la posición del cuartil, decil o percentil que se desee calcular con las fórmulas utilizadas para una serie estadística.

Se calcula el valor del cuaritl, decil o percentil con las siguientes fórmulas.

CUARTILES DECILES CENTIL

EJEMPLO:

Calcular el decil SIETE de la siguiente tabla estadística:

54

Page 55: Esta Di Stica

X f fai

101 - 300 12

12

301 - 500 17

29

501 - 700 6 35

701 - 900 10

45

901 - 1100

12

57

1101 - 1300

8 65

1301 - 1500

6 71

TOTAL 71

Primeramente calculo la posición 7 que es igual:

Se encuentra la clase que contiene la posición del decil siete, la misma que corresponde al intervalo 901 – 1100

EJERCICIOS PROPUESTOS:

1.- LAS NOTAS DE UN ESTUDIANTE HAN SIDO 85, 76, 93, 82 Y 96. HALLAR SU MEDIA ARITMÉTICA POR LOS DOS METODOS.

Calificaciones.8576938296432

55

Page 56: Esta Di Stica

2.- LOS TIPOS DE REACCIÓN DE UN INDIVIDUO ENTRE DIVERSOS ESTÍMULOS, MEDIOS POR UN PSICÓLOGO, FUERON 0.53, 0.46, 0.50, 0.49, 0.52, 0.53, 0.44 Y 0.55 SEGUNDOS RESPECTIVAMENTE. DETERMINAR SU TIEMPO MEDIO DE REACCIÓN POR LOS DOS METODOS.

3.- UN CONJUNTO DE NÚMEROS CONTIENE 6 SEISES, 7 SIETES, 8 OCHOS, 9 NUEVES Y 10 DIECES ¿CUÁL ES SU MEDIA ARITMÉTICA?

Números F6 67 78 89 910 10total 40

4.- EN LABORATORIO, TEORÍA Y PROBLEMAS DE FÍSICA UN ESTUDIANTE HA SACADO 71, 79,89 PUNTOS RESPECTIVAMENTE

a) CON PESOS 2, 4,5 ASIGNADOS RESPECTIVAMENTE A ESAS PRUEBAS ¿CUAL ES SU PUNTUACIÓN MEDIA?b) ÍDEM CON LOS TRES PESOS IGUALES: DATOS: 71, 78, 89

5.- TRES PROFESORES DE ECONOMÍA DIERON NOTAS MEDIAS EN SUS CURSOS, CON 32, 25 Y 17 ESTUDIANTES DE 79, 74 Y 82 PUNTOS, RESPECTIVAMENTE. HALLAR LA PUNTUACIÓN MEDIA DE LOS TRES CURSOS.

6.- LA TABLA MUESTRA LA DISTRIBUCIÓN DE CARGAS MÁXIMAS EN TONELADAS CORTAS (1 TONELADA CORTA = 2000 LB.) QUE SOPORTAN LOS CABLES PRODUCIDOS EN CIERTA FÁBRICA. DETERMINAR LA CARGA MÁXIMA MEDIA, USANDO LOS TRES METODOS:

CARGA MÁXIMA (toneladas cortas)

NÚMERO DE CABLES

9,3 - 9,7 29,8 - 10,2 510,3 - 10,7 1210,8 - 11,2 1711,3 - 11,7 1411,8 - 12,2 612,3 - 12,7 312,8 - 13,2 1TOTAL 60

7.- HALLAR LA PARA LOS DATOS DE LA TABLA, USANDO:

56

Page 57: Esta Di Stica

a) El método largob) El método de compilación

8.- LA TABLA MUESTRA LA DISTRIBUCIÓN DE LOS DIÁMETROS DE LOS REMACHES SALIDOS DE UNA FÁBRICA. CALCULAR EL DIÁMETRO MEDIO.

DIÁMETRO F0,7247 - 0,7249 20,7250 - 0,7252 60,7253 - 0,7255 80,7256 - 0,7258 150,7259 - 0,7261 420,7262 - 0,7264 680,7265 - 0,7267 490,7268 - 0,7270 250,7271 - 0,7273 180,7274 - 0,7276 120,7277 - 0,7279 40,7280 - 0,7282 1TOTAL 250

9.- CALCULAR LA MEDIA PARA LOS DATOS DE LA TABLA

Clase f x(x-A)

fdj

10 – 15

312.5

15 – 20

717.5

X F Fx Dj Fdj462 98480 75498 56516 42534 30552 21570 15588 11606 6624 2Total 356

57

Page 58: Esta Di Stica

20 – 25

16

22.5

25 – 30

12

27.5

30 – 35

932.5

35 – 40

537.5

40 – 45

242.5

54

10.- Hallar la media y la mediana de estos conjuntos de números:a) 5, 4, 8, 3, 7, 2, 9 b) 18.3, 20.6, 19.3, 22.4, 20.2, 18.8, 19.7, 20.0

11.- Hallar la puntuación media del problema

76, 82, 85, 93, 96

12.- Hallar la mediana del tiempo de reacción del problema:Los tipos de reacción de un individuo ante diversos estímulos, medidos por un psicólogo, fueron 0.53, 0.46, 0.50, 0.49, 0.52, 0.53, 0.44 y 0.55 segundos, respectivamente. Determinar su tiempo medio de reacción.

13.- Hallar la mediana de las cargas máximas del problema:La tabla muestra la distribución de cargas máximas en toneladas cortas (1 tonelada corta = 2000 lb.) que soportan los cables producidos en cierta fábrica.

CARGA MÁXIMA (toneladas cortas)

F F. a

9,3 - 9,7 2 29,8 - 10,2 5 710,3 - 10,7 12 1910,8 - 11,2 17 3611,3 - 11,7 14 5011,8 - 12,2 6 5612,3 - 12,7 3 5912,8 - 13,2 1 60TOTAL 60  

58

Page 59: Esta Di Stica

14.- HALLAR LA MEDIANA PARA LA DISTRIBUCIÓN DEL PROBLEMA:

OBSERVACIONES

f X Fa

453 – 471 98472 – 488 75489 – 507 56508 – 524 42525 – 543 36544 – 560 21561 – 579 15580 – 596 11597 – 615 6616 - 632 2TOTAL 36

2

15.- Hallar la mediana, la media, la moda de cada uno de estos conjuntos:

a) 7, 4, 10, 9, 15, 12, 7, 9, 7 b) 8, 11, 4, 3, 2, 5, 10, 6, 4, 1, 10, 8, 12, 6, 5, 7

16.- HALLAR LA MODA DEL PROBLEMA: Las notas de un estudiante han sido 85, 76, 93, 82 y 96.

17.- HALLAR EL TIEMPO DE REACCIÓN MODAL EN EL PROBLEMA

0.44 – 0.46 – 0.49 – 0.50 – 0.52 – 0.53 – 0.53 – 0.55

18.- HALLAR LA MODA DEL CONJUNTO DE DATOS DEL PROBLEMA

19) HALLAR LA MODA DE LAS CARGAS MÁXIMAS DEL PROBLEMA:

toneladas

# de cables

x

9.3 9.7 29.8 10.2 510.3 10.7 1210.8 11.2 1711.3 11.7 1411.8 12.2 612.3 12.7 312.8 13.2 1

59

Page 60: Esta Di Stica

60

20.-HALLAR EL DIÁMETRO MODAL DE LOS REMACHES DE LA TABLA

21.- HALLAR LA MODA DE LA DISTRIBUCIÓN DEL SIGUIENTE PROBLEMA

CLASE FRECUENCIA

10 HASTA 15

3

15 HASTA 20

7

20 HASTA 25

16

25 HASTA 30

12

30 HASTA 35

9

35 HASTA 40

5

40 HASTA 45

2

TOTAL 54

22.-HALLAR LA MEDIA GEOMÉTRICA DE LOS NÚMEROS:

a) 4.2 Y 16.8 b) 3.00 Y 6.00

f x0.7247 - 0.7249 20.7250 - 0.7252 60.7253 - 0.7255 80.7256 - 0.7258 150.7259 - 0.7261 420.7262 - 0.7264 680.7265 - 0.7267 490.7268 - 07270 250.7271 - 0.7273 180.7274 - 0.7276 120.7277 - 0.7279 1

250

60

Page 61: Esta Di Stica

23.- HALLAR A) LA MEDIA GEOMÉTRICA Y B) LA MEDIA ARITMÉTICA DE LOS NÚMEROS 2, 4, 8, 16, 32

24.- HALLAR LA G DE LA DISTRIBUCIÓN DE LOS PROBLEMAS Y COMPARAR LA MEDIA GEOMÉTRICA ES MENOR O IGUAL A LA PARA ESTOS CASOS.

CARGA MÁXIMA (toneladas cortas)

F X Log x f. log x

9,3 - 9,7 2 9,59,8 - 10,2 5 1010,3 - 10,7 12 10,510,8 - 11,2 17 1111,3 - 11,7 14 11,511,8 - 12,2 6 1212,3 - 12,7 3 12,512,8 - 13,2 1 13TOTAL 60

25.- HALLAR LA MEDIA ARMÓNICA DE LOS NÚMEROS A) 2, 3, 6, B) 3.2, 5.2, 4.8, 6.1, 4.2

26.- HALLAR A) LA MEDIA ARITMÉTICA, B) LA MEDIA GEOMÉTRICA Y C) LA MEDIA ARMÓNICA DE LOS NÚMEROS 0, 2,4 Y 6

27.- USAR EL PROBLEMA PARA HALLAR LA MEDIA ARMONICA DE LAS DISTRIBUCIONES DE:

Altura   F X F/X60 65 563 65 1866 68 4269 71 2772 74 8

TOTAL  

100

28.- DEL EJERCICIO 6, CALCULAR EL CUARTEL 2 Y 3

29.- DEL EJERCICIO 7 CALCULAR EL DECIL 5, 7, 8, 9

30.- DEL EJERCICIO 8 CALCULAR EL CENTIL 38, 45,75,89,15

61

Page 62: Esta Di Stica

CAPITULO IV

MEDIDAS DE DISPERSIÓN.

¿POR QUÉ ESTUDIAR LA DISPERSIÓN?

Luego de determinar las medidas de tendencia central (punto medio) de un conjunto de observaciones es importante tener una idea de cuán dispersas se encuentran dichos datos. Las medidas descriptivas que permitan especificar esta característica se denominan medidas de dispersión o medidas de variabilidad.

62

Page 63: Esta Di Stica

Una pequeña medida de dispersión indica que los datos se encuentran muy agrupados.

Una medida de dispersión grande indica que los datos están ampliamente extendidos.

MEDIDAS DE DISPERSION.- La amplitud de variación o intervalo se basa en la localización de los valores más grande y más pequeño de un conjunto de datos. La desviación media, la varianza y la desviación estándar se basan en las desviaciones respecto de la media.

AMPLITUD (O INTERVALO) DE VARIACION.-

La medida de dispersión más sencilla es la amplitud de variación. Se trata de la diferencia entre el valor más grande y el más pequeño de un conjunto de datos. Nos indica el recorrido de los datos observados de la variable que se investiga. Expresada como ecuación:

AMPLITUD DE VARIACION = Valor más grande – Valor más pequeño

Ejemplo: Determine la amplitud de variación del número de computadoras producidas en las plantas industriales de Quito y Guayaquil. Interprete los dos intervalos.

La amplitud de variación en la producción diaria de computadoras en la planta de Quito es 4, se obtiene de la diferencia entre la producción diaria mayor, que es 52, y la menor, que es 48. La amplitud de variación de la producción diaria en la planta de Guayaquil es 20 computadoras, ya que 20 = 60 – 40. Por tanto, puede concluirse que: 1.- Hay menos dispersión en la producción diaria en la planta de Quito que en la de Guayaquil, porque la amplitud de variación de 4 computadoras es menor que la de 20 computadoras, y 2.- La producción en la planta de Quito se acumula más cerca de la media de 50, que la producción en la planta de Guayaquil (porque el intervalo de variación de 4 es menor que uno de 20). De esta forma, la producción media en la planta de Quito (50 computadoras) es un promedio más representativo que la media de 50 computadoras para la planta de Guayaquil.

AMPLITUD DE VARIACION CON FRECUENCIAS:

Recuérdese que la amplitud (o intervalo de variación) se define como la diferencia entre el valor más grande y el más pequeño de una población. Para calcular la amplitud de variación a partir de datos agrupados en una distribución de

63

Page 64: Esta Di Stica

frecuencias, se resta el límite inferior de la clase más baja, del límite superior de la clase más alta

1) Supóngase que se agrupó una muestra de 47 sueldos por hora (en dólares) en la siguiente distribución de frecuencias.

Sueldo por hora (en dólares)

Frecuencias

5 hasta 10 610 hasta 15 1215 hasta 20 1920 hasta 25 725 hasta 30 3

La amplitud de variación es de 25, que se obtiene 30 – 5

AT = X max – X min AT = 30 – 5 AT = 25

DESVIACION MEDIA: Es el promedio aritmético de los valores absolutos de las desviaciones con respecto a la media aritmética.

En términos de una formula queda:

Donde:Es el valor de cada desviaciónEs la media aritmética de los valores

n Es el número de observaciones en la muestra.ll Indica el valora absoluto. En otras palabras, cuando no se toman en cuenta los signos algebraicos de las desviaciones respecto de la media.

¿Por qué no se consideran los signos de las desviaciones respecto de la media? Si no se hiciera así, las desviaciones positivas y negativas se compensarían, y la desviación media siempre sería igual a cero. Tal medida (cero) sería un valor estadístico inútil. Como se consideran desviaciones absolutas, la desviación media suele denominarse también desviación media absoluta, simbolizada por DMA. Generalmente se abreviará como DM.

64

Page 65: Esta Di Stica

Ejemplo: El número de pacientes atendidos en la sala de urgencias del Hospital Regional, para una muestra de 5 días el año pasado fue: 103, 97, 101, 106 y 103. Determine e interprete la desviación media.

La desviación media es el promedio según el cual las observaciones individuales se desvían respecto de la media aritmética. Para obtener la desviación media de un conjunto de datos, se comienza evaluando la media aritmética. La media del número de pacientes es 102, valor obtenido de (103 + 97 + 101 + 106 + 103) /5. Después se determina la magnitud en que cada observación se desvía respecto de la media. Luego se suman esas diferencias, omitiendo sus signos, y se divide la suma entre el número de observaciones. El resultado es el valor medio en que las observaciones se desvían con respecto al promedio. Un valor pequeño en la desviación indica que la media es representativa de los datos, en tanto que un valor grande en la desviación indica dispersión en los datos. A continuación se muestran los detalles de los cálculos utilizando la formula.

Número de casos

Desviación absoluta

103 (103 – 102) = 1

1

97 (97 – 102) = - 5

5

101 (101 – 102) = -1

1

106 (106 – 102) = 4

4

103 (103 – 102) = 1

1

TOTAL 12

La desviación media es 2,4 pacientes por día. El número de esta varia, en promedio, en 2,4 pacientes por día respecto de la media de 102 enfermos diarios.

La desviación media tiene dos ventajas. Primero, utiliza en su cálculo todos los valores en la muestra. Segundo, es fácil de comprender, pues representa el promedio en que los valores se desvían con respeto a la media. Sin embargo, su principal desventaja es el uso de valores absolutos, ya que generalmente es difícil trabajar con ellos. En consecuencia, la desviación media no se usa con la misma frecuencia que las otras medidas de dispersión, como es el caso de la desviación estándar.

2.1.- DESVIACION MEDIA DE UNA SERIE ESTADISTICA DE FRECUENCIAS.

65

Page 66: Esta Di Stica

La desviación media de una serie estadística de frecuencia se

la obtiene con la siguiente fórmula: que es la

misma anterior, solamente se introduce un nuevo elemento que es la frecuencia.

EJEMPLO:

El peso en Kg., registrado para un grupo de señoritas es:

X f51

1

50

2

49

3

48

5

47

3

46

2

45

2

44

1

Hallar la desviación media:

a) Obtenemos la media aritmética

b) Se resta la media de cada valorc) Se multiplican la frecuencia por las desviaciones

absolutas.d) Se divide la suma de los productos entre el número de

valores.

66

Page 67: Esta Di Stica

X f f*X51 1 51 3,3750 2 100 4,7449 3 147 4,1148 5 240 1,8547 3 141 1,8946 2 92 3,2645 2 90 5,2644 1 44 3,63

-------- ----- ------ ---------TOTA

L19 905 28,11

1,48 Kg. Es el valor con el cual cada valor de la variable difiere con respecto a la media aritmética.

2.2.- DESVIACION MEDIA DE UNA SERIE ESTADISTICA DE INTERVALOS.-

La fórmula que nos permite hacer los cálculos correspondientes a la desviación media de una serie estadística de intervalos es:

En donde:

DM = Desviación media

= Sumatoria del producto de las frecuencias por las desviaciones.

n = Número de casos.EJEMPLO:

67

Page 68: Esta Di Stica

Mediante la aplicación de un cuestionario se recogieron los siguientes datos, que tienen relación con la edad de un grupo de personas.

X f16 – 19

4

20 – 23

3

24 – 27

2

28 – 31

8

32 – 35

12

36 – 39

20

40 – 43

10

44 – 47

5

48 – 51

0

52 – 55

1

--------- --------TOTAL 65

Hallar la desviación media: Para trabajar seguimos los siguientes pasos:

a) Obtenemos los puntos medios

b) Se determina la media aritmética.

c) Se encuentra las desviaciones d) Se determina el producto de las frecuencias por las

desviaciones e) Se suma aritméticamente el producto de las

desviaciones por las frecuencias y se divide para el número de casos.

68

Page 69: Esta Di Stica

X f X f*X f*16 - 19 4 17,

570 69,68

20 – 23

3 21,5

64,5 40,26

24 – 27

2 25,5

51 18,84

28 – 31

8 29,5

236 43,36

32 – 35

12 33,5

402 17,04

36 – 39

20 37,5

750 51,60

40 – 43

10 41,5

415 65,80

44 – 47

5 45,5

227,5 52,90

48 – 51

0 49,5

0 0

52 – 55

1 53,5

53,5 18,58

---------- -------- --------- ---------TOTAL 65 2269,

5378,06

5,82 años es el valor que indica con cuanto se separan las edades de cada una de las personas con respecto a la media.

VARIANZA Y DESVIACIÓN ESTÁNDAR:

VARIANZA: La media aritmética de las desviaciones cuadráticas con respecto a la media

Cabe indicar que la varianza es no negativa, y es cero solamente si todas las observaciones son iguales

69

Page 70: Esta Di Stica

DESVIACION ESTANDAR: La raíz cuadrada positiva de la varianza.

VARIANZA POBLACIONAL: Las fórmulas para la varianza poblacional y la varianza muestral son un poco diferentes. Primero se considerará la varianza poblacional (Recuérdese que una población es la totalidad de las observaciones o datos que se estudian). La varianza poblacional de datos no agrupados, es decir, los datos que no están tabulados en una distribución de frecuencias, se obtienen por medio de la fórmula.

VARIANZA POBLACIONAL

DATOS ORIGINALES

Donde:

Es el símbolo de la varianza de una población ( es la letra griega sigma minúscula). Se expresa comúnmente como “sigma al cuadrado”

X Es el valor de una observación en la poblaciónU Es a media aritmética de la poblaciónN Es el número total de observaciones en la población.

Ejemplo: Las edades de los pacientes del pabellón de aislados en el Hospital XYZ, son 38, 26, 13, 41 y 22 años. ¿Cuál es la varianza de esa población?.

La suma de las desviaciones de la media debe ser igual a cero.

Igual que la amplitud de variación y la desviación media, la varianza se utiliza para comparar la dispersión en dos o más conjuntos de observaciones. Por ejemplo, se

EDAD (X)

X - U

38 10 10026 - 2 413 - 15 22541 13 16922 - 6 36

------------ ------- ----------140 534

70

Page 71: Esta Di Stica

calculó que 106,8 es la varianza de las edades de los pacientes del pabellón. Si tal medida para las edades de todos los enfermos de cáncer en el hospital es 342,9, puede decirse que:

1) hay menos dispersión en la distribución de las edades de los hospitalizados en aislamiento, que en la de los pacientes de cáncer (porque 106,8 es menor que 342,9); 2) las edades de los pacientes aislados se acumulan más cerca de la media de 28 años, que las de los enfermos de cáncer. De modo que, la edad media para aquéllos es un promedio más representativo en comparación con la media para todos los pacientes que padecen enfermedades cancerosas.

DESVIACION ESTÁNDAR POBLACIONAL:La interpretación de la amplitud de variación y la desviación media es fácil. La primera, es la diferencia entre los valores más alto y más bajo, de un conjunto de datos. La segunda es el promedio de las desviaciones respecto a la media. Sin embargo, resulta difícil interpretar la varianza para un solo conjunto de observaciones. La varianza de 106,8 para las edades de los pacientes en aislamiento, no está en términos de “años”, sino en “años al cuadrado”.

Al obtener la raíz cuadrada de la varianza poblacional, se transforma a un valor que tiene la misma unidad de medición que se utiliza en los datos originales. La raíz cuadrada de 106,8 “años al cuadrado”, es 10,3 años. A esta magnitud: raíz cuadrada de la varianza poblacional, se denomina desviación estándar poblacional. Una fórmula para datos no agrupados es:

DESVIACION ESTANDAR POBLACIONAL

PARA DATOS ORIGINALES

Tenemos dos fórmulas de la Varianza y estas son:

VARIANZA MUESTRAL FÓRMULA DE LA DESVIACIÓN PARA

DATOS ORIGINALES

71

Page 72: Esta Di Stica

VARIANZA MUESTRAL FÓRMULA DIRECTA PARA DATOS

ORIGINALESS

EJERCICIOS:

1) Las edades de los pacientes del pabellón de aislados en el Hospital TWX, SON 38, 26, 13, 41, 22. ¿Cuál es la varianza de esa población y la desviación estándar?

Varianza poblacional

Desviación estándar

2) Los salarios por hora en una muestra de operarios de medio tiempo en la empresa FRUIT PACKERS, son (en dólares); 2, 10, 6, 8, 9. ¿Cuál es la varianza muestral?

a) Varianza muestral

Edad (X)38 10 10026 - 2 413 - 15 22541 13 16922 - 6 36

----------- ---------- ----------5 0 534

Salarios por hora (X)2 - 5 25

10 3 96 - 1 18 1 19 2 4

------------------------ -------- ----------75 0 40

72

Page 73: Esta Di Stica

Formula directa:

b) La desviación estándar es:

EJEMPLO: Los salarios por hora en una muestra de operarios de medio tiempo en la empresa Fruit, son (en dólares): $ 2, 10, 6, 8, 9. ¿Cuál es la varianza muestral?

La varianza muestral se calcula utilizando dos métodos. A la izquierda se presenta el

método de la desviación, utilizando la fórmula . A la derecha se indica

el método directo, en el que se aplica la fórmula

EMPLEANDO LAS DESVIACIONESAL CUADRADO CON RESPECTO ALA MEDIA

Salario por hora (X)2 410 1006 368 649 81

---------------------- ------35 285

SalarioPor

hora(X)2 - 5 2510 3 96 1 18 1 19 2 4

--------- --------- ---------35 0 40

73

Page 74: Esta Di Stica

(Dólares al cuadrado)

USANDO LA FORMULADIRECTA

Salario por hora(X)2 4

10 100

6 368 649 81

-------------------- -----35 28

5

(Dólares al cuadrado)

DESVIACION ESTANDAR MUESTRAL: Este concepto se utiliza como un estimador de la desviación estándar poblacional. Según se indicó antes, esta última es la raíz cuadrada de la varianza de la población. En forma semejante, la desviación estándar muestral es la raíz cuadrada de la varianza muestral. La desviación muestral para datos no agrupados se obtiene fácilmente como sigue:

DESVIACION MUESTRAL

ESTANDAR FORMULA

DIRECTA

74

Page 75: Esta Di Stica

EJEMPLO: La varianza muestral en el ejemplo anterior de los salarios por hora resultó ser igual a 10. ¿Cuál es la desviación estándar de la muestra?

La desviación estándar muestral es $ 3,16 (dólares), que se obtiene de . Observe de nuevo que la varianza muestral está en términos de dólares al cuadrado, pero al obtener la raíz cuadrada de 10 resulta $ 3,16 en dólares simples, y por tanto está en las mismas unidades monetarias que los datos originales.

OTROS METODOS DE LA VARIANZA PARA DATOS ORIGINALES.-

PRIMER METODO

EJEMPLOS:

Calculamos primero la media aritmética

10, 12, 2, 9, 15, 6, 7, 8, 12, 9

Luego aplicamos la fórmula de la varianza por el método:

SEGUNDO METODO

10, 12, 2, 9, 15, 6, 7, 8, 12, 9

75

Page 76: Esta Di Stica

LA VARIANZA PARA DATOS AGRUPADOS.-

PRIMER METODO:

Hallar la varianza de la siguiente tabla de frecuencias:

Intervalo

f XMarca de

clase

fX

27 – 29 1 28 28 9 9 81 8130 – 32 1

031 310 6 60 36 360

33 – 35 14

34 476 3 42 9 126

36 – 38 33

37 1221

0 0 0 0

39 – 41 14

40 560 3 42 9 126

42 – 44 7 43 301 6 42 36 25245 – 47 3 46 138 9 27 81 243----------- --- --------- ----- ------- --------TOTAL 8

2303

4222 1188

PROCEDIMIENTOS ABREVIADOS PARA EL CÁLCULO DE LA VARIANZA.

El procedimiento de la varianza puede simplificarse mediante procedimientos que son una generalización de los ya presentados en relación al cálculo de la media aritmética.

76

Page 77: Esta Di Stica

VARIANZA CON DATOS AGRUPADOS CON FRECUENCIAS:

PRIMER METODO DE COMPILACIÓN:

EJEMPLO:

Altura En

pulgadas

Frecuencia(f)

Marca de Clase(X)

fX

60 – 62 5 61 305 - 6,45 41,60 20863 – 65 18 64 1152 - 3,45 11,90 214,266 – 68 42 67 2814 - 0,45 0,20 8,469 – 71 27 70 1890 2,55 6,50 175,572 – 74 8 73 582 5,55 30,80 246,4

------------ ---------- --------- -----------TOTAL 100 6745 852,5

SEGUNDO METODO:

Altura En

pulgadas

Frecuencia(f)

Marca de Clase(X)

fX

60 – 62 5 61 305 3721

18605

63 – 65 18 64 1152 4096

73728

66 – 68 42 67 2814 4489

188538

69 – 71 27 70 1890 4900

132300

72 – 74 8 73 582 5329

42632

77

Page 78: Esta Di Stica

------------ ---------- --------- -----------TOTAL 100 6745 455803

TERCER METODO: LARGO (MEDIA SUPUESTA “A”):

Altura En

pulgadas

Frecuencia(f)

Marca de Clase(X)

fX Dj=(X-A)A=67

F(X-A)

60 – 62 5 61 305 - 6 36 - 30 18063 – 65 18 64 115

2- 3 9 - 54 162

66 – 68 42 67 2814

0 0 0 0

69 – 71 27 70 1890

3 9 81 243

72 – 74 8 73 584 6 36 48 288----------- ---------- ----- ------ --------TOTAL 100 674

545 873

CUARTO METODO: CLAVE

78

Page 79: Esta Di Stica

Altura En

pulgadas

Frecuencia(f)

Marca Clase(X)

fX (X-A)

U fU

60 – 62 5 61 305 - 6 - 2

4 - 10 20

63 – 65 18 64 1152

- 3 - 1

1 - 18 18

66 – 68 42 67 2814

0 0 0 0 0

69 – 71 27 70 1890

3 1 1 27 27

72 – 74 8 73 584 6 2 4 16 32----------- ---------- ------ ------ -------TOTAL 100 674

515 97

DESVIACIÓN TIPICA O ESTÁNDAR Y DISPERSION RELATIVA.-

DESVIACION TIPICA O ESTANDAR.-

La varianza , que estudiamos en la parte anterior como medida del grado de variabilidad de las distribuciones, tiene el inconveniente de expresar la dispersión de una variable en unidades distintas a la que mide la variable; así, si estudiamos la dispersión de la altura de las personas respecto a la media de su grupo, el valor mide la desviación en centímetros, en tanto que la varianza mide la dispersión en centímetros cuadrados. Al extraer la raíz cuadrada regresamos a la unidad

79

Page 80: Esta Di Stica

de medida de las variables, de lo cual nos resulta la desviación típica o estándar (s).

La desviación típica o estándar es la raíz cuadrada de la varianza.

Desviación típica o estándar =

Desviación estándar = s =

NO AGRUPADOS:

DESVIACION ESTANDAR = S=

Utilizando las fórmulas modificadas que se demostraron en el estudio de la varianza,

PARA DATOS AGRUPADOS

EJEMPLOS:

1.- Hallar la desviación estándar de la serie 10, 12, 2, 9, 15, 6, 7, 8, 12, 9. En el ejemplo se calcula la varianza por dos métodos y se tiene:

Calculamos la varianza por el método:

80

Page 81: Esta Di Stica

La desviación estándar es:

2.- Averiguar la desviación estándar de las distribuciones agrupadas del siguiente ejercicio:

Intervalo

f XMarca

de clase

fX

27 – 29 1 28 28 9 9 81 81 784 78430 – 32 1

031 310 6 60 36 360 961 9610

33 – 35 14

34 476 3 42 9 126 1156

16184

36 – 38 33

37 1221

0 0 0 0 1369

45177

39 – 41 14

40 560 3 42 9 126 1600

22400

42 – 44 7 43 301 6 42 36 252 1849

12943

45 – 47 3 46 138 9 27 81 243 2116

6348

----------- --- --------- ----- ------- -------- ------TOTAL 8

2303

4222 1188 11344

6

La desviación es:

81

Page 82: Esta Di Stica

INTERPRETACION Y USOS DE LA DESVIACION ESTANDAR.

TEOREMA DE CHEBYSHEV.-

La desviación estándar se emplea como una medida para comparar la dispersión en dos o más conjuntos de observaciones. Por ejemplo si tenemos para una distribución una desviación estándar de 7,51 y para otra 10,47 y los valores medios son aproximadamente iguales, esto nos indicaría que en la primera distribución los datos no se dispersan tanto como en el segundo caso porque 7,51< 10,47 por tanto el valor medio para la primera distribución es una medida más confiable que la correspondiente a la segunda distribución.

La desviación estándar no proporciona una imagen completa de la información en este sentido tiene una función importante en la toma de decisiones críticas con respecto a la composición de una cartera de inversiones.

La desviación estándar es útil para describir un conjunto de datos midiendo el grado de dispersión de las observaciones individuales alrededor de su media. Existen dos aplicaciones adicionales para la desviación estándar.

1. Teorema de Chebyshev.2. La regla empírica.

Se ha dicho que una desviación estándar pequeña para un conjunto de datos indica que éstos se encuentran localizados cerca de la media. Por el contrario, una desviación estándar de gran valor revela que las observaciones están lejos de la media. El matemático ruso Chebyshev (1821 – 1894) desarrolló un teorema que permite determinar la proporción mínima de los valores que se encuentran dentro de un número específico de desviaciones estándares con respecto de la media. Por ejemplo con base en el teorema de Chebyshev, al menos 3 de 4 valores, es decir el 75% deben encontrarse entre la media más dos desviaciones estándares

82

Page 83: Esta Di Stica

y la media menos dos de tales desviaciones . Esta relación se aplica sin que importe la forma de la distribución. Además, al menos 8 de cada 9 valores, es decir el 88,9% estarán entre la y al menos 24 de 25 valores, es decir 96% se encontrarán entre .

TEOREMA DE CHEBYSHEV: Establece que para un conjunto cualquiera de observaciones (muestra o población), la proporción mínima de los valores que se encuentran dentro de k desviaciones estándares desde la media es al menos

, donde K es una constante mayor que 1

EJEMPLO: Una muestra de las cantidades que los empleados de Duprein invierten quincenalmente en el plan de participación de utilidades, la media aritmética fue de $ 51,54 dólares y se obtuvo una desviación estándar de $ 7,51 dólares. Al menos, ¿qué porcentaje de las contribuciones se encuentran entre más 3,5 desviaciones estándar, y menos 3,5 desviaciones estándar, respecto de la media?

Aproximadamente 92%, valor que se obtiene como sigue:

REGLA EMPÍRICA.-

El teorema de Chebyshev se refiere a cualquier conjunto de valores; esto es, la distribución de los valores puede tomar cualquier forma. Sin embargo, en una distribución simétrica en forma de campana, como la de la figura siguiente, se obtiene mayor precisión al explicar la dispersión con respecto a la media. Estas relaciones entre la desviación estándar y la media constituyen la llamada regla empírica, que algunas veces se conoce como regla normal.

83

Page 84: Esta Di Stica

“En una distribución de frecuencias simétrica, con forma de campaña, aproximadamente 68% de las observaciones estarán entre más una y menos una desviación estándar desde la media; aproximadamente 95% de las observaciones se encontrarán entre más dos y menos dos desviaciones estándares desde la media; prácticamente todas las observaciones 99,7% se hallarán entre más tres y menos tres desviaciones estándar, a partir del valor medio.”

Se ha observado que si una distribución es simétrica con forma de campana, prácticamente todas las observaciones se encuentran entre la media más y menos tres desviaciones estándares. De esta forma si la y S =10, prácticamente todas las observaciones se hallan entre 100 +3(10) y 100 – 3(10), o sea 70 y 130. Por lo tanto, la amplitud de variación es 60, que se obtiene por 130 – 70

Recíprocamente, si se sabe que esta última es 60, podemos aproximar la desviación estándar dividiendo entre 6 la

70 80 90 100 110 120 130

68%

95%

99,7%

Grafica simétrica de campana, que muestra las relaciones entre la desviación estándar y la media.

-3S -2S -1S Media 1S 2S 3S

84

Page 85: Esta Di Stica

amplitud de variación. Para este ejemplo, la desviación estándar vale: amplitud de variación para 6 = 10.EJEMPLO: Una muestra de las cantidades mensuales de dinero que destina a sus alimentos un ciudadano de la tercera edad – que vive solo – sigue aproximadamente una distribución de frecuencias simétrica, del tipo de campana. La media muestral es de $ 150 (dólares), y la desviación estándar es $ 20. Utilizando la regla empírica indique:

1.- Aproximadamente, ¿entre qué cantidades está 68% de los gastos mensuales en alimentos?2.- Aproximadamente, ¿entre qué cantidades se halla 95% de los gastos mensuales por alimentos?3.- Aproximadamente, ¿entre qué montos están todos los gastos mensuales?

1.- Aproximadamente 68% está entre $ 130 y $ 170, que se obtiene por:

2.- aproximadamente 95% está entre $ 110 y $ 190, que se obtiene por:

3.- Casi todos los casos 99,7% están entre $ 90 y $ 210, lo que se obtiene mediante:

1.- De acuerdo con el teorema de Chebyshev, ¿al menos qué porcentaje de cualquier conjunto de observaciones se encontrará a no más de 1,8 desviaciones estándar desde la media?

2.- El ingreso medio de un grupo de observaciones muestrales es $ 500, la desviación estándar es $ 40. De acuerdo con el teorema de Chebyshev, ¿al menos que porcentaje de los ingresos se encontrará entre $ 400 y $ 600?

a) Aproximadamente en 68%

b) Aproximadamente en 95%

c) Aproximadamente en 99,7%

85

Page 86: Esta Di Stica

La respuesta esta entre un total del 95%.

DISPERSION RELATIVA.-

Resulta imposible una comparación directa de dos o más medidas de dispersión (por ejemplo, la desviación estándar de una distribución de ingresos anuales y la desviación estándar de una distribución de inasistencias, ambas del mismo grupo de empleados). ¿Se puede decir que la desviación estándar, $ 1200 (dólares), de la distribución del ingreso es mayor que la desviación estándar de 4,5 días de la distribución de faltas de asistencia? Obviamente no es así porque no podemos comparar directamente dólares y días de inasistencia al trabajo. A fin de realizar una comparación significativa de la distribución de ingresos y las faltas, se necesita convertir cada una de esas medidas a un valor relativo, es decir, aun porcentaje.

Kart Pearson (1857 – 1936), contribuyo de manera importante a la ciencia estadística, y desarrolló una medida relativa denominada COEFIENTE DE VARIACION (CV). Es una medida muy útil cuando:

1.- Los datos están en unidades diferentes (como dólares y días de inasistencia)2.- Los datos están en las mismas unidades, pero los valores medios están muy distantes (como sucede con los ingresos de ejecutivos superiores, y los ingresos de empleados no calificados)

COEFICIENTE DE VARIACION: Es la razón (cociente) de la desviación estándar y la media aritmética, expresada como un porcentaje.

En términos de una fórmula para una muestra queda:

Al multiplicar por 100 se convierte la expresión decimal a %

EJEMPLO: Un estudio sobre el monto de bonos pagados y los años de servicio de varios empleados, dio como resultado los siguientes datos estadísticos: la media de los bonos pagados fue $ 200 (dólares), y la desviación estándar fue $ 40. La media del número

86

Page 87: Esta Di Stica

de años de servicio fue 20 años, y la desviación estándar, 2 años. Compare las dispersiones relativas de las dos distribuciones empleando el coeficiente de variación.

Las distribuciones están en unidades diferentes (dólares y años de servicio). Por tanto se convierten en coeficientes de variación.

PARA LOS BONOS

PARA LOS AÑOS DE SERVICIO

Al interpretar se puede ver que existe mayor dispersión relativa con respecto a la media en la distribución de los bonos pagaos en comparación con la distribución de los años de servicio (ya que 20% es mayor que 10%).

EJEMPLOS:1.- Se va a comparar la variación en los ingresos anuales de varios ejecutivos con la variación en los ingresos de trabajadores no calificados. En una muestra de ejecutivos, la media = $ 500.000 (dólares) y S= $ 50.000. Para Una muestra de empleados no calificados la media es = $ 32.000 y S= $ 3200. Uno se ve tentado a afirmar que hay mayor dispersión en los ingresos anuales de los ejecutivos porque $ 50000 es mayor que $ 3200. Sin embargo, las medias son tan distantes que se necesitan convertir los valores estadísticos a coeficientes de variación para poder efectuar una comparación significativa de las variaciones en los ingresos anuales.

PARA LOS EJECUTIVOS:

PARA LOS TRABAJADORES NO CALIFICADOS:

87

Page 88: Esta Di Stica

No existe diferencia en la dispersión relativa de los dos grupos.

ASIMETRIA.-

Se conoce como sesgo el grado de asimetría de una distribución es decir cuando se aparta de la simetría. Si la curva de frecuencias (polígono de frecuencias suavizado) de una distribución tiene a la derecha una cola más larga que a la izquierda, se dice sesgada ala derecha, o de sesgo positivo. En caso contrario, sesgada a la izquierda, o de sesgo negativo.Recuérdese que si una distribución de frecuencias es simétrica, no tiene sesgo – es decir, su asimetría es nula. Si una o más observaciones son sumamente grandes, la media de la distribución se vuelve mayor que la mediana o la moda. En tales casos se dice que la distribución tiene asimetría positiva o sesgo positivo. Por lo contrario, si hay una o más observaciones muy pequeñas, la media es la menor de las tres medidas de tendencia central, y se dice que la distribución tiene asimetría negativa o sesgo negativo. Lo anterior se ilustra en el siguiente gráfico:

88

FRECUENCIA

1,000Media

Mediana

Diámetros exteriores

SIMETRICA

S = 0,09 FRECUENCIA

YY

X

36 38 39Mo Md X

SESGO POSITIVO

Edades

S = 4,0

FRECUENCIA

Y

Tiempo de servicio

S = 3.0

SESGO NEGATIVO

Page 89: Esta Di Stica

COEFIENTE DE ASIMETRIA DE PEARSON:

Kart Pearson desarrolló también una medida, para evaluar el grado de orientación al sesgo, denominada coeficiente de asimetría. Para distribuciones sesgadas, la media tiende a estar del mismo lado de la moda que la cola larga. Luego una medida de asimetría viene dada por la diferencia: media – moda, que puede hacerse adimensional dividiéndola por una medida de dispersión, tal como la desviación típica, lo que lleva a la definición del primer y segundo coeficientes de sesgo de Pearson.

Para evitar el uso de la moda, podemos recurrir a la fórmula empírica y definir:

COEFIENTE DE ASIMETRIA

(DE PEARSON)

COEFIENTE DE ASIMETRIA DE SOFTWARE:

La fórmula permite entender mejor la asimetría. El segundo miembro de la fórmula contiene la diferencia de cada valor respecto de la media, dividida entre la desviación estándar. Esto es la porción de la fórmula. A esto se le lama estandarización. Hay que observar que el resultado de esto es indicar la diferencia entre cada valor y la media, en unidades de la desviación estándar. Si esta diferencia es positiva, el valor de que se trata es mayor que la media; si es negativa, es menor que la media. Cunado se elevan al cubo estos valores, se conserva la información relativa al sentido de la diferencia. Debe recordarse que en la expresión de la

89

POLIGONOS DE FRECUENCIA QUE ILUSTRAN LA ASIMETRIA

X

10 11 13X Md Mo

Page 90: Esta Di Stica

desviación estándar como resultado que todos los valores sean positivos.

Si el conjunto de valores que se considera es simétrico, al elevar al cubo los valores estandarizados y sumarlos se obtendrá un resultado cercano a cero. Si hay varios valores grandes, claramente alejados de los otros, la suma de las diferencias al cubo será un valor positivo grande. Varios valores mucho más pequeños darán como resultado una suma de cubos negativa.

COEFICIENTE DE ASIMETRIA

(SOFTWARE)

EJEMPLO: A continuación se da la ganancia por acción, en el año 2000, de una muestra de 15 empresas productoras de software. Las ganancias se ordenaron de menor a mayor, y son cantidades en dólares.

$0,09

0,13

0,41

0,51

1,12

1,20

1,49

3,18

3,50

6,36

7,83

8,92

10,13

12,99

16,40

Calcule la media, la mediana y la desviación estándar. Encuentre el coeficiente de asimetría usando la estimación de Pearson y los métodos usados por los paquetes de software. ¿Qué se concluye respecto a la forma de la distribución?

MEDIA ARITMETICA

LA MEDIANA:

Es el valor central de los 15 números y es MD= 3,18

LA DESVIACION ESTANDAR:

90

Page 91: Esta Di Stica

COEFICIENTE DE ASIMETRIA PEARSON:

Esto indica que en los datos de las ganancias por acción hay una mediana asimétrica positiva. Usando el método de software se obtiene un resultado simular, pero no exactamente igual

CALCULO DEL COEFIENTE DE ASIMETRIA SOFTWARE.

COEFICIENTE DE AISMETRIA POR SOFTWARE

X

0,09 0,00810,13 0,01690,41 0,16810,51 0,26011,12 1,25441,20 1,441,49 2,22013,18 10,11243,50 12,256,36 40,44967,83 61,30898,92 79,5664

10,13 102,6169

12,99 168,7401

16,40 268,96------------ ------------

74,26 749,3720

Ganancia por

acción0,09 -0,9310 -0,80700,13 -0,9234 -0,78730,41 -0,8697 -0,65790,51 -0,8506 -0,61541,12 -0,7337 -0,39501,20 -0,7184 -0,37081,49 -0,6628 -0,29123,18 -0,3391 -0,03903,50 -0,2778 -0,02146,36 0,2701 0,01977,83 0,5517 0,16798,92 0,7605 0,4399

10,13 0,9923 0,977212,99 1,5402 3,653916,40 2,1935 10,5537

-------------- ------------- -------------------11,8274

91

Page 92: Esta Di Stica

Se concluye que los valores de las ganancias por acción son un poco asimétricos positivamente.

EJERCICIOS PROPUESTOS:

AMPLITUD DE VARIACION

1) HALLAR EL RANGO DE LAS ALTURAS DE LOS ESTUDIANTES DE LA SIGUIENTE TABLA:

ALTURA

Número de estudiantes

60 – 62

5

63 – 65

8

66 – 68

42

69 – 71

27

72 – 74

8

TOTAL 100

2) HALLAR EL RANGO DE LAS CARGAS MÁXIMAS DE:

Carga Máxima

Número de cables

9,3 - 9, 7 29,8 – 10,2 510,3 – 10,7 1210,8 – 11,2 1711,3 – 11,7 1411,8 – 12,2 612,3 – 12,7 312,8 – 13,2 1

TOTAL 60

3) DETERMINAR EL RANGO DE LOS DATOS:a)

Edades (años)

Varones (miles)

Mujeres (miles)

92

Page 93: Esta Di Stica

18 – 19 121 48120 – 24 2441 418425 – 29 5930 695230 – 34 6587 719335 – 44 11788 1189345 – 54 9049 902255 – 64 8749 817165 – 74 5786 4654

75 y más 2581 1524

4) CONSIDERAR LOS DATOS DE PRODUCCIÓN DE TELEVISORES A COLOR DE 20 PULGADAS DURANTE LOS DÍAS DE LA SEMANA DE LUNES A VIERNES, SE HA PRODUCIDO LO SIGUIENTE: 40, 35, 20, 35, 25; HALLAR LA DESVIACIÓN MEDIA.

5) EL NÚMERO DE PACIENTES ATENDIDOS EN LA SALA DE EMERGENCIA DEL HOSPITAL H.C.C., PARA UNA MUESTRA DE 5 DÍAS EN EL MES ANTERIOR FUE: 103, 97, 101, 106, 103. DETERMINA E INTERPRETE LA AMPLITUD TOTAL Y LA DESVIACIÓN MEDIA.

6) HALLAR EL RANGO DE LOS SIGUIENTES CONJUNTOS: 12, 6, 7, 3, 15, 10, 18, 5.

7) LA MAYOR DE 50 MEDIDAS ES 8,34 KG. SI EL RANGO ES 0,46 KG. HALLAR EL MENOR DE ESAS MEDIDAS.

8) LOS PESOS DE UN GRUPO DE CAJAS QUE SE VAN A ENVIAR A IRLANDA SON (EN DÓLARES): 95, 103, 105,110, 104, 104, 112, 90

a) ¿CUÁL ES LA AMPLITUD DE VARIACIÓN DE LOS PESOS?b) CALCULE LA MEDIA ARITMÉTICA DE LOS VALORESc) DETERMINE LA DESVIACIÓN MEDIA DE LOS PESOS.

9) DE LOS SIGUIENTES EJERCICIOS CALCULAR A) LA VARIACIÓN DE AMPLITUD (AT); B) LA MEDIA ARITMÉTICA; C) LA DESVIACIÓN MEDIA; D) INTERPRETAR LA AMPLITUD DE VARIACIÓN Y LA DESVIACIÓN MEDIA.

10) CONSIDERE LOS 5 VALORES SIGUIENTES COMO UNA POBLACIÓN: 8, 3, 7, 3, 4. CALCULAR:

93

Page 94: Esta Di Stica

a) DETERMINAR LA MEDIA DE LA POBLACIÓNb) EVALUÉ LA VARIANZA POBLACIONAL.

11) CONSIDERE LOS SEIS VALORES SIGUIENTES COMO UNA POBLACIÓN: 13, 3, 8, 10, 8 Y 6.

a) CALCULAR LA MEDIA DE LA POBLACIÓNb) HALLE EL VALOR DE LA VARIANZA.

12) LOS CINCO VALORES SIGUIENTES SON UNA MUESTRA 11, 6, 10, 6, 10a) CALCULAR LA MEDIA DE LA POBLACIÓNb) HALLE EL VALOR DE LA VARIANZA.

13) EL EJERCICIO SE REFIERE A LA EMPRESA DAVES, QUE SE DEDICA A INSTALAR MECANISMOS AUTOMÁTICOS PARA ABRIR PUERTAS DE GARAJE. CON BASE EN UNA MUESTRA, LOS SIGUIENTES SON LOS TIEMPOS, EN MINUTOS, REQUERIDOS PARA INSTALAR 10 PUERTAS: 28, 32, 24, 46, 44, 40, 54, 38, 32 Y 28

a) CALCULAR LA MEDIA DE LA POBLACIÓNb) HALLE EL VALOR DE LA VARIANZA.

14) EN UNA MUESTRA DE ESTUDIANTES DE LA FACULTAD DE ADMINISTRACIÓN DE EMPRESAS DE LA UNIVERSIDAD XYZ, LA MEDIA DE LOS PROMEDIOS DE CALIFICACIONES ES 3,10, CON UNA DESVIACIÓN ESTÁNDAR DE 0,25. ¿CALCULE EL COEFICIENTE DE VARIACIÓN?

15) LA EMPRESA TVZ ESTUDIA EL PESO DE EQUIPAJE PARA CADA PASAJERO. EN UN GRUPO GRANDE DE VIAJEROS EN VUELOS NACIONALES, LA MEDIA ES 47 LIBRAS, CON UNA OBSERVACIÓN ESTÁNDAR DE 10 LIBRAS. EN UN GRUPO GRANDE DE PASAJEROS DE VUELOS INTERNACIONALES, LA MEDIA ES 78 LIBRAS Y LA DESVIACIÓN ESTÁNDAR ES DE 15 LIBRAS. CALCULE LA DISPERSIÓN RELATIVA DE CADA GRUPO. COMENTE A CERCA DE LA DIFERENCIA EN DICHA DISPERSIÓN RELATIVA.

94

Page 95: Esta Di Stica

16) A CONTINUACIÓN SE PRESENTAN LOS SUELDOS INICIALES EN MILES DE DÓLARES EN UNA MUESTRA DE CONTADORES QUE TERMINARON SUS ESTUDIOS Y EMPEZARON A TRABAJAR COMO CONTADORES PÚBLICOS EL AÑO PASADO. DE LA SIGUIENTE TABLA:

36, 26, 33, 28, 31

CALCULAR LO SIGUIENTE

a) LOS VALORES DE LA MEDIA, MEDIANA Y DESVIACIÓN ESTÁNDAR

b) DETERMINE EL COEFICIENTE DE ASIMETRÍA USANDO EL MÉTODO DE PEARSON

c) DETERMINE EL COEFICIENTE DE ASIMETRÍA USANDO EL MÉTODO DE SOFTWARE

17) A CONTINUACIÓN SE DAN LOS SALARIOS, EN MILES DE DÓLARES, PARA UNA MUESTRA DE 15 EJECUTIVOS DE LA INDUSTRIA ELECTRÓNICA.

516, 548, 566, 534, 586, 529, 546, 523, 538, 523, 551, 552, 486, 558, 574

CALCULAR LO SIGUIENTE

a) LOS VALORES DE LA MEDIA, MEDIANA Y DESVIACIÓN ESTÁNDAR

b) DETERMINE EL COEFICIENTE DE ASIMETRÍA USANDO EL MÉTODO DE PEARSON

c) DETERMINE EL COEFICIENTE DE ASIMETRÍA USANDO EL MÉTODO DE SOFTWARE

18) A CONTINUACIÓN SE INDICAN LAS COMISIONES (EN MILES DE DÓLARES) OBTENIDOS EL AÑO PASADO POR LOS REPRESENTANTES DE VENTAS DE LA EMPRESA FRUIT, LOS DATOS SON LOS SIGUIENTES:

3,9 5,7 7,3 10,6 13,0 13,6 15,1 15,8 17,1 17,4 17,6 22,338,6 43,2 87,7

95

Page 96: Esta Di Stica

CALCULAR LO SIGUIENTE

a) LOS VALORES DE LA MEDIA, MEDIANA Y DESVIACIÓN ESTÁNDAR

b) DETERMINE EL COEFICIENTE DE ASIMETRÍA USANDO EL MÉTODO DE PEARSON

c) DETERMINE EL COEFICIENTE DE ASIMETRÍA USANDO EL MÉTODO DE SOFTWARE

CAPITULO V

REGRESION LINEAL Y CORRELACION.

¿Qué es un análisis de correlación?

Es el estudio de la relación que existe entre las variables. Para explicar lo anterior supóngase que el gerente de ventas de la compañía XEROX, empresa que tiene una gran fuerza de ventas en todo Ecuador y Perú, desea determinar si existe una relación entre el número de llamadas telefónicas de ventas hechas en un mes, y la cantidad de copiadoras vendidas durante ese lapso. El gerente selecciona al azar una muestra de 10 representantes, y determina el número de tales llamadas que hizo cada uno el mes anterior y la cantidad de productos vendidos. La información muestral tenemos a continuación:

Representantes De ventas

Número de llamadas

Número de Copiadoras vendidas

Juan 20 30Pedro 40 60Luís 20 40Jorge 30 60Rocío 10 30Karina 10 40José 20 40

Antonio 20 50Oswaldo 20 30

Nube 30 70

96

Page 97: Esta Di Stica

Para haber cierta relación entre el número de llamadas y la cantidad de unidades vendidas. Esto es, el agente que realizó el mayor número de llamadas vendió más copiadoras. Sin embargo, la relación no es “perfecta” o exacta Por ejemplo Nube Hizo menos llamadas que Pedro, pero ella vendió más unidades.

En vez de hablar en lo general, como se ha hecho hasta ahora, se desarrollarán algunas medidas estadísticas para presentar en forma más precisa la relación entre las dos variables: llamadas de ventas y copiadoras vendidas. A este conjunto de técnicas estadísticas se le denomina análisis de correlación.

ANALISIS DE CORRELACION: Conjunto de técnicas estadísticas empleado para medir la intensidad de la asociación entre dos variables.

El principal objetivo del análisis de correlación consiste en determinar qué tan intensa es la relación entre dos variables. Normalmente, el primer paso es mostrar los datos en un diagrama de dispersión.

DIAGRAMA DE DISPERSION: Gráfica que representa la relación entre dos variables.EJEMPLO:

La empresa XEROX, vende copiadoras a negociaciones grandes, medianas y pequeñas en Ecuador y Perú. La señorita Mónica Tello fue promovida recientemente al puesto de gerente nacional de ventas. A la próxima junta de ventas asistirán los representantes de todo el país. A ella le gustaría hacerles notar la importancia de hacer llamadas extra cada día, Decide reunir alguna información acerca de la relación entre el número de llamadas y el número de productos vendidos. Seleccionó al azar una muestra de 10 representantes y determinó el número de llamadas que

97

Page 98: Esta Di Stica

hicieron el último mes, y el de copiadoras que vendieron. La información muestral se tiene en la tabla siguiente:

Representantes De ventas

Número de llamadas

Número de Copiadoras vendidas

Juan 20 30Pedro 40 60Luís 20 40Jorge 30 60Rocío 10 30Karina 10 40José 20 40

Antonio 20 50Oswaldo 20 30

Nube 30 70-------------- ---------- ------------------

220 450

¿Qué observaciones puede hacer usted acerca de la relación entre el número de llamadas y la cantidad de copiadoras vendidas? Trace un diagrama de dispersión para representar esta información.

SOLUCION AL PROBLEMA:

La señorita Tello sospecha que existe una relación entre el número de llamadas hechas en un mes, y la cantidad de copiadoras que se vendieron. Nube vendió el mayor número de unidades el mes anterior, y era una de las tres representantes que hizo 30 o más llamadas. Por otra parte, Rocío y Karina correspondieron al menor número de copiadoras vendidas entre los representantes en la muestra.

La deducción es que el número de copiadoras vendidas tiene relación con la cantidad de llamadas realizadas. A medida que aumenta el número de llamadas telefónicas crece la cantidad de unidades vendidas. El número de llamadas de venta se denomina variable independiente, y la cantidad d copiadoras vendidas, variable dependiente.

VARIABLE DEPENDIENTE: La variable que se predice o calcula

98

Page 99: Esta Di Stica

VARIABLE INDEPENDIENTE: Una variable que proporciona las bases para el cálculo. Es la variable de predicción (suposición).

Con los datos anteriores graficar el diagrama de dispersión.

COPIADORAS VENDIDAS (Y)

0

20

40

60

80

0 5 10 15 20 25 30 35 40 45

Llamadas teléfonicas

Un

idad

es v

end

idas

El diagrama de dispersión indica gráficamente que los representantes de ventas que hacen más llamadas telefónicas, tienden a vender más copiadoras. Es razonable que la señorita Tello, la gerente nacional de ventas de la empresa mencionada, diga sus representantes que cuanto mayor sea el número de llamadas a clientes que hagan, más copiadoras podrán esperar vender. Obsérvese que aunque parece existir una relación positiva entre las dos variables, no todos los puntos quedan en una misma línea recta.

Del mismo ejemplo, primeramente calculamos la media aritmética de X y la media aritmética de Y, que resultan los valores

Estas dos rectas pasan por el centro de los datos y dividen al diagrama de dispersión en cuatro cuadrantes. Puede considerarse que origen el origen se desplaza de (0,0) a (22,45). Si la relación entre las dos variables es positiva, entonces el número de copiadoras vendidas es mayor que la

99

Page 100: Esta Di Stica

media, el número de llamadas a clientes también será mayor que la media

COEFICIENTE DE CORRELACIÓN:

Originado por el investigador Kart Pearson, el coeficiente de correlación describe la intensidad de la relación entre dos conjuntos de variables de nivel de intervalo (o variables de nivel de relación o razón). Se le denota por la letra “r”. Puede tomar cualquier valor de -1 a +1, inclusive. Un coeficiente de correlación de -1 o de +1 indica una correlación perfecta. Por ejemplo, un coeficiente de correlación para el ejemplo anterior calculado como +1, señalaría que el número de llamadas era un pronóstico perfecto de la cantidad de copiadoras vendidas. Esto es, el número de telefonemas y el de productos vendidos están perfectamente relacionados en un sentido lineal positivo. Un valor -1 indicaría que las llamadas a clientes y el número de copiadoras vendidas están perfectamente relacionadas en un sentido lineal negativo. La forma como quedaría el diagrama de dispersión si la relación entre ambos conjuntos de datos fuera lineal y perfecta

Si no existe en absoluto alguna relación entre los dos conjuntos de variables, la “r” de Pearson será cero. Un coeficiente de correlación “r” cercano a cero (por ejemplo 0,08) indica que la relación es muy débil. Se llega a la misma conclusión si r = -0,08. Coeficientes de – 0,91 y +0,91 tienen igual fuerza; ambos indican una correlación muy intensa entre

Correlación negativa perfecta Y

La línea tienePendiente negativa

. . . .

.r = -1 .

.. X

Correlación positiva perfectaY

r = +1 . . . . .

La línea tiene . Pendiente positiva

. X

Diagramas de dispersión que ilustra una correlación negativa perfecta y una correlación positiva perfecta

100

Page 101: Esta Di Stica

los dos conjuntos de variables. De modo que la fuerza de la correlación no depende de la dirección (ya sea – o +).

En el siguiente gráfico se muestran diagramas de dispersión para r = 0; una r débil r = -0,23 y una r fuerte r = + 0,87.

El siguiente cuadro resume la intensidad y la dirección del coeficiente de correlación:

Correlación ceror = 0

X y Y no tienen relación lineal.

……………….……………….……………….……………….……………….……………….……………….

SALARIO

ANUAL

Número de hijos

Correlación negativa y débil(X y Y tienen cierta relación lineal)

. . . . . . .. … . . . . . . . .. .. . . . . .. .. . . . . . … …. …. … . . .. . .. . … .. .. .. .. . . . . .. . .. .. . . . . . . ...

Cantidad vendida Precio

Correlación positiva y fuerte (X y Y tienen una relación lineal intensa

. . . . . .. . . . . . . . . . . . . . . .. . . . . . . …… …

GPA

Universitario GPA Bachillerato

101

Page 102: Esta Di Stica

COEFICIENTE DE CORRELACION: Medida de la intensidad de la relación lineal entre dos variables.

Tienen dos fórmulas:

1. COEFICIENTE DE CORRELACION

FORMA CONCEPTUAL.

2. COEFICIENTE DE CORRELACIONFORMA DIRECTA

Donde:

n = Es el número de pares de observaciones =Es la suma de los valores de la variable X= Es la suma de los valores de la variable Y

= Es la suma de los cuadrados de los valores de la variable X

= Es el cuadrado de la suma de los valores de la variable X

= Es la suma de los cuadrados de los valores de la variable Y

Correlación CorrelaciónNegativa Sin positivaPerfecta Correlación perfecta

Correlación Correlación Correlación Correlación Correlación Correlación Negativa negativa negativa positiva positiva positiva Intensa moderada débil débil moderada intensa

- 1 - 0,50 0 + 0,50 + 1

Correlación negativa Correlación positiva

102

Page 103: Esta Di Stica

= Es el cuadrado de la suma de los valores de la variable Y

= Suma de los productos de X y Y.

Para la primera fórmula tenemos que calcular primeramente la desviación estándar tanto de X como de Y

Trabajadores X Y X2 Y2 XY      

Juan 20 30 400 900 600 -2,0000 -15 30

Pedro 40 60 1600 3600 2400 18,0000 15 270

Luis 20 40 400 1600 800 -2,0000 -5 10

Jorge 30 60 900 3600 1800 8,0000 15 120

Rocio 10 30 100 900 300 -12,0000 -15 180

Karina 10 40 100 1600 400 -12,0000 -5 60

José 20 40 400 1600 800 -2,0000 -5 10

Antonio 20 50 400 2500 1000 -2,0000 5 -10

Oswaldo 20 30 400 900 600 -2,0000 -15 30

Nube 30 70 900 4900 2100 8,0000 25 200                 TOTAL 220 450 5600 22100 10800     900

22

45

n = 10

Primer MétodoConceptual

103

XX YYXX

n

XX

n

YY

Page 104: Esta Di Stica

Segundo método directo

r = 0,76

¿Cómo se interpreta un coeficiente de correlación igual a 0,76? Primero es positivito, de manera que se ve que hay una relación directa entre el número de llamadas a clientes y la cantidad de copiadoras vendidas. El valor de 0,76 está bastante cercano a +1, por lo que se concluye que la relación es fuerte. Dicho de otra manera, un aumento de 25% en las llamadas posiblemente llevaría a un aumento de 25% en las ventas.

COEFICIENTE DE DETERMINACIÓN: En el ejemplo anterior respecto a la relación entre el número de llamadas telefónicas y la cantidad de productos vendidos, el coeficiente de correlación r = 0,76, se interpretó como “fuerte”. Sin embargo, los términos como débil, moderado y fuerte no tienen significado preciso. Una media que tiene una acepción (significado), más fácil de interpretar es el coeficiente de determinación. Se calcula elevando al cuadrado el coeficiente de correlación. Para el ejemplo, dicho coeficiente de determinación, , vale 0,58, que proviene de . Esta es una proporción o porcentaje, puede decirse que 58% de la variación en el número de copiadoras vendidas se explica por la variación en el número de llamadas a los clientes.

DEFINICION: La porción de la variación total en la variable dependiente Y, que se explica por la variación en la variable independiente X.

104

2

4502210010*2

220560010

4502201080010

r

2222 *

YYnXXn

YXXYnr

Page 105: Esta Di Stica

ANALISIS DE REGRESIÓN:

En la tabla anterior se presenta el número de llamadas telefónicas y cantidad de unidades vendidas para una muestra de 10 representantes de ventas de la empresa XEROX. El diagrama muestra esta información en un diagrama de dispersión. Ahora se desarrolla una ecuación lineal que exprese la relación entre el número de llamadas a clientes y la cantidad de unidades vendidas. La ecuación de la línea recta empleada para calcular Y, con base en X, se conoce como ecuación de regresión.

DEFINICION: Es una ecuación que define la relación lineal entre dos variables.

La forma general de la ecuación de regresión lineal es:

Donde:

= Se lee Y prima, es el valor pronosticado de la variable Y para un valor seleccionado de X.a = Es la ordenada de la intersección con el eje Y, es decir, el valor estimado de cuando X = 0. Dicho de otra forma, corresponde al valor estimado de Y, donde la recta de regresión cruza el eje Y, cuando X=0

b = Es la pendiente de la recta, o el cambio promedio en por unidad de cambio (incremento o decremento) en la variable independiente X.

X = Es cualquier valor seleccionado de la variable independiente.

Debe observarse que la ecuación de regresión lineal para la muestra de vendedores es sólo una estimación de la relación entre las dos variables en la población. De modo que la

105

Page 106: Esta Di Stica

regresión estimada, o simplemente coeficiente de regresión queda con las siguientes fórmulas.

1.- PENDIENTE DE LA

LINEA DE REGRESION

2.- PUNTO DONDE SE

INTERCEPTA CON EL

EJE Y

Donde:X = Es un valor de la variable independienteY = Es un valor de la variable dependienten = Es el número de elementos en la muestra.

EJEMPLO:Volviendo al ejemplo anterior de la compañía XEROX, la gerente de ventas recopiló información respecto al número de llamadas telefónicas hechas y la cantidad de copiadoras vendidas, para una muestra aleatoria de 10 representantes de ventas. Como parte de su presentación en la próxima junta de ventas, a la señorita Tello, gerente de esa área, le gustaría ofrecer información especifica referente a la relación entre el número de llamadas y la cantidad de productos vendidos. ¿Cuál es el número esperado de copiadoras vendidas por un representante que realiza 20 llamadas a sus clientes?

Trabajadores X Y X2 Y2 XY

Juan 20 30 400 900 600

Pedro 40 60 1600 3600 2400

Luís 20 40 400 1600 800

Jorge 30 60 900 3600 1800

Rocío 10 30 100 900 300

Karina 10 40 100 1600 400

José 20 40 400 1600 800

Antonio 20 50 400 2500 1000

106

Page 107: Esta Di Stica

Oswaldo 20 30 400 900 600

Nube 30 70 900 4900 2100           TOTAL 220 450 5600 22100 10800

22

45

n = 10

Por lo tanto, la ecuación de regresión es . De modo que si un vendedor hace 20 llamadas telefónicas, puede esperarse que venda 42,6316 copiadoras, valor que se obtiene de .

El valor de b = 1,1842 significa que para cada llamada adicional que realizan los representantes de ventas pueden esperar aumentar en casi 1,2 el número de copiadoras vendida. Para decirlo de otra forma, cinco llamadas extra en un mes resultarán en casi seis copiadoras vendidas adicionalmente.

El valor de a = 18,9476 es el punto donde la ecuación cruz el eje Y. Una traducción literal es que si no se hacen llamadas, esto es, X = 0, Se venderán 18,9476 copiadoras. Obsérvese que X = 0 se encuentra fuera del intervalo de valores incluidos en la muestra y, por tanto, no debe emplearse para calcular el número de productos vendidos. Las llamadas a clientes fueron de 10 a 40, así que los cálculos se den hacer dentro de esa gama de valores.

TRAZO DE LA LINEA DE REGRESION:

107

Page 108: Esta Di Stica

La ecuación , se puede graficar en el diagrama de dispersión. El primer representante de ventas en la muestra, quien hizo 20 llamadas telefónicas, y así sucesivamente con cada uno de los agentes de ventas multiplicando por la cantidad que le corresponda; luego esto se grafica en el diagrama de dispersión con los valores de X y los valores de Y y de

Trabajadores X    

Juan 20   42,6316

Pedro 40   66,3156

Luís 20   42,6316

Jorge 30   54,4736

Roció 10   30,7896

Karina 10   30,7896

José 20   42,6316

Antonio 20   42,6316

Oswaldo 20   42,6316

Nube 30   54,4736       TOTAL 220 0  

a = 18,9476b = 1,1842

Tal recta tiene características interesantes. Según se análizo, no existe otra línea recta que pase por los datos y tenga una suma de desviaciones al cuadrado que sea menor. Además, esta recta pasará por los puntos representados por las medias respectivas de los valores X y Y, esto es

108

Page 109: Esta Di Stica

EL ERROR ESTANDAR DE ESTIMACION:

Obsérvese en el gráfico de dispersión anterior que no todos los puntos quedan con exactitud en la recta de regresión. Si todos hubieran quedado en la línea y si el número de observaciones hubiera sido suficientemente grande, no existiría error en el cálculo del número de unidades vendidas. Dicho de otra forma, si todos los puntos estuvieran en la recta de regresión, las unidades vendidas podrían pronosticarse con una precisión del 100%. Entonces no habría error al pronostica la variable Y con base en la variable X.

Obtener una predicción perfecta en los aspectos de economía y administración es prácticamente imposible. Por ejemplo, los ingresos anuales provenientes de ventas de gasolina (Y) con base en los registros de automóviles (x) hasta cierta fecha, sin duda podrían aproximarse con gran exactitud, pero el pronóstico no sería preciso con redondeo a unidades monetarias enteras, o tal vez hasta el millar de unidades monetarias. Entonces, lo que se necesita es una medida que indique qué tan preciso es el pronóstico de Y con base en X o, por el contrario, cuán inexacta podría ser la predicción. A esta medida se le denomina ERROR ESTÁNDAR DE ESTIMACION, el cual se representa por

DEFINICION: Medida de la dispersión de los valores observados, con respecto a la línea de regresión.

FORMULA DEL ERROR ESTANDAR DE ESTIMACIÓN:

PRIMER MÉTODO

Si la suma de los cuadrados de las desviaciones es pequeña, esto significa que la línea de regresión es representativa de los datos. Si los cuadrados de las desviaciones son grandes,

109

Page 110: Esta Di Stica

entonces la recta de regresión puede no representar a los datos.

Ventas reales

Ventas calculadas   Desviación Desviación al cuadrado

Trabajadores Y       

Juan 30   42,6316 -12,6316 159,557

Pedro 60   66,3156 -6,3156 39,887

Luís 40   42,6316 -2,6316 6,925

Jorge 60   54,4736 5,5264 30,541

Rocío 30   30,7896 -0,7896 0,623

Karina 40   30,7896 9,2104 84,831

José 40   42,6316 -2,6316 6,925

Antonio 50   42,6316 7,3684 54,293

Oswaldo 30   42,6316 -12,6316 159,557

Nube 70   54,4736 15,5264 241,069           TOTAL 450     0 784,211

a = 18,9476b = 1,1842

La fórmula para el error estándar de estimación

sirve para mostrar la semejanza que existe, en concepto y cálculo, entre la desviación estándar y el error estándar de

estimación

FORMULA DEL ERROR ESTANDAR DE ESTIMACIÓN:

SEGUNDO MÉTODO

110

Page 111: Esta Di Stica

Trabajadores Número de Número de    llamadas copiadoras     (X*Y)  X Y      

Juan 20 30 400 900 600

Pedro 40 60 1600 3600 2400

Luís 20 40 400 1600 800

Jorge 30 60 900 3600 1800

Rocío 10 30 100 900 300

Karina 10 40 100 1600 400

José 20 40 400 1600 800

Antonio 20 50 400 2500 1000

Oswaldo 20 30 400 900 600

Nube 30 70 900 4900 2100           TOTAL 220 450     10800

a = 18,9476b = 1,1842

INTERVALOS DE CONFIANZA Y DE PREDICCIÓN:

El error estándar de estimación también se utiliza para establecer intervalos de confianza cuando el tamaño de la muestra es grande y la dispersión con respecto a la línea de regresión se aproxima ala distribución normal. En el ejemplo relacionado con el número de llamadas telefónicas y la cantidad de copiadoras vendidas, el tamaño de la muestra es pequeño; por tanto, se necesita un factor de corrección que considere el tamaño de la muestra. Además, al alejarse del valor medio de la variable independiente, los cálculos están sujetos a mayor variación, y esto también se debe corregir.

111

Page 112: Esta Di Stica

1.- El primero, denominado INTERVALO DE CONFIANZA, presenta el valor medio de Y para un valor dado de X.

2.- El segundo tipo se conoce como INTERVALO DE PREDICCIÓN e informa acerca de la gama de valores de Y para un valor particular de X.

1.- INTERVALO DE

CONFIANZA

Donde:

`=Es el valor pronosticado para cualquier valor X seleccionadoX = Es cualquier valor seleccionado

= Es la media de las X, evaluada mediante

n = Es el número de observaciones = Es el error estándar de estimación

t = Es un valor tomado para n – 2 grados de libertad del apéndice del libro.

Ejemplo: Con los datos del ejemplo anterior de llamadas telefónicas y venta de copiadoras calcular el intervalo de confianza. Cuando se hacen 25 llamadas y el valor de t = 2,306

En este caso multiplicamos por 25 que son las llamadas telefónicas y nos queda:

t = 2,306 = 9,901

n = 10X = 25 son las llamadas telefónicas que se dan para calcular los intervalos.

= 22; media aritmética que se calculo al inicio del problema.

112

Page 113: Esta Di Stica

= 5600 = 220

48,5526 + 7,6356 = 56,1948,5526 – 7,6356 = 40,92

Por tanto, el intervalo de confianza de 95% para todos los representantes de ventas que realizan 25 llamadas telefónicas va desde 40,9170 hasta 56,1882. Para interpretarlo se redondean los valores. Si un vendedor hace 25 telefonemas, puede esperar vender 48,6 copiadoras. Es probable que sus ventas varíen de 40,9 a 56,2 de tales máquinas.

2.- INTERVALO DE

PREDICCION

Donde:

`=Es el valor pronosticado para cualquier valor X seleccionadoX = Es cualquier valor seleccionado

= Es la media de las X, evaluada mediante

n = Es el número de observaciones = Es el error estándar de estimación

113

Page 114: Esta Di Stica

t = Es un valor tomado para n – 2 grados de libertad del apéndice del libro.

Ejemplo: Con los datos del ejemplo anterior de llamadas telefónicas y venta de copiadoras calcular el intervalo de predicción. Cuando se hacen 25 llamadas y el valor de t = 2,306

En este caso multiplicamos por 25 que son las llamadas telefónicas y nos queda:

t = 2,306 = 9,901

n = 10X = 25 son las llamadas telefónicas que se dan para calcular los intervalos.

= 22; media aritmética que se calculo al inicio del problema.

= 5600 = 220

48,5526 + 24,0746 = 72,627248,5526 – 24,0746 = 24,4780

El intervalo va desde 24,478 hasta 72,627 copiadoras. Se concluye que el número de productos vendidos se encontrará entre aproximadamente 24 y 73 para un representante de ventas en particular. Este intervalo es muy grande. Es mucho mayor que el intervalo de confianza para todos los vendedores que hicieron 25 llamadas. Sin embargo, es lógico

114

Page 115: Esta Di Stica

que exista mayor variación en el estimado de ventas para un individuo que para un grupo.

ALGO MÁS ACERCA DEL COEFICIENTE DE DETERMINACION:

La fórmula

Es una expresión conveniente para calcular el coeficiente de correlación. El coeficiente de determinación se obtuvo elevando al cuadrado el coeficiente de correlación.

FORMULA:

COEFICIENTE DE

DETERMINACION

Para examinar más de cerca el concepto básico del coeficiente de determinación, supóngase que interesa la relación entre los años de permanencia en el trabajo (X), y la producción semanal (Y). Los datos muestrales son los siguientes

Empleado

Años de servicio

(X)

Producción

(Y)

X*Y X^2

Jorge 14 6 84 196Oswaldo 7 5 35 49José 3 3 9 9Antonio 15 9 135 225Karina 11 7 77 121TOTAL 50 30 34

0600

Primeramente calculamos , con las fórmulas siguientes:

115

Page 116: Esta Di Stica

Entonces nos queda:

Calculamos para cada valor de X que tenemos en la tabla anterior y nos queda.

Empleado

Años de servicio

(X)

Producción

(Y)

X*Y X^2

Jorge 14 6 84 196 7,6

Oswaldo 7 5 35 49 4,8

José 3 3 9 9 3,2

Antonio 15 9 135 225 8Karina 11 7 77 121 6,

4TOTAL 50 30 34

0600

Luego graficamos en el diagrama de dispersión:

116

Page 117: Esta Di Stica

Comparación de años de servicio con la producción semanal

0

5

10

0 5 10 15 20

Años de servicio

Pro

du

cció

n

sem

anal Serie1

Serie2

Empleado

Años de servicio

(X)

Producción

(Y)Jorge 14 6 7,

6-1,6 2,56

Oswaldo 7 5 4,8

0,2 0,04

José 3 3 3,2

- 0,2 0,04

Antonio 15 9 8 1 1Karina 11 7 6,

40,6 0,36

TOTAL 50 30 0 4Nota *) SIEMPRE DEBE SER CERO (0)

Supóngase que ahora se conoce solo Y; entonces debemos

calcular la media aritmética de Y

Empleado

Producción(Y)

Media aritmética

De YJorge 6 6 0 0

Oswaldo 5 6 - 1 1José 3 6 - 3 9

Antonio 9 6 3 9Karina 7 6 1 1TOTAL 30 20

Nota *) SIEMPRE DEBE SER CERO (0)

Entonces se aplica la fórmula del coeficiente de determinación que es igual a:

117

Page 118: Esta Di Stica

El 80% de la variación en la producción semanal (Y), esta determinado o explicado por su relación lineal con los años de permanencia en el trabajo (X).

EJERCICIOS PROPUESTOS:

1)SE SELECCIONARON AL AZAR LAS SIGUIENTES OBSERVACIONES DE MUESTRA.

X Y 4 45 63 56 710 728 29

a)ESTABLEZCA LA ECUACIÓN DE REGRESIÓN b)OBTENGA EL VALOR DE Y' CUANDO X VALE 7

2)SE SELECCIONARON AL AZAR LAS SIGUIENTES OBSERVACIONES MUÉSTRALES.

X Y 5 133 156 73 124 134 116 98 539 85

a)DETERMINE LA ECUACIÓN DE REGRESIÓNb)OBTENGA EL VALOR DE Y' CUANDO X ES 7

3)UN RECIENTE ARTÍCULO EN BUSINESS WEEK PRESENTÓ UNA LISTA DE LAS “MEJORES COMPAÑÍAS PEQUEÑAS”. HAY INTERÉS EN LOS

118

Page 119: Esta Di Stica

RESULTADOS ACTUALES DE LAS VENTAS Y GANANCIAS DE LAS EMPRESAS. SE SELECCIONÓ UNA MUESTRA ALEATORIA DE 12 COMPAÑÍAS. A CONTINUACIÓN SE INDICA LAS VENTAS Y GANANCIAS, EN MILLONES DE DÓLARES.

Compañía Ventas (mil.US$)

Ganancias(mil. US$)

Papa John's International

$89.2 $4.9

Applied Innovation

$18.6 $4.4

Integracare $18.2 $1.3Wall Data $71.7 $8.0Davidson Associates

$58.6 $6.6

chico's Fas $46.8 $4.1Checkmate Electronics

$17.5 $2.6

Royal Grip $11.9 $1.7M-wave $19.6 $3.5

Serving-N-Slide $51.2 $8.2Dais $28.6 $6.0

Cobra Golf $69.2 $12.8501.1 64.1

LAS VENTAS SERÁN LA VARIABLE INDEPENDIENTE Y LAS GANANCIAS LA VARIABLE DEPENDIENTE.

a)TRACE UN DIAGRAMA DE DISPERSIÓN b)CALCULE EL COEFICIENTE DE CORRELACIÓN c) COEFICIENTE DE CORRELACIÓN CONCEPTUALd)EVALUÉ EL COEFICIENTE DE DETERMINACIÓN e)DETERMINE LA ECUACIÓN DE REGRESIÓNf) CALCULE LAS GANANCIAS DE UNA COMPAÑÍA

PEQUEÑA CON 50 MILLONES DE DÓLARES EN VENTAS

4)SE ESTUDIAN LOS FONDOS DE BONOS MUTUALES PARA INVERTIR EN ELLOS. ESTE ANÁLISIS EN PARTICULAR SE CENTRA EN LOS ACTIVOS DE UN FONDO Y SU RENDIMIENTO A CINCO AÑOS. LA PREGUNTA ES ¿PUEDE CALCULARSE LA TAZA DE RENDIMIENTO A CINCO AÑOS EN LOS ACTIVOS DEL FONDO? SE SELECCIONARON 9 MUTUALIDADES AL

119

Page 120: Esta Di Stica

AZAR Y A CONTINUACIÓN SE MUESTRAN SUS ACTIVOS Y TASAS.

a)TRACE UN DIAGRAMA DE DISPERSIÓN b)CALCULE EL COEFICIENTE DE CORRELACIÓN c) COEFICIENTE DE CORRELACIÓN CONCEPTUALd)EVALUÉ EL COEFICIENTE DE DETERMINACIÓN e)DETERMINE LA ECUACIÓN DE REGRESIÓN.

UTILICE LOS ACTIVOS COMO LA VARIABLE INDEPENDIENTE.

f) ESTABLEZCA LA TASA DE RENDIMIENTO EN CINCO AÑOS (EN PORCENTAJE) DE UN FONDO CON 400 MILLONES DE DÓLARES EN VENTAS

5.- DEL EJERCICIO CALCULAR LO SIGUIENTE:

a. EVALUÉ EL ERROR ESTÁNDAR DE ESTIMACIÓN b. SUPÓNGASE QUE SE SELECCIONA UNA MUESTRA

AGRANDE EN VES DE SOLO 10

Nº de habitaciones

Consumo(Miles/Kwh)

12 99 7

14 106 5

10 8

Fondos Activos(mil dolares)

(X)

Rendimiento(%)(Y)

AARP Hig Quality Bond $622.2 10.8Babson Bond L $160.4 11.3Compass Capital Fixed Income

$275.7 11.4

Galaxi Bond Rentail $433.2 9.1Keystone Custodian B-1 $437.9 9.2MFS Bond A $494.5 11.6Nichols Income $158.3 9.5T. Raive Price Short-term $681.0 8.2Thompson Income B $241.3 6.8

33089.1 87.9

120

Page 121: Esta Di Stica

8 610 810 105 47 7

91 74

6.- DEL EJERCICIO CALCULAR:

a- DETERMINE EL ERROR ESTÁNDAR DE ESTIMACIÓNb- SUPÓNGASE QUE SE SELECCIONA UNA MUESTRA

GRANDE (EN VEZ DE ÚNICAMENTE 10 SE SEÑALO 13) ¿ENTRE QUE PAR DE VALORES ESTARÍA APROXIMADAMENTE EL 95% DE LAS PREDICCIONES REFERENTES A LAS VENTAS?

# de contactos

Ventas miles de ($)

x y14 2412 1420 2816 3046 8023 3048 9050 8555 12050 110

334 611

121

Page 122: Esta Di Stica

7.- DEL EJERCICIO DETERMINAR: EL ERROR ESTÁNDAR DE ESTIMACIÓN.

Ciudad Policía#

delitosx y

Quito 15 17Guayaquil 17 13Cuenca 25 5Manta 27 7

Portoviejo 17 7Azogues 12 21Ambato 11 19

Riobamba 22 6n=8 146 95

8.- DEL EJERCICIO DETERMINAR:

a. DETERMINE EL INTERVALO DE CONFIANZA 95 PARA EL VALOR MEDIO PRONOSTICADO CUANDO X = 7 Y EL VALOR CONSTANTE ES DE 2,365

b. ESTABLEZCA EL INTERVALO DE PREDICCIÓN 0.95 PARA UN VALOR INDIVIDUAL PRONOSTICADO CUANDO X = 7 Y EL VALOR CONSTANTE T = 2,365

X Y4 45 63 56 710 728 29

9.- DEL EJERCICIO DETERMINAR a).- OBTENGA EL INTERVALO DE CONFIANZA DE 95 PARA EL VALOR MEDIO PRONOSTICADO CUANDO X = 10. T = 2,447.b) INTERVALO DE PREDICCIÓN PARA EL VALOR PRONOSTICADO CUANDO X = 10 Y T = 2,447

Ciudad Policía #

122

Page 123: Esta Di Stica

delitosx y

Quito 15 17Guayaquil 17 13Cuenca 25 5Manta 27 7

Portoviejo 17 7Azogues 12 21Ambato 11 19

Riobamba 22 6n=8 146 95

10.- DEL EJERCICIO DETERMINAR:

# de habitacionesconsumo (miles de

kwh)12 99 7

14 106 5

10 88 6

10 810 105 47 7

91 74

a) HALLE EL INTERVALO DE CONFIANZA 0.95, EN MILES DE KILOWATTS-HORA, PARA LA MEDIA DE TODAS LAS CASAS CON SEIS HABITACIONES Y T = 2,306b) DETERMINE EL INTERVALO DE PREDICCIÓN 0.95, EN MILES DE KILOWATTS-HORA, PARA LA MEDIA DE TODAS LAS CASAS CON SEIS HABITACIONES EN PARTICULAR.

11.- DEL EJERCICIO: EL NÚMERO DE ACCIONES DE LA EMPRESA ICOM. INC. QUE VARIARON DURANTE UN MES Y EL PRECIO AL FINAL DEL MES, SE ENLISTAN EN LA SIGUIENTE TABLA. ADEMÁS, SE DAN LOS PUNTOS Y´ EN LA RECTA QUE PASA POR LOS DATOS OBSERVADOS.

Movimiento (X)

precio actual (Y)

123

Page 124: Esta Di Stica

4 21 15 43 22 115 10

A) ELABORE UN DIAGRAMA DE DISPERSIÓN Y HAGA PASAR UNA LÍNEA RECTA A TRAVÉS DE LOS PUNTOS.B) CALCULE EL COEFICIENTE DE DETERMINACIÓN.C) COMO VERIFICACIÓN, UTILICE LA FORMULA PARA R.D) INTERPRETE EL COEFICIENTE DE DETERMINACIÓN.

124