apuntes de estadistica

64
UNIDAD I Definición de Estadística Es aquella que se encarga de los, métodos científicos para recolectar, organizar, reunir, presentar y analizar datos. Con el objetivo de tener una mejor toma de decisiones de acuerdo con la muestra analizada. Tipos de Estadística. A la parte de la Estadística que busca únicamente describir y analizar un gripo determinado de datos sin obtener conclusiones validas recibe el nombre de Estadística inductiva o inferencial. Al recolectar datos que determina las características de un grupo de individuos u objetos, por ejemplo las estaturas y los pesos de los estudiantes de una universidad o la cantidad de piezas defectuosas y no defectuosas producidas en una fabrica durante un día determinado, muchas veces es imposible o impráctico observara todo el grupo, especialmente si este es demasiado grande. En lugar de examinar a todo el grupo que recibe el nombre de población o universo se examina una pequeña parte a la que se le llama muestra de la población. Una población puede ser finita o infinita, es decir; la población que comprende todas las piezas producidas en un día determinado por una fábrica es finita, mientras que la población que consta de todos los resultados posibles en el

Transcript of apuntes de estadistica

Page 1: apuntes de estadistica

UNIDAD I

Definición de Estadística

Es aquella que se encarga de los, métodos científicos para recolectar,

organizar, reunir, presentar y analizar datos. Con el objetivo de tener una mejor

toma de decisiones de acuerdo con la muestra analizada.

Tipos de Estadística.

A la parte de la Estadística que busca únicamente describir y analizar un gripo

determinado de datos sin obtener conclusiones validas recibe el nombre de

Estadística inductiva o inferencial.

Al recolectar datos que determina las características de un grupo de individuos

u objetos, por ejemplo las estaturas y los pesos de los estudiantes de una

universidad o la cantidad de piezas defectuosas y no defectuosas producidas

en una fabrica durante un día determinado, muchas veces es imposible o

impráctico observara todo el grupo, especialmente si este es demasiado

grande. En lugar de examinar a todo el grupo que recibe el nombre de

población o universo se examina una pequeña parte a la que se le llama

muestra de la población.

Una población puede ser finita o infinita, es decir; la población que comprende

todas las piezas producidas en un día determinado por una fábrica es finita,

mientras que la población que consta de todos los resultados posibles en el

lanzamiento sucesivo de una moneda (águila o sol) es infinita.

Variables discretas y variables continuas.

Una variable es un símbolo, y se representa con las letras latinas mayúsculas

H, A, B, J, Y, etc. Si la variable solo toma un valor entonces recibe el nombre

de constante. A la variable que toma cualquier valor, entre 2 valores dados

recibe el nombre de variable continua, si no es así se denomina variable

discreta.

Ejemplo: De acuerdo con los siguientes enunciados indicar el tipo de variable

que corresponde.

Page 2: apuntes de estadistica

El número de niños en una familia.-VARIABLE DISCRETA

La altura H de un individuo registrada en centímetros. VARIABLE CONTINUA

El número de acciones vendidas por día en la bolsa de valores. VARIABLE

DISCRETA.

Las temperaturas registradas cada 13 horas en un observatorio. VARIABLE

CONTINUA

El ingreso semestral de los `profesores universitarios.-VARIABLE DISCRETA

El tiempo de vida de una lámpara incandescente. VARIABLE CONTINUA.

INSTRUCCIONES: Realice cada una de las operaciones indicadas. Redondear

el resultado a 3 decimales.

a) 48.0 x 943=45,264

b) 8.35 / 98=0.085

c) (28)(4,193)(182)=21,367,528

d) [(526.7)(0.001280)]/0.000034921=19,305.747

e) ¶√71.35= 26.537

f) √128.5-89.24=6.266

La siguiente tabla muestra el número de celemines medida de volumen

equivalente a 4.625 litros en especial de granos de trigo y de maíz producidas

por una granja de 1997 a 2007.

AÑO# DE CELEMINES DE

MAIZ

# DE CELEMINES DE

TRIGO

1997 200 75

1998 185 90

1999 225 100

2000 250 85

2001 240 80

2002 195 100

2003 210 110

2004 225 105

Page 3: apuntes de estadistica

2005 250 95

2006 230 110

2007 235 100

Usando la tabla determine el o los años en los que:

a) Se produjo el menor número de celemines de trigo.

En el año de 1997

b) Se produjo el mayor número de celemines de maíz.

En los años 2000 y 2005.

c) Se dio el mayor descenso en la producción de trigo.

Del año de 1999 al 2000

d) Se produjeron las mismas cantidades de trigo.

En los años 2003 y 2006 con la cantidad de 110 celemines; y en los

años 2002 y 2007 con la cantidad de 100 celemines.

e) L a producción de maíz disminuyo, mientras la producción de trigo

aumento.

En 1998,2002 y 2006

f) Se obtuvo la máxima producción conjunta

En el 2005

Logaritmos

Log MN=Log M + Log N

Log M/N=Log M-Log N

Log MP=P Log M

Ejemplo: Calcule cada una de las expresiones.

1. P= (3.81) (43.4)

Log P = Log (3.81)+Log (43.4)

Log P=.0580924975+1.63748973

Log P=2.218414706

P=Antilog (2.218414706)

P=165.3

Page 4: apuntes de estadistica

2. P=[(784.6)(0.04311)]/28.23

Log P=

Log P=

Log P=

P=

P=

3. P=

Log P=

Log P=

Log P=

P=

P=

4. P=

Log P=

Log P=

Log P=

P=

P=

5. P=

Log P=

Log P=

Log P=

P=

P=

Datos:

Son aquellos datos que no han sido reforestados ni organizados

numéricamente. Un ejemplo es el conjunto de estaturas de 100 estudiantes en

una universidad obtenidas en el registro universitario.

Datos ordenados.

Es el conjunto de datos numéricos ordenados en forma creciente o decreciente

de magnitud.

Page 5: apuntes de estadistica

Ejemplo: La siguiente tabla muestra las calificaciones en Matemáticas de 80

estudiantes universitarios.

6.8 8.4 7.5 8.2 6.8 9.0 6.2 8.8 7.6 9.3

7.3 7.9 7.5 7.3 6.0 9.3 7.1 5.9 8.5 7.5

6.1 6.5 8.8 8.7 7.4 6.2 9.5 7.8 6.3 7.2

6.6 7.8 8.2 7.5 9.4 7.7 6.9 7.4 6.8 6.0

9.6 7.8 8.9 6.1 7.5 9.5 6.0 7.9 8.3 7.1

7.9 6.2 6.7 9.7 7.8 8.5 7.6 6.5 7.1 7.5

6.5 8.0 7.3 5.7 8.8 7.8 6.2 7.6 5.3 7.4

8.6 6.7 7.3 8.1 7.2 6.3 7.6 7.5 8.5 7.7

A partir de esta tabla encuentre.

a) Su ordenación en forma creciente

5.3 6.2 6.5 7.1 7.3 7.5 7.7 7.9 8.5 9.3

5.7 6.2 6.6 7.1 7.4 7.5 7.8 8.0 8.5 9.3

5.9 6.2 6.7 7.1 7.4 7.5 7.8 8.1 8.6 9.3

6.0 6.2 6.7 7.2 7.4 7.6 7.8 8.2 8.7 9.4

6.0 6.3 6.8 7.2 7.5 7.6 7.8 8.2 8.8 9.5

6.0 6.3 6.8 7.3 7.5 7.6 7.8 8.3 8.8 9.5

6.1 6.5 6.8 7.3 7.5 7.6 7.9 8.4 8.9 9.5

6.1 6.5 6.9 7.3 7.5 7.7 7.9 8.5 9.0 9.7

b) La calificación más alta

9.7

c) La calificación más baja

5.3

d) Las 5 calificaciones más altas

9.7, 9.6, 9.5, 9.5 y 9.4

e) Las 3 calificaciones más bajas

5.3, 5.7 y 5.9

Page 6: apuntes de estadistica

f) La calificación del alumno que tuvo el vigésimo lugar más alto

8.2

g) El número de estudiantes con 7.5 o más.

44

h) El número de estudiantes con calificaciones menores a 8.5

63

i) Las calificaciones que no aparecen en la tabla.

5.4, 5.5, 5.6, 5.8, 6.4, 7.0, 8.7, 9.1, 9.2, 9.8, 9.9, 10

Distribuciones de frecuencias.

Si se reúnen grandes cantidades de datos sueltos, es útil distribuirlos en clases

o categorías y determinar el número de individuos que pertenecen a cada

categoría recibe el nombre de frecuencia de clase. A la disposición tabular de

los datos, por clases con sus respectivas frecuencias se le conoce como

distribución de frecuencias.

Ejemplo: la siguiente tabla muestra una distribución de frecuencias de las

estaturas de 100 estudiantes hombres en una universidad.

ESTATURA

PULGADAS

NÚMERO DE

ESTUDIANTESF.C. C M.C.

F.R.

%F.A

60-62 5 59.5-62.5 3 61 5% 5

63-65 18 62.5-65.5 3 64 18% 23

66-68 42 65.5-68.5 3 67 42% 65

69-71 27 68.5-71.5 3 70 27% 92

72-74 8 71.5-74.5 3 73 8% 100

La primera clase o categoría comprende las estaturas entre 60 y 62 pulgadas y

se indica con el rango-

Intervalos de clase.

El símbolo que define a un intervalo de clase corresponde a los 2 datos

separados por un guion en la parte de en medio.

Page 7: apuntes de estadistica

Limites de clase.

El número más pequeño (60) recibe el nombre de límite inferior de clase,

mientras que el número más grande (62) es el límite superior de clase.

NOTA: Aquel intervalo que no tiene límite de clase inferior o superior recibe el

nombre de intervalo de clase abierto.

Fronteras de clase.

Se abrevia con las letras latinas mayúsculas FC. Si se miden las estaturas con

una exactitud de una pulgada por 2 personas diferentes sus criterios no serán

los mismos, para que esto no ocurra, se utiliza el error de agrupamiento.

Limites de tolerancia

Tamaño o amplitud del intervalo de clase.

Se le conoce como la diferencia entre las fronteras de clase inferior y superior,

se representa por la letra C y su valor siempre es constante.

Marca de clase

Se abrevia por las letras latinas mayúsculas MC y se obtiene promediando los

límites superior e inferior de clase.

Frecuencias relativas

L a frecuencia relativa de una clase es su frecuencia dividida entre la

frecuencia total de todas las clases y se expresa generalmente como

porcentaje.

Frecuencias acumuladas

Es la frecuencia total de los valores de la frontera de clase para cada intervalo

se simboliza con las letras FA.

Polígonos de frecuencias, Histogramas y ojivas.

El polígono de frecuencias, el histograma y la ojiva son 3 representaciones

básicas de las distribuciones de frecuencias.

Page 8: apuntes de estadistica

Un polígono de frecuencia es una representación grafica de línea de las

frecuencias de clase dibujada con respecto a la marca de clase y se obtiene

uniendo los puntos medios de las partes superiores de los rectángulos del

histograma.

Un histograma consiste en un conjunto de rectángulos que tienen sus bases en

el eje X (horizontal), sus centros en las marcas de clase y longitudes iguales a

los tamaños del intervalo de clase.

Una ojiva es aquella que recoge las frecuencias acumuladas por debajo de

cualquiera de las fronteras de clase superiores.

Page 9: apuntes de estadistica

UNIDAD II MEDIDAS DE TENDENCIA CENTRAL

Notación de Índices

Denotemos el valor xj, para cualquiera de los N valores que van desde x1, x2,

x3…xN que toma la variable x. La letra j puede valer desde 1 hasta N y recibe el

nombre de subíndice.

Nota: En algunas ocasiones es posible utilizar para que esto no cause

confusión otro tipo de letras en lugar de j como pueden ser f, k, q, r, s, w, etc.

Notación de Sumatoria

El símbolo ∑j=1

N

x j denota la suma de todos los valores xj desde j=1 hasta j=N.

Por definición se acepta la siguiente fórmula:

∑j=1

N

x j=x1+x2+x3+...+xN

En algunas ocasiones el símbolo de sumatoria se puede utilizar o expresar de

diferentes formas:

1. ∑ x

2. ∑ xj

3. ∑, xj

Ejemplo:

Represente las siguientes sumatorias:

1. ∑j=1

N

x1 y j=x1 y1+x2 y2+ x3 y3+...+xN

∑j=1

N

x j y j=(x1+x2+x3+…+xN ) ( y1+ y2+ y3+…+ yN )

2. ∑j=1

N

a x j=a x1+a x2+a x3+...+a xN

3. ∑ (ax+by−cz )=∑ (by−cz+ax )

Page 10: apuntes de estadistica

∑ (ax+by−cz )=(ax−cz+by )∑

∑ (ax+by+cz )=∑ ax+∑ by+∑ cz

Ejercicios:

Escriba los términos explícitos de cada uno de las siguientes sumas:

1. ∑j=1

6

x j=x1+x2+x3+x4+x5+ x6

2. ∑j=1

4

( y j−3 )2=( y1−3 )2+ ( y2−3 )2+( y3−3 )2+( y 4−3 )2

3. ∑j=1

N

a=a+a+a+...a

4. ∑k=1

5

f k xk=f 1 x1+ f 2 x2+ f 3 x3+ f 4 x4+ f 5 x5

5. ∑j=1

3

( x j−a )=(x1−a )+(x2−a )+(x3−a )

Exprese en notación de sumatoria cada uno de los siguientes términos:

1. x1+ x2+x3+x4+...+x20=∑j=1

20

x j

2. ( y1−3 )2+ ( y2−3 )2+( y3−3 )2+...+( yN−3 )2=∑j=1

N

( y j−3 )2

3. f 1 x1+ f 2 x2+ f 3 x3+ f 4 x4=∑k=1

4

(f k xk )

4. a1b1+a2b2=∑j=1

2

a jb j

5.f 1 x1 y1a

+f 2 x2 y2a

+f 3 x3 y3a

+f 4 x4 y4a

+ ...+f N x N yNa

=∑k=1

N f j x j y ja

Ejercicios:

Dos variables X y Y toman los siguientes valores:

x1= 1, x2= -5, x3= 4, x4= -8, y1= -3, y2= -8, y3=10, y4= 6 respectivamente:

Page 11: apuntes de estadistica

a) ∑ x=(2)+(−5 )+(4 )+(−8 )=−7

b) ∑ y=(−3 )+(−8 )+ (10 )+(−6 )=5

c) ∑ xy=(2 )(−3)+(−5 )(−8)+(4 )(10)+(−8 )(6)=26

d) ∑ x2= (2 )2+(−5 )2+ (4 )2+(−8 )2=109

e) ∑ x y2=(2 ) (−3 )2+(−5 ) (−8 )2+(4 ) (10 )2+(−8 ) (6 )2=−190

f) ∑ xy=( 2−3 )+(−5−8 )+( 410 )+(−86 )=−39

40

Promedios o medidas de Tendencia Central

Un promedio es un valor típico o representativo de un conjunto de datos.

Como tales valores suelen situarse hacia el centro del conjunto de datos

ordenados por magnitud (menor a mayor) los promedios se les conoce como

medidas de tendencia central. Entre las cuales tenemos la media aritmética,

la media aritmética ponderada, la mediana, la moda, etc.

Media Aritmética (x ).

La media aritmética o simplemente media es representada por el siguiente

símbolo x.

De un conjunto de N números x1, x2, x3…xN por definición se acepta lo

siguiente:

Fórmula para datos sueltos:

x=∑j=1

N

x j

N=X1+X2+X3+... X N

N

Fórmula para datos agrupados:

x=∑j=1

K

f 1 x1

N=f 1 x1+f 2 x2+ f 3 x3+... f K xK

f 1+f 2+ f 3+...+ f N

Ejemplos:

Encuentre la media aritmética para los siguientes datos:

Page 12: apuntes de estadistica

a) 10, 8, 3, 12, 5.

x=10+8+3+12+55

x=7.6

b) Si los números 5, 8, 6 y 2 ocurren con frecuencias 3, 2, 4 y 1

respectivamente. Encuentre su media aritmética:

x=(3 ) (5 )+(2 ) (8 )+(4 ) (6 )+(1 )(2)

3+2+4+1=5710

x=5.7

Media Aritmética Ponderada

Algunas veces se asocia a los números x1, x2, x3…xk para ciertos factores de

peso w1, w2, w3…wk dependiendo de la influencia asignada a cada número.

Cuando esto ocurre recibe entonces el nombre de media aritmética

ponderada y por definición se acepta lo siguiente:

x=∑ wx

∑ w=w1 x1+w2 x2+w3 x3+...+wk xk

w1+w2+w3+...+w k

Ejemplo:

Si el examen final de un curso cuenta tres veces más que una evaluación

parcial y un alumno tuvo una calificación de 85 en su examen final y 70 y 90 en

los dos parciales. ¿Cuál es la calificación promedio media?

x=(1 ) (70 )+ (1 ) (90 )+ (3 )(85)

1+1+3=4155

x=83es lacalificaci ón promediomedia

Calculo de la Media Aritmética para datos agrupados

La siguiente formula nos indica el cálculo de la media para datos agrupados,

siempre y cuando exista un intervalo de clase también se le conoce con el

nombre de método de codificación y por definición se acepta la formula

siguiente:

Page 13: apuntes de estadistica

x=A+(∑j=1K

f ju j

N)C=A+( fuN )C

Donde: A es la parte media de los datos

Ejercicio:

Determine x para los datos de las siguientes tablas:

a)

Solución:

x=67+( 15100 ) (3 )

x=67.45

b)

x u f fu

61 -2 5 -10

64 -1 18 -18

67 0 42 0

70 1 27 27

73 2 8 16

∑f=100 ∑f=15

x u f fu

255 -2 8 -16

265 -1 10 -10

275 0 16 0

285 1 14 14

295 2 10 20

305 3 5 15

315 4 2 8

∑f=65 ∑f=31

Page 14: apuntes de estadistica

Solución:

x=285+( 3165 ) (10 )

x=289.77

Mediana y Moda

Mediana.

La mediana de un conjunto de datos ordenados en magnitud (de menor a

mayor) es el valor central del conjunto de datos.

Ejemplos:

1. El conjunto de números 3, 4, 4, 5, 6, 8, 8, 8, 10 tiene una mediana de 6.

2. El conjunto de números 5, 5, 7, 9, 11, 12, 15, 18 tiene una mediana de

10.

Mediana para datos agrupados:

Para datos agrupados la mediana se obtiene de la siguiente forma:

mediana=L1+( N2 −(∑ f )1fmediana )C

Donde:

L1= Frontera inferior de la clase.

N= Número total de datos.

2= Constante.

Page 15: apuntes de estadistica

(∑f)1= Suma de las frecuencias de las clases inferiores de la mediana.

fmediana= frecuencia de la clase de la mediana.

C= Tamaño del intervalo de clase.

Moda.

Es el valor que ocurre con mayor frecuencia.

Nota 1: La moda puede no existir, cuando esto ocurre recibe el nombre de

moda inexistente.

Nota 2: Cuando la moda se presenta una vez recibe el nombre de unimodal.

Nota 3: Si la moda se presenta dos veces entonces se llama bimodal. Si se

presenta tres veces ó más se llama polimodal.

Ejemplos:

De acuerdo con los enunciados indique el tipo de moda que corresponde:

a) 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 11, 15

Solución: Unimodal 9

b) 7, 3, 4, 16, 9, 20

Solución: Moda inexistente

c) 2, 3, 4, 4, 4, 5, 5, 7, 7, 7, 9.

Solución: bimodal 4

Moda para datos agrupados:

moda=L1+( ∆1∆1+∆2 )C

L1= Frontera inferior de la clase modal

∆1= Diferencia de la frecuencia modal con la frecuencia de la clase inferior

inmediata.

∆2= Diferencia de la frecuencia modal con la frecuencia de la clase superior

inmediata.

Page 16: apuntes de estadistica

C= Tamaño del intervalo de clase

Ejercicios:

1. Encuentren la media, mediana y la moda de los siguientes conjuntos de

números:

a) 3, 5, 2, 6, 5, 9, 5, 2, 8, 6

Números ordenados: 2, 2, 3, 5, 5, 5, 6, 6, 8, 9

Media=x=2+2+3+5+5+5+6+6+8+9

10=5110

x=5.1

Mediana= 5

Moda= Unimodal 5

b) 51.6; 47.8; 50.3; 49.5; 48.9

Números ordenados: 47.8; 48.9; 49.5; 50.3; 51.6

Media= x=47.8+48.9+49.5+50.3+51.6

7=248.1

7

x=49.62

Mediana= 49.5

Moda= Moda inexistente

2. Encuentre la mediana para datos agrupados cuando L1= 280, N= 65,

(∑f)= 17, fmediana= 12, C=9.

mediana=L1+( N2 −(∑ f )1fmediana )C

mediana=280+( 652 −(17 )1

12 )9mediana=280+(32.5−1712 )9mediana=291.625

3. Obtenga el tamaño del intervalo de clase para los siguientes datos:

Moda= $277.50

Page 17: apuntes de estadistica

L1= $269.99

Δ1=16-10

Δ2=16-14

moda=L1+( ∆1∆1+∆2 )C

Solución:

C=moda−L1

∆1∆1+∆2

C=277.50−269.9968

C=7.510.75

C=10.013

Relaciones empíricas entre media, mediana y moda.

Para curvas de frecuencia unimodales que sean moderadamente sesgadas o

asimétricas se presenta la siguiente relación empírica:

media−moda=3 (media−mediana)

Ejemplos:

Del ejercicio anterior numero 1 verificar si se cumple la relación empírica entre

media, mediana y moda:

a) media−moda=3 (media−mediana)

5.1−5=3(5.1−5)

0.1=0.3 No se cumple la relación entre las 3 variables

La Figura 1 y la Figura 2 nos indican las posiciones relativas de la media, la

mediana y la moda para curvas de frecuencia sesgadas a la derecha o a la

izquierda respectivamente.

Figura 1:

Page 18: apuntes de estadistica

Figura 2:

Nota: Si tuviéramos curvas simétricas entonces quiere decir que los valores de

la media, la mediana y la moda coinciden.

La Media Geométrica (G).

Se representa con la letra mayúscula G de un conjunto de N números positivos

que van desde x1, x2, x3…xN y se obtiene multiplicando cada uno de los datos

para después extraer la raíz N-esima del total de los datos.

G=N√ (x1 ) (x2 ) (x3 )… (xN )

De acuerdo con los datos del problema 1 obtenga la Media Geométrica:

a) G=10√ (2 ) (2 ) (3 ) (5 ) (5 ) (5 ) (6 ) (6 ) (8 ) (9 )

G=4.56

b) G= 5√(47.8 ) (48.9 ) (49.5 ) (50.3 ) (51.6 )

G=49.60

La Media Armónica (H)

Representada por la letra mayúscula H de un conjunto de números positivos x1,

x2, x3…xN y es el reciproco de la sumatoria de cada uno de los datos y está

representada como sigue:

H= N

∑ 1x

Ejemplo:

Encontrar la media armónica para el siguiente conjunto de datos: 2, 4, 6.

Solución:

Page 19: apuntes de estadistica

H= 312+14+16

H= 398

H=2

Ejercicios:

De acuerdo con los datos del problema 1 encuentre la media armónica:

a)H= 10

12+12+13+15+15+15+16+16+18+19

H= 10901360

H=3600901

=3.99

b)H= 5

147.8

+148.9

+149.5

+150.3

+151.6

H= 5.101

=49.5

Media Cuadrática (MC).

La Media Cuadrática de un conjunto de números en ocasiones se llega a

simbolizar √ x2 y por definición se representa de la siguiente forma:

MC=√∑j=1N

x j2

N=√∑ x2

N

Ejercicios:

Page 20: apuntes de estadistica

Relación entre la media aritmética, le media geométrica y la media

armónica.

La media geométrica de un conjunto de números positivos x1, x2, x3...xN es

menor o igual a su media aritmética pero es mayor o igual a su media armónica

es decir: H≤G≤X.

Ejemplos:

Encuentre la H, G y X de los siguientes datos:

a) 2, 3, 4

Solución:

1. H= 3

12+14+18

= 378

=247

=3.42

2. G= 3√(2 ) (4 ) (8 )=4

3. x=2+4+83

=143

=4.66

Quartiles, Deciles y Percentiles.

En primera instancia existen dos formas de obtener los quartiles, deciles, y

percentiles, la primera es para datos sueltos y la segunda para datos

agrupados.

Para datos sueltos es la siguiente, necesitamos ordenar los datos en forma

creciente de magnitud.

De manera que el punto medio recibe el nombre de Mediana.

Extendiendo esta idea al conjunto de datos que lo divide en cuatro partes

iguales recibe el nombre de Quartil.

Nuevamente el conjunto de datos que divide en 10 partes iguales recibe el

nombre de Decil.

Page 21: apuntes de estadistica

Finalmente el conjunto que divide en 100 partes iguales recibe el nombre de

Percentil.

1 100

Para datos agrupados se representa de la siguiente forma:

UNIDAD III MEDIDAS DE DISPERSIÓN

Dispersión o variación

La dispersión o variación de los datos es el grado en el que los datos

numéricos tienden a espaciarse alrededor de un punto medio o de un valor

promedio, entre los más comunes podemos mencionar: El rango, el rango

modificado, la desviación media, la desviación estándar, la varianza, etc.

Rango

El rango se define de la diferencia del dato mayor menos el dato menor o

viceversa, (menor menos mayor) se deberá ubicar en dos líneas verticales,

cuyo significado es valor absoluto.

Range=¿datomayor−datomenor∨¿

Page 22: apuntes de estadistica

Ejemplo:

Calcule el rango de los siguientes datos: 2, 15, 8, 3, 9, 4, 4, 4, 4, 4, 6

Solución:

Range=|15−2|=13

Rango semiintercuartilar

También se le conoce con el nombre de desviación cuartilar y se denota con la

letra Q

Q=Q3−Q12

Ejercicio:

Calcule el cuartil 1

Q=11.25

Q3=268.25

Q1=?

Solución:

Q (2 )−Q3=−Q1

(11.25 ) (2 )−268.25=−Q1

22.5−268.25=−Q1

−245.75=−Q1

Q1=245.75

Rango percentilar 10-90

Se caracteriza por la diferencia de percentiles y se define como:

Rango percentilar 10−90=P90−P10

Page 23: apuntes de estadistica

Ejercicio: Calcule el rango percentilar 10-90:

P10=62.5+518

(3)

P90=68.5+2527

(3)

Solución:

Rango percentilar 10−90=[68.5+ 2527 (3 )]−[62.5+ 518 (3 )]Rango percentilar 10−90=[71.28 ]−[63.34 ]

Rango percentilar 10−90=7.94

Rango semipercentilar

También se le conoce como rango modificado, se define como:

Rangomodificado=12(P90−P10)

Ejemplo:

Con los datos del ejercicio anterior, obtén el dato semipercentilar

Rangomodificado=12(7.94)

Rangomodificado=3.97

La desviación media D.M.

Se le conoce con el nombre de desviación promedio de un conjunto de N datos

que van desde X1 hasta X N

D .M=∑j=1

N

│ x−x│

N=

|x−x|N

Page 24: apuntes de estadistica

Ejemplo:

Calcule la desviación media de:

a) 12, 6, 7, 3, 15, 10, 18, 5

b) 9, 3, 8, 8, 9, 8, 9, 18

Solución:

a) x=3+5+6+7+10+12+15+18

8=768

=9.5

D .M=|3−9.5|+|5−9.5|+|6−9.5|+|7−9.5|+|10−9.5|+|12−9.5|+|15−9.5|+|18−9.5|

8

¿ 6.5+4.5+3.5+2.5+0.5+2.5+5.5+8.58

=348

=4.25

b) x=3+8+8+8+9+9+9+18

8=728

=9

D .M=|3−9|+|8−9|+|8−9|+|8−9|+|9−9|+|9−9|+|9−9|+|18−9|

8

¿ 6+1+1+1+0+0+0+98

=188

=2.25

Si x1 , x2,…., xk ocurren con frecuencias f 1 , f 2 ,…. , f k respectivamente, la

desviación media puede expresarse:

D .M=∑j=1

K f j|x j−x|N

Ejemplo:

Calcule la desviación media para datos agrupados de acuerdo con los datos de

la tabla:

Dato x=67.50

Pulgadas

Marca de

clase

(x)

|x−x| f f|x−x|

Page 25: apuntes de estadistica

60-62 61 6.5 5 32.5

63-65 64 3.5 18 63

66-68 67 0.5 42 21

69-71 70 2.5 27 67.5

Solución:

DM=32.5+63+21+67.55+18+42+27

=18492

=2

La desviación estándar

Se representa con la letra s y existen dos formas para diferenciarlas:

S→Muestra

σ→Población

Para datos sueltos:

S=√∑j=1N

(x j−x )2

N=√∑ ( x−x )2

N

Para datos agrupados

S=√∑j=1K

f j (x j−x )2

N=√∑ f ( x−x )2

N

Ejercicio:

Calcule la desviación estándar de:

a) 12, 6, 7, 3, 15, 10, 18, 5

b) 9, 3, 8, 8, 9, 8, 9, 18

Solución:

a) x=9.5

Page 26: apuntes de estadistica

S=√ (12−9.5 )2+ (6−9.5 )2+ (7−9.5 )2+ (3−9.5 )2+ (15−9.5 )2+ (10−9.5 )2+(18−9.5 )2+(5−9.5 )2

8

S=√ 6.25+12.25+6.25+42.25+30.25+0.25+72.25+20.258=√ 1908 =√23.75=4.87

b) x=9

S=√ (9−9 )2+(3−9 )2+(8−9 )2+ (8−9 )2+ (9−9 )2+ (8−9 )2+ (9−9 )2+ (18−9 )2

8

S=√ 0+36+1+1+0+1+0+818=√ 1208 =√15=3.87

Ejercicio: Calcule la desviación estándar para datos agrupados de acuerdo con

los datos de la tabla:

Dato x=67.50

Pulgadas

Marca de

clase

(x)

|x−x|2 f f|x−x|2

60-62 61 42.25 5 211.25

63-65 64 12.25 18 220.5

66-68 67 0.25 42 10.5

69-71 70 6.25 27 168.75

Solución:

S=√ 211.25+220.5+10.5+168.755+18+42+27=√ 61192 =√6.64=2.58

Métodos cortos para el cálculo de la desviación estándar

Page 27: apuntes de estadistica

También se les conoce con el nombre de métodos de codificación, en donde la

formula 1 y 3 se utilizan para datos sueltos y las restantes para datos

agrupados.

1)S=√∑j=1N X j

2

N−(∑j=1

N

X j

N)2

=√∑ X2

N−(∑ X

N )2

2)S=√∑j=1K f j X j

2

N−(∑j=1

K

f j X j

N)2

=√∑ f X2

N−(∑ f X

N )2

3)S=√∑j=1N d j2N

−(∑j=1N

d j

N)2

=√∑ d2

N−(∑ d

N )2

4)S=√∑j=1K f jd j2N

−(∑j=1K

f jd j

N)2

=√∑ f d2

N−(∑ fd

N )2

5)S=c√∑j=1K f ju j2N

−(∑j=1K

f ju j

N)2

=c √∑ f u2

N−(∑ fu

N )2

Ejercicio:

Calcular la desviación estándar aplicando una de las 5 formulas para cada

tabla:

1)

Pulgadas f M.C x2 f X2

60-62 5 61 3721 18605

63-65 18 64 4096 73728

66-68 42 67 4489 188538

69-71 27 70 4900 132300

72-74 8 73 5329 42632

=100 =455803

Page 28: apuntes de estadistica

Solución:

S=√ 455803100−( 6745100 )

2

=√4558.03−4549.5025=√8.5275=2.92

2)

Pulgadas f d=X-A fd f d2

60-62 5 -6 -30 180

63-65 18 -3 -54 162

66-68 42 0 0 0

69-71 27 3 81 243

72-74 8 6 48 288

=100 =45 =873

Solución:

S=√ 873100−( 45100 )2

=√8.73−0.2025=√8.5275=2.92

3)

Pulgadas f U= X−Ac

fU f U 2

60-62 5 -2 -10 20

63-65 18 -1 -18 18

66-68 42 0 0 0

69-71 27 1 27 27

72-74 8 2 16 32

=100 =15 =97

Solución:

Page 29: apuntes de estadistica

S=3√ 97100−( 15100 )2

=3√0.97−0.0225=2.92

Varianza

La varianza de un conjunto de datos se define como el cuadrado de la

desviación estándar.

Ejemplo:

Varianza= (2.92)2=8.5264

Comprobación de Charlier

Utiliza las siguientes dos identidades

∑ f (u+1 )=∑ fu+∑ f=∑ fu+N

∑ f (u+1 )2=∑ f (u2+2u+1 )=∑ f u2+2∑ fu+∑ f=∑ f u2+2∑ fu+N

Ejercicio:

Utilice la comprobación de Charlier.

x u f fu fu2

70 -6 4 -24 144

74 -5 9 -45 225

78 -4 16 -64 256

82 -3 28 -84 252

86 -2 45 -90 180

90 -1 66 -66 66

94 0 85 0 0

98 1 72 72 72

102 2 54 108 216

106 3 38 114 342

110 4 27 108 432

114 5 18 90 450

Page 30: apuntes de estadistica

118 6 11 66 396

122 7 5 35 245

126 8 2 16 128

N=480 fu=236 fu2=3404

Solución:

∑ f (u+1 )=∑ fu+N

∑ f ' (u+1 )=716

¿236+480=716

∑ f (u+1 )2=∑ f u2+2∑ fu+N

∑ f (u+1)2=4356

=3404+2 (236 )+480=4356

Corrección de Sheppard

Esta formula se aplica cuando existe un calculo en la desviación estándar, el

cual presenta cierto grado de error ocasionado por el agrupamiento de los

datos.

Varianzacorregida=Varianzade datos agrupados− c2

12

Varianzacorrecta=√Varianzac orregida

Ejemplos:

1) s2=8.5273c=3

Varianza corregida=8.5273− 32

12=8.5273−0.75=7.7773

Varianzacorrecta=√7.7773=2.79

Page 31: apuntes de estadistica

2) s2=243.41c=10

Varianzacorregida=243.41−102

12=243.41−8.33=235.07

Varianzacorrecta=√235.07=15.33

3) s2=109.60c=4

Varianzacorre gida=109.60− 42

12=109.60−1.33=108.27

Varianza correcta=√108.27=10.43

Relaciones empíricas entre medidas de dispersión:

Reciben el nombre de relaciones empíricas aquellas formulas que presenten

los siguientes puntos.

a) Tengan desviación estándar (Para efectos de cálculos)

b) Sea para distribuciones moderadamente sesgadas a la izquierda o a la

derecha (Para efectos de graficación)

Y se definen como:

D .M=45S

Rango semiintercuartilar=25(Desviaciónestándar)

Variable estandarizada

Es la variable que mide la desviación estándar con respecto de la media

aritmética, teniendo unidades adimensionales (carente de unidades)

Se representa de la siguiente forma:

z= x−xs

Donde:

z= Variable estandarizada

Page 32: apuntes de estadistica

X= Valor cualquiera

x= Media aritmética (Promedio)

s=Desviación estándar

Coeficiente de dispersión absoluta y relativa

La dispersión o variación real es determinada a partir de la dispersión estándar

u otra medida de dispersión, recibe el nombre de dispersión absoluta y se

obtiene por simple inspección, es decir comparando dos datos.

Para obtener la dispersión relativa se requiere la dispersión absoluta mayor o

menor según sea el caso, dividido entre alguna medida de tendencia central y

su resultado se expresa en porcentaje.

Dispersiónrelativa=Dispersión absolutaPromedio

×100

Coeficiente de Variación

Se expresa con la letra mayúscula (V) y al igual que el anterior su resultado

debe estar escrito en porcentaje.

Coeficiente de variación (V )= sx

Ejemplos:

1) Calcule la desviación media para los siguientes datos:

a) 3.2, 3, 4.6, 2, 2.8, 1, 5.2, 7, 4.4, 5

Solución:

x=3.2+3+4.6+2+2.8+1+5.2+7+4.4+510

=38.210

=3.82

D .M=|3.2−3.8|+|3−3.8|+|4.6−3.8|+|2−3.8|+|2.8−3.8|+|1−3.8|+|5.2−3.8|+|7−3.8|+|4.4−3.8|+|5−3.8|

10

D .M=|0.6|+|0.8|+|0.8|+|1.8|+|1|+|2.8|+|1.4|+|3.2|+|0.6|+|1.2|

10=14.210

=1.42

Page 33: apuntes de estadistica

2) Con los datos del ejercicio anterior, calcule:

a) Rango

Range=¿datomayor−datomenor∨¿

Range=|7−1|=6

b) Desviación estándar

x=3.82

S=√ (3.2−3.8 )2+(3−3.8 )2+(4.6−3.8 )2+(2−3,8 )2+(2.8−3.8 )2+ (1−3.8 )2+(5.2−3.8 )2+(7−3.8 )2+(4.4−3.8 )2+ (5−3.8 )2

10

S=√ 27.71610=√2.7716=1.66

3) Aplique la formula 1 de métodos cortos para calcular su desviación

estándar.

70, 74, 78, 82, 86, 90, 94, 98, 102, 106, 110, 114, 118

Solución:

S=√ 702+742+782+822+862+902+942+982+1022+1062+1102+1142+118213−( 122213 )

2

S=√ 11778013− (94 )2=√9060−(8836 )=√224=14.97

4) Si el valor de la D.M.=12.90 y el rango semiintercuartilar es igual a 95.97

encontrar el valor de la desviación estándar.

Page 34: apuntes de estadistica

UNIDAD 4

MOMENTOS, ASIMETRIA Y CURTOSIS

Momento:

Pueden ser utilizados en la aplicación de matriz, costo, utilidad, venta etc.

Si los valores X1, X2, Xn de la variable X se define como N los valores y la expresión es:

xr=∑i=1

N

x ir

N=x1

r+x2r+xn

r

mr=∑i=1

N

(¿ x i−x)

N=∑(¿x−x)

m

N¿¿

m1=∑i=1

N

¿¿¿ = ∑ ¿¿¿

1) 2,3,7,8,10 A= 6 B= 45.2 c = 378 d= 3,318.8

x1=21+31+71+81+101÷5=6

x2=22+32+72+82+102÷5=45.2

x3=23+33+73+83+103÷5=378

x4=24+34+74+84+104÷5=3318.8

Page 35: apuntes de estadistica

2) 2, 3, 7, 8, 10 4 momentos 1=0 2=9.2 3= 3.6 4=122

m1=(2−6 )1+(3−6 )1+ (7−6 )1+ (8−6 )1+ (10−6 )1÷5

m1 = 0

m2=(2−6 )2+(3−6 )2+(7−6 )2+(8−6 )2+(10−6 )2÷5

m2 = 9.2

m3=(2−6 )3+(3−6 )3+(7−6 )3+(8−6 )3+(10−6 )3÷5

m3 = 3.6

m4=(2−6 )4+(3−6 )4+ (7−6 )4+(8−6 )4+ (10−6 )4÷5

m4 = 122

3) Cuando A = 4 I=2 2=13.2 3=59.6 4=330

m1=(2−4 )1+ (3−4 )1+(7−4 )1+ (8−4 )1+(10−4 )1÷5

m1 = 2

m2=(2−4 )2+ (3−4 )2+(7−4 )2+ (8−4 )2+(10−4 )2÷5

m3 = 13.2

m3=(2−4 )3+ (3−4 )3+(7−4 )3+(8−4 )3+ (10−4 )3÷5

m3 = 59.6

m4=(2−4 )4+ (3−4 )4+ (7−4 )4+(8−4 )4+(10−4 )4÷5

m4 = 330

Momentos Datos Agrupados

xr=∑i=1

k

f i x ir

N=f 1 x1

x+ f k xkr

N

Page 36: apuntes de estadistica

mr=∑i=1

k

f i ¿¿¿

mr=∑i=1

k

f i ¿¿¿

Momentos adimensionales

ar= mr

√m2r

a1= 01

√120 = 0

a2= 02

√9.222=1

a3= 03

√9.223

a 4= 04

√9.224

Relaciones entre momentos

m2=m21−m1

12

m3=m31−3m1

1m21+2m1

13

m4=m41−4m1

1m21+2m1

14

m2=13.2− (22 )

m2 = 9.2

m3=59.6−(3 (2 )(13.2))+2¿

m3 = 3.6

m4=330−4 (12(13.2))+6¿

m4 = 122

Page 37: apuntes de estadistica

Cálculo de momentos para datos agrupados

Método de codificación, utilizado para el cálculo de los

x U f fu fu2 fu3 f461 -264 -167 070 173 0

4 momentos

M 1r=cr∑ f ur

N

x U f fu fu2 fu3 fu470 -6 4 24 -144 864 -518474 -5 9 45 -225 1125 -562578 -4 16 64 -256 1024 -409682 -3 28 84 -252 756 -226886 -2 45 90 -180 360 -72090 -1 66 66 -66 66 -6694 0 85 0 0 0 098 1 72 72 72 72 72

102 2 54 108 216 432 864106 3 38 114 342 1026 3078110 4 27 108 432 1728 6912114 5 18 90 450 2250 11250118 6 11 66 396 2376 14256122 7 5 35 245 1715 12005126 8 2 16 128 1024 8192

∑   480 240  3,404  6,428  74,528 

m11=41( 236480 ) = 1.96

m21=42( 3,464480 ) = 113.46

m31=43( 6,428480 ) = 857.06

Page 38: apuntes de estadistica

m31=44(74,588480 ) = 3,978.02

Comprobación de Charlier

∑ f= (u+1 ) = ∑ fu+N

∑ f= (u+1 )2 = ∑ f u2+2∑ fu+N

∑ f= (u+1 )3 = ∑ f u3+3∑ f u2+3∑ fu+N

∑ f= (u+1 )4 =∑ f u4+4∑ f u3+6∑ f u2+4∑ fu+N

Corrección de Sheppard

m2 Corregido = m2 - 112c2

m4 Corregido = m4 - 112c2m 2+ 7

240c4

El m1 y el m3 no requieren corrección

A) m2 = 8.5275 C=3m4 = 199.3759

m2 = 8.5275 - 112

(9) m2C = 7.7775

m2 = 199.3759 - 112

(9) (8.5275) + 7240

(81)

m4C = 163.3646

B) m2 = 109.5488 C=4m4 = 35,627.2853

m2c = 109.5488 - 112

(16) m2C = 108.2654

Page 39: apuntes de estadistica

m2 = 109.5488 - 112

(16) (109.5488) + 7240

(256)

m4C = 34,757.9615

ASIMETRIA

Es la ausencia o distorsión de la simetría de una distribución. Si la curva de la “f” para una distribución tiene una cola más larga que la derecha, que hacia la izquierda, entonces esta sesgada a la derecha o tiene sesgo positiva. Si es al revés, tiene sesgo a la izquierda y la asimetría es negativa.

1° y 2° coeficientes de asimetría del Pearson.

1° = x−Moda

s

2° = 3(x−Moda)

s

65 empleados Media = $279, 76 Mediana = $79.06Moda = $277.50 D.E. 15.60

1° = 279.76 –277.50

15.62° =

3(279.76−79.06)15.6

1° = $0.1448 2° = $ 38.5961

Page 40: apuntes de estadistica

En términos de Cuartiles y Percentiles

CoeficienteDe asimetría =Cuartilar

CoeficienteDe asimetría =Perceptilar

Coeficiente de momento

De asimetría: m3

√m23

A) Q1 = $268.25 Q2 = P50 = $279.06 Q3= $290.75P10 = P1 = 258.12 P40 = Dq = 301

=290.75−2 (279.06 )+268.25

290.75−268.25 = $.03911

=301−2 (279.06 )+258.12

301−258.12 = $0.0233

B) M3 = -2.69 M2 = 8.53

= .69

√(8.53 )3

CURTOSIS

Puntiaguda es la distribución

Page 41: apuntes de estadistica

Leptocúrtica Plantoecúrtica Mesocúrtica

Coeficiente de

Momento m 4

m22

De curtosís

Percentil y Cuartil

k= QP90−P10

UNIDAD 5

Relación entre variables

Para ecuaciones de 1° grado con 2 incógnitas

A= método de eliminación por igualación.

B= método por sustitución

C= método por reducción o suma y resta

D= método de Cramer

Para ecuaciones de 3 incognitas

E= método de triangulación

F= método Gauss Jordan

G= método de determinantes o cofactores

H= regla de Sarrus

Page 42: apuntes de estadistica

A=2a+b=107a−3b=9 B=

3a+5b=242a+3b=14 C=

8 x−3 y=2 (7)3 x+7 y=−9 (3)

b=10−2a 56 x−21 y=149 x+21 y=−27

b=9−7 a−3 65x=-13

10−2a=9−7a−3

x=-13/65

X=−15

D= 5 A−9B=−103 A−4B=16 X=

c 1b2−c 2b1a1b2−a2b1

Y= a1c 2−a2c1a1b2−a2b1

ELIMINACIÓN GAUSSIANA

x−4 y−z=62 x+5 y−7 z=−93 x−2 y+z=2

(1 4 −12 5 −73 −2 1 |692)(−2)(−3)

(1 4 −10 −3 50 −14 4 | 6

−21−16)(−13 )

X=1Y=2Z=3

Para generar unos, el reciproco (no camba signo) se multiplica por cada elemento de fila hilera o renglón.

Para 0 se utiliza inverso (cambio de signo), se da en la fila do0nde hay 1 luego se multiplica por cada fila y el R= se suma el resta en la fila donde 0.

Page 43: apuntes de estadistica

(1 4 −10 1 5 /30 −14 4 | 67−16)(4)

(1 4 −10 1 5 /30 −14 82 /3| 6782)( 382 )

(1 4 −10 1 5/30 0 1 |673)

Z=3

Y+5/32=7 x+4y-2= 6

X= 1

Y=5=7

Y=2

5 x+2 y+3 z=−52x−3 y−6 z=1x+5 y−4 z=22

(1 5 −42 −3 −65 2 3 | 221−5) (−2 )(−5)

(1 5 −40 −13 20 −23 23 | 22−43

−115)(−1/13)

(1 5 −4

0 1−213

0 −23 23| 224313−115

) (23 )

(1 5 −4

0 1−23

0 025313

| 224313

−50613

)( 13253 )

Page 44: apuntes de estadistica

(1 5 −40 1 −2/30 0 1 | 22

43 /13−2 )

Z= -2

y− 213 (−2 )

=43 /13

y=4313

−4/13

y=3

x+5 (3 )−4 (−2 )=22x=22−15−8

x=−1

MÉTODO DETERMINANTES

X= det . |x|det . |D|

=−82−82

=1

Y= det . |y|det . |D|

=−164−82

=2

Z=det . |z|det . |D|

=−246−82

=3

x∓ 4 y−2 z=62 x+5 y−7 z=−93 x−2 y+z=2

det . ¿

5-84+4+15-14-8=-82

det . ¿

det . ¿=-164

det . ¿

Page 45: apuntes de estadistica

X+4Y−Z=62 X+5Y−7 Z=−93 X−2Y +Z=2

det .|D|=|1 4 −12 5 −7312

−245

2−1−7

|=−82

det .|x|=| 6 4 −1−9 5 −726

−9

−245

2−1−7

|=−82

det .|y|=|1 6 −12 −9 −7312

26

−9

2−1−7

|=−164

det .|z|=|1 4 62 5 −9312

−245

26

−9|=−246

X= −82−82

Y= −164−82

Z= −246−82

X=−1000−898

=500449

Y=−976−898

=488449

Z=226

−898=−113449

Page 46: apuntes de estadistica

Sarrus

2-4+16 x−195

=-y

10-x−228

=2 y−1

4z+3y=3x-y

16 x+5 y+2=23−x−16 y−22=−18−3 x+4 y+42=0

det .|D|=|16 5 1−1 −16 −2−316−3

45

−16

41

−2|=−898

et .|X|=| 23 5 1−18 −16 −2023

−18

45

−16

41

−2|=−1000

et .|y|=|16 23 1−1 −18 −2−316−1

023

−18

412

|=−976

et .|Z|=|16 5 23−1 −16 −18−316−1

45

−16

023

−18|=226

Gauss

Page 47: apuntes de estadistica

2a−2=−b+c3a−4b+2c=44 a+3b−5c=−8

2a+b−c=23a−4b+2c=44 a+3b−5c=−8

(2 1 −13 −4 24 3 −5|248)(1/2)

(1 1/2 −1 /23 −4 24 3 −5 |148) (−3 )(−4)

(1 1/2 −1/20 −11 /2 7/20 1 −3 | 1

1−12)

(1 1/2 −1/20 1 −30 −11 /2 7/2 | 1

−121 ) (11/2 )

(1 1/2 −1/20 1 −30 0 −13 | 1

−12−65) (−1/13 )

(1 1/2 −1/20 1 −30 0 1 | 1

−125 )

Page 48: apuntes de estadistica

C=5 x+1/2(3)-1/2(5)=1

Y-12+5 x=1-3/2+5/2

b= 3 a= 2

Determinantes

5 x+2 y+32=−52x−3 y−62=1x+5 y−42=22

det . |D|=|5 2 32 −3 −61 5 −4

5 22 −31 5 |=60-12+30+9+150+16=253

det . |x|=|−5 2 31 −3 −622 5 −4

−5 21 −322 5 |=60-264+15+198-150+8=253

det . |y|=|5 −5 32 1 −61 22 −4

−5 −52 11 22|=-20+30+132-3+660-40=759

det . |z|=|5 2 −52 −3 11 5 22

5 22 −31 5 |=-330+2-50-15-25+88=-506

X=253

−253=−1

Y=759253

=3

Z=−506253

=−2

Page 49: apuntes de estadistica

Gauss Jordan

3u−5 v+6w=75u+3 v−2w=−14 u−8 v+10w=11

MÉTODO DE CORRELACIÓN

Con el uso de técnicas como las que vimos antes. Para determinar la ecuación que relacione variables.

X y Y denotan estaturas y pesos de adultos con una muestra n, se representa:

Estaturas PesosX1, X2, X3, XN Y1, Y2, Y3, YN

Gráfica puntos (x1, y1), (x2, y2), (Xn,Yn), en un eje rectangular.Se unen los puntos cuyo R=, se llama “diagrama de dispersión.”A partir del diagrama, se pueden ajustar los tipos de curva, mediante métodos vistos antes.

Eje:

Figura A Figura B

Parece línea recta visualiza la dirección/2 variables

Figura A relación lineal entre dos variables figura B relación de variables no lineal

El problema general. Para encontrar ecuación de curvas de aproximación que se ajusten al conjunto de datos = ajuste de curvas.

ECUACIONES DE CURVAS DE APROXIMACION

Se presentan curvas de aproximación para tener referencia.

X y Y = constantes

X y Y = variables dependientes e independientes

Y= a0+a1x

Page 50: apuntes de estadistica

181716151413121110

987654321

0 1 2 3 4 5 6 7 8 9 10 11

A= línea recta con los datos

x 2 3y 1 3

5 7 97 11 15

1017

B= ecuación para

1=a0+a13=a0+a1

23

a0+2a1=1(−3)a0+3a1=3(2)

−3a0−6a1=−32a0+6a1=6

−a0=3

a0=−3

−3+2a1= 1+3

2a1=1+3

7=a0+a15

11=a0+a17

y=−3+2x

y=2x−3

Page 51: apuntes de estadistica

a1=2

x 1 3y 1 2

4 6 84 4 5

9 11 147 8 9

1= a0+a1 1

2=a0+a1 3

a0+a1=1(−3)

a0+3a1=2(1)

−3a0- 3a1=-3

a0+3a1=2

−2a0=-1

a0=−1−2

a0=0.5

RECTAS DE REGRESIÓN DE MINIMOS CUADRADOS

Se considera que la recta es la relación de dos variables

∑ y=a0N+a1∑ x

∑ xy=a0∑ x+a1∑ x2

a0=N∑ xy−¿¿¿

De x sobre y

X= b0+b1 y

∑ x=b0 N+b1∑ y

∑ xy=b0∑ y+b1∑ y2

10

9

8

7

6

5

4

3

2

10 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Page 52: apuntes de estadistica

b0=¿¿

La tabla muestra

x 65 63y 68 66

67 64 6868 65 69

62 70 6666 68 65

68 67 6971 67 68

7170

X y x2 y2 xy

65 68 4225 4624 4420

63 66 3969 4356 4158

67 68 4489 4624 4556

64 65 4096 4225 4165

68 69 4624 4761 4692

62 66 3844 4356 4092

70 68 4900 4624 4760

66 65 4356 4225 4290

68 71 4624 5041 4828

67 67 4489 4489 4489

69 68 4761 4624 4692

71 70 5041 4900 4970

811=a0+a1800

5410=a0811+a153148

12a0+800a1=811 (-800)

800a0+53418a1=54107 (12 )

-9600-640000a1=−648800

9600+641016a1=649284

1016a1=484

a1=0.48

a0=35.82

Y = 35.82+0.48x