COMPETENCIAS Y OBJETIVOS - usalesiana

64
28/02/2012 TPAU 1 COMPETENCIAS Y OBJETIVOS UNIDAD I :ESTADISTICA DESCRIPTIVA Competencia: -El estudiante debe utilizar correctamente los procedimientos ,técnicas y métodos estadísticos,en el tratamiento y procesamiento de datos de todo trabajo de investigación científica Objetivos. -Aplicar adecuadamente las técnicas y procedimientos estadísticos como metodología de toda investigación principalmente en la Ingeniería. Descripción general de la unidad: -Esta unidad comprende el desarrollo de los siguientes aspectos :ciclo metodológico de la investigación estadística, recopilación. organización ,clasificación y descripción de datos de una muestra aleatoria o población; determinación y utilización de las medidas descriptivas. Lectura :Millar/Freund/Jonson “Probabilidad y Estadística para Ingenieros”Edo.de México 1992 Pgs.1 al 40 Córdova Zamora “Estadística Descriptiva e Inferencial” 2ª ed.Perú 1996 Pags,1 al 69 Bibliografía Básica: García Oré (1995) “Estadística descriptiva y Probabilidades”(2ª ed) Perú .Pags.2al 83 Referencia electrónica : http://thales.cica.es/red/Recursos/rd99/ed99-0278- 01/inicio.html

Transcript of COMPETENCIAS Y OBJETIVOS - usalesiana

Page 1: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 1

COMPETENCIAS Y OBJETIVOS

• UNIDAD I :ESTADISTICA DESCRIPTIVA

• Competencia:

• -El estudiante debe utilizar correctamente los procedimientos ,técnicas y métodos estadísticos,en el tratamiento y procesamiento de datos de todo trabajo de investigación científica

• Objetivos.

• -Aplicar adecuadamente las técnicas y procedimientos estadísticos como metodología de toda investigación principalmente en la Ingeniería.

• Descripción general de la unidad:

• -Esta unidad comprende el desarrollo de los siguientes aspectos :ciclo metodológico de la investigación estadística, recopilación. organización ,clasificación y descripción de datos de una muestra aleatoria o población; determinación y utilización de las medidas descriptivas.

• Lectura:Millar/Freund/Jonson “Probabilidad y Estadística para Ingenieros”Edo.de México 1992 Pgs.1 al 40

• Córdova Zamora “Estadística Descriptiva e Inferencial” 2ª ed.Perú 1996 Pags,1 al 69

• Bibliografía Básica: García Oré (1995) “Estadística descriptiva y Probabilidades”(2ª ed) Perú .Pags.2al 83

• Referencia electrónica: http://thales.cica.es/red/Recursos/rd99/ed99-0278-01/inicio.html

Page 2: COMPETENCIAS Y OBJETIVOS - usalesiana

Estadística DescriptivaCONTENIDO MÍNIMO

1.-INTRODUCCIÓN A LA ESTADÍSTICA(muestreo)

2.-ORGANIZACIÓN Y CLASIFICACIÓN DE DATOS

3.-MEDIDAS DE POSICIÓN

4.-MEDIDAS DE DISPERSIÓN

5.-REGRESIÓN LINEAL SIMPLE

Page 3: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 3

Introducción a la

Estadística1.-DEFINICIÓN.- Como ciencia proporciona un

conjunto de métodos,técnicas y/o procedimientos ,para recopilar,organizar,presentar ,analizar datos,con el fin de realizar generalizaciones válidas,para tomar decisiones coherentes,ante la incertidumbre,acerca de la población o sus parámetros a partir de datos extraídos de una muestra.

• ESTADÍSTICA DESCRIPTIVA.

• ESTADÍSTICA INFERENCIAL

Page 4: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 4

• POBLACIÓN (N).-Conjunto universo,motivo

de análisis que tiene por lo menos alguna

característica en común,el proceso para

obtener toda la información de la población se

llama censo

• PARÁMETRO.- Es un nº resumen que

sintetiza alguna característica de la población

• MUESTRA (n).- Es un subconjunto propio

representativo de la población,el proceso para

la obtención de los datos muestrales se llama

muestreo

• ESTADÍGRAFO.-Es un nº sintético que

resume alguna característica de la muestra

Page 5: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 5

1.- INTRODUCCIÓN AL MUESTREO

PROCESO DEL DESARROLLO CIENTÍFICO

DESARROLLO DEL CONOCIMIENTO

MÉTODO ESTADÍSTICO

OBSERVACIÓN DEL

FENÓMENO

FORMULACIÓN DE

LA HIPÓTESIS

VERIFICACIÓN

DE LA HIPÓTEIS

MÉTODO CIENTÍFICO

Page 6: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 6

PERFIL DE TESIS TÍTULO

JUSTIFICACIÓN

FORMULACIÓN DEL PROBLEMA

HIPÓTESIS

OBJETIVOS:

METODOLOGÍA:

MÉTODOS : inductivo,deductivo,hidtórico,lógico,experimental etc.

.TÉCNICAS: DE RECOLECCIÓN DE datos (muesreo)

DE PROCESAMIENTO DE DATOS(Estadística

Inferencial)

INSTRUMENTOS SOFTWARE ESTADÍSTICO)

MARCO TEÓRICO Y REFERENCIAL

ESQUEMA TENTATIVO DE LA TÉSIS O PROYECTO DE GRADO

ANEXOS

BIBLIOGRAFÍA

Page 7: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 7

Metodología de la investigación:

1.-Planteamiento del problema y de la hipótesis:

Se define claramente los objetivos del

estudio,se toma una m.a. cuyos datos se utilizan

para la inferencia sobre el modelo asignado ó

contrastando valores para sus parámetros

2.-Recolección de datos:

a)Datos publicados,b)diseño experimental

c)Encuesta

3.-Organización y clasificación de datos:

se debe realizar un análisis de consistencia

4.-Análisis e interpretación de los datos

D

E

S

C

R

I

P

T

I

V

A

Page 8: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 8

• METODOLO´GIA DE LA INVESTIGACIÓN

• 5.-Realización de Inferencia

• PRUEBAS PARAMÉTRICAS .-representar la incertidumbre asociada a la característica en cuestión ,a un modelo probabilístico cuyos parámetros se desconocen

• Estimación de los estadísiticos :

• a) Puntual ,b) Por Intervalos de Confianza

• 6.-Realizar el TEST DE HIPóTESIS

• Contrastar la validez de algún supuesto

• acerca de los valores de los parámetros ó

• de la Distribución del modelo ,(por IC ó de Siginificancia,y el “P” value),ó predecir.

I

N

F

R

E

N

C

I

A

Page 9: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 9

1.2.- Tipos de Muestreo

• Muestreo.- herramienta fundamental de la investigación científica,cuya función básica es determinar q´parte representatriva de la población en estudio debe examinarse con el fin de realizar Inferencia sobre dicha Población.

• Razones para tomar muestras:

• a) Poblaciones muy grandes ó infinitas ó desconocidas

• b)Costos más económicos en muestras que en poblaciones

• c) Mayor rapidez en la recolección de una m.a que el de una población

• d) Mayor exactitud.-al reducirse el volumen de trabajo se puede emplear personal más capacitado y someterlo a un entrenamiento intensivo,supervisión del trabajo de campo y procesamiento de los resultados,resultados más exactos que la enumeración completa

• e)Destrucción de las unidades estudiadas

Page 10: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 10

Tipos de muestreo

NO PROBABILÍSTICO

INVESTIGADOR

CONOCE LAS

CARACTERÍSTICAS DE LA

POBLACIÓN

→CERTIDUMBRE → →

VARIABLE ESTADÍSTICA

→ESTADÍSTICA DESCRIPTIVA

PROBABILÍSTICO

INVESTIGADOR NO CONOCE

LAS CARACTERÍSTICAS DE

LA POBLACIÓN

→INCERTIDUMBRE

→VARIABLE ALEATORIA

→ESTADÍSTICA INFERENCIAL

Page 11: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 11

TIPOS DE MUESTREO

PROBABILÍSTICOS

• MUESTREO ALEATORIO SIMPLE ( M.A.S.)

• MUESTREO ALEATORIO

SISTEMÁTICO(M.A.Sys)

• MUESTREO ALEATORIO

ESTRATIFICADO(M.A.E)

• MUESTREO ALEATORIO

CONGLOMERADO(M.A.C.)

• MUESTREO POLIETÁPICO(M.U.M)

Page 12: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 12

MUESTREO ALEATORIO SIMPLE (M.A.S) CON ó sin

REPOSICIÓN

• La población es homogénea y no muy grande, todos los

elementos tienen la misma posibilidad de ser tomados en

cuenta

• PROCEDIMIENTO.- las extracciones que se realizan

manual ó mediante la generación de Nº aleatorios

mediante el PC ,con reposición son independientes ,y si

es sin reposición son dependientes Sea una N(1000)

201 100

Page 13: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 13

MUESTREO ALEATORIO SISTEMÁTICO (M.A.Sys)

Sea una población grande homogénea N= 1000

,se toma

una m.a. n=50→K=N / n =1000 / 50=201k= 20 2k=40 3k=60 4k=80 5k=100

6k=120 7k 8k 9k 10k

: : : : :

46k 47k 48k=960 49k=980 50k=100

0

Page 14: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 14

Ventajas y desventajas del M.A.Sys

• Ventajas:

• - Mayor representatividad que un m.a.s. porque es

más facíl sacar una m.a y se lo puede hacer en

una oficina ahorrando tiempo

• -Es casi tan preciso como el estratificado

• Desventajas.

• -Sólo se pueden tomar k muestras distintas

• -Los elementos de la m.a son dependientes

• -No es válido si la característica se presenta

periodicamente y no coincide con la posición K

Page 15: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 15

Muestreo aleatorio estratificado(M.A.E)

Se aplica en poblaciones heterogéneas desde el punto de vista de la

característica.por lo que se divide en L clases o L estratos homogéneos• Sea una Población heterogénea dispersa N tal que N1+N2+…+Nl =N

• Ni = subpoblaciones, cuya m.a. n tal que n1+n2+…+nl =n

• =estratos ni= submuestras

N1

n1

N2

n2

N3

n3

N4

n4

… NL

nl

n1 n2 n3

n4 nl

Page 16: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 16

Ventajas y desventajas del M.A.E.

• Ventajas.-

• -permite aplicar técnicas de selección diferentes en cada estrato

• -Permite realizar inferencia en cada uno de los estratos.

• -Mayor precisión en los estimadores

• -Permite disminuir el tamaño de la muestra

• Desventajas.- si la población está muy dispersa se requiere mucho dinero en cuanto al aspecto logístico

Page 17: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 17

Selección del tamaño de cada submuestra en el

M.A.E

• -Afijación uniforme (ni=nj=nl)

• -Afijación proporcional /estrato (Wh= Nh/N)

• -Afijación de Mínima Varianza

• -Afijación óptima( en función de sus costos)

• (V óptima≤ V proporcional ≤ V ran)

Page 18: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 18

Notación y definición en el M.A.E• .-Una vez estratificado la población y determinados las

submuestras:

• -Los símbolos que se refieren al estrato h. son:

• h= Identidad del estrato , i = la unidad dentro el estrato

• Nh=Nº total de unidades en el h-ésimo estrato

• nh=nº de unidades en la h-ésima muestra

• yhi = valor obtenido para la i-ésima unidad del h-esimo estrato

• Wh = Nh / N = ponderación del estrato h-ésimo

• fh = nh / Nh = fracción del muestreo del h-ésimo estrato

• Ÿh = yhi / Nh = media verdadera ;ÿ = yhi /nh media muestral del h-ésimo estrato

• S²h = ( yhi –Ÿh ) ² / Nh =varianza verdadera del h-ésimo estrato

Page 19: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 19

Muestreo aleatorio por conglomerados

(M.A.C)

Se aplica también en poblaciones heterogéneas y

dispersonas desde el punto de vista geográfico• Sea una población muy heterogénea y dispersa desde el punto de vista

geográfico N se divide en Mu unidades de conglomerados heterogéneos

• M1 M2 M3 ….. Mu

M1 M2 M3 ….

….

Mu

n1 n2 n3 nu

Page 20: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 20

Muestreo polietápico(MUM)• En la práctica casi es común utilizar diferentes

tipos de muestreo ,es decir debe realizar en

varias etapas ,así por ejemplo cuando se

utiliza el M.A.E ó el M.A.C ,en cada estrato ó

en cada conglomerado se debe aplicar el

M.A.S.

• Otro caso tenemos en el muestreo de

la”Unidad monetaria” gralmente aplicable en

Auditoría que consiste en tomar como

unidades aquellos expedientes con mayor

cantidad monetaria y dentro cada expediente

aplicar el M.A.S.

Page 21: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 21

• 2.Estadísticos muestrales• DEFINICIÓN Y NOTACIÓN.-.

• -CARACTERÍSTICAS O ATRIBUTOS(Y).-ciertas propiedades q´se quiere medir,analizar,registrar, etc. Para cada unidad de la población si es muestral (y).

• CARACTERÍSTICAS QUE ANALIZA EL MUESTREO.-

• Analiza 4 características de la población:

• 1) El total (Y)

• 2)la Media E ( Y)

3) La Proporción(P)

4)La Razón( R )

Page 22: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 22

NOTACIÓN

Característica Población(N) Muestra(n)

1.-Valores yi = y1,y2,...,yN yi = y1,y2,...,yn

2.-Total Y= yi = y1+y2+,...,+yN ; y = yi = y1 +y2+,...,+ yn

3.-La Media Ÿ = yi / N ; : ÿ = yi / n

4.-La Razón R= Y / X : r = y / x

5.-Proporción P= X/N : p = x/n

Page 23: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 23

Estadísticos muestrales• ESTIMACIONES Ó ESTADÍGRAFOS

• a)Del total(Y)

• Ŷ = N ÿ = N yi / n,donde N/ n = factor

de expansión

• b) De la media (Ÿ) ÿ = yi / n ,donde

n/N =f ,fracción muestral

• c)De la Varianza(σ²) S² = ∑(xi-x)²/ n

• c) De la razón(Ř) r = y / x = yi / xi

Page 24: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 24

• ESTADÍSTICOS MUESTRALES• Varianza muestral S² = Σ ( yi –y )²/ n

• Varianza de Cochran ó

• cuasi varianza S² =Σ ( yi –y )²/ n-1

• Media muestral E(y ) = Y =µ

• Varianza de la media muestral V(y) = σ²/ n

• Media de la Varianza muestral E(S²) = (n-1)σ²/n

• MEDIA DE LA CUASI VARIANZA E(S²) = σ²

• Caso particular si Y →Bernoulli(p)

• Proporción muestral p =y/n ó Σyi/n

• Media de la proporción muestral E(p) =P

• Varianza de la proporción muestral V(p)= pq/n

Page 25: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 25

INTERVALOS DE CONFIANZA.-

(n 50)

1.-IC PARA LA MEDIA (Ÿ) al 100 r % = [ ÿ ± Zo S 1 –f / n ]

donde Zo P(Z< Zo) = (1+ r) / 2

2.-IC PARA EL TOTAL (Y). Al 100r% = [ Nÿ ± ZoN S 1 –f / n ]

-3.-IC para la Proporción (P) al 100% = [p ± Zo S 1 –f / n ]

Nota cuando la muestra es pequeña ,es decir n < 50 se debe utilizar la

distribución “t”, El valor crítico es to

donde to P(T<to) = (1+ r) / 2 ; tiene distribución n-1 g.d l.

NIVELES DE SIGNIFICACIÓN ( ) = 50% 20% 10% 5% 1%

NIVELES DE CONFIANZA ( r ) = 50% 80% 90% 95% 99%

VALORES CRÍTICOS (n≥50) ( Zo) = 0.67 1.28 1.65 1.96 2.58

Page 26: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 26

Ej. Se recabó información sobre una cadena de 676 internets.Cada

internet tiene 42 CPU’s ,pero en muchos internetsde no todos los PC

funcionan normalmente.Se contó el Nº CPU’s por internet que funcionan

normalmente. De 50 Internets(aprox. El 7%) cuyos resultados están en la

tabla,donde :N=Tamaño de la póblación 676; n=50 yi = nº de PC

q´funcionan ; fi =f recuencias./,internet Se pide estimar

a) El Nº total de PC que funcionan normalmente

b)La varianza de la muestra c)El IC para el total al 80%

yi : 42 41 36 32 29 27 23 19 16 15 14 11 10 9 7 6 5 4 3 Total

fi : 23 + 4+ 1+ 1+ 1+ 2 + 1+ 1+ 2 + 2+ 1+ 1+ 1+ 1+ 1+ 3+ 2 +1+ 1 50

Yifi : 966+…………………………………………………… +10 + 4+ 3 1 471

yi²fi:40572 + ………………………………………………… +50 +16 + 9 54 497

Page 27: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 27

Sol.- Datos . N= 676 ; Unidad muestral = internet n= 50 internet

a)Estimación del Total Y Ŷ = Nÿ = N yi fi / n = 676 (1471)/ 50=19888

fPC q funcionan normalmente

b) Varianza muestral S² = (1 / n-1) [ yi² fi –( yi fi )²/n],reemplazando

S² = (1/ 49) [54497 –(1471)²/ 50] = 229.0 PC²

la desviación típica S = 229 firmas ² = 15.1327 PC

c) El IC para el total(Y) al 80%,:

= [ 19888 1.28(676)(15.13)(0.9623) / 50 ] = [18 107 ; 21 669 ]

Significa que de entre 100 muestras diferentes que se pueden obtener de

ésa población se espera que 80 muestras darán la estimación del total

entre 18 107 y 21 669 PC que funcionan normalmente

Page 28: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 28

4.-TAMAÑO MUESTRAL• En forma general depende:

• 1)Si la población es finita conocida ó infinita desconocida

• 2)Del Error admitido ( acuerdo a la calidad de la v.a.)

• 3)Del nivel de significación( α →Mín)

• 4)Del tipo de muestreo aplicable(con o sin reposicion)

• 5)Del estadístico utilizado en la investigación

• La fórmula gral n= no N / [no +(N-1)]

• donde : n=tamaño de la muestra

• N= tamaño de la población

• no= tamaño de la m.a inicial

Page 29: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 29

Determinación del tamaño de la muestra

inicial no

a) Para la media

1) no= (Zo σ/ E)²;(n≥50)

2) no= (to S/ E)²;(n<50)

Donde Zo=P(Z<zo)=(1+r)/2

to= P(T<to) =(1+r)/2

to→T con n-1 gdl

b) Para la proporción

Si se supone P conocido:

3) no= Zo²pq/E² ;(n≥50)

Si no se conoce P

4)no=1/4 (Zo/E)²

Donde Zo=P(Z<zo)=(1+r)/2

Page 30: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 30

Ejemplos para estimar el tamaño de la

m.a.• Ej. 1)Un investigador quiere determinar el tiempo

promedio que un ensamblador tarda en ensamblar

las partes de un ordenador,con una confianza del

95% que la media de su m.a. tenga un error a lo

máximo de 0.50 minutos.Se presume por

experiencia que la σ= 1.6 minutos.Qué tamaño

debe ser la muestra?

• Solución : Y:”tiempo de ensamblaje en minutos”

• Datos; E=0.5, σ= 1.6 ; r=95% →Zo=1.96

• Por 1) n= (Zo σ/ E)² → n=(1.96*1.6 /0.5)² =39.3

=40

• n= 40

Page 31: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 31

• Ej 2)Se desea estimar el Nº promedio de días de uso

continuo antes de que cierto tipo de PC requiera su

reparación inicial, si se supone que la σ= 6 días de un

lote de 100 PC s .De qué tamaño debe ser la m.a.

para asegurar con una confianza del 90% que la

media muestral difiera a lo más por 2 días?

• Solución.- Y:”Tiempo de uso del pc en días”

• Datos: N= 100; σ= 6 ;r= 0.90 → Zo= 1.645 ,E=2

• Por la fórmula general:n= no N/ [no +(N-1)]

• no= (1.645*6 /2)²= 24.354225

• n= 24.354225*100 / [24.354225+(100-1)]= 19.74=20

Page 32: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 32

• Ej.3)Se desea estimar la Proporción real de CD´s defectuosos

en un importación muy grande ,al nivel de un 95% se admite un

error a lo sumo de un 4%.de qué tamaño debe ser la m.a. si

• a) No se conoce la proporción real

• b)Se sabe q’ la proorción real de defectuosos es 12%

• c)Si se conoce el tamaño de la Importación =5000

• Solución.-a) r=0.95→Zo=1.96;E=0.04 n=?

• Por 4) no= (Zo/2E)²= (1.96 / 2*0.04)²= 600

• b) p=0.12 →q=0.88; por 3) no= Zo²pq/E²

• n= 1.96²(0.12)(0.88) / (0.04)²= 254

• c) N=5000 por :n= no N/ [no +(N-1)]

• n=254*5000 /[254 +(5000-1)] =242

Page 33: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 33

• Conctrucción de los estratos

Una población de 13 435 datos cuya Distribución de frecuencias .Determinar

a) los tamaños de los estratos(Nh) b)elTamaño de la m.a (n) si se quiere

minimizar el mismo para una V(ÿst) =0.01 puede obiar la cpf.c) Determine

los tamaños de las submuestras

Deterdeterminar √fi→ la F(√ fi). De la siguiente manera.

Ii fi √fi F(√fi) Ii fi √ fi F(√fi )

0 -5 3464 58.9 58.9 50-55 125 11.2 340.3

5-10 2516 50.2 109.1 55-60 107 10.3 350.6

10-15 2157 46.4 155.5 60-65 82 9.1 359.7

15-20 1581 39.8 195.3 65-70 50 7.1 366.8

20-25 1142 33.8 229.1 70-75 39 6.2 373.0

25-30 746 27.3 256.4 75-80 25 5.0 378.0

30-35 512 22.6 279.0 80-85 16 4.0 382.0

35-40 376 19.4 298.4 85-90 19 4.4 386.4

40-45 265 16.3 314.7 90-95 2 1.4 387.8

45-50 207 14.4 329.1 95-100 3 1.7 389.5

Page 34: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 34

• Construción de estratos

• Suponiendo se quiere tener 5 estratos

• Supuestamente serían F(√fi )/ L= 389/5= 77.9

• 77.9 -155.8 -233.7- 311.6 pero los nº más

cercanos son:

• Estratos

• 1 2 3 4 5

• Ii. 0-5 5-15 15-25 25-45 45-100

• Fi,√fi 58.9 96.6 73.6 85.6 74.8

Page 35: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 35

• N1 = 3464 N2= 4673 N3=2723 N4=1899 N5=676

• W1= N1/N =3464/13435=0.26;

W2=4673/13435=0.35 W3= 0.20 W4=0.14 W5=0.05

• n1= ? n2=? n3= ? n4= ? n5= ?

• h Wh Sh WhSh nh W1 = N1/N=

3464/13435=0.26

• 1 0.26 5 1.30 903

• 2 0.35 10 3.50 2432

• 3 0.20 7 1.40 973

• 4 0.14 5 0.70 486

• 5 0.05 1 0.05 36

• Total 1 69.5 4830

Page 36: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 36

• A) por D)Asignación óptima revisada

Vmin(ÿst)=(ΣWhSh)² / n) – Σ WhSh² / N (cpf)

0.01 =(6.95)²/n → n = 4830

b) Por A)Minimizar V(ÿst) para un n total fijo

(NEYMAN)

nh= nWhSh / ΣWhSh =nNhSh / ΣNhSh

n1=4830(1.3)/6.95 =903

n2 = 4830(3.5)/6.95=2432

n3 = 4830(1.4)/6.95= 973

n4 = 4830(0.7)/6.95= 486

n5 = 4830(0.05)/6.95= 36

n=4830

Page 37: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 37

• VARIABLES ESTADÍSTICAS

Es toda característica que se desea estudiar de la población y que toma mínimamente dos valores:

X: x1 ,x2,...,xn

CLASES DE VARIABLES:

1.-CUANTITATIVAS.- Son aquellas que se pueden contar o medir,tenemos: a) Discreta y b)continuas

2.-CUALITATIVAS.-Son aquellas que guardan algún atributo o característica,tenemos:a)Nominal y b) ordinal

Page 38: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 38

• CICLO METODOLÓGICO

POBLACION (N)

MUESTRA

(n)

MUESTRA

(n)

muestreo

Toma de decisiones

Estadística inferencial

Estadística

descriptiva

Page 39: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 39

Metodología de la investigación:

1.-Planteamiento del problema y de la hipótesis:

Se define claramente los objetivos del

estudio,relacionando con los valores numéricos de

las variables observables(y =efecto ;x =causa)

2.-Recolección de datos:

a)Datos publicados,b)diseño experimental

c)Encuesta

3.-Organización y clasificación de datos:

se debe realizar un análisis de consistencia

4.-Análisis e interpretación de los datos

Page 40: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 40

• ORGANIZACIÓN DE LOS DATOS:

• Una vez recopilados los datos ,éstos se los

deben presentar en:

1.-Cuadros estadísticos.-que deben tener:

a) Título descriptivo y numerado(superior)

b) Fuente de los datos(pie de página)

c) Unidades en que se expresan

• 2 .-Gráficos:

a) De barras (Verticales u horizontales)

b) Circulares

Page 41: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 41

• DISTRIBUCIÓN DE FREC. DE V

.CUALITATIVAS

Cuadro Nº 1.1. Distrib.de frec. De..........Categorías

X

Frecuencias

absolutas simples

fi

Frecuencias

relativas hi

Porcentajes pi

C1

C2

.

.

Ck

f1

f2

.

.

fk

h1

h2

.

.

hk

p1

p2

.

.

pk

Totales n 1 100

Page 42: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 42

• Ejemplo.-

En una entrevista a 20 alumnos sobre la preferencia por

tipos de ordenadores:A,B,C,se obtuvieron los siguientes

resultado:

A,B,B,A,C,B,B,A,A,B,A,B,B,C,A,B,A,C,A,B, Cuadro nº

1.2.Distrib.de alumnos por pref.de pc

Tipo de PC

X fi hi pi %

A 8 0.40 40

B 9 0.45 45

C 3 0.15 15

Totales 20 1.00 100

Page 43: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 43

0

1

2

3

4

5

6

7

8

9

Xi

A

B

C

Figura Nº gráfica de barras

Page 44: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 44

• Distribución de frec.de v.cuantitativas discretas

Valores

X

fi hi pi %

x1 f1 h1 p1

x2 f2 h2 p2

.

.

.

.

.

.

.

.

xk fk hk pk

Totales n 1.00 100

Valores

X

fi hi pi %

x1 f1 h1 p1

x2 f2 h2 p2

.

.

.

.

.

.

.

.

xk fk hk pk

Totales n 1.00 100

Page 45: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 45

Distrib.de frec. por Intervalos o clases (n>30)

Cuadro Nº.. Distrib. de frec. por intérvalosIntérvalos

Ii

Xi fi hi pi %

I1 X1 f1 h1 p1

I2 X2 f2 h2 p2

.

.

.

.

.

.

.

.

.

.

Ik Xk fk hk pk

Totales n 1.00 100

Page 46: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 46

Procedimiento: ordenar los datos y

determinar:

1.-El alcance (A) A=[Valor Mínimo,Valor Máximo]

2.-El Rango (R) R=|Valor Máx-valor Mín|

3.-Nº de Intérvalos (k)

a) 5 < k < 20

b) k=1+3.3 log(n)

4.-Ancho de clase (wi) Wi=|L i +1 -Li|

igual ancho W = R/k

5.-Marca de clase Xi = (Li + Li+1)/2

Page 47: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 47

• Ejemplo.- se tiene los ingresos quincenales

en $us(X) de 45 familias:

63 89 36 49 56 64 59 35 78

43 53 70 57 62 43 68 62 26

64 72 52 51 62 60 71 61 55

59 60 67 57 67 61 67 51 81

53 54 76 44 73 56 62 63 60

Se pide clasificar en 8 clases

Page 48: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 48

• Cuadro Nº... Distrib.de frec.de los ingresos

de 45 familias en dólares

Ii Xi fi hi pi%

[26,34>

[34,42>

[42,50>

[50,58>

[58,66>

[66,74>

[74,82>

[82,90>

30

38

46

54

62

70

78

86

1

2

4

10

16

8

3

1

0.022

0.044

0.089

0.222

0.356

0.178

0.067

0.022

2.2

4.4

8.9

22.2

35.6

17.8

6.7

2.2

totales 45 1.000 100

Page 49: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 49

Histograma de los ingresos de 45 familias

0

2

4

6

8

10

12

14

16

30

38

46

54

62

70

78

86

fi

xi

Page 50: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 50

Frecuencia absoluta simple fi

Es el Nº de datos observados en cada categoría

Tal que : Σfi =n

Frecuencia relativa simple hi

Es la proporción por cada categoría .

Tal que: hi = fi/n ; Σhi =1

Porcentaje pi

Es el tanto por ciento de cada categoría

Tal que pi = 100%hi ; Σpi = 100%

Frecuencia Abs.acumulada Fi

Nº de obs.menores que el límite superior de determinada clase

Tal que :F1=f1 ; Fi= F i-1+fi

Frecuencia Relativa acumulada Hi

Es la proporción menor al límite superior de determinada clase

Tal que :Hi = hi , Hi= Hi-1 +hi ; Hi = Fi/n ; i=1,2,3,....k

Page 51: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 51

TEMA Nº 3 MEDIDAS DE POSICIÓN

Tenemos:La media , la media geométrica armónica,

cuadrática , la mediana,la moda,los cuantiles:

La media aritmética :

a) Para datos no clasificados

poblacional µ =Σ Xi/N ;muestral X = Σxi/n

b)Para datos clasificados

poblacional µ = Σ (xi fi)/N;muestral X = Σ (xi fi)/n

Del Ej. De los ingresos de 45 familias ,el ingreso medio ó

percápita es X = Σ (xi fi)/n = 2702/45

X = 60,04 $us semanal

Page 52: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 52

Propiedades de la media aritmética

Sean: a,b,c, constantes ; x,y variables

1.- M( c ) =C

2.- M( x+ c ) = M( x ) + c

3.- M( ax ) = a M( x )

4.- M ( ax+ b) =aM( x ) +b

5.- M [ x – M( x ) ] = 0

Page 53: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 53

• La Mediana- Xm ó Md

• 1.-Para datos no clasificados,una vez ordenado,la mediana es:

• a) Cuando n es impar es el valor central

• b) Cuando n es par es el promedio de los dos valores centrales

• 2.-Para datos clasificados

• Xm = Lm + Wm [n/2 –F m-1 ] / fm, donde

• la clase mediana se obtiene.

• ;Fm n/2 Im = [ Lm ,Lmi +1>

Page 54: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 54

LA MODA Xmo Ó Mo.-para datos clasificado

Mo = Li + Wi [ 1 / (1 + 2 ) ] ; 1 =fi –fi-1 ; 2 = fi –fi +1

Ej se tiene la siguiente distribución de frecuencias de alturas

(pulg ) de 100 personas

Hallar a) La media,b)La Mediana c) la Moda

Ii Xi fi Fi Xi fi (xi-

67.95)²fi

60-63

63-66

66-69

69-72

72-75

61.5

64.5

67.5

70.5

73.5

5

18

42

27

8

5

23

65

92

100

307.5

1161.0

2835.0

1903.5

588.0

208.0125

214.2450

8.5050

175.5675

2.46.4200

total 100 6795.0 852.7500

Page 55: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 55

• Solución

a)la media X = 6795 / 100 = 67,95 pulg

b)La mediana Xm = 66+3[50-23] / 42 =67.90 pulg

c)La moda Mo = 66+3[24 / (24+15 ] =67.8 pulg

Media geométrica .-(G)se utiliza cuando el conjunto es una

P.G. Porcentajes.índices etc..

Media armónica (H) .- se utiliza cuando el conjunto es un

P.A., tasas, muestra pequeña etc.

Page 56: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 56

Tema nº 4 MEDIDAS DE DISPERSIÓN

1.-La varianza V(X)

Def gral. V(X) = E[ (x – x )²]

a) Datos no clasificados

S²= Σ (xi – x)² / n-1

b) datos clasificados

S²= Σ (xi – x)² fi / n-1

2.-La desviación típica s

s = V(x)

3.- Coeficiente de variación CV

CV = S / x * 100 %

Page 57: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 57

Ej. De la anterior distribución hallar a) la varianza b) la

desviación c) el coeficiente de variación.

Solución

a) La varianza:

S² = 852.75 / 100 = 8.5275 pulg ²

b) La desviación típica :

S = 8.5275 pulg² = 2.92 pulg

c) El cv =( 2.92 / 76.95 ) *100% =4.30 %

Page 58: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 58

Propiedades de la Varianza

Sean : a,b,c constantes, X;Y variables

1.-V( c ) = 0

2.-V (X+ c) = V(X)

3.-V( aX ) = a² V (X)

4.-V(aX +b)= a² v(X)

5.-V(X)=M(x²) –[ M(x) ]² ;donde

M(x²)= xi² /n, para datos no clasificados;

M(x²)= xi²fi / n,para datos clasificados

Page 59: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 59

Momentos.- Definición Gral : E[ (x-a)*]; *= r =1,2,3,..

a) Momentos originales; si a=0

m´r =E [x *] = Σ xi * fi / n

b) Momentos centrales; si a = x

m r = E[ (xi-x)* ] = Σ( xi-x)*fi / n ;*=r = 1,2,3....

Coeficiente de asimetría

Sk = ( x – Mo) / s , si: Sk > 0 sesgado a la derecha

Sk < 0 sesgado a la izquierda

Sk = 0 simétrico

Coeficiente de Kurtosis

Cx = 4 / ( ²)² si Cx >0 leptocúrtico

si Cx <0 platicúrtico

si Cx =0 mesocúrtico

Page 60: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 60

Tema nº 5 REGRESIÓN LINEAL SIMPLE

V.E.Bidimensional (X,Y)

-La regresión surge en el análisis de la forma funcional

entre X (causa) ,Y(efecto)

-La correlación surge en el análisis de asociación entre X ,Y

- Diagrama de dispersión .- es el gráfico de los pares (xy)

,que da la pauta de la forma funcional entre X e Y

- La covarianza mide el grado de dispersión conjunta entre

X ,Y

- Coeficiente de correlación r.-mide el grado de asociación

lineal entre X e Y

- -1< r < 1

Page 61: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 61

Regresión lineal simple .- Y= a + bX ,consiste en estimar la

ec.de la recta con el fin de predecir o estimar Y (dependiente) a

partir de x( independiente)

Donde a= intercepto; b= pendiente o coeficiente de regresión

Estimación mediante los MCO

Ŷ = â + b X donde b= n [Σxiyi –ΣxiΣyi] / n[Σx²-(Σx)²]

â = y –b x

si b>0 la tendencia lineal es creciente

si b<0 la tendencia lineal es decreciente

si b=0 no hay regresión por que Y= a

Page 62: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 62

• Ejemplo.-

En un estudio de la relación entre la publicidad por tv y las

ventas de ordenadores durante 10 semanas se han

recopilado los tiempos de duración en minutos de publicidad

por semana (X) y el nº de ordenadores vendidos(y) siendo:

Semana 1 2 3 4 5 6 7 8 9 10

Publicidad(X) 20 30 30 40 50 60 60 60 70 80

Ventas(Y) 50 73 69 87 108 128 135 132 148 170

a)Estimar la recta de regresión ,b) el r c) Estime

las ventas si la publicidad es de 90 minutos

Page 63: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 63

• Solución

Cuadro Nº ...

x y xy X² Y²

20

30

30

40

50

60

60

60

70

80

50

73

69

87

108

128

135

132

148

170

1000

2190

2070

3480

5400

7680

8100

7920

10360

13600

400

900

900

1600

2500

3600

3600

3600

4900

6400

2500

5329

4761

7569

11664

16384

18225

17424

21904

28900

500 1100 61800 28400 134660

Page 64: COMPETENCIAS Y OBJETIVOS - usalesiana

28/02/2012 TPAU 64

SOLUCIÓN

a) b=[10(61800)-500(11009] / [10(28400)-500²] =

b = 68000 / 3400=2 ; b=2

a = 110- 2(50) = 10 ; a=10

Por lo tanto ŷ = 10 + 2 X

b) El r= n [Σxiyi –ΣxiΣyi] / n[Σx²-(Σx)²] * n[Σy²-(Σy)²] =

=680 /681.5424 = 0.998 , r=0.998 altamente positivo

c) Estimación para x=70 ;ŷ = 10 + 2 (90) = 190

ordenadores