COMPETENCIAS Y OBJETIVOS - usalesiana
Transcript of COMPETENCIAS Y OBJETIVOS - usalesiana
28/02/2012 TPAU 1
COMPETENCIAS Y OBJETIVOS
• UNIDAD I :ESTADISTICA DESCRIPTIVA
• Competencia:
• -El estudiante debe utilizar correctamente los procedimientos ,técnicas y métodos estadísticos,en el tratamiento y procesamiento de datos de todo trabajo de investigación científica
• Objetivos.
• -Aplicar adecuadamente las técnicas y procedimientos estadísticos como metodología de toda investigación principalmente en la Ingeniería.
• Descripción general de la unidad:
• -Esta unidad comprende el desarrollo de los siguientes aspectos :ciclo metodológico de la investigación estadística, recopilación. organización ,clasificación y descripción de datos de una muestra aleatoria o población; determinación y utilización de las medidas descriptivas.
• Lectura:Millar/Freund/Jonson “Probabilidad y Estadística para Ingenieros”Edo.de México 1992 Pgs.1 al 40
• Córdova Zamora “Estadística Descriptiva e Inferencial” 2ª ed.Perú 1996 Pags,1 al 69
• Bibliografía Básica: García Oré (1995) “Estadística descriptiva y Probabilidades”(2ª ed) Perú .Pags.2al 83
• Referencia electrónica: http://thales.cica.es/red/Recursos/rd99/ed99-0278-01/inicio.html
Estadística DescriptivaCONTENIDO MÍNIMO
1.-INTRODUCCIÓN A LA ESTADÍSTICA(muestreo)
2.-ORGANIZACIÓN Y CLASIFICACIÓN DE DATOS
3.-MEDIDAS DE POSICIÓN
4.-MEDIDAS DE DISPERSIÓN
5.-REGRESIÓN LINEAL SIMPLE
28/02/2012 TPAU 3
Introducción a la
Estadística1.-DEFINICIÓN.- Como ciencia proporciona un
conjunto de métodos,técnicas y/o procedimientos ,para recopilar,organizar,presentar ,analizar datos,con el fin de realizar generalizaciones válidas,para tomar decisiones coherentes,ante la incertidumbre,acerca de la población o sus parámetros a partir de datos extraídos de una muestra.
• ESTADÍSTICA DESCRIPTIVA.
• ESTADÍSTICA INFERENCIAL
28/02/2012 TPAU 4
• POBLACIÓN (N).-Conjunto universo,motivo
de análisis que tiene por lo menos alguna
característica en común,el proceso para
obtener toda la información de la población se
llama censo
• PARÁMETRO.- Es un nº resumen que
sintetiza alguna característica de la población
• MUESTRA (n).- Es un subconjunto propio
representativo de la población,el proceso para
la obtención de los datos muestrales se llama
muestreo
• ESTADÍGRAFO.-Es un nº sintético que
resume alguna característica de la muestra
28/02/2012 TPAU 5
1.- INTRODUCCIÓN AL MUESTREO
PROCESO DEL DESARROLLO CIENTÍFICO
DESARROLLO DEL CONOCIMIENTO
MÉTODO ESTADÍSTICO
OBSERVACIÓN DEL
FENÓMENO
FORMULACIÓN DE
LA HIPÓTESIS
VERIFICACIÓN
DE LA HIPÓTEIS
MÉTODO CIENTÍFICO
28/02/2012 TPAU 6
PERFIL DE TESIS TÍTULO
JUSTIFICACIÓN
FORMULACIÓN DEL PROBLEMA
HIPÓTESIS
OBJETIVOS:
METODOLOGÍA:
MÉTODOS : inductivo,deductivo,hidtórico,lógico,experimental etc.
.TÉCNICAS: DE RECOLECCIÓN DE datos (muesreo)
DE PROCESAMIENTO DE DATOS(Estadística
Inferencial)
INSTRUMENTOS SOFTWARE ESTADÍSTICO)
MARCO TEÓRICO Y REFERENCIAL
ESQUEMA TENTATIVO DE LA TÉSIS O PROYECTO DE GRADO
ANEXOS
BIBLIOGRAFÍA
28/02/2012 TPAU 7
Metodología de la investigación:
1.-Planteamiento del problema y de la hipótesis:
Se define claramente los objetivos del
estudio,se toma una m.a. cuyos datos se utilizan
para la inferencia sobre el modelo asignado ó
contrastando valores para sus parámetros
2.-Recolección de datos:
a)Datos publicados,b)diseño experimental
c)Encuesta
3.-Organización y clasificación de datos:
se debe realizar un análisis de consistencia
4.-Análisis e interpretación de los datos
D
E
S
C
R
I
P
T
I
V
A
28/02/2012 TPAU 8
• METODOLO´GIA DE LA INVESTIGACIÓN
• 5.-Realización de Inferencia
• PRUEBAS PARAMÉTRICAS .-representar la incertidumbre asociada a la característica en cuestión ,a un modelo probabilístico cuyos parámetros se desconocen
• Estimación de los estadísiticos :
• a) Puntual ,b) Por Intervalos de Confianza
• 6.-Realizar el TEST DE HIPóTESIS
• Contrastar la validez de algún supuesto
• acerca de los valores de los parámetros ó
• de la Distribución del modelo ,(por IC ó de Siginificancia,y el “P” value),ó predecir.
•
I
N
F
R
E
N
C
I
A
28/02/2012 TPAU 9
1.2.- Tipos de Muestreo
• Muestreo.- herramienta fundamental de la investigación científica,cuya función básica es determinar q´parte representatriva de la población en estudio debe examinarse con el fin de realizar Inferencia sobre dicha Población.
• Razones para tomar muestras:
• a) Poblaciones muy grandes ó infinitas ó desconocidas
• b)Costos más económicos en muestras que en poblaciones
• c) Mayor rapidez en la recolección de una m.a que el de una población
• d) Mayor exactitud.-al reducirse el volumen de trabajo se puede emplear personal más capacitado y someterlo a un entrenamiento intensivo,supervisión del trabajo de campo y procesamiento de los resultados,resultados más exactos que la enumeración completa
• e)Destrucción de las unidades estudiadas
28/02/2012 TPAU 10
Tipos de muestreo
NO PROBABILÍSTICO
INVESTIGADOR
CONOCE LAS
CARACTERÍSTICAS DE LA
POBLACIÓN
→CERTIDUMBRE → →
VARIABLE ESTADÍSTICA
→ESTADÍSTICA DESCRIPTIVA
PROBABILÍSTICO
INVESTIGADOR NO CONOCE
LAS CARACTERÍSTICAS DE
LA POBLACIÓN
→INCERTIDUMBRE
→VARIABLE ALEATORIA
→ESTADÍSTICA INFERENCIAL
28/02/2012 TPAU 11
TIPOS DE MUESTREO
PROBABILÍSTICOS
• MUESTREO ALEATORIO SIMPLE ( M.A.S.)
• MUESTREO ALEATORIO
SISTEMÁTICO(M.A.Sys)
• MUESTREO ALEATORIO
ESTRATIFICADO(M.A.E)
• MUESTREO ALEATORIO
CONGLOMERADO(M.A.C.)
• MUESTREO POLIETÁPICO(M.U.M)
28/02/2012 TPAU 12
MUESTREO ALEATORIO SIMPLE (M.A.S) CON ó sin
REPOSICIÓN
• La población es homogénea y no muy grande, todos los
elementos tienen la misma posibilidad de ser tomados en
cuenta
• PROCEDIMIENTO.- las extracciones que se realizan
manual ó mediante la generación de Nº aleatorios
mediante el PC ,con reposición son independientes ,y si
es sin reposición son dependientes Sea una N(1000)
201 100
28/02/2012 TPAU 13
MUESTREO ALEATORIO SISTEMÁTICO (M.A.Sys)
Sea una población grande homogénea N= 1000
,se toma
una m.a. n=50→K=N / n =1000 / 50=201k= 20 2k=40 3k=60 4k=80 5k=100
6k=120 7k 8k 9k 10k
: : : : :
46k 47k 48k=960 49k=980 50k=100
0
28/02/2012 TPAU 14
Ventajas y desventajas del M.A.Sys
• Ventajas:
• - Mayor representatividad que un m.a.s. porque es
más facíl sacar una m.a y se lo puede hacer en
una oficina ahorrando tiempo
• -Es casi tan preciso como el estratificado
• Desventajas.
• -Sólo se pueden tomar k muestras distintas
• -Los elementos de la m.a son dependientes
• -No es válido si la característica se presenta
periodicamente y no coincide con la posición K
28/02/2012 TPAU 15
Muestreo aleatorio estratificado(M.A.E)
Se aplica en poblaciones heterogéneas desde el punto de vista de la
característica.por lo que se divide en L clases o L estratos homogéneos• Sea una Población heterogénea dispersa N tal que N1+N2+…+Nl =N
• Ni = subpoblaciones, cuya m.a. n tal que n1+n2+…+nl =n
• =estratos ni= submuestras
•
•
•
•
•
N1
n1
N2
n2
N3
n3
N4
n4
… NL
nl
n1 n2 n3
n4 nl
28/02/2012 TPAU 16
Ventajas y desventajas del M.A.E.
• Ventajas.-
• -permite aplicar técnicas de selección diferentes en cada estrato
• -Permite realizar inferencia en cada uno de los estratos.
• -Mayor precisión en los estimadores
• -Permite disminuir el tamaño de la muestra
• Desventajas.- si la población está muy dispersa se requiere mucho dinero en cuanto al aspecto logístico
28/02/2012 TPAU 17
Selección del tamaño de cada submuestra en el
M.A.E
• -Afijación uniforme (ni=nj=nl)
• -Afijación proporcional /estrato (Wh= Nh/N)
• -Afijación de Mínima Varianza
• -Afijación óptima( en función de sus costos)
• (V óptima≤ V proporcional ≤ V ran)
28/02/2012 TPAU 18
Notación y definición en el M.A.E• .-Una vez estratificado la población y determinados las
submuestras:
• -Los símbolos que se refieren al estrato h. son:
• h= Identidad del estrato , i = la unidad dentro el estrato
• Nh=Nº total de unidades en el h-ésimo estrato
• nh=nº de unidades en la h-ésima muestra
• yhi = valor obtenido para la i-ésima unidad del h-esimo estrato
• Wh = Nh / N = ponderación del estrato h-ésimo
• fh = nh / Nh = fracción del muestreo del h-ésimo estrato
• Ÿh = yhi / Nh = media verdadera ;ÿ = yhi /nh media muestral del h-ésimo estrato
• S²h = ( yhi –Ÿh ) ² / Nh =varianza verdadera del h-ésimo estrato
28/02/2012 TPAU 19
Muestreo aleatorio por conglomerados
(M.A.C)
Se aplica también en poblaciones heterogéneas y
dispersonas desde el punto de vista geográfico• Sea una población muy heterogénea y dispersa desde el punto de vista
geográfico N se divide en Mu unidades de conglomerados heterogéneos
• M1 M2 M3 ….. Mu
M1 M2 M3 ….
….
Mu
n1 n2 n3 nu
28/02/2012 TPAU 20
Muestreo polietápico(MUM)• En la práctica casi es común utilizar diferentes
tipos de muestreo ,es decir debe realizar en
varias etapas ,así por ejemplo cuando se
utiliza el M.A.E ó el M.A.C ,en cada estrato ó
en cada conglomerado se debe aplicar el
M.A.S.
• Otro caso tenemos en el muestreo de
la”Unidad monetaria” gralmente aplicable en
Auditoría que consiste en tomar como
unidades aquellos expedientes con mayor
cantidad monetaria y dentro cada expediente
aplicar el M.A.S.
28/02/2012 TPAU 21
• 2.Estadísticos muestrales• DEFINICIÓN Y NOTACIÓN.-.
• -CARACTERÍSTICAS O ATRIBUTOS(Y).-ciertas propiedades q´se quiere medir,analizar,registrar, etc. Para cada unidad de la población si es muestral (y).
• CARACTERÍSTICAS QUE ANALIZA EL MUESTREO.-
• Analiza 4 características de la población:
• 1) El total (Y)
• 2)la Media E ( Y)
3) La Proporción(P)
4)La Razón( R )
28/02/2012 TPAU 22
NOTACIÓN
Característica Población(N) Muestra(n)
1.-Valores yi = y1,y2,...,yN yi = y1,y2,...,yn
2.-Total Y= yi = y1+y2+,...,+yN ; y = yi = y1 +y2+,...,+ yn
3.-La Media Ÿ = yi / N ; : ÿ = yi / n
4.-La Razón R= Y / X : r = y / x
5.-Proporción P= X/N : p = x/n
28/02/2012 TPAU 23
Estadísticos muestrales• ESTIMACIONES Ó ESTADÍGRAFOS
• a)Del total(Y)
• Ŷ = N ÿ = N yi / n,donde N/ n = factor
de expansión
• b) De la media (Ÿ) ÿ = yi / n ,donde
n/N =f ,fracción muestral
• c)De la Varianza(σ²) S² = ∑(xi-x)²/ n
• c) De la razón(Ř) r = y / x = yi / xi
28/02/2012 TPAU 24
• ESTADÍSTICOS MUESTRALES• Varianza muestral S² = Σ ( yi –y )²/ n
• Varianza de Cochran ó
• cuasi varianza S² =Σ ( yi –y )²/ n-1
• Media muestral E(y ) = Y =µ
• Varianza de la media muestral V(y) = σ²/ n
• Media de la Varianza muestral E(S²) = (n-1)σ²/n
• MEDIA DE LA CUASI VARIANZA E(S²) = σ²
• Caso particular si Y →Bernoulli(p)
• Proporción muestral p =y/n ó Σyi/n
• Media de la proporción muestral E(p) =P
• Varianza de la proporción muestral V(p)= pq/n
28/02/2012 TPAU 25
INTERVALOS DE CONFIANZA.-
(n 50)
1.-IC PARA LA MEDIA (Ÿ) al 100 r % = [ ÿ ± Zo S 1 –f / n ]
donde Zo P(Z< Zo) = (1+ r) / 2
2.-IC PARA EL TOTAL (Y). Al 100r% = [ Nÿ ± ZoN S 1 –f / n ]
-3.-IC para la Proporción (P) al 100% = [p ± Zo S 1 –f / n ]
Nota cuando la muestra es pequeña ,es decir n < 50 se debe utilizar la
distribución “t”, El valor crítico es to
donde to P(T<to) = (1+ r) / 2 ; tiene distribución n-1 g.d l.
NIVELES DE SIGNIFICACIÓN ( ) = 50% 20% 10% 5% 1%
NIVELES DE CONFIANZA ( r ) = 50% 80% 90% 95% 99%
VALORES CRÍTICOS (n≥50) ( Zo) = 0.67 1.28 1.65 1.96 2.58
28/02/2012 TPAU 26
Ej. Se recabó información sobre una cadena de 676 internets.Cada
internet tiene 42 CPU’s ,pero en muchos internetsde no todos los PC
funcionan normalmente.Se contó el Nº CPU’s por internet que funcionan
normalmente. De 50 Internets(aprox. El 7%) cuyos resultados están en la
tabla,donde :N=Tamaño de la póblación 676; n=50 yi = nº de PC
q´funcionan ; fi =f recuencias./,internet Se pide estimar
a) El Nº total de PC que funcionan normalmente
b)La varianza de la muestra c)El IC para el total al 80%
yi : 42 41 36 32 29 27 23 19 16 15 14 11 10 9 7 6 5 4 3 Total
fi : 23 + 4+ 1+ 1+ 1+ 2 + 1+ 1+ 2 + 2+ 1+ 1+ 1+ 1+ 1+ 3+ 2 +1+ 1 50
Yifi : 966+…………………………………………………… +10 + 4+ 3 1 471
yi²fi:40572 + ………………………………………………… +50 +16 + 9 54 497
28/02/2012 TPAU 27
Sol.- Datos . N= 676 ; Unidad muestral = internet n= 50 internet
a)Estimación del Total Y Ŷ = Nÿ = N yi fi / n = 676 (1471)/ 50=19888
fPC q funcionan normalmente
b) Varianza muestral S² = (1 / n-1) [ yi² fi –( yi fi )²/n],reemplazando
S² = (1/ 49) [54497 –(1471)²/ 50] = 229.0 PC²
la desviación típica S = 229 firmas ² = 15.1327 PC
c) El IC para el total(Y) al 80%,:
= [ 19888 1.28(676)(15.13)(0.9623) / 50 ] = [18 107 ; 21 669 ]
Significa que de entre 100 muestras diferentes que se pueden obtener de
ésa población se espera que 80 muestras darán la estimación del total
entre 18 107 y 21 669 PC que funcionan normalmente
28/02/2012 TPAU 28
4.-TAMAÑO MUESTRAL• En forma general depende:
• 1)Si la población es finita conocida ó infinita desconocida
• 2)Del Error admitido ( acuerdo a la calidad de la v.a.)
• 3)Del nivel de significación( α →Mín)
• 4)Del tipo de muestreo aplicable(con o sin reposicion)
• 5)Del estadístico utilizado en la investigación
• La fórmula gral n= no N / [no +(N-1)]
• donde : n=tamaño de la muestra
• N= tamaño de la población
• no= tamaño de la m.a inicial
•
28/02/2012 TPAU 29
Determinación del tamaño de la muestra
inicial no
•
•
a) Para la media
1) no= (Zo σ/ E)²;(n≥50)
2) no= (to S/ E)²;(n<50)
Donde Zo=P(Z<zo)=(1+r)/2
to= P(T<to) =(1+r)/2
to→T con n-1 gdl
b) Para la proporción
Si se supone P conocido:
3) no= Zo²pq/E² ;(n≥50)
Si no se conoce P
4)no=1/4 (Zo/E)²
Donde Zo=P(Z<zo)=(1+r)/2
28/02/2012 TPAU 30
Ejemplos para estimar el tamaño de la
m.a.• Ej. 1)Un investigador quiere determinar el tiempo
promedio que un ensamblador tarda en ensamblar
las partes de un ordenador,con una confianza del
95% que la media de su m.a. tenga un error a lo
máximo de 0.50 minutos.Se presume por
experiencia que la σ= 1.6 minutos.Qué tamaño
debe ser la muestra?
• Solución : Y:”tiempo de ensamblaje en minutos”
• Datos; E=0.5, σ= 1.6 ; r=95% →Zo=1.96
• Por 1) n= (Zo σ/ E)² → n=(1.96*1.6 /0.5)² =39.3
=40
•
• n= 40
28/02/2012 TPAU 31
• Ej 2)Se desea estimar el Nº promedio de días de uso
continuo antes de que cierto tipo de PC requiera su
reparación inicial, si se supone que la σ= 6 días de un
lote de 100 PC s .De qué tamaño debe ser la m.a.
para asegurar con una confianza del 90% que la
media muestral difiera a lo más por 2 días?
• Solución.- Y:”Tiempo de uso del pc en días”
• Datos: N= 100; σ= 6 ;r= 0.90 → Zo= 1.645 ,E=2
• Por la fórmula general:n= no N/ [no +(N-1)]
• no= (1.645*6 /2)²= 24.354225
• n= 24.354225*100 / [24.354225+(100-1)]= 19.74=20
28/02/2012 TPAU 32
• Ej.3)Se desea estimar la Proporción real de CD´s defectuosos
en un importación muy grande ,al nivel de un 95% se admite un
error a lo sumo de un 4%.de qué tamaño debe ser la m.a. si
• a) No se conoce la proporción real
• b)Se sabe q’ la proorción real de defectuosos es 12%
• c)Si se conoce el tamaño de la Importación =5000
• Solución.-a) r=0.95→Zo=1.96;E=0.04 n=?
• Por 4) no= (Zo/2E)²= (1.96 / 2*0.04)²= 600
• b) p=0.12 →q=0.88; por 3) no= Zo²pq/E²
• n= 1.96²(0.12)(0.88) / (0.04)²= 254
• c) N=5000 por :n= no N/ [no +(N-1)]
• n=254*5000 /[254 +(5000-1)] =242
28/02/2012 TPAU 33
• Conctrucción de los estratos
Una población de 13 435 datos cuya Distribución de frecuencias .Determinar
a) los tamaños de los estratos(Nh) b)elTamaño de la m.a (n) si se quiere
minimizar el mismo para una V(ÿst) =0.01 puede obiar la cpf.c) Determine
los tamaños de las submuestras
Deterdeterminar √fi→ la F(√ fi). De la siguiente manera.
Ii fi √fi F(√fi) Ii fi √ fi F(√fi )
0 -5 3464 58.9 58.9 50-55 125 11.2 340.3
5-10 2516 50.2 109.1 55-60 107 10.3 350.6
10-15 2157 46.4 155.5 60-65 82 9.1 359.7
15-20 1581 39.8 195.3 65-70 50 7.1 366.8
20-25 1142 33.8 229.1 70-75 39 6.2 373.0
25-30 746 27.3 256.4 75-80 25 5.0 378.0
30-35 512 22.6 279.0 80-85 16 4.0 382.0
35-40 376 19.4 298.4 85-90 19 4.4 386.4
40-45 265 16.3 314.7 90-95 2 1.4 387.8
45-50 207 14.4 329.1 95-100 3 1.7 389.5
28/02/2012 TPAU 34
• Construción de estratos
• Suponiendo se quiere tener 5 estratos
• Supuestamente serían F(√fi )/ L= 389/5= 77.9
• 77.9 -155.8 -233.7- 311.6 pero los nº más
cercanos son:
• Estratos
• 1 2 3 4 5
• Ii. 0-5 5-15 15-25 25-45 45-100
• Fi,√fi 58.9 96.6 73.6 85.6 74.8
28/02/2012 TPAU 35
•
• N1 = 3464 N2= 4673 N3=2723 N4=1899 N5=676
• W1= N1/N =3464/13435=0.26;
W2=4673/13435=0.35 W3= 0.20 W4=0.14 W5=0.05
• n1= ? n2=? n3= ? n4= ? n5= ?
• h Wh Sh WhSh nh W1 = N1/N=
3464/13435=0.26
• 1 0.26 5 1.30 903
• 2 0.35 10 3.50 2432
• 3 0.20 7 1.40 973
• 4 0.14 5 0.70 486
• 5 0.05 1 0.05 36
• Total 1 69.5 4830
28/02/2012 TPAU 36
• A) por D)Asignación óptima revisada
Vmin(ÿst)=(ΣWhSh)² / n) – Σ WhSh² / N (cpf)
0.01 =(6.95)²/n → n = 4830
b) Por A)Minimizar V(ÿst) para un n total fijo
(NEYMAN)
nh= nWhSh / ΣWhSh =nNhSh / ΣNhSh
n1=4830(1.3)/6.95 =903
n2 = 4830(3.5)/6.95=2432
n3 = 4830(1.4)/6.95= 973
n4 = 4830(0.7)/6.95= 486
n5 = 4830(0.05)/6.95= 36
n=4830
28/02/2012 TPAU 37
• VARIABLES ESTADÍSTICAS
Es toda característica que se desea estudiar de la población y que toma mínimamente dos valores:
X: x1 ,x2,...,xn
CLASES DE VARIABLES:
1.-CUANTITATIVAS.- Son aquellas que se pueden contar o medir,tenemos: a) Discreta y b)continuas
2.-CUALITATIVAS.-Son aquellas que guardan algún atributo o característica,tenemos:a)Nominal y b) ordinal
28/02/2012 TPAU 38
• CICLO METODOLÓGICO
POBLACION (N)
MUESTRA
(n)
MUESTRA
(n)
muestreo
Toma de decisiones
Estadística inferencial
Estadística
descriptiva
28/02/2012 TPAU 39
Metodología de la investigación:
1.-Planteamiento del problema y de la hipótesis:
Se define claramente los objetivos del
estudio,relacionando con los valores numéricos de
las variables observables(y =efecto ;x =causa)
2.-Recolección de datos:
a)Datos publicados,b)diseño experimental
c)Encuesta
3.-Organización y clasificación de datos:
se debe realizar un análisis de consistencia
4.-Análisis e interpretación de los datos
28/02/2012 TPAU 40
• ORGANIZACIÓN DE LOS DATOS:
• Una vez recopilados los datos ,éstos se los
deben presentar en:
1.-Cuadros estadísticos.-que deben tener:
a) Título descriptivo y numerado(superior)
b) Fuente de los datos(pie de página)
c) Unidades en que se expresan
• 2 .-Gráficos:
a) De barras (Verticales u horizontales)
b) Circulares
28/02/2012 TPAU 41
• DISTRIBUCIÓN DE FREC. DE V
.CUALITATIVAS
Cuadro Nº 1.1. Distrib.de frec. De..........Categorías
X
Frecuencias
absolutas simples
fi
Frecuencias
relativas hi
Porcentajes pi
C1
C2
.
.
Ck
f1
f2
.
.
fk
h1
h2
.
.
hk
p1
p2
.
.
pk
Totales n 1 100
28/02/2012 TPAU 42
• Ejemplo.-
En una entrevista a 20 alumnos sobre la preferencia por
tipos de ordenadores:A,B,C,se obtuvieron los siguientes
resultado:
A,B,B,A,C,B,B,A,A,B,A,B,B,C,A,B,A,C,A,B, Cuadro nº
1.2.Distrib.de alumnos por pref.de pc
Tipo de PC
X fi hi pi %
A 8 0.40 40
B 9 0.45 45
C 3 0.15 15
Totales 20 1.00 100
28/02/2012 TPAU 43
0
1
2
3
4
5
6
7
8
9
Xi
A
B
C
Figura Nº gráfica de barras
28/02/2012 TPAU 44
• Distribución de frec.de v.cuantitativas discretas
Valores
X
fi hi pi %
x1 f1 h1 p1
x2 f2 h2 p2
.
.
.
.
.
.
.
.
xk fk hk pk
Totales n 1.00 100
Valores
X
fi hi pi %
x1 f1 h1 p1
x2 f2 h2 p2
.
.
.
.
.
.
.
.
xk fk hk pk
Totales n 1.00 100
28/02/2012 TPAU 45
Distrib.de frec. por Intervalos o clases (n>30)
Cuadro Nº.. Distrib. de frec. por intérvalosIntérvalos
Ii
Xi fi hi pi %
I1 X1 f1 h1 p1
I2 X2 f2 h2 p2
.
.
.
.
.
.
.
.
.
.
Ik Xk fk hk pk
Totales n 1.00 100
28/02/2012 TPAU 46
Procedimiento: ordenar los datos y
determinar:
1.-El alcance (A) A=[Valor Mínimo,Valor Máximo]
2.-El Rango (R) R=|Valor Máx-valor Mín|
3.-Nº de Intérvalos (k)
a) 5 < k < 20
b) k=1+3.3 log(n)
4.-Ancho de clase (wi) Wi=|L i +1 -Li|
igual ancho W = R/k
5.-Marca de clase Xi = (Li + Li+1)/2
28/02/2012 TPAU 47
• Ejemplo.- se tiene los ingresos quincenales
en $us(X) de 45 familias:
63 89 36 49 56 64 59 35 78
43 53 70 57 62 43 68 62 26
64 72 52 51 62 60 71 61 55
59 60 67 57 67 61 67 51 81
53 54 76 44 73 56 62 63 60
Se pide clasificar en 8 clases
28/02/2012 TPAU 48
• Cuadro Nº... Distrib.de frec.de los ingresos
de 45 familias en dólares
Ii Xi fi hi pi%
[26,34>
[34,42>
[42,50>
[50,58>
[58,66>
[66,74>
[74,82>
[82,90>
30
38
46
54
62
70
78
86
1
2
4
10
16
8
3
1
0.022
0.044
0.089
0.222
0.356
0.178
0.067
0.022
2.2
4.4
8.9
22.2
35.6
17.8
6.7
2.2
totales 45 1.000 100
28/02/2012 TPAU 49
Histograma de los ingresos de 45 familias
0
2
4
6
8
10
12
14
16
30
38
46
54
62
70
78
86
fi
xi
28/02/2012 TPAU 50
Frecuencia absoluta simple fi
Es el Nº de datos observados en cada categoría
Tal que : Σfi =n
Frecuencia relativa simple hi
Es la proporción por cada categoría .
Tal que: hi = fi/n ; Σhi =1
Porcentaje pi
Es el tanto por ciento de cada categoría
Tal que pi = 100%hi ; Σpi = 100%
Frecuencia Abs.acumulada Fi
Nº de obs.menores que el límite superior de determinada clase
Tal que :F1=f1 ; Fi= F i-1+fi
Frecuencia Relativa acumulada Hi
Es la proporción menor al límite superior de determinada clase
Tal que :Hi = hi , Hi= Hi-1 +hi ; Hi = Fi/n ; i=1,2,3,....k
28/02/2012 TPAU 51
TEMA Nº 3 MEDIDAS DE POSICIÓN
Tenemos:La media , la media geométrica armónica,
cuadrática , la mediana,la moda,los cuantiles:
La media aritmética :
a) Para datos no clasificados
poblacional µ =Σ Xi/N ;muestral X = Σxi/n
b)Para datos clasificados
poblacional µ = Σ (xi fi)/N;muestral X = Σ (xi fi)/n
Del Ej. De los ingresos de 45 familias ,el ingreso medio ó
percápita es X = Σ (xi fi)/n = 2702/45
X = 60,04 $us semanal
28/02/2012 TPAU 52
Propiedades de la media aritmética
Sean: a,b,c, constantes ; x,y variables
1.- M( c ) =C
2.- M( x+ c ) = M( x ) + c
3.- M( ax ) = a M( x )
4.- M ( ax+ b) =aM( x ) +b
5.- M [ x – M( x ) ] = 0
28/02/2012 TPAU 53
• La Mediana- Xm ó Md
• 1.-Para datos no clasificados,una vez ordenado,la mediana es:
• a) Cuando n es impar es el valor central
• b) Cuando n es par es el promedio de los dos valores centrales
• 2.-Para datos clasificados
• Xm = Lm + Wm [n/2 –F m-1 ] / fm, donde
• la clase mediana se obtiene.
• ;Fm n/2 Im = [ Lm ,Lmi +1>
28/02/2012 TPAU 54
LA MODA Xmo Ó Mo.-para datos clasificado
Mo = Li + Wi [ 1 / (1 + 2 ) ] ; 1 =fi –fi-1 ; 2 = fi –fi +1
Ej se tiene la siguiente distribución de frecuencias de alturas
(pulg ) de 100 personas
Hallar a) La media,b)La Mediana c) la Moda
Ii Xi fi Fi Xi fi (xi-
67.95)²fi
60-63
63-66
66-69
69-72
72-75
61.5
64.5
67.5
70.5
73.5
5
18
42
27
8
5
23
65
92
100
307.5
1161.0
2835.0
1903.5
588.0
208.0125
214.2450
8.5050
175.5675
2.46.4200
total 100 6795.0 852.7500
28/02/2012 TPAU 55
• Solución
a)la media X = 6795 / 100 = 67,95 pulg
b)La mediana Xm = 66+3[50-23] / 42 =67.90 pulg
c)La moda Mo = 66+3[24 / (24+15 ] =67.8 pulg
Media geométrica .-(G)se utiliza cuando el conjunto es una
P.G. Porcentajes.índices etc..
Media armónica (H) .- se utiliza cuando el conjunto es un
P.A., tasas, muestra pequeña etc.
28/02/2012 TPAU 56
Tema nº 4 MEDIDAS DE DISPERSIÓN
1.-La varianza V(X)
Def gral. V(X) = E[ (x – x )²]
a) Datos no clasificados
S²= Σ (xi – x)² / n-1
b) datos clasificados
S²= Σ (xi – x)² fi / n-1
2.-La desviación típica s
s = V(x)
3.- Coeficiente de variación CV
CV = S / x * 100 %
28/02/2012 TPAU 57
Ej. De la anterior distribución hallar a) la varianza b) la
desviación c) el coeficiente de variación.
Solución
a) La varianza:
S² = 852.75 / 100 = 8.5275 pulg ²
b) La desviación típica :
S = 8.5275 pulg² = 2.92 pulg
c) El cv =( 2.92 / 76.95 ) *100% =4.30 %
28/02/2012 TPAU 58
Propiedades de la Varianza
Sean : a,b,c constantes, X;Y variables
1.-V( c ) = 0
2.-V (X+ c) = V(X)
3.-V( aX ) = a² V (X)
4.-V(aX +b)= a² v(X)
5.-V(X)=M(x²) –[ M(x) ]² ;donde
M(x²)= xi² /n, para datos no clasificados;
M(x²)= xi²fi / n,para datos clasificados
28/02/2012 TPAU 59
Momentos.- Definición Gral : E[ (x-a)*]; *= r =1,2,3,..
a) Momentos originales; si a=0
m´r =E [x *] = Σ xi * fi / n
b) Momentos centrales; si a = x
m r = E[ (xi-x)* ] = Σ( xi-x)*fi / n ;*=r = 1,2,3....
Coeficiente de asimetría
Sk = ( x – Mo) / s , si: Sk > 0 sesgado a la derecha
Sk < 0 sesgado a la izquierda
Sk = 0 simétrico
Coeficiente de Kurtosis
Cx = 4 / ( ²)² si Cx >0 leptocúrtico
si Cx <0 platicúrtico
si Cx =0 mesocúrtico
28/02/2012 TPAU 60
Tema nº 5 REGRESIÓN LINEAL SIMPLE
V.E.Bidimensional (X,Y)
-La regresión surge en el análisis de la forma funcional
entre X (causa) ,Y(efecto)
-La correlación surge en el análisis de asociación entre X ,Y
- Diagrama de dispersión .- es el gráfico de los pares (xy)
,que da la pauta de la forma funcional entre X e Y
- La covarianza mide el grado de dispersión conjunta entre
X ,Y
- Coeficiente de correlación r.-mide el grado de asociación
lineal entre X e Y
- -1< r < 1
28/02/2012 TPAU 61
Regresión lineal simple .- Y= a + bX ,consiste en estimar la
ec.de la recta con el fin de predecir o estimar Y (dependiente) a
partir de x( independiente)
Donde a= intercepto; b= pendiente o coeficiente de regresión
Estimación mediante los MCO
Ŷ = â + b X donde b= n [Σxiyi –ΣxiΣyi] / n[Σx²-(Σx)²]
â = y –b x
si b>0 la tendencia lineal es creciente
si b<0 la tendencia lineal es decreciente
si b=0 no hay regresión por que Y= a
28/02/2012 TPAU 62
• Ejemplo.-
En un estudio de la relación entre la publicidad por tv y las
ventas de ordenadores durante 10 semanas se han
recopilado los tiempos de duración en minutos de publicidad
por semana (X) y el nº de ordenadores vendidos(y) siendo:
Semana 1 2 3 4 5 6 7 8 9 10
Publicidad(X) 20 30 30 40 50 60 60 60 70 80
Ventas(Y) 50 73 69 87 108 128 135 132 148 170
a)Estimar la recta de regresión ,b) el r c) Estime
las ventas si la publicidad es de 90 minutos
28/02/2012 TPAU 63
• Solución
Cuadro Nº ...
x y xy X² Y²
20
30
30
40
50
60
60
60
70
80
50
73
69
87
108
128
135
132
148
170
1000
2190
2070
3480
5400
7680
8100
7920
10360
13600
400
900
900
1600
2500
3600
3600
3600
4900
6400
2500
5329
4761
7569
11664
16384
18225
17424
21904
28900
500 1100 61800 28400 134660
28/02/2012 TPAU 64
SOLUCIÓN
a) b=[10(61800)-500(11009] / [10(28400)-500²] =
b = 68000 / 3400=2 ; b=2
a = 110- 2(50) = 10 ; a=10
Por lo tanto ŷ = 10 + 2 X
b) El r= n [Σxiyi –ΣxiΣyi] / n[Σx²-(Σx)²] * n[Σy²-(Σy)²] =
=680 /681.5424 = 0.998 , r=0.998 altamente positivo
c) Estimación para x=70 ;ŷ = 10 + 2 (90) = 190
ordenadores