Datos atípicos y Transformaciones
-
Upload
alfonso-rada-vargas -
Category
Documents
-
view
30 -
download
0
Transcript of Datos atípicos y Transformaciones
DATOS ATPICOS Y TRANSFORMACIONES
Cesar Castro Anderson Guerrero
DATOS ATPICOS
Datos que tienen un valor extremo con respecto al conjunto de datos en que se encuentran Generan malas interpretaciones o ruidos. Especial cuidado al detectarlos (sesgo de informacin)
Pueden detectarse por medio de diagramas de dispersin.
Grafica de pares de la base de datos Aves
TRANSFORMACIONESSon tiles cuando se presentan valores extremos o atpicos. Cuando las distribuciones no son normales . Cuando no hay clara evidencia de heterogeneidad de datos. Su eleccin depende de la seleccin de los anlisis estadsticos y de la experiencia del investigador.
Verificar existen valores atpicos. Escoger el tipo de transformacin ms adecuada. En casos extremos omitir estos valores del anlisis pero siempre realizando los anlisis con y sin estos datos.
Transformaciones Box-cox
Se puede aplicar si los datos no son negativos. Se utilizan para corregir sesgos en: Distribucin. Varianzas desiguales. La no linealidad en la relacin
Ayuda a mejorar la correlacin entre las variables.
REGLA DE ABULTAMIENTO DE MOSTELLER Y TUKEY
Cuando el anlisis de seguimiento se basa en relaciones lineales y no se puedan identificar patrones.
se requiere un aumento o disminucin de los ejes x y y para para transformar los datos de forma lineal.
pasos ara la transformacin de datos en R n.clases=7 puntos=min(aves$Comisura)+(0:n.clases)*(max(aves$C omisura)-min(aves$Comisura))/n.clases hist(aves$Comisura) #Transformacion box-cox comisura1=((aves$Comisura)^(1/2)-1)/(1/2) comisura2=log(aves$Comisura) comisura3=((aves$Comisura)^(-1/2)-1)/(-1/2) comisura4=((aves$Comisura)^(-1)-1)/(-1)
Histogram of comisura
Frequency
00
10
20
30
40
5
10
15
20
25
30
35
comisura
Distribucin de frecuencia de los datos originales Asimetra=4.197753
puntos=min(comisura1)+(0:n.clases)*(max(comisura1)min(comisura1))/n.clases hist(comisura1, breaks=puntos) puntos=min(comisura2)+(0:n.clases)*(max(comisura2)min(comisura2))/n.clases hist(comisura2, breaks=puntos) puntos=min(comisura3)+(0:n.clases)*(max(comisura3)min(comisura3))/n.clases hist(comisura3, breaks=puntos)
puntos=min(comisura4)+(0:n.clases)*(max(comisura4)min(comisura4))/n.clases hist(comisura4, breaks=puntos)
Histogram of comisura130 30
Histogram of comisura2
25
20
Frequency
Frequency2 4 6 comisura1 8
15
10
5
0
01.0
5
10
15
20
25
1.5
2.0 comisura2
2.5
3.0
3.5
Asimetra=2.135249
Asimetra=0.1219074
Histogram of comisura330 40
Histogram of comisura4
25
20
Frequency
Frequency
15
10
5
0
00.6
10
20
30
0.8
1.0
1.2 comisura3
1.4
1.6
0.7
0.8 comisura4
0.9
Asimetra= -1.82621
Asimetra= -3.704287
#Asimetria sum((comisura1-mean(comisura1))^3)/(44*sd(comisura1)^3) sum((comisura2-mean(comisura2))^3)/(44*sd(comisura2)^3) sum((comisura3-mean(comisura3))^3)/(44*sd(comisura3)^3) sum((comisura4-mean(comisura4))^3)/(44*sd(comisura4)^3)
aves$Alto.Narina 55 10
Alto.Narina
10
15
20
25
30
15
20
25
30
5
210
415 Comisura
comisura1 6 8
20 25 30
aves$Alto.Narina 5 10 15 20 25 305 10 15 20
Alto.Narina 25 30
1.05
1.5 2.0 comisura2 2.5 3.0 3.5Comisura
10 15 20 25 30
aves$Alto.Narina 5 10 15 20 25 30
Alto.Narina 5 10 15 20 25 30
5
0.8
10
1.0
15
1.2 1.4 1.6
comisura3
Comisura 20 25 30
aves$Alto.Narina 5 10 15 20 25 30
Alto.Narina 5 10 15 20 25 30
0.6
5 10
0.7
15
comisura4 0.8 0.9
Comisura 20 25 30