Clase03 entendiendo las relaciones

Post on 08-Jun-2015

449 views 1 download

description

Bioestadistica

Transcript of Clase03 entendiendo las relaciones

Bioestadistica 1

Ac. Fabrizio Marcillo Morla MBA

barcillo@gmail.comhttp://www.facebook.com/barcillo094-194239

Capitulo 3

Entendiendo las Relaciones

Percentil y Cuartil Percentil (0 < p < 1) es el valor de la variable en

donde hay una proporción p de valores de la población menores o iguales.

Cuartiles: dividen poblacion en 4 cuantiles: Q1(25%, 50% y 75%

Excel: =CUARTIL(Datos,Cuartil) =PERCENTIL(Datos,p%)

Rango intercuartílico IQR: rango entre el 50% de elementos centrales de la distribución (Q3 – Q1)

Diagrama de Cajas Tukey 1977: Box and whisker plot (diagrama de

caja y bigote) Resumen de 5 numeros:

Centro: Mediana Dispersión: IQR (Q3 – Q1) Mayor y Menor Puede incluir datos atipicos fuera del grafico

Excel No los crea directamente: Data Desk XL add-in Grafico de cotizaciones (incompleto) Truco con Barras apiladas Ejercicio08 - Diagrama de Cajas.xlsx

Diagrama de Cajas

Permiten apreciar de forma grafica rapidamente la forma de la poblacion, su tendencia, sesgo y distribucion.

Permiten comparar poblaciones.

Diagrama Dispersión Se usa para ver la relación de dos variables cuantitativas

medidas en los mismos elementos. Gráfico en el cual van a estar representados, mediante

puntos, los valores de nuestros pares de variables (x,y). Sirve para darnos una idea visual del tipo de relación que

existe entre ambas variables, y debe de ser hecho antes de iniciar cualquier cálculo para evitar trabajos innecesarios

Dirección: Positiva, negativa o nula Forma: Lineal, Exponencial, Logaritmica, etc Fuerza: Baja, Moderada, Alta Valores atipicos

Eje X: Variable independiente, Eje Y: V. Dependiente Excel Grafico dispersión tiene herramientas para

evaluación interactiva de correlación.

Correlación Al observar graficamente una serie de

pares de datos podemos tener una apreciación errada.

La correlación es una medida numerica de la fuerza de una asociacion lineal. Va de -1 a +1: -1: asociacion lineal negativa perfecta +1: asociacion lineal positiva perfecta 0: ninguna asociacion lineal

No distingue variable dependiente de independiente

Regresion Lineal Fijamos valores variable independiente (x), y

observamos variable dependiente (y) de ésta. Lograr ecuación para describir comportamiento y

relacionado con x, dentro rango específico.

y = a + bx Análisis correlación mide, para c/ muestra x y y. Grafica pares para ver relaciones entre ellos. Calcula algunos estadísticos para determinar la

fuerza de la relación Regresión para experimentos reales Correlación para estudios ex post facto

Puede ser usada como comparativa o predictiva.

Mínimos Cuadrados Recta donde cuadrados de diferencias entre

puntos experimentales (x,y) y puntos calculados (x',y') sea mínima.

y’ – y = residual y = a + bx

a: intersección de la recta con el eje Y b: pendiente de la recta.

a =INTERSECCION.EJE(rango Y,rango X) b =PENDIENTE(rango Y,rango X) Herramientas de Analisis

b=xy -

x yN

x -( x )N

22

a =y

N-b

x

N

Coeficiente Correlación r: Coeficiente de correlación de Pearson Mide la relación lineal entre las variables A diferencia de covarianza no tiene unidades Estimador parámetro coeficiente de correlación

poblacional . Es la proporción entre la covarianza de XY y el

producto de sus desviaciones estándar =COEF.DE.CORREL(rango Y,rango X) =PEARSON(rango Y,rango X)

22 )()(

))((

yyxx

yyxx=r

Coeficiente Determinación r2

A menor varianza de residuales respecto a varianza de y, mejor será la predicción. No relación: Var(y’) / Var(y) = 1 Relación perfecta : Var(y’) / Var(y) = 0

1 - Var(y’) / Var(y) = r2

r2: Cuadrado de Coeficiente de Correlación Mide ajuste a la regresión. Proporción de variación en variable y que puede

ser atribuida a una regresión lineal con respecto a la variable x. Resto falta por explicar

  r2 ajustado: Toma en cuenta los gdl: y = n-1 y' = n-2

Regresiones No Lineales Existen otros tipos relaciones posibles entre x y y Crecimiento poblacional común regresión exponencial:

a : "índice de Falton“ B: índice de crecimiento relativo.

Grafico en papel semilogarítmico da una línea recta.  Datos se linealizan con:  

Luego es un caso de regresión lineal.

y = abx

log log logy = a+ x b

Regresiones No Lineales Hay otros casos regresiones no

lineales y mayoría se linealiza de misma forma.

Excel presenta opción de visualizar previamente alguns tipos de regresiones visualmente y calcular su ecuación y r2 mediante la opción Formato de Linea de tendencia en los graficos de dispersión.