Tema 8. Asociación Entre Variables Cuantitativas Numéricas (16!03!2015)

3
GRUPO 34 16/03/2015 TEMA 8. ASOCIACION ENTRE VARIABLES CUANTITATIVAS NUMERICAS La asociación entre variables en fundamental en medicina. Para estudiarla utilizaremos los modelos de regresión. Para entender lo que son usaremos un ejemplo: El perímetro torácico es una variable que en medicina se utiliza en clínica para evaluar la posibilidad de realizar trasplantes de órganos, son variables del donante y el receptor. Ambos perímetros torácicos deben estar dentro de unos márgenes apropiados para realizar el trasplante, si es muy grande la diferencia no se podría hacer. Desviaciones de más de un 20 % entre ambos suelen desaconsejar el trasplante por lo que es aconsejable hacer un estudio de su perímetro torácico. Sin embargo, a veces las personas llegan en mal estado a los servicios de urgencia, y es complicado averiguar el perímetro torácico por eso hay que saber si el perímetro torácico se relaciona con otras variables que sean más fáciles de observar en situaciones extremas. Una de ellas es por ejemplo el peso. Por ello se ha estudiado la relación entre el peso y el perímetro torácico. Para que si no se puede medir el perímetro torácico por lo menos se obtenga una aproximación con su peso. Estudiamos 2 variables: Para llevar a cabo la asociación tenemos 2 métodos: 1.- ESTUDIO GRAFICO Esto lo haremos mediante diagramas de dispersión. Se representan en ambos ejes las variables, en la Y el perímetro torácico y en la X el peso. Cada individuo se representa con un punto en la intersección de cada uno de los valores de las variables. A todos los puntos se les llama nube de puntos. Si la nube posee una forma de cero o circular implicaría que la asociación es nula. Si en cambio la nube es alargada habrá una asociación dependiente de su orientación. Si la pendiente es positiva la asociación será positiva y viceversa.

description

Comi

Transcript of Tema 8. Asociación Entre Variables Cuantitativas Numéricas (16!03!2015)

  • GRUPO 34 16/03/2015

    TEMA 8. ASOCIACION ENTRE VARIABLES CUANTITATIVAS NUMERICAS

    La asociacin entre variables en fundamental en medicina. Para estudiarla utilizaremos los

    modelos de regresin. Para entender lo que son usaremos un ejemplo:

    El permetro torcico es una variable que en medicina se utiliza en clnica para evaluar la

    posibilidad de realizar trasplantes de rganos, son variables del donante y el receptor. Ambos

    permetros torcicos deben estar dentro de unos mrgenes apropiados para realizar el

    trasplante, si es muy grande la diferencia no se podra hacer. Desviaciones de ms de un 20 %

    entre ambos suelen desaconsejar el trasplante por lo que es aconsejable hacer un estudio de su

    permetro torcico.

    Sin embargo, a veces las personas llegan en mal estado a los servicios de urgencia, y es

    complicado averiguar el permetro torcico por eso hay que saber si el permetro torcico se

    relaciona con otras variables que sean ms fciles de observar en situaciones extremas. Una de

    ellas es por ejemplo el peso. Por ello se ha estudiado la relacin entre el peso y el permetro

    torcico. Para que si no se puede medir el permetro torcico por lo menos se obtenga una

    aproximacin con su peso.

    Estudiamos 2 variables:

    Para llevar a cabo la asociacin tenemos 2 mtodos:

    1.- ESTUDIO GRAFICO

    Esto lo haremos mediante diagramas de dispersin. Se representan en ambos ejes las

    variables, en la Y el permetro torcico y en la X el peso. Cada individuo se representa con un

    punto en la interseccin de cada uno de

    los valores de las variables. A todos los

    puntos se les llama nube de puntos.

    Si la nube posee una forma de cero o

    circular implicara que la asociacin es

    nula.

    Si en cambio la nube es alargada habr

    una asociacin dependiente de su

    orientacin. Si la pendiente es positiva la

    asociacin ser positiva y viceversa.

  • 2.-ESTUDIO ANALITICO

    Empezaremos calculando la media y desviacin estndar:

    A continuacin lo representamos en nuestra grafica, donde la media del permetro ser la lnea

    horizontal y la del peso la vertical. Las dos se cruzarn en el centro de gravedad.

    La covarianza (SX,Y) es una medida de

    asociacin entre

    variables. Es una medida de dispersin respecto al

    centro de gravedad.

    Para saber su valor

    calcularemos la distancia

    de x1 a su media y lo

    mismo para y1. Luego

    calcularemos el rea que

    forma el rectngulo que

    forman. Finalmente sumaremos todos los rectngulos y lo dividiremos entre el nmero de

    puntos.

    Puede tomar valores entre - y

    Si = sera la varianza.

    Un cambio de escala afectar a la covarianza, ya que es una medida de dispersin.

    Si la covarianza es positiva la asociacin ser positiva y viceversa. Si es 0 no va a haber

    asociacin.

    Para interpretar mejor la covarianza usaremos el coeficiente de correlacin

    .

    Cuanto ms se acerquen al cero

    menos asociacin habr. Hablaremos

    de una asociacin significativa a partir

    de +/-0,8.

    Covarianza

  • MODELOS DE REGRESION LINEAL

    Buscaremos los modelos ms sencillos, es decir:

    y = a + bx

    Esta recta tiene que cumplir la condicin de pasar por el centro de gravedad de la nube de

    puntos. Al haber infinitas rectas que cumplen esta condicin, nos quedamos con aquella que

    hace mnimos los errores elevados al cuadrado (el error ser la diferencia entre lo predicho y la

    realidad

    Para calcular la pendiente o el

    coeficiente de regresin de esta recta

    usaremos esta frmula.

    El peso es la variable

    independiente y el permetro torcico

    la dependiente.

    a y b van a ser coeficientes de

    regresin. a va a ser el trmino

    independiente, es la ordenada en el

    origen, es decir el valor de Y cuando X

    es 0.

    Por ltimo tenemos el coeficiente de determinacin, es el porcentaje de la variabilidad total de

    la variable a predecir (permetro torcico) que es explicada por el modelo de regresin lineal

    que tome como variable explicativa X. Es el porcentaje de variabilidad de la variable. Cuanto

    ms se aproxime a 100 mejor es el modelo. Se calcula as:

    STATA

    1. Para hacer el anlisis mediante stata haremos un diagrama de dispersin: Grficos -

    Twoway graph Scatter.

    2. Calcularemos las medias y editaremos el grafico para aadir las lneas de referencia,

    as tendremos el punto de gravedad

    3. Haremos el anlisis de regresin Statistics - Lineal models - Lineal regressions.

    Obtendremos la pendiente b y la constante a.