Aspectos relevantes en el diseño y análisis de las encuestas de salud pública. María del Mar...

Aspectos relevantes en el Aspectos relevantes en el diseño y análisis de las diseño y análisis de las encuestas de salud encuestas de salud pública.pública.

María del Mar Rueda GarcíaMaría del Mar Rueda GarcíaDpto. de Estadística e I.O. Dpto. de Estadística e I.O. Universidad de GranadaUniversidad de Granada

Las encuestas de salud Las encuestas de salud públicapública

Son un elemento esencial para la Son un elemento esencial para la toma de decisionestoma de decisiones

Proporcionan conocimientoProporcionan conocimiento- Situación epidemiológicaSituación epidemiológica- Tendencias de saludTendencias de salud- Hábitos de vidaHábitos de vida- Utilización de servicios sanitariosUtilización de servicios sanitarios

ObjetivosObjetivos

Monotorizar las tendencias en la Monotorizar las tendencias en la salud percibida, los hábitos de salud percibida, los hábitos de vida y la utilización de servicios vida y la utilización de servicios sanitariossanitarios

Identificar los principales grupos Identificar los principales grupos de riesgo en la salud, en los de riesgo en la salud, en los hábitos de vida y en el acceso a hábitos de vida y en el acceso a los servicios sanitarios.los servicios sanitarios.

Principales aspectos en Principales aspectos en las encuestas de salud las encuestas de salud públicapública Diseño muestralDiseño muestral InferenciaInferencia Estimación de las varianzasEstimación de las varianzas Tratamiento de datos faltantesTratamiento de datos faltantes Software para el análisis de los Software para el análisis de los

datosdatos

Diseño muestralDiseño muestral

Se determina atendiendo aSe determina atendiendo a

objetivos primarios de la encuestaobjetivos primarios de la encuesta restricciones económicas, restricciones económicas,

temporales y materialestemporales y materiales tamaño y características de la tamaño y características de la

población bajo estudiopoblación bajo estudio

Diseños muestralesDiseños muestrales

d=(S,p)d=(S,p) p:S p:S→R→R

s=(is=(i11,i,i22,…,i,…,in(s)n(s)) 0<p(s)<1 ) 0<p(s)<1

La selección de las unidades es La selección de las unidades es aleatoriaaleatoria

Se puede determinar Se puede determinar de antemano de antemano cuál escuál es la probabilidad la probabilidad de que de que cada individuo sea seleccionadocada individuo sea seleccionado

Principales diseños usados en Principales diseños usados en encuestas de saludencuestas de salud

Muestreo por conglomeradosMuestreo por conglomerados Muestreo estratificadoMuestreo estratificado Muestreo sistemático Muestreo sistemático Muestreo con probabilidades proporcionales Muestreo con probabilidades proporcionales

al tamañoal tamaño Diseños muestrales complejosDiseños muestrales complejos Muestreo de unidades rarasMuestreo de unidades raras

Muestreo estratificadoMuestreo estratificado

Procedimiento: Dividir la Procedimiento: Dividir la población en estratos población en estratos disjuntos (ciudades, disjuntos (ciudades, pueblos, distritos, áreas pueblos, distritos, áreas rurales,…) y seleccionar en rurales,…) y seleccionar en cada uno una muestracada uno una muestraRazones: Poder hacer Razones: Poder hacer estimaciones separadas en estimaciones separadas en cada estrato, asegurar la cada estrato, asegurar la representación de todos los representación de todos los estratos, menor error,…estratos, menor error,…

Muestreo por conglomeradosMuestreo por conglomerados

Objetivo: seleccionar Objetivo: seleccionar muestras cuando no se muestras cuando no se tiene un listado de tiene un listado de individuosindividuos

Procedimiento: se Procedimiento: se seleccionan grupos de seleccionan grupos de unidades (conglomerados) unidades (conglomerados) y se muestrean unidades y se muestrean unidades de los conglomerados de los conglomerados seleccionadosseleccionados

Muestreo polietápicoMuestreo polietápico

Procedimiento: seleccionar una muestra de conglomerados (UP) y dentro de éstos seleccionar otra muestra de elementos (US) . Dentro de las US se muestrean otros elementos (UT)…

Uso: Es más barato y sólo necesita un marco de las unidades seleccionadas en cada etapa.

Muestreo bietápico

Muestreo por conglomerados

Muestreo trietápico

Muestreo sistemáticoMuestreo sistemático

Problema: no se tiene un listado Problema: no se tiene un listado de las unidades, no se conoce el de las unidades, no se conoce el tamaño de la población, es difícil tamaño de la población, es difícil localizar las unidades,…localizar las unidades,…

Procedimiento: Se elige un número Procedimiento: Se elige un número aleatorio i, y se analizan las aleatorio i, y se analizan las unidades: i,i+k,i+2k,…i+(n-1)kunidades: i,i+k,i+2k,…i+(n-1)k

Hogares como unidades Hogares como unidades de muestreode muestreo

El listado es fácil de obtenerEl listado es fácil de obtener Las unidades dentro del hogar son Las unidades dentro del hogar son

heterogéneas (sexo, edad,…)heterogéneas (sexo, edad,…) La información se obtiene a partir La información se obtiene a partir

dede

-una unidad representativa-una unidad representativa

- - una unidad muestreada (Kish una unidad muestreada (Kish grid)grid)

Muestreo estratificado Muestreo estratificado polietápico de hogarespolietápico de hogares

Se utilizan para elaborar el marco y Se utilizan para elaborar el marco y agrupar entrevistadores de forma que agrupar entrevistadores de forma que el el costecoste sea pequeñosea pequeño

Es el diseño más usado tanto en países Es el diseño más usado tanto en países desarrollados como en vías de desarrollados como en vías de desarrollo.desarrollo.

Estructura típica de un Estructura típica de un diseño muestral de diseño muestral de hogareshogares

característicacaracterística Posible definiciónPosible definición

EstratoEstrato RegionesRegiones

Tipo de comunidadTipo de comunidad

U PrimariaU Primaria Secciones censalesSecciones censales

Pueblos en áreas ruralesPueblos en áreas rurales

Manzanas en áreas urbanasManzanas en áreas urbanas

U SecundariaU Secundaria ViviendasViviendas

U TerciariaU Terciaria Miembros de las viviendasMiembros de las viviendas

U observaciónU observación IndividuosIndividuos

National Health Interview National Health Interview Survey (EEUU)Survey (EEUU) Población marco: mujeres 15-44 años que Población marco: mujeres 15-44 años que

viven en hogares.viven en hogares. 1900 UPs (pueblos o conjuntos de éstos)1900 UPs (pueblos o conjuntos de éstos) UP se estratificaron usando variables UP se estratificaron usando variables

socioeconómicas y demográficas.socioeconómicas y demográficas. Se seleccionan 198 UP con probabilidades Se seleccionan 198 UP con probabilidades

proporcionales al tamaño dentro de cada proporcionales al tamaño dentro de cada estrato.estrato.

Dentro de cada UP se selecciono una muestra Dentro de cada UP se selecciono una muestra de manzanas (US)de manzanas (US)

Dentro de cada US se selecciona una muestra Dentro de cada US se selecciona una muestra de aprox. 8 hogares (UT)de aprox. 8 hogares (UT)

43007 hogares en la muestra43007 hogares en la muestra

Tetanus toxoid inmunization sample Tetanus toxoid inmunization sample survey BURUNDI (World Health survey BURUNDI (World Health Organization)Organization)

Estrato 1: Bujumbura (estrato urbano)Estrato 1: Bujumbura (estrato urbano) Estrato 2: resto del pais (estrato rural)Estrato 2: resto del pais (estrato rural) UP (areas geográficas) en cada estrato UP (areas geográficas) en cada estrato

con probabilidades proporcionales al con probabilidades proporcionales al tamañotamaño

US viviendas con probabilidades igualesUS viviendas con probabilidades iguales Todas las mujeres de la vivienda nacidas Todas las mujeres de la vivienda nacidas

en el último año son seleccionadasen el último año son seleccionadas

Muestreo de unidades Muestreo de unidades poco frecuentes.poco frecuentes.

Obtener estimaciones con precisión Obtener estimaciones con precisión satisfactoria suele ser muy costososatisfactoria suele ser muy costoso

Ejemplo: m.a.s. Ejemplo: m.a.s. P=0.02, n=800 error relativo=50%P=0.02, n=800 error relativo=50%

P=0.02, n=80000 error relativo=5%P=0.02, n=80000 error relativo=5%

Diseños muestrales usados: Diseños muestrales usados: Muestreo Muestreo inverso, muestreo de redes, muestreo inverso, muestreo de redes, muestreo dual, muestreo en bola de nievedual, muestreo en bola de nieve

Muestreo inversoMuestreo inverso

Fija de antemano el número de Fija de antemano el número de unidades raras a incluir en la unidades raras a incluir en la muestra.muestra.

Se continúa el muestreo hasta Se continúa el muestreo hasta

completar dicho número completar dicho número cualquiera que sea el tamaño cualquiera que sea el tamaño total de la muestratotal de la muestra

Muestreo en bola de Muestreo en bola de nievenieve

seleccionar una muestra inicial de seleccionar una muestra inicial de nn individuos de forma probabilísticaindividuos de forma probabilística

en cada entrevista cada individuo en cada entrevista cada individuo nombra a otros nombra a otros KK nuevos individuos de nuevos individuos de la población en estudio que han de la población en estudio que han de entrevistarse.entrevistarse.

inmigrantes, minorías étnicas, personas inmigrantes, minorías étnicas, personas con dificultades o marginadoscon dificultades o marginados

Ejemplo: En una encuesta destinada a estudiar la ocurrencia de una rara enfermedad se selecciona una muestra aleatoria de centros médicos. De los registros de cada centro médico de la muestra, se obtienen los ficheros de los pacientes tratados en el centro de esa enfermedad. No obstante un paciente dado puede haber sido tratado por más de un centro. Cuanto mayor sea el número de centros en los cuales haya sido tratado un enfermo, más probabilidad tiene éste de pertenecer a la muestra.

Muestreo de nexos (network sampling)

Muestreo de nexos (network sampling)

Se selecciona una muestra aleatoria de unidades de selección, y todas las unidades de observación que están asociadas con cada unidad seleccionada se incluyen en la muestra y son observadas. La multiplicidad del individuo es el número de unidades de selección al cual está ligado. Se define un nexo como el conjunto de unidades de observación con un determinado patrón de ligadura.

Uso: por la imposibilidad de realizar un muestreo convencional

Muestreo dualMuestreo dual

La estimación se realiza a partir de dos La estimación se realiza a partir de dos encuestas independientesencuestas independientes

SISI NONO

SISI x12x12 x1x1

NONO

x2x2

Encuesta 2Encuesta 1

N~ x1*x2/x12

InferenciaInferencia

Formulación de resultados acerca de Formulación de resultados acerca de la población completa en base a la la población completa en base a la parte seleccionada parte seleccionada

Inferencia Inferencia basada en el diseñobasada en el diseño (la (la aleatorización proviene del diseño muestral)aleatorización proviene del diseño muestral)

Inferencia Inferencia basada en el modelobasada en el modelo (la (la aleatorización proviene del modelo aleatorización proviene del modelo estocástico)estocástico)

Tipos de análisisTipos de análisis

Estudios descriptivos Estudios descriptivos - parámetros fijos- parámetros fijos - basada en el diseño- basada en el diseño

Estudios analíticos Estudios analíticos - relaciones complejas - relaciones complejas

(asociación, (asociación, causalidad,…)causalidad,…)

Estudios descriptivosEstudios descriptivos

- Media de una variable Media de una variable Y = Y = ∑∑UUyyii/N/N

- Total de una variable Total de una variable T = T = ∑∑UUyyii

- Proporción de individuos que Proporción de individuos que presentan una característica.presentan una característica.

P= P= ∑∑UUAAii/N/N

Estimador de Horvitz-Estimador de Horvitz-ThompsonThompson

dd= (S= (Sd,d,ppdd) diseño muestral ) diseño muestral

ππi i = p(i sea seleccionada)= p(i sea seleccionada)

sk k

ky

yT

ˆ

Propiedades: Insesgado, tiene un estimador simple de su varianza, es admisible, consistente, …

El uso de información auxiliarEl uso de información auxiliar

Sea y= variable objeto de estudioSea y= variable objeto de estudio Sea x= variable auxiliar que está Sea x= variable auxiliar que está

relacionada con la variable y.relacionada con la variable y.

y, x

xU

s

La información auxiliar se puede La información auxiliar se puede utilizarutilizar

- en la fase de selección (muestreo - en la fase de selección (muestreo estratificado, m. con probabilidades estratificado, m. con probabilidades desiguales)desiguales)

- en la - en la fase de estimaciónfase de estimación

Estimadores indirectosEstimadores indirectos

Sea TSea Txx conocido, en la muestra s se conocido, en la muestra s se observan observan y, x.y, x.

sk k

ky

yT

ˆ

)ˆ(ˆˆ xxyy TTcTT

Si c=1 estimador de diferenciaSi c=Ty/Tx=R estimador de razónSi c=b= coef. De regresión, estimador de regresión

sk sk

kkk

ky yd

yT̂

La calibración consiste en sustituir, en el estimador de H-T, dk, por otros pesos k , tan cercanos como sea posible, con respecto a una métrica dada, a dk y respetando la ecuación de calibración :

sk

kk )x(Tx

Estimadores de calibración.Estimadores de calibración.

Estimador de calibraciónEstimador de calibración

sk

s'

xykkyyreg B̂)T̂)x(T(T̂yT̂T̂

sk

kkkk1

ss yxqdTB̂

ESTIMADOR DE REGRESIÓN GENERALIZADO

(Cassel, Särndal y Wretman,1976)

Estimadores de Estimadores de verosimilitud empíricaverosimilitud empírica

(Chen y Qin, 1993)(Chen y Qin, 1993)

Consiste en sustituir, en el estimador de H-T, dk, por otros pesos pk que se obtienen maximizando la función de verosimilitud empírica sujeta a las restricciones

Σspi=1 Σspiui=0

Σuui/N =0

TVE=Σspi

yi

EjemploEjemplo

Estudio sobre la mortalidad por cáncer Estudio sobre la mortalidad por cáncer de mama en los estados de Carolina y de mama en los estados de Carolina y GeorgiaGeorgia

Variable a estudio: número de muertes Variable a estudio: número de muertes por cáncer de mama por cáncer de mama

Variable auxiliar: número de mujeres Variable auxiliar: número de mujeres adultas en la poblaciónadultas en la población

nn

EstimaEstima4040 8080 100100 140140 200200

Horvitz-THorvitz-T 11 11 11 11 11

RazónRazón 0.0690.069 0.060.0655

0.0700.070 0.0630.063 0.0630.063

Hartley-RHartley-R 0.0710.071 0.060.0655

0.0700.070 0.0620.062 0.0620.062

GREGGREG 0.0760.076 0.070.0722

0.0780.078 0.0650.065 0.0660.066

CalibracióCalibraciónn

0.0720.072 0.060.0688

0.0740.074 0.0640.064 0.0640.064

Ver. Ver. Empir.Empir.

0.1360.136 0.080.0844

0.1050.105 0.0790.079 0.0660.066

Cocientes entre las varianzas de los estimadoresindirectos de la media respecto al estimador de Horvitz-Thompson

nn

EstimaEstima4040 8080 100100 140140 200200

directodirecto 11 11 11 11 11

RazónRazón 0.4730.473 0.460.4611

0.4420.442 0.4360.436 0.5080.508

ChamberChamberss

0.3530.353 0.250.2588

0.2310.231 0.2270.227 0.2580.258

DiferenciDiferenciaa

0.4150.415 0.440.4455

0.4230.423 0.4200.420 0.5280.528

CalibracióCalibraciónn

0.3880.388 0.420.4233

0.4290.429 0.3940.394 0.4680.468

Ver. Ver. Empir.Empir.

0.4030.403 0.410.4133

0.4090.409 0.3860.386 0.4420.442

Cocientes entre las varianzas de los estimadoresindirectos de la mediana respecto al estimador directo

Estudios analíticosEstudios analíticos

Contraste de significación de proporcionesContraste de significación de proporciones

HHoo: p1-p2=0 H1: p1-p2<>0 : p1-p2=0 H1: p1-p2<>0 RegresiónRegresión

yyNN= X= XNNββ + + εεNN

Análisis categórico de datosAnálisis categórico de datos tabla de contingencia a x btabla de contingencia a x b

Contraste de significación Contraste de significación de proporcionesde proporciones

HH00: p: p11-p-p22=0 H=0 H11: p: p11-p-p22<>0 <>0

- MModelo superpoblación pob.1. Iodelo superpoblación pob.1. Iii i.i.d. i.i.d.

pob.2. Jpob.2. Ji i i.i.d. Independie. i.i.d. Independie.

- Problemas potenciales: mala especificación del Problemas potenciales: mala especificación del modelo y la muestra no representa la distribuciónmodelo y la muestra no representa la distribución

- Consecuencias: los estimadores son sesgados y los Consecuencias: los estimadores son sesgados y los errores incorrectoserrores incorrectos

Contraste de Contraste de significación de significación de proporcionesproporciones Aproximación basada en el diseñoAproximación basada en el diseño1 fase produce la población finita1 fase produce la población finita

2 fase produce la muestra 2 fase produce la muestra

Se considera el mismo modelo de Se considera el mismo modelo de superpoblaciónsuperpoblación

DDHTHT= p1= p1HTHT-p2-p2HTHT es diseño insesgado de D es diseño insesgado de D

V(DV(DHTHT) puede ser estimada insesgadamente por ) puede ser estimada insesgadamente por el estimador basado en el diseñoel estimador basado en el diseño

Los estimadores son robustos Los estimadores son robustos

Determinación del Determinación del tamaño muestral.tamaño muestral.

Tipo de análisis empleadoTipo de análisis empleado El nivel de precisión requeridaEl nivel de precisión requerida Homogeneidad de la poblaciónHomogeneidad de la población Información disponibleInformación disponible Diseño muestral usadoDiseño muestral usado

Errores en las encuestasErrores en las encuestas

Es la diferencia entre el valor Es la diferencia entre el valor estimado y el parámetro estimado y el parámetro desconocido: desconocido: ׀׀est -est -θθ ׀׀

Tipos: Errores de muestreoTipos: Errores de muestreo

Errores ajenos al muestreoErrores ajenos al muestreo

Errores de muestreoErrores de muestreo

Son los debidos a haber analizado sólo Son los debidos a haber analizado sólo una parte de la poblaciónuna parte de la población

Se define como V(est)Se define como V(est)1/21/2

Se puede determinarSe puede determinar el error que se el error que se comete con un muestra concretacomete con un muestra concreta

Se puede fijar de antemanoSe puede fijar de antemano y y seleccionar el tamaño de muestra seleccionar el tamaño de muestra necesario para obtener ese error necesario para obtener ese error máximomáximo

Estimación de errores Estimación de errores muestralesmuestrales

permite decidir acerca del grado de permite decidir acerca del grado de validez o confianza de los datos en validez o confianza de los datos en relación con el uso que se va a hacer de relación con el uso que se va a hacer de ellos.ellos.

ParametroParametro

Diseño Diseño

lineallineal No linealNo lineal

simplesimple aa bb

complejocomplejo cc dd

Estimación de errores Estimación de errores muestralesmuestrales a- Expresión algebraica de la varianzaa- Expresión algebraica de la varianza

Aproximación lineal (Taylor)Aproximación lineal (Taylor)

b,c,d Replicación de muestrasb,c,d Replicación de muestras

Exploración intensiva de Exploración intensiva de muestrasmuestras

grupos aleatorios, semimuestras

bootstrap, jackknife

Errores ajenos al Errores ajenos al muestreomuestreo Tienen lugar tanto en censos como en Tienen lugar tanto en censos como en

muestrasmuestras Son debidos a muchos factores: falta de Son debidos a muchos factores: falta de

respuesta, recogida, registro y respuesta, recogida, registro y procesamiento incorrecto de los datos, procesamiento incorrecto de los datos, marcos imperfectos, errores de campo, marcos imperfectos, errores de campo, errores de respuesta…errores de respuesta…

Imposible cuantificarlos en su totalidadImposible cuantificarlos en su totalidad Su tratamiento es muy caroSu tratamiento es muy caro Suelen ser el Suelen ser el principal problemaprincipal problema de las de las

encuestasencuestas

Tipos de errores ajenos Tipos de errores ajenos al muestreoal muestreo

sobrecoberturasobrecobertura De observación medida De observación medida

procesamientoprocesamiento

De no observación coberturaDe no observación cobertura

falta de respuestafalta de respuesta

Tratamiento de la falta Tratamiento de la falta de respuestade respuesta

Primario: Primario: Encuestas repetidas, encuestas delegadas, Encuestas repetidas, encuestas delegadas, sustitución de unidades, uso de incentivos, método de sustitución de unidades, uso de incentivos, método de Kish y Hace,…Kish y Hace,…

En la fase de campo: En la fase de campo: métodos de Hansen y Hurvitz, de métodos de Hansen y Hurvitz, de Politz y Simmons, de Demming, respuesta aleatorizada,…Politz y Simmons, de Demming, respuesta aleatorizada,…

En la fase de procesamiento: En la fase de procesamiento: métodos gráficos, de métodos gráficos, de Platek, de Thompsen, …Platek, de Thompsen, …

En la fase de análisis: En la fase de análisis: Imputación (de registro Imputación (de registro donante, de regresión, probabilística, múltiple), donante, de regresión, probabilística, múltiple), formulación de estimadores con datos parcialmente formulación de estimadores con datos parcialmente faltantes.faltantes.

Software para el análisis Software para el análisis de encuestas por de encuestas por muestreomuestreo

De propósito general (De propósito general (C, Visual basic, C, Visual basic, fortran, matlab, hojas de cálculo,…)fortran, matlab, hojas de cálculo,…)

De aplicaciones estadísticas De aplicaciones estadísticas (SPSS, (SPSS, Statgraphics, SAS, Splus, R,…)Statgraphics, SAS, Splus, R,…)

Específico de muestreo Específico de muestreo (Sudaan, (Sudaan, PcCarp, Wesvar, survey…)PcCarp, Wesvar, survey…)

Software de muestreoSoftware de muestreo

Obtención de muestras Obtención de muestras desde diseños muestrales desde diseños muestrales

Cálculos asociados al Cálculos asociados al proceso de estimación proceso de estimación

ComparativaComparativa

Diseños muestrales disponiblesDiseños muestrales disponibles

Métodos de estimación de la Métodos de estimación de la varianza varianza

Análisis estadísticos realizadosAnálisis estadísticos realizados

AparienciaApariencia

Disponibilidad y preciosDisponibilidad y precios

RecomendacionesRecomendaciones

Es necesario el uso de un software específico Es necesario el uso de un software específico para el análisis de datos de muestras complejas.para el análisis de datos de muestras complejas.

Si ya se utiliza previamente un software general Si ya se utiliza previamente un software general que incluya la estimación usando el diseño que incluya la estimación usando el diseño muestral o tenga algún modulo optativo, utilizar muestral o tenga algún modulo optativo, utilizar dicho software.(Stata, SAS, Epi Info, SPSS)dicho software.(Stata, SAS, Epi Info, SPSS)

Si el software usado no lo incluye hay que Si el software usado no lo incluye hay que considerar un software especializado (SUDAAN, considerar un software especializado (SUDAAN, WESVAR, PC-CARP, CENVAR)WESVAR, PC-CARP, CENVAR)

RecomendacionesRecomendaciones

Para pequeños usuarios Para pequeños usuarios usar un usar un programa gratuito (Epi Info, CENVAR, programa gratuito (Epi Info, CENVAR, WESVAR 2, R)WESVAR 2, R)

Para grandes empresas, institutos de Para grandes empresas, institutos de estadística, centros de estudios, …estadística, centros de estudios, …

--adquirir una licencia (WESVAR, PC-CARP, adquirir una licencia (WESVAR, PC-CARP, STATA, STATA, SUDAANSUDAAN, , SASSAS))

-utilizar su propio código-utilizar su propio código

PROBLEMAS PROBLEMAS RELACIONADOS CON RELACIONADOS CON

LOS MEDICAMENTOS EN LOS MEDICAMENTOS EN LOS USUARIOS DEL LOS USUARIOS DEL

SERVICIO DE URGENCIASSERVICIO DE URGENCIAS

Instituto de Salud Carlos III

Gracias por su atención

Aspectos relevantes en el diseño y análisis de las encuestas de salud pública. María del Mar...

Documents

Transcript of Aspectos relevantes en el diseño y análisis de las encuestas de salud pública. María del Mar...