Aspectos relevantes en el diseño y análisis de las encuestas de salud pública. María del Mar...
-
Upload
agata-amparo -
Category
Documents
-
view
5 -
download
0
Transcript of Aspectos relevantes en el diseño y análisis de las encuestas de salud pública. María del Mar...
Aspectos relevantes en el Aspectos relevantes en el diseño y análisis de las diseño y análisis de las encuestas de salud encuestas de salud pública.pública.
María del Mar Rueda GarcíaMaría del Mar Rueda GarcíaDpto. de Estadística e I.O. Dpto. de Estadística e I.O. Universidad de GranadaUniversidad de Granada
Las encuestas de salud Las encuestas de salud públicapública
Son un elemento esencial para la Son un elemento esencial para la toma de decisionestoma de decisiones
Proporcionan conocimientoProporcionan conocimiento- Situación epidemiológicaSituación epidemiológica- Tendencias de saludTendencias de salud- Hábitos de vidaHábitos de vida- Utilización de servicios sanitariosUtilización de servicios sanitarios
ObjetivosObjetivos
Monotorizar las tendencias en la Monotorizar las tendencias en la salud percibida, los hábitos de salud percibida, los hábitos de vida y la utilización de servicios vida y la utilización de servicios sanitariossanitarios
Identificar los principales grupos Identificar los principales grupos de riesgo en la salud, en los de riesgo en la salud, en los hábitos de vida y en el acceso a hábitos de vida y en el acceso a los servicios sanitarios.los servicios sanitarios.
Principales aspectos en Principales aspectos en las encuestas de salud las encuestas de salud públicapública Diseño muestralDiseño muestral InferenciaInferencia Estimación de las varianzasEstimación de las varianzas Tratamiento de datos faltantesTratamiento de datos faltantes Software para el análisis de los Software para el análisis de los
datosdatos
Diseño muestralDiseño muestral
Se determina atendiendo aSe determina atendiendo a
objetivos primarios de la encuestaobjetivos primarios de la encuesta restricciones económicas, restricciones económicas,
temporales y materialestemporales y materiales tamaño y características de la tamaño y características de la
población bajo estudiopoblación bajo estudio
Diseños muestralesDiseños muestrales
d=(S,p)d=(S,p) p:S p:S→R→R
s=(is=(i11,i,i22,…,i,…,in(s)n(s)) 0<p(s)<1 ) 0<p(s)<1
La selección de las unidades es La selección de las unidades es aleatoriaaleatoria
Se puede determinar Se puede determinar de antemano de antemano cuál escuál es la probabilidad la probabilidad de que de que cada individuo sea seleccionadocada individuo sea seleccionado
Principales diseños usados en Principales diseños usados en encuestas de saludencuestas de salud
Muestreo por conglomeradosMuestreo por conglomerados Muestreo estratificadoMuestreo estratificado Muestreo sistemático Muestreo sistemático Muestreo con probabilidades proporcionales Muestreo con probabilidades proporcionales
al tamañoal tamaño Diseños muestrales complejosDiseños muestrales complejos Muestreo de unidades rarasMuestreo de unidades raras
Muestreo estratificadoMuestreo estratificado
Procedimiento: Dividir la Procedimiento: Dividir la población en estratos población en estratos disjuntos (ciudades, disjuntos (ciudades, pueblos, distritos, áreas pueblos, distritos, áreas rurales,…) y seleccionar en rurales,…) y seleccionar en cada uno una muestracada uno una muestraRazones: Poder hacer Razones: Poder hacer estimaciones separadas en estimaciones separadas en cada estrato, asegurar la cada estrato, asegurar la representación de todos los representación de todos los estratos, menor error,…estratos, menor error,…
Muestreo por conglomeradosMuestreo por conglomerados
Objetivo: seleccionar Objetivo: seleccionar muestras cuando no se muestras cuando no se tiene un listado de tiene un listado de individuosindividuos
Procedimiento: se Procedimiento: se seleccionan grupos de seleccionan grupos de unidades (conglomerados) unidades (conglomerados) y se muestrean unidades y se muestrean unidades de los conglomerados de los conglomerados seleccionadosseleccionados
Muestreo polietápicoMuestreo polietápico
Procedimiento: seleccionar una muestra de conglomerados (UP) y dentro de éstos seleccionar otra muestra de elementos (US) . Dentro de las US se muestrean otros elementos (UT)…
Uso: Es más barato y sólo necesita un marco de las unidades seleccionadas en cada etapa.
Muestreo bietápico
Muestreo por conglomerados
Muestreo trietápico
Muestreo sistemáticoMuestreo sistemático
Problema: no se tiene un listado Problema: no se tiene un listado de las unidades, no se conoce el de las unidades, no se conoce el tamaño de la población, es difícil tamaño de la población, es difícil localizar las unidades,…localizar las unidades,…
Procedimiento: Se elige un número Procedimiento: Se elige un número aleatorio i, y se analizan las aleatorio i, y se analizan las unidades: i,i+k,i+2k,…i+(n-1)kunidades: i,i+k,i+2k,…i+(n-1)k
Hogares como unidades Hogares como unidades de muestreode muestreo
El listado es fácil de obtenerEl listado es fácil de obtener Las unidades dentro del hogar son Las unidades dentro del hogar son
heterogéneas (sexo, edad,…)heterogéneas (sexo, edad,…) La información se obtiene a partir La información se obtiene a partir
dede
-una unidad representativa-una unidad representativa
- - una unidad muestreada (Kish una unidad muestreada (Kish grid)grid)
Muestreo estratificado Muestreo estratificado polietápico de hogarespolietápico de hogares
Se utilizan para elaborar el marco y Se utilizan para elaborar el marco y agrupar entrevistadores de forma que agrupar entrevistadores de forma que el el costecoste sea pequeñosea pequeño
Es el diseño más usado tanto en países Es el diseño más usado tanto en países desarrollados como en vías de desarrollados como en vías de desarrollo.desarrollo.
Estructura típica de un Estructura típica de un diseño muestral de diseño muestral de hogareshogares
característicacaracterística Posible definiciónPosible definición
EstratoEstrato RegionesRegiones
Tipo de comunidadTipo de comunidad
U PrimariaU Primaria Secciones censalesSecciones censales
Pueblos en áreas ruralesPueblos en áreas rurales
Manzanas en áreas urbanasManzanas en áreas urbanas
U SecundariaU Secundaria ViviendasViviendas
U TerciariaU Terciaria Miembros de las viviendasMiembros de las viviendas
U observaciónU observación IndividuosIndividuos
National Health Interview National Health Interview Survey (EEUU)Survey (EEUU) Población marco: mujeres 15-44 años que Población marco: mujeres 15-44 años que
viven en hogares.viven en hogares. 1900 UPs (pueblos o conjuntos de éstos)1900 UPs (pueblos o conjuntos de éstos) UP se estratificaron usando variables UP se estratificaron usando variables
socioeconómicas y demográficas.socioeconómicas y demográficas. Se seleccionan 198 UP con probabilidades Se seleccionan 198 UP con probabilidades
proporcionales al tamaño dentro de cada proporcionales al tamaño dentro de cada estrato.estrato.
Dentro de cada UP se selecciono una muestra Dentro de cada UP se selecciono una muestra de manzanas (US)de manzanas (US)
Dentro de cada US se selecciona una muestra Dentro de cada US se selecciona una muestra de aprox. 8 hogares (UT)de aprox. 8 hogares (UT)
43007 hogares en la muestra43007 hogares en la muestra
Tetanus toxoid inmunization sample Tetanus toxoid inmunization sample survey BURUNDI (World Health survey BURUNDI (World Health Organization)Organization)
Estrato 1: Bujumbura (estrato urbano)Estrato 1: Bujumbura (estrato urbano) Estrato 2: resto del pais (estrato rural)Estrato 2: resto del pais (estrato rural) UP (areas geográficas) en cada estrato UP (areas geográficas) en cada estrato
con probabilidades proporcionales al con probabilidades proporcionales al tamañotamaño
US viviendas con probabilidades igualesUS viviendas con probabilidades iguales Todas las mujeres de la vivienda nacidas Todas las mujeres de la vivienda nacidas
en el último año son seleccionadasen el último año son seleccionadas
Muestreo de unidades Muestreo de unidades poco frecuentes.poco frecuentes.
Obtener estimaciones con precisión Obtener estimaciones con precisión satisfactoria suele ser muy costososatisfactoria suele ser muy costoso
Ejemplo: m.a.s. Ejemplo: m.a.s. P=0.02, n=800 error relativo=50%P=0.02, n=800 error relativo=50%
P=0.02, n=80000 error relativo=5%P=0.02, n=80000 error relativo=5%
Diseños muestrales usados: Diseños muestrales usados: Muestreo Muestreo inverso, muestreo de redes, muestreo inverso, muestreo de redes, muestreo dual, muestreo en bola de nievedual, muestreo en bola de nieve
Muestreo inversoMuestreo inverso
Fija de antemano el número de Fija de antemano el número de unidades raras a incluir en la unidades raras a incluir en la muestra.muestra.
Se continúa el muestreo hasta Se continúa el muestreo hasta
completar dicho número completar dicho número cualquiera que sea el tamaño cualquiera que sea el tamaño total de la muestratotal de la muestra
Muestreo en bola de Muestreo en bola de nievenieve
seleccionar una muestra inicial de seleccionar una muestra inicial de nn individuos de forma probabilísticaindividuos de forma probabilística
en cada entrevista cada individuo en cada entrevista cada individuo nombra a otros nombra a otros KK nuevos individuos de nuevos individuos de la población en estudio que han de la población en estudio que han de entrevistarse.entrevistarse.
inmigrantes, minorías étnicas, personas inmigrantes, minorías étnicas, personas con dificultades o marginadoscon dificultades o marginados
Ejemplo: En una encuesta destinada a estudiar la ocurrencia de una rara enfermedad se selecciona una muestra aleatoria de centros médicos. De los registros de cada centro médico de la muestra, se obtienen los ficheros de los pacientes tratados en el centro de esa enfermedad. No obstante un paciente dado puede haber sido tratado por más de un centro. Cuanto mayor sea el número de centros en los cuales haya sido tratado un enfermo, más probabilidad tiene éste de pertenecer a la muestra.
Muestreo de nexos (network sampling)
Muestreo de nexos (network sampling)
Se selecciona una muestra aleatoria de unidades de selección, y todas las unidades de observación que están asociadas con cada unidad seleccionada se incluyen en la muestra y son observadas. La multiplicidad del individuo es el número de unidades de selección al cual está ligado. Se define un nexo como el conjunto de unidades de observación con un determinado patrón de ligadura.
Uso: por la imposibilidad de realizar un muestreo convencional
Muestreo dualMuestreo dual
La estimación se realiza a partir de dos La estimación se realiza a partir de dos encuestas independientesencuestas independientes
SISI NONO
SISI x12x12 x1x1
NONO
x2x2
Encuesta 2Encuesta 1
N~ x1*x2/x12
InferenciaInferencia
Formulación de resultados acerca de Formulación de resultados acerca de la población completa en base a la la población completa en base a la parte seleccionada parte seleccionada
Inferencia Inferencia basada en el diseñobasada en el diseño (la (la aleatorización proviene del diseño muestral)aleatorización proviene del diseño muestral)
Inferencia Inferencia basada en el modelobasada en el modelo (la (la aleatorización proviene del modelo aleatorización proviene del modelo estocástico)estocástico)
Tipos de análisisTipos de análisis
Estudios descriptivos Estudios descriptivos - parámetros fijos- parámetros fijos - basada en el diseño- basada en el diseño
Estudios analíticos Estudios analíticos - relaciones complejas - relaciones complejas
(asociación, (asociación, causalidad,…)causalidad,…)
Estudios descriptivosEstudios descriptivos
- Media de una variable Media de una variable Y = Y = ∑∑UUyyii/N/N
- Total de una variable Total de una variable T = T = ∑∑UUyyii
- Proporción de individuos que Proporción de individuos que presentan una característica.presentan una característica.
P= P= ∑∑UUAAii/N/N
Estimador de Horvitz-Estimador de Horvitz-ThompsonThompson
dd= (S= (Sd,d,ppdd) diseño muestral ) diseño muestral
ππi i = p(i sea seleccionada)= p(i sea seleccionada)
sk k
ky
yT
ˆ
Propiedades: Insesgado, tiene un estimador simple de su varianza, es admisible, consistente, …
El uso de información auxiliarEl uso de información auxiliar
Sea y= variable objeto de estudioSea y= variable objeto de estudio Sea x= variable auxiliar que está Sea x= variable auxiliar que está
relacionada con la variable y.relacionada con la variable y.
y, x
xU
s
La información auxiliar se puede La información auxiliar se puede utilizarutilizar
- en la fase de selección (muestreo - en la fase de selección (muestreo estratificado, m. con probabilidades estratificado, m. con probabilidades desiguales)desiguales)
- en la - en la fase de estimaciónfase de estimación
Estimadores indirectosEstimadores indirectos
Sea TSea Txx conocido, en la muestra s se conocido, en la muestra s se observan observan y, x.y, x.
sk k
ky
yT
ˆ
)ˆ(ˆˆ xxyy TTcTT
Si c=1 estimador de diferenciaSi c=Ty/Tx=R estimador de razónSi c=b= coef. De regresión, estimador de regresión
sk sk
kkk
ky yd
yT̂
La calibración consiste en sustituir, en el estimador de H-T, dk, por otros pesos k , tan cercanos como sea posible, con respecto a una métrica dada, a dk y respetando la ecuación de calibración :
sk
kk )x(Tx
Estimadores de calibración.Estimadores de calibración.
Estimador de calibraciónEstimador de calibración
sk
s'
xykkyyreg B̂)T̂)x(T(T̂yT̂T̂
sk
kkkk1
ss yxqdTB̂
ESTIMADOR DE REGRESIÓN GENERALIZADO
(Cassel, Särndal y Wretman,1976)
Estimadores de Estimadores de verosimilitud empíricaverosimilitud empírica
(Chen y Qin, 1993)(Chen y Qin, 1993)
Consiste en sustituir, en el estimador de H-T, dk, por otros pesos pk que se obtienen maximizando la función de verosimilitud empírica sujeta a las restricciones
Σspi=1 Σspiui=0
Σuui/N =0
TVE=Σspi
yi
EjemploEjemplo
Estudio sobre la mortalidad por cáncer Estudio sobre la mortalidad por cáncer de mama en los estados de Carolina y de mama en los estados de Carolina y GeorgiaGeorgia
Variable a estudio: número de muertes Variable a estudio: número de muertes por cáncer de mama por cáncer de mama
Variable auxiliar: número de mujeres Variable auxiliar: número de mujeres adultas en la poblaciónadultas en la población
nn
EstimaEstima4040 8080 100100 140140 200200
Horvitz-THorvitz-T 11 11 11 11 11
RazónRazón 0.0690.069 0.060.0655
0.0700.070 0.0630.063 0.0630.063
Hartley-RHartley-R 0.0710.071 0.060.0655
0.0700.070 0.0620.062 0.0620.062
GREGGREG 0.0760.076 0.070.0722
0.0780.078 0.0650.065 0.0660.066
CalibracióCalibraciónn
0.0720.072 0.060.0688
0.0740.074 0.0640.064 0.0640.064
Ver. Ver. Empir.Empir.
0.1360.136 0.080.0844
0.1050.105 0.0790.079 0.0660.066
Cocientes entre las varianzas de los estimadoresindirectos de la media respecto al estimador de Horvitz-Thompson
nn
EstimaEstima4040 8080 100100 140140 200200
directodirecto 11 11 11 11 11
RazónRazón 0.4730.473 0.460.4611
0.4420.442 0.4360.436 0.5080.508
ChamberChamberss
0.3530.353 0.250.2588
0.2310.231 0.2270.227 0.2580.258
DiferenciDiferenciaa
0.4150.415 0.440.4455
0.4230.423 0.4200.420 0.5280.528
CalibracióCalibraciónn
0.3880.388 0.420.4233
0.4290.429 0.3940.394 0.4680.468
Ver. Ver. Empir.Empir.
0.4030.403 0.410.4133
0.4090.409 0.3860.386 0.4420.442
Cocientes entre las varianzas de los estimadoresindirectos de la mediana respecto al estimador directo
Estudios analíticosEstudios analíticos
Contraste de significación de proporcionesContraste de significación de proporciones
HHoo: p1-p2=0 H1: p1-p2<>0 : p1-p2=0 H1: p1-p2<>0 RegresiónRegresión
yyNN= X= XNNββ + + εεNN
Análisis categórico de datosAnálisis categórico de datos tabla de contingencia a x btabla de contingencia a x b
Contraste de significación Contraste de significación de proporcionesde proporciones
HH00: p: p11-p-p22=0 H=0 H11: p: p11-p-p22<>0 <>0
- MModelo superpoblación pob.1. Iodelo superpoblación pob.1. Iii i.i.d. i.i.d.
pob.2. Jpob.2. Ji i i.i.d. Independie. i.i.d. Independie.
- Problemas potenciales: mala especificación del Problemas potenciales: mala especificación del modelo y la muestra no representa la distribuciónmodelo y la muestra no representa la distribución
- Consecuencias: los estimadores son sesgados y los Consecuencias: los estimadores son sesgados y los errores incorrectoserrores incorrectos
Contraste de Contraste de significación de significación de proporcionesproporciones Aproximación basada en el diseñoAproximación basada en el diseño1 fase produce la población finita1 fase produce la población finita
2 fase produce la muestra 2 fase produce la muestra
Se considera el mismo modelo de Se considera el mismo modelo de superpoblaciónsuperpoblación
DDHTHT= p1= p1HTHT-p2-p2HTHT es diseño insesgado de D es diseño insesgado de D
V(DV(DHTHT) puede ser estimada insesgadamente por ) puede ser estimada insesgadamente por el estimador basado en el diseñoel estimador basado en el diseño
Los estimadores son robustos Los estimadores son robustos
Determinación del Determinación del tamaño muestral.tamaño muestral.
Tipo de análisis empleadoTipo de análisis empleado El nivel de precisión requeridaEl nivel de precisión requerida Homogeneidad de la poblaciónHomogeneidad de la población Información disponibleInformación disponible Diseño muestral usadoDiseño muestral usado
Errores en las encuestasErrores en las encuestas
Es la diferencia entre el valor Es la diferencia entre el valor estimado y el parámetro estimado y el parámetro desconocido: desconocido: ׀׀est -est -θθ ׀׀
Tipos: Errores de muestreoTipos: Errores de muestreo
Errores ajenos al muestreoErrores ajenos al muestreo
Errores de muestreoErrores de muestreo
Son los debidos a haber analizado sólo Son los debidos a haber analizado sólo una parte de la poblaciónuna parte de la población
Se define como V(est)Se define como V(est)1/21/2
Se puede determinarSe puede determinar el error que se el error que se comete con un muestra concretacomete con un muestra concreta
Se puede fijar de antemanoSe puede fijar de antemano y y seleccionar el tamaño de muestra seleccionar el tamaño de muestra necesario para obtener ese error necesario para obtener ese error máximomáximo
Estimación de errores Estimación de errores muestralesmuestrales
permite decidir acerca del grado de permite decidir acerca del grado de validez o confianza de los datos en validez o confianza de los datos en relación con el uso que se va a hacer de relación con el uso que se va a hacer de ellos.ellos.
ParametroParametro
Diseño Diseño
lineallineal No linealNo lineal
simplesimple aa bb
complejocomplejo cc dd
Estimación de errores Estimación de errores muestralesmuestrales a- Expresión algebraica de la varianzaa- Expresión algebraica de la varianza
Aproximación lineal (Taylor)Aproximación lineal (Taylor)
b,c,d Replicación de muestrasb,c,d Replicación de muestras
Exploración intensiva de Exploración intensiva de muestrasmuestras
grupos aleatorios, semimuestras
bootstrap, jackknife
Errores ajenos al Errores ajenos al muestreomuestreo Tienen lugar tanto en censos como en Tienen lugar tanto en censos como en
muestrasmuestras Son debidos a muchos factores: falta de Son debidos a muchos factores: falta de
respuesta, recogida, registro y respuesta, recogida, registro y procesamiento incorrecto de los datos, procesamiento incorrecto de los datos, marcos imperfectos, errores de campo, marcos imperfectos, errores de campo, errores de respuesta…errores de respuesta…
Imposible cuantificarlos en su totalidadImposible cuantificarlos en su totalidad Su tratamiento es muy caroSu tratamiento es muy caro Suelen ser el Suelen ser el principal problemaprincipal problema de las de las
encuestasencuestas
Tipos de errores ajenos Tipos de errores ajenos al muestreoal muestreo
sobrecoberturasobrecobertura De observación medida De observación medida
procesamientoprocesamiento
De no observación coberturaDe no observación cobertura
falta de respuestafalta de respuesta
Tratamiento de la falta Tratamiento de la falta de respuestade respuesta
Primario: Primario: Encuestas repetidas, encuestas delegadas, Encuestas repetidas, encuestas delegadas, sustitución de unidades, uso de incentivos, método de sustitución de unidades, uso de incentivos, método de Kish y Hace,…Kish y Hace,…
En la fase de campo: En la fase de campo: métodos de Hansen y Hurvitz, de métodos de Hansen y Hurvitz, de Politz y Simmons, de Demming, respuesta aleatorizada,…Politz y Simmons, de Demming, respuesta aleatorizada,…
En la fase de procesamiento: En la fase de procesamiento: métodos gráficos, de métodos gráficos, de Platek, de Thompsen, …Platek, de Thompsen, …
En la fase de análisis: En la fase de análisis: Imputación (de registro Imputación (de registro donante, de regresión, probabilística, múltiple), donante, de regresión, probabilística, múltiple), formulación de estimadores con datos parcialmente formulación de estimadores con datos parcialmente faltantes.faltantes.
Software para el análisis Software para el análisis de encuestas por de encuestas por muestreomuestreo
De propósito general (De propósito general (C, Visual basic, C, Visual basic, fortran, matlab, hojas de cálculo,…)fortran, matlab, hojas de cálculo,…)
De aplicaciones estadísticas De aplicaciones estadísticas (SPSS, (SPSS, Statgraphics, SAS, Splus, R,…)Statgraphics, SAS, Splus, R,…)
Específico de muestreo Específico de muestreo (Sudaan, (Sudaan, PcCarp, Wesvar, survey…)PcCarp, Wesvar, survey…)
Software de muestreoSoftware de muestreo
Obtención de muestras Obtención de muestras desde diseños muestrales desde diseños muestrales
Cálculos asociados al Cálculos asociados al proceso de estimación proceso de estimación
ComparativaComparativa
Diseños muestrales disponiblesDiseños muestrales disponibles
Métodos de estimación de la Métodos de estimación de la varianza varianza
Análisis estadísticos realizadosAnálisis estadísticos realizados
AparienciaApariencia
Disponibilidad y preciosDisponibilidad y precios
RecomendacionesRecomendaciones
Es necesario el uso de un software específico Es necesario el uso de un software específico para el análisis de datos de muestras complejas.para el análisis de datos de muestras complejas.
Si ya se utiliza previamente un software general Si ya se utiliza previamente un software general que incluya la estimación usando el diseño que incluya la estimación usando el diseño muestral o tenga algún modulo optativo, utilizar muestral o tenga algún modulo optativo, utilizar dicho software.(Stata, SAS, Epi Info, SPSS)dicho software.(Stata, SAS, Epi Info, SPSS)
Si el software usado no lo incluye hay que Si el software usado no lo incluye hay que considerar un software especializado (SUDAAN, considerar un software especializado (SUDAAN, WESVAR, PC-CARP, CENVAR)WESVAR, PC-CARP, CENVAR)
RecomendacionesRecomendaciones
Para pequeños usuarios Para pequeños usuarios usar un usar un programa gratuito (Epi Info, CENVAR, programa gratuito (Epi Info, CENVAR, WESVAR 2, R)WESVAR 2, R)
Para grandes empresas, institutos de Para grandes empresas, institutos de estadística, centros de estudios, …estadística, centros de estudios, …
--adquirir una licencia (WESVAR, PC-CARP, adquirir una licencia (WESVAR, PC-CARP, STATA, STATA, SUDAANSUDAAN, , SASSAS))
-utilizar su propio código-utilizar su propio código
PROBLEMAS PROBLEMAS RELACIONADOS CON RELACIONADOS CON
LOS MEDICAMENTOS EN LOS MEDICAMENTOS EN LOS USUARIOS DEL LOS USUARIOS DEL
SERVICIO DE URGENCIASSERVICIO DE URGENCIAS
Instituto de Salud Carlos III
Gracias por su atención