Software y Manual - ph.ucla.edu por probabilidad proporcional al tamaño en 1 a etapa ... mínimo de...
Transcript of Software y Manual - ph.ucla.edu por probabilidad proporcional al tamaño en 1 a etapa ... mínimo de...
Software y Manual
Versión 2.0
Cálculo de Tamaño Muestral y
Selección de Conglomerados y Hogares
en Encuestas Rápidas
Muhammad N. Farid Ralph R. Frerichs
Departamento de Epidemiología Universidad de California, Los Ángeles (UCLA)
Los Ángeles, CA 90095-1772 USA
- 1 -
Junio, 2007
El programa Csurvey fue inicialmente programado para DOS (para computadoras compatibles con IBM) por Iwan Ariawan, de la Universidad de Indonesia, mientras realizaba estudios de postgrado en UCLA en un programa patrocinado por el Programa de Entrenamiento en VIH/SIDA de Fogarty International. Csurvey se basó en un programa de Hoja de Cálculo creado por el Profesor Ralph R. Frerichs, el cual fue usado por muchos años en su curso de UCLA, EPI 418 Encuestas Epidemiológicas
Rápidas en Países en Desarrollo. Después de asistir al curso EPI 418, Muhammad N. Farid, también patrocinado por el Programa de Entrenamiento en VIH/SIDA de Fogarty International, diseñó y programó la Versión 2 de Csurvey en ambiente Windows. Después de la creación de la Versión 2 del programa, el presente manual fue escrito por el Profesor Frerichs en conjunto con Muhammad Farid.
Este manual fué traducido al Español por Danilo Rayo1 y editado por Alfonso Rodriguez-Lainz2
Este manual y el programa de software son de dominio público y pueden ser
copiados y distribuidos sin restricción. Ni el manual ni el programa deberían ser
vendidos para obtener un beneficio financiero.
1 Director, DRB Consulting , Managua, Nicaragua. www.drbcons.com
2 Public Health Institute, Oakland, California http://www.phi.org/
- 2 -
Tabla de contenidos
Capítulo 1: Introducción
¿Qué es Csurvey? ....................................................................................... ..... 4
Selección de Conglomerados ............................................................... 4 Tamaño muestral .................................................................................. 5 Número aleatorio .................................................................................. 6
¿Cómo está organizado este manual? ............................................................... 8
Capítulo 2: Instalación
Obtenga Csurvey del sitio web de Epidemiología de UCLA ........................... 9 Instale Csurvey en la unidad C: de su computadora ........................................ 9 Cómo remover CSurvey de su computadora ..................................................... 18
Capítulo 3: Ejemplo General
Tamaño muestral inicial .................................................................................... 19
Estimación de parámetros .......................................................................19 Prueba de hipótesis ................................................................................ 27
Preparación para una encuesta rápida .................................................................31 Parámetros de encuestas ......................................................................... 34 Datos de conglomerados .........................................................................37 Revisión del tamaño muestral .................................................................40
Implementación de una encuesta rápida Muestreo por probabilidad proporcional al tamaño en 1a etapa ........... 44 Muestreo por probabilidad proporcional al tamaño en 1a etapa en comunidades con múltiples conglomerados ..................................... 46
Otras funciones ................................................................................................. 50 Discado giratorio para seleccionar una dirección aleatoria ................... 51 Números aleatorios ............................................................................... 54
Capítulo 4: Explicación Detallada
Tamaño muestral – estimación de parámetros ................................................. 56 Tamaño muestral – prueba de hipótesis ........................................................... 60 Muestreo por probabilidad proporcional al tamaño en primera etapa ............. 65
- 3 -
- 4 -
Capítulo 1: Introducción
¿Qué es Csurvey?
Csurvey es un programa para Windows que realiza las tareas necesarias para implementar encuestas rápidas, llamadas también encuestas bietápicas (o de dos etapas) por conglomerados, con muestreo por probabilidad proporcional al tamaño (PPS por sus siglas en Inglés) en una primera etapa y un número constante de hogares o personas en una segunda etapa. Aunque los métodos de dichas encuestas pueden ser utilizados para encuestas de gran tamaño, éstas son generalmente pequeñas (i.e aplicadas a 300 hogares o individuos aproximadamente). El programa Csurvey 2.0 ha sido escrito para computadoras compatibles con Windows como una continuación al programa Csurvey
1.5, escrito para DOS. El programa ayuda a seleccionar una muestra de conglomerados de una lista de los mismos, calcula el tamaño muestral para una encuesta por conglomerados y crea una tabla de números aleatorios para seleccionar hogares de inicio aleatorio o personas dentro de los hogares. Existen tres módulos principales en Csurvey, a saber, selección de conglomerados, tamaño muestral y números aleatorios. El detalle de estos módulos se presenta a continuación.
Selección de conglomerados. El primer módulo selecciona una muestra de conglomerados de la lista total de los mismos utilizando el método de probabilidad proporcional al tamaño (PPS por sus siglas en inglés). Para realizar el muestreo de conglomerados, los usuarios deben crear una base de datos de origen, la cual contendrá el nombre y el tamaño de cada conglomerado en la población de la que se seleccionará la muestra. Esta base de datos puede ser creada utilizando Csurvey o puede ser importada de otros programas comunes de hoja de cálculo o administración de bases de datos. La Figura 1.1 muestra los conglomerados seleccionados en un archivo típico de bases de datos de origen.
- 5 -
Número Pueblo
Tamaño
Poblacional*
Número de
Conglomerados
Seleccionados
Número
de
hogares
Número
de
Personas
Elegibles
Número de
Hogares Elegibles
Personas
Elegibles
por
Hogares
Elegibles
*Personas en la población como unidad de tamaño
Figura 1.1 Módulo de selección de conglomerados de Csurvey.
Tamaño muestral. El segundo módulo permite calcular el tamaño muestral requerido para una encuesta por conglomerados que satisfaga las necesidades del investigador. Los usuarios pueden evaluar un tamaño muestral propuesto o calcular el número mínimo de conglomerados o el promedio de personas por conglomerado que se necesitan para un intervalo de confianza especificado. La Figura 1.2 presenta la estimación del tamaño muestral para una muestra por conglomerados propuesta con una estimación del valor de prevalencia de 50%, un nivel de confianza del 95% y un intervalo de confianza entre 40 % y 60% (inclusive).
- 6 -
Estimación de Parámetros Prueba de Hipótesis
Propósito del cálculo
Probar el tamaño muestral propuesto Error estándar deseado de la proporción
Calcular el número mínimo de conglomerados Error estándar observado de la proporción
Calcular el número promedio en la muestra por
conglomerado Efecto de diseño
Proporción estimada que posee el atributo Tasa de homogeneidad
Mitad de la longitud del intervalo de confianza Estimación puntual para la proporción
Nivel de confianza deseado: Límite inferior de confianza
Parámetro de homogeneidad: Efecto de diseño Límite superior de confianza
Nivel de homogeneidad: Bajo
Tamaño muestral para la encuesta por
conglomerados propuesta
Número promedio de personas elegibles por hogar
¿Es el tamaño muestral adecuado para la
necesidad planteada? SI
Número de conglomerados
Número promedio de hogares seleccionados por conglomerado IC (Intervalo de confianza)
Calcular Imprimir
Figura 1.2 Módulo de tamaño muestral de Csurvey
Números aleatorios. El tercer módulo se utiliza para crear una tabla de números aleatorios que puede ser impresa. Esta tabla es útil para seleccionar personas u hogares en los conglomerados muestreados. La Figura 1.3 presenta una tabla típica de números aleatorios para comunidades con menos de 500 hogares.
- 7 -
Tabla Discado Giratorio
El número máximo Generar Imprimir
Figura 1.3 Módulo de números aleatorios de Csurvey
- 8 -
¿Cómo está organizado este manual?
El Capítulo 2 del manual de Csurvey describe el proceso de instalación del programa en una computadora compatible con Windows con una unidad C: que utilice dicho sistema operativo. Seguidamente, el Capítulo 3 ofrece un ejemplo general de una encuesta rápida que podría ser planeada para la región de Yogyakarta en Indonesia. Posiblemente, los usuarios que estén familiarizados con la versión 1.5 de Csurvey para DOS no necesitarán información adicional para usar la versión nueva. Finalmente, el Capítulo 4 contiene la explicación técnica de las diferentes funciones disponibles en el programa Csurvey, incluyendo las fórmulas matemáticas que están incorporadas dentro del mismo.
- 9 -
Capítulo 2: Instalación
Obtenga Csurvey del sitio web de Epidemiología de UCLA Para iniciar, el programa Csurvey debe ser descargado del sitio web de Epidemiología de UCLA. Posteriormente, este debe ser copiado a la unidad C: de la computadora de destino. El programa y las instrucciones para realizar la instalación se encuentran en http://www.ph.ucla.edu/epi/rapidsurvey.html, específicamente en la sección de software. Una vez que el programa ha sido descargado y copiado a la unidad C:, el archivo de instalación debería aparecer tal y como se muestra en la Figura 2.1:
Dirección C:\csurvey2
Nombre Tamaño Tipo
CS2setup 13,479 KB Aplicación
Figura 2.1 Ubicación del programa Csurvey en la unidad C:
Cómo instalar el Csurvey en la unidad C: de la computadora: Con el botón izquierdo del ratón, haga doble clic en el archivo CS2setup (ver Figura 2.1) . La primera pantalla del proceso de instalación debería ser igual a la mostrada en la Figura 2.2.
- 10 -
Csurvey 2.0 - Asistente de Instalación
Selección Aleatoria de
Conglomerados
Determinación del Tamaño Muestral
Generador de Números Aleatorios
C-Survey
Versión 2.0
Instalador Atrás Siguiente Cancelar
Figura 2.2: Pantalla inicial del proceso de instalación Al hacer clic con el botón izquierdo del ratón en el botón Siguiente, aparecerá lo presentado en la Figura 2.3, en la cual se recuerda al usuario que el material está protegido con derechos de autor y que no está destinado para la venta. Por el contrario, el programa está disponible gratuitamente para todas aquellas personas que quieran implementar encuestas basadas en la comunidad.
- 11 -
Csurvey 2.0 - Asistente de Instalación
Bienvenido al Asistente de Instalación de Csurvey 2.0
El Asistente instalará Csurvey 2.0 en su
computadora. Para continuar, haga clic en Siguiente
ADVERTENCIA: Este programa está protegido por leyes
de derechos de autor y tratados internacionales.
CS
Atrás Siguiente Cancelar
Figura 2.3 Pantalla de bienvenida del proceso de instalación Al hacer clic nuevamente en el botón Siguiente aparecerá lo presentado en la Figura 2.4, mostrando la ubicación en la cual el programa será instalado en la computadora. Si desea que el programa se instale en una ubicación diferente, haga clic con el botón izquierdo del ratón en el botón Cambiar y seleccione la ruta del nuevo directorio o sub directorio.
- 12 -
Csurvey 2.0 - Asistente de Instalación
Carpeta de Destino
Haga clic en el botón Siguiente para instalar
en esta carpeta o haga clic en ¨Cambiar¨
para instalar en una carpeta distinta.
Instalar Csurvey 2.0
en:
C:\Archivos de Programa\Csurvey Cambiar
Instalador Atrás Siguiente Cancelar
Figura 2.4: Subdirectorio de destino para el programa Csurvey. Nota: En este caso, el programa está siendo instalado como un sub directorio en la ruta C:\Archivos de programa\Csurvey2. Los archivos de ejemplo (cuya extensión es *.csf) también serán instalados en esa carpeta a menos de que se seleccione una nueva ubicación haciendo clic en el botón ‘Cambiar’. Si la ubicación es correcta, haga clic en el botón ‘Siguiente’ para continuar. Antes de que se lleve a cabo la instalación, el
- 13 -
programa ofrecerá una última oportunidad para visualizar el sub-directorio de destino, tal y como se muestra en la Figura 2.5.
Csurvey 2.0 - Asistente de Instalación
Listo para Instalar el Programa
El asistente esta listo para comenzar la instalación
Si desea revisar o cambiar cualquiera de los parámetros de instalación, haga
clic en ¨Atrás¨. Haga clic en ¨Cancelar para salir del asistente.
Parámetros actuales
Tipo de Instalación
Típica
Carpeta de Destino
C:\Archivos de Programa\Csurvey
Información del Usuario
Nombre: Su Nombre
Compañía:
Instalador Atrás Siguiente Cancelar
Figura 2.5: Revisión del subdirectorio de destino
- 14 -
Los archivos necesarios serán copiados por el programa de instalación a la ubicación seleccionada. Mientras este proceso se realiza, la pantalla mostrará el progreso del mismo, tal y como se muestra en la Figura 2.6.
Csurvey 2.0 - Asistente de Instalación
Instalando Csurvey 2.0
Las funciones del programa que usted seleccionó están
siendo instaladas
Por favor espere mientras el Asistente instala Csurvey 2.0. Esto podría
tardar varios minutos
Estatus:
Copiando los archivos nuevos
Instalador Atrás Siguiente Cancelar
Figura 2.6 Instalación de los archivos de Csurvey Una vez completado el proceso anterior, la pantalla presentada en la Figura 2.7 aparecerá, indicando que el programa ha sido instalado exitosamente.
- 15 -
Csurvey 2.0 - Asistente de Instalación
Asistente de Instalación Completado
El Asistente ha instalado Csurvey 2.0 exitosamente.
Haga clic en Finalizar para salir del asistente
CS
Atrás Finalizar Cancelar
Figura 2.7 Instalación exitosa de Csurvey
Haga clic en Finalizar con el botón izquierdo del ratón.
- 16 -
Ubicación de los archivos. Si abre el subdirectorio de destino en la unidad C:, los archivos mostrados en la Figura 2.8 deberían aparecer.
Nombre Tamaño Tipo
csurvey Aplicación
conglomerado Archivo de Microsoft Excel
Maestro de Presentaciones
Extensión de Aplicación
Figura 2.8 Archivos instalados en el subdirectorio Csurvey2.
El programa Csurvey está instalado ahora.
Iniciar Csurvey. Para iniciar el programa, lleve el ratón a la parte inferior izquierda del Escritorio de Windows y haga clic con el botón izquierdo en . Posteriormente seleccione , seguido de .
Finalmente seleccione .
- 17 -
Removiendo Csurvey de la Computadora
Cómo Desinstalar Csurvey. Si desea desinstalar Csurvey, el procedimiento es el mismo que para instalarlo. Sin embargo, en el último paso se debe hacer clic en
. El programa entonces preguntará si el usuario está seguro de querer desinstalar Csurvey, tal y como se muestra en la Figura 2.9
Instalador de Windows
Está seguro que desea desinstalar este producto?
Si No
Figura 2.9 Pantalla de confirmación para desinstalar Csurvey Haga clic en sí y el programa empezará el proceso de desinstalación, removiendo Csurvey de la computadora.
- 18 -
Capítulo 3: Ejemplo General
Posiblemente, la mejor manera de aprender a utilizar Csurvey sea mediante un ejemplo, utilizando datos de Indonesia, los cuales están incluidos en el programa. El programa está destinado a asistir al usuario en las diversas tareas requeridas para las encuestas rápidas. Para obtener mayor información sobre este tipo de encuestas visite http://www.ph.ucla.edu/epi/rapidsurvey.html.
Después de iniciar el programa Csurvey (como se describió al final del Capítulo 2), aparecerá la pantalla mostrada en la Figura 3.1.
Csurvey 2.0
CS
Archivo de
trabajo:
Selección Aleatoria de
Conglomerados
Determinación del Tamaño Muestral
Generador de Números Aleatorios
C-Survey
Versión 2.0
El Programa
Internacional de
Entrenamiento
e Investigación
sobre SIDA
de UCLA/Fogarty
Contáctenos
Figura 3.1 Pantalla de inicio de Csurvey.
- 19 -
Suponga que usted está planeando una encuesta rápida pero aún no ha realizado la estimación del tamaño muestral que es
Crear un archivo .CSF Crear
Archivos tipo Cancelar
Figura 3.2 Creación del archivo de trabajo samplesize.csf
necesario para realizar la encuesta. Para hacer esto, considere los dos íconos
en la parte superior derecha de la pantalla.
Tamaño muestral inicial
Estimación de Parámetros. Haga clic con el botón izquierdo del ratón en
para crear un archivo temporal de trabajo llamado samplesize.csf. Introduzca el texto tal y como se muestra en la Figura 3.2.
Posteriormente haga clic en el botón para crear el archivo de trabajo. La pantalla mostrada en la Figura 3.3 debería aparecer.
- 20 -
Csurvey 2.0 Selección Aleatoria
de Conglomerados
CS C- Survey
Determinación del
Tamaño Muestral
Versión 2.0
Generador de
Números
Aleatorios
Archivo de trabajo:
Parámetro
de encuesta Datos de Conglomerado
Selección de
Conglomerados
Tamaño
Muestral
Número
Aleatorio
Nombre de la encuesta
Unidad primaria de muestreo
Unidad de tamaño
Unidad última de muestreo
Unidad
elegible
Tamaño muestral
-Conglomerados
-Hogares por conglomerado
Información
Adicional Número promedio de personas por hogar
Proporción de personas elegibles
Proporción de hogares elegibles
El Programa
Internacional de
Entrenamiento e
Investigación sobre
SIDA de
UCLA/Fogarty
Contáctenos OK Cancelar Imprimir
Figura 3.3 Pantalla de inicio (no utilizada en este momento)
La pantalla está dividida en cinco secciones, con pestañas en la parte superior mostrando los nombres de las mismas. Al abrir esta pantalla, la primera pestaña, Parámetros de Encuesta, aparece resaltada. El usuario utilizará esta pestaña en un momento posterior, una vez que esté disponible la información para la encuesta específica a realizar. La sección Tamaño Muestral está dividida en dos partes, Estimación de Parámetros ( la cual será presentada inicialmente) y Prueba de Hipótesis (la cual será presentada posteriormente). Por el momento, para completar el proceso de
planificación haga clic con el botón izquierdo del ratón en botón y la pantalla mostrada en la Figura 3.4 debería aparecer.
- 21 -
- 22 -
Csurvey 2.0
C- Survey
Selección Aleatoria de
Conglomerados
Versión 2.0
Determinación del Tamaño
Muestral
Generador de Números Aleatorios
Archivo de trabajo:
Parámetro
de Encuesta
Datos de
Conglomerado
Selección de
Conglomerados
Tamaño
Muestral
Número
Aleatorio
Estimación de Parámetros Prueba de Hipótesis
Propósito del cálculo
Probar el tamaño muestral propuesto Error estándar deseado de la proporción
Calcular el número mínimo de conglomerados Error estándar observado de la proporción
Calcular el número promedio en la muestra por
conglomerado Efecto de diseño
Proporción estimada que posee el
atributo Tasa de homogeneidad
Mitad de la longitud del intervalo de
confianza Estimación puntual para la proporción
Nivel de confianza
deseado Límite inferior de confianza
Parámetro de
homogeneidad Límite superior de confianza
Nivel de homogeneidad
Tamaño muestral para la encuesta por
conglomerados propuesta
Número promedio de personas elegibles por hogar
¿Es el tamaño muestral adecuado para la
necesidad planteada?
Número de
conglomerados
Número promedio de hogares seleccionados por conglomerado IC (Intervalo de confianza)
El Programa
Internacional de
Entrenamiento e
Investigación sobre
SIDA de
UCLA/Fogarty
Contáctenos Calcular Imprimir
Figura 3.4 Pantalla de la sección ´Tamaño muestral´, utilizada para estimar una proporción.
Dado que usted considerará diversas estimaciones de tamaño muestral para un parámetro de interés, seleccione la opción Probar el tamaño muestral propuesto, tal y
- 23 -
como se muestra en la Figura 3.4. Para determinar el tamaño muestral para una encuesta rápida, usted necesitará cuatro valores: 1) su mejor estimación de la proporción que posee el atributo de interés en la población a ser muestreada, 2) la mitad de la longitud del intervalo de confianza máximo que sería aceptable (i.e. el nivel de precisión deseado), 3) el nivel de confianza deseado (ya sea 90%, 95% -el nivel usual- ó 99%) y 4) una estimación del efecto de diseño esperado o la tasa de homogeneidad. El efecto de diseño es una medida de cuanto más grande es la varianza en una encuesta rápida (i.e. una encuesta bietápica por conglomerados) en comparación con un grupo de tamaño similar con datos recolectados mediante muestreo aleatorio simple. Para encuestas de inmunización, por ejemplo, el valor del efecto de diseño para la estimación del tamaño muestral se establece en 2.0 frecuentemente. Mientras la tasa de
homogeneidad (o coeficiente de correlación intraclase) es utilizada frecuentemente por encuestadores experimentados con conocimiento del atributo de interés sobre la base de encuestas rápidas previas, el efecto de diseño es usado con mayor frecuencia por aquellos investigadores que no cuentan con dicha información.
Para este ejemplo, suponga, en primer lugar, que un 20% de la población muestreada poseerá el atributo de interés. Por ende, usted deberá digitar 0.20 en el espacio ubicado a la derecha de la etiqueta Proporción estimada con atributo. En segundo lugar, suponga que el nivel de confianza deseado es del 95% y que la mitad de la longitud del intervalo de confianza es de cinco puntos porcentuales (i.e. 0.05) o que el límite inferior del intervalo de confianza es 15% y el límite superior de dicho intervalo es 25%. En tercer lugar, suponga que el efecto de diseño será bajo (i.e. 2.0), que habrá una persona elegible por hogar (un supuesto frecuente en encuestas de inmunización de niños entre los 12 y 23 meses de edad), que habrán 30 conglomerados que serán seleccionados en la primera etapa y 10 hogares con una persona elegible en cada uno que serán seleccionados en la segunda etapa. Una vez que se introduzca toda esta información, haga clic en y la Figura 3.5 aparecerá.
- 24 -
- 25 -
Parámetro
de Encuesta
Datos de
Conglomerado
Selección de
Conglomerados
Tamaño
Muestral
Número
Aleatorio
Estimación de Parámetros Prueba de Hipótesis
Propósito del cálculo
Probar el tamaño muestral propuesto Error estándar deseado de la proporción
Calcular el número mínimo de conglomerados Error estándar observado de la proporción
Calcular el número promedio en la muestra por
conglomerado Efecto de diseño
Proporción estimada que posee el atributo Tasa de homogeneidad
Mitad de la longitud del intervalo de confianza Estimación puntual para la proporción
Nivel de confianza deseado Límite inferior de confianza
Parámetro de homogeneidad: Efecto de Diseño Límite superior de confianza
Nivel de homogeneidad: Bajo
Tamaño muestral para la encuesta por
conglomerados propuesta
Número promedio de personas elegibles por hogar ¿Es el tamaño muestral adecuado para la
necesidad planteada?
Número de conglomerados
Número promedio de hogares seleccionados por conglomerado IC (Intervalo de confianza)
Calcular Imprimir
Figura 3.5 Tamaño muestral inadecuado para los limites de confianza deseados
Note que los límites de confianza inferiores y superiores correspondientes al tamaño muestral especificado serían 13.3% y 26.7%, respectivamente, un intervalo de confianza más grande que el solicitado (para el cual los límites inferiores y superiores eran 15% y 25%, respectivamente). Para obtener los límites de confianza deseados, la Figura 3.5 muestra que el error estándar para el parámetro estimado no debería exceder un valor de 0.0244. Para el tamaño muestral seleccionado, el error estándar observado de la proporción es de 0.0327, es decir, demasiado alto para lo esperado. Por esta razón, el programa contesta con un ´No´ la pregunta ¿Es el tamaño muestral adecuado para la
necesidad planteada? En este punto, usted puede incrementar los límites de confianza aceptables, incrementar el número de conglomerados, incrementar el número de hogares seleccionados por conglomerado o, con conocimiento adicional del diseño muestral, reducir el coeficiente de correlación intraclase de manera que éste se aproxime a cero (el nivel de una muestra aleatoria simple). Por ahora, suponga que el tamaño de los límites de confianza deseados permanece fijo en +/- 5 puntos porcentuales y que existen suficientes fondos y tiempo para muestrear una grupo más grande, siempre considerando 30 conglomerados y estableciendo que habrán 18 personas por conglomerado, tal y como se muestra en la Figura 3.6.
- 26 -
Parámetro
de Encuesta
Datos de
Conglomerado
Selección de
Conglomerados
Tamaño
Muestral
Número
Aleatorio
Estimación de Parámetros Prueba de Hipótesis
Propósito del cálculo
Probar el tamaño muestral propuesto
Error estándar deseado de la
proporción
Calcular el número mínimo de conglomerados
Error estándar observado de la
proporción
Calcular el número promedio en la muestra por
conglomerado Efecto de diseño
Proporción estimada que posee el atributo Tasa de homogeneidad
Mitad de la longitud del intervalo de confianza
Estimación puntual para la
proporción
Nivel de confianza deseado Límite inferior de confianza
Parámetro de homogeneidad: Efecto de Diseño Límite superior de confianza
Nivel de homogeneidad: Bajo
Tamaño muestral para la encuesta
por conglomerados propuesta
Número promedio de personas elegibles por hogar
¿Es el tamaño muestral adecuado para
la necesidad planteada?
Número de conglomerados
Número promedio de hogares seleccionados por conglomerado IC (Intervalo de confianza)
Calcular Imprimir
Figura 3.6 Tamaño muestral adecuado para los límites de confianza deseados
- 27 -
Ahora, los límites de confianza anticipados son 15% y 25%, es decir, el intervalo aceptable para el investigador. En lugar de una muestra de 300 personas –como se observaba en la Figura 3.5-, el tamaño de la muestra ahora ha aumentado a 540 personas. Por ende, debe notarse que el incremento de la precisión tiene su precio, lo que se observará en el aumento del tiempo y trabajo utilizado para muestrear a 240 personas adicionales. El pequeño gráfico presentado en la parte inferior derecha de la figura muestra los límites confianza esperados al 90%, 95% y 99%, lo cual es útil para explicar el concepto de límites de confianza a personas que no están familiarizadas con nociones estadísticas.
Si las partes involucradas con la encuesta planificada consideran que estos valores son aceptables, entonces haga clic en el botón , firme y escriba la fecha sobre la página que será impresa y entréguela a la persona o agencia que está financiando la encuesta planificada. Prueba de Hipótesis: Podría ser que en lugar de determinar la prevalencia o incidencia de un atributo, usted esté interesado en comparar un cambio de un atributo en el tiempo o en comparar el nivel de un atributo en varias regiones. Generalmente, este tipo de estudios se realizan para evaluar cambios, tales como aumentos en niveles de vacunación, reducción de consumo de cigarrillos, aumentos en el uso de condón, entre otros. Para implementar una evaluación de este tipo, el programa proporciona información de dos encuestas rápidas del mismo tamaño e indica si el tamaño muestral es suficiente para detectar una diferencia en las dos proporciones de interés con un nivel aceptable de precisión, de acuerdo a las especificaciones del investigador. En la sección Tamaño Muestral, haga clic en Prueba de Hipótesis en la parte derecha del panel. Note que la parte izquierda cambiará, tal y como se muestra en la Figura 3.7.
- 28 -
Parámetro
de Encuesta
Datos de
Conglomerado
Selección de
Conglomerados
Tamaño
Muestral
Número
Aleatorio
Estimación de Parámetros Prueba de Hipótesis
Propósito del cálculo
Probar el tamaño muestral propuesto
Error estándar deseado de la diferencia de las
proporciones
Calcular el número mínimo de
conglomerados
Error estándar observado de la diferencia de las
proporciones
Calcular el número promedio en la
muestra por conglomerado Efecto de diseño
Valor estimado de la primera proporción
Valor estimado de la segunda proporción Tasa de homogeneidad
Mitad de la longitud del intervalo de confianza Estimación puntual de la diferencia de proporciones
Nivel de confianza deseado Límite inferior de confianza
Parámetro de homogeneidad Límite superior de confianza
Nivel de homogeneidad
Tamaño muestral para la encuesta por
conglomerados propuesta
Número promedio de personas elegibles por hogar
¿Es el tamaño muestral adecuado para la necesidad
planteada?
Número de conglomerados
Número promedio de hogares seleccionados por conglomerado IC (Intervalo de confianza)
El Programa Internacional
de Entrenamiento e
Investigación sobre SIDA de
UCLA/Fogarty
Contáctenos
Calcular Imprimir
Figura 3.7 Pantalla de tamaño muestral para probar la diferencia entre dos proporciones (i.e. prueba de hipótesis).
- 29 -
Suponga que la cobertura de inmunización en una región es 20%. Suponga también que la cobertura de inmunización es 60% en otra región en la cual trabaja un grupo de salud más activo. Por ende, se piensa que la diferencia entre las dos regiones es de 40 puntos porcentuales. Usted está interesado en implementar dos encuestas rápidas para probar la hipótesis de que las dos regiones tienen coberturas de inmunización diferentes. Si bien el investigador y la agencias financiadoras creen que la diferencia entre ambas regiones es de 40 puntos porcentuales, están dispuestos a aceptar, con un nivel de confianza del 95%, que la diferencia se encuentra entre 25 puntos porcentuales y 50 puntos porcentuales. Es decir, con una diferencia de 0.40, el intervalo de confianza al 95% no debería ser mayor de ±0.15. Al igual que se planteó anteriormente, se supone que el efecto de diseño será bajo, que el número promedio de personas elegibles por hogar será 1.0, que el número de conglomerados será 30 y que el número de hogares que serán seleccionados en cada conglomerado puede tomar varios valores –en el caso de este ejemplo este valor es 12-.
Los valores estimados que se ajustan a los requerimientos del investigador o la agencia financiera se muestran en la Figura 3.8. Tal y como se ha mencionado, se estima que la diferencia entre las dos proporciones es 0.40. Para dos encuestas con 360 individuos cada una, el resultado será un intervalo de confianza al 95% entre 0.3 y 0.5 para la diferencia entre dos proporciones, el cual será aceptable para los requerimientos de precisión estipulados por el investigador. Una vez que dichos valores se consideren aceptables, la página debería ser impresa, firmada, fechada y entregada a la agencia o persona que financia la encuesta planeada.
- 30 -
Parámetro
de Encuesta
Datos de
Conglomerado
Selección de
Conglomerados
Tamaño
Muestral
Número
Aleatorio
Estimación de Parámetros Prueba de Hipótesis
Propósito del cálculo
Probar el tamaño muestral propuesto
Error estándar deseado de la diferencia de las
proporciones
Calcular el número mínimo de
conglomerados
Error estándar observado de la diferencia de las
proporciones
Calcular el número promedio en la
muestra por conglomerado Efecto de diseño
Valor estimado de la primera proporción
Valor estimado de la segunda proporción Tasa de homogeneidad
Mitad de la longitud del intervalo de
confianza Estimación puntual de la diferencia de proporciones
Nivel de confianza deseado Límite inferior de confianza
Parámetro de
homogeneidad: Efecto de Diseño Límite superior de confianza
Nivel de homogeneidad: Bajo
Tamaño muestral para la encuesta por
conglomerados propuesta
Número promedio de personas elegibles por hogar
¿Es el tamaño muestral adecuado para la necesidad
planteada? SI
Número de conglomerados
Número promedio de hogares seleccionados por
conglomerado IC (Intervalo de confianza)
El Programa Internacional de
Entrenamiento e Investigación
sobre SIDA de UCLA/Fogarty
Contáctenos
Calcular Imprimir
Figura 3.8 Tamaño muestral adecuado para los límites de confianza deseados
- 31 -
Preparándose para una Encuesta Rápida
El programa supone que el encuestador dispone de información demográfica sobre la población estudiada y requiere que éste tome decisiones sobre los detalles del diseño muestral bietápico por conglomerados. En la parte superior derecha se observan los dos botones siguientes: El botón de la izquierda se utiliza para crear nuevos archivos de programa con datos de la población estudiada. Por otro lado, el botón de la derecha se utiliza para trabajar con archivos existentes que contienen datos de la población estudiada.
Dado que esta sección del Capítulo 3 demuestra el trabajo con datos existentes, haga clic con el botón izquierdo de su ratón en el botón El Programa debería
encontrar dos archivos de ejemplo, a saber, yogya.csf y vil9_yogya.csf (y
posiblemente el archivo SAMPLESIZE.csf si ha seguido los pasos de la sección
Tamaño Muestral Inicial de este capítulo) tal y como se muestra en la Figura 3.9.
- 32 -
Abrir archivo de
datos CSF
Buscar en: Csurvey2
Mis documentos
recientes
Escritorio
Mis documentos
Mi PC
Abrir un archivo con
extensión .CSF Abrir
Archivos tipo *.CSF Cancelar
Mis sitios de red
Página de
códigos
Figura 2.9 Archivos con extensión CSF mostrados en el programa CSurvey
Seleccione yogya.csf y haga clic con el botón izquierdo del ratón en ‘Abrir’. Esto hará que aparezca la pantalla mostrada en la Figura 3.10.
- 33 -
Csurvey 2.0 Selección Aleatoria de
Conglomerados
C- Survey
Determinación del Tamaño
Muestral
Versión 2.0 Generador de Números
Aleatorios
Archivo de trabajo:
Parámetro de
encuesta
Datos de
Conglomerado
Selección de
Conglomerados
Tamaño
Muestral
Número
Aleatorio
Nombre de la
encuesta Encuesta de Salud Infantil en Yogyakarta, Indonesia, 2006
Unidad primaria
de muestreo Pueblo/localidad
Unidad de
tamaño Población
Unidad última
de muestreo Hogar
Unidad elegible Niños entre los 12 y 23 meses de edad
Tamaño
muestral
-
Conglomerados
-Hogares por
conglomerado
Información
Adicional
Número promedio de personas por hogar
Proporción de personas elegibles
Proporción de hogares elegibles
El Programa
Internacional de
Entrenamiento e
Investigación sobre SIDA
de UCLA/Fogarty
Contáctenos OK Cancelar Imprimir
Figura 3.10 Abriendo la pantalla de Csurvey para el archivo yogya.csf, un archivo de ejemplo.
- 34 -
Como puede observarse, la pantalla se divide en cinco secciones, con pestañas mostrando los nombres de las mismas. Al abrir esta pantalla, la primera pestaña, a saber, Parámetros de Encuesta, aparecerá seleccionada.
Parámetros de Encuesta. En esta pestaña se incluyen campos que deben ser llenados por el usuario con información descriptiva sobre la encuesta propuesta y la población a estudiar. Dicha información se utiliza en la primera etapa de una encuesta rápida, es decir, durante la etapa de selección de los conglomerados a través del método de Probabilidad Proporcional al Tamaño (PPS por sus siglas en inglés). En primer lugar aparece el nombre de la encuesta y a éste le sigue la unidad primaria de muestreo(i.e. UPM). Las UPMs se identifican sobre la base del número de personas (i.e. población), hogares o alguna otra unidad de tamaño. En el caso de este ejemplo, las UPMs (o pueblos/localidades) se listan por tamaño poblacional. La unidad última de
muestreo(UUM) en el ejemplo es un hogar y las unidades elegibles a ser incluidas en la encuesta son todos los niños con edades entre los 12 y 23 meses. El número de conglomerados (o grupos de individuos u hogares de tamaño constante) que serán seleccionados por el programa en la primera etapa del muestreo son 25, el número mínimo para este tipo de encuestas dado que el número usual de conglomerados seleccionados es 30. Otra información que debe ser proporcionada por el usuario incluye la población por hogar (i.e. el número promedio de personas por hogar en la población en la que se seleccionará la muestra), la proporción de personas elegibles (i.e. la proporción de la población entre los 12 y 23 meses de edad), y la proporción de
hogares elegibles (i.e. la proporción de todos los hogares en la población a ser muestreada que tienen uno o más niños entre los 12 y 23 meses de edad). Generalmente, el usuario no conocerá los valores exactos de las variables de hogar. Sin embargo, debería ser capaz de proveer estimaciones razonables de dichos valores, de tal manera que éstos sean apropiados para la planificación de una encuesta. En el ejemplo mostrado en la Figura 3.10, el hogar promedio en la región de Yogyakarta tiene 4.5 personas. Por otro lado, los niños entre las edades de 12 y 23 meses conforman el 2% de la población total (i.e. 0.02) y se estima que el 9% de los hogares en la población estudiada (i.e. 0.09) tienen un niño entre las edades de12 y 23 meses.
A continuación haga clic en la pestaña de datos de conglomerado para ver la información de la población estudiada (ver Figura 3.11)
- 35 -
Csurvey 2.0
C- Survey
Selección Aleatoria de
Conglomerados
Versión 2.0
Determinación del Tamaño
Muestral
Generador de Números
Aleatorios
Archivo de trabajo:
Parámetro de
encuesta
Datos de
Conglomerado
Selección de
Conglomerados
Tamaño
Muestral
Número
Aleatorio
Número Pueblo/localidad Población*
El Programa
Internacional de
Entrenamiento e
Investigación
sobre SIDA de
UCLA/Fogarty
*Personas en la población como
unidad de tamaño
Contáctenos Agregar Insertar Editar Borrar Imprimir Anexar desde .CSF .XLS
Figura 3.11 Datos de población por conglomerado.
- 36 -
Para la realización de cualquier encuesta rápida, la información poblacional de todas las comunidades que conforman la población estudiada debe ser introducida por el investigador. Para hacer esto, la persona a cargo de la implementación de la encuesta puede crear un archivo *.csf nuevo, anexar un archivo *.csf creado previamente (ver parte inferior derecha de la Figura 3.11) o anexar un archivo *.xls usando el programa de Hoja de Cálculo Microsoft Excel (ver parte inferior derecha de la Figura 3.11). Si se selecciona la opción de anexar un archivo de Microsoft Excel (i.e. *.xls), aparecerá una pantalla que guía al investigador en el proceso de digitación de datos, tal y como se muestra en la Figura 3.12.
- 37 -
Importar desde un archivo de Microsoft Excel
Para importar datos de conglomerados desde MS Excel, el archivo debería
ajustarse a los siguientes criterios:
1. No hay encabezados de columna en la fila 1;
2. El número 9 se coloca en la columna A para los conglomerados que serán
importados;
3. El nombre y tamaño del conglomerado (i.e. población u hogares) se colocan en
las columnas C y D, respectivamente;
4. Las columnas que no sean A, C y D deberán dejarse en blanco; y
5. Sólo la Hoja 1 del libro de trabajo de Excel se utilizará para importar los datos.
A continuación se presenta un ejemplo
Continuar Cancelar
Figura 3.12 Formato para importar datos desde Microsoft Excel.
Datos de conglomerado. El conjunto de datos de ejemplo mostrado en la Figura 3.11 contiene información para 45 pueblos, cuya población estimada se presenta en la columna D. Los datos pueden ser fácilmente editados o impresos, usando los botones ubicados en la parte inferior de la Figura 3.11.
Para asegurarse que el tamaño muestral especificado en la Figura 3.10 es el adecuado para satisfacer las necesidades del investigador, haga clic en la pestaña etiquetada
tamaño muestral, tal y como se muestra en la Figura 3.13.
- 38 -
- 39 -
Csurvey 2.0
C- Survey
Selección Aleatoria de
Conglomerados
Versión 2.0 Determinación del Tamaño
Muestral
Generador de Números
Aleatorios
Archivo de trabajo:
Parámetro de
Encuesta
Datos de
Conglomerado
Selección de
Conglomerados
Tamaño
Muestral
Número
Aleatorio
Estimación de Parámetros Prueba de Hipótesis
Propósito del cálculo
Probar el tamaño muestral propuesto Error estándar deseado de la
proporción
Calcular el número mínimo de conglomerados Error estándar observado de la
proporción
Calcular el número promedio en la muestra por
conglomerado Efecto de diseño
Proporción estimada que posee el atributo Tasa de homogeneidad
Mitad de la longitud del intervalo de confianza
Estimación puntual para la
proporción
Nivel de confianza deseado Límite inferior de confianza
Parámetro de homogeneidad Efecto de Diseño Límite superior de confianza
Nivel de homogeneidad Bajo
Tamaño muestral para la encuesta
por conglomerados propuesta
Número promedio de personas elegibles por hogar
¿Es el tamaño muestral adecuado para
la necesidad planteada?
Número de conglomerados
Número promedio de hogares seleccionados por conglomerado IC (Intervalo de confianza)
El Programa
Internacional de
Entrenamiento e
Investigación sobre
SIDA de UCLA/Fogarty
Contáctenos Calcular Imprimir
Figura 3.13 Revisión del tamaño muestral especificado para una encuesta bietápica por conglomerados.
- 40 -
Revisión del Tamaño Muestral. En este ejemplo, el valor de la proporción del atributo de interés es de 0.20 (ó 20%). El investigador está dispuesto a aceptar límites de confianza entre 0.12 y 0.28 (ó entre 12% y 28%) con un nivel de confianza del 95%. En otras palabras, la mitad de la longitud del intervalo de confianza es 0.08. Dado que se trata de una encuesta por conglomerados, la estimación de la varianza será probablemente mayor que la observada en una encuesta que utilice muestreo aleatorio simple. La medida en la que la varianza será mayor será estimada ya sea por el efecto de
diseño o la tasa de homogeneidad. En el ejemplo, el efecto de diseño es seleccionado y se le asigna un nivel de homogeneidad bajo, lo cual equivale a un efecto de diseño de 2.0. Además, se especifica que se trata de una encuesta pequeña, con 25 conglomerados y 10 niños entre las edades de 12 y 23 meses en cada uno de ellos. Para el ejemplo de Indonesia, las 10 unidades de muestreo por conglomerado son 10 hogares con uno o más niños entre las edades de 12 y 23 meses. ¿Es este tamaño muestral adecuado? Para
asegurarse, haga clic en el botón (el cual importará la información apropiada de la pestaña de Parámetros de Encuesta). A continuación haga clic en el botón
En el ejemplo presentado en la Figura 3.13, el tamaño muestral para la encuesta propuesta sería de 250 personas ó 25 conglomerados con 10 hogares elegibles en cada uno de éstos con 1 niño entre los 12 y 23 meses de edad en cada hogar elegible. En este ejemplo, el error estándar deseado de la proporción no debería exceder el valor de 0.0363 para satisfacer los criterios introducidos por el investigador en la primera columna de la sección de Tamaño Muestral. Sobre la base del tamaño muestral estimado, el error estándar observado de la proporción es 0.0358, un valor menor que el error estándar máximo deseado, es decir, 0.0363. Por ende, el tamaño muestral propuesto es adecuado para la necesidad planteada, lo que ocasiona que el programa responda sí. Con un nivel bajo de homogeneidad (tal y como lo definió el investigador), el programa supone un efecto de diseño de 2.0 (i.e. la varianza de la encuesta por conglomerados será el doble de la varianza de una encuesta similar que utilice muestreo aleatorio simple) y una tasa de homogeneidad de 0.1111. La media y los límites de confianza al 95% son estimados como proporciones con valores de 0.2000 (0.1262, 0.2738) o como porcentajes con valores de 20% (12.6%, 27.4%), respectivamente.
- 41 -
En la parte inferior derecha de la pestaña Tamaño Muestral, se presenta un pequeño gráfico, tal y como se muestra en la Figura 3.14
.
Figura 3.14 Gráfico de los límites de confianza al 90%, 95% y 99% para los parámetros de encuesta propuestos.
La información sobre el tamaño muestral debería ser compartida con la persona o agencia que financia la encuesta para determinar si la precisión de las estimaciones es aceptable. Es decir, debería buscarse una respuesta a la pregunta: ¿sería aceptable realizar una encuesta de un atributo que tiene una prevalencia del 20% (i.e. 0.20) y límites de confianza de 13% a 27% con un nivel de confianza del 95%? Es importante mencionar también que con este tamaño muestral el investigador podría aceptar, con un nivel de confianza del 90%, que el intervalo de confianza de 14% a 26% contendría al verdadero valor. A la vez, el investigador podría aceptar, con un nivel de confianza del 99%, que el intervalo de confianza de 10% a 30% encerraría al verdadero valor, suponiendo, claro está, que no existe sesgo. Si el tamaño muestral se considera aceptable, el investigador debería presionar el botón para imprimir una copia de la pantalla del Tamaño Muestral y proporcionarla a la agencia financiera para mostrar los valores que deberían esperarse. La página que se imprimiría (incluyendo todo el texto pero no el gráfico) se muestra en la Figura 3.15.
- 42 -
- 43 -
Tamaño Muestral: Estimación de Parámetros
Propósito del cálculo:
Probar el tamaño muestral
propuesto
Proporción estimada que posee el atributo
Mitad de la longitud del intervalo de confianza
Nivel de confianza deseado
Parámetro de homogeneidad Efecto de Diseño
Nivel de homogeneidad Bajo
Número de conglomerados
Número promedio de la muestra por conglomerado
Error estándar deseado de la proporción
Error estándar observado de la proporción
Efecto de diseño
Tasa de homogeneidad
Estimación puntual de la proporción
Límite inferior de confianza
Límite superior de confianza
Tamaño muestral para la encuesta por conglomerados propuesta
¿Es el tamaño muestral adecuado para la necesidad planteada? SI
Intervalo de confianza al 90%
Intervalo de confianza al 95%
Intervalo de confianza al 99%
Figura 3.15 Información impresa sobre el tamaño muestral para la estimación de parámetros
- 44 -
En la sección de Parámetros de Encuesta (mostrada en la Figura 3.10), se ordenó al programa que seleccionara 25 conglomerados por el método de probabilidad proporcional al tamaño (PPS por sus siglas en Inglés) de una lista poblacional de 45 localidades o comunidades. Dado que el módulo de Tamaño Muestral mostró que tanto el número de conglomerados y hogares por conglomerado era aceptable, se cuenta con las condiciones necesarias para continuar con el proceso de implementación de encuestas rápidas.
Implementando una Encuesta Rápida
Muestreo por Probabilidad Proporcional al Tamaño en la Primera Etapa. Las encuestas rápidas se implementan mediante un proceso de dos etapas. En la primera etapa, se seleccionan conglomerados por medio del método de probabilidad proporcional al tamaño (PPS por sus siglas en inglés). En la segunda etapa se selecciona un número igual de hogares (o quizás personas) en cada uno de los conglomerados seleccionados en la primera etapa. Este método de muestreo asegura que los datos de la encuesta sean auto-ponderados y no requieran ponderaciones estadísticas especiales para su análisis. Las encuestas auto-ponderadas pueden ser analizadas con mayor facilidad que las encuestas ponderadas.
Los datos poblacionales en el archivo yogya.csf fueron presentados en la sección Datos
de Conglomerado (Figura 3.11). Para ver la muestra estimada mediante probabilidad proporcional al tamaño, haga clic en la pestaña Selección de Conglomerados, tal y como se muestra en la Figura 3.16.
- 45 -
Csurvey 2.0
C- Survey
Selección aleatoria de conglomerados
Versión 2.0
Determinación del tamaño muestral
Generador de números aleatorios
Archivo de trabajo:
Parámetro de
encuesta
Datos de
conglomerado
Selección de
conglomerados
Tamaño
muestral
Número
aleatorio
Conglomerado seleccionado por el método de
Probabilidad Proporcional al Tamaño con
reemplazo (PPS-WR por sus siglas en Inglés) Ultima selección:
Número
Pueblo/
Localidad
Tamaño
Poblacional*
Número de
Conglomerados
Seleccionados
Número
de
hogares
Número de
Personas
Elegibles
Número
de
Hogares
Elegibles
Personas
Elegibles
por
Hogares
Elegibles
*Personas en la población como unidad de tamaño
El Programa
Internacional
de
Entrenamiento
e Investigación
sobre SIDA de
UCLA/Fogarty
Contáctenos Ejecutar Imprimir
Figura 3.16 Muestra de 25 conglomerados con probabilidad proporcional al tamaño (PPS).
La mayoría de los pueblos seleccionados tienen un conglomerado de 10 hogares que será seleccionado en la segunda etapa. Sin embargo, algunos de los pueblos tienen más de un conglomerado de 10 hogares que será seleccionado en la segunda etapa. Si un pueblo es grande, el investigador puede repetir el proceso de selección. Esto puede hacerse únicamente, claro está, para el número de conglomerados que serán seleccionados en dicho pueblo.
- 46 -
Muestreo por Probabilidad Proporcional al Tamaño en la Primera Etapa en
Comunidades con Conglomerados Múltiples. A continuación se presenta un ejemplo para el pueblo de 9.Wirogunan (mostrado en la línea 3 de la Figura 3.16), el cual tiene tres conglomerados que serán seleccionados. Para este propósito, el pueblo de Wirogunan se ha sub-dividido para hacer más fácil el trabajo del equipo de campo. Para ver los datos del pueblo de Wirogunan, haga clic en el botón , seleccione el archivo vil9_yogya.csf y seguidamente haga clic en el botón . Hecho esto, debería aparecer lo presentado en la Figura 3.17. Note que la figura muestra que hay tres conglomerados que serán seleccionados, no 25 como antes. También debe notar que el programa aún muestra 10 hogares por conglomerado. La información adicional sobre el tamaño de los hogares y datos por el estilo es la misma que se mostró en la Figura 3.10.
- 47 -
Csurvey 2.0
Selección Aleatoria de
Conglomerados
C- Survey
Determinación del Tamaño
Muestral
Versión 2.0
Generador de Números
Aleatorios
Archivo de trabajo:
Parámetro de
encuesta
Datos de
Conglomerado
Selección de
Conglomerados
Tamaño
Muestral
Número
Aleatorio
Nombre de la
encuesta Encuesta de Salud Infantil en Yogyakarta, Indonesia, 2006
Unidad primaria de
muestreo Pueblo: Wirogunan
Unidad de tamaño Población
Unidad última de
muestreo Hogar
Unidad elegible Niños entre los 12 y 23 meses de edad
Tamaño muestral
-Conglomerados
-Hogares por
conglomerado
Información
Adicional
Número promedio de personas por hogar
Proporción de personas elegibles
Proporción de hogares elegibles
El Programa Internacional de
Entrenamiento e
Investigación sobre SIDA de
UCLA/Fogarty
Contáctenos OK Cancelar Imprimir
Figura 3.17 Muestra de 3 conglomerados en el pueblo de Wirogunan.
Para ver los datos del pueblo de Wirogunan, haga clic en la pestaña Datos de
Conglomerado en la parte superior del panel. La Figura 3.18 debería aparecer.
- 48 -
Parámetro de
encuesta
Datos de
Conglomerado
Selección de
Conglomerados
Tamaño
Muestral
Número
Aleatorio
Número
Pueblo:
Wirogunan Población*
Región 1
Región 2
Región 3
Región 4
Región 5
*Personas en la población como
unidad de tamaño
Agregar Insertar Editar Borrar Imprimir Anexar desde .CSF .XLS
Figura 3.18 Sub-regiones en el pueblo de Wirogunan
La suma de las poblaciones de las cinco subregiones es 18,049, lo que equivale al total de la población de Wirogunan, tal y como se mostró en la Figura 3.16. Para seleccionar los tres conglomerados de Wirogunan que fueron originalmente indicados en la Figura 3.16, haga clic en la pestaña Selección de Conglomerados. Tal y como se observa en la Figura 3.19, tres de las cinco sub-regiones ahora tienen un conglomerado seleccionado en cada una de ellas.
- 49 -
Parámetro
de
encuesta
Datos de
conglomerado
Selección de
conglomerados
Tamaño
muestral
Número
aleatorio
Conglomerado seleccionado por el método de Probabilidad
Proporcional al Tamaño con reemplazo
(PPS-WR por sus siglas en Inglés)
Ultima selección:
Número
Pueblo:
Wirogunan
Tamaño
Poblacional*
Número de
Conglomerados
Seleccionados
Número
de
hogares
Número
de
Personas
Elegibles
Número de
Hogares Elegibles
Personas
Elegibles
por
Hogares
Elegibles
Región 1
Región 2
Región 4
*Personas en la población como unidad de
tamaño
Ejecutar Imprimir
Figura 3.19 Muestreo por probabilidad proporcional al tamaño (PPS) de tres conglomerados en las sub-regiones de Wirogunan.
- 50 -
El mismo procedimiento puede ser repetido para otros pueblos en los cuales se seleccionó más de un conglomerado. De manera alternativa, los pueblos podría haberse dividido previamente en unidades más pequeñas de tal manera que un conglomerado tenga probabilidad de ser seleccionado en cada una de éstas. Sin embargo, esto podría implicar demasiado tiempo en lo que respecta a recolección, digitación, recuento y procesamiento de datos.
Otras Funciones
Existen dos funciones adicionales en el programa Csurvey, las cuales son útiles para la implementación de encuestas rápidas. Estas corresponden a la función de discado giratorio en una dirección aleatoria y la generación de una tabla de números aleatorios.
En muchas regiones del mundo los hogares no están identificados o numerados claramente. Cuando se está ante ese tipo de situaciones, el procedimiento más frecuente para seleccionar un número constante de hogares (o individuos elegibles), en la segunda etapa, corresponde a la selección aleatoria del hogar con el cual se iniciará, para, posteriormente, continuar con el hogar vecino más cercano hasta que la cuota constante se complete. El objetivo de esto es lograr que cada hogar en el conglomerado tenga una probabilidad igual de ser seleccionado aleatoriamente como el hogar en el que se iniciará el proceso. El procedimiento se describe a continuación. Primero, el investigador se ubica en el centro del pueblo o sub-región. En segundo lugar, el investigador utiliza la herramienta de discado giratorio disponible en Csurvey para seleccionar una dirección aleatoria que le permitirá caminar hasta la periferia del pueblo o sub-región (i.e. un vector seleccionado aleatoriamente). En su trayecto por dicho vector, el investigador contará todos los hogares por los que pase (ver Figura 3.20). Estos se marcarán y se numerarán en un mapa dibujado a mano en el campo.
Figura 3.20 Conteo de hogares a lo largo de un vector aleatorio camino a la periferia de un pueblo.
- 51 -
Una vez que todos los hogares a lo largo del vector seleccionado sean contados y marcados en un mapa, uno de ellos se seleccionará por muestreo de una lista de números aleatorios. Dicha selección será un número entre 1 y el número del último hogar contado (i.e. el #10 en el ejemplo). El hogar seleccionado se considerará como el hogar de inicio aleatorio y será el punto inicial para obtener el número constante de hogares elegibles (o personas, si se cuenta con una persona elegible por hogar) para el conglomerado en cuestión. Discado Giratorio. Haga clic en la pestaña de Número Aleatorio en la parte superior del panel. Seguidamente, haga clic en Discado Giratorio (la sección ubicada a la derecha), tal y como se presenta en la Figura 3.20. Note que el disco giratorio está dividido en 8 secciones numeradas de un pastel circular.
- 52 -
Parámetro de
Encuesta
Datos de
Conglomerado
Selección de
Conglomerados
Tamaño
Muestral
Número
Aleatorio
Tabla Discado Giratorio
El número de dirección
Girar Imprimir
Figura 3.21 Discado giratorio para determinación de dirección aleatoria con el fin de seleccionar el hogar de inicio aleatorio
Haga clic en y el disco empezará a girar y se detendrá en una dirección aleatoria. El número de esta dirección será señalado por la flecha y se mostrará en el espacio ubicado en la parte inferior derecha de la figura. Una vez que el proceso de discado se haya completado para el conglomerado especificado (este proceso sólo debería realizarse una vez para ajustarse a la teoría estadística), la página deberá imprimirse. Para hacer esto, haga clic en y una imagen de la dirección aleatoria determinada por el discado giratorio será impresa como se muestra en la Figura 3.22.
- 53 -
Csurvey 2.0
Dirección Determinada por Discado Giratorio
El número de dirección: 3
Figura 3.22 Formato impreso de discado giratorio para un conglomerado específico
El proceso deberá repetirse para todos los conglomerados seleccionados, usualmente un total de 30. El número específico de conglomerado deberá anotarse en la parte superior del formato impreso, el cual deberá entregarse a cada encuestador correspondiente. Una vez que se cuenta con esta página, el personal de campo solamente necesitará una brújula pequeña y módica para determinar la dirección del vector aleatorio. Utilizando la brújula, el entrevistador deberá determinar la dirección Norte y luego caminar a lo largo de la línea imaginaria mostrada en el formato impreso del discado giratorio (i.e. #3 en el ejemplo) hasta llegar a la periferia del pueblo o sub-región. Todos los hogares por
- 54 -
los que el entrevistador pase en su trayecto deberán ser contados y listados en forma de mapa, como se mostró previamente en la Figura 3.20.
Número aleatorio. Con el fin de seleccionar el hogar de inicio aleatorio, Csurvey generará una tabla de números aleatorios para cada equipo de campo. Si los pueblos o sub-regiones son pequeños, solamente se necesitarán números aleatorios de dos dígitos. De manera contrastante, si los pueblos o sub-regiones son medianos o grandes, una lista de números aleatorios de tres dígitos seria útil. Para generar una tabla de números aleatorios haga clic en la pestaña Número Aleatorio. A continuación, haga clic en Tabla. Dado que el ejemplo mostrado en la Figura 3.20 es muy pequeño, una lista de números aleatorios entre 1 y 50 es suficiente. Para crear dicha lista, introduzca el número 50 en el espacio al lado de la etiqueta Número Máximo –ubicada en la parte inferior izquierda de la pantalla- y haga clic en el botón para crear la tabla de números aleatorios. Un ejemplo de esta lista se muestra en la Figura 3.23.
Parámetro de
Encuesta
Datos de
Conglomerado
Selección de
Conglomerados
Tamaño
Muestral
Número
Aleatorio
Tabla Discado Giratorio
El número máximo Generar Imprimir
Figura 3.23 Lista de números aleatorios de 1 a 50.
- 55 -
La lista puede ser impresa haciendo clic en el botón Iniciando en un punto aleatorio en la lista, el encuestador lee hacia abajo la columna de números y hace lo mismo en las siguientes columnas hasta que un número aleatorio entre 1 y el número del último hogar ubicado en el vector de interés sea ubicado. Para el ejemplo de la Figura 3.20, se buscaría un número entre 1 y 10. Si ese número fuera 8, por ejemplo, el hogar con el número 8 en el mapa se identificaría como el hogar de inicio aleatorio. El equipo de campo retornaría al hogar número 8 y empezaría a buscar individuos elegibles, yendo de un hogar a su vecino más cercano, hasta que la cuota constante se complete.
Para mayores detalles sobre encuestas rápidas, visite por favor http://www.ph.ucla.edu/epi/rapidsurvey.html. Con esto concluye la presentación de las funciones del programa Csurvey.
- 56 -
Capítulo 4: Explicación Detallada
Este capítulo proporciona una explicación breve pero detallada de cada procedimiento presentado en Csurvey. Para mayor información sobre encuestas rápidas, visite por favor http://www.ph.ucla.edu/epi/rapidsurvey.html.
Tamaño Muestral - Estimación de Parámetros
La pantalla de tamaño muestral para la estimación de parámetros fue descrita en el Capítulo 3 y presentada en la Figura 3.6. Las siguientes descripciones utilizan los valores presentados en la Figura 3.6.
Valores que Deben ser Digitados por el Investigador
Propósito del cálculo
Probar el tamaño muestral propuesto
Calcular el número mínimo de conglomerados
Calcular el número promedio en la muestra por
conglomerado
El investigador debe estimar el valor de la proporción
que posee el atributo en la población muestreada. Este
valor debe ser digitado en el espacio correspondiente.
Proporción estimada que posee el atributo
Mitad de la longitud del intervalo de confianza
El investigador digita la precisión deseada de la
proporción estimada que posee el atributo (d).La
precisión es la mitad de la longitud del intervalo de
confianza. Es igual a donde t es la t de
Student que corresponde al
nivel de confianza deseado y donde se(p) es el error
estándar de la proporción (conocido también como la
desviación estándar de la media muestral)
Nivel de confianza deseado El investigador selecciona un nivel de confianza, de tres
opciones posibles, a saber, 90%, 95%, 99%.
Parámetro de Homogeneidad: Efecto de Diseño
El investigador define parámetro de homogeneidad que
pretende usar. La primera opción de parámetro es el
efecto de diseño (el cual compara la varianza de la
encuesta por conglomerados con la varianza de una
encuesta de tamaño similar que utilice muestreo
aleatorio simple). La segunda opción es la tasa de
homogeneidad (la cual es una medida del coeficiente de
correlación intraclase)
- 57 -
Nivel de Homogeneidad: Bajo
El investigador define el nivel anticipado del parámetro de
homogeneidad. Las opciones son: igual que en una muestra
aleatoria simple (i.e. ya sea un efecto de diseño con un
valor de 1.0 o la tasa de homogeneidad equivalente), bajo
(i.e. ya sea un efecto de diseño de 2.0 o la tasa de
homogeneidad equivalente), medio (i.e. ya sea un efecto de
diseño de 4.0 o la tasa de homogeneidad equivalente), alto
(i.e. ya sea un efecto de diseño de 7.0 o la tasa de
homogeneidad equivalente), o manual (i.e. definida por el
investigador).
Número promedio de personas elegibles por hogar
El investigador tiene dos opciones. La primera permite
al investigador digitar una estimación del número
promedio de personas elegibles que residen en un
hogar. La segunda opción es que el investigador deje
que el programa proporcione este valor sobre la base de
la información digitada en la pantalla Parámetros de
Encuesta (Ver Figura 3.10).
Número de conglomerados
El investigador digita el número de conglomerados que
serán muestreados en la primera etapa por medio de
probabilidad proporcional al tamaño (PPS) –en el
ejemplo se muestra el valor típico 30-. Este número
debería ser mayor o igual a 25 para ajustarse a la teoría
estadística correspondiente a una estimación de
parámetros no sesgada.
Número promedio de hogares seleccionados por
conglomerado
El investigador digita el número constante de hogares (o
personas, si se cuenta con una persona por hogar
elegible) que serán seleccionadas en cada conglomerado
escogido.
Una vez que el investigador ha introducido los diferentes valores, el programa calculará los valores muestrales que correspondan con los datos digitados. Como se ha mencionado anteriormente, la presentación se basa en los valores mostrados previamente en la Figura 3.6.
- 58 -
Valores Calculados por el Programa
Error estándar deseado de la proporción
El programa determinará, sobre la base de los valores
digitados por el investigador, el error estándar máximo
que satisfará los deseos del este. El valor es el nivel de
precisión deseado (d), dividido por el valor de la t de
Student, el cual corresponde a 1 menos el número de
conglomerados, de tal manera que
Error estándar observado de la proporción
El programa determinará, sobre la base de los valores
digitados por el investigador, el error estándar cuya
formula es:
donde p es la proporción que posee el atributo de interés,
q es igual a 1-p, roh es la tasa de homogeneidad (o
coeficiente de correlación intraclase),
es el número promedio de personas por
conglomerado y n es el número de conglomerados.
Efecto de diseño (deff)
El programa determinará el efecto de diseño sobre la base
de los valores digitados por el investigador. Si la tasa de
homogeneidad (roh) fue digitada en lugar del efecto de
diseño, el programa calculara el valor de este mediante la
siguiente fórmula.
donde tiene el mismo significado mencionado
arriba.
- 59 -
Tasa de homogeneidad (roh)
La tasa de homogeneidad (roh) puede ser un valor
digitado por el investigador como una medida del
coeficiente de correlación intraclase o puede ser
calculada mediante la siguiente formula
donde y deff tienen el mismo significado
mencionado arriba.
Estimación puntual para la proporción
La estimación puntual (p) fue previamente
digitada por el investigador y se muestra
nuevamente aquí.
Límite inferior de confianza
Límite superior de confianza
Los límites de confianza superior e inferior para el
intervalo de confianza (IC) deseado se calculan por
medio de la fórmula:
donde p es la estimación puntual, t es la t de
Student – igual a 1 menos el número de
conglomerados- (i.e. los grados de libertad para el
análisis de un estimador de razones o
proporciones ) y se(p) es el error estándar de la
proporción.
Tamaño muestral para la encuesta de conglomerados
propuesta
El tamaño muestral propuesto por el investigador
es igual a:
donde n es el número de conglomerados y
es el número promedio de personas por
conglomerado.
Es el tamaño muestral adecuado para la necesidad planteada?
El programa compara el error estándar se(p)
calculado con el error estándar esperado sobre la
base de los deseos del investigador y digita “Sí” si
o “No” si donde se(p) es el error
estándar de la proporción, d es la mitad de la
longitud del intervalo de confianza y t es el valor
de la t de Student –igual a 1 menos el número de
conglomerados-.
- 60 -
Finalmente, el programa calcula los intervalos de
confianza al 90%, 95% y 99%, para la muestra
propuesta. La fórmula para el intervalo de
confianza es:
Para el ejemplo de los 30 conglomerados (i.e. 29
grados de libertad calculados en el análisis
estadístico) los valores de t son 1.699, 2.045 y
2.756 para los intervalos de confianza al 90%, 95%
y 99%, respectivamente. Los valores de t usados
por el programa dependen del número de
conglomerados digitado por el investigador. Si el
límite inferior de confianza es menor que cero o si
el límite superior de confianza es mayor que 1, los
valores serán truncados a 0 y 1, respectivamente.
El programa calcula también el número mínimo de conglomerados que serían necesarios para satisfacer los deseos del investigador (suponiendo que el número promedio de personas elegibles por hogar y el número promedio de hogares por conglomerado hayan sido incluidos) o el número promedio en la muestra por conglomerados (suponiendo que el número promedio de personas elegibles por hogar y el número de conglomerados hayan sido incluidos).
Tamaño Muestral – Prueba de Hipótesis
La pantalla de tamaño muestral y su sección de prueba de hipótesis fue previamente descrita en el Capítulo 3 y mostrada en la Figura 3.8. Las siguientes descripciones utilizan los valores presentados en dicha figura.
Valores que Deben ser Digitados por el Investigador
Propósito del calculo:
Probar el tamaño muestral propuesto
Calcular el número mínimo de conglomerados
Calcular el número promedio en la muestra por
Conglomerados
Valor estimado de la primera proporción
Valor estimado de la segunda proporción
El investigador debe estimar las proporciones que
poseen el atributo de interés en las dos muestras que
serán comparadas. El programa considerará la
diferencia absoluta entre las dos proporciones
(i.e. |p2-p1|). Por ende, el orden no es importante.
- 61 -
Mitad de la longitud del intervalo de confianza
El investigador debe digitar la precisión deseada de la
diferencia absoluta estimada entre las dos
proporciones. La precisión equivale a la mitad de la
longitud del intervalo de confianza, la cual se
representa por la letra d y se calcula por medio de la
siguiente fórmula:
donde t es la t de Student que corresponde al nivel de
confianza deseado y es el error estándar
de la diferencia entre las dos proporciones.
Nivel de confianza deseado El investigador debe seleccionar uno de los tres niveles
de confianza disponibles, a saber, 90%, 95% y 99%.
Parámetro de homogeneidad: Efecto de Diseño
El investigador debe establecer el parámetro de
homogeneidad que pretende usar. La primera opción
es el efecto de diseño –el cual compara la varianza de la
diferencia entre las dos proporciones para una
encuesta por conglomerados con la varianza de una
encuesta de tamaño similar que utilice muestreo
aleatorio simple. La segunda opción posible es la tasa
de homogeneidad, la cual es una medida del
coeficiente de correlación intraclase.
Nivel de homogeneidad: Bajo
El investigador debe establecer el nivel anticipado del
parámetro de homogeneidad para la diferencia entre
las dos proporciones. Las opciones son: igual que en
una muestra aleatoria simple (i.e. ya sea un efecto de
diseño con un valor de 1.0 o la tasa de homogeneidad
equivalente), bajo (i.e. ya sea un efecto de diseño de
2.0 o la tasa de homogeneidad equivalente), medio (i.e.
ya sea un efecto de diseño de 4.0 o la tasa de
homogeneidad equivalente), alto (i.e. ya sea un efecto
de diseño de 7.0 o la tasa de homogeneidad
equivalente), o manual (i.e. definida por el
investigador).
Número promedio de personas elegibles por hogar
El investigador debe digitar una estimación del número
promedio de personas que residen en un hogar o dejar
que el programa calcule este valor sobre la base de la
información digitada en la pantalla de Parámetros de
Encuesta (Ver Figura 3.10).
- 62 -
Número de conglomerados
El investigador debe digitar el número de
conglomerados a ser muestreados en la primera etapa
utilizando el método de probabilidad proporcional al
tamaño (PPS por sus siglas en inglés) para las dos
encuestas. En el ejemplo, cada encuesta selecciona 30
conglomerados, para un total de 60.
Número promedio
de hogares seleccionados
por conglomerado
El investigador debe digitar el número constante de
hogares ( o personas si se cuenta con una persona por
hogar elegible) que serán seleccionados en cada
conglomerado escogido en las dos encuestas.
Una vez que el investigador digita los diversos valores, el programa calculará los valores muestrales que correspondan con los datos digitados.
- 63 -
Valores Calculados por el Programa
Error estándar deseado de la diferencia
de proporciones
El programa determinará, sobre la base de los valores
digitados por el investigador y para satisfacer los deseos
de este, el error estándar máximo de la diferencia entre
dos proporciones. El valor es el nivel de precisión deseado
(d), dividido por el valor de la t de Student, el cual
corresponde a 1 menos el número de conglomerados en
cada encuesta, de tal forma que
Error estándar observado de la diferencia
de proporciones
El programa determinará el error estándar -sobre la base
de los valores digitados- por medio de la siguiente
fórmula:
donde p1 y p2 son las dos proporciones que poseen el
atributo de interés y q1 y q2 equivalen a 1-p1 y 1-p2,
respectivamente. Deff es el efecto de diseño, n es el
número de conglomerados en cada una de las dos
encuestas y es el número promedio de personas
por conglomerado en cada una de las encuestas.
Efecto de Diseño(deff)
El programa determinará el efecto de diseño sobre la base
de los valores digitados. Si la tasa de homogeneidad (roh)
fue digitada en lugar del efecto de diseño (deff), el
programa calculará este último utilizando la siguiente
fórmula:
donde tiene el mismo significado mencionado
anteriormente.
Tasa de homogeneidad(roh)
La tasa de homogeneidad (roh) puede ser digitada por el
investigador como una medida del coeficiente de
correlación intraclase o puede ser calculada por medio de
la fórmula:
donde deff y tienen el mismo significado
mencionado anteriormente.
- 64 -
Estimación puntual para la diferencia de proporciones
Las dos estimaciones puntuales (i.e. p1 y p2) fueron
previamente digitadas por el investigador y son mostradas
aquí como | p2- p1| ó | 0.60 - 0.20|.
Límite inferior de confianza
Límite superior de confianza
Los límites superiores e inferiores para el intervalo de
confianza (IC) deseado se calculan por medio de la fórmula
siguiente:
donde p1 y p2 son las dos estimaciones puntuales, t es el
valor de la t de Student –igual a 1 menos el número de
conglomerados- y es el error estándar de la
diferencia entre las dos proporciones.
Tamaño muestral para la encuesta
por conglomerados propuesta
El tamaño muestral propuesto por el investigador para
cada una de las dos encuestas por conglomerados es igual
a:
Donde n es el número de conglomerados y es el
número promedio de personas por conglomerado. El total
es 720 en el ejemplo para las dos encuestas.
Es el tamaño muestral adecuado para la necesidad
planteada?
El programa comparara el error estándar observado de las
dos proporciones con el error estándar
deseado por el investigador y digita “Si” si
o “No” si
donde se(p2-p1) es el error estándar de la diferencia entre
las dos proporciones, d es la mitad de la longitud del
intervalo de confianza y t es el valor de la t de Student –
igual a 1 menos el número de conglomerados-.
Finalmente, el programa calcula los intervalos de confianza
al 90%, 95% y 99% para la muestra propuesta. La fórmula
del intervalo de confianza es:
Para el ejemplo de 30 conglomerados (i.e. 29 grados de
libertad calculados en el análisis estadístico) los valores de
t son 1.699, 2.045 y 2.756 para los intervalos de confianza
(IC) al 90%, 95% y 99%, respectivamente. Los valores de t
usados por el programa dependen del número total de
conglomerados digitados por el investigador.
- 65 -
El programa calcula también el número mínimo de conglomerados que son necesarios para satisfacer los deseos del investigador (suponiendo que el número promedio de personas elegibles por hogar y el número promedio de hogares por conglomerado están incluidos) o el número promedio en la muestra por conglomerado (suponiendo que el número promedio de personas elegibles por hogar y el número de conglomerados están incluidos).
Muestra por Probabilidad Proporcional al Tamaño en la Primera Etapa
Para encuestas rápidas (i.e. encuestas bietápicas (o de dos etapas) por conglomerados), los conglomerados (pueblos, comunidades, cuadras, etc.) son seleccionados en una primera etapa por medio del método de probabilidad proporcional al tamaño. Una vez que los datos poblacionales son digitados para cada conglomerado, el programa crea una lista acumulada de la población muestreada y almacena información de la ubicación de cada conglomerado en dicha lista. Posteriormente, se selecciona un número aleatorio entre 1 y un número que equivale al total de la población muestreada. Seguidamente, este número es asignado al conglomerado correspondiente en la lista acumulada. El proceso se repite para cada uno de los conglomerados, usualmente 30 de ellos. Por lo anterior, los conglomerados son seleccionados aleatoriamente por medio del método de probabilidad proporcional al tamaño (PPS pos sus siglas en inglés) con reemplazo.