Unidad 1 Tipos y Usos de Estadistica

73
UNIDAD 1 TIPOS Y USOS DE ESTADISTICA La estadística es una técnica basada en la recolección, recuento, clasificación, e interpretación de un conjunto de datos obtenidos a partir de la observación, con el propósito de poder llevar a cabo comparaciones y realizar estimaciones. La estadística es una ciencia formal y una herramienta que estudia el uso y los análisis provenientes de una muestra representativa de datos, busca explicar las correlaciones y dependencias de un fenómeno físico o natural, de ocurrencia en forma aleatoria o condicional. Sin embargo, la estadística es más que eso, es decir, es la herramienta fundamental que permite llevar a cabo el proceso relacionado con la investigación científica. Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales, desde las ciencias de la salud hasta el control de calidad. Se usa para la toma de decisiones en áreas de negocios o instituciones gubernamentales. 1.1 ESTADISTICA DESCRIPTIVA Se dedica a la descripción, visualización y resumen de datos originados a partir de los fenómenos de estudio. Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos de parámetros estadísticos son: la media y la desviación estándar. Algunos ejemplos gráficos son: histograma, pirámide poblacional, gráfico circular, entre otros. 1.2 ESTADISTICA INFERENCIAL Se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo

description

l

Transcript of Unidad 1 Tipos y Usos de Estadistica

Page 1: Unidad 1 Tipos y Usos de Estadistica

UNIDAD 1 TIPOS Y USOS DE ESTADISTICA

La estadística es una técnica basada en la recolección, recuento, clasificación, e interpretación de un conjunto de datos obtenidos a partir de la observación, con el propósito de poder llevar a cabo comparaciones y realizar estimaciones.

La estadística es una ciencia formal y una herramienta que estudia el uso y los análisis provenientes de una muestra representativa de datos, busca explicar las correlaciones y dependencias de un fenómeno físico o natural, de ocurrencia en forma aleatoria o condicional.

Sin embargo, la estadística es más que eso, es decir, es la herramienta fundamental que permite llevar a cabo el proceso relacionado con la investigación científica.

Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales, desde las ciencias de la salud hasta el control de calidad.

Se usa para la toma de decisiones en áreas de negocios o instituciones gubernamentales.

1.1ESTADISTICA DESCRIPTIVA

Se dedica a la descripción, visualización y resumen de datos originados a partir de los fenómenos de estudio. Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos de parámetros estadísticos son: la media y la desviación estándar. Algunos ejemplos gráficos son: histograma, pirámide poblacional, gráfico circular, entre otros.

1.2ESTADISTICA INFERENCIAL

Se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas sí/no (prueba de hipótesis), estimaciones de unas características numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o modelamiento de relaciones entre variables (análisis de regresión). Otras técnicas de modelamiento incluyen anova, series de tiempo y minería de datos.

1.3ESTADISTICA PARAMETRICA

es una rama de la estadística inferencial que comprende los procedimientos estadísticos y de decisión que están basados en las distribuciones de los datos

Page 2: Unidad 1 Tipos y Usos de Estadistica

reales. Estas son determinadas usando un número finito de parámetros. Esto es, por ejemplo, si conocemos que la altura de las personas sigue una distribución normal, pero desconocemos cuál es la media y la desviación de dicha normal. La media y la desviación típica de la desviación normal son los dos parámetros que queremos estimar. Cuando desconocemos totalmente que distribución siguen nuestros datos entonces deberemos aplicar primero un test no paramétrico, que nos ayude a conocer primero la distribución.

La mayoría de procedimientos paramétricos requiere conocer la forma de distribución para las mediciones resultantes de la población estudiada. Para la inferencia paramétrica es requerida como mínimo una escala de intervalo, esto quiere decir que nuestros datos deben tener un orden y una numeración del intervalo. Es decir nuestros datos pueden estar categorizados en: menores de 20 años, de 20 a 40 años, de 40 a 60, de 60 a 80, etc, ya que hay números con los cuales realizar cálculos estadísticos. Sin embargo, datos categorizados en: niños, jóvenes, adultos y ancianos no pueden ser interpretados mediante la estadística paramétrica ya que no se puede hallar un parámetro numérico (como por ejemplo la media de edad) cuando los datos no son numéricos.

Es la que requiere que los elementos que integran las muestras contengan elementos parámetros o medibles. Puede resolver tres tipos de problemas:

Estimación puntual: En la que pretendemos darle un valor al parámetro a estimar.

Estimación por intervalos (buscamos un intervalo de confianza).

Contraste de hipótesis, donde buscamos contrastar información acerca del parámetro.

1.4ESTADISTICA NO PARAMETRICA

es una rama de la estadística que estudia las pruebas y modelos estadísticos cuya distribución subyacente no se ajusta a los llamados criterios paramétricos. Su distribución no puede ser definida a priori, pues son los datos observados los que la determinan. La utilización de estos métodos se hace recomendable cuando no se puede asumir que los datos se ajusten a una distribución conocida, cuando el nivel de medida empleado no sea, como mínimo, de intervalo.

Las principales pruebas no paramétricas son las siguientes:

Prueba χ² de Pearson

Prueba binomial

Page 3: Unidad 1 Tipos y Usos de Estadistica

Prueba de Anderson-Darling

Prueba de Cochran

Prueba de Cohen kappa

Prueba de Fisher

Prueba de Friedman

Prueba de Kendall

Prueba de Kolmogórov-Smirnov

Prueba de Kruskal-Wallis

Prueba de Kuiper

Prueba de Mann-Whitney o prueba de Wilcoxon

Prueba de McNemar

Prueba de la mediana

Prueba de Siegel-Tukey

Prueba de los signos

Coeficiente de correlación de Spearman

Tablas de contingencia

Prueba de Wald-Wolfowitz

Prueba de los rangos con signo de Wilcoxon

La mayoría de estos test estadísticos están programados en los paquetes estadísticos más frecuentes, quedando para el investigador, simplemente, la tarea de decidir por cuál de todos ellos guiarse o qué hacer en caso de que dos test nos den resultados opuestos. Hay que decir que, para poder aplicar cada uno existen diversas hipótesis nulas y condiciones que deben cumplir nuestros datos para que los resultados de aplicar el test sean fiables. Esto es, no se puede aplicar todos los test y quedarse con el que mejor convenga para la investigación sin verificar si se cumplen las hipótesis y condiciones necesarias pues, si se violan, invalidan cualquier resultado posterior y son una de las causas más frecuentes de que un estudio sea estadísticamente incorrecto. Esto ocurre sobre todo cuando el

Page 4: Unidad 1 Tipos y Usos de Estadistica

investigador desconoce la naturaleza interna de los test y se limita a aplicarlos sistemáticamente.

Es importante mencionar que si la distribución de los datos se ajusta a un tipo de distribución conocida, existen otras [pruebas] que, en la práctica, son más aconsejables pero que así mismo requieren otros supuestos. En este caso, la estadística a emplear es la estadística paramétrica, dentro de la cual muchas veces podemos encontrar equivalencias entre pruebas pero con diferencias en la potencia entre ambas siendo siempre la potencia de las pruebas no paramétricas menor que la potencia de las pruebas paramétricas equivalentes. Aun así, el uso adecuado de los tamaños muestrales disminuye la posibilidad de cometer un [error tipo II], puesto que aumenta al mismo tiempo la eficacia de la prueba . Es decir, a medida que se aumenta el tamaño de la muestra, disminuye la posibilidad de cometer un error tipo II (un falso negativo: No rechazar la hipótesis nula cuando ésta en realidad es falsa).

UNIDAD 2 CONCEPTOS BASICOS DE ESTADISTICA

2.1 POBLACION

Es el conjunto de todos los posibles elementos que intervienen en un experimento o en un estudio. La hay de dos tipos

Población finita. Es aquella que indica que es posible alcanzarse o sobrepasarse al contar. Es aquella que posee o incluye un número limitado de medidas y observaciones.

Población infinita. Es infinita si se incluye un gran conjunto de medidas y observaciones que no pueden alcanzarse en el conteo. Son poblaciones infinitas porque hipotéticamente no existe límite en cuanto al número de observaciones que cada uno de ellos puede generar.

2.2 MUESTRA

Un conjunto de medidas u observaciones tomadas a partir de una población dada. Es un subconjunto de la población.

Muestra representativa. Un subconjunto representativo seleccionado de una población de la cual se obtuvo.

Muestreo. Al estudio de la muestra representativa.

Page 5: Unidad 1 Tipos y Usos de Estadistica

Es un subconjunto de la población. Ejemplo: Estudiantes de 2do Semestre de la Universidad UTN. Sus principales características son:

Representativa.- Se refiere a que todos y cada uno de los elementos de la población tengan la misma oportunidad de ser tomados en cuenta para formar dicha muestra.

Adecuada y válida.- Se refiere a que la muestra debe ser obtenida de tal manera que permita establecer un mínimo de error posible respecto de la población.

Para que una muestra sea fiable, es necesario que su tamaño sea obtenido mediante procesos matemáticos que eliminen la incidencia del error.

Para calcular el tamaño de la muestra suele utilizarse la siguiente fórmula:

Donde:

n = el tamaño de la muestra. N = tamaño de la población.

Desviación estándar de la población que, generalmente cuando no se tiene su valor, suele utilizarse un valor constante de 0,5.

Z = Valor obtenido mediante niveles de confianza. Es un valor constante que, si no se tiene su valor, se lo toma en relación al 95% de confianza equivale a 1,96 (como más usual) o en relación al 99% de confianza equivale 2,58, valor que queda a criterio del encuestador.

e = Límite aceptable de error muestral que, generalmente cuando no se tiene su valor, suele utilizarse un valor que varía entre el 1% (0,01) y 9% (0,09), valor que queda a criterio del encuestador.

Ejemplo ilustrativo: Calcular el tamaño de la muestra de una población de 1000 elementos.

Solución:

Se tiene N=1000, y como no se tiene los demás valores se tomará o=0,5 , Z = 1,96 y e = 0,05. Reemplazando valores en la fórmula se obtiene:

Page 6: Unidad 1 Tipos y Usos de Estadistica

2.3 VARIABLE

Son caracteres susceptibles a cambio y pueden tener diferentes valores en cada elemento o individuo.

Clasificación

- Variable Cualitativa

Son atributos que se expresan mediante palabras no numéricas. Como por ejemplo, profesión, religión, marca de automóvil, estado civil, sexo, raza, etc.

- Variable Cuantitativa

Es toda magnitud representada por números. Como por ejemplo, peso, estatura, número de habitantes, etc.

- Variable Discreta

Es una característica cuantitativa representada por números enteros o exactos, que generalmente resultan del proceso de conteo, como por ejemplo: número de estudiantes de la promoción del año anterior.

- Variable Continua

Es una característica cuantitativa que puede tomar cualquier valor representado por un número racional, que generalmente resultan del proceso de medición, como por ejemplo, tiempo destinado a estudiar Estadística

Niveles de medición

- Nivel Nominal

Cuando los datos sólo pueden contarse y clasificados en categorías, no existe un orden específico entre las clases. Como por ejemplo, se cuentan cuántos hombres y cuántas mujeres asisten a determinado evento.

- Nivel Ordinal

Page 7: Unidad 1 Tipos y Usos de Estadistica

Cuando se ordenan los datos por jerarquías, una categoría es mayor que otra. Como por ejemplo, excelente es mejor que bueno o bueno es mejor que regular. Otro ejemplo: Una persona puede tener mucho o poco dinero.

- Nivel de Intervalos

Cuando se incluye todas las características del nivel ordinal, pero la diferencia entre los valores tiene un significado medido en unidades iguales que son comunes y constantes, que permiten asignar números reales a todos los miembros de la clase ordenada, facilitando el establecimiento de diferencias en grados de propiedad y entre objetos sobre la base de una medida. Como por ejemplo: La diferencia entre 70 kilogramos y 60 kilogramos, es de 10 kilogramos. Otro ejemplo: Si la temperatura de hoy es de 20 grados centígrados y la de ayer fue de 25 grados centígrados, se sabe que la de hoy es 5 grados centígrados más baja que la de ayer.

- Nivel de Razón o Cociente

Este es el nivel de medición "más alto", tiene todas las características del nivel de intervalos y además en este nivel de medición el cero tiene significado (así si se tiene 0 dólares, entonces no se poseen fondos), y la razón (o cociente) entre dos números también es significativa (Un estudiante obtiene una calificación de 3/10 y otro 6/10, el segundo estudiante obtiene el doble que el primero).

2.4 DATO

Los datos son agrupaciones de cualquier número de observaciones relacionadas. Para que se considere un dato estadístico debe tener 2 características: a) Que sean comparables entre sí. b) Que tengan alguna relación.

2.5 EXPERIMENTO

Es una actividad planificada, cuyos resultados producen un conjunto de datos. Es el proceso mediante el cual una observación o medición es registrada.

2.6 PARAMETRO

Se conoce como parámetro al dato que se considera como imprescindible y orientativo para lograr evaluar o valorar una determinada situación. A partir de un parámetro, una cierta circunstancia puede comprenderse o ubicarse en perspectiva. Por dar algunos ejemplos concretos: “Si nos basamos en los parámetros habituales, resultará imposible comprender esta situación”, “El paciente está evolucionando de acuerdo a los parámetros esperados”, “Estamos

Page 8: Unidad 1 Tipos y Usos de Estadistica

investigando pero no hay parámetros que nos permitan establecer una relación con el caso anterior”, “La actuación del equipo en el torneo local es el mejor parámetro para realizar un pronóstico sobre su participación en el campeonato mundial”.

2.7 ESTADISTICO

es una medida cuantitativa, derivada de un conjunto de datos de una muestra, con el objetivo de estimar o inferir características de una población o modelo estadístico.

Más formalmente un estadístico es una función medible T que, dada una muestra estadística de valores (X_1,X_2,...,X_n), les asigna un número, T(X_1,X_2,...,X_n), que sirve para estimar determinado parámetro de la distribución de la que procede la muestra. Así, por ejemplo, la media de los valores de una muestra (media muestral) sirve para estimar la media de la población de la que se ha extraído la misma; la varianza muestral podría usarse para estimar la varianza poblacional, etc.1 Esto se denomina como realizar una estimación puntual.

2.8 SESGO

Se llama sesgo de un estimador a la diferencia entre su esperanza matemática y el valor numérico del parámetro que estima. Un estimador cuyo sesgo es nulo se llama insesgado o centrado.

En notación matemática, dada una muestra X_1, \dots, X_n\, iid X y un estimador T(x_1, \dots, x_n)\, del parámetro muestral \theta\,, el sesgo es:

E(T) - \theta\,

El no tener sesgo es una propiedad deseable de los estimadores. Una propiedad relacionada con ésta es la de la consistencia: un estimador puede tener un sesgo pero el tamaño de éste converge a cero conforme crece el tamaño muestral.

Dada la importancia de la falta de sesgo, en ocasiones, en lugar de estimadores naturales se utilizan otros corregidos para eliminar el sesgo. Así ocurre, por ejemplo, con la varianza muestral.

En el diseño y elaboración de un estudio de investigación en clínica, puede haber distintos tipos de sesgos:

Page 9: Unidad 1 Tipos y Usos de Estadistica

de selección: debido a que los grupos no comparables a causa de cómo se eligieron los pacientes o sujetos.

de información: debido a que los grupos no comparables a causa de cómo se obtuvieron los datos.

de confusión: debido a una mezcla de efectos debido a una tercera variable (variable de confusión).

2.9 CONFIABILIDAD

Una medición es “confiable” si podemos esperar en forma razonable que los resultados de dicha medición sean sistemáticamente precisos. Esto requiere que el instrumento usado para realizar la medición (como por ejemplo una prueba o examen a estudiantes) sea confiable. Por ejemplo, una pistola es por completo confiable si siempre da en el blanco al ser apuntada exactamente en la misma dirección. En otras palabras, si la bala que dispara siempre da en el punto al cual se apunta la pistola. O sea, que si la pistola no da en el blanco es porque la persona que la disparó falló, o sea, no apuntó correctamente.

2.10 VALIDEZ

Una medición es “válida” si mide lo que en realidad trata de medir. Por ejemplo, una prueba de matemática no es válida para medir el rendimiento de alfabetización de los estudiantes. Tampoco sería válida una prueba culturalmente sesgada. En el caso de la pistola, si ésta no es apuntada en la dirección del blanco, sino que fuera de él, simplemente jamás dará en el blanco, por muy confiable que sea.

El problema de la validez, entonces, consiste asegurarnos de que estamos midiendo lo que deseamos medir o, de acuerdo con nuestro ejemplo, que estamos apuntando en la dirección correcta. El problema de la confiabilidad, en cambio, se resuelve utilizando un instrumento preciso (una pistola en perfecto estado).

2.11 DISEÑO DE MUESTRA

Proporcionar información para un estudio de investigación. Medir el desempeño en un servicio o proceso de producción. Ayudar a una mejor toma de decisiones Satisfacer nuestra curiosidad.

Ejemplos :

Page 10: Unidad 1 Tipos y Usos de Estadistica

El gerente de una empresa desea controlar un proceso de manera regular para investigar la calidad del servicio.

Un investigador de mercados busca las características que distinguen su producto del de sus competidores.

¿Cómo diseñar la muestra?

La fase del diseño de la muestra está relacionada con :

La estructuración de los instrumentos para recoger datos.

Con las técnicas estadísticas susceptibles de emplearse para el análisis.

Con los resultados.

El diseñar la muestra implica:

Calcular el numero de casos.

Definir quienes serán los encuestados.

Prever los problemas para su levantamiento.

Lugar de entrevista.

Estrategia para sustituir encuestados.

Rutas que deben seguirse para su aplicación.

Presentar 2 o mas opciones de muestra

Los puntos a discutirse son:

Los objetivos del Análisis.

La disponibilidad de recursos financieros, humanos y materiales.

El nivel de confianza y precisión para estimar parámetros de la población.

La forma de la población (homogénea o heterogénea).

El tipo de preguntas (abiertas, cerradas).

El número de preguntas que está en relación con la cantidad de variables sujetas a investigación.

El plan de análisis estadístico

Page 11: Unidad 1 Tipos y Usos de Estadistica

¿Qué tipos de muestra existen?

Muestreo probabilística:

Las unidades de análisis o de observación son seleccionadas en forma aleatoria

Aleatoria simple

Estratificado

Por racimos

Sistemático

Muestreo no probabilistico:

Es muy cómodo y económico pero tiene el inconveniente de que los resultados de la muestra no pueden generalizarse para toda la población.

Cuotas

Intencional o selectivo

UNIDAD 3 LOS DISEÑOS EPIDEMIOLOGICOS

son el conjunto de actividades intelectuales y experimentales realizadas de modo sistemática con el objeto de generar conocimientos sobre las causas que originan las enfermedades humanas.

Los estudios epidemiológicos permiten establecer la relación entre las causas de la enfermedad (variables independientes) y la influencia de éstas sobre el surgimiento de la enfermedad (variables dependientes).

3.1 OBSERVACIONALES

El investigador no interviene. Se limita a observar y describir la realidad. Ejemplos son el estudio caso control, estudio de cohortes y el estudio de la prevalencia.

son estudios de carácter estadístico y demográficos, ya sean de tipo sociológico o biológico -estudios epidemiológicos- en los que no hay intervención por parte del investigador, y éste se limita a medir las variables que define en el estudio.

Un estudio observacional puede ser descriptivo o analítico.

Page 12: Unidad 1 Tipos y Usos de Estadistica

Los estudios epidemiológicos þ observacionales pueden ser de tres tipos dependiendo del momento en que se llevan a cabo y de la información disponible en cada caso:1

Estudios longitudinales: Se desarrollan durante un "período" definido de tiempo y suponen trabajar con dos bloques de la información relativos a la misma población, la existente al comienzo del período en estudio y la existente al final de ese período (p.e. estudios de historia demográfica y biométrica, fecundidad, mortalidad...). Éstos pueden ser a su vez:1

Estudio caso control: Son "retrospectivos".

Estudio de cohorte: Son de carácter "prospectivo".

Estudios transversales: Se desarrollan en un "momento" concreto del tiempo. Son los estudios de prevalencia. (p.e. pirámides de población)

VENTAJAS

Los estudios observacionales,

Son más prácticos y factibles de realizar ya que la cooperación de los sujetos es menos necesaria

Sus resultados son más generalizables a poblaciones geográfica o demográfica mente definidas, lo que permite que este tipo de estudios sean apropiados para establecer metas de salud pública orientadas a una determinada acción.

INCONVENIENTES

Escaso control de las influencias de los factores de confusión sobre los resultados del estudio.

Debido a la falta de control por parte del investigador, cada estudio observacional tiende a ser único, siendo muy difícil reproducir los resultados por otro investigador.

3.1.1 DESCRIPTIVOS

Es un tipo de metodología a aplicar para deducir un bien o circunstancia que se esté presentando; se aplica describiendo todas sus dimensiones, en este caso se describe el órgano u objeto a estudiar. Los estudios descriptivos se centran en recolectar datos que describan la situación tal y como es.

Page 13: Unidad 1 Tipos y Usos de Estadistica

Los estudios descriptivos clásicos son los estudio de serie de casos y los estudios de prevalencia.

Objetivos de un estudio descriptivo

Identificar casos de enfermedad, estimar su frecuencia y examinar tendencias de la población estadística según las variables de estudio.

Justificar estudios analíticos para probarse hipótesis específicidades.

Otro tipo del Término descriptivo es que el lector obtenga una imagen exacta de la realidad que estamos transmitiendo en palabras así que representa lo que el lector cree poder describir mediante una idea.

Función

Su función es describir cómo se distribuye una enfermedad o evento en cierta población, en un lugar y durante un período de tiempo determinado; cuál es su frecuencia y cuáles son los determinantes o factores con ella asociados.

La Epidemiología Descriptiva considera

-Que población o subgrupos desarrollan la enfermedad o lo hacen con más frecuencia.

-Como la frecuencia de ésta varía a lo largo del tiempo y/o en poblaciones con diferentes características.

-En que localización geográfica es más o menos frecuente dicha enfermedad.

A partir de la descripción de la distribución de estos eventos, se podrá arriesgar una explicación o "hipótesis" que dé cuenta de las causas que los producen.

• En líneas generales, si Ustedes quieren describir la ocurrencia de una enfermedad entonces tendrán que utilizar algunos de los distintos diseños descriptivos

Si tienen datos de una sola persona o de un grupo de personas que experimentaron una determinada enfermedad y quiere describir estos casos debidos, por ejemplo, a la rareza de la enfermedad en cuestión, entonces deberán optar por un diseño descriptivo. En esta situación, entonces, lo único que harán es describir detalladamente la enfermedad en uno o varios individuos.

Page 14: Unidad 1 Tipos y Usos de Estadistica

ESTUDIOS DE PREVALENCIA

se denomina prevalencia a la proporción de individuos de un grupo o una población que presentan una característica o evento determinado en un momento o en un período determinado ("prevalencia de periodo"). Por tanto podemos distinguir dos tipos de prevalencia: puntual y de periodo.

Prevalencia puntual: cuántas personas de un grupo definido están enfermas en un determinado momento. Ejemplo hipotético: 1% de los empleados están esta semana enfermos.

Prevalencia de periodo: la proporción de personas que están o estarán enfermas en algún momento. Ejemplo hipotético: 10% de los habitantes de este pueblo tendrá cáncer en algún momento durante su vida.

La prevalencia de una enfermedad es el número total de los individuos que presentan un atributo o enfermedad en un momento o durante un periodo dividido por la población en ese punto en el tiempo o en la mitad del periodo. Cuantifica la proporción de personas en una población que tienen una enfermedad (o cualquier otro suceso) en un determinado momento y proporciona una estimación de la proporción de sujetos de esa población que tenga la enfermedad en ese momento.

Es un parámetro útil porque permite describir un fenómeno de salud, identificar la frecuencia poblacional del mismo y generar hipótesis explicatorias. La utilizan normalmente los epidemiólogos, las personas encargadas de la política sanitaria, las agencias de seguros y en diferentes ámbitos de la salud pública.

CARACTERISTICAS

Es una proporción. Por lo tanto, no tiene dimensiones y su valor oscila entre 0 y 1, aunque a veces se expresa como porcentaje.

Es un indicador estático, que se refiere a un momento temporal. La prevalencia indica el peso o la abundancia del evento que soporta una

población susceptible, teniendo su mayor utilidad en los estudios de planificación de servicios sanitarios.

En la prevalencia influye la velocidad de aparición del evento y su duración. Por ello es poco útil en la investigación causal y de medidas terapéuticas.

La prevalencia no debe confundirse con la incidencia. La incidencia es una medida del número de casos nuevos de una enfermedad en un período determinado. Podría considerarse como una tasa que cuantifica las personas que enfermarán en un periodo. La prevalencia se refiere a todos los individuos afectados, independientemente de la fecha de contracción de la enfermedad. Es decir, que con la prevalencia puede saberse en un determinado momento

Page 15: Unidad 1 Tipos y Usos de Estadistica

cuantos enfermos hay. Una enfermedad de larga duración que se extiende ampliamente en una comunidad en 2002 tendrá una alta prevalencia en 2003 (asumiendo como duración larga un año o más), pero puede tener, sin embargo, una tasa de incidencia baja en 2003. Por el contrario, una enfermedad que se transmite fácilmente pero de duración corta, puede tener una baja prevalencia y una alta incidencia. La prevalencia es un parámetro útil cuando se trata de infecciones de larga duración, como por ejemplo el SIDA, pero la incidencia es más útil cuando se trata de infecciones de corta duración, como por ejemplo la varicela.

La prevalencia de una enfermedad en una población determinada influye en la eficacia real de una prueba para diagnosticar dicha enfermedad en esa población concreta. Se trata de un parámetro que, junto con los valores de sensibilidad y especificidad intrínsecos a esa prueba, permite obtener aplicando el teorema de Bayes los valores predictivos positivo y negativo, que son probabilidades de que la enfermedad esté realmente presente o no si el resultado de la prueba es positivo o negativo, respectivamente. En definitiva, se trata de que esas probabilidades de acierto por parte del test serán mayores en función no solo de la muestra sobre la que se realiza el estudio, sino también de la población de la que procede. Por ejemplo, si tratamos de detectar una enfermedad muy rara (con baja prevalencia)en una poblacíón A con una prueba de diagnóstico, la cantidad de falsos positivos que vamos a obtener va a ser mayor con respecto a los falsos positivos que obtendríamos usando esa misma prueba en otra población B donde la enfermedad es mucho más abundante (alta prevalencia), lo cual equivale a decir que en la población A la probabilidad de que una persona esté realmente enferma si la prueba da positivo es menor que en la población B.

SERIE DE CASOS

Un estudio de serie de casos clínicos (o situaciones de cualquier tipo que estén relacionados con la investigación científica, industrial, académica, etc.) es un estudio epidemiológico, descriptivo, que se limita a la simple identificación y descripción de un conjunto de casos clínicos que han aparecido en un intervalo de tiempo.

En el caso de nuevas enfermedades o fármacos, las series de casos contribuyen a la caracterización del perfil y delimitación de nuevas entidades nosológicas. Sin embargo para valorar la importancia de los antecedentes y posibles asociaciones es necesaria la presencia de un grupo control que sirva de referencia y comparación.

Page 16: Unidad 1 Tipos y Usos de Estadistica

ESTUDIOS ECOLOGICOS

Un estudio ecológico es un tipo de estudio epidemiológico basado en la población como unidad de estudio, en el que falta información sobre la relación en el individuo entre el factor de exposición y la enfermedad en la población en estudio.

TIPOS DE ESTUDIO

Estudio ecológico exploratorio. Estudio con emigrantes. Estudio ecológico de comparación. Estudio ecológico de tendencias. Estudio ecológico mixto.

VENTAJAS

Son relativamente baratos y factibles, especialmente con datos secundarios obtenidos de bases de datos poblacionales. Es útil para seleccionar nuevas hipótesis.

Es útil para evaluar la efectividad de programas, intervenciones y políticas de salud en la población, especialmente cuando los efectos en el individuo (eficacia) no se prueban, pero son conocidos por investigaciones previas.

A veces sirven para identificar ciertos tipos de efectos que no se detectan en el individuo.

INCONVENIENTES

Falacia ecológica: Debido a que los grupos no son totalmente homogéneos con respecto al estado de exposición, el realizar inferencias causales está limitado por la asociación que se realiza en el grupo más que en el individuo, es decir no es correcto extrapolar datos de la población al individuo, por el diseño de este estudio.

Multicolinealidad: Es difícil separar los efectos observados de dos o más exposiciones.

Muchos datos no están disponibles cuando están agregados en la población. Ambigüedad temporal: A menudo no se puede determinar si la exposición

precede a la enfermedad. En los estudios de tendencias es difícil separar las influencias de cambios en

un intervalo corto de tiempo de las influencias de un intervalo grande de tiempo.

3.1.2 ANALITICOS

Page 17: Unidad 1 Tipos y Usos de Estadistica

es un estudio epidemiológico en el que el análisis del estudio se establecen relaciones entre las variables, de asociación o de causalidad. Cuando se plantea realizar un estudio analítico, se conoce bastante sobre la enfermedad, así pueden probarse hipótesis específicas previas surgidas de un estudio descriptivo.

Son estudios analíticos típicos: El estudio de cohorte, el estudio caso control y el ensayo clínico.

Objetivos de un estudio analítico

Probar hipótesis etiológicas o preventivas y estimar los efectos crónicos sobre la salud.

Justificar estudios adicionales para probar hipótesis aún más específicas. Sugerir aspectos potenciales para la prevención de la enfermedad o

promoción de la salud. Analizar los aspectos potenciales Analizar 3 veces para decir algo mente/mental

ESTUDIOS DE COHORTES

es un estudio epidemiológico, observacional, analítico, longitudinal prospectivo, en el que se hace una comparación de la frecuencia de enfermedad (o de un determinado desenlace) entre dos poblaciones, una de las cuales está expuesta a un determinado factor de exposición o factor de riesgo al que no está expuesta la otra. Los individuos que componen los grupos de estudio se seleccionan en función de la presencia de una determinada característica o exposición.

Estos individuos no tienen la enfermedad de interés y son seguidos durante un cierto periodo de tiempo para observar la frecuencia con que la enfermedad aparece en cada uno de los grupos. También se llama estudio de seguimiento, de proyección o de incidencia, y tienen por objetivo medir causalidad entre factores de riesgo y la enfermedad a estudiar.

Los estudios de seguimiento son los estudios prospectivos clásicos, caracterizados por el hecho de que el planteamiento del estudio se produce con anterioridad al desarrollo de la enfermedad. A pesar de que se trata de estudios muy costosos, al requerir grandes recursos económicos y de tiempo, y de gran solidez ya que la probabilidad de que estén sesgados es menor, hay que cuidar extremadamente los aspectos del diseño y evitar sesgos, especialmente de clasificación y el de los trabajadores sanos.

Técnicas de un estudio de cohorte

Page 18: Unidad 1 Tipos y Usos de Estadistica

Seleccionar una muestra de estudio sanos de población. Medir variables de exposición en la muestra, si el factor de riesgo está

ausente o presente. Seguir a la cohorte. Medir las variables de resultado, es decir, la presencia o ausencia de

enfermedad. Ventajas de un estudio de cohorte[editar] Estudiar factores de exposición extraños. Visualizar los múltiples efectos que puede tener una exposición Observar simultáneamente los efectos de varias exposiciones (siempre y

cuando esta posibilidad sea planteada desde el principio del estudio). Posibilitar la muestra de la secuencia temporal entre exposición y

desenlace Permitir la estimación de incidencia y riesgo relativo. Establecer claramente la secuencia de sucesos de interés como es la

exposición-enfermedad. Evitar el sesgo de supervivencia. Tener mejor control sobre la selección de sujetos. Tener mayor control de las medidas. Se caracteriza por tener movimiento. Inconvenientes de un estudio de cohorte[editar] Requiere a menudo grandes tamaños muestrales. No es eficiente en eventos raros o con largos períodos de latencia. Su ejecución puede requerir mucho tiempo y dinero. No es útil para enfermedades raras.

Son estudios caros por la cantidad de personas y el tiempo de seguimiento necesarios, así como por los esfuerzos que han de llevarse a cabo para que la calidad del seguimiento minimice las pérdidas entre las poblaciones que se siguen, manteniéndolas en un nivel aceptable.

Como alternativa, existe otro tipo de estudios de cohortes: las cohortes retrospectivas, en las cuales la investigación se plantea después de haberse producido la enfermedad, para lo cual tanto la presencia de exposición como la de desenlace deben provenir de registros históricos de alta fiabilidad en los que se hayan registrado con precisión la exposición y el desenlace, en el momento de producirse. Surge la siguiente pregunta: ¿es ética la realización de estudios de cohortes?

Ejemplos de estudios de cohorte

Page 19: Unidad 1 Tipos y Usos de Estadistica

The Framingham Heart Study es uno de los estudios de cohorte más conocidos al estudiar los factores de riesgo cardiovascular.

El United Kingdom Prospective Diabetes Study (UKPDS) es el estudio de cohorte sobre la evolución de la diabetes mellitus tipo 2.

ESTUDIO DE CASOS Y CONTROLES

es un estudio epidemiológico, observacional, analítico, en el cual los sujetos son seleccionados en función de que tengan (casos) o no tengan (control) una determinada enfermedad, o en general un determinado efecto. Una vez seleccionados los individuos en cada grupo, se investiga si estuvieron expuestos o no a una característica de interés y se compara la proporción de expuestos en el grupo de casos frente a la del grupo de controles.

Tipos de estudio de casos y controles

Estudio de casos y controles retrospectivo: Todos los casos han sido diagnosticados antes del inicio del estudio.

Estudio de casos y controles prospectivo: Los casos son diagnosticados con posterioridad al inicio del estudio y así pueden incluirse los nuevos casos detectados durante un cierto tiempo establecido previamente.

Estudio de casos y controles de base poblacional: Combina elementos del estudio de cohorte y de casos y controles. Se sigue a un grupo de individuos hasta cuando aparezca la enfermedad de interés de igual forma del estudio de cohortes. Estos casos se comparan con un grupo control, muestreado de la misma población. Una vez obtenidos todos los casos y los controles se analiza el tipo de exposición previa o actual, como en un estudio de casos y controles.

Estudio casos y controles anidados: Es un estudio caso control en el cual tanto los casos como los controles son tomados de la población que participa en un estudio de cohortes. Como los datos de esta población se obtienen a lo largo del tiempo, se reduce la posibilidad de sesgos de selección e información, que son comunes en los diseños caso control.

Técnica de un estudio de casos y controles

Seleccionar una muestra de población con la enfermedad o con el problema de estudio. A los individuos de esta muestra se les llama casos.

Page 20: Unidad 1 Tipos y Usos de Estadistica

Seleccionar una muestra de la población de riesgo de enfermar pero que esté libre de la enfermedad problema, que será el grupo control.

Medir las variables predictoras, que son los factores de riesgo.

Ventajas de los estudios de casos y controles

Son útiles para estudiar eventos raros o dichas enfermedades.

Permiten el estudio con tamaños muestrales relativamente pequeños.

Exigen poco tiempo en su ejecución.

Relativamente baratos comparados con los estudios de cohortes. Los de diseño de base poblacional suelen ser más caros.

Proporcionan estimadores de odds ratio.

Evalúan muchos factores de riesgo para una enfermedad o suceso.

Inconvenientes de los estudios de casos y controles

Es ineficiente para el estudio de efectos de exposición raros.

No establece la secuencia de eventos de interés.

Posibles errores de selección de casos y controles. Este sesgo es menor en el diseño de base poblacional.

Posible sesgo de supervivencia.

Sólo pueden estudiar una variable de resultado (enfermedad).

No proporcionan estimadores de prevalencia, incidencia o riesgo atribuible. En el diseño de base poblacional, sí se puede estimar la incidencia.

Son inapropiados cuando el resultado de interés no se conoce al comienzo del estudio o cuando el resultado es una variable continua.

3.2 ESPERIMENTALES

Un ensayo clínico es una evaluación experimental de un producto, sustancia, medicamento, técnica diagnóstica o terapéutica que, en su aplicación a seres humanos, pretende valorar su eficacia y seguridad.

Los estudios de prometedores tratamientos nuevos o experimentales en pacientes se conocen como ensayos clínicos. Un ensayo clínico se realiza sólo cuando hay razones para creer que el tratamiento que se está estudiando puede ser

Page 21: Unidad 1 Tipos y Usos de Estadistica

beneficioso para el paciente. Los tratamientos usados en los ensayos clínicos con frecuencia demuestran tener beneficios reales. Los investigadores realizan estudios sobre nuevos tratamientos para conocer la utilidad del nuevo tratamiento, el mecanismo de acción del nuevo tratamiento, si la efectividad es mayor que otros tratamientos ya disponibles, los efectos secundarios del nuevo tratamiento y si son mayores o menores que el tratamiento convencional, si supera los beneficios a los efectos secundarios y en qué pacientes el nuevo tratamiento es más útil.

3.2.1 ENSAYO CLINICO NO CONTROLADO

Un estudio no controlado obtiene resultados que se comparan con datos históricos, que se obtuvieron previamente con otro tratamiento o que son consecuencia de la evolución natural de una enfermedad. Existe el peligro en este tipo de estudios, de que las poblaciones no sean comparables, o de que los medios utilizados para obtener los resultados sean diferentes, lo cual puede condicionar la comparación.

3.2.2 ESNSAYO CLINICO CONTROLADO

El ensayo clínico es un estudio experimental en el que en el diseño de investigación están definidas las variables y los mecanismos de control de dichas variables, cuya función es evitar los sesgos y las variables de confusión. Existe un grupo con el que se compara la intervención experimental. Este grupo sufre también una intervención con un procedimiento placebo o con un procedimiento estándar de referencia, ya validado para la situación objeto de estudio. Para que ambos grupos sean comparables todos los factores pronósticos, tanto los conocidos (mediante los criterios de selección) como los desconocidos (mediante la asignación aleatoria), deben estar repartidos por igual entre los grupos antes de iniciar el tratamiento. Pueden existir más de un grupo de intervención experimental cuando queremos probar más de una hipótesis, así como más de un grupo de control cuando existe más de una intervención validada que se sabe eficaz. Esto se suele hacer cuando se quiere estratificar la eficacia de las intervenciones. A cada grupo, tanto de intervención como de control, se les llama brazos del estudio.

Un ejemplo: Queremos probar la eficacia de dos fármacos A y B en la enfermedad E, para la cual ya se han mostrado efectivos los fármacos C y D. Pues bien, podemos hacer los siguientes grupos: grupo del fármaco A, grupo del fármaco B, grupo del fármaco C, grupo del fármaco D y grupo con placebo. Tras el análisis estadístico de los resultados, la comparación de los brazos A y B con el brazo placebo nos dirá si los fármacos son o no eficaces en esa enfermedad. La comparación con los brazos C y D nos dirá el grado de eficacia respecto a lo ya

Page 22: Unidad 1 Tipos y Usos de Estadistica

conocido. Así, podemos conseguir resultados del tipo: El fármaco A no es eficaz, mientras que el B sí lo es, siendo más eficaz que el C pero menos que el D.

ENSAYO CLINICO ALEATORIO Y NO ALEATORIO

Lo podemos encontrar frecuentemente bajo el término randomizado, neologismo inglés que en ocasiones hasta se declina como si fuera un verbo castellano: randomizar. La aleatorización significa que los casos son distribuidos al azar en cada brazo del estudio. El objetivo es conseguir que los diferentes grupos sean comparables u homogéneos, evitar el sesgo del investigador en la asignación de casos a los grupos y garantizar que los tests estadísticos tendrán valores de significación estadística válidos. Existen varias alternativas metodológicas de aleatorización, que deben ser consideradas en la fase de planificación del estudio, y cuya idoneidad depende de las características del ensayo a efectuar. En Medicina y otras ciencias biológicas, las técnicas de aleatorización más usadas son:

Aleatorización simple

Consiste en la asignación a cada uno de los brazos con una probabilidad constante y conocida de antemano. Un ejemplo sería en un estudio con dos brazos tirar una moneda al aire. Si sale cara se asigna a un brazo y si sale cruz se asigna al otro brazo. La probabilidad sería constante y conocida: 1/2. En la actualidad se suele efectuar la asignación utilizando programas de ordenador y se realiza antes del inicio del estudio bien con una tabla o con un generador de números aleatorios oculto al investigador.

Aleatorización simple

Ventajas Inconvenientes

•Sencillez•Fácil realización

•Tamaño desigual de los brazos en muestras <100 sujetos.•Desigual distribución respecto a los factores de selección de la muestra en muestras pequeñas y ensayos de corta duración.•Imposibilita los análisis intermedios.•Grupos desequilibrados en

Page 23: Unidad 1 Tipos y Usos de Estadistica

estudios multicéntricos.2

Aleatorización restrictiva o equilibrada

La aleatorización restrictiva o equilibrada se realiza igual que la asignación

aleatoria simple pero en ésta se asegura que el número de sujetos de cada

brazo del ensayo sea el mismo, con lo cual se facilita el análisis de los

resultados. El número de sujetos se puede determinar de forma global o

creando bloques con aleatorización interna y entre ellos, pero que pueden o no

ser iguales entre sí; teniendo cada elección sus ventajas e inconvenientes.

Aleatorización restrictiva

Tipo Ventajas Inconvenientes

Aleatorización restrictiva global

•Aumenta la potencia estadística.

•Es desequilibrada en los estudios multicéntricos.

Aleatorización restrictiva por bloques

•Equilibrada en los estudios multicéntricos.

•Problemas en cuanto a la elección del tamaño de los bloques

Aleatorización estratificada

Cuando alguno de los factores pronósticos presenta gradientes en su definición

(por ejemplo pacientes con enfermedad leve o grave), la aleatorización simple o la

equilibrada no puede asegurar la adecuada distribución de estos gradientes en

cada brazo del estudio. La aleatorización estratificada clasifica los pacientes en

diferentes estratos o categorías según determinados criterios pronósticos

conocidos antes de la asignación aleatoria. Los pacientes de cada categoría son

asignados de forma independiente a cada brazo del estudio mediante un

procedimiento de aleatorización propio. De esta manera se consigue que los

grupos contengan aproximadamente el mismo número de sujetos en cada

gradiente definido.

Page 24: Unidad 1 Tipos y Usos de Estadistica

Aleatorización estratificada

Ventajas Inconvenientes

•Útil en ensayos pequeños•En estudios multicéntricos cada centro puede ser un estrato.•Asegura la correcta aleatorización cuando hay gradientes.

•Muchos gradientes obligan a un elevado número de estratos, lo que dificulta la realización del ensayo.3

Aleatorización por grupos

También conocida como aleatorización por agregados o cluster design (del

inglés, diseño agrupado), esta técnica agrupa a sujetos heterogéneos entre sí

en grupos que se consideran como sujetos individuales de cara al estudio. La

homogeneización se realiza entre los grupos seleccionados al igual que la

selección delgrupo de control. Esta técnica es útil para valorar la utilidad de

programas de educación para la salud u otros proyectos en los que exista un

gran número de factores pronósticos con la presencia de varios gradientes en

los mismos. Así, si por ejemplo queremos valorar la eficacia de un anuncio

televisivo para evitar los accidentes de tráfico, los factores pronósticos serían

muy variados (edad, sexo, raza, grupo cultural, conducir con o sin licencia,

etc.) al igual que los gradientes presentes (antigüedad en la licencia, nivel

cultural, duración de la conducción, etc.). Igualmente habría que tener en

cuenta la interacción de los individuos en el trabajo, la compra o el colegio, al

hablar del anuncio entre ellos. Las técnicas habituales serían muy inexactas o

prácticamente imposibles de implementar. En este caso se podría coger como

sujetos individuales los pueblos. Se realizaría el estudio en cada pueblo y se

compararían los resultados entre ellos. Así, en unos se divulgaría el anuncio

televisivo, mientras que en otros no (grupo de control), siendo la selección de

los pueblos por sus características similares. Otros ejemplos de grupos

podrían ser colegios, o empresas, etc.

Aleatorización por grupos

Page 25: Unidad 1 Tipos y Usos de Estadistica

Ventajas Inconvenientes

•Evalúan intervenciones de efecto grupal•Han mejorado mucho la eficacia de programas de salud, educativos, etc.

•Dificultad para determinar el tamaño muestral•Menor potencia estadística•No permite llegar a conclusiones respecto a individuos.

ENSAYO CLINICO PARALELO Y CRUZADO

En los estudios paralelos los diferentes grupos en estudio participan en el mismo de forma simultánea, se realiza el seguimiento a lo largo de la duración del estudio en todos los grupos a la vez. En los estudios cruzados los mismos individuos reciben dos o más tratamientos en diferentes periodos, de forma que cada uno de ellos sirve como su propio control.

En determinadas circunstancias, cuando la variabilidad intraindividual es inferior a la interindividual, el ensayo clínico cruzado parece el más adecuado para aumentar la sensibilidad del estudio y reducir el número de pacientes necesario para responder a la hipótesis. Incluso puede pensarse que es lo más parecido a la práctica clínica habitual, en la que se utilizan diferentes fármacos en un mismo paciente, hasta que se encuentra el que mejor funciona en una determinada persona.

Sin embargo, es un diseño que puede presentar algunos problemas. En primer lugar, solo puede usarse en enfermedades relativamente estables, con una evolución lenta, de forma que en los diferentes periodos de estudio la enfermedad no haya cambiado, siga siendo comparable. Por tanto, no es útil este diseño en el estudio de la eficacia de un tratamiento en enfermedades agudas o autolimitadas, o en aquellas que se curen al aplicar un determinado tratamiento (por ejemplo, muchas infecciones). Tampoco tiene sentido en los estudios en los que la variable de medida principal es la supervivencia o la aparición de un suceso irreversible (infarto, ACV...).

En segundo lugar, es necesario establecer un periodo de lavado suficientemente largo entre los diferentes tratamiento, con el fin de que no quede un efecto residual del tratamiento previo cuando se empieza a utilizar el nuevo. En cualquier caso,

Page 26: Unidad 1 Tipos y Usos de Estadistica

puede haber un aprendizaje como consecuencia de la experiencia obtenida, de forma que las mediciones pueden variar a lo largo del tiempo.

Definitivamente, hoy en día este diseño cruzado se reserva para las primeras fases del desarrollo clínico de los fármacos (tolerancia, farmacodinamia, biodisponibilidad, búsqueda de dosis) o para estudios de bioequivalencia de genéricos.

Generalmente se usan en estudios con dosis únicas o con tratamientos de dosis múltiple pero de corta duración, y cuando el efecto se observa en un plazo breve de tiempo. Siempre hay que intentar equilibrar el diseño con respecto a la secuencia de los tratamientos y establecer periodos de lavado suficientes, cerciorándose de la ausencia de efectos residuales antes de la aplicación de los siguientes tratamientos.

En general, en las fases más tardías, sobre todo en fases III y IV, los estudios deben realizarse con grupos paralelos.

Como resumen de los diferentes métodos posibles en la investigación en ensayos clínicos, podemos decir que los diseños más comunes son los siguientes. Generalmente en la fase II del desarrollo de un fármaco, los ensayos clínicos son controlados y con asignación aleatoria del tratamiento, utilizándose con frecuencia el placebo. En la fase III suelen ser estudios controlados, aleatorizados, paralelos y enmascarados.

3.2.3 ENSAYOS DE INTERVENCION COMUNITARIA

realiza ensayos de intervención comunitaria para demostrar hasta qué punto puede ser efectiva una solución en particular al problema que se busca resolver. En sus formas más simples, se trata de una comparación de resultados dentro de un grupo de comunidades con la situación de una comunidad o un grupo de comunidades similares en las que no se ha implementado la solución.

Lo primero que hacemos es realizar un estudio preliminar en todas las comunidades que puedan verse involucradas en el estudio. Luego, siempre que sea posible, le asignamos el estado de ‘intervención’ o ‘control’ a cada comunidad de forma aleatoria, sirviéndonos de los datos iniciales para asegurarnos de que exista un equilibrio entre ambos grupos. Cuando son aleatorizados, los ensayos de intervención comunitaria se denominan ensayos controlados aleatorizados por conglomerados (ECAC). Se aplique o no la aleatorización, si la solución resulta ser benéfica, nuestro compromiso es extender su aplicación a todas las comunidades que formen parte de la muestra.

Page 27: Unidad 1 Tipos y Usos de Estadistica

UNIDAD 4 ESCALAS DE MEDICION

Se entenderá por medición al proceso de asignar el valor a una variable de un elemento en observación. Este proceso utiliza diversas escalas: nominal, ordinal, de intervalo y de razón.

Las variables de las escalas nominal y ordinal se denominan también categóricas, por otra parte las variables de escala de intervalo o de razón se denominan variables numéricas. Con los valores de las variables categóricas no tiene sentido o no se puede efectuar operaciones aritméticas. Con las variables numéricas sí.

La escala nominal sólo permite asignar un nombre al elemento medido. Esto la convierte en la menos informativa de las escalas de medición.

4.1 MEDIDAS DE TENDENCIA CENTRAL

Al describir grupos de observaciones, con frecuencia es conveniente resumir la información con un solo número. Este número que, para tal fin, suele situarse hacia el centro de la distribución de datos se denomina medida o parámetro de tendencia central o de centralización. Cuando se hace referencia únicamente a la posición de estos parámetros dentro de la distribución, independientemente de que ésta esté más o menos centrada, se habla de estas medidas como medidas de posición.1 En este caso se incluyen también los cuantiles entre estas medidas.

4.1.2 MEDIA ARITMETICA

La media aritmética es el valor obtenido por la suma de todos sus valores

dividida entre el número de sumadores.

Por ejemplo, las notas de 5 alumnos en una prueba:

niño nota 1 6,0 ·Primero, se suman las notas: 2 5,4 6,0+5,4+3,1+7,0+6,1 = 27,6 3 3,1 ·Luego el total se divide entre la cantidad de alumnos: 4 7,0 27,6/5=5,52 5 6,1

· La media aritmética en este ejemplo es 5,52

La media aritmética es, probablemente, uno de los parámetros estadísticos más

extendidos.2 Se le llama también promedio o, simplemente, medi

Page 28: Unidad 1 Tipos y Usos de Estadistica

Propiedades

Las principales propiedades de la media aritmética son:3

Su cálculo es muy sencillo y en él intervienen todos los datos.

Su valor es único para una serie de datos dada.

Se usa con frecuencia para comparar poblaciones, aunque es más apropiado

acompañarla de una medida de dispersión.

Se interpreta como "punto de equilibrio" o "centro de masas" del conjunto de

datos, ya que tiene la propiedad de equilibrar las desviaciones de los datos

respecto de su propio valor:

Minimiza las desviaciones cuadráticas de los datos respecto de cualquier

valor prefijado, esto es, el valor de   es mínimo

cuando  . Este resultado se conoce como Teorema de König. Esta

propiedad permite interpretar uno de los parámetros de dispersión más

importantes: la varianza.

Se ve afectada por transformaciones afines (cambios de origen y escala),

esto es, si

 entonces  , donde   es la media aritmética de

los  , para i = 1, ..., n y a y b números reales.

Es poco sensible a fluctuaciones muestrales, por lo que es un

parámetro muy útil en inferencia estadística.INCONVENIENTES

Este parámetro, aún teniendo múltiples propiedades que aconsejan su uso en situaciones muy diversas, tiene también algunos inconvenientes, como son:

Para datos agrupados en intervalos (variables continuas) su valor oscila en función de la cantidad y amplitud de los intervalos que se consideren.

Page 29: Unidad 1 Tipos y Usos de Estadistica

La estatura media como resumen de una población homogénea (abajo) o heterogénea (arriba).

Es una medida a cuyo significado afecta sobremanera la dispersión, de modo que cuanto menos homogéneos sean los datos, menos información proporciona. Dicho de otro modo, poblaciones muy distintas en su composición pueden tener la misma media.4 Por ejemplo, un equipo de baloncesto con cinco jugadores de igual estatura, 1,95 m, evidentemente, tendría una estatura media de 1,95 m, valor que representa fielmente a esta población homogénea. Sin embargo, un equipo de jugadores de estaturas más heterogéneas, 2,20 m, 2,15 m, 1,95 m, 1,75 m y 1,70 m, por ejemplo, tendría también, como puede comprobarse, una estatura media de 1,95 m, valor que no representa a casi ninguno de sus componentes.

En el cálculo de la media no todos los valores contribuyen de la misma manera. Los valores altos tienen más peso que los valores cercanos a cero. Por ejemplo, en el cálculo del salario medio de un empresa, el salario de un alto directivo que gane 10.000 € tiene tanto peso como el de diez empleados "normales" que ganen 1.000 €. En otras palabras, se ve muy afectada por valores extremos.

No se puede determinar si en una distribución de frecuencias hay intervalos de clase abiertos.

4.1.3 MEDIANA

La mediana es un valor de la variable que deja por debajo de sí a la mitad de los

datos, una vez que éstos están ordenados de menor a mayor.7 Por ejemplo, la

mediana del número de hijos de un conjunto de trece familias, cuyos respectivos

hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una vez ordenados

los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la posición central es 2:

En caso de un número par de datos, la mediana no correspondería a ningún

valor de la variable, por lo que se conviene en tomar como mediana el valor

intermedio entre los dos valores centrales. Por ejemplo, en el caso de doce

datos como los siguientes:

Page 30: Unidad 1 Tipos y Usos de Estadistica

Se toma como mediana 

Existen métodos de cálculo más rápidos para datos más numerosos (véase

el artículo principal dedicado a este parámetro). Del mismo modo, para

valores agrupados en intervalos, se halla el "intervalo mediano" y, dentro

de éste, se obtiene un valor concreto por interpolación.

Cálculo de la mediana para datos agrupados[editar]

Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla del

margen derecho).

Así, aplicando la fórmula asociada a la mediana para n impar,

obtenemos X(39+1)/2 = X20 y basándonos en la fórmula que hace

referencia a las frecuencias absolutas:

Ni-1< n/2 < i = N19 < 19.5 < N20

Por tanto la mediana será el valor de la variable que ocupe el vigésimo

lugar. En nuestro ejemplo, 21 (frecuencia absoluta acumulada para Xi = 5)

> 19.5 con lo que Me = 5 puntos (es aconsejable no olvidar las unidades; en

este caso como estamos hablando de calificaciones, serán puntos)

La mitad de la clase ha obtenido un 5 o menos, y la otra mitad un 5 o más.

Ejemplo (N par)

Las calificaciones en la asignatura de Matemáticas de 38

alumnos de una clase viene dada por la siguiente tabla

(debajo):

Calificaciones 1 2 3 4 5 6 7 8 9

Número de alumnos 2 2 4 5 6 9 4 4 2

Calculemos la Mediana:

Primero hallamos las frecuencias absolutas acumuladas Fi (ver

tabla margen derecho).

Si volvemos a utilizar la fórmula asociada a la mediana

para n par, obtenemos X(38/2) = X19 y basándonos en la

fórmula que hace referencia a las frecuencias absolutas --> Ni-1< n/2

< Ni = N18 < 19 < N19

Con lo cual la mediana será la media aritmética de los valores de la

variable que ocupen el decimonoveno y el vigésimo lugar.

xi fi Fi

1 2 2

2 2 4

3 4 8

4 5 13

5 6 19 = 19

6 9 28

7 4 32

8 4 36

9 2 38

Page 31: Unidad 1 Tipos y Usos de Estadistica

En nuestro ejemplo, el lugar decimonoveno lo ocupa el 5 y el vigésimo el 6,

(desde el vigésimo hasta el vigésimo octavo)

con lo que Me = (5+6)/2 = 5,5 puntos.

Propiedades e inconvenientes

Las principales propiedades de la mediana son:8

Es menos sensible que la media a oscilaciones de los valores de la

variable. Un error de transcripción en la serie del ejemplo anterior en,

pongamos por caso, el último número, deja a la mediana inalterada.

Como se ha comentado, puede calcularse para datos agrupados en

intervalos, incluso cuando alguno de ellos no está acotado.

No se ve afectada por la dispersión. De hecho, es más representativa

que la media aritmética cuando la población es bastante heterogénea.

Suele darse esta circunstancia cuando se resume la información sobre

los salarios de un país o una empresa. Hay unos pocos salarios muy

altos que elevan la media aritmética haciendo que pierda

representatividad respecto al grueso de la población. Sin embargo,

alguien con el salario "mediano" sabría que hay tanta gente que gana

más dinero que él, como que gana menos.

Sus principales inconvenientes son que en el caso de datos agrupados en

intervalos, su valor varía en función de la amplitud de estos. Por otra parte,

no se presta a cálculos algebraicos tan bien como la media aritmética.

4.1.4 MODA

La moda es el dato más repetido de la encuesta, el valor de la variable con

mayor frecuencia absoluta.5 En cierto sentido la definición matemática

corresponde con la locución "estar de moda", esto es, ser lo que más se lleva.

Su cálculo es extremadamente sencillo, pues solo necesita un recuento. En

variables continuas, expresadas en intervalos, existe el denominado intervalo

modal o, en su defecto, si es necesario obtener un valor concreto de la variable, se

recurre a la interpolación.

Por ejemplo, el número de personas en distintos vehículos en una carretera: 5-7-4-

6-9-5-6-1-5-3-7. El número que más se repite es 5, entonces la moda es 5.

Page 32: Unidad 1 Tipos y Usos de Estadistica

Hablaremos de una distribución bimodal de los datos, cuando encontremos dos

modas, es decir, dos datos que tengan la misma frecuencia absoluta máxima.

Cuando en una distribución de datos se encuentran tres o más modas, entonces

es multimodal. Por último, si todas las variables tienen la misma frecuencia

diremos que no hay moda.

Cuando tratamos con datos agrupados en intervalos, antes de calcular la moda, se

ha de definir el intervalo modal. El intervalo modal es el de mayor frecuencia

absoluta.

La moda, cuando los datos están agrupados, es un punto que divide el intervalo

modal en dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que

verifiquen que:

Siendo   la frecuencia absoluta del intervalo modal y   y   las

frecuencias absolutas de los intervalos anterior y posterior, respectivamente, al

intervalo modal.

Las calificaciones en la asignatura de Matemáticas de 39 alumnos de una

clase viene dada por la siguiente tabla (debajo):

Calificaciones 1 2 3 4 5 6 7 8 9

Número de alumnos 2 2 4 5 8 9 3 4 2

Propiedades

Sus principales propiedades son:

Cálculo sencillo.

Interpretación muy clara.

Al depender solo de las frecuencias, puede calcularse para variables

cualitativas. Es por ello el parámetro más utilizado cuando al resumir una

población no es posible realizar otros cálculos, por ejemplo, cuando se

enumeran en medios periodísticos las características más frecuentes de

determinado sector social. Esto se conoce informalmente como "retrato

robot".6

Inconvenientes

Su valor es independiente de la mayor parte de los datos, lo que la hace

muy sensible a variaciones muestrales. Por otra parte, en variables

Page 33: Unidad 1 Tipos y Usos de Estadistica

agrupadas en intervalos, su valor depende excesivamente del número de

intervalos y de su amplitud.

Usa muy pocas observaciones, de tal modo que grandes variaciones en los

datos fuera de la moda, no afectan en modo alguno a su valor.

No siempre se sitúa hacia el centro de la distribución.

Puede haber más de una moda en el caso en que dos o más valores de la

variable presenten la misma frecuencia (distribuciones bimodales o

multimodales).

4.2 MEDIDAS DE DISPERSION

Las medidas de dispersión, también llamadas medidas de variabilidad, muestran la variabilidad de una distribución, indicando por medio de un número si las diferentes puntuaciones de una variable están muy alejadas de la media. Cuanto mayor sea ese valor, mayor será la variabilidad, y cuanto menor sea, más homogénea será a la media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos.

Para calcular la variabilidad que una distribución tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmética. Pero la suma de las desviaciones es siempre cero, así que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (desviación media) y otra es tomando las desviaciones al cuadrado (varianza).

4.2.1 AMPLITUD(RANGO)

Requisitos del rango

Ordenamos los números según su tamaño.

Restamos el valor mínimo del valor máximo

Ejemplo

Para la muestra (8, 7, 6, 9, 4, 5), el dato menor es 4 y el dato mayor es 9. Sus

valores se encuentran en un rango de:

Page 34: Unidad 1 Tipos y Usos de Estadistica

Medio rango o Rango medio

El medio rango o rango medio de un conjunto de valores numéricos es la

media del mayor y menor valor, o la tercera parte del camino entre el dato

de menor valor y el dato de mayor valor. En consecuencia, el medio

rango es:

Ejemplo

Para una muestra de valores (3, 3, 5, 6, 8), el dato de menor valor Min= 3 y

el dato de mayor valor Max= 8. El medio rango resolviéndolo mediante la

correspondiente fórmula sería:

Representación del medio rango: 

4.2.2. VARIANZA

La varianza es una medida estadística que mide la dispersión de los valores respecto a un

valor central (media), es decir, es el cuadrado de las

desviaciones: 

Propiedades

La varianza es siempre positiva o 0: 

Page 35: Unidad 1 Tipos y Usos de Estadistica

Si a los datos de la distribución les sumamos una cantidad constante la varianza no se

modifica.

1 c 

Si a los datos de la distribución los multiplicamos por una constante, la varianza queda

multiplicada por el cuadrado de esa constante.

Propiedad distributiva:   ,

siempre y cuando las variables   y   sean independiente

La varianza a veces no se interpreta claramente, ya que se mide en unidades

cuadráticas. Para evitar ese problema se define otra medida de dispersión, que es

la desviación típica, o desviación estándar, que se halla como la raíz cuadrada

positiva de la varianza. La desviación típica informa sobre la dispersión de los

datos respecto al valor de la media; cuanto mayor sea su valor, más dispersos

estarán los datos. Esta medida viene representada en la mayoría de los casos por

S, dado que es su inicial de su nominación en inglés.

Desviación típica muestral

S = \sqrt{\frac{\sum_{i=1}^n (x_i - \bar{x})^2}{n-1}}

Desviación típica poblacional

\sigma = \sqrt{\frac{\sum_{i=1}^n fi (X_i - \mu)^2}{n}}

-->x = [17 14 2 5 8 7 6 8 5 4 3 15 9]

x = 17. 14. 2. 5. 8. 7. 6. 8. 5. 4. 3. 15. 9.

-->stdev(x)

ans = 4.716311

Page 36: Unidad 1 Tipos y Usos de Estadistica

-->

Primero hemos declarado un vector con nombre X, donde introducimos los

números de la serie. Luego con el comando stdev se hallará la desviación típica.

4.2.3 DESVIO ESTANDAR

La desviación típica o desviación estándar (denotada con el símbolo σ o s, dependiendo de la procedencia del conjunto de datos) es una medida de dispersión para variables de razón (variables cuantitativas o cantidades racionales) y de intervalo. Se define como la raíz cuadrada de la varianza de la variable.

Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de tendencia central, sino que necesitamos conocer también la desviación que presentan los datos en su distribución respecto de la media aritmética de dicha distribución, con objeto de tener una visión de los mismos más acorde con la realidad al momento de describirlos e interpretarlos para la toma de decisiones.

La desviación típica es una medida del grado de dispersión de los datos con respecto al valor promedio. Dicho de otra manera, la desviación estándar es simplemente el "promedio" o variación esperada con respecto a la media aritmética.

Por ejemplo, las tres muestras (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8) cada una tiene una media de 7. Sus desviaciones estándar muestrales son 7, 5 y 1 respectivamente. La tercera muestra tiene una desviación mucho menor que las otras dos porque sus valores están más cerca de 7.

La desviación estándar puede ser interpretada como una medida de incertidumbre. La desviación estándar de un grupo repetido de medidas nos da la precisión de éstas. Cuando se va a determinar si un grupo de medidas está de acuerdo con el modelo teórico, la desviación estándar de esas medidas es de vital importancia: si la media de las medidas está demasiado alejada de la predicción (con la distancia medida en desviaciones estándar), entonces consideramos que las medidas contradicen la teoría. Esto es coherente, ya que las mediciones caen fuera del rango de valores en el cual sería razonable esperar que ocurrieran si el modelo teórico fuera correcto. La desviación estándar es uno de tres parámetros de ubicación central; muestra la agrupación de los datos alrededor de un valor central (la media o promedio).

Page 37: Unidad 1 Tipos y Usos de Estadistica

4.2.3. MEDIDAS DE POSICION

Las medidas de posición  d iv iden un conjunto de datos

en grupos con el mismo número de indiv iduos.

Para calcular las  medidas de posición  es necesar io

que los datos  estén ordenados de  menor a mayor .

La medidas de posición  son:

Cuartiles

Los cuarti les  son los  tres valores  de la var iable

quedividen  a un conjunto  de datos ordenados  en cuatro

partes iguales .

Q1, Q2 y Q3 determinan los valores correspondientes

al 25%, al 50% y al 75%  de losdatos .

Q2 coincide con la mediana .

Cálculo de los cuartiles

1 Ordenamos   los datos  de menor a mayor .

2 Buscamos el lugar que ocupa cada  cuartil  mediante la

expresión  .

Page 38: Unidad 1 Tipos y Usos de Estadistica

Número impar de datos

2, 5, 3, 6, 7, 4, 9

Número par de datos

2, 5, 3, 4, 6, 7, 1, 9

Cálculo de los cuartiles para datos agrupados

En primer lugar buscamos la clase  donde se

encuentra  , en la tabla de las frecuencias

acumuladas .

L i  es el l ímite inferior de la clase donde se encuentra la

mediana.

Page 39: Unidad 1 Tipos y Usos de Estadistica

N es la suma de las frecuencias absolutas.

F i - 1 es la frecuencia acumulada  anterior a la clase

mediana.

a i  es la amplitud de la clase.

Ejercicio de cuartiles

Calcular los cuartiles  de la distribución de la tabla:

f i F i

[50, 60) 8 8

[60, 70) 10 18

[70, 80) 16 34

[80, 90) 14 48

[90, 100) 10 58

[100, 110) 5 63

Page 40: Unidad 1 Tipos y Usos de Estadistica

[110, 120) 2 65

65

Cálculo del primer cuartil

Cálculo del segundo cuartil

Cálculo del tercer cuartil

Deciles

Page 41: Unidad 1 Tipos y Usos de Estadistica

Los deciles  son los nueve valores  que dividen   la serie

de datos  en diez partes iguales .

Los deciles  dan los valores correspondientes al 10%, al

20%... y al 90% de los datos.

D5 coincide con la mediana .

Cálculo de los deciles

En primer lugar buscamos la clase donde se

encuentra  , en la tabla de las frecuencias

acumuladas.

L i  es el l ímite inferior de la clase donde se encuentra la

mediana.

N es la suma de las frecuencias absolutas.

F i - 1 es la frecuencia acumulada  anterior a la clase

mediana.

a i  es la amplitud de la clase.

Page 42: Unidad 1 Tipos y Usos de Estadistica

Ejercicio de deciles

Calcular los deciles  de la distribución de la tabla:

f i F i

[50, 60) 8 8

[60, 70) 10 18

[70, 80) 16 34

[80, 90) 14 48

[90, 100) 10 58

[100, 110) 5 63

[110, 120) 2 65

65

Cálculo del primer decil

Page 43: Unidad 1 Tipos y Usos de Estadistica

Cálculo del segundo decil

Cálculo del tercer decil

Cálculo del cuarto decil

Cálculo del quinto decil

Page 44: Unidad 1 Tipos y Usos de Estadistica

Cálculo del sexto decil

Cálculo del séptimo decil

Cálculo del octavo decil

Cálculo del noveno decil

Page 45: Unidad 1 Tipos y Usos de Estadistica

Percentiles

Los percentiles  son los 99 valores  que dividen   la serie

de datos en 100 partes iguales .

Los percentiles  dan los valores correspondientes al 1%,

al 2%... y al 99% de los datos.

P50  coincide con la mediana .

Cálculo de los percentiles

En primer lugar buscamos la clase donde se

encuentra  , en la tabla de las frecuencias

acumuladas.

L i  es el l ímite inferior de la clase donde se encuentra la

mediana.

N es la suma de las frecuencias absolutas.

F i - 1 es la frecuencia acumulada  anterior a la clase

mediana.

Page 46: Unidad 1 Tipos y Usos de Estadistica

a i  es la amplitud de la clase.

Ejercicio de percentiles

Calcular el percentil 35 y 60  de la distribución de la

tabla:

f i F i

[50, 60) 8 8

[60, 70) 10 18

[70, 80) 16 34

[80, 90) 14 48

[90, 100) 10 58

[100, 110) 5 63

[110, 120) 2 65

65

Page 47: Unidad 1 Tipos y Usos de Estadistica

Percentil 35

Percentil 60

UNIDAD 5 PRECISION Y VALIDEZ DE LOS ESTUDIOS EPIDEMILOGICOS

1. Objetivos

- Comprender el rol de la causalidad en estudios epidemiológicos.

- Comprender el proceso de las inferencias causales basadas en resultados de estudios epidemiológicos.

- Conocer las fuentes más importantes de error en los estudios epidemiológicos y cómo éstos se minimizan.

2. Términos Claves: Inferencia causal, error aleatorio, confusión, sesgo, modificación del efecto

3. Desarrollo del módulo

3.1. Causalidad

Uno de los principales objetivos de la investigación epidemiológica es establecer las causas del fenómeno de interés. Una “causa” de enfermedad desde el punto de vista epidemiológico es un evento, condición, característica o una combinación de estos factores que juegan un papel importante en el desarrollo de la

Page 48: Unidad 1 Tipos y Usos de Estadistica

enfermedad. La epidemiología ocupacional, se orienta a la identificación de las causas de las enfermedades y lesiones resultantes de las exposiciones ocurridas en el sitio de trabajo.

5.1 PRECISION

Carencia de error aleatorio y se corresponde con la reducción del error debido al azar. Para reducir este error el elemento más importante del que disponemos es incrementar el tamaño de la muestra y con ello aumentamos la precisión. Los intervalos de confianza y el error estándar se reducen al aumentar el tamaño muestral. Es por tanto necesario desde un principio preocuparse por el tamaño muestral del estudio que vamos a realizar definiendo la precisión y la seguridad del mismo. La precisión también se puede mejorar modificando el diseño del estudio para aumentar la eficiencia de la información que obtengo de los sujetos del estudio.

5.1.1 ERRORES ALEATORIOS

Es un error al azar, es inevitable, se produce por eventos únicos imposibles de controlar durante el proceso de medición. Ejemplo: en un estudio de investigación, el error aleatorio puede ocurrir por tomar sólo una muestra de una población para hacer inferencias.

5.2 VALIDEZ

La validez interna se refiere a que los resultados del estudio sean atribuidos sólo al efecto bajo investigación. Esto es posible cuando todas las fuentes de error han sido reducidas al mínimo en las etapas de diseño, implementación y análisis del estudio. La validez externa se refiere a que los resultados del estudio sean generalizables, esto es, cuando un estudio produce inferencias imparciales con respecto a una población objetivo. Por ejemplo, los resultados de un estudio realizado en hombres podrían no ser generalizables en mujeres, quienes también forman parte de la misma población objetivo desde dónde los hombres vinieron.

VALIDEZ EN LOS ESTUDIOS EPIDEMIOLÓGICOS Se distinguen dos principales tipos de validez de estudio son: la interna y la externa. La validez consiste en la correspondencia (concordancia) o correlación entre lo que se mide y lo que se pretende medir.

Validez externa La validez externa se refiere a la extensión y forma en que los resultados de un experimento pueden ser generalizados a diferentes sujetos, poblaciones, lugares, experimentadores. Validez interna se refiere a que los resultados del estudio sean atribuidos sólo al efecto bajo investigación. Es posible

Page 49: Unidad 1 Tipos y Usos de Estadistica

cuando las fuentes de error han sido reducidas al mínimo en las etapas de diseño, implementación y análisis del estudio.

Al reducir al mínimo los errores, en las etapas de planificación y de ejecución de la indagación, el investigador puede emitir conclusiones, a partir de resultados con una mayor exactitud y precisión. Sólo las investigaciones con resultados válidos son útiles para el proceso de inferencia causal.

5.2.1 ERRORES SISTEMATICOS

Es aquel que se produce de igual modo en las mediciones, que se realizan de una magnitud, en otras palabras, es el efecto de un error que ocurre de manera persistente o constante. Puede estar originado en un defecto del instrumento, en una particularidad del operador o del proceso de medición u observación.

5.2.2 FACTORES DE CONFUSION

La confusión es otra fuente de error en los estudios epidemiológicos. Ocurre cuando hay un tercera variable que puede causar la enfermedad en estudio y que a su vez está asociada con el factor de riesgo bajo investigación. A menos que sea posible ajustar el efecto de confusión de esta tercera variable, sus efectos no pueden distinguirse de los del factor de riesgo en estudio.

La confusión tiene el mismo efecto sobre los cálculos de riesgo que el sesgo. Produciendo una desviación de los cálculos de riesgo del verdadero valor, aunque no es un sesgo.

UNIDAD 6 EVALUACION DE PROYECTO DE INVESTIGACION

En gestión de proyectos, la evaluación de proyectos es un proceso por el cual se determina el establecimiento de cambios generados por un proyecto a partir de la comparación entre el estado actual y el estado previsto en su planificación. Es decir, se intenta conocer qué tanto un proyecto ha logrado cumplir sus objetivos o bien qué tanta capacidad poseería para cumplirlos.

En una evaluación de proyectos siempre se produce información para la toma de decisiones, por lo cual también se le puede considerar como una actividad orientada a mejorar la eficacia de los proyectos en relación con sus fines, además de promover mayor eficiencia en la asignación de recursos. En este sentido, cabe precisar que la evaluación no es un fin en sí misma, más bien es un medio para optimizar la gestión de los proyectos.

TIPOS DE EVALUACION

Page 50: Unidad 1 Tipos y Usos de Estadistica

Según el nivel de gestión

La evaluación de proyectos la podemos clasificar de la siguiente manera:

Política-Estratégica: La parte política verá la parte social y política, su consistencia para trascender en el tiempo y que sea en cierta forma equitativo.

Administrativa: En el caso administrativo, el fin siempre es la mayor racionalización de todos los recursos, el logro de sus planes, objetivos, metas, actividades, programas; expresión de la eficiencia y eficacia en su mayor expresión.

Técnica: Lo técnico es una mezcla de lo anterior y lo propio, ya que incide hoy en día al mejor logro de los dos puntos anteriores, por el avance en los descubrimientos, su rapidez, medición y precisión. Ya dependerá de cada ciencia que enfoque científico y técnico aplicarán.

Según la naturaleza de la evaluación

La evaluación de proyectos puede ser vista de dos ópticas diferentes:

Evaluación privada: Que incluye a la "evaluación económica" que asume que el proyecto está totalmente financiado con capital propio, por lo que no hay que pedir crédito, y por otro lado la evaluación financiera, que incluye financiamiento externo.

Evaluación social: En la evaluación social, tanto los beneficios como los costos se valoran a precios sombra de eficiencia. Aquí interesa los bienes y servicios reales utilizados y producidos por el proyecto.

Según el momento en que se realiza

La evaluación en el ciclo de proyectos.

Los distintos tipos de evaluación varían según el momento en que se realicen. Los tipos de evaluación son: ex-ante, de proceso, ex-post y de impacto.1 2 3 4

Evaluación supervisada: Se efectúa antes de la aprobación del proyecto y busca conocer su pertinencia, viabilidad y eficacia potencial. Este tipo de evaluación consiste en seleccionar de entre varias alternativas técnicamente factibles a la que produce el mayor impacto al mínimo costo.2 Este tipo de evaluación supone la incorporación de ajustes necesarios en el diseño del proyecto, lo cual podría generar incluso el cambio del grupo beneficiario, su jerarquía de objetivos y el presupuesto.4

Page 51: Unidad 1 Tipos y Usos de Estadistica

Evaluación de proceso, operativa, de medio término o contínua: Se hace mientras el proyecto se va desarrollando y guarda estrecha relación con el monitoreo del proyecto. Permite conocer en qué medida se viene logrando el logro de los objetivos (Resultados en caso de marco lógico); en relación con esto, una evaluación de este tipo debe buscar aportar al perfeccionamiento del modelo de intervención empleado y a identificar lecciones aprendidas. Las fuentes financieras suelen requerir la realización de este tipo de evaluación para ejecutar los desembolsos periódicos.

Evaluación ex-post, de resultados o de fin de proyecto: Se realiza cuando culmina el proyecto. Se enfoca en indagar el nivel de cumplimiento de los objetivos (Propósito y Resultados en caso de marco lógico) asimismo busca demostrar que los cambios producidos son consecuencia de las actividades del proyecto (exclusivamente o en interacción con otras fuentes); para esto suele recurrir a un diseño experimental. No solo indaga por cambios positivos, también analiza efectos negativos e inesperados.

Evaluación de impacto: Es la que indaga por los cambios permamentes y las mejoras de la calidad de vida producidos por el proyecto, es decir, se enfoca en conocer la sostenibilidad de los cambios alcanzados y los efectos imprevistos (positivos o negativos). En caso de diseño con marco lógico, se enfoca en la evaluación del Fin de la jerarquía de objetivos. Esta evaluación necesariamente debe ser realizada luego de un tiempo de culminado el proyecto y no inmediatamente éste concluya;5 el tiempo recomendado para efectuar la evaluación de impacto es de 5 años.4

Cabe considerar que las evaluaciones ex-ante y de proceso son consideradas como evaluaciones formativas debido a que se producen mientras se da la preparación y/o ejecución del proyecto y sus conclusiones sirven para optimizar la ejecución del mismo; en tanto que las evaluaciones de resultados y de impacto vienen a ser evaluaciones sumativas que ocurren al culminar el proyecto e incluso un tiempo después de haber culminado, ocurriendo que sus conclusiones servirán para ser transferidas a otras experiencias pero ya no podrán tener una aplicación directa en el proyecto que ha concluido.6

Las evaluaciones de resultados y de impacto requieren asumir un diseño específico de investigación, como se verá más adelante.

CRITERIOS UTILIZADOS PARA LA EVALUACION DE PROYECTOS

La evaluación de los proyectos, en sus distintos tipos, contempla una serie de criterios base que permiten establecer sus conclusiones. En función del campo, empresa u organización de que se trate, es que se emplearán una serie de

Page 52: Unidad 1 Tipos y Usos de Estadistica

criterios u otros que guarden relación con los objetivos estratégicos que se persigan.

No existen criterios únicos, por lo general los criterios surgen en función de la naturaleza de cada proyecto; sin embargo, en la mayoría de casos se toman en cuenta los siguientes cinco criterios definidos por la OECD para la cooperación internacional: la pertinencia ("relevance"), eficacia ("effectiveness"), eficiencia ("efficiency"), impacto ("impact") y sostenibilidad ("sustainability").7 8 4

Pertinencia o relevancia: Observa la congruencia entre los objetivos del proyecto y las necesidades identificadas y los intereses de la población e instituciones (consenso social). Se observa especialmente en la evaluación ex-ante pero también en los demás tipos de evaluación.

Eficacia: Medida en que se lograron o se espera lograr los objetivos de la intervención, tomando en cuenta su importancia relativa. Se observa en las evaluaciones de tipo contínuas y ex-post.

Eficiencia: Medida en que los recursos/insumos fondos, tiempo, etc.) se han convertido en los resultados del proyecto. Este criterio es usual en el análisis costo-beneficio realizado en la evaluación ex-ante.

Impacto: Efectos de largo plazo positivos y negativos, primarios y secundarios, producidos directa o indirectamente por una intervención para el desarrollo, intencionalmente o no.

Sostenibilidad: Medida en que los cambios logrados por el proyecto continúen y permanecen en el tiempo a favor de la población y/o las instituciones, una vez que la intervención ha finalizado.9 Suele considerarse en las evaluaciones de impacto.

Es fundamental considerar la evaluación desde las propias necesidades, y alcances de las acciones para con la población meta.

REQUISITOS QUE DEBES CUMPLIR

Toda evaluación cumpla algunos requisitos metodológicos para garantizar que la información que genere puede ser usada en la toma de decisiones.1 10 Así, se espera que todo proceso de evaluación sea:

Objetivo: Debe medirse y analizarse los hechos definidos tal como se presentan.

Imparcial: La generación de conclusiones del proceso de evaluación debe ser neutral, transparente e imparcial. Quienes realizan la evaluación no deben tener intereses personales o conflictos con la unidad ejecutora del proyecto.

Page 53: Unidad 1 Tipos y Usos de Estadistica

Valido: Debe medirse lo que se ha planificado medir, respetando las definiciones establecidas. En caso el objeto de análisis sea demasiado complejo para una medición objetiva, debe realizarse una aproximación cualitativa inicial.

Confiable: Las mediciones y observaciones deben ser registradas adecuadamente, preferentemente recurriendo a verificaciones in-situ.

Creíble:Todas las partes involucradas en el proyecto deben tener confianza en la idoneidad e imparcialidad de los responsables de la evaluación, quienes a su vez deben mantener una política de transparencia y rigor profesional.

Oportuno: Debe realizarse en el momento adecuado, evitando los efectos negativos que produce el paso del tiempo.

Útil: Debe ser útil y elaborarse en un lenguaje conciso y directo, entendible para todos los que accedan a la información elaborada, los resultados de una evaluación no deben dirigirse sólo a quienes tienen tienen altos conocimientos técnicos sino que debe servir para que cualquier involucrado pueda tomar conocimiento de la situación del proyecto.

Participativo:Debe incluirse a todos los involucrados en el proyecto, buscando de reflejar sus experiencias, necesidades, intereses y percepciones.

Retroalimentador:Un proceso de evaluación debe garantizar la diseminación de los hallazgos y su asimilación por parte de los involucrados en el proyecto (desde las altas esferas hasta los beneficiarios), para así fomentar el aprendizaje organizacional.

Costo/eficaz:La evaluación debe establecer una relación positiva entre su costo (económico, de tiempo y recursos) y su contribución en valor agregado para la experiencia de los involucrados en el proyecto.

DISEÑO DE EVALUACION

En general, cualquier forma de evaluación de proyectos se basa en los conceptos

y procedimientos de la metodología de la investigación científica,11 sin embargo

cabe precisar que cuando se efectúa una evaluación de proyectos de tipo de

resultado o de impacto es necesario asumir un diseño específico de

investigación. Alguno de estos diseños son los siguientes:12

Evaluación sólo después

Es un diseño simple que carece de línea de base. Su principal defecto es tener

poca capacidad para explicar los efectos alcanzados por un proyecto.

Page 54: Unidad 1 Tipos y Usos de Estadistica

Su esquema es el siguiente:

.......... X .......... A1

Donde:

"X" es la intervención del proyecto

"A1" es la población objetivo del proyecto al final de la intervención

Evaluación simple antes y después

Este diseño permite comparar la situación incial de la población objetivo contra la

situación final, es decir luego de realizado el proyecto. La relación causa-efecto

entre el proyecto y sus resultados es más clara pero aún no es precisa ya que

pueden haber intervenido causas externas no controladas.

Su esquema es el siguiente:

A .......... X .......... A1

Donde:

"X" es la intervención del proyecto

"A" es la línea de base (situación inicial de la población objetivo)

"A1" es la población objetivo del proyecto al final de la intervención

Diseño cuasiexperimental

Este diseño permite realizar una evaluación antes y después de la intervención del

proyecto, comparando los hallazgos además con un grupo control para los

resultados "después" de la intervención. La precisión de este diseño es mucho

mayor que el de los anteriores y por su viabilidad técnica es el más recomendado.

Su esquema es el siguiente:

A .......... X .......... A1......................... B

Donde:

"X" es la intervención del proyecto

"A" es la línea de base

Page 55: Unidad 1 Tipos y Usos de Estadistica

"A1" es la población objetivo del proyecto al final de la intervención

"B" es un grupo de comparación al finalizar el proyecto, con similares

características a la población objetivo y que no ha tenido una intervención

similar

Diseño experimental clásico

Este diseño permite también efectuar una comparación antes y después del

proyecto, pero además también permite efectuar una comparación antes y

después en grupos de similares características que no hayan estado influenciados

por una intervención similar a la del proyecto. Su capacidad de explicación es

bastante alta, pero sus costos y dificultad técnica también se incrementan.

Su esquema es el siguiente:

A .......... X .......... A1B ....................... B1

Donde:

"X" es la intervención del proyecto

"A" es la línea de base

"A1" es la población objetivo del proyecto al final de la intervención

"B" es un grupo de comparación antes del inicio del proyecto, similar al grupo

objetivo con el que se realizó la línea de base

"B1" es un grupo de comparación al finalizar el proyecto

Diseño experimental complejo

Es un diseño muy complicado, además de tener un altísimo costo, por lo que su

aplicación merece una fundamentación muy amplia. Con este tipo de estudios se

busca determinar la influencia de cada componente del proyecto, e incluso de la

combinación de diversos componentes en un proyecto.

Su esquema es el siguiente:

A .......... X .......... A1B .......... x1 ......... B1C .......... x2 ......... C1

Donde:

"X" es la intervención de un componente del proyecto.

Page 56: Unidad 1 Tipos y Usos de Estadistica

"A" es la línea de base del componente correspondiente

"A1" es la población objetivo del proyecto al final de la intervención,

independiente de los otros grupos de comparación

"X1" es la intervención de un segundo componente del proyecto

"B" es la línea de base del componente correspondiente

"B1" es un grupo de comparación al finalizar el proyecto, independiente de

los otros grupos de comparación

"X2" es la intervención de un tercer componente del proyecto

"C" es la línea de base del componente correspondiente

"C1" es un grupo de comparación al finalizar el proyecto, independiente de

los otros grupos de comparación

DIFICULTADES

La labor de evaluación de proyectos no es fácil y conlleva múltiples dificultades, muchas de ellas de orden metodológico pero también de orden político.

Falta de disponibilidad de información.

No contar con personal calificado para efectuar el trabajo.

Clientelismo de la población beneficiaria y de los encargados de la ejecución del proyecto.

Carencia de un sistema de evaluación y monitoreo, por lo que no se conoce el proceso desarrollado.

Resistencias de la comunidad. En este caso muchas veces ocurre que la población ha recibido muchas promesas incumplidas por parte de políticos de turno o bien se ha generado una expectativa muy alta frente al proyecto, por lo cual desarrolla una actitud contraria hacia éste; también se presentan resistencias debido a los prejuicios o ignorancia de los beneficiarios.13