Post on 17-Jan-2016
description
Muestreo
BENITO RAMÍREZ VALVERDE
bramirez@colpos.mx
analisis.estadistico.brv@gmail.com
La duda es la base de todo conocimiento.
R. Descartes
•Problema preliminar•Objetivos, justificación •Definición de variables•Hipótesis preliminar•Revisión conceptual •Problema •Redefinición de variables•Hipótesis•Revisión de métodos•Diseño•Conducción•Análisis y síntesis•Interpretación y discusión•Conclusiones y recomendaciones•Reporte.
METODO CIENTIFICO
METODO CIENTIFICOGUIA, PASOS, REALIMENTACIÓN
Fase de tormenta de ideas
Para generar la hipótesis de la
investigación, elaborar la lista de hipótesis
(candidatos))
No debe limitar las ideas
PROBLEMA
OBJETIVOS
HIPOTESIS
CONCEPTOS Y VARIABLES
PRIMER CICLO : PROBLEMATIZACIÓN, HIPOTESIS
HIPOTESIS
VARIABLES
RECURSOS
DISEÑO
METODO CIENTIFICOGUIA, PASOS, REALIMENTACIÓN
SEGUNDO CICLO DISEÑO
Factores o fuentes de confusión respecto con el efecto de una variable independiente. La validez interna se logra cuando hay control, cuando los grupos difieren entre sí solamente en la exposición a la variable independiente, cuando las mediciones de la variable dependiente son confiables y válidas, y cuando el análisis es el adecuado para el tipo de datos que estamos manejando.
Validez interna
Factor de confusión Factor de variación que no esta bajo estudio, pero influye en la variable respuesta y esta
presente en forma diferencial en las unidades experimentales bajo estudio.
Validez externaPlantea el interrogante de la posibilidad de generalización: ¿a qué poblaciones, situaciones, variables de tratamiento y variables de medición puede generalizarse este efecto?
VALIDEZ EXTERNAREPRESENTATIVIDAD DE LAS MUESTRAS
POBLACION
MUESTRA
La distribución de las variables de interés en el
estudio es aproximadamente la misma en la población y
en la muestra
Xi
f(Xi)Xi
f(Xi)
¿Qué , cómo, cuándo, con qué medir?
Formas de captación
Tamaño de muestra
Validez externa (extrapolación )
Validez interna (control factores de confusión)
¿Estudio piloto?
Logística
DISEÑO
CRITERIOS DE CLASIFICACION DE INVESTIGACIONES
1. Según el propósito son Descriptivos o Comparativos
2. Según la evolución son Transversales o Longitudinales
3. Según la fuente de información son Retrospectivos o Prospectivos
4.- Según el control del investigador son Observacionales o Experimentales
LONGITUDINALSe mide en dos o más
ocasiones la o las variables de interés.
La comparación de los valores en épocas distintas nos informa de la evolución de los elementos.
Se conserva la identidad de los elementos durante el seguimiento.
•TRANSVERSAL–Se mide una o más variables en
una sola ocasión en cada unidad.
–No hay seguimiento y no se requiere mantener la identidad de los elementos.
Hay estudios longitudinal en el que medición se realiza en un solo día, mientras que hay estudios transversales en el que se requiere tres meses para la medición.
RETROSPECTIVOLa información fundamental, o parte de ella, ya ha sido captada en otras fuentes. El investigador no estudia los elementos, sino registros, expedientes, fichas, etc.., donde esta la información.
Es rápido y barato.
La información puede ser de mala calidad.
PROSPECTIVOToda la información fundamental se obtiene directamente aplicando instrumentos de medición a los elementos de estudio. La información no existe en fuentes secundarias, o es de muy mala calidad.
Es caro y lento
La información es de buena calidad.
•EXPERIMENTO
–Se tienen dos o más poblaciones.
–Hay seguimiento.
–Se eligen o inventan las variantes del factor causal la X.
–Se aleatoriza la asignación de esas variantes a las unidades experimentales.
–Se forman bloques.
•OBSERVACIONAL
–Una o mas poblaciones.
–Dos poblaciones: Los elementos se eligen ya con las variantes del factor causal. Se pueden formar bloques. Comparativo.
–Una población: Se estudia una muestra de ella. Descriptivo
Estudio observacional comparativo = Pseudoexperimento
INTERFERENCIA PERIODO EVOLUCIÓN COMPARACIÓN TIPO DE
INVESTIGACIÓN
Observacional Prospectivo o Retrospectivo
Transversal Descriptivo Encuesta
descriptiva
Observacional Prospectivo o Retrospectivo
Transversal Comparativo Encuesta
comparativa
Observacional Retrospectivo Longitudinal Descriptivo Revisión de
casos
Observacional Retrospectivo Longitudinal Comparativo
(efecto-causa) Casos y
controles
Observacional Retrospectivo Longitudinal Comparativo
(causa-efecto) Perspectiva
histórica
Observacional Prospectivo Longitudinal Descriptivo Estudio de una
cohorte
Observacional Prospectivo Longitudinal Comparativo Estudio de varias
cohortes Experimental Prospectivo Longitudinal Comparativo Experimento
DISEÑO DE ESTUDIOS
PPm
m
Extrapolación
Pasado Presente Futuro
P = poblaciónm = muestra
ENCUESTA DESCRIPTIVA
ENCUESTA DESCRIPTIVA
Ejemplo: Describir las practicas agrícolas de los habitantes de una región. La población son todos los habitantes de la región. Se toma una muestra representativa de ellos. Se aplica un cuestionario (Prospectivo).
Ejemplo: Describir las áreas donde crece cierta especie vegetal. Se tendrá que muestrear aquellas zonas donde se sospeche que puede desarrollarse, posiblemente con muestreo de transectos.
P2
m2
m2
Ext
rap
ola
ció
n
Pasado Presente Futuro
P1 y P2 = poblacionesm1 y m2 = muestras
ENCUESTA COMPARATIVA
P1
m1
m1
ENCUESTA COMPARATIVA
Comparar el grado y tipo de practicas agrícolas, por parte de productores agrícolas que tengan diferente origen étnico y
escolaridad.
Los factores de confusión pueden ser, el grado de dependencia de la agricultura, capital, tipo de tenencia de la
tierra, etc..
Comparar el perfil de estudiantes de la universidad publica con la privada
P1P1
m1
m1
Ex
tra
po
laci
ón
en
el p
as
ado
Pasado Presente Futuro
P = poblacionesm = muestras
REVISION DE CASOS
P1P1
m1
m1
Ex
tra
po
laci
ón
en
el p
res
ente
EvoluciónPosible
seguimiento
Captación de informaciónde aspectos en el pasado
REVISION DE CASOS
En base a expedientes del seguro y o crédito agrícola, valorar los cambios en las técnicas de producción agrícola, en los últimos 40 años.
En base a registros estudiantiles, avaluar el proceso educativo de un plantel. Determinar tasas de reprobación, evolución de
calificaciones, estas, se asocian con sexo, escuela de procedencia, carrera etc..
P1 = población de casos con efectom1 = muestra de casosP2 = población de controles, sin efectom2 = muestra de controles, sin efecto
CASOS Y CONTROLES
m1 m1 P1
Casos
Controles
Búsqueda delfactor causal
No expuestos
Evolución
seguimiento retrospectivo
Se supone que en el pasado no está presente el efecto
Pasado Presente Futuro
Evoluciónm2 P2m2
Expuestos
Expuestos
Efecto-causa
CASOS Y CONTROLES
Pérdida de recursos genéticos o forestales
con veda: casos
sin veda: controles.
Remontarse a épocas pasadas en la que no se habían perdido los recursos, para investigar posibles factores causales, tales como
industrialización, educación, etc..
Comparar los expedientes de alumnos reprobados (casos) con alumnos regulares (controles). Valorar como riesgos para la
reprobación: turno, carrera, sexo, escuela de procedencia, calificación previa, nivel socioeconómico, participación en
deporte o actividades políticas.
Pasado Presente Futuro
P1 y P2 = poblacionesm1 y m2 = muestras
PERSPECTIVA HISTORICA
m1
P1
Evolución
seguimiento retrospectivo
P1 m1
posible seguimiento
m1
Evoluciónm2P2 m2 m2
P2
Causa - efecto
PERSPECTIVA HISTORICA
Con base en expedientes de seguro o crédito agrícola, evaluar productividad agrícola en zonas comparables antes y después
de un desastre natural, como volcán, o inundación.
Pasado Presente Futuro
P1 = poblaciónm1 = muestra
ESTUDIO DE UNA COHORTE
m1
P1
seguimiento
P1P1
mediciones
m1m1
ESTUDIO DE UNA COHORTE
Se decreta una nueva ley de explotación forestal y se quiere conocer su impacto futuro en la conservación de recursos.
Se crea una nueva carrera , se quiere valorar todo el proceso educativo. Se decide efectuar exámenes y aplicar
cuestionarios al termino de cada semestre.
Pasado Presente Futuro
P1 y P2 = poblacionesm1 y m2 = muestras
ESTUDIO DE VARIAS COHORTES
m1
seguimiento
P1P1
mediciones
m1m1
P1
m2
seguimiento
P2P2
mediciones
m2m2
P2
ESTUDIO DE VARIAS COHORTES
Se comparan las carreras académicas de estudiantes con actividad política intensa con la de los
políticamente no activos
Se comparan las carreras académicas de un nuevo programa educativo, con el tradicional.
Pasado Presente Futuro
EXPERIMENTO
m1
Mediciones
Tratamientos Evaluación final
Asignación aleatoriaa los tratamientos
Seguimiento
Pi = población inicialm = muestrasT = tratamientos extrapolación
P con T2
P con T3
P con T1
m2
m1
m1
m2
m1
P con T1
P con T2
P con T3
mPi
EXPERIMENTO
Se comparan los resultados de la medicina tradicional con la moderna, para diabetes y cáncer. Se tienen 50 voluntarios que pueden ser asignados al azar a cualquiera de los dos
tipos de tratamiento.
Se comparan los rendimientos de maíz con diferentes tipos de fertilizante. Unidad experimental de 4 surcos de 10 m.
La ciencia que no se ve no existe
http://www.colpos.mx/asyd/asyd.htm
Agricultura, Sociedad y Desarrollo
La matemática es la ciencia del orden y la medida, de bellas cadenas de razonamientos, todos sencillos y fáciles.
René Descartes
MEDICION
Medir es tipificar o caracterizar un propiedad en un elemento de estudio. Previamente se debe conceptualizar la propiedad por medirse y obtener un indicador mediante una operacionalización.
XX1 X2 ... Xn
CONCEPTO
INDICADORES
VARIABLES
Como al medir, es decir obtener el indicador con las operaciones establecidas en diferentes elementos o en uno solo en diferentes épocas, se tienen generalmente resultados distintos; se le llama variable al conjunto de posibles resultados.
• Peso de una persona en kilogramos• Rendimiento de un cultivo• Ingreso• Sexo de una persona• Edad
Ejemplos:
MEDICION NUMERICACuando el resultado de la medición se expresa con números, se llama medición numérica. También se dice que tenemos una escala numérica.Con esta forma o escala de medición se pueden calcular promedios o medias, desviaciones estándar, modas, correlaciones y en general aplicar las llamadas pruebas paramétricas.Ejemplos:
• Rendimiento• Peso en Kg. , estatura en cm.• Monto del subsidio de un programa
Categóricas
nominal Sexo: masculino, femenino
ordinal Nivel socioeconómico: Bajo, Medio y Alto
Numéricas
de intervalo
Temperatura, calificación de examen, etc.
Estatura, peso, distancia, etc.de razón o relación
Número de hijos por familia, etc.absoluta
VariablesEscala de medición Ejemplos
ESCALA NOMINAL
Cuando el resultado de la medición es la ubicación o clasificación de un elemento a una categoría, y si estas no tienen un orden, se tiene una medición en escala nominal, con la cual sólo se le dan nombres a las categorías.
En este caso no se pueden obtener medias o varianzas, solo modas.
Se estudia la frecuencia de ocurrencia de los casos en cada una de las categorías.
Las categorías deben ser mutuamente exclusivas y exhaustivas.
ESCALAS DE MEDICIÓN
1) Nominal
•No existe orden•Categorías excluyentes•Existe relación de igualdad entre los elementos
Ejemplos:
•Sexo•Estado civil•Estado de salud
• Carrera de procedencia de un técnico.• Tipo de programa del que recibe apoyo• Participantes en un programa• Programas que actúan en un territorio
Ejemplos:
ESCALA ORDINAL
Cuando el resultado de la medición se expresa en grados de intensidad, pero sin poder precisar el incremento de un grado a otro, únicamente se puede establecer un orden entre esos grados, se llama escala ordinal.
En este caso sólo es válido en sentido estricto, la obtención de la moda, la mediana o los porcentiles.
Aunque con muestras grandes y aplicándolo a conjuntos de resultados, se pueden manejar como variables numéricas y aplicar pruebas paramétricas.
2) Ordinal
•Existe orden entre las clases•Relaciones de <, =, >
Ejemplos:
Grado de Marginación0 Muy alto1 Alto2 Medio3 Bajo4 Muy Bajo
Estado de un paciente Sida1 empeoramiento intenso2 empeoramiento3 sin cambio4 mejorado5 muy mejorado
• Opinión sobre la oportunidad de con que llegan los recursos de un programa
• Nivel de pobreza• Posición jerárquica en el trabajo
Ejemplos:
3) Intervalo
•Relaciones de <, =, >•Permite diferencias entre clases (-)
Ejemplo:Temperatura100 C = 500 F50 C = 410 F
25
100
0
CC 2
4150
0
0
FF
4) Razón
•Permite todas las operaciones aritméticasEjemplo:Peso, estatura, concentración de substancias
100 lb = 46 Kg50 lb = 23 Kg
250
100 22346
Estadística Descriptiva
Cuando se tiene un conjunto de datos, se puede explorar que representan dichos datos de manera numérica o de manera gráfica
Medidas de Tendencia Central
n
YY
n
ii
1Valor o categoría más frecuente.........
50% 50%
Media Mediana Moda
Datos 1 Datos 2 Datos 36 12 1.56 4 66 2 36 5 06 0 16 6 66 8 16 7 26 4 2.56 6 36 0 26 18 44
Medidas de variabilidad o dispersión
•La dispersión es la cantidad de variación, o diseminación en los datos. Determina si los valores están relativamente cercanos entre sí, o no
Medidas de Dispersión
Se les usa para comparar distribuciones y para calcular los errores estándar, que serán de importancia en la estadística inferencial, en las pruebas de hipótesis y en los intervalos de confianza
Aplicaciones
Rango
• Es la medida de dispersión más fácil de calcular
• No están usada ya que sólo considera los valores extremos de la serie de datos
maximo - Valor minimoRango Valor
Datos 1 Datos 2 Datos 36 12 1.56 4 66 2 36 5 06 0 16 6 66 8 16 7 26 4 2.56 6 36 0 26 18 44
Varianza
• Indica qué tan dispersos se encuentran los datos, en promedio, de la media de la población
• Para representar la varianza poblacional y la varianza muestral se utilizan los siguientes dos símbolos: 2 - donde es la letra griega (sigma ) al cuadrado
que determinará la varianza de una población– s2 - determina la varianza de la muestra analizada
La fórmula para calcular la varianza de una población está dada por la expresión:
N
i
N
ii
i
N
ii
N
x
xNN
x
1
2
121
2
2
1
1
1
)(
donde:xi = son las observaciones que componen la población, i = 1, 2, 3,...,N = la media de la poblaciónN = El número total de elementos de la población.σ2 = La varianza de la población
Para calcular la varianza muestral para datos no agrupados se utiliza la misma fórmula reemplazando las variables 2,
y N por s2,x y n, respectivamente, esto es:
n
i
n
ii
i
n
ii
n
x
xnn
xxs
1
2
121
2
2
1
1
1
)(
donde: x - es la media muestralxi - son las observaciones que componen la muestra, i = 1, 2, 3,...,nn - el número total de elementos de la muestras2 - La varianza de la muestra
Datos 1 Datos 2 Datos 36 12 1.56 4 66 2 36 5 06 0 16 6 66 8 16 7 26 4 2.56 6 36 0 26 18 44
Desviación Estándar
• En la varianza, los resultados se expresan en unidades originales al cuadrado, por lo que se requiere de una medida de desviación que sea útil en unidades originales que no estén elevadas
• Esta medida es llamada desviación estándar y es la raíz cuadrada de la varianza
• Para representar la desviación estándar poblacional y la desviación estándar muestral se utilizan los siguientes dos símbolos: - donde sigma es la letra griega que determinará la
desviación estándar de una población– s -determina la desviación estándar de la muestra
analizada
La fórmula para calcular la desviación estándar de una población está dada por la expresión:
N
i
N
ii
i
N
ii
N
x
xNN
x
1
2
121
2
1
1
1
)(
donde:xi = son las observaciones que componen la población, i = 1, 2, 3,...,N = la media de la poblaciónN = El número total de elementos de la poblaciónσ = La desviación estándar de la población
Para Desviación estándar muestral de datos individuales se utiliza la misma fórmula reemplazando las variables y N por s, x y n, respectivamente, esto es:
n
i
n
ii
i
n
ii
n
x
xnn
xxs
1
2
121
2
1
1
1
)(
donde:x - es la media muestralxi - son las observaciones que componen la muestra, i = 1, 2, 3,...,nn - el número total de elementos de la muestras - la desviación estándar de la muestra
Datos 1 Datos 2 Datos 36 12 1.56 4 66 2 36 5 06 0 16 6 66 8 16 7 26 4 2.56 6 36 0 26 18 44
Ejemplo
Coeficiente de Variación
• Es la dispersión relativa existente entre la desviación estándar y la media aritmética de los datos
• Este coeficiente está dado como el cociente resultante de dividir la desviación estándar entre la media:
• El coeficiente de variación se puede expresar como porcentaje
X
SVC ..
• Esta medida de variabilidad expresa la desviación estándar por unidad experimental como una medida general del experimento.
• De esta forma se puede comparar entre dos o más coeficientes de variación, y observar cuál muestra tiene mayor variabilidad.
Datos 1 Datos 2 Datos 36 12 1.56 4 66 2 36 5 06 0 16 6 66 8 16 7 26 4 2.56 6 36 0 26 18 44
EJEMPLO
Un tirador efectuar tres disparos a 100 m del blanco y se mide la separación entre el centro del blanco y el lugar del impacto. Los resultados son:
Disparos Desviaciones Primero 5 mm Segundo 3 mm Tercero 7 mm
Se envían tres cohetes a la luna, que debería alunizar en un sitio. Se mide el lugar donde agudizaron y el sitio donde deben llegar. Los resultados son:
Cohetes Desviaciones Primero 11 km Segundo 23 km Tercero 7 km
Gómez Aguilar R. !977
Promedio =5 mm Promedio = 17 km
Desviación estándar = 1.6 mm Desviación estándar = 4.9 km
¿Qué población tiene mayor variabilidad?
1),( 1
n
xxyyyxCov
n
iii
Covarianza medida de variabilidad
conjunta
Coeficiente de Correlación
(Pearson) )()(
),(
xVaryVar
xyCovr