Clase 11 Introduccion-cualitativos PDF
Transcript of Clase 11 Introduccion-cualitativos PDF
UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS
FACULTAD DE CIENCIAS BIOLOGICASEAP CIENCIAS BIOLOGICAS
FUNDAMENTOS DE ESTADISTICA
Dra. DORIS GOMEZ TICERAN (T)
Lic. Pilar Depaz Apéstegui (L)
Lic. Carla Zúñiga Vilca (P)
ABRIL _ JULIO 2010
I. INTRODUCCION
¿Por qué los biólogos tendrían que estudiar Estadística?Fundamentos de Estadística
Bioestadística
Progreso en el conocimiento de la Estadística:
• Sociedad completamente informatizada, permite uso de pruebas estadísti cas impensadas, costosas.
• Cambio de actitud de los profesionales usuarios: herramienta útil y rigurosa en las investigaciones.
• Mera aplicación de conocimientos,evolucionado a una Sociedad Científica,donde la investigación ha pasado a ser parteesencial de su labor diaria.
• Necesidad de técnicas básicas demetodología de la investigación, análisis dedatos!!!
• Ciencias de la vida: Estadística, materiatroncal con identidad propia, es unanecesidad.
No se trata de convert irlos en expertos en Estadística:
1. Generar una actitud crítica y objetiva ante cualquier lectura científica
2. Pasos y elementos imprescindibles investigación empírica, apoyada manejo datos
3. Compartir lenguaje común con estadísticosHay necesidad de pensar en la naturaleza real del
problema en sí, reflexionar, así como entender los principios estadísticos y sus consecuencias prácticas.
• No existe investigación si no se tiene objetivo previo(s):
• No puede confi rmarse ni descartarse lo que no se ha planteado!!! ç
La investigación científica es un proceso deaprendizaje dirigido.
El objetivo de los métodos estadísticoses hacer que ese proceso de aprendizajesea lo más eficiente posible!!
Lo primero que preguntan l os estudiantes es ¿para qué me si rve la Estadística?
• La razón es que el mundo está l leno de variaciones, y a veces se hace di fícil descubrir las verdaderas di ferencias que surgen como consecuenci a de ellas.
Todo investigador se enfrenta a tareas difíciles:
Descubrir y entender las relaciones complejasque pueden existir entre variables
Presencia de efectos de factores no controladosè variacionesa)Diferencias en especies de palmeras en
parcelas de aguajal denso(aguaje, aguajillo,catahua..)
b) Diferencias en la constitución genética de losseres humanos
c) Diferencias en las longitudes de los tallos delEucalyptus capitellata
d) Diferentes número de suris encontrados dentrode los arboles de Mauritia flexuosa(aguajes).
Las Variaciones aleatoriaspuede tener efectos que alteren
completamente los resultados experimentales .
La estadística no sería necesari a si:a) Todos los frutos de Mauritia
flexuosa(aguajes) fueran idénticos!!!b) Todos los pacientes responden de l a misma manera a un tratami ento etc. etc.
Método Científico
• El científico, generalmente por razonamiento deductivo o inductivo, a partir de los hechos reales, llega a postular una hipótesis sobre cierta particularidad de la realidad.
• Diseña un experimento para verificar de manera objetiva la hipótesis propuesta.
Método Científico
• Posteriormente LOS DATOS, resultado del experimento, se analizan con métodos estadísticos- rechazar o no la hipótesis propuesta.
• NO INTERESA LO QUE EL CI ENTIFICO CREA QUE ES VERDADERO, el EXPERIMENTO PROPORCIONA LA BASE PARA UNA EVALUACION OBJETIVA DE LA HIPOTESIS.
Método Científico
• Aspecto importante MÉTODO CIENTÍFICO es que los
datos- análisis estadístico -demostrarán si el investigador tiene o no la razón.
• A largo plazo existe una al ta probabilidad de llegar a la verdad.
13
Pasos en un estudio estadístico
• Plantear hipótesis sobre una población• Los fumadores tienen “más faltas” laborales que los no fumadores• ¿En qué sentido? ¿Mayor número? ¿Tiempo medio?
• Decidir qué datos recoger (diseño de experimentos)– Qué individuos pertenecerán al estudio (muestras)
• Fumadores y no fumadores en edad laboral.• Criterios de exclusión ¿Cómo se eligen? ¿Descartamos los que padecen enfermedades crónicas?
– Qué datos recoger de los mismos (variables)• Número de faltas• Tiempo de duración de cada falta• ¿Géneo? ¿Sector laboral? ¿Otros factores?
• Recoger los datos (muestreo)– ¿Estratificado? ¿Sistemáticamente?
• Describir (resumir) los datos obtenidos• tiempo medio de faltas en fumadores y no (estadísticos)• Porcentaje de faltas por fumadores y género (frecuencias), gráficos,...
• Realizar una inferencia sobre la población• Los fumadores están faltando a su centro laboral al menos 10 días/año más que los no fumadores.
• Cuantificar la confianza en la inferencia– Nivel de confianza del 95%– Significación del contraste: p=2%
No tienes que entenderlo
(aún)
14
Plantearhipótesis
Obtenerconclusiones
Recoger datosy analizarlos
Diseñar experimento
Método científico y estadística
Algo de historia sobre la Biometria1837-1936 1857-1936
1890-1962
FRANCIS GALTONvPrimo de DarwinvEstadístico y aventurerovFundador (con otros) dela estadística modernapara explicar las teoríasde Darwin
KARL PEARSONv Coeficiente de
correlaciónv X2
v Desviación Estándar
RONALD FISHER
v Fundador de la genética de poblacionesvAnálisis de varianza vMáxima VerosimilitudvValor -pvRegresión Múltiple
Herramientas de análisis
q Calculadoras, tablas estadisticasq Planillas de Cálculo (Excelq Programas Estadisticos modernos (SPSS, SAS, SYSTAT, R, etc)
Compañías Privadas
Free
PROGRAMAS ESTADISTICOS
CAPITULO ICONCEPTOS FUNDAMENT ALES
1. Estadística2. Clasificaión de la Estadística
3. Unidad de análisis, Población, Muestra,Parámetro , Estadística (o)
4. Variables y tipos de variables5. Pautas del trabajo de investigación
6. Organización y presentación de datos : cualitativos
¿Qué el la Estadística?1. ES LA CIENCIA QUE SE OCUPA DE LOS METODOSY
PROCEDIMIENTOS PARA RECOPILAR, CLASIFICAR, RESUMIR, HALLAR REGULARIDADES Y ANALIZAR E INTERPRETAR INFORMACIÓN NUMÉRICA O CUALITATIVA, DATOS, SIEMPRE Y CUANDO ESTE PRESENTE LA VARIABILIDAD Y LA INCERTIDUMBRE; ASI COMO DE REALIZAR INFERENCIAS A PARTIR DE ELLOS, A FIN DE AYUDAR A LA TOMA DE DECISIONES Y/O FORMULAR PREDICCIONES.
¿Qué es la estadística?
Ciencia dedicada al estudiosistemático de los datos, los queson transformados eninformación, permitiendo lageneración de conocimientos
¿Qué es la Estadística?• Ciencia , que nos proporciona metodos o
procedimientos (estadisticos)permiten la toma de decisiones en presencia de incertidumbre.YSOPORTE TOMA DE DECISIONESYSOPORTE METODOLOGIA DE LA
INVESTIGACION
Métodos estadísti cos soporte para evaluar y juzgar la realidad.
2. ¿Areas de la Estadística ?
Estadística Descriptiva: Se ocupa de métodos y procedimientos para RECOPILAR, CLASIFICAR, RESUMIR DATOS. Describe, analiza y representa datos, utilizando métodos numéricos y gráficos que resumen y presentan la información contenida en ellos.
Estadística Inferencial: Apoyada en el cálculo de probabilidades y a partir de datos de las muestras, efectua estimaciones, decisiones y predicciones o generalizaciones , de la muestra(s) a la población(es).
3. Unidad de análisis, Población, Muestra,, Parámetro, Estadística
Unidad de análisis
Es el objeto o elemento indivisible enbase al cual se obtienen los datos
3. Unidad de análisis, Población, Muestra,, Parámetro, Estadística
Población
Es el conjunto de elementos (personas, plantas,organismos, etc.) que contienen una o máscaracterísticas observables de naturalezacualitativa o cuantitativa. Tienen ciertaspropiedades comunes.
3. Unidad de análisis, Población, Muestra,, Parámetro, Estadística
ParámetroEs una medida utilizada para resumiralguna característica de la población. Paraconocer su valor es necesario utilizar lainformación de toda la población.
3. Unidad de análisis, Población, Muestra,, Parámetro, Estadística
Muestra
Es un subconjunto de la población,seleccionada de acuerdo a un plan oregla.
3. Unidad de análisis, Población, Muestra,, Parámetro, Estadística
Estadística (Estimador)
Es una medida utilizada pararesumir alguna característica de lamuestra.
3. Unidad de análisis, Población, Muestra,, Parámetro, Estadística, Estimación
Estimación
Es el resultado obtenido una vez que se reemplaza los datos de la muestra en la estadística.
PARAMETROS vs ESTADISTICAS
μ X2σ 2S
π PPROPORCIONPOBLACIONAL MUESTRAL
MEDIA POBLACIONAL MUESTRAL
MEDIA POBLACIONAL MUESTRAL
ρ rCOEFICIENTE DE CORRELACION
POBLACIONAL MUESTRAL
4. Variables y su clasificación
VariableEs una característica observable que puedetomar diferentes valores entre los individuos dela población.
La variable es un aspecto específico de larealidad referida a la unidad de investigación yque puede ser susceptible a ser medida ocuantificada.
La información que disponemos de cada individuo es resumida en variables .
4. Variables y su clasificación
Todas las variables tienen una escala de medida
Escala Nominal• No implica orden • Existe un número finito de resultados
Escala Ordinal• Existe un orden• No exactamente cantidad (mejor / peor).• Número finito de resultados
4. Variables y su clasificación
Escala de Intervalo• El orden se encuentra inherente en los datos y de
igual importancia, existe una unidad constante y común la cual es usada para la medición. Sin embargo el cero no es absoluto (no es importante)
• Existe la posibilidad de un número infinito de resultados
• Para la medición la escala es constante y común• Los valores reales pueden ser no relevantes
Escala de Razón• Se realizan las operaciones aritméticas
Tipos de variablesa) CualitativasSi sus valores (modalidades) no se pueden asociar naturalmente a un número (no se pueden hacer operaciones algebraicas con ellos)
Nominales: Si sus valores no se pueden ordenarSexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No)
Ordinales: Si sus valores se pueden ordenarMejoría a un tratamiento, Grado de satisfacción, Intensidad del dolor
b) Cuantitativas o NuméricasSi sus valores son numéricos (tiene sentido hacer operaciones algebraicas con ellos)
Discretas: Si toma valores enterosNúmero de hijos, Número de cigarrillos, Num. de “cumpleaños”
Continuas: Si entre dos valores, son posibles infinitos valores intermedios.Altura, Presión intraocular, Dosis de medicamento administrado, edad
38
• Los posibles valores de una variable suelen denominarse modalidades.
• Las modalidades pueden agruparse en clases (intervalos)– Edades:
• Menos de 20 años, de 20 a 50 años, más de 50 años– Número de cursos aprobados :
• Menos de 1 , De 2 a 4, 5 o más cursos
• Las modalidades/clases deben forman un sistema exhaustivo y excluyente– Exhaustivo: No podemos olvidar ningún posible valor de la variable
Presencia de alga parasitaria Gelidiocolax(Si, No)
– Excluyente: Nadie puede tener dos valoressimultáneos de la variable
• Longitud del húmero de los gorriones(un valor para cada unidad de análisis)
Variable cualitativa
PoblacionVariable
X: Especies de árboles
Parámetro • Proporción poblacional
de árboles de aguaje• Proporción esperada de
árboles de aguaje
MuestraVariable
X: Especies de árboles
• Estadística• Proporción muestral de a.
aguajeSu valor: Valor de la
proporción de ar aguajeProporción de la muestra
observada. p=0.46
xxxx
π P
Variable cuantitativa
PoblaciónVariable
X: Altura del árbol
Parámetro• Altura esperada del árbol• Altura media poblacional
del árbol
MuestraVariable
X: Altura del árbol
• Estadística• Altura media muestralSu valor: Valor de la altura
promedio del árbol. Promedio de la muestra observada.μ
X
xxxx
5. Trabajo de Investigación
Equipo: Máximo 2 estudiantes
1. Elegir Revistas de Investigación Ciencias de la Vida ( Ciencias Biológicas):a) Peruanasb)Colombianasc)Chilenasd) Brasileñas ………………
Revista Peruana de BiologíaMonografías: Secretari a General de la OEA
programa Regional de Desarrol lo Científico y Tecnológico.
. Primara parte 1.Elegir Revistas de Investigación Ciencias
2.Elegir un artículo en el que se haga uso de algún métodoestadístico.
Seguimiento 1: Tercera semana: Hora de laboratorio(10% nota)3. Entender el artículo :
a) Identificación del problema. Importancia de la investigación.Objetivo de la investigación
b) Población objetivo. Muestra. Unidad de investigaciónc) Variablesd) Metodología biológicae) Metodología(s) estadística(s) para analizar los datos
Seguimiento 2: Quinta semana: Hora de laboratorio(20% nota)
4. Preparar el informe y exponerSeguimiento 3: Exposición : Sétima semana. Todos los horarios(20%)
Segunda parte
5. Emular el artículo: diseño, generación, análisisinterpretación de datos.
6. Presentación trabajo final
7. Exposición
Seguimiento 4: Presentación y exposición final.Semana 14 (50%)
Cualquier presentación fuera de la fecha no será calificada.
6. ORGANIZACIÓN Y PRESENTACION DE DATOS CUALITATIVOS
ORGANIZACIÓN Y PRESENTACION DE DATOS( VALORES VARIABLES)
a) CUALITATIVOSb) CUANTITATIVOS DISCRETOSc) CUANTITATIVOS CONTINUOS
6. Organización de Datos Cualitativos6.1 Tabla de Frecuencias: Distribución de frecuencias Resume la información recogida en la
muestra, de forma que no se pierda nada de información (o poca).
– Frecuencias absolutas: Contabilizan el número de individuos de cada modalidad
– Frecuencias relativas o proporción: frecuencia absoluta dividido por el total è Porcentaje
Sexo del encuestado
636 41,9 41,9881 58,1 58,1
1517 100,0 100,0
HombreMujerTotal
VálidosFrecuencia Porcentaje
Porcentajeválido
Especies arbole s
60 43,8 43,8 43,840 29,2 29,2 73,09 6,6 6,6 79,67 5,1 5,1 84,77 5,1 5,1 89,89 6,6 6,6 96,45 3,6 3,6 100,0
137 100,0 100,0
AguajeAguajilloBrea caspiCatahuaCashaponaMarimariPungaTotal
ValidFrequency Percent Valid Perc ent
CumulativePercent
Tabla de Distribución de Frecuencias
Cuadro No 1 Distribución de los árboles según Especies
Bosque Húmedo Tropical Reserva Nacional Pacaya Samiria, Parinari- Loreto 2006 Especies Número
árboles Porcentaje árboles
Total 137 100,0 Aguaje 60 43,8 Aguajillo 40 29,2 Brea caspi 9 6,6 Catahua 7 5,1 Cashapona 7 5,1 Marimari 9 6,6 Punga 5 3,6
Fuente: Documento Técnico No 29, IIPA
50
6.2 Gráficos de frecuencias• Gráfico de barras
– Alturas proporcionales a las frecuencias (abs. o rel.)– Se pueden aplicar también a variables discretas
• Gráfico de sectores (tartas, polares)– No usarlo con variables ordinales– El área de cada sector es proporcional a su frecuencia
(absoluta o relaiva)
• Pictogramas– Fáciles de entender.– El área de cada modalidad debe ser proporcional a la
frecuencia. – Es un gráfico con dibujos alusivos al carácter que
se está estudiando y cuyo tamaño es proporcional a la frecuencia que representan; dicha frecuencia se suele indicar.
Gráfico de BarrasGráfico de
Frecuencias:Barras
AguajeAguajillo
Brea caspiCatahua
CashaponaMarimari
Punga
Especies
0
20
40
60
Núm
ero
árbo
les
60
40
97 7
95
Gráfico 1 Distribución de árboles según especies
Gráfico de Frecuencias:Barras
AguajeAguajillo
Brea caspiCatahua
CashaponaMarimari
Punga
Especies
10%
20%
30%
40%
Porc
enta
jeGráfico 1 Distribución de árboles según especies
AguajeAguajilloBrea caspiCatahuaCashaponaMarimariPunga
Especies arboles
43,80%
29,20%
6,57%
5,11%
5,11%
6,57%3,65%
Gráfico 1 Distribución de árboles según especies
Gráfico de Frecuencias: Sectores
CASO 1: Ejercicio 14 de la práctica 1• Las palmeras son un grupo de plantas que conforman la familia Arecacea o
Palmae. Sabal es uno de los géneros mas comunes en el Caribe y areas adyacentes, creciendo en áreas pantanosas , abiertas costeras o arenosas. La luz, la temperatura y la humead son algunos de los factores que medio ambiente que intervienen de manera decisiva en su desarrollo. Se realizó una investigación (Pacaya Samiria, Parinari- Loreto 2007: Documento Técnico No 35, IIPA)a fin de evaluar los efectos de dos niveles de irradiancia (450 y 1750 umol.m-2s-1) sobre la anatomía de la lámina foliar de Sabal mauritiiformis, en base a las siguientes variables:
• Longitud de los estomas de la superficie abaxial (LEaba)• Longitud de las células epidérmicas superficie adaxial (LCEada)• Anchura de las células epidérmicas superficie adaxial (ACEada)• Anchura de las células epidérmicas superficie abaxial (ACEaba)• Número de células epidérmicas (NCE) Indi ce estomático (IE- %)
BASE: DATOS_EFECTOS_IRRADIACION
Tabla de frecuencias Gráfico de frecuencias