Taller II- Resumen Completo

11
TALLER II - CAP. VI ELABORACION Y ANALISIA DE DATOS.(A.D.D) Esta sección comprende el procesamiento y el análisis de los datos recolectados para el cual es importante tener presente los pasos y procedimientos a seguir. Para kerlinger (1983) analizar es establecer categorías, ordenar, manipular y resumir los datos; según AVILA menciona que el A.D.D., comprende dos fases: El procesamiento de los análisis de datos y los elementos estadísticos. El 1ero comprende el análisis univariado, bivariado y trivariado, y el 2do la estadística descriptiva y la inferencial. El A.D.D. es el precedente para la actividad de interpretación. La interpretación se realiza en términos de los resultados de la investigación. Esta actividad consiste en establecer inferencias sobre las relaciones entre las variables estudiadas para extraer conclusiones y recomendaciones (kerlinger, 1983). Según TAMAYO (2002), sostiene que en la etapa de elaboración de datos “se plantea el proceso de preparar la información después de su recolección, mediante las siguientes fases: revisión, codificación, procesamiento, recuento, plan de tabulación y presentación de los datos”. A continuación señalamos los procedimientos de recolección de datos que se deberá indicar: 1. A quien y como solicito los permiso o las autorizaciones necesarias para realizar el estudio. Las solicitudes, etc. 2. A quien y como se extendió la invitación a participar en el estudio; 3. Como llego a cabo la coordinación del estudio y los recursos de los cuales dispuso. 4. Como administro y recogió el instrumento de investigación. 5. Qué medidas de control investigativo estableció. TABULACION DE DATOS. Consiste en la contabilización o registro de número de casos (frecuencia o repetición) en cada una de las categorías de la variable de acuerdo al plan de tabulación previamente establecido. PRESENTACION DE LOS DATOS . PRESENTACION DE DATOS RECOLECTADOS EN TEXTO EN FORMA GRAFICOS O DIAGRAMAS CUADROS TAB LAS LINEAL DIBUJO DE CARTIGRAMA DE

Transcript of Taller II- Resumen Completo

Page 1: Taller II- Resumen Completo

TALLER II - CAP. VI

ELABORACION Y ANALISIA DE DATOS.(A.D.D)Esta sección comprende el procesamiento y el análisis de los datos recolectados para el cual es importante tener presente los pasos y procedimientos a seguir. Para kerlinger (1983) analizar es establecer categorías, ordenar, manipular y resumir los datos; según AVILA menciona que el A.D.D., comprende dos fases: El procesamiento de los análisis de datos y los elementos estadísticos. El 1ero comprende el análisis univariado, bivariado y trivariado, y el 2do la estadística descriptiva y la inferencial.

El A.D.D. es el precedente para la actividad de interpretación. La interpretación se realiza en términos de los resultados de la investigación. Esta actividad consiste en establecer inferencias sobre las relaciones entre las variables estudiadas para extraer conclusiones y recomendaciones (kerlinger, 1983).

Según TAMAYO (2002), sostiene que en la etapa de elaboración de datos “se plantea el proceso de preparar la información después de su recolección, mediante las siguientes fases: revisión, codificación, procesamiento, recuento, plan de tabulación y presentación de los datos”.

A continuación señalamos los procedimientos de recolección de datos que se deberá indicar: 1. A quien y como solicito los permiso o las autorizaciones necesarias para realizar el estudio. Las solicitudes, etc. 2. A quien y como se extendió la invitación a participar en el estudio; 3. Como llego a cabo la coordinación del estudio y los recursos de los cuales dispuso. 4. Como administro y recogió el instrumento de investigación. 5. Qué medidas de control investigativo estableció.

TABULACION DE DATOS.Consiste en la contabilización o registro de número de casos (frecuencia o repetición) en cada una de las categorías de la variable de acuerdo al plan de tabulación previamente establecido.

PRESENTACION DE LOS DATOS.La presentación de datos es tener la información recolectada en forma organizada estadísticamente para proceder el análisis y la interpretación de los resultados. Según Ávila – Acosta (2003), los resultados de la tabulación se presentan en cuadros, tablas y gráficos.Hay dos formas de presentar los datos estadísticos:a) En forma tabular, como son los cuadros y las tablas estadísticas.b) Mediante gráficos y diagramasUna tabla o cuadro estadístico completo puede tener las siguientes partes:a) Numero del cuadro: Es el código o elemento de identificación que permite ubicar el cuadro en el

interior del documento.b) Titulo: es la descripción resumida del contenido del cuadro. Debe ser breve, clara y completa.

Responder a las preguntas: qué?, donde?, cómo?, y cuándo?c) Encabezamientos o conceptos: es la descripción de las filas y las columnas de un cuadro

estadístico y se ubica en la parte superior del cuadro.d) Cuerpo: es la parte donde se colocan los datos correspondientes a las variables indicadas en el

encabezamiento. Es el contenido numérico del cuadro.e) Nota de pie o llamadas. Es utilizada para precisar algunos términos o siglas del cuadro.

PRESENTACION DE DATOS RECOLECTADOS

EN TEXTO

EN FORMA TABULAR

GRAFICOS O DIAGRAMAS

CUADROS

TAB LAS

LINEALE

DIBUJOS

DE SUPERFICIE

CARTIGRAMAS

DE DIMENSIONES

Page 2: Taller II- Resumen Completo

f) Fuente. Es la indicación al pie del cuadro y sirve para nombrar la publicación, entidad, estudio o fuente de donde se obtuvieron los datos utilizados para construir el cuadro.

g) Nota de unidad de medida: se escribe debajo del título original, se usa cuando se abrevia la escritura de las cifras y para expresar en que unidades esta expresada la variable.

h) Elaboración: es una indicación que se coloca debajo de la fuente y sirve para mencionar el responsable que está utilizando datos originales o de la fuente que elaboro el cuadro estadístico final.

SUGERENCIAS PARA LA CONSTRUCCION DE CUADROS.1. No deben ser complicados, ni grandes, ni largos.2. Los cuadros deben ser claros y precisos.3. Las variables deben estar interrelacionadas entre sí.4. Las clasificaciones incluidas en el cuadro estarán diseñadas de manera que facilite el análisis y las

comparaciones.5. Destacar las cifras e información más importante.6. Utilizar letras mayúsculas en los títulos del cuadro.7. Se debe abreviar las cantidades, considerar un decimal.8. Dentro del cuadro anotar las cifras adecuadamente espaciadas.

LOS GRAFICOS.Son representaciones de figuras geométricas, de superficie o volumen con el objeto de ilustrar los cambios de una variable, para comparar visualmente dos o más variables similares o relacionadas.

PARTES DE UN GRAFICO.a) Titulo: es una descripción del contenido del grafico.b) Los diagramas: están dados por el propio dibujo del grafico.c) Escalas y/o leyendas: son indicaciones en donde se precisa la correspondencia entre los

elementos del grafico y la naturaleza de las medidas representadas.d) Fuente: origen de los datos estadísticos.

CLASIFICACION DE LOS GRAFICOS SEGÚN EL NUMERO DE VARIABLES:A) Los gráficos de una variable: estos gráficos sirven para fines comparativos de cantidades

absolutas, tasas, proporciones, etc. Pueden tener la forma de barras, superficies, puntos o líneas.B) Los gráficos de dos variables: se construyen en el plano rectangular o de coordenadas cartesianas,

donde hay dos ejes, X e Y. En el eje Y (ordenada) se colocan los valores de la variable dependiente y en X (abcisa) la variable independiente, siendo y = f(x)-

TIPOS DE GRAFICOS:a. Linealesb. De superficiec. Pictogramas o dibujod. Mapas estadísticos o cartogramas e. De dimensiones

TECNICAS DE ANÁLISIS DE DATOSExisten técnicas de como se analizaran los datos recopilados y la importancia de los resultados del estudio y se debe explicar cómo se interpretaran los datos recopilados para cada pregunta de la investigación o hipótesis formulada.

NUMERO

TITULO

CONCEPTOS

CUERPO

NOTA DE PIE

FUENTE

NOTAS DE UNIDAD DE MEDIDA

ELABORACION

PARTES DE UNA TABLA O CUADRO

Page 3: Taller II- Resumen Completo

En la investigación cuantitativa las técnicas de análisis de datos son las estadísticas. Se debe incluir un análisis descriptivo de la población y un análisis comparativo mediante Prueba T, correlación de Pearson, etc.Las investigaciones cualitativas que son investigaciones de campo donde se entrevista o se analizan documentos es importante detallar como se analizara la recopilación de datos. En la inv. Cualitativa el investigador es el instrumentos de investigación, es importante explicar la técnica que se utilizó y cuál fue el papel del investigador. Si se realizaron entrevistas, se debe detallar cuales fueron las preguntas guías y presentarlas en los anexos.

MEDICION ESTADISTICAEs la ciencia y técnica que tiene que ver con la recolección, procesamiento y análisis e interpretación de datos. Otras definiciones están referidas al número k obtenemos por contar cosa.

PARA SIERRA BRAVO 1991. La estadística es la ciencia conformada por un conjunto de teorías y técnicas cuantitativas que tiene por objeto la organización presentación, descripción y resumen de datos numéricos obtenidos de la población en su conjunto o fenómenos o muestras que representan la poblaciones estudiadas.

SANCHEZ CRESPO. Lo define a la estadística como ciencia que se ocupa del estudio de fenómenos de tipo genérico normalmente complejos y enmarcados en universo variable mediante el empleo de modelos de reducción de la información y del análisis de variación de resultados de términos de representatividad.

PARA RUIZ. Es la ciencia cuyo objetivo es reunir una información cuantitativa concerniente a individuo, grupos, series de hechos.

PARA HOPKINS, la estadística es un lenguaje para comunicar información basada en datos cuantitativosLa estadística puede clasificarse en descriptiva e interferencial según varios autores y esta última pueda sub dividirse en pruebas parametricas Aplicación de la estadística.a. Obtener muestrab. Resumir y organizar datosc. Hacer diferencias sobre una población basados en los resultados de la muestra.d. Obtener un modelo simple para presentar un grupo.

SEGÚN RUIZ. El método estadístico es el conjunto de los métodos que se utilizan para medir las características de la información para resumir los valores individuales.a. Definición del problemab. Recopilación de información existente c. Obtención de información originald. Clasificacióne. Presentaciónf. Análisis.

TIPOS DE DATOSEn cada individuo de la muestra lo que se estudia son las variables (edad sexo talla) los datos son los que toman la variable en cada caso .se realiza la medición, asignar valores a las variables incluidas en el estudio, se debe concretar la escala de medida que aplicaremos en cada variable. La naturaleza de observación será de gran importancia al elegir el método estadístico.CLASIFICACION DE LOS ESTUDIOS ESTADISTICOS

a. Según la etapa. Descriptiva inferencial

b. Según el tiempo Estatico o estructural Dinamico o evolutivo

Page 4: Taller II- Resumen Completo

c. Según la cantidad de variables Estadística bivariada Estadística multivariada

ESTADISTICA CLASIFICACION DE LA ESTADISTICA Estadística descriptiva Estadística inferencial

I. ESTADISTICA DESCRIPTIVA. Permite presentar la información contenida en una población o muestra mediante uso de tablas de frecuencia e indicadores o medidas. incluye la tabulación, representación y descripción de conjuntos de datos, a partir de ellos se puede organizar simplificar y resumir información básica, los datos pueden ser variables cuantitativas o categóricas.

DISTRIBUCION DE FRECUENCIASSe determina contando cuantas veces se repite cada valor de la variable y además se transforma ,la distribución de frecuencias, contienen las categorías los códigos , la frecuencias absolutas(números de casos)las frecuencias relativas (porcentajes), las frecuencias ajustadas y las frecuencias acumuladas (absolutas o relativas) se pueden presentar en polígonos de frecuencia o curva de frecuencias.

1. MEDIDAS DESCRIPTIVASa. Deposición

. cuartiles .percentiles. . deciles

b. De centralización Media Mediana Moda

c. De dipercion. Varianza Desviación Estándar Coeficiente Variación

d. De forma. Asimetría cuatosis.

A. MEDIDAS DE CENTRALIZACION:

Esta medición estadística consiste en describir o localizar el centro de distribución de una variable; constituyen valores típicos de representatividad o localización de conjunto de datos. Moda: es la medida estadística que localiza el centro de la distribución de la variable en base al

valor más frecuente. Mediana: es el valor o puntuación que deja por debajo y por encima de si el 50% de los casos

(percentil 50), divide al conjunto de datos en dos partes de igual tamaño. La mediana es la observación equidistante de los extremos.La mediana en el siguiente ejemplo seria el valor que deja a la mitad de los datos por encima de dicho valor y a la otra mitad por debajo. Si ordenamos los datos de mayor a menor observamos la secuencia:15, 21, 32, 59, 60, 60, 61, 64, 71, 80.En este ejemplo el número de observaciones es par (individuos), los dos valores se encuentran en el medio son 60 y 60. Si realizamos el cálculo de la media de estos dos valores nos dará a su vez 60, que es el valor de la mediana.Si la media y la mediana son iguales, la distribución de la variable es simétrica. La media es muy sensible a la variación de las puntuaciones. Sin embargo, la mediana es menos sensible a dichos cambios.

Media Aritmética: es el estadístico que localiza el centro de la distribución en base a su centro de gravedad y consiste en la suma de los valores dividida por el número de valores sumados.

Page 5: Taller II- Resumen Completo

La medida más evidente que podemos calcular para describir un conjunto de observaciones numéricas en su valor medio. La media es la suma de todos los valores de una variable dividida entre el número total de datos de los que se dispone.EJEMPLO: se tiene 10 personas cuyas edades son 21, 32, 15, 59, 60, 61, 64, 60, 71 y 80 años. La media de edad de estas personas será de:

χ=21+32+15+59++60+61+64+60+71+8010

Formalmente, si denotamos por (x1 , x2,…. xn ,) los n datos que tenemos recogidos de la variable en cuestión, el valor medio será dado por:

Media (χ)= ∑j=1n

χ j

n

B. MEDIDAS DE LOCALIZACIÓN:Los cuartiles y percentiles son medidas de posición. El percentil es el valor de la variable que indica el porcentaje de una distribución que es igual o menor a esa cifra. Ejemplo, el percentil 80 es el valor de la variable que es igual o deja por debajo de sí al 80% del total de las puntuaciones. Los cuartiles son los valores de la variable que dejan por debajo de sí el 25%, 50% y el 75% del total de las puntuaciones y así tenemos por tanto el primer cuartil (Q1), el segundo (Q2) y el tercer cuartil (Q3).Lo que se estudia en cada individuo de la muestra son las variables (edad, sexo, peso, talla, presión arterial sistólica, etc.). Los datos son los valores que toma la variable en cada caso. Lo que se realiza es medir, asignar valores a las variables incluidas en el estudio.Se debe concretar la escala de medida que aplicara a cada variable.En este grupo están consideradas las siguientes medidas estadísticas:

Los Percentiles: son 99 y dividen al conjunto en 100 partes iguales, cada uno equivale al 1%.

Los vigentiles: son 19, dividen al conjunto en 20 partes iguales cada uno equivalente al 5%.

Deciles: los deciles son 9, dividen al conjunto en 10 partes iguales cada uno equivalente al 10%.

Quintales: son 4, dividen al conjunto en cinco partes iguales, cada uno equivalente al 20% y corresponden a los percentiles 20, 40 60 y 80 o a los deciles 2, 4, 6, y 8.

Cuartiles: son tres dividen al conjunto en cuatro partes iguales cada una equivalente al 25% y corresponden a los percentiles 25, 50 y 75.

C. MEDIDAS DE DISPERSIÓN:Las medidas de dispersión o variabilidad están relacionadas a describir datos y su dispersión o variabilidad de los mismos. Existen distintas formas de cuantificar esa variabilidad. La dispersión de datos indica la separación o agrupamiento de los valores. Las principales medidas son:

i. La varianza (s2): es la medida cuadrática de las puntuaciones diferenciales con respecto a la media aritmética. La varianza ( s2 ) de los datos es la más utilizada. Es la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmética de la distribución.

Sx2=∑J=1

N

(X j−Media (X ))2

n

Page 6: Taller II- Resumen Completo

Esta varianza muestral se obtiene como la suma de las diferencias de cuadrados y por tanto tiene como unidades de medida el cuadrado de las unidades de medida en que se mide la variable estudiada.De los datos del ejemplo anterior la varianza seria:

SX2=(15−52,3)2+(21−53,2)2…¿¿

ii. La desviación estándar(S): es la raíz cuadrada de la varianza.Mide la dispersión absoluta de los datos con respecto al promedio.La desviación típica (S) es la raíz cuadrada de la varianza. Expresa la dispersión de la distribución y se expresa en las mismas unidades de medida de la variable. La desviación típica es la medida de dispersión más utilizada en estadística.

SX=√∑j=1X

XjMedia(X )2

n

Aunque esta fórmula de la desviación típica muestral es correcta, en la práctica, la estadística nos interesa para realizar inferencias poblacionales, por lo que en el denominador se utiliza, en lugar de n, el valor n-1.Por tanto, la medida que se utiliza es la cuasidesviacion típica, dada por:

SX=√∑j=1n

(Xj−Media (X ))2

n−1

Aunque en muchos contextos se utiliza el término de desviación típica para referirse a ambas expresiones. En los cálculos del ejercicio previo, la desviación típica muestral, que tiene como denominador n, el valor seria 20.678. A efectos de cálculo lo haremos como n-1 y el resultado seria 21.79.

El haber cambiado el denominador de n por n-1 está en relación al hecho de que esta segunda fórmula es una estimación más precisa de la desviación estándar verdadera de la población y posee las propiedades que necesitamos para realizar inferencias a la población.

iii. El coeficiente de variabilidad o variación (CV): indica la dispersión relativa (en proporción o en porcentaje) de los datos con respecto al promedio. El coeficiente de variabilidad o variación (CV). Es una medida de dispersión relativa de los datos y se calcula dividiendo la desviación típica muestral por la media y multiplicando el cociente por 100. Su utilidad estriba en que nos permite comparar la dispersión o variabilidad de dos o más grupos. Por ejemplo, si tenemos el peso de 5 pacientes (70, 60, 56, 83 y 79 Kg) cuya media es de 69.6 kg. Y su desviación típica (s)=10,44 y la PAS de los mismos (150, 170, 135, 180 y 195 mmHg) cuya media es de 166mmHg y su desviación típica de 21,3. La pregunta sería: ¿Qué distribución es más dispersa, el peso o la presión arterial? Si comparamos las desviaciones típicas observamos que la desviación típica de la presión arterial es mucho mayor; sin embargo, no podemos comparar dos variables que tienen escalas de medidas diferentes, por lo que calculamos los coeficientes de variación:

Page 7: Taller II- Resumen Completo

CV de la variable peso = 10,4469,6

=15%

CV de la variable TAS = 21,30166

=12,8%

A la vista de los resultados, observamos que la variable pero tiene mayor dispersión.iv. Rango(R): diferencia entre el valor máximo y el valor mínimo (R= VM – vm). Se da

cuando se quieren señalar valores extremos en una distribución de datos, se suele utilizar la amplitud o rango como medida de dispersión. La amplitud o rango es la diferencia entre el valor mayor y el menor de la distribución.Por ejemplo, utilizando los datos del ejemplo previo tendremos 80 - 15 = 65.

v. Desviación media (DM): es el promedio del valor absoluto de las diferencias de los valores de la variable con respecto a la media aritmética.

vi. Desviación mediana (DMe): es el promedio del valor absoluto de las diferencias de los valores de la variable con respecto a la mediana.

vii. Rango intercuartil (Ri): es la diferencia entre el percentil 75 y el percentil 25.viii. Rango semicuartil (Rsi): es la diferencia entre el percentil 75 y el percentil 25 dividida

por o la mitad del rango intercuartil.

D. MEDIDAS DE FORMA DE DISTRIBUCION:Las medidas de distribución nos permiten identificar la forma en que se separan o aglomeran los valores de acuerdo a su representación grafica. Estas medidas describen la manera como los datos tienden a reunirse de acuerdo con la frecuencia con que se presentan dentro de la información. Su utilidad está basada en la posibilidad de identificar las características de la distribución sin necesidad de generar el grafico. Sus principales medidas son las Asimetría y la Curtosis.

a) Coeficiente de asimetría: indica si la distribución de los datos es simétrica.b) Coeficiente de curtosis: indica si el histograma de la distribución de los datos es

apuntado, es decir si la distribución es más alto o más bajo que la curva normal.

ANALISIS EXPLORATORIO DE DATOSCuando el número total de datos de variables cuantitativos (de intervalo o razón) es menor que 50 (muestras pequeñas) es apropiado el análisis exploratorio de datos, con el cual es posible evaluar de manera inmediata y grafica la forma de distribución de los datos, su dispersión y la presencia de datos discordantes. Se realiza con las técnicas: diagrama de tallos y hojas y gráficos de cajas.

II. ESTADISTICA INFERENCIAL E INDUCTIVA.- sirve para extrapolar o inferir los resultados obtenidos en el análisis de los datos y a partir de ello predecir acerca de la población o con margen de confianza conocida. Además proporciona métodos para estimar las características de un grupo (población) basándose en los datos de un conjunto pequeño (muestra). Se utiliza para probar la hipótesis y estimar parámetros. Su medio es cero (0) y su desviación estándar es uno (1).Dentro de las estadísticas inferencial está comprendido:

a.- Distribución Muestral.- es la que resulta de considerar todas las muestras posibles que pueden ser tomadas de una población. Su estudio permite calcular la probabilidad que se tiene, dado una sola muestra, de acercarse al parámetro de la población. Con ello se puede estimar el error para un tamaño de muestra dado.

DISTRIBUCIÓN NORMALEs el modelo de probabilidad de mayor uso, es una distribución teórica de variable aleatoria continua, que puede expresarse en la forma general o estandarizada. Tiene simetría perfecta, en forma de una campana unimodal, la media y la moda son iguales.

Propiedades de la Distribución normal

Page 8: Taller II- Resumen Completo

- La distribución normal tiene forma de campana.- Es una distribución de probabilidad que tiene media u=0 y desviación estándar o=1.- El área bajo la curva o la probabilidad desde menos infinito a más infinito vale 1.- Es asimétrica, es decir cada mitad de curva tiene un área de 0.5.- La escala horizontal de la curva se mide en desviaciones estándar.- La forma y la posición de una distribución normal dependen de los parámetros u y o, en

consecuencia hay un número infinito de distribuciones normales.

b.- La estimación de parámetros.- consiste en el cálculo aproximado del valor de un parámetro en la población utilizando la inferencia estadística a partir de los valores observados en la muestra estudiada.

Intervalo de confianza.- es un intervalo de valores alrededor de un parámetro muestral en los que con una probabilidad o nivel de confianza determinado, se situara el parámetro poblacional a estimar.

c.- Determinación del tamaño de la muestra.- por la cual se aplica varias fórmulas, las mismas que ya han sido descritas anteriormente cuando se trató la muestra.

d.- Pruebas estadísticas:Clasificaciones de las pruebas:- Parametricas y no paramétricas- Para una muestra, dos muestras y K muestras- Independientes y dependientesPruebas de hipótesis:

Condiciones para aplicar la estadística inferencial:- Usa la teoría de la probabilidad para extraer conclusiones acerca de una población, a partir de

los datos obtenidos por la muestra.- Es muy difícil estudiar a toda la población por lo que estudiamos muestras.- Método para hacer estimaciones y probar hipótesis son fundamentales para obtener inferencias.

FACTORES QUE INTERVIENEN EN LA ESTADÍSTICA INFERENCIAL- Prueba de hipótesis.- es determinar si la hipótesis es congruente con los datos obtenidos con la

muestra.- Distribución muestral.- es un conjunto de valores sobre una estadística calculada de todas las

muestras posibles de determinado tamaño.- Nivel de significación.- la probabilidad de que un evento ocurra entre 0 y 1: donde 0 significa la

imposibilidad de ocurrencia y 1 la certeza de que el fenómeno ocurra.- Intervalo de confianza.- es la probabilidad definida de que el parámetro se va ubicar en un

determinado intervalo.

ANALISIS INFERENCIAL SEGÚN VARIABLE- Univariante.- solo con la intervención de la variable dependiente en sus modalidades: continua,

ordinal y nominal.- Bivariante.- existe comparación de las variables dependientes e independientes, modalidades

continua, ordinal y nominal.- Multivariante.- comparación de la variable dependiente y dos o más variables independientes en la

modalidades continua, ordinal y nominal.

ANALISIS DE LOS DATOS- Cuantitativa.- Medidas de Tendencia central. Medidas de dispersión. Pruebas de significación.- Cualitativa.- Señalar los procedimientos utilizados. Análisis de contenidos. Análisis de

congruencias. Síntesis de argumentos, etc.