conceptos basicos de estadistica
-
Upload
leslie-contreras -
Category
Education
-
view
152 -
download
8
description
Transcript of conceptos basicos de estadistica
1
PROFESOR MARIO RODRIGUEZ L.
CONCEPTOS BÁSICOS DEESTADÍSTICA DESCRIPTIVA
UNIVERSIDAD LOS LEONESESTADÍSTICA Y ANÁLISIS DE DATOS
ESCUELA DE PSICOLOGÍA
2
Conceptos Generales
La Estadística Descriptiva es aquella área de la Estadística
encargada de desarrollar herramientas destinadas a describir el
comportamiento de una serie de datos, definida mediante una
base de datos, pertenecientes a una población o a una muestra.
Población: conjunto de elementos que tienen algunas
características comunes.
Muestra: subconjunto representativo de elementos de la
población.
Variable: característica interés de estudio
Base de Datos: Se entiende por base de datos un conjunto de
elementos cuantitativos o cualitativos que corresponden a los
valores que toma la variable.
3
Análisis de datos en Psicología
El profesional de la Psicología en su ámbito laboral y de
investigación generalmente maneja y procesa gran cantidad de
información tanto de tipo cuantitativo como cualitativo, en este
sentido, frecuentemente está enfrentado a fenómenos que
requiere analizar, los cuales están definidos en función de
características (o variables) sean éstas cuantitativas o cualitativas.
Para el análisis de información, el psicólogo debe conocer las
metodologías que le permiten organizar la información y así
analizar el comportamiento de las principales características o
variables de interés de estudiar. En este curso se propondrán y
estudiarán una diversidad de herramientas útiles para describir el
comportamiento de la información asociada a las variables interés
de estudio del psicólogo.
4
Organización y Representación de Datos.
Definida la información acerca del fenómeno que se desea
estudiar surge la etapa de “organización y representación de
datos” para el desarrollo de la cual es necesario, en primer lugar,
clasificar la(s) variable(s) a estudiar.
Clasificación de una variable
Discreta
Cuantitativa
Continúa
Variable
Ordinal
Cualitativa
Nominal
5
Variable Cuantitativa es aquella que se expresa en términos de
cantidad, de manera que tiene magnitud y dimensión.
Variable Cualitativa es aquella que se expresa en términos de
cualidad o calidad, de modo que carece de magnitud y dimensión.
Variable Cuantitativa Discreta (VCD) es aquella característica
cuantitativa que en un intervalo cualquiera toma un número finito
o infinito numerable de valores, es decir, toma un número
reducido de valores o un número contable (ó numerable) de
valores.
Variable Cuantitativa Continua (VCC) es aquella característica
cuantitativa que en un intervalo cualquiera toma un número
infinito de valores (siempre entre dos valores es posible encontrar
un tercero).
6
Variable Cualitativa Ordinal (VCO) es aquella característica
cualitativa que es susceptible de ordenar (de forma creciente o
decreciente), por lo tanto, esta variable acepta cualquier condición
de orden (igual, menor, mayor, menor o igual ó a lo más, mayor o
igual ó a lo menos).
Variable Cualitativa Nominal (VCN) es aquella característica
cualitativa que no admite ser ordenada, sólo tiene incidencia su
nombre, de allí su patronímico de “nominal”.
7
Ejemplos de Variables y su clasificación.
Número de pacientes con déficit atencional VCD
Rendimiento académico de un grupo de estudiantes VCC
Nivel Educativo de un grupo de trabajadores VCO
Creencia religiosa de un grupo de personas VCN
Número de patologías de un grupo de estudiantes VCD
Grado de aprendizaje de un grupo de escolares VCO
Región de origen de los pacientes de una consulta VCN
Consumo de fármacos anti ansiolíticos VCC
Nivel de gravedad de un paciente con depresión VCO
Estatura de un grupo de personas VCC
Número de personas del grupo familiar VCD
8
Distribución de Frecuencias.
Es una herramienta estadística diseñada para tabular (ordenar) la
información relativa a una variable en un cuadro o una tabla
estadística que muestra o describe el comportamiento de la
variable.
Caso Variable Cuantitativa Discreta.
Una D. de F. consta, verticalmente, de dos cuerpos, uno referido a
los valores de la variable y el otro que corresponde a la frecuencia
que toman los distintos valores de la variable (frecuencias
absoluta simple, relativa simple, absoluta acumulada, relativa
acumulada); horizontalmente se ubican los valores de los
intervalos de clase de la variable.
9
ClaseValores de
la variable
Frecuencia
absoluta
simple
Frecuencia
relativa
simple
Frecuencia
absoluta
acumulada
Frecuencia
relativa
acumulada
i Xi ni hi N i Hi
1 x1 n1 h1 N1 H1
2 x2 n2 h2 N2 H2
… … … … … …
m xm nm hm Nm = n Hm = 1
n 1
10
Elementos de la Distribución de Frecuencias VCD
Clase i: corresponde al subíndice i que permite distinguir los
distintos valores de la variable definida por la una D de F.
Valores xi: define cada uno de los valores de la variable
Frecuencia absoluta simple: ni es el número de elementos
pertenecientes al valor xi
Frecuencia relativa simple: hi porcentaje o proporción de
elementos que pertenecen al valor xi
Frecuencia absoluta Acumulada: Ni es el número de elementos que
toman a lo más el valor xi
Frecuencia relativa simple: Hi porcentaje o proporción de
elementos que toman a lo más el valor xi
11
Ejemplo de D de F de VCD
Considere la información relativa al número de estudiantes con
déficit atencional en 30 cursos de un instituto educativo de la
Región Metropolitana, señalada en la siguiente base de datos:
Construya la D de F de la variable en estudio
1° Se debe determinar el valor menor (0) y el valor mayor (5), esto
significa que el recorrido de la variable es 0, 1, 2, 3, 4, 5
2° En una tabla vaciar la información de la B de D, y determinar la
frecuencia absoluta simple (ni), frecuencia relativa simple (hi),
frecuencia absoluta acumulada (Ni) y frecuencia relativa
acumulada (Hi).
3 2 4 0 2 4 1 4 1 10 1 2 0 2 3 2 5 1 11 2 0 1 5 1 1 1 3 3
12
Obteniéndose la siguiente D de F.
La cual permite estudiar el comportamiento de la variable en
estudio, número de estudiantes con déficit atencional, de acuerdo
a preguntas que se pueden plantear, como las siguientes:
a. ¿En cuántos cursos existen dos estudiantes con déficit
atencional?
Respuesta: n3 = 6; lo cual significa que en seis cursos existen dos
estudiantes con déficit atencional.
i Xi ni hi Ni Hi
1 0 4 0,13 4 0,132 1 11 0,37 15 0,503 2 6 0,20 21 0,704 3 4 0,13 25 0,835 4 3 0,10 28 0,936 5 2 0,07 30 1,00
30 1,00
13
b. ¿En qué proporción o porcentaje de cursos hay cuatro
estudiantes con déficit atencional? Respuesta: h5 = 0,10; es decir,
en un 10% de los cursos hay cuatro estudiantes con déficit
atencional.
c. ¿En cuántos cursos existen a lo más tres estudiantes con déficit
atencional? Respuesta: N4 = 25; o sea, en 25 de los cursos existen
a lo más tres estudiantes con déficit atencional.
d. ¿En qué porcentaje de cursos hay a lo más dos estudiantes con
déficit atencional? Respuesta: H3 = 0,70; significa que en el 70%
de los cursos hay a lo más dos estudiantes con déficit atencional.
e. ¿En cuántos cursos hay más de dos estudiantes con déficit
atencional? Respuesta: n – N3 = 30 – 21 = 9; quiere decir que en 9
cursos hay más dos estudiantes con déficit atencional.
14
f. ¿En qué porcentaje de cursos hay más de tres estudiantes con
déficit atencional? Respuesta: 1 – H4 = 1 - 0,83 = 0,17; en el 17%
de los cursos hay más tres estudiantes con déficit atencional.
g. ¿En cuántos cursos hay entre 1 y 3 estudiantes (ambos
incluidos) con déficit atencional? N4 – N1 = 24 – 3 = 21; en 21
cursos hay entre 1 y 3 estudiantes con déficit atencional.
De este modo se pueden plantear muchas otras preguntas que
van a permitir describir el comportamiento de la variable en
estudio, número de estudiantes con déficit atencional.
15
Caso D de F de una VCC.
Igual que en el caso de una D. de F. de VCD, ésta consta,
verticalmente, de dos cuerpos, uno referido a los valores de la
variable y el otro que corresponde a la frecuencia que toman los
distintos valores de la variable (frecuencias absoluta simple,
relativa simple, absoluta acumulada, relativa acumulada);
horizontalmente se ubican los valores de los intervalos de clase de
la variable.
En este caso, por tratarse de una variable cuantitativa continúa,
surgen los intervalos de clase, que permiten identificar subclases
de valores entre la totalidad de valores, y las marcas de clase, que
son valores representativos de cada una de las clases o intervalos
de clase.
16
ClaseMarca de
Clase
Frecuencia
absoluta
simple
Frecuencia
relativa
simple
Frecuencia
absoluta
acumulada
Frecuencia
relativa
acumulada
i Y' i-1 Y' i Yi ni hi N i Hi
1 Y' 0 Y' 1 Y1 n1 h1 N1 H1
2 Y' 1 Y' 2 Y2 n2 h2 N2 H2
… … … … … … … …
m Y' m-1 Y' m Ym nm hm Nm = n Hm = 1
n 1
I ntervalos
de Clase
17
Elementos de la Distribución de Frecuencias VCC
Clase i: corresponde al subíndice i que permite distinguir los
distintos intervalos de clase de la variable definida en la una D de
F.
Intervalo de clase: Y’i-1 – Y’i: recorrido entre el límite inferior y
superior de la clase i-ésima;
Marca de clase: Yi: elemento representativo de la clase, se calcula
como el promedio aritmético de los límites de la clase i-ésima;
Frecuencia absoluta simple: ni es el número de elementos
pertenecientes al intervalo de clase i-ésima;
Frecuencia relativa simple: hi porcentaje o proporción de
elementos que pertenecen al intervalo de clase i-ésima;
Frecuencia absoluta Acumulada: Ni es el número de elementos que
toman a lo más el valor Y’i (límite superior de la clase i-ésima)
Frecuencia relativa simple: Hi porcentaje o proporción de
elementos que toman a lo más el valor xi
18
Ejemplo de D de F de VCC
Considere la información sobre el Rendimiento Académico, en
puntos, de un grupo de 70 estudiantes de un instituto educativo.
Construya una D de F de nueve intervalos de clase (m = 9) de
amplitud constante.
3,2 5,5 4,0 5,8 3,1 3,9 3,2 3,9 4,2 6,5
2,5 2,8 3,4 5,6 6,3 4,4 5,4 4,8 5,0 5,7
4,7 6,9 5,1 4,0 5,2 3,8 3,8 7,0 5,5 3,3
3,4 4,9 4,8 2,8 5,0 3,2 5,5 3,7 4,1 2,9
5,9 5,5 2,6 3,0 3,4 4,0 4,4 5,6 3,8 4,6
6,4 5,3 4,4 4,2 3,5 3,9 6,4 4,7 6,6 6,7
4,9 3,6 5,4 3,3 4,0 2,6 4,4 4,1 2,6 3,0
19
Para construir la D de F del Rendimiento Académico del grupo de
estudiantes se debe seguir el siguiente algoritmo:En primer lugar se debe identificar el valor menor (y21 = 2,5) y el
valor mayor de la variable (y38 = 7,0) y así se calcula el recorrido:
R = Ymáx – Ymín = 7,0 – 2,5 = 4,5 (eso quiere decir que en un
recorrido de 4,5 puntos se encuentran todos los valores de la
variable en estudio).
Luego, se calcula la amplitud (constante) como la relación entre el
recorrido (R = 4,5) y el número de clases de la D de F (m = 9),
entonces la amplitud es: c = R/m = 4,5/9 = 0,5, y así se generan
los nueve intervalos de clase: 2,5 – 3,0; 3,0 – 3,5;… y así
sucesivamente.
En seguida, se determina la marca de clase (elemento
representativo de cada clase) Yi, como la semi-suma (ó promedio) de los límites de cada intervalo: Yi = (Y’i-1+Y’i)/2 el que es utilizado
como el elemento representativo de cada intervalo de clase.
Finalmente se cuentan los elementos pertenecientes a cada
intervalo de clase generándose la frecuencia absoluta simple: ni.
(en cada clase se incluye hasta su límite superior).
20
Obteniéndose la siguiente D de F.
Obsérvese que al realizar el conteo de los elementos
pertenecientes a cada clase, el valor 3,0 se considera en la
primera clase y no en la segunda (los intervalos de clase son
cerrados con relación al límite superior Y’i)
i Y'i-1 Y'i Yi ni hi Ni Hi
1 2,50 3,00 2,75 9 0,13 9 0,13
2 3,00 3,50 3,25 10 0,14 19 0,27
3 3,50 4,00 3,75 12 0,17 31 0,44
4 4,00 4,50 4,25 8 0,11 39 0,56
5 4,50 5,00 4,75 9 0,13 48 0,69
6 5,00 5,50 5,25 9 0,13 57 0,81
7 5,50 6,00 5,75 5 0,07 62 0,89
8 6,00 6,50 6,25 4 0,06 66 0,94
9 6,50 7,00 6,75 4 0,06 70 1,00
70 1,00
21
Algunas preguntas sobre esta D de F.-¿Cuántos estudiantes obtienen rendimiento entre 5,0 y 5,5
puntos?Respuesta n6 = 9; existen 9 estudiantes con rendimiento entre 5,0
y 5,5 puntos.-¿Qué proporción o porcentaje de estudiantes tienen entre 3,5 y
4,0 puntos?Respuesta h3 = 0,17; significa que hay un 17% de estudiantes que
tienen entre 3,5 y 4,0 puntos.-¿Cuántos estudiantes obtienen a lo más 5,0 puntos?Respuesta: N5 = 48; hay 48 estudiantes que obtienen a lo más 5,0
puntos.-¿Qué porcentaje de estudiantes obtienen a lo más 4,0 puntos?Respuesta H3 = 0,44; quiere decir que un 44% de los estudiantes
obtienen a lo más 4,0 puntos.-¿Cuántos estudiantes obtienen entre 3,50 y 6,00 puntos?Respuesta N7 – N2 = 62 – 19 = 43; existen 43 estudiantes cuyo
rendimiento está entre 3,50 y 6,00 puntos.
22
Caso Variables Cualitativas.
En el caso de las variables cualitativas la D de F es simple, lo único
que debe tenerse en cuenta es el conjunto de valores que toma la
variable y la frecuencia con que ocurren.
Por ejemplo para una variable ordinal como el nivel educativo la D
de F adquiere la siguiente estructura:
Existen cuatro valores. Lea e interprete el significado de las siguientes cifras: n3 = 15; h2 = 0,4; N2 = 30; H3 = 0,9.
Para una VCN, la situación es de simplísima, puesto que sólo tienen sentido las fas (ni) y frs (hi).
iNivel
Educativoni hi Ni Hi
1 Pre escolar 10 0,2 10 0,22 Básico 20 0,4 30 0,63 Medio 15 0,3 45 0,94 Superior 5 0,1 50 1,0
50 1,0
23
Representación Gráfica.
La representación gráfica será tratada mediante el uso del
software Excel y se revisa en una clase que se realiza en el
laboratorio de computación utilizando un algoritmo desarrollado
para esta finalidad.
Se desarrollan gráficos para:fas (ni): histograma;
frs (hi): gráfico circular;FAA (Ni): ojiva