Estadistica toño 11
-
Upload
antonio-botero -
Category
Documents
-
view
514 -
download
0
description
Transcript of Estadistica toño 11
ESTADÍSTICA
La ESTADÍSTICA es la parte de las Matemáticas que tiene por objeto estudiar fenómenos físicos, biológicos, económicos, sociales, etc. , a partir de datos recogidos de numerosas experiencias u observaciones.
1. INFORMACIÓN ESTADÍSTICA. CONCEPTOS BÁSICOS.
El conjunto de todos los elementos que cumplen una determinada característica y sobre el que se desea obtener información se denomina población. La población viene representada usualmente por la letra N.
Cada uno de los elementos que forman la población es un individuo.Para recoger información acerca de la población se realiza una encuesta. Esta recogida de información se
hace bien por observación o mediante preguntas.Por razones de economía, tiempo o necesidad, en Estadística no se trabaja con el total de la población, sino
con una parte de la misma.Una muestra es cualquier subconjunto o parte de la población. Esta muestra tiene que ser representativa de
toda la población objeto de estudio. Uno de los procesos para elegir de manera adecuada una muestra es el muestreo aleatorio; en él, todos los elementos de la población tienen la misma probabilidad de ser incluidos en la muestra. El tamaño de la muestra se representa mediante la letra n. Ejemplos :
a) Población: Socios de un club de tenis ( 500 personas (300 hombres y 200
mujeres) ). N = 500. Muestra: 10 % de los socios ( 50 personas (30 hombres y 20 mujeres) ). n = 50.
b) Población: Ciudadanos con derecho a voto ( 4 millones (2’5 millones hombres y 1’5 millones mujeres) ). N = 4.000.000. Muestra: 1 ‰ de la población ( 4.000 personas (2.500 hombres y 1.500 mujeres) ). n = 4.000. 2. VARIABLES ESTADÍSTICAS.
Cada uno de los aspectos que se desea conocer acerca de la población se denomina variable estadística. Las variables estadísticas pueden ser:
Cualitativas: si se pueden observar o leer, pero no se pueden contar o medir. Por ejemplo: color de pelo,
lugar de nacimiento, profesión. Cuantitativas: si se pueden contar o medir. Por ejemplo: número de hermanos, peso, número de discos
vendidos, talla. Las variables estadísticas cuantitativas pueden ser discretas o continuas:
Una variable estadística cuantitativa es discreta cuando sólo toma un número finito de valores aislados (es decir, se puede contar). Por ejemplo: número de hermanos, número de discos vendidos, número de pulsaciones.
Una variable estadística cuantitativa es continua cuando puede tomar todos los valores posibles de un intervalo (es decir, se puede medir). Por ejemplo: peso, talla, medida del salto de longitud.
Los valores de una variable estadística se representan por
x x x xk1 2 3, , , ,Observación:En algunos textos se habla de caracteres estadísticos cualitativos y cuantitativos, y sólo se consideran
variables estadísticas las cuantitativas, es decir las que se pueden medir.
3. FRECUENCIAS ABSOLUTAS Y RELATIVAS. TABLAS ESTADÍSTICAS.
Con los datos desordenados obtenidos en la encuesta, se construyen unas tablas ordenadas. Estas tablas recogen el número de individuos que toma los diferentes valores de la variable, son las frecuencias.
Frecuencia absoluta de un valor de la variable es el número de veces que se repite dicho valor.
La frecuencia absoluta del valor xi se representa por f i .La correspondencia que asocia a cada valor de la variable su frecuencia absoluta se llama distribución estadística.
Frecuencia relativa de un valor de la variable es el cociente entre la frecuencia absoluta del valor y el
número total de datos.
La frecuencia relativa del valor xi se representa por hi , por tanto
h
f
ni
i
Frecuencia absoluta acumulada de un valor de la variable, xi , es la suma de las frecuencias absolutas
de los valores menores o iguales a xi .
La frecuencia absoluta acumulada del valor xi se representa por Fi , así tenemos que
F f f fi i 1 2
Frecuencia relativa acumulada de un valor de la variable, xi , es el cociente entre la frecuencia absoluta
acumulada del valor xi y el número total de datos.
La frecuencia relativa acumulada del valor xi se representa por H i , así tenemos que
H
F
n
f f f
n
f
n
f
n
f
nh h hi
i i ii
1 2 1 2
1 2
Para construir las tablas estadísticas formaremos varias columnas: una en la que figuren los valores de la
variable, otra de frecuencias absolutas, otra de frecuencias relativas, otra de frecuencias absolutas acumuladas, otra de frecuencias relativas acumuladas y otra de porcentajes.
Si la variable estadística es discreta con un número grande de datos (por ejemplo, número de discos vendidos) o es continua, se realiza un agrupamiento de los datos en intervalos, que en Estadística se denominan clases.
Para realizar un buen agrupamiento debemos tener en cuenta los siguientes puntos: - Es aconsejable escoger los extremos inferior y superior de cada intervalo de modo que se sitúen en
números “redondos”; por ejemplo, múltiplos de 5, de 10, etc.- Todas las clases deben tener la misma amplitud.- Los puntos medios de cada clase se llaman marcas de clase.- El número de clases que debemos formar es de libre elección, pero existe un criterio general que aconseja
formar tantas clases como la raíz cuadrada del número total de datos. Ejemplos :
1) En un centro de enseñanza secundaria hay ocho clases de tercero de E.S.O. y se quiere tener una información sobre el número de hermanos de los alumnos.
Variable: Número de hermanos del alumno (var. estad. cuantitativa discreta).Población: Curso de 3º de E.S.O. Muestra: 30 alumnos seleccionados al azar de las ocho clases. n = 30.
xi (nº de hermanos) f i (nº de alumnos) Fi hi H i %
0 3 3 3/30 3/30 101 9 12 9/30 12/30 302 13 25 13/30 25/30 43’333 2 27 2/30 27/30 6’664 1 28 1/30 28/30 3’335 1 29 1/30 29/30 3’338 1 30 1/30 30/30 = 1 3’33 n 30 1 99’98
2) En un centro de enseñanza secundaria hay ocho clases de tercero de E.S.O. y se quiere tener una información sobre el peso de los alumnos.
Variable: Peso de los alumnos (var. estad. cuantitativa continua).Población: Curso de 3º de E.S.O.Muestra: 30 alumnos seleccionados al azar de las ocho clases. n = 30.
Datos recogidos: 42, 48, 51, 55, 57, 52, 50, 58, 62, 70, 49, 52, 51, 73, 67, 61, 56, 56, 54, 46, 63, 54, 59, 61, 53, 52, 52, 57, 59, 55. Clases
(peso del alumno)xi
(marca de clase)
f i (nº de alumnos)
Fi hi H i %
[ 40 , 45 ) 42’5 1 1 1/30 1/30 3’33[ 45 , 50 ) 47’5 3 4 3/30 4/30 10[ 50 , 55 ) 52’5 10 14 10/30 14/30 33’33[ 55 , 60 ) 57’5 9 23 9/30 23/30 30[ 60 , 65 ) 62’5 4 27 4/30 27/30 13’33[ 65 , 70 ) 67’5 2 29 2/30 29/30 6’66[ 70 , 75 ) 72’5 1 30 1/30 30/30 = 1 3’33
n 30 1 99’98 3. REPRESENTACIONES GRÁFICAS.
La forma más inmediata de hacer comprensible la información estadística es a través de las gráficas estadísticas. La elección de determinada gráfica estadística estará en función del tipo de datos que se manejen en el estudio que se realiza. Los principales tipos de gráficas son los siguientes:
Diagrama de barras y polígono de frecuencias.
Se utiliza para representar variables cualitativas o cuantitativas discretos sin agrupar en clases. Para
construir el diagrama de barras se representan sobre el eje de abscisas los datos y sobre el eje de ordenadas las frecuencias absolutas. Sobre cada valor de la variable se levanta una barra de longitud igual a la frecuencia absoluta.
Si unimos los extremos de las barras obtenemos el polígono de frecuencias. Ejemplo: Vamos a representar al diagrama de barras asociado a la distribución que clasifica a los
alumnos según el número de hermanos ( ejemplo 1) ).
Histograma y polígono de frecuencias.
Se utiliza para representar variables cuantitativas discretas agrupadas en clases o variables
cuantitativas continuas. Para construir el histograma se representan sobre el eje de abscisas los extremos
0
2
4
6
8
10
12
14
0 1 2 3 4 5 6 7 8
Número de hermanos
Nú
mero
de a
lum
no
s
de las clases y sobre el eje de ordenadas las frecuencias absolutas. Se construyen unos rectángulos de base la amplitud de cada clase y de altura la frecuencia absoluta de cada clase.
Si unimos los puntos medios de los lados superiores de cada rectángulo obtenemos el polígono de frecuencias.
Ejemplo: Vamos a representar el histograma asociado a la distribución que clasifica a los alumnos según su peso en kilogramos ( ejemplo2) ).
Diagrama de sectores.
Se utiliza para representar fundamentalmente variables cualitativas. Consiste en un círculo dividido en
tantos sectores circulares como modalidades tiene la variable. El ángulo central de cada sector ha de ser proporcional a la frecuencia absoluta correspondiente.
Para calcular la medida del ángulo se hace la siguiente operación: hi 360º
Ejemplo: Se realiza sobre la población y muestra de los ejemplos 1) y 2) el estudio de la variable cualitativa “Autonomía de nacimiento del alumno”.Vamos a representar mediante un diagrama de sectores la distribución estadística que clasifica a los alumnos según la autonomía de nacimiento. Para el cálculo del ángulo central procedemos así:
Autonomía Número de alumnos
Medidadel ángulo central
Andalucía
19
19
30360 228 º º
Castilla-La Mancha
7
7
30360 84 º º
Cataluña
2
2
30360 24 º º
Galicia
1
1
30360 12 º º
País Vasco
1
1
30360 12 º º
El diagrama de sectores asociado sería el siguiente:
0
2
4
6
8
10
12
40 45 50 55 60 65 70 75 Peso en Kg.
Número de alumnos
4. PARÁMETROS ESTADÍSTICOS. Observación: El cálculo de parámetros estadísticos se restringe a las variables estadísticas cuantitativas. No podemos calcular parámetros de variables cualitativas, aunque si podemos hacer sus tablas de frecuencias y representarlas gráficamente. MEDIDAS DE CENTRALIZACIÓN.
Se llaman medidas de centralización a los parámetros que tienden a situarse hacia el centro del conjunto de datos ordenados. Las medidas de centralización son valores que representan el conjunto de los datos.
Las medidas de centralización más importantes son: la media aritmética, la mediana y la moda. Media aritmética .
La media aritmética de una variable estadística es el cociente entre la suma de todos los valores de la
variable y el número de éstos (tamaño muestral). Se representa por x .
Si la variable toma los valores xi con frecuencias absolutas f i , la media aritmética es:
x
x f x f x f
n
x f
nk k
i i
i
k
1 1 2 2 1
Si los datos están agrupados en clases, se toma para xi las marcas de clase. Ejemplos :
1)
x
0 3 1 9 2 13 3 2 4 1 5 1 8 1
30193'
2)
x
42 5 1 47 5 3 52 5 10 57 5 9 62 5 4 67 5 2 72 5 1
305616
' ' ' ' ' ' ''
Mediana.
Andalucía
Castilla-La Mancha
Cataluña
Galicia
País Vasco
La mediana de una variable estadística es el valor de la variable que ocupa el lugar central de los datos. Se representa por Me.
Si el número de datos es impar se toma como valor de la mediana el valor central.Si el número de datos es par se toma como valor de la mediana la media aritmética de los dos valores
centrales. Ejemplos :
1) Me = 2 ( los valores 15º y 16º son 2 )2) Me = 57’5 ( los valores 15º y 16º están en la clase [55,60) )
Moda.
La moda de una variable estadística es el valor de la variable que tiene mayor frecuencia absoluta. Se
representa por Mo.Si los datos están agrupados en clases se toma como valor de la moda la marca de la clase que tiene
mayor frecuencia absoluta. Esta clase se llama clase modal. Ejemplos :
1) Mo = 2 . 2) Mo = [50,55) .
MEDIDAS DE DISPERSIÓN.
Se llaman medidas de dispersión a los parámetros que miden las desviaciones respecto de la media. Las medidas de dispersión amplían la información sobre la distribución de los datos, estableciendo si están más o menos próximos unos de otros.
Las medidas de dispersión más importantes son :el rango o recorrido, la varianza y la desviación típica. Rango o recorrido.
El rango o recorrido de una variable estadística es la diferencia entre el mayor y el menor valor de la
variable.Esta medida tiene el inconveniente de que sólo depende de los valores extremos de la variable. Ejemplos :
1) Rango = 8 – 0 = 8 . 2) Rango = 72’5 – 42’5 = 30 .
Varianza.
La varianza de una variable estadística es la media aritmética de los cuadrados de las desviaciones
respecto a la media. Se representa por 2 .
n
xxf
n
xxfxxfxxf
k
iii
kk
1
222
222
112
Ejemplos :
1) 2 2 395 '
. 2)
2 415 '
.
Desviación típica.
La desviación típica de una variable estadística es la raíz cuadrada positiva de la varianza. Se representa por .
Ejemplos :
1) 1547' . 2) 6 446' .