Post on 30-Dec-2015
description
ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA
• Los orígenes de la estadística, aunque no se sabe con exactitud cuándo se comenzó a utilizar, pueden estar ligados al antiguo Egipto como a los censos chinos que se realizaron hace unos 4.000 años, aproximadamente.
• Sin duda, fueron los romanosromanos, maestros de la organización política, quienes mejor supieron ocupar la estadística. Cada cinco años realizaban un censo de la población, cuyos datos de nacimientos, defunciones y matrimonios eran esenciales para estudiar los avances del imperio; sin olvidar los recuentos de ganancias y las riquezas que dejaban las tierras.
ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA
• Para poder comprender mejor este tipo de estudio es importante que conozcas los siguientes términos básicos:
Población: Es un conjunto de personas, eventos o cosas de las cuales se desea hacer un estudio, y tienen una característica en común.
ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVAMuestra: Es un subconjunto cualquiera de la población; es importante escoger la muestra en forma aleatoria (al azar), pues así se logra que sea representativa y se puedan obtener conclusiones más a fines acerca de las características de la población.
ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA
Todo estudio estadístico debe considerar diferentes tipos de variables:
VariablesVariables
Variables cualitativasVariables Cuantitativas
ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA
Variables cualitativas: Relacionadas con características no numéricas de un individuo (por ejemplo: atributos de una persona, nacionalidad, color de la piel, sexo).
ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVAVariables Cuantitativas: Relacionadas con características numéricas del individuo por ejemplo: edad, precio de un producto, ingresos anuales. Las variables cuantitativas se dividen en discretas (aquellas que pueden tomar solo algunos valores en un intervalo y no valores intermedio, ejemplo: edad, número de hermanos que puede ser 1, 2, 3....,etc, pero, por ejemplo, nunca podrá ser 3,45) o continuas (aquellas que pueden tomar cualquier valor en un intervalo real, ejemplo: alturas, la velocidad de un vehículo puede ser 80,3 km/h, 94,57 km/h...etc.).
Estadística Descriptiva: Es la parte de la estadística que trata solamente de describir y analizar un grupo dado sin sacar conclusiones o inferencias de un grupo mayor, a partir de ella. La estadística descriptiva incluye las técnicas
que se relacionan con el resumen y la descripción de datos numéricos. Estos datos pueden ser gráficos o pueden incluir análisis computacional.
Estadística Inferencial: Cuando una muestra es representativa de una
población se pueden deducir importantes conclusiones acerca de esta, a partir de su análisis. La inferencia estadística comprende aquellas técnicas por
medio de las cuales se toma decisiones sobre una población estadística basadas solo en la muestra observada. Debido a que dichas decisiones se
toman en condiciones de incertidumbre, entonces estas serán confiables con cierto grado de probabilidad. Considerando que las características medidas de una muestra se denominan estadísticas de la muestra, las características
medidas de una población estadística, o universo se llaman parámetros de la población.
ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVAOrdenando la Información
Al ordenar datos muy numerosos, es usual agruparlos en clases o categorías. Al determinar cuántos pertenecen a cada clase, establecemos la frecuencia. Construimos así una tabla de datos llamada tabla de frecuencias.
ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA
¿Para qué se construyen las ¿Para qué se construyen las tablas de frecuencias ?tablas de frecuencias ?
1.1. ORDENARORDENAR
2.2. AGRUPARAGRUPAR
3.3. RESUMIR informaciónRESUMIR información
ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVAEl formato general de una tabla estadística , llamada también TABLA DE FRECUENCIAS O TABLA DE DISTRIBUCIÓN DE FRECUENCIAS es la siguiente:
Nombre de la variable
Frecuencia
Categorías o
Recorrido de la variable
Frecuencias
Observadas
TOTAL n
ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVAEn la siguiente tabla se presenta el motivo de la consulta médica, durante una semana.
Motivo Consulta Número de pacientes
Bronquitis 19
Otitis 13
Heridas 7
Fracturas 18
Vacunas 20
ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA
TIPOS DE FRECUENCIAS
a)a) Frecuencia o Frecuencia Absoluta: Es el número de veces que se presenta un valor o categoría de una variable. Se representa por fi.
b) Frecuencia Relativa: La frecuencia relativa se puede expresar en términos de porcentaje o de proporción y se representa por fr. (Es la razón entre la frecuencia absoluta y el total de datos)
ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA
Los siguientes datos corresponden a las notas obtenidas por un curso de 24 alumnos 24 alumnos en un trabajo de matemáticas:
3,2 4,2 5,6 6,0 2,8 3,9 4,2 4,2 5,0 5,0 3,9 3,9 3,2 3,2 4,2 5,6 6,0 6,0 3,2 6,0 4,2 5,0 5,6 5,0
Ordenemos estos datos en una tabla:Ordenemos estos datos en una tabla: Anota en tu cuaderno una tabla de frecuencias que considere• Nombre de variable: NotasNombre de variable: Notas• Frecuencia AbsolutaFrecuencia Absoluta• Frecuencia relativa (ambas)Frecuencia relativa (ambas)Si tu resultado es un decimal, usa 3 dígitos Si tu resultado es un decimal, usa 3 dígitos después de la comadespués de la coma
ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA
NotaNota Frecuencia Frecuencia AbsolutaAbsoluta
Frecuencia Frecuencia RelativaRelativa
Frecuencia Relativa Frecuencia Relativa Porcentual (%)Porcentual (%)
2,82,8
3,23,2
3,93,9
4,24,2
5,05,0
5,65,6
6,06,0
ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA
NotaNota Frecuencia Frecuencia AbsolutaAbsoluta
Frecuencia Frecuencia RelativaRelativa
Frecuencia Relativa Frecuencia Relativa Porcentual (%)Porcentual (%)
2,82,8 1 0,041 4,166
3,23,2 4 0,166 16,666
3,93,9 3 0,125 12,500
4,24,2 5 0,208 20,833
5,05,0 4 0,166 16,666
5,65,6 3 0,125 12,500
6,06,0 4 0,166 16,666
¿Qué conclusiones puedes obtener de la tabla anterior?¿Qué conclusiones puedes obtener de la tabla anterior?
ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA
Hasta el momento sólo hemos trabajado con una pequeña cantidad de datos. ¿Qué crees que deberíamos hacer si tenemos muchos datos?
Tabla de Frecuencias de datos agrupados (tambien llamadas tabla de frecuencias con clase)
En ocasiones, el agrupar los datos en intervalosintervalos, nos puede ayudar para realizar un mejor análisis de ellos.
ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVADefiniciones:•Rango: Diferencia entre el máximo y el mínimo valor de una variable.
•Marca de clase: Representante de un intervalo, y corresponde al promedio entre los extremos de éste.
•Tamaño de un intervalo: Es el cuociente entre el valor del rango y la cantidad de intervalos que se desea obtener. Se recomienda tomar como longitud de los intervalos un valor entero que sea mayor o igual al cuociente obtenido.
ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVAPara estas tablas debemos considerar cada intervalo con límites cerrado y abierto, o sea [ - [La tabla siguiente la vamos a elaborar con: frecuencias absolutas: estas frecuencias son las que se obtienen directamente del conteofrecuencias relativas: corresponden a los porcentajes de cada frecuencia absoluta.frecuencia absoluta acumulada: corresponde a la frecuencia absoluta del intervalo más la suma de las frecuencias absolutas de todos los valores anteriores.frecuencia relativa acumulada: corresponde al porcentaje de la frecuencia relativa del intervalo más la suma de las frecuencias relativas de todos los valores anteriores.
Nivel de colesterol en la sangre de una muestra de hombres estadounidenses que tienen entre 25 y 34 años de edad , que fueron atendidos en centros médicos de New York y sufren de hipertensión arterial , en el año 2001
Nivel de Colesterol (mg/100 ml) Cantidad de hombres
80-120 13
120-160 15
160-200 44
200-240 29
240-280 9
¿Cuál es la variable de interés?
¿Qué se mide?
Observa: El rango de cada intervalo es de 40.Observa: El rango de cada intervalo es de 40.
ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVAEjemplo:Consideremos los siguientes datos, expresados en metros, correspondientes a las estaturas de 80 estudiantes de Cuarto año de Educación Media.
1,67 1,72 1,81 1,72 1,74 1,83 1,84 1,88 1,921,75 1,84 1,86 1,73 1,84 1,87 1,83 1,81 1,771,73 1,75 1,78 1,77 1,67 1,83 1,83 1,72 1,711,85 1,84 1,93 1,82 1,69 1,70 1,81 1,66 1,761,75 1,80 1,79 1,84 1,86 1,80 1,77 1,80 1,761,88 1,75 1,79 1,87 1,79 1,77 1,67 1,74 1,751,78 1,77 1,74 1,73 1,83 1,76 1,83 1,77 1,751,77 1,77 1,84 1,83 1,79 1,82 1,76 1,76 1,761,79 1,88 1,66 1,80 1,72 1,75 1,79 1,77
ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVAEstatura Mayor: 1,93 metrosEstatura Menor: 1,66 metrosRango: 1,93 metros - 1,66 metros = 0,27 metros = 27 cm.
Formaremos 6 intervalos. Para calcular el tamaño de intervalo de cada uno dividimos 27 y 6, obteniendo finalmente 4,5 5Luego los intervalos de la tabla son:
Intervalo Marca de Clase Frecuencia Absoluta
1,65 – 1,69
1,70 – 1,74
1,75 – 1,79
1,80 – 1,84
1,85 – 1,89
1,90 – 1,94
ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA
Representaciones Gráficas Para hacer más clara y evidente la información que nos dan las tablas se utilizan los gráficos. Existen múltiples tipos de gráficos, pero aquí trataremos solamente de los usados más frecuentemente, que son: gráfico de barras, gráfico de sectores o circular (pastel), histograma, polígono de frecuencias, la ojiva y el pictograma.
La información contenida en las tablas de La información contenida en las tablas de frecuencias resulta más accesible y fácil de frecuencias resulta más accesible y fácil de interpretar si se representan por medio de gráficos interpretar si se representan por medio de gráficos estadísticos.estadísticos.
GRÁFICOSGRÁFICOSGráficos estadísticos Gráficos estadísticos
Diagrama de barras
Se usa fundamentalmente para representar distribuciones de frecuencias de una variable cualitativa o cuantitativa discreta y, ocasionalmente, en la representación de series cronológicas o históricas. Uno de los ejes sirve para inscribir las frecuencias, ya sean absolutas o relativas (%), y el otro para la escala de clasificación utilizada.
GRÁFICOSGRÁFICOS
Histograma
Está formado por rectángulos, cuyas bases corresponden con los intervalos de clase y sus Áreas son iguales o proporcionales a sus frecuencias. Este gráfico se usa para representar una distribución de frecuencias de una variable cuantitativa continua. Habitualmente se representa la frecuencia observada en el eje Y, y en el eje X la variable
GRÁFICOSGRÁFICOSPolígono de frecuencias
Es una línea poligonal que une los vértices superiores de las barras de un diagrama de barras, o los puntos medios de las bases superiores de los rectángulos de un histograma. Se utiliza, al igual que el histograma, para representar distribuciones de frecuencias de variables cuantitativas continuas, pero como no se utilizan barras en su confección sino segmentos de recta, de ahí el nombre de polígono. Habitualmente se usa cuando se quiere mostrar en el mismo gráfico más de una distribución.
GRÁFICOSGRÁFICOSDiagrama de sectores o gráfico circular
Gráfico circular: Se usa, fundamentalmente, para representar distribuciones de frecuencias relativas (%) de una variable cualitativa o cuantitativa discreta. En este gráfico se hace corresponder la medida del ángulo de cada sector con la frecuencia correspondiente a la clase en cuestión. Si los 360º del círculo representan el 100 % de los datos clasificados, a cada 1% le corresponderán 3,6º. Luego, para obtener el tamaño del ángulo para un sector dado bastaría con multiplicar el por ciento correspondiente por 3,6º (por simple regla de tres).
GRÁFICOSGRÁFICOSPictogramas
Los pictogramas son gráficos similares a los gráficos de barras, pero empleando un dibujo en una determinada escala para expresar la unidad de medida de los datos. Se utiliza un dibujo relacionado con el tema, para representar cierta cantidad de frecuencias. Este tipo de gráfica atrae la atención por los dibujos, pero la desventaja es que se lee en forma aproximada.
Gráfico de líneas u ojiva
En este tipo de gráfico, al igual que el histograma y el polígono de frecuencias el objetivo es representar distribuciones de frecuencias de variables cuantitativas continuas, pero sólo para frecuencias acumuladas. se representan los valores de los datos en dos ejes cartesianos ortogonales entre sí. Se pueden usar para representar: una serie o más series
ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVAEjercicios: 1)Construya una tabla de frecuencia de los siguientes gráficos.
ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA
DíasDías N° ArtículosN° Artículos Frecuencia Frecuencia RelativaRelativa
Frecuencia Frecuencia relativa relativa
porcentualporcentual
LunesLunes 33 0,1290,129 12,912,9
MartesMartes 5,25,2 0,2240,224 22,422,4
MiércolesMiércoles 4,84,8 0,2060,206 20,620,6
JuevesJueves 66 0,2580,258 25,825,8
ViernesViernes 4,24,2 0,1810,181 18,118,1
TotalTotal 23,223,2 0,9980,998 99,899,8
ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA
EdadEdad Frecuencia Frecuencia AbsolutaAbsoluta
Frecuencia Frecuencia RelativaRelativa
Frecuencia Frecuencia Relativa %Relativa %
20-24 6
24-28 5
28-32 3
32-36 2
Total 16
MEDIDAS DE RESUMENMEDIDAS DE RESUMEN
Entre las medidas que permiten Entre las medidas que permiten resumir información proveniente de resumir información proveniente de una población, podemos una población, podemos considerar las medidas de considerar las medidas de posición, medidas de dispersión y posición, medidas de dispersión y medidas de forma.medidas de forma.
Medidas de PosiciónTienen por objeto, obtener un valor Tienen por objeto, obtener un valor que resuma en sí todas las que resuma en sí todas las mediciones. La mayoría de ellas trata mediciones. La mayoría de ellas trata de ubicar el centro de la distribución, de ubicar el centro de la distribución, razón por la cual, se llaman razón por la cual, se llaman MEDIDAS DE TENDENCIA MEDIDAS DE TENDENCIA CENTRAL; estas son: Media, CENTRAL; estas son: Media, Mediana y Moda.Mediana y Moda.
MEDIDAS DE TENDENCIA CENTRAL
Media aritmética o promedio: Es una de las medidas de tendencia central de mayor uso. La media muestral se simboliza por y la media poblacional de denota por .
X
PROMEDIO PARA DATOS NO TABULADOSPROMEDIO PARA DATOS NO TABULADOS
Sea X una variable cuantitativa y x1, x2,…, xn una muestra
de tamaño "n" de valores de la variable, se define la media aritmética de X como:
n
xxxxX n
.....321
n
xX
n
ii
1
PROMEDIO PARA DATOS TABULADOSPROMEDIO PARA DATOS TABULADOS
Para calcular la media aritmética de un conjunto de datos, se suma cada uno de los valores y se divide entre el total de casos.Sea X una variable estadística que toma los valores , con frecuencias absolutas , respectivamente, la media viene dada por:
n
ii
n
iii
n
nn
f
fx
fff
fxfxfxx
1
1
21
2211
...
...
Ejemplo N°1
Consideremos la edad en años de ocho personas
10 18 25 32 12 5 7 7
En este ejemplo el promedio , media o media aritmética de la edad de estas personas está dada por:
87751232251810 x
Es decir la edad promedio de estas personas es de 14,5 años.
Mediana (Me)
Sea X una variable por lo menos ordinal y sea x1, x2,…xn una muestra de
tamaño n de observaciones de la variable, se define como Mediana "Me" un valor tal que supera a no más del 50% de las observaciones y es superado por no más del 50% de las observaciones, cuando estas han sido ordenadas según magnitud.
MEDIANA PARA DATOS NO TABULADOS
Ejemplo: Consideremos la edad en años de ocho personas
10 18 25 32 12 5 7 7
Para calcular la mediana , previamente se deben ordenar las observaciones. En este caso lo haremos en forma creciente:
5 7 7 10 12 18 25 32
Como la cantidad de datos es par, entonces la mediana corresponde al promedio de los datos centrales, por lo tanto la mediana es 11.
MEDIANA PARA DATOS TABULADOSMEDIANA PARA DATOS TABULADOS
En casos de datos agrupado es un poco más complejo y requiere de la utilización de la siguiente fórmula
límite inferior de la clase mediana amplitud del intervalo número total de datos frecuencia absoluta acumulada de la clase anterior a la mediana frecuencia absoluta de la clase mediana
i
i
i f
FN
cLM12
iLcN 1iF
if
Moda o Modo (Mo) para datos no tabulados
La moda se identifica al observar el valor que se presenta con más frecuencia en la distribución.
Si consideramos el ejemplo del peso de una muestra de personas: 65 76 48 48 68 78 90 87 67 72 78
Mo = 48 kilos
Mo = 78 kilos.
Esto significa que la mayoría de estas personas pesa 48 kilos y 78 kilos.
Esta distribución es bimodal. Moda o Modo (Mo) para datos tabulados
Ahora bien, en el caso de datos agrupados en intervalos, es fácil determinar la clase modal (clase con mayor frecuencia), pero el valor dentro del intervalo que se presume tenga mayor frecuencia se obtiene a partir de la siguiente expresión: límite inferior de la clase modal.amplitud de los intervalos.diferencia entre la frecuencia absoluta de la clase modal y la frecuencia absoluta de la clase anterior.diferencia entre la frecuencia absoluta de la clase modal y la frecuencia absoluta de la clase siguiente.
Cuantiles La mediana divide a la distribución en dos partes iguales, los cuantiles son parámetros que dividen los datos de la distribución en partes iguales. Los más usados son: Cuartiles:Se llaman cuartiles a tres valores que dividen a la serie de datos en cuatro partes iguales. ( cuartil primero, cuartil segundo y cuartil tercero ) Quintiles:Se llaman quintiles a cuatro valores que dividen a la serie en cinco partes iguales. ( quintil primero,... ) Deciles:Nueve valores iguales que dividen la distribución en 10 partes iguales. ( decil primero,...) Percentiles: Noventa y nueve valores que dividen la serie en 100 partes iguales.( percentil primero,... ) El cálculo es análogo al de la mediana.