Estadistica Descriptiva
description
Transcript of Estadistica Descriptiva
Lady Mariebelia Elías
Es una ciencia que estudia fenómenoscolectivos, mediante la observación numérica,análisis matemático y la interpretación lógicade los datos.
Estadística Descriptiva o Deductiva: es la parte dela estadística que da los procedimientos paratransformar los datos del análisis en unfenómeno colectivo. Puede ser:◦ Gráficamente
◦ Cálculo de medidas numéricas
Estadística Inferencial o Inductiva: es la parte delos métodos estadísticos que ayuda a conoceralgún aspecto de la población mediante elconocimiento de ciertos aspectos de la muestra.
Población: colección completa de los objetosde investigación.
Muestra: subconjunto de la población aestudiar.
Variables: características de los objetos de lapoblación a investigar.
Población: puede ser finita o infinita.
Muestra: probabilística y no probabilística.◦ Muestra Probabilística:
Muestreo Aleatorio Simple
Muestro Aleatorio Estratificado
Muestreo Sistemático
◦ Muestreo no probabílistico
Tipos de variables:Dependiendo del número de características:
◦ Variables unidimensionales
◦ Variables bidimensionales
◦ Variables pluridimensionales o multidimensionales
Dependiendo del tipo de datos
◦ Categóricas o cualitativas
◦ Numéricas o cuantitativas
Cualitativa: se hace con base a unadeterminada cualidad.
Cuantitativa: Permite diferenciar individuos,señalando que tan grandes son lasdiferencias observadas.
Discretas: es la variable cuyos valoresnuméricos se pueden contar o son finitos enun intervalo cualquiera.
Continuas: se da cuando los valoresnuméricos que forman la variable en unintervalo cualquiera son infinitos.
Formas de clasificar los datos:◦ Nominal: se usa como medidas de identidad. Los
datos no pueden acomodarse según esquema de ordenamiento.
◦ Ordinal: permite establecer relaciones del tipo “mayor que” o “menor que”. Tiene un orden significativo
Por intervalos: se mide de manera numérica, y al igual que los datos ordinales si llevan un orden y se pueden determinar magnitudes de diferencias entre los datos que tienen algún significado.
Razones: se diferencia de la escala por intervalos únicamente porque el cero no es representativo.
Fuentes para obtener datos:◦ Fuentes internas
◦ Fuentes externas
Técnicas para recopilar datos:◦ Encuesta
◦ Entrevista
◦ Cuestionario
◦ Observación
• Número de preguntas deber ser conservado en un mínimo,para lo cual se debe revisar primero los problemas delestudio, y precisar que preguntas son pertinentes pararesolver los problemas.
• Preguntas deben ser claras y breves, mientras más larga esuna pregunta, más difícil es entenderla.
• Evitar preguntas ofensivas.
• Evitar preguntas que induzcan una respuesta
• Las preguntas deben ser fáciles de contestar
• Las preguntas deben requerir de respuestas simples
Corrección
Registros
internos
Datos
publicados
Resultados
de encuestas
Clasificación
Cronológica
Geográfica
Cualitativa
Cuantitativa
Tabulación
Manual
Bases de
datos en pc
Distribución de frecuencias:Es una representación de la relación entre unconjunto de medidas o clases de medidas y lafrecuencia de cada una de ellas.
Al hacer una distribución de los datos, podemosclasificar la información obtenida en forma:
Cronológica o histórica
Geográfica
Cualitativa
Cuantitativa
Esta nos indica la frecuencia con queaparecen los números, desde el menor delconjunto hasta el mayor o viceversa.
n: el tamaño de la muestra, es el número de observaciones.
Xi: la variable; es cada uno de los diferentes valores que sehan observado.
fi: la frecuencia absoluta o solo frecuencia, es el número deveces que se repite la variable Xi.
Fa: la frecuencia acumulada; se obtiene acumulando lafrecuencia absoluta.
fr: frecuencia relativa; es el resultado de dividir c/u de lasfrecuencias absolutas por el tamaño de la muestra.
Fra: frecuencia relativa acumulada; se obtiene dividiendo lafrecuencia acumulada entre el tamaño de la muestra.
Organiza en una distribución de frecuencias simples y acumuladas la siguiente distribución.
Punteos obtenidos en el primer examen de Estadística 1.
52 54 55 53 52 54 51 55 53
50 55 54 52 54 56 54 55 55
54 51 53 54 53 55 53 56 56
55 50 55 54 52 54 55 53 55
54 55 52 54 51 53 53 53 53
54 55 55 54 56
Es un método estadístico que se utiliza para estudiar el comportamiento de un conjunto de datos y consiste en formar grupos de valores consecutivos de la variable y poner cada uno de estos grupos en cada fila.
Ordenar los datos de mayor a menor o viceversa.
Calcular el rango o recorrido. R=Xmax-Xmin
Determinar el número de clases: k=1+3.3log(n) fórmula de Sturges
Determinar el intervalo de clase i=R/k
Formar los intervalos (límites aparentes) de clase agregando i-1 al límite inferior de cada clase.
Formar los límites reales
Determinar las frecuencias de clase contando el número de observaciones.
Se puede observar lo siguiente:
Cada clase o intervalo: límites aparentes: inferior y superior
Los límites reales
Marca de clase (x): promedio de los límites aparentes de las clases.
Frecuencias absolutas
Frecuencias relativas
Frecuencias acumuladas
Frecuencias porcentual acumulativa
Realice una distribución de frecuencias de valores agrupados para los resultados obtenidos en el segundo parcial de Estadística 1.
34 45 56 78 45 67 89 36 66
89 48 56 60 65 78 66 57 65
63 64 62 78 77 87 85 58 60
76 74 56 88 67 77 55 67 66
76 88 85 74 68 89 89 69 70
Los siguientes datos son los kilómetros por galón que registraron 30 vehículos en un recorrido de 100 km. por la ciudad. (2,1,2,2,10,13)
31.5 34.4 36.0 35.5 36.1 35.0 32.8 30.8 31.8 34.7
18.8 37.1 34.2 33.2 31.0 35.2 36.8 33.7 33.4 34.0
33.9 24.6 23.3 35.3 29.6 27.6 33.6 30.8 25.4 16.4
Es la manera de expresar los datos estadísticos, utilizando los medio de representación que proporciona la Geometría.
Componentes de una gráfica:◦ Título general
◦ Elementos de referencia con expresión de la variable representada sobre cada uno.
◦ Fuente de procedencia de los datos representados.
◦ La parte más alta de la gráfica debe ser aproximadamente tres cuartos de su ancho total.
Barras rectangulares de igual ancho, conservando la misma distancia de separación entre sí.
Se utiliza básicamente para mostrar y comparar frecuencias de variables cualitativas.
Pueden ser verticales o en forma horizontal.
Se usan para mostrar como una cantidad total se reparte en un grupo de categorías.
Variables cualitativas en porcentajes o cifras absolutas.
Número de ítems no mayor a 5.
Eje horizontal: intervalos de clase (límites reales)
Eje vertical: frecuencias
Rectángulos unidos cuyos anchos son los de los intervalos de clase.
Variables cuantitativas
Es un gráfico de líneas trazado sobre las marcas de clase.
El polígono empieza y termina en el eje horizontal.
Eje horizontal: límites reales superiores
Eje vertical: frecuencia acumulada
Para el límite inferior de la primera clase la frecuencia acumulada es cero y para el límite superior de la última clase es igual al total de datos.
Sirven para representar las series de tiempo, porque reflejan la dirección del cambio.
Eje horizontal: escala de tiempo
Muestra pequeños conjunto de datos.
Eje horizontal: valores de la variableestudiada.
Eje vertical: la frecuencia de aparición de unvalor en el conjunto de datos estudiados.