Guia 1 Estadistica Sena
Click here to load reader
-
Upload
camilo-plazas -
Category
Documents
-
view
181 -
download
23
description
Transcript of Guia 1 Estadistica Sena
GUIA BASICA DE ESTADÍSTICA DESCRITIVA
Instructor: FRANKILL SALAZAR LAMILLA
E-mail: [email protected]
SERVICIO NACIONAL DE APRENDIZAJESENA
GUIA N°2
Introducción a la Estadística, Fenómenos, Población, Muestra y
Tipos de Variables
ESTADISTICA DESCRIPTIVA
La EstadísticaEs la rama de las matemáticas que se va a encargar
de Recopilar, Organizar, y Procesar datos con el fin de inferir las características de la población objetivo.
3
ESTADÍSTICA
ESTADÍSTICA DESCRIPTIVA
ESTADÍSTICA INFERENCIA
TEORÍA DE DECISIONES
La Estadística Descriptiva Trata del recuento, ordenación y clasificación de
los datos obtenidos por las observaciones.
Se construyen tablas y se presentan gráficos que permiten simplificar los datos obtenidos.
Se calculan parámetros estadísticos. Se limita a realizar deducciones directas de los datos y parámetros obtenidos
4
Fenómeno Determinístico Un fenómeno determinístico es aquel en que se obtiene
siempre el mismo resultado bajo las mismas condiciones iniciales.
La relación causa-efecto se conoce en su totalidad. Por ejemplo, todos los fenómenos que siguen las leyes de la física clásica, como puede ser la caída de un cuerpo.
Ejemplos:
Si se lanza una pelota hacia arriba, sabemos que tiene que caer.
Si se lanza un trozo de hielo en el agua, este se derretirá.
Si el agua se calienta a 100ªC esta se evaporara.
Fecha del cumpleaños.
Nombre del próximo mes. 5
Fenómeno no Determinístico Un fenómeno no determinístico es aquel que bajo el
mismo conjunto aparente de condiciones iniciales, puede presentar resultados diferentes, es decir, no se puede predecir el resultado exacto de cada experiencia particular.
Este tipo de fenómeno es opuesto al fenómeno determinista, en el que conocer todos los factores de un experimento nos hace predecir exactamente el resultado del mismo.
Ejemplos:
Si se lanza una moneda esta puede caer cara o sello.
El lanzamiento de los dados, pudiendo salir el 1,2,3,4,5 o 6
Los número premiados de los juegos de azar.6
Población Todo estudio estadístico esta referido a un conjunto o
colección de persona o cosas . Este conjunto de personas o cosas es lo que se denomina POBLACIÓN.
Las personas o cosas que forman parte de esta población se denominan ELEMENTOS . En sentido estadístico este elemento puede ser algo tangible como una persona , automóvil o casa, por ejemplo, o algo más abstracto como temperatura, voto, intervalo de tiempo.
A su vez cada elemento de la población puede ser objeto de estudio estadístico. Si consideramos a una persona, se puede distinguir los siguientes caracteres o cualidades: sexo, edad, nivel de estudio, profesión, peso, color de ojos, estatura, etc. Se puede estudiar uno o más aspectos de cada elemento de la población. 7
Clasificación de la Población La población según su tamaño puede ser de dos tipos:
Población Finita: Cuando el número de elementos que la forma es finito.
Ejemplo: Si estudiamos el precio de la vivienda en una ciudad, la población será el total de las viviendas de dicha ciudad.
Ejemplo: El número de alumnos en un centro educacional.
Población Infinita: Cuando el número de elementos que la forma es infinito o tan grande que pudiera considerarse infinito.
Ejemplo: Si se realizara un estudio de todos los productos que existen en el mercado.
Ejemplo: Un estudio astronómico en base a todas las estrellas del universo. 8
Muestra En un estudio estadístico no se trabaja con todos los
elementos de la población, sino que se realiza sobre un subconjunto de ella.
Este subconjunto puede ser una muestra, cuando se toma un determinado número de elementos de la población, sin que en principio tengan nada en común.
La muestra debe obtener toda la información deseada para tener la posibilidad de extraerla, esto sólo se puede lograr con una buena selección de la muestra y un trabajo muy cuidadosos y de alta calidad en la recogida de los datos. 9
Tipos de Variable y Clasificación
VARIABLES
CUALITATIVA O ATRIBUTO
ESCALA DE MEDICIÓN
NOMINAL
ORDINAL
CUANTITATIVA
ESCALA DE MEDICIÓN
INTERVALO
RAZÓN
TIPO
DISCRETA
CONTINUA
10
Variables Los caracteres de un elemento pueden ser de
diferentes tipos, por lo cual las variables se pueden clasificar en dos grandes clases:
Variables cualitativas o atributos: Las cuales no se pueden medir numéricamente. Ejemplo: nacionalidad, color de piel, sexo, etc.
Variables cuantitativas: Tienen valor numérico. Ejemplo: Estatura, edad, precio producto, etc.
11
Variables También se pueden clasificar, a su vez en:
Variables unidimensionales: Sólo recogen información sobre una característica. Ejemplo: edad de los alumnos de una clase.
Variables bidimensionales: Recogen información sobre dos características de la población. Ejemplo: edad y altura de los alumnos de una clase.
Variables pluridimensionales: Recogen información sobre tres o más características. Ejemplo: edad, altura y peso de los alumnos de una clase.
12
Variables Cuantitativas Las variables cuantitativas se pueden clasificar
en:
Variables discretas: Sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Ejemplo: número de hermanos (puede ser 1, 2, 3....,etc., pero nunca podrá ser 3,5
Variables continuas: Pueden tomar cualquier valor real dentro de un intervalo. No se pueden expresar mediante un número entero. Ejemplo: la velocidad de un vehículo puede ser 80,3 km/h, 94,57 km/h...etc.
13
Variables Cuantitativas La escala de Intervalo:
1. Posee una unidad de medida constante y arbitraria.
2. Posee un cero “arbitrario”, es decir no indica la ausencia de la característica que se esta midiendo.
3. Prevalece la relación de orden “mayor que” (>). La diferencia entre los valores tiene significado.
4. Entre los valores de las variables solo es posible realizar la suma y la resta de como operaciones aritméticas.
EJEMPLOS:
1. La temperatura de una ciudad medida en grados Celsius o Fahrenheit.
2. La altura de las ciudades tomando como referencia el nivel del mar.
3. El rendimiento académico medido en una escala de 0 a 20.14
Variables Cuantitativas La escala de Razón:
1. Posee una unidad de medida constante y arbitraria.
2. Posee un cero “absoluto”, es decir indica la ausencia de la característica que se esta midiendo. Este cero tiene significado.
3. Prevalece la relación de orden “mayor que” (>). El cociente entre ellos tiene significado.
4. Se puede realizar todas las operaciones aritméticas entre los valores de las variables.
EJEMPLOS:
1. Edad.
2. Peso.
3. Estatura
4. Tiempo invertido por un estudiante en realizar una prueba.15
Variables Cualitativas ESCALA NOMINAL.
1. Se clasifican a los sujetos en categorías, mutuamente excluyentes y totalmente exhaustivas, tal que todos los sujetos clasificados en la misma categoría son equivalentes respecto a la variable que se esta midiendo.
2. Solo tiene sentido en la relación de igualdad – desigualdad. Solo clasifica las variables.
3. Se pueden usar números, letras o símbolos para identificar a cada categoría de variable.
4. No se puede realizar ninguna operación aritmética en esta escala. 16
Variables Cualitativas
ESCALA NOMINAL.
Soltero 1
Masculino M Casado 2
GENERO ESTADO CIVIL
Femenino F Divorciado 3
Viudo 4
17
Variables Cualitativas ESCALA ORDINAL.
1. Se usa cuando es posible establecer una relación de orden entre las distintas categorías de la variable. Prevalece la relación de orden “mayor que” (>)
2. Se pueden usar letras o números para identificar cada categoría de la variable. Los números o letras usados deben reflejar el orden de la categoría.
3. No se puede realizar operaciones aritméticas entre los números asignados a las distintas categorías. Estos números solo reflejan una relación de orden.
18
Variables Cualitativas
ESCALA ORDINAL.
Preescolar 1 Mala D
Educación Básica 2 Regular C
NIVEL DE CALIDAD DE
INSTRUCCIÓN UN SERVICIO
Media y diversificada 3 Buena B
Superior 4 Excelente A
19
Población, Muestra y Variable
20
Tipos de Frecuencias, Representación Gráfica y Variables
Discretas.
Tablas de Frecuencia Variable Cualitativa
La muestra es el sub-conjunto de nuestro universo o población y del cual se recopilan nuestros datos. Es necesario que la muestra sea representativa.
Se debe tener presente que la muestra esta conformada por N elementos.
Uno de los primeros pasos es la tabulación de resultados, es decir, recoger la información de la muestra resumida en un tabla en que cada valor de la variable se le asocian determinados números que representan el número de veces que ha aparecido, su proporción con respecto a otros valores de la variable, etc. 22
Tipos de Frecuencia FRECUENCIA ABSOLUTA: La frecuencia absoluta de una
variable estadística, definida Xi, es el numero de veces que aparece en la muestra dicho valor de la variable.
Se representa por: ni
FRECUENCIA RELATIVA: La frecuencia relativa esta influida por el tamaño de la muestra, es directamente proporcional. Si la muestra es muy grande, para poder comparar se requiere utilizar la frecuencia relativa, la cual es el cociente entre la frecuencia absoluta y el tamaño de la muestra.
Se representa por: fi= ni/N (en algunos textos y/o ejercicios como hi)
23
Ejemplo Se realizó una encuesta a 419 personas, en relación a la
adquisición de un cierto bien. Los siguientes datos reflejan las respuestas de las
personas encuestadas a la pregunta ¿compraría usted un computador?
a) ¿Qué tanto por ciento de las personas no responden?
b) ¿Qué tanto por ciento de las personas compraría un computador? 24
Solución
a) El porcentaje de personas que no responden : 0,1098 x 100 = 10,98%
b) b. El porcentaje de personas que respondieron si : 0,6993 x 100 = 69,93%
25
Representación Gráfica
Uno de los gráficos más utilizados para representar variables cualitativas es el gráfico sectorial o circular.
Para construir este gráfico, se utiliza una circunferencia, cuyo círculo se divide en sectores tales que sus medidas angulares centrales y, por lo tanto la superficie del sector circular sean proporcionales a las magnitudes de los valores de la variable que representan.
Al total le corresponde el círculo completo, es decir los 360° de la circunferencia y por proporciones, se encuentra el número de grados que le corresponde a cada parte.
26
Ejemplo
27
Representación Gráfica
Gráfico de barras: Es aquel en el cual el fenómeno que se estudia queda representado por una serie de rectángulos, barras o paralelepípedos, los cuales pueden dibujarse horizontalmente o verticalmente.
Este gráfico se utiliza para representar variables de tipo cualitativo o cuantitativo discreto.
Ejemplo: Confeccionar gráfico de barras, con respecto a la siguiente tabla de distribución de frecuencias:
28
Representación Gráfica
29
Representación Gráfica El Pictograma: Se caracteriza este gráfico por
figuritas que representan cierta cantidad (por ejemplo 1%). Cada valor de la variable lleva tantas figuritas como sea su frecuencia
1. Cada fila de figuritas, debe llevar el rótulo que la identifica. Si fuera necesario, se agrega una leyenda explicativa.
2. Se debe usar la misma figurita para todo el gráfico.
3. El tamaño y el color de las figuritas debe ser el mismo en todo el gráfico.
30
Representación Gráfica
4. Debe indicarse claramente cuánto representa cada figurita, y en qué unidades.
5. Rotular el gráfico, especificando qué muestra. Asimismo, si fuera posible indicar la fuente de los datos.
6. Evitar trazados en 3D, que suelen interferir la información. 31
Tabla de frecuencia para variable discreta
Sean x1 , x2 , x3 ..............xm los m diferentes valores de la variable.
Frecuencia absoluta: Se denomina frecuencia absoluta al número de veces que se repite un valor de la variable en el conjunto de observaciones.
Frecuencia relativa: Se denomina frecuencia relativa al cociente de la frecuencia absoluta y el número tota de observaciones n.
32
Tabla de frecuencia para variable discreta
Frecuencia absoluta acumulada: Se llama Frecuencia Absoluta Acumulada, a la suma acumulativa término a término de las frecuencias absolutas.
El último término de las Frecuencias Absolutas acumuladas es n.
Frecuencia relativa acumulada: Se llama Frecuencia Relativa Acumulada, a la suma acumulativa término a término de las frecuencias relativas.
El último término de las Frecuencias Relativas Acumuladas es 1.
33
Ejemplo de Variable Discreta En un packing se examinó un lote de 30 cajas de
duraznos para exportación. El número de duraznos en mal estado en cada caja es el siguiente.
a) Construir tabla de distribución de frecuencias.
34
Ejemplo de Variable Discretab) ¿Cuantas cajas tienen 2 o 3 duraznos en mal
estado?
5 + 8=13 Cajas
c) ¿Qué tanto por ciento de las cajas tiene a lo más 1 durazno en mal estado?
10 + 23,33 = 33,33%
35
Ejemplo de Variable Discreta Se dispone de la siguiente información sobre el número
de personas activas (trabajan) en 25 familias:
a) ¿Qué tipo de variable es?
b) Construir Tabla de Distribución de Frecuencias
c) ¿Qué tanto por ciento de las familias tienen 2 o más personas activas?
d) ¿Que tanto por ciento de las familias tienen entre 2 y 3 personas activas? 36
Ejemplo de Variable Discretaa) Variable Discreta
b) Tabla
c) 68%
d) 40%37
Representación Gráfica
Los gráficos más adecuados, para representar una variable numérica discreta son:
1. Diagrama de tallo y hojas Un procedimiento semi- gráfico (tabular y gráfico)
de presentar la información para datos cuantitativos, especialmente útil cuando el número de observaciones es pequeño (menor a 50)
38
Construcción Tallo y Hoja Para datos con un solo dígito, el tallo queda
constituido por los distintos valores de la variable, ordenados de menor a mayor, de arriba hacia abajo.
Las hojas quedan representadas por tantos ceros como sea su frecuencia:
Ejemplo: si el 7 se repite 4 veces, se escribe
39
Construcción Tallo y Hoja Para datos con dos dígitos, escribir a la izquierda
de la línea los dígitos de las decenas, que forman el tallo, y a la derecha las unidades que serán hojas.
Ejemplo: El número 72 se escribe.
40
Construcción Tallo y Hoja Para datos con tres dígitos el tallo estará formado
por los dígitos de las centenas y decenas, que se escribirán a la izquierda, separados de las unidades que serán las hojas.
Ejemplo: El número 754 se escribe
41
Construcción Tallo y Hoja Los siguientes datos representan los ingresos
semanales (en dólares) de un grupo de trabajadores.
114, 125, 114, 124, 143, 152, 133, 113, 178, 127, 135, 161, 126, 134, 147, 132
42
Representación Gráfica
2. Gráfico de Segmento Para representar gráficamente las
distribuciones de frecuencias absolutas (o relativas), se ubican en el eje horizontal, los valores de las variables y se levantan sobre cada uno de ellos, un segmento vertical de longitud igual a la frecuencia absoluta (o relativa) correspondiente a cada valor x.
43
Ejemplo Dada la siguiente tabla de distribución, construir
gráfico de segmentos, utilizando frecuencias absolutas
44
ESTADÍSTICA
Tablas de Frecuencia para Variables Continuas, Representación Gráfica y
Tabla de Contingencia
Tabla de frecuencia Variable Continua
Si la variable que se esta midiendo es de tipo continuo (puede tomar cualquier intervalo determinado por los números reales), no tiene sentido el tabularla para cada una de las observaciones dado que es muy improbable que variable bajo estudio tome el mismo valor durante el experimento.
Recorrido: Es el campo de variación de la variable.
Recorrido = X máx – X mín46
Tabla de frecuencia Variable Continua
El número y tamaño de los intervalos, dependen de la cantidad de datos de la muestra y de su recorrido.
El número de intervalos debe cumplir con dos condiciones: resumir la información y conservar el detalle de la muestra.
Los intervalos puede ser cerrado- cerrado,
cerrado- abierto
47
Tabla de frecuencia Variable Continua
Definiciones:
1. Clases: Consisten en intervalos de valores ordenados en forma accedente y descendente y que cubren todos los valores disponibles. El número de clases se denota K
2. Limites de clases: Son los extremos de las clases. El valor menos se denomina limite inferior (Li) y le valor mayor limite superior (Ls). Puede ser abierto ( ) o cerrado [ ].
3. Amplitud de clase: Se obtiene hallando la diferencia entre los limites de clases. Se denota C.
48
Tabla de frecuencia Variable Continua
4. Marca de clase: Es el punto medio de las clases, es decir, la semisuma del Ls y Li.
Las clases deben tener el misma Amplitud.
Amplitud = C = (Máx. - VMín) / K
Donde K es el número de clases
En caso de no saber cuantas clases se deben tener (K) ni la amplitud de estas, se utiliza la Regla de Sturges.
K = (1 + 3,322 Log n)49
Ejemplo Los siguientes datos indican el número de minutos que
ocuparon sus asientos 20 clientes de una cafetería.
Construir tabla de distribución de frecuencias, utilizando intervalo cerrado – abierto. Calcular el número de intervalos utilizando la expresión [1+ 3,3log n]
¿Qué tanto por ciento de clientes ocuparon sus asientos 32 minutos o más?
¿Qué tanto por ciento de los clientes ocuparon sus asientos entre 28 y menos de 36 minutos? 50
Solución
1. 45%
2. 60%51
Representación Gráfica
1. Histograma Consiste en un conjunto de rectángulos con:
bases en el eje x, centros en las marcas de clases y longitudes iguales a los tamaños de los intervalos de clases.
Si los intervalos de clases tienen todos la misma amplitud, las alturas de los rectángulos son proporcionales a las frecuencias de clase.
52
Representación Gráfica
53
Ejemplo Dada la siguiente tabla de distribución, graficar
histograma.
54
Representación Gráfica
2. Polígono de Frecuencia Es un gráfico de trazos de la frecuencia de clase
con relación a la marca de clase. Puede obtenerse conectando los puntos medios de las partes superiores de los rectángulos del histograma.
Ejemplo: Realizar el polígono de frecuencia de la tabla anterior.
55
Representación Gráfica
56
Representación Gráfica
3. Ojiva: Al igual que el histograma y el polígono de
frecuencias es representar distribuciones de frecuencias de variables cuantitativas continuas, pero sólo para frecuencias acumuladas.
En el eje horizontal se considera los limites de clase. Limites inferiores Ojiva mayor
Limites superiores Ojiva menor
57
Representación Gráfica
Ojiva Mayor 58
Ojiva Menor
Representaciones Gráficas
59
Variables Cualitativas
Gráfico Circular
Gráfico de Barras
Pictograma
Variables Discretas
Gráfico Circular
Gráfico de Barras
Diagrama de Tallo y Hoja
Gráfico de Segmento
Ojiva
Variables Continuas
Gráfico Circular
Histograma
Polígono de Frecuencias
Ojiva
Tabla de Contingencia 2 x 2 Sirve para analizar la relación de dependencia o
independencia entre dos variables cualitativas o una cualitativa y otra cuantitativa, es necesario estudiar su distribución conjunta o tabla de contingencia.
1. Permite organizar la información contenida en un experimento cuando ésta es de carácter bidimensional, es decir, cuando está referida a dos factores.
2. A partir de la tabla de contingencia se puede además analizar si existe alguna relación de dependencia o independencia entre los niveles de las variables objeto de estudio. 60
Tabla de Contingencia 2 x 2 Para identificar relaciones de dependencia entre
variables cualitativas se utiliza un contraste estadístico basado en el estadístico X2 (Chi-cuadrado), cuyo cálculo nos permitirá afirmar con un nivel de confianza estadístico determinado si los niveles de una variable cualitativa influyen en los niveles de la otra variable nominal analizada.
61
Tabla de Contingencia 2 x 2 Considerando un grado de confianza del 95%, esto
implica un a = 0,05.
Ho: El sexo de la persona no es un facto determinante en que la persona fume. Son independientes.
H1: El sexo de la persona es un facto determinante en que la persona fume. Son dependientes.
Obtención del grado de libertad para X2 (Chi-cuadrado):
Grados de libertad: (r-1)*(c-1), r: filas; c: columnas Grados de libertad: (2-1)*(2-1)=1
Valor tabla = 3,84
62
Tabla de Contingencia 2 x 2
Si el resultado es menor a 3,84 no se rechaza Ho
Si el resultado es mayor a 3,84 se rechaza Ho
63