Guia 1 Estadistica Sena

63

Click here to load reader

description

contabilidad y finanzas

Transcript of Guia 1 Estadistica Sena

Page 1: Guia 1 Estadistica Sena

GUIA BASICA DE ESTADÍSTICA DESCRITIVA

Instructor: FRANKILL SALAZAR LAMILLA

E-mail: [email protected]

SERVICIO NACIONAL DE APRENDIZAJESENA

Page 2: Guia 1 Estadistica Sena

GUIA N°2

Introducción a la Estadística, Fenómenos, Población, Muestra y

Tipos de Variables

ESTADISTICA DESCRIPTIVA

Page 3: Guia 1 Estadistica Sena

La EstadísticaEs la rama de las matemáticas que se va a encargar

de Recopilar, Organizar, y Procesar datos con el fin de inferir las características de la población objetivo.

3

ESTADÍSTICA

ESTADÍSTICA DESCRIPTIVA

ESTADÍSTICA INFERENCIA

TEORÍA DE DECISIONES

Page 4: Guia 1 Estadistica Sena

La Estadística Descriptiva Trata del recuento, ordenación y clasificación de

los datos obtenidos por las observaciones.

Se construyen tablas y se presentan gráficos que permiten simplificar los datos obtenidos.

Se calculan parámetros estadísticos. Se limita a realizar deducciones directas de los datos y parámetros obtenidos

4

Page 5: Guia 1 Estadistica Sena

Fenómeno Determinístico Un fenómeno determinístico es aquel en que se obtiene

siempre el mismo resultado bajo las mismas condiciones iniciales.

La relación causa-efecto se conoce en su totalidad. Por ejemplo, todos los fenómenos que siguen las leyes de la física clásica, como puede ser la caída de un cuerpo.

Ejemplos:

Si se lanza una pelota hacia arriba, sabemos que tiene que caer.

Si se lanza un trozo de hielo en el agua, este se derretirá.

Si el agua se calienta a 100ªC esta se evaporara.

Fecha del cumpleaños.

Nombre del próximo mes. 5

Page 6: Guia 1 Estadistica Sena

Fenómeno no Determinístico Un fenómeno no determinístico es aquel que bajo el

mismo conjunto aparente de condiciones iniciales, puede presentar resultados diferentes, es decir, no se puede predecir el resultado exacto de cada experiencia particular.

Este tipo de fenómeno es opuesto al fenómeno determinista, en el que conocer todos los factores de un experimento nos hace predecir exactamente el resultado del mismo.

Ejemplos:

Si se lanza una moneda esta puede caer cara o sello.

El lanzamiento de los dados, pudiendo salir el 1,2,3,4,5 o 6

Los número premiados de los juegos de azar.6

Page 7: Guia 1 Estadistica Sena

Población Todo estudio estadístico esta referido a un conjunto o

colección de persona o cosas . Este conjunto de personas o cosas es lo que se denomina POBLACIÓN.

Las personas o cosas que forman parte de esta población se denominan ELEMENTOS . En sentido estadístico este elemento puede ser algo tangible como una persona , automóvil o casa, por ejemplo, o algo más abstracto como temperatura, voto, intervalo de tiempo.

A su vez cada elemento de la población puede ser objeto de estudio estadístico. Si consideramos a una persona, se puede distinguir los siguientes caracteres o cualidades: sexo, edad, nivel de estudio, profesión, peso, color de ojos, estatura, etc. Se puede estudiar uno o más aspectos de cada elemento de la población. 7

Page 8: Guia 1 Estadistica Sena

Clasificación de la Población La población según su tamaño puede ser de dos tipos:

Población Finita: Cuando el número de elementos que la forma es finito.

Ejemplo: Si estudiamos el precio de la vivienda en una ciudad, la población será el total de las viviendas de dicha ciudad.

Ejemplo: El número de alumnos en un centro educacional.

Población Infinita: Cuando el número de elementos que la forma es infinito o tan grande que pudiera considerarse infinito.

Ejemplo: Si se realizara un estudio de todos los productos que existen en el mercado.

Ejemplo: Un estudio astronómico en base a todas las estrellas del universo. 8

Page 9: Guia 1 Estadistica Sena

Muestra En un estudio estadístico no se trabaja con todos los

elementos de la población, sino que se realiza sobre un subconjunto de ella.

Este subconjunto puede ser una muestra, cuando se toma un determinado número de elementos de la población, sin que en principio tengan nada en común.

La muestra debe obtener toda la información deseada para tener la posibilidad de extraerla, esto sólo se puede lograr con una buena selección de la muestra y un trabajo muy cuidadosos y de alta calidad en la recogida de los datos. 9

Page 10: Guia 1 Estadistica Sena

Tipos de Variable y Clasificación

VARIABLES

CUALITATIVA O ATRIBUTO

ESCALA DE MEDICIÓN

NOMINAL

ORDINAL

CUANTITATIVA

ESCALA DE MEDICIÓN

INTERVALO

RAZÓN

TIPO

DISCRETA

CONTINUA

10

Page 11: Guia 1 Estadistica Sena

Variables Los caracteres de un elemento pueden ser de

diferentes tipos, por lo cual las variables se pueden clasificar en dos grandes clases:

Variables cualitativas o atributos: Las cuales no se pueden medir numéricamente. Ejemplo: nacionalidad, color de piel, sexo, etc.

Variables cuantitativas: Tienen valor numérico. Ejemplo: Estatura, edad, precio producto, etc.

11

Page 12: Guia 1 Estadistica Sena

Variables También se pueden clasificar, a su vez en:

Variables unidimensionales: Sólo recogen información sobre una característica. Ejemplo: edad de los alumnos de una clase.

Variables bidimensionales: Recogen información sobre dos características de la población. Ejemplo: edad y altura de los alumnos de una clase.

Variables pluridimensionales: Recogen información sobre tres o más características. Ejemplo: edad, altura y peso de los alumnos de una clase.

12

Page 13: Guia 1 Estadistica Sena

Variables Cuantitativas Las variables cuantitativas se pueden clasificar

en:

Variables discretas: Sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Ejemplo: número de hermanos (puede ser 1, 2, 3....,etc., pero nunca podrá ser 3,5

Variables continuas: Pueden tomar cualquier valor real dentro de un intervalo. No se pueden expresar mediante un número entero. Ejemplo: la velocidad de un vehículo puede ser 80,3 km/h, 94,57 km/h...etc.

13

Page 14: Guia 1 Estadistica Sena

Variables Cuantitativas La escala de Intervalo:

1. Posee una unidad de medida constante y arbitraria.

2. Posee un cero “arbitrario”, es decir no indica la ausencia de la característica que se esta midiendo.

3. Prevalece la relación de orden “mayor que” (>). La diferencia entre los valores tiene significado.

4. Entre los valores de las variables solo es posible realizar la suma y la resta de como operaciones aritméticas.

EJEMPLOS:

1. La temperatura de una ciudad medida en grados Celsius o Fahrenheit.

2. La altura de las ciudades tomando como referencia el nivel del mar.

3. El rendimiento académico medido en una escala de 0 a 20.14

Page 15: Guia 1 Estadistica Sena

Variables Cuantitativas La escala de Razón:

1. Posee una unidad de medida constante y arbitraria.

2. Posee un cero “absoluto”, es decir indica la ausencia de la característica que se esta midiendo. Este cero tiene significado.

3. Prevalece la relación de orden “mayor que” (>). El cociente entre ellos tiene significado.

4. Se puede realizar todas las operaciones aritméticas entre los valores de las variables.

EJEMPLOS:

1. Edad.

2. Peso.

3. Estatura

4. Tiempo invertido por un estudiante en realizar una prueba.15

Page 16: Guia 1 Estadistica Sena

Variables Cualitativas ESCALA NOMINAL.

1. Se clasifican a los sujetos en categorías, mutuamente excluyentes y totalmente exhaustivas, tal que todos los sujetos clasificados en la misma categoría son equivalentes respecto a la variable que se esta midiendo.

2. Solo tiene sentido en la relación de igualdad – desigualdad. Solo clasifica las variables.

3. Se pueden usar números, letras o símbolos para identificar a cada categoría de variable.

4. No se puede realizar ninguna operación aritmética en esta escala. 16

Page 17: Guia 1 Estadistica Sena

Variables Cualitativas

ESCALA NOMINAL.

Soltero 1

Masculino M Casado 2

GENERO ESTADO CIVIL

Femenino F Divorciado 3

Viudo 4

17

Page 18: Guia 1 Estadistica Sena

Variables Cualitativas ESCALA ORDINAL.

1. Se usa cuando es posible establecer una relación de orden entre las distintas categorías de la variable. Prevalece la relación de orden “mayor que” (>)

2. Se pueden usar letras o números para identificar cada categoría de la variable. Los números o letras usados deben reflejar el orden de la categoría.

3. No se puede realizar operaciones aritméticas entre los números asignados a las distintas categorías. Estos números solo reflejan una relación de orden.

18

Page 19: Guia 1 Estadistica Sena

Variables Cualitativas

ESCALA ORDINAL.

Preescolar 1 Mala D

Educación Básica 2 Regular C

NIVEL DE CALIDAD DE

INSTRUCCIÓN UN SERVICIO

Media y diversificada 3 Buena B

Superior 4 Excelente A

19

Page 20: Guia 1 Estadistica Sena

Población, Muestra y Variable

20

Page 21: Guia 1 Estadistica Sena

Tipos de Frecuencias, Representación Gráfica y Variables

Discretas.

Page 22: Guia 1 Estadistica Sena

Tablas de Frecuencia Variable Cualitativa

La muestra es el sub-conjunto de nuestro universo o población y del cual se recopilan nuestros datos. Es necesario que la muestra sea representativa.

Se debe tener presente que la muestra esta conformada por N elementos.

Uno de los primeros pasos es la tabulación de resultados, es decir, recoger la información de la muestra resumida en un tabla en que cada valor de la variable se le asocian determinados números que representan el número de veces que ha aparecido, su proporción con respecto a otros valores de la variable, etc. 22

Page 23: Guia 1 Estadistica Sena

Tipos de Frecuencia FRECUENCIA ABSOLUTA: La frecuencia absoluta de una

variable estadística, definida Xi, es el numero de veces que aparece en la muestra dicho valor de la variable.

Se representa por: ni

FRECUENCIA RELATIVA: La frecuencia relativa esta influida por el tamaño de la muestra, es directamente proporcional. Si la muestra es muy grande, para poder comparar se requiere utilizar la frecuencia relativa, la cual es el cociente entre la frecuencia absoluta y el tamaño de la muestra.

Se representa por: fi= ni/N (en algunos textos y/o ejercicios como hi)

23

Page 24: Guia 1 Estadistica Sena

Ejemplo Se realizó una encuesta a 419 personas, en relación a la

adquisición de un cierto bien. Los siguientes datos reflejan las respuestas de las

personas encuestadas a la pregunta ¿compraría usted un computador?

a) ¿Qué tanto por ciento de las personas no responden?

b) ¿Qué tanto por ciento de las personas compraría un computador? 24

Page 25: Guia 1 Estadistica Sena

Solución

a) El porcentaje de personas que no responden : 0,1098 x 100 = 10,98%

b) b. El porcentaje de personas que respondieron si : 0,6993 x 100 = 69,93%

25

Page 26: Guia 1 Estadistica Sena

Representación Gráfica

Uno de los gráficos más utilizados para representar variables cualitativas es el gráfico sectorial o circular.

Para construir este gráfico, se utiliza una circunferencia, cuyo círculo se divide en sectores tales que sus medidas angulares centrales y, por lo tanto la superficie del sector circular sean proporcionales a las magnitudes de los valores de la variable que representan.

Al total le corresponde el círculo completo, es decir los 360° de la circunferencia y por proporciones, se encuentra el número de grados que le corresponde a cada parte.

26

Page 27: Guia 1 Estadistica Sena

Ejemplo

27

Page 28: Guia 1 Estadistica Sena

Representación Gráfica

Gráfico de barras: Es aquel en el cual el fenómeno que se estudia queda representado por una serie de rectángulos, barras o paralelepípedos, los cuales pueden dibujarse horizontalmente o verticalmente.

Este gráfico se utiliza para representar variables de tipo cualitativo o cuantitativo discreto.

Ejemplo: Confeccionar gráfico de barras, con respecto a la siguiente tabla de distribución de frecuencias:

28

Page 29: Guia 1 Estadistica Sena

Representación Gráfica

29

Page 30: Guia 1 Estadistica Sena

Representación Gráfica El Pictograma: Se caracteriza este gráfico por

figuritas que representan cierta cantidad (por ejemplo 1%). Cada valor de la variable lleva tantas figuritas como sea su frecuencia

1. Cada fila de figuritas, debe llevar el rótulo que la identifica. Si fuera necesario, se agrega una leyenda explicativa.

2. Se debe usar la misma figurita para todo el gráfico.

3. El tamaño y el color de las figuritas debe ser el mismo en todo el gráfico.

30

Page 31: Guia 1 Estadistica Sena

Representación Gráfica

4. Debe indicarse claramente cuánto representa cada figurita, y en qué unidades.

5. Rotular el gráfico, especificando qué muestra. Asimismo, si fuera posible indicar la fuente de los datos.

6. Evitar trazados en 3D, que suelen interferir la información. 31

Page 32: Guia 1 Estadistica Sena

Tabla de frecuencia para variable discreta

Sean x1 , x2 , x3 ..............xm los m diferentes valores de la variable.

Frecuencia absoluta: Se denomina frecuencia absoluta al número de veces que se repite un valor de la variable en el conjunto de observaciones.

Frecuencia relativa: Se denomina frecuencia relativa al cociente de la frecuencia absoluta y el número tota de observaciones n.

32

Page 33: Guia 1 Estadistica Sena

Tabla de frecuencia para variable discreta

Frecuencia absoluta acumulada: Se llama Frecuencia Absoluta Acumulada, a la suma acumulativa término a término de las frecuencias absolutas.

El último término de las Frecuencias Absolutas acumuladas es n.

Frecuencia relativa acumulada: Se llama Frecuencia Relativa Acumulada, a la suma acumulativa término a término de las frecuencias relativas.

El último término de las Frecuencias Relativas Acumuladas es 1.

33

Page 34: Guia 1 Estadistica Sena

Ejemplo de Variable Discreta En un packing se examinó un lote de 30 cajas de

duraznos para exportación. El número de duraznos en mal estado en cada caja es el siguiente.

a) Construir tabla de distribución de frecuencias.

34

Page 35: Guia 1 Estadistica Sena

Ejemplo de Variable Discretab) ¿Cuantas cajas tienen 2 o 3 duraznos en mal

estado?

5 + 8=13 Cajas

c) ¿Qué tanto por ciento de las cajas tiene a lo más 1 durazno en mal estado?

10 + 23,33 = 33,33%

35

Page 36: Guia 1 Estadistica Sena

Ejemplo de Variable Discreta Se dispone de la siguiente información sobre el número

de personas activas (trabajan) en 25 familias:

a) ¿Qué tipo de variable es?

b) Construir Tabla de Distribución de Frecuencias

c) ¿Qué tanto por ciento de las familias tienen 2 o más personas activas?

d) ¿Que tanto por ciento de las familias tienen entre 2 y 3 personas activas? 36

Page 37: Guia 1 Estadistica Sena

Ejemplo de Variable Discretaa) Variable Discreta

b) Tabla

c) 68%

d) 40%37

Page 38: Guia 1 Estadistica Sena

Representación Gráfica

Los gráficos más adecuados, para representar una variable numérica discreta son:

1. Diagrama de tallo y hojas Un procedimiento semi- gráfico (tabular y gráfico)

de presentar la información para datos cuantitativos, especialmente útil cuando el número de observaciones es pequeño (menor a 50)

38

Page 39: Guia 1 Estadistica Sena

Construcción Tallo y Hoja Para datos con un solo dígito, el tallo queda

constituido por los distintos valores de la variable, ordenados de menor a mayor, de arriba hacia abajo.

Las hojas quedan representadas por tantos ceros como sea su frecuencia:

Ejemplo: si el 7 se repite 4 veces, se escribe

39

Page 40: Guia 1 Estadistica Sena

Construcción Tallo y Hoja Para datos con dos dígitos, escribir a la izquierda

de la línea los dígitos de las decenas, que forman el tallo, y a la derecha las unidades que serán hojas.

Ejemplo: El número 72 se escribe.

40

Page 41: Guia 1 Estadistica Sena

Construcción Tallo y Hoja Para datos con tres dígitos el tallo estará formado

por los dígitos de las centenas y decenas, que se escribirán a la izquierda, separados de las unidades que serán las hojas.

Ejemplo: El número 754 se escribe

41

Page 42: Guia 1 Estadistica Sena

Construcción Tallo y Hoja Los siguientes datos representan los ingresos

semanales (en dólares) de un grupo de trabajadores.

114, 125, 114, 124, 143, 152, 133, 113, 178, 127, 135, 161, 126, 134, 147, 132

42

Page 43: Guia 1 Estadistica Sena

Representación Gráfica

2. Gráfico de Segmento Para representar gráficamente las

distribuciones de frecuencias absolutas (o relativas), se ubican en el eje horizontal, los valores de las variables y se levantan sobre cada uno de ellos, un segmento vertical de longitud igual a la frecuencia absoluta (o relativa) correspondiente a cada valor x.

43

Page 44: Guia 1 Estadistica Sena

Ejemplo Dada la siguiente tabla de distribución, construir

gráfico de segmentos, utilizando frecuencias absolutas

44

Page 45: Guia 1 Estadistica Sena

ESTADÍSTICA

Tablas de Frecuencia para Variables Continuas, Representación Gráfica y

Tabla de Contingencia

Page 46: Guia 1 Estadistica Sena

Tabla de frecuencia Variable Continua

Si la variable que se esta midiendo es de tipo continuo (puede tomar cualquier intervalo determinado por los números reales), no tiene sentido el tabularla para cada una de las observaciones dado que es muy improbable que variable bajo estudio tome el mismo valor durante el experimento.

Recorrido: Es el campo de variación de la variable.

Recorrido = X máx – X mín46

Page 47: Guia 1 Estadistica Sena

Tabla de frecuencia Variable Continua

El número y tamaño de los intervalos, dependen de la cantidad de datos de la muestra y de su recorrido.

El número de intervalos debe cumplir con dos condiciones: resumir la información y conservar el detalle de la muestra.

Los intervalos puede ser cerrado- cerrado,

cerrado- abierto

47

Page 48: Guia 1 Estadistica Sena

Tabla de frecuencia Variable Continua

Definiciones:

1. Clases: Consisten en intervalos de valores ordenados en forma accedente y descendente y que cubren todos los valores disponibles. El número de clases se denota K

2. Limites de clases: Son los extremos de las clases. El valor menos se denomina limite inferior (Li) y le valor mayor limite superior (Ls). Puede ser abierto ( ) o cerrado [ ].

3. Amplitud de clase: Se obtiene hallando la diferencia entre los limites de clases. Se denota C.

48

Page 49: Guia 1 Estadistica Sena

Tabla de frecuencia Variable Continua

4. Marca de clase: Es el punto medio de las clases, es decir, la semisuma del Ls y Li.

Las clases deben tener el misma Amplitud.

Amplitud = C = (Máx. - VMín) / K

Donde K es el número de clases

En caso de no saber cuantas clases se deben tener (K) ni la amplitud de estas, se utiliza la Regla de Sturges.

K = (1 + 3,322 Log n)49

Page 50: Guia 1 Estadistica Sena

Ejemplo Los siguientes datos indican el número de minutos que

ocuparon sus asientos 20 clientes de una cafetería.

Construir tabla de distribución de frecuencias, utilizando intervalo cerrado – abierto. Calcular el número de intervalos utilizando la expresión [1+ 3,3log n]

¿Qué tanto por ciento de clientes ocuparon sus asientos 32 minutos o más?

¿Qué tanto por ciento de los clientes ocuparon sus asientos entre 28 y menos de 36 minutos? 50

Page 51: Guia 1 Estadistica Sena

Solución

1. 45%

2. 60%51

Page 52: Guia 1 Estadistica Sena

Representación Gráfica

1. Histograma Consiste en un conjunto de rectángulos con:

bases en el eje x, centros en las marcas de clases y longitudes iguales a los tamaños de los intervalos de clases.

Si los intervalos de clases tienen todos la misma amplitud, las alturas de los rectángulos son proporcionales a las frecuencias de clase.

52

Page 53: Guia 1 Estadistica Sena

Representación Gráfica

53

Page 54: Guia 1 Estadistica Sena

Ejemplo Dada la siguiente tabla de distribución, graficar

histograma.

54

Page 55: Guia 1 Estadistica Sena

Representación Gráfica

2. Polígono de Frecuencia Es un gráfico de trazos de la frecuencia de clase

con relación a la marca de clase. Puede obtenerse conectando los puntos medios de las partes superiores de los rectángulos del histograma.

Ejemplo: Realizar el polígono de frecuencia de la tabla anterior.

55

Page 56: Guia 1 Estadistica Sena

Representación Gráfica

56

Page 57: Guia 1 Estadistica Sena

Representación Gráfica

3. Ojiva: Al igual que el histograma y el polígono de

frecuencias es representar distribuciones de frecuencias de variables cuantitativas continuas, pero sólo para frecuencias acumuladas.

En el eje horizontal se considera los limites de clase. Limites inferiores Ojiva mayor

Limites superiores Ojiva menor

57

Page 58: Guia 1 Estadistica Sena

Representación Gráfica

Ojiva Mayor 58

Ojiva Menor

Page 59: Guia 1 Estadistica Sena

Representaciones Gráficas

59

Variables Cualitativas

Gráfico Circular

Gráfico de Barras

Pictograma

Variables Discretas

Gráfico Circular

Gráfico de Barras

Diagrama de Tallo y Hoja

Gráfico de Segmento

Ojiva

Variables Continuas

Gráfico Circular

Histograma

Polígono de Frecuencias

Ojiva

Page 60: Guia 1 Estadistica Sena

Tabla de Contingencia 2 x 2 Sirve para analizar la relación de dependencia o

independencia entre dos variables cualitativas o una cualitativa y otra cuantitativa, es necesario estudiar su distribución conjunta o tabla de contingencia.

1. Permite organizar la información contenida en un experimento cuando ésta es de carácter bidimensional, es decir, cuando está referida a dos factores.

2. A partir de la tabla de contingencia se puede además analizar si existe alguna relación de dependencia o independencia entre los niveles de las variables objeto de estudio. 60

Page 61: Guia 1 Estadistica Sena

Tabla de Contingencia 2 x 2 Para identificar relaciones de dependencia entre

variables cualitativas se utiliza un contraste estadístico basado en el estadístico X2 (Chi-cuadrado), cuyo cálculo nos permitirá afirmar con un nivel de confianza estadístico determinado si los niveles de una variable cualitativa influyen en los niveles de la otra variable nominal analizada.

61

Page 62: Guia 1 Estadistica Sena

Tabla de Contingencia 2 x 2 Considerando un grado de confianza del 95%, esto

implica un a = 0,05.

Ho: El sexo de la persona no es un facto determinante en que la persona fume. Son independientes.

H1: El sexo de la persona es un facto determinante en que la persona fume. Son dependientes.

Obtención del grado de libertad para X2 (Chi-cuadrado):

Grados de libertad: (r-1)*(c-1), r: filas; c: columnas Grados de libertad: (2-1)*(2-1)=1

Valor tabla = 3,84

62

Page 63: Guia 1 Estadistica Sena

Tabla de Contingencia 2 x 2

Si el resultado es menor a 3,84 no se rechaza Ho

Si el resultado es mayor a 3,84 se rechaza Ho

63