Estadistica Wilson Octubre

34
ESTADÍSTICA Compilado: Compilado: Ing. Msc. Wilson Velastegui Ojeda Email Email: [email protected]

description

GENERALIDADES DE ESTADISTICA

Transcript of Estadistica Wilson Octubre

Page 1: Estadistica Wilson Octubre

ESTADÍSTICA

Compilado: Compilado: Ing. Msc. Wilson Velastegui OjedaEmailEmail: [email protected]

Page 2: Estadistica Wilson Octubre

La Estadística es la disciplina de las matemáticas que se refiere a los métodos de recolección, clasificación, presentación, de información para el análisis e interpretación de un conjunto de datos para la toma de decisiones

ESTADÍSTICA Ciencia que recoge, organiza, presenta, analiza e interpreta datos con el fin de propiciar una toma de decisiones más eficaz.

Recopilar Clasificar Presentar Analizar Interpretar

CONCLUSIONES LÓGICAS

ESTADÍSTICA ESTADÍSTICA

ESTADÍSTICA ESTADÍSTICA CLASIFICACIÓN CLASIFICACIÓN

Descriptiva Descriptiva : Consiste en un conjunto de procedimientos para organizar y resumir datos

Inferencial Inferencial : Implica tomar una muestra de una población y llevar a cabo cálculos relativos a ésta sobre la base de los resultados de la muestra

Page 3: Estadistica Wilson Octubre

PRODUCCION Diseño de Procesos Control de Calidad Muestras de Adquisición

MARKETING Investigación de Mercados Análisis de Gustos y Preferencias Búsqueda de Mercados Meta

FINANZAS Análisis de Rendimientos Análisis de Riesgos

RECURSOS HUMANOS Selección de Personal Evaluación de Personal

APLICACIONES ESTADISTICAS EN LOS NEGOCIOS

TOMA DE TOMA DE DECISIONES DECISIONES

Page 4: Estadistica Wilson Octubre

Datos son hechos/informaciones y cifras que se recogen, analizan y resumen para su presentación e interpretación. A todos los datos reunidos para un determinado estudio se les llama conjunto de datos para el estudio.

Los datos se clasifican en cualitativos o cuantitativos. Los datos cualitativos emplean etiquetas o nombres para determinar categorías de elementos iguales. Los datos cuantitativos son números que indican cuánto o cuántos.

Los datos se clasifican por niveles de medición así:

Page 5: Estadistica Wilson Octubre

N

n

POBLACION (N)Conjunto de individuos u objetos de interés o las medidas que se obtienen de todos los individuos u objetos de interés

MUESTRA (n)Es una parte de la población

Muestra:Ejemplos:1.-Cadetes del 2do año de la Policía Nacional.2.-Número de docentes de la Facultad de Administración de Empresas de la ESPOCH

Población:Ejemplos:1.- Conjunto de cadetes de la Policía Nacional.2.- Número de docentes del la ESPOCH.

Page 6: Estadistica Wilson Octubre

VARIABLEVARIABLEEs una característica que puede manifestarse según dos o más modalidades. Ejemplo: El peso, la estatura y la edad.

VARIABLES CUALITATIVAS (ATRIBUTOS):

Son aquellas que no se pueden medir, es decir, no se pueden expresar mediante un número. Los atributos se expresan mediante conceptos (palabras).Ejemplo:

Religión: católica, evangélica, judía

VARIABLES CUANTITATIVAS:Son aquellas que pueden ser medidas y se expresan por una cantidad (numero).Las variables cuantitativas las podemos clasificar en: Variables Variables Discretas y Variables ContinuasDiscretas y Variables Continuas

Variables DiscretasVariables Discretas:Son aquellas que admiten

únicamente valores únicamente valores numéricos enterosnuméricos enteros..

Ejemplo: Numero de alumnos inscritos

en la ESPOCH.

Variables Continuas:Variables Continuas:Una variable es continua si

admite valores admite valores fraccionarios.fraccionarios.

Ejemplo: Peso de un alumno.

Page 7: Estadistica Wilson Octubre

DISTRIBUCIÓN O TABLAS DE FRECUENCIAS: Es un resumen de los datos en el cual, cada opción de respuesta de la variable se relaciona con el número de datos correspondiente.

El primer procedimiento que se emplea para organizar y resumir un conjunto de datos es una tabla tabla de frecuenciasde frecuencias..

La distribución de frecuencias para una variable cualitativa está constituida por:

Clases:Clases: que corresponde a opiniones, gustos, preferencias, cualidades o características

Frecuencia absoluta (ni): Frecuencia absoluta (ni): indica cuantos elementos pertenecen a cada clase.

Frecuencia relativa (hi): Frecuencia relativa (hi): indica la proporción de elementos en cada clase, por lo tanto está dada por la razón entre la frecuencia absoluta de cada clase y el número total de observaciones. Obviamente, si se multiplica por 100 cada valor se obtiene la distribución de frecuencias porcentuales.

Page 8: Estadistica Wilson Octubre

BARCO BARCO TREN TREN TREN CARRO AVIONCARRO AVION CARRO AVION CARRO CARRO CARROAVION CARRO AVION CARRO AVION AVION CARROTREN AVION AVION AVION CARRO CARRO BARCO

BARCO CARRO CARRO CARRO CARRO AVION  BARCO AVION AVION BARCO BARCO BARCO  

Una agencia de viajes quiere saber cuál es el medio de transporte por el cuál viajan las personas en el país. Para ello, realizó un estudio a cuarenta personas a quienes se les preguntó por su medio de transporte preferido. Se obtuvo la siguiente lista de datos.

TABLA DE FRECUENCIAS DE LA VARIABLE MEDIOS DE TRANSPORTE

MT f fr %

CARRO 15 15/40 = 0.38 38%

AVION 13 13/40 = 0.33 33%

TREN 4 4/40 = 0.10 10%

BARCO 8 8/ 40 = 0.20 20%

4040 1.001.00 100%100%

Page 9: Estadistica Wilson Octubre

DESCRIPCION DE DATOS U OBSERVACIONES Al número de datos u observaciones se lo representan con n. Para describir los dates puede presentar dos casos: 1er CASO:- Cuando el conjunto de observación tiene pocos datos o valores Ejemplo. Un estudiante durante un semestre dio diez exámenes parciales calificados sobre diez (10 puntos), obteniendo los siguientes resultados: 6 – 7 – 6 – 8 – 5 – 7 – 6 – 9 – 10 y 6. En este ejemplo, n = 10 (número de datos).

Para este tipo de conjunto (o estadística) primero se hace un cuadro o una tabla, luego en la primera columna del cuadro se ordenan los datos o valores ya sea en forma ascendente o descendente (creciente o decreciente) en la segunda columna se ponen el número de los valores que se repiten, al número que se repite se llama frecuencia (f).

Esto lo visualizamos mediante el siguiente cuadro.

Page 10: Estadistica Wilson Octubre

2do. CASO. - Cuando el conjunto de observación tiene muchos valores diferentes

Para este caso se emplea un procedimiento llamado “Agrupamiento de datos". Esto es posible cuando el numero do datos es mayor que 30 (n >30)

 OBSERVACIÓN:- El número de clases que se emplea para agrupar los datos en

un conjunto depende del número de datos.  Si el número de datos es pequeño, el número de clases a emplear será cercano

a cinco (5), pero generalmente nunca menos que cinco (5)  Si existe una cantidad elevada de datos, el número de clases debe encontrarse

entre ocho (8) y doce (12) clases 

En general el número de clases puede encontrarse entre 5 a 15 clases, el número de clases se puede elegir uno mismo (entre 5 a 15)

Para saber en cuantos grupos o clases agrupamos

estos datos, se utiliza la fórmula de Sturges K= 1+3,322 Log (n), donde K. es el número de clases y n es el número de dates u observaciones.

Page 11: Estadistica Wilson Octubre

EJEMPLO: La demanda diaria, en unidades de un producto, durante 30 días de trabajo es: 105, 106, 105, 107, 109, 111, 110, 110, 107, 107, 104, 99, 103, 99, 103, 101, 100 101, 100, 103, 98, 92, 97, 94, 95, 95, 93, 95, 95, 95, 91, 82 ,91, 85, 90, 86, 87, 89, 87, 89

El número de datos u observaciones es n = 40. Como el número de datos es mayor que 30, agrupamos los datos utilizando la fórmula de Sturges:

K = 1+3,322 log (n) K = 1+3.322 log (40)K = 1+3,322 (1.60205)K = 1+5,322K = 6,32 = 6

Por tanto los 40 datos podernos agrupar en 6 grupos intervalos o clases

Page 12: Estadistica Wilson Octubre

PROCEDIMIENTO PARA AGRUPAR LOS DATOS Ordenamos los datos en forma creciente o decreciente (ascendente o descendente)

Encontramos el dato mayor y el dato menor, llamado también observación mayor (OM) y observación menor (om). Con estos datos encontramos el rango o recorrido, en formula es:

Rango = R = OM – om

Determinamos el numero de clases o grupos (K), utilizando la fórmula de Sturges, (en nuestro ejemplo anterior K=6). 

Hallamos o determinamos la longitud o amplitud del intervalo de la clase, que se designa con la letra C, en formula es:

C= es la amplitud de la clase

Preparamos un cuadro con 3 columnas, para las clases, limite de clases y en frecuencia, esto es

Page 13: Estadistica Wilson Octubre

En la columna de límites de clase anotamos como límite inferior (Li) de la clase a la observación menor. Luego de acuerdo a la amplitud del intervalo de la clase (C), incluimos tantos datos hasta el límite superior (Ls), así sucesivamente iremos anotando en clase, hasta llegar a la última clase en la que debe escribir incluido el dato mayor

Finalmente contamos cuantos datos están incluidos en cada clase y lo ponemos en la columna de las frecuencias (f)

 Ejemplo. Dado conjunto anterior aplique los pasos y agrupe este conjunto de

datos 105, 106, 105, 107, 109, 111, 110, 110, 107, 107, 104, 99, 103, 99, 103, 101, 100

101, 100, 103, 98, 92, 97, 94, 95, 95, 93, 95, 95, 95, 91, 82 ,91, 85, 90, 86, 87 89, 87, 89

1. Ordenamos los dates del ejemplo que estamos tratando en forma ascendente

82, 85, 86, 87, 87, 89, 89, 90, 91, 91, 92, 93, 94, 95 95, 95, 95, 95, 97, 98, 99, 99, 100, 100, 101,101 103, 103, 103, 104, 105, 105, 106, 107, 107, 107 109, 110, 110, 111

2. Hallamos el Rango

R = OM – om R = 111 – 82 = 29

 

Page 14: Estadistica Wilson Octubre

3.- Determinamos el número de clases. K = 1+3,322 log(40) = 6, (K=6) 4.- Determinamos la amplitud del intervalo de la clase. C = R/K 29/6 = 4.83 C = 5

5.- Preparamos una tabla con 3 columnas

Page 15: Estadistica Wilson Octubre

DISTRIBUCIONES DE FRECUENCIAS, INTERVALOS Y MARCA DE CLASE.Para hacer la descripción gráfica de los datos es necesario conocer algunos elementos de la estadística LIMITES DE INTERVALOS DE CLASE : : Todo grupo, intervalo o clases tiene dos límites: Límite inferior (Li) y límite superior (Ls) PUNTOS MEDIOS 0 MARCAS DE CLASES (Xc) : Cuando estamos trabajando con datos agrupados es conveniente buscar para cada intervalo un valor que lo represente. Este valor se llama punto medio o marca de clase, que se representa con Xc, en formula es:

FRECUENCIA ABSOLUTA (f)Es el número de veces que se repite un dato, o el

número de datos que se encuentre dentro de un intervalo o clase, se lo representa con la letra (“f”) minúscula, es decir a este tipo de frecuencia se llama Frecuencia Absoluta.

Page 16: Estadistica Wilson Octubre

FRECUENCIA RELATIVA (fr): Se obtiene dividiendo el número de datos u observaciones de la clase o grupo para el número total de datos u observaciones:

Se representa con la letra (fr), en fórmula es:  FRECUENCIA ACUMULADA ( Fa )Se obtiene de la siguiente forma: En la primera clase se pone la frecuencia

absoluta del mismo, en la segunda clase se pone la suma de la frecuencia de la primera clase con la segunda clase, y así sucesivamente hasta la suma con la frecuencia de la última clase.

  FRECUENCIA RELATIVA ACUMULADASe obtiene de forma similar que la frecuencia acumulada, pero sumando las

frecuencias relativas correspondientes. La suma de todas las frecuencias relativas es igual a 1en formula es:

 

PORCENTAJEEl porcentaje se obtiene multiplicando la frecuencia relativa por 100, en fórmula es: Aplicando esta formula se obtiene el porcentaje, cuyo resultado debe expresarse con % (tanto por ciento). La suma de todos los porcentajes es igual a 100%  

Page 17: Estadistica Wilson Octubre

EJEMPLO: Dada la siguiente tabla hallar:

a) El punto medio, b) Frecuencia acumulada, c) frecuencia relativa, d) frecuencia relativa acumulada y e) el porcentaje.

Page 18: Estadistica Wilson Octubre

REPRESENTACION GRAFICA DE LOS DATOSLa representación gráfica de los datos es un medio eficaz para el análisis de las estadísticas, que nos permiten ver el comportamiento de los datos en mi conjunto del cual se esté investigando. Para luego sacar sus conclusiones.La representación gráfica de los datos constituye mi medio auxiliar de la investigación estadística pues esta se fluidamente en la descripción. SISTEMAS DE REPRESENTACION.- El sistema de representación más usual es el PLANO CARTESIANO, en el eje X se ponen los valores distintos de la variable para dates no agrupados y los límites de clases para los datos agrupados, en el eje Y se ponen las frecuencias absolutas (o frecuencias relativas), Veamos las representaciones gráficas más usuales en la estadística

HISTOGRAMA.- El histograma es un gráfico que tiene un conjunto de rectángulos de igual base y de altura igual a su respectiva frecuencia absoluta o frecuencias relativas.

Para construir un histograma se traza primero en el primer cuadrando positivo del plano cartesiano, luego en el ej. X se anotan los limites inferiores; y superiores de las clases, procurando que haya una continuidad o coincidencia, Esto es que, el límite superior de una clase se constituye en límite inferior do In siguiente clase

NOTA:- Para esto es necesario hallar los limites reales (L-R) de la clase. En el eje Y que corresponden a sus alturas se ponen sus respectivas (frecuencias.

Page 19: Estadistica Wilson Octubre

 EJEMPLO: Dado los siguientes datos de la siguiente tabla grafique el histograma

Page 20: Estadistica Wilson Octubre

POLÍGONO DE FRECUENCIA.- Es un gráfico lineal, su construcción es similar al histograma; para su construcción se unen los puntos medios de cada clase, con sus respectivas frecuencias; de tal manera que al unir sus puntos medios por segmentos forman un polígono

Ejemplo: dado los siguientes datos de la tabla construya el polígono de frecuencia

POLÍGONO DE FRECUENCIA: DEMANDA DIARIA

Page 21: Estadistica Wilson Octubre

DIAGRAMA DE DISTRIBUCIÓN U OJIVA (CURVAS DE FRECUENCIAS ACUMULADAS)

 El gráfico de una distribución de frecuencias acumuladas (se llaman OJIVA) o

curva de distribución de frecuencias acumuladas Para su construcción se procede de la siguiente manera. Se considera el plano

cartesiano, en el eje X se anotan los limites reales (L – R) de la clase, en el eje Y se anotan las frecuencias acumuladas (desde la menor hasta la mayor)

Page 22: Estadistica Wilson Octubre

DIAGRAMA DE PASTEL O CICLOGRAMAS

Los gráficos en sectores o diagramas de pastel se utilizan para representar los datos cuyo conjunto forman un todo.

Pertenecen a este grupo los CIRCUNGRAMAS O CICLOGRAMAS, que son círculos que representan al número total de datos (n) divididos en tantos sectores circulares como categorías tiene el grupo.

Cada sector circular es proporcional a la frecuencia de su clase o categoría.

Para encontrar el número de grados de cada clase o categoría se utiliza la siguiente formula.

GRADO = (fx360)/n

Donde f es la frecuencia de la clase y n el número total de datos

EJEMPLO: Dado los siguientes datos de la tabla construya el diagrama de pastel

Page 23: Estadistica Wilson Octubre

DIAGRAMA DE BARRAS O GRÁFICO DE BARRAS.El diagrama de barras es un gráfico que se representa por medio de rectángulos que

se levantan desde el eje X, hasta una altura que corresponde al eje Y y que es igual a las frecuencias de las diferentes categorías de los datos.

 La diferencia entre el diagrama de barras y el histograma está en que el histograma se

refiere a una distribución de frecuencias y los diagramas de barras se utilizan para cualquier tipo de atributos cualidades o categorías.

 Ejemplo: Los siguientes datos corresponden a los campos petroleros existentes en el

Oriente Ecuatoriano.

Page 24: Estadistica Wilson Octubre

MEDIDAS DE TENDENCIA CENTRAL

Page 25: Estadistica Wilson Octubre

MEDIA ARITMETICA O PROMEDIO PARA DATOS NO AGRUPADOS DEFINICION.- La media se define como la suma de los valores de un conjunto de

datos dividido para el número total de datos.

Existen dos tipos de medias aritméticas: La media poblacional que se representa por u (miu) y la media muestral que se representa por X (equis barra).

La media para datos no agrupados está dada por la siguiente fórmula:

Ejemplo: Dado el siguiente conjunto de datos hallas su media. 38 – 35 – 76 – 58 – 48 – 59 – 67 – 63 – 33 – 69 – 53 – 51 – 28 – 25 – 36 – 32 – 61 – 57 – 49 78 – 48 – 42 – 72 – 52 – 47 – 66 – 58 – 44 – 44 – 56 – 45  Aquí es este conjunto n = 30

Page 26: Estadistica Wilson Octubre

MEDIANA PARA DATOS NO AGRUPADOSDEFINICIÓN.- La mediana es una colección de datos debidamente ordenados en forma ascendente o descendente (creciente o decreciente). Es el valor medio o la media aritmética de los dos valores medios. La mediana está justamente en el 50% de los datos (en la mitad). Para hallar la mediana, puede presentar dos casos. 1er. CASO.- Cuando el número de datos es impar.- En este caso la mediana se encuentra en la mitad de la “serie ordenada” de los datos, se puede encontrar utilizando la siguiente fórmula

El resultado de esta operación nos indica la posición o el lugar donde está la mediana (este valor no es la respuesta).

EJEMPLO:35, 76, 58, 45, 67, 63, 33, 69, 53, 59 , 28, 36, 32, 61, 51, 49, 78, 48, 42, 72, 57, 47, 66, 58, 44, 44, 52, 56, 48,

Datos ordenados 28, 32, 33, 35, 36, 42, 44, 44, 45, 47, 48, 48, 49, 51, 5252, 53, 56, 57, 58, 58, 59 61, 63, 66, 67, 69, 72, 76, 78

Page 27: Estadistica Wilson Octubre

n = 29 (NÚMERO DE DATOS IMPAR)

El 15 no es la mediana, el 15 nos indica la posición o el lugar donde se encuentra ubicado la mediana en el ordenamiento de los datos, en nuestro ejemplo el puesto 115 ocupa el número 52. Por lo tanto la mediana es:

Mdn = 52

2do. CASO.- Cuando el número de datos es par.- En este caso se utiliza el mismo procedimiento que el 1er. Caso, y se obtiene un número entero con decimales, en este caso la median se encuentra hallando la media aritmética de los dos valores medios

EJEMPLO:35, 76, 58, 45, 67, 63, 33, 69, 53, 59 , 28, 36, 32, 61, 51, 49, 78, 48, 42, 72, 57, 47, 66, 58, 44, 44, 52, 56, 48, 78

Datos ordenados 28, 32, 33, 35, 36, 42, 44, 44, 45, 47, 48, 48, 49, 51, 52, 53, 56, 57, 58, 58, 59 61, 63, 66, 67, 69, 72, 76, 78, 78

5,152

31

2

130

2

1

n

Mdn

n = 30 (NÚMERO DE DATOS PAR)

Page 28: Estadistica Wilson Octubre

El número 15, 5 no es la mediana, este valor nos dice que la mediana está entre el elemento 15 y el elemento 16 de los datos ordenados, esto es: El puesto 15 está ocupado por el número 52 y el puesto 16 por el número 53.

Por lo tanto la mediana es: 5,522

105

2

5352

Mdn

MODA PARA DATOS NO AGRUPADOS DEFINICIÓN.- La moda en un conjunto de datos u observaciones es el valor que se repite con mayor frecuencia. A la moda o modo se lo representa con Mo. NOTA.- Si existe un solo valor que se repite, el conjunto tiene una sola moda y se llama UNIMODAL Ejemplo: Hallar la moda del siguiente conjunto de datos

19, 1, 3, 4, 2, 5 , 7, 6, 6, 6, 6, 6, 20, 17, 8, 18, 9, 10

En este conjunto el número que se repite es el 6, por tanto la moda es Mo = 6

Ejemplo : Hallar la moda del siguiente conjunto de datos.

1, 2, 3, 3, 3, 3, 4, 5, 6, 7, 8, 9, 10, 11, 11, 11, 11, 12

En este conjunto los números que se repiten son el 3 y el 11, por tanto la moda es Mo = 3 Mo = 11 por lo tanto es bimodal (tiene dos modas)

Page 29: Estadistica Wilson Octubre

Si existen dos valores que se repiten, el conjunto tiene dos modas, es BIMODAL.

Si existen más de dos valores que se repiten, se dice que el conjunto tiene varias modas, en este caso se llama MULTIMODAL

MEDIA ARITMÉTICA PARA DATOS AGRUPADOS La media para datos agrupados se calcula por la siguiente fórmula: 

n

XfXfXf

n

XfX CkkCC

k

iCi

.....22111

Donde = a la suma del producto de las frecuencias por el punto medio o marca de clase. n = número total de datos u observaciones K = número de intervalos grupos o clases

k

iiXcf

1

Para hallar la media de datos agrupados, primero encontramos los puntos medios o marca de clase XC, luego multiplicamos la frecuencia cada clase por el punto medio de la misma

Finalmente sumamos la columna de los productos y su resultado dividimos para el número total de datos

Page 30: Estadistica Wilson Octubre

Ejemplo: Dado la siguiente tabla de frecuencias halle la media aritmética.

Page 31: Estadistica Wilson Octubre

MEDIANA PARA DATOS AGRUPADOSPROCEDIMIENTO1.- De la tabla hallamos las frecuencias acumuladas y límites de clases 2.- Dividimos el número total de datos para dos utilizando la expresión 3.- El resultado encontrado en numeral 2) localizamos en la columna de frecuencias acumuladas 4.- Aplicamos la fórmula de la mediana para datos agrupados que está dado por: 

2

n

Page 32: Estadistica Wilson Octubre

Ejemplo: Dado la siguiente tabla de frecuencias halle la mediana

NOTA: La clave primero está en dividir el número total de datos para dos, esto es:

Page 33: Estadistica Wilson Octubre

MODA PARA DATOS AGRUPADOS Para hallar la moda para datos agrupados, primeramente se observa en columna da las frecuencias, el valor más alto (clase con la mayor frecuencia.) Luego se halla la moda utilizando la siguiente fórmula

Page 34: Estadistica Wilson Octubre

Ejemplo: Dado la siguiente tabla de frecuencias halle la moda