Estadistica 2015 I

106
UNIVERSIDAD ANDINA “NESTOR CACERES VELASQUEZ” JULIACA ESCUELA DE POSTGRADO MAESTRIA EN EDUCACIÓN MENCIÓN : Administración y gerencia educativa. CURSO: MÉTODOS ESTADÍSTICOS PARA LA INVESTIGACIÓN DOCENTE: Dr. MARIO AGUILAR FRUNA JULIACA – PERÚ. 2015

description

diapositivas

Transcript of Estadistica 2015 I

UNIVERSIDAD ANDINA “NESTOR CACERES VELASQUEZ” JULIACA

ESCUELA DE POSTGRADO MAESTRIA EN EDUCACIÓN

MENCIÓN : Administración y gerencia educativa.

CURSO: MÉTODOS ESTADÍSTICOS PARA LA INVESTIGACIÓN

DOCENTE: Dr. MARIO AGUILAR FRUNA

JULIACA – PERÚ.2015

MAFRUNA 2

Reseña histórica

LOS BABILONIOS EN CHINA LOS ARABES3000 A.C. tablillas de arcilla: recolectar información

2000 a.c. CATASTROS

INFORMACION: DEMOGRAFICA,

AGRICOLA.

AÑO 0 LA BIBLIA

CENSO PROTOTIPO DE LOS ACTUALES. AÑO 727 758 Y 762 LOS

REYES: CAROLINGIOS PEPINO EL BREVE Y

CARLOMAGNO ORDENARON ESTUDIO ESTADISTICO SOBRE PROPIEDADES DE LA

IGLESIA.

PRODUCCION AGRICOLA,

PRODUCTOS VENDIDOS O

CAMBIADOS POR TRUEQUE.

MAFRUNA 3

ESCUELAS ESTADISTICAS

ADMINISTRATIVA

PROBABILISTICO

DEMOGRAFICO

AlemaniaFrancia, juegos de

azar.

Inglaterra

Asuntos del Estado.

problemas de la población.

MAFRUNA

ESCUELAS ESTADISTICAS

1. ADMINISTRATIVA.- Alemania asuntos del Estado.

2. PROBABILISTICO.- Francia, juegos de azar.

3. DEMOGRAFICO.- Inglaterra, problemas de la población.

MAFRUNA 5

CONCEPTO ETIMOLOGICAMENTE

• voz griega “STATERA”, que significa balanza

. Latín “STATUS”, que significa situación.

• También se afirma que procede del alemán “STAAT”, que significa Estado.

Se puede suponer que viene del vocablo Estado, por el hecho de que una de las funciones tradicionales de un gobierno central es de llevar registros de la situación de la población, nacimientos, defunciones, producciones, etc.

MAFRUNA 6

La estadística tiene que ver con:

Obje tivos

1° Colección y compendio de datos.

2°Diseños de experimentos y reconocimiento.

3° Suministro de varias medidas de

exactitud y la medición de la

variación.

4° La estimación de los parámetros y la

prueba de hipótesis.

5° El estudio de la relación de dos o

más variables.

MAFRUNA 7

Sentidos de la Estadística.

La Estadística como un conjunto de datos.

Expresados en términos numéricos, y recopilados

en forma sistemática aplicando una serie de

procedimientos técnicos

La Estadística como un

método para tratar datos.

Estadística comprende las siguientes etapas:

Recolección de datos Organización de datos Representación de datos

Análisis interpretación y conclusiones.

Considerada como un conjunto de métodos para procesar datos

numéricos.

MAFRUNA 8

CONCEPTO DE ESTADISTICA

• Ciencia aplicada que nos proporciona un conjunto de técnicas para recolectar, organizar, presentar, analizar e interpretar datos cuantitativos, con él propósito de obtener conclusiones y tomar decisiones acerca de hechos, fenómenos o acontecimientos, tanto de la realidad natural y social.

MAFRUNA 9

DEFINICION DE ESTADISTICA

CIENCIA QUE PROPORCIONA UN CONJUNTO DE METODOS O TECNICAS QUE SE UTILIZAN PARA RECOLECTAR, RESUMIR, CLASIFICAR, ANALIZAR E INTERPRETAR EL COMPORTAMIENTO DE LOS DATOS CON EL FIN DE OBTENER CONCLUSIONES Y PODER PREDECIR ALGO RESPECTO A UN DETERMINADO HECHO O FENOMENO EN ESTUDIO.

MAFRUNA 10

Clasificación de la estadística.

La Estadística Descriptiva Es un conjunto de

técnicas para recolectar, organizar, presentar y describir

datos cuantitativos, sin pretender obtener

conclusiones de orden general.

La Estadística inferencial Es un conjunto de

técnicas que hacen posible estimar o inferir

una o más características de una

población o universo en base a los resultados

obtenidos en una muestra.

MAFRUNA 11

CLASES DE ESTADISTICA

DESCRIPTIVA

Es aquella parte de la estadística que describe y analiza una muestra, sin pretender sacar conclusiones de tipo general.

INFERENCIAL

Es aquella parte de la estadística , cuyo propósito es inferir o deducir leyes de comportamiento de una población, a partir del estudio de una muestra.

MAFRUNA 12

CARACTERISTICAS DE LA ESTADISTICA:

• Es el único medio que permite manejar y procesar una gran masa de datos.

• Es un medio eficaz e infaltable en la investigación científica.

• Es una forma convincente y evidente de presentación de informes de estudios realizados.

• Las técnicas estadísticas son las mismas, tanto para las ciencias naturales como las ciencias sociales.

• El método estadístico se usa inclusive para el análisis de datos provenientes de fenómenos considerados como “subjetivos”, tales como la inteligencia, aprendizaje, actitudes, etc.

MAFRUNA 13

USOS Y ABUSOS DE LA ESTADISTICA:

Así como hay múltiples formas de utilizar la Estadística con fines científicos o en trabajos serios y honestos; existen también formas de mal uso que se hace de la Estadística, por ejemplo, en las siguientes situaciones:

• Las encuestas deshonestas que se toman en las campañas electorales para favorecer o perjudicar a un determinado partido político.

• Algunas veces se usa para mentir, como cuando en una propaganda comercial.

• En algunos casos se usa para distorsionar una realidad concreta.• Puede haber un propósito deshonesto en la presentación gráfica de

los datos a fin de distorsionar los hechos de la realidad o simplemente un incorrecto procesamiento de los datos.

MAFRUNA 14

DESLINDE DE TERMINOS BASICOS:

Población

• Esta formado por el conjunto completo de elementos, individuos, objetos, unidades de análisis o medidas que presentan características comunes y observaciones, cuyo estudio revista alguna importancia.

MAFRUNA 15

EJEMPLOS: Se han determinado las siguientes poblaciones:-Todos los trabajadores que laboran en el GRC cusco.- Todas las notas obtenidas en el área de matemática por los estudiantes de una Institución Educativa.- El número total de aparatos producidos por una fábrica en un año.- El total de accidentes de tránsito ocurridos en la ciudad de Lima en el año 2009.- Total de pacientes atendidos por tuberculosis en el hospital Antonio Lorena de la ciudad del cusco en el año 2010.

MAFRUNA 17

Valor constante

Son los datos que tienen un valor único o fijo. Son ejemplos de constantes los siguientes datos:

1)El valor del número (pi) = 3,1416.2)Los días de la semana son siete.3)El sexo de una persona es único.4)El número de días del mes de julio es 31.5)Las estaciones del año son cuatro.6)Los meses del año son 12.

MAFRUNA 18

Parámetro.- Es constante o medida que describe las características importantes de una población.

Los parámetros se designan con letras del alfabeto griego.

Constante que caracteriza a la población.

MAFRUNA 19

Estadígrafo.- Son los valores que se calculan a partir de una muestra. Sirven para estimar los parámetros de una población. los estadígrafos se designan con letras del alfabeto castellano.

MAFRUNA 20

• - Unidad Estadística.• Esta formado por cada uno de los elementos de

una muestra o población. Es el objeto o individuo que será estudiado y de los cuales se obtendrán los datos de acuerdo a las características o propiedades que se van a estudiar.

• EJEMPLO: Cada trabajador del sector público es una unidad estadística.

En cambio, las características pueden ser los datos referidos al desempeño laboral, edad, peso, talla, etc. de cada trabajador.

MAFRUNA 21

- Datos Estadísticos. Son las medidas o valores que han sido recopilados de

cada uno de los elementos pertenecientes a una muestra. Los datos constituyen la materia prima de la estadística.

• EJEMPLO: Son datos estadísticos los siguientes:• El número de trabajadores de una empresa es 250.• En el Perú, de cada 1000 estudiantes que egresan de

Educación secundaria, solo 150 ingresan a Universidades Públicas o Nacionales.

• El promedio final de rendimiento académico de una sección del primer semestre académico en la CAP de contabilidad de la UANCV es de 12 puntos.

• El 20% de la población peruana es analfabeta.• El promedio anual de inflación en el Perú es del 12%.• El número de empresas constructoras en la Región Puno

es de 500.

MAFRUNA 22

Pasos de la investigación estadística:1º Formulación y definición del problema.- 2º Compilación o recolección de datos.- 3º Organización de la información.-

PRIMER PASO.- la corrección SEGUNDO PASO.- la clasificación

4 BASES; tiempo, lugar, cantidad y cualidad. TERCER PASO.- Tabulación

4º Presentación de Los datos.- 3 formas: Literal. Tabular y grafica.5º análisis de los datos.-

5.1. ANALISIS ESTADISTICO SIMPLE. 5.2. LA INFERENCIA ESTADISTICA.5.3. ANALISIS DE SERIES DE TIEMPO 5.4. ANALISIS DE LA RELACION.-5.5. ANALISIS DE VARIANZA.-

MAFRUNA 23

Variables estadísticas.Una variable es característica o propiedad de los elementos de una muestra o población.

Las variables toman diferentes valores de

acuerdo a los objetos o individuos observados.

• Las variables se designan con letras mayúsculas, tales como: X, Y, Z. En cambio, los valores se designan con letras minúsculas, x, y, z.

MAFRUNA 24

EJEMPLO: En el siguiente cuadro se presentan variables con sus respectivos valores: VARIABLES VALORES

Sexos Masculino y femenino.Edades 20, 35, 45, 25, 44, 24,años, etc.C.I. 88, 90, 96,130,110, puntos,etc.Pesos 60; 85; 5: 55: 5; 70: kilos, etc.Estaturas 1,70; 1,75; 1,68; 1,80; m, etc.Estado civil Soltero, casado, etc.

Ingreso mensual 400, 500, 600, 700 soles, etc.Profesiones Contador,Médico,Abogado, etc.Tiempo de servicios 3; 4; 8; 23; 27; 30 años, etc.Rendimiento académico 10; 12; 07; 14; 17 puntos, etc.Lugar de nacimiento Juliaca, Puno, Lampa, etc.Número de hijos 2; 4; 0; 1; 6; 3; etc.

MAFRUNA 25

CLASIFICACION DE LAS VARIABLESI.- POR SU NIVEL DE ABSTRACCIÓN O GENERALIDAD.

De acuerdo a este criterio se clasifican en:

- Variables teóricas. Son aquellas variables que para ser observadas o medidas requieren ser operacionalizadas en términos más concretos.

• Variables intermedias. Son aquellas que operacionalizan o específicas a las variables generales y, que por lo tanto son más observables o mensurables.

• Variables empíricas o indicadores. Son aquellas variables cuyos valores son fácilmente observables o mensurables.

MAFRUNA 26

VARIABLES GENERALES

VARIABLES INTERMEDIAS

INDICADORES

1. RENDIMIENTO ACADÉMICO

1.1. EVALUACION FORMATIVA.

1.2. EVALUACION SUMATIVA.

1.3. EVALUACION DE SALIDA

NOTAS O CALIFICATIVOS

EN CADA TIPO DE EVALUACION

2.- NIVEL SOCIOECONOMICO DE UNA PERSONA

2.1. INGRESO ECONOMICO.

2.2. TIPO DE VIVIENDA.

2.3. ZONA DONDE VIVE.

SUELDO MENSUAL

PROPIA O ALQUILADA.

BARRIO PP JJ URBANIZACION

3.- EDUCACION DE UNA PERSONA

3.1. GRADO DE INSTRUCCIÓN.

3.2. TIPO DE COLEGIO.

PRIMARIA/SECUNDARIA/SUPERIOR, ETC.

PRIVADA O PUBLICO

4. NIVEL ALIMENTARIO 4.1 NIVEL DE NUTRICION DE LOS ALIMENTOS.

4.2. CALIDAD DE LOS ALIMENTOS

CALORIAS AL DIA

TIPOS DE ALIMENTOS

MAFRUNA 27

VARIABLES TEORICAS VARIABLES INTERMEDIAS VARIABLES EMPIRICAS

1. RENDIMIENTO ACADEMICO DE LOS ESTUDIANTES DE LA

UANCV.

2. HABITOS DE CONSUMO.

3. DESARROLLO ECONOMICO.

4. ESTRATO SOCIO ECONOMICO.

5. CALIDAD EDUCATIVA.

1.1. CALIFICACIONES

1.2. ASISTENCIA A CLASES.

1.3. PRACTICAS PRE PROFESIONALES

ALTA 20 -17MEDIA 16 -11BAJA 10 -00

REGULAR 100 -81%MEDIA 80 - 61%BAJA menos a 61%

EFICIENTE 20 -17REGULAR 16 -11DEFICIENTE 10 -00

MAFRUNA 28

II.- VARIABLES POR SU RELACIÓN CAUSAL.

De acuerdo a este criterio las variables se clasifican en:• Variable independiente. Es aquella que no depende de

ninguna otra variable en el marco de un estudio o investigación. Indica la causa, el antecedente o el factor determinante de otra variable. Este tipo de variables se representa generalmente con la letra “X”.

• Variable dependiente. Es aquella que depende de la variable independiente. Indica el efecto, el consecuente o la resultante. Se simboliza con la letra “Y”. Luego y = f (x).

• Variable interviniente. Es aquella variable que coparticipa con la variable independiente, condicionado a la variable dependiente.

MAFRUNA 29

EJEMPLO:

La falta de fomento de la educación alimentaria en la población, genera mayor desnutrición infantil en las familias con bajo nivel de instrucción.

Educación alimentaria = X: Variable independiente

Desnutrición infantil = Y: Variable dependiente.

Nivel de instrucción. = Z: Variable interviniente.

MAFRUNA 30

Problema: ¿En que medida influye la cultura tributaria en la informalidad comercial en los comerciantes de la ciudad de Juliaca?

a)Hipótesis: Si los comerciantes de la ciudad de Juliaca tienen un nivel de cultura tributaria, entonces la informalidad comercial es ...

a)Variables Independiente: cultura tributaria. b) Variable dependiente: informalidad comercial .

c) Variable interviniente: Edad, sexo, nivel socio-económico, etc. de los comerciantes.

MAFRUNA 31

III.- VARIABLES POR SU NATURALEZA.1. VARIABLES CUALITATIVAS. expresan atributos y por tanto no

son numéricas. Son ejemplos de variables cualitativas: el sexo, estado civil, tipo de religión, grado de instrucción, ocupaciones, partido político, tipo de empresas, clases de contabilidad etc.

2. VARIABLES CUANTITATIVAS. Son aquellas variables cuyos valores se obtienen como resultado de un proceso de conteo o de una medición, y por consiguiente tienen variables numéricos. Las variables numéricas se clasifican, a su vez, en:

a) variables cuantitativas discretas. tienen valores numéricos naturales: 0; 2; 3; 4; 5...........; Etc. son ejemplos de variables discretas: Número de hijos, Número de estudiantes, habitaciones por vivienda, Número de accidentes de tránsito, etc.

b) variables cuantitativas continuas: son aquellas cuyos valores se obtienen como resultado de una medición. Pueden tener cualquier valor dentro del conjunto de números reales. Son ejemplos de variables continuas: el peso de una persona, edades, ingreso económico, el tiempo de servicios, etc.

MAFRUNA 32

Ejemplos: variable cualitativa.Cuyo dominio de variación son objeto de clasificación.

VARIABLE DOMINIO DE VARIACION

SEXO - Masculino – Femenino

LUGAR DE

NACIMIENTO: - Juliaca. - Cusco.– Sicuani.

MAFRUNA 33

Ejemplos: variables ordinales Cuyo dominio de variación son objeto de clasificación y orden

VARIABLE DOMINIO DE VARIACION

Nivel de - Analfabeto – Primaria -

Instrucción. - Secundaria - Superior.

Nivel - Alto

Socio - Medio

Económico. - Bajo

MAFRUNA 34

EJEMPLOS.VARIABLE CUANTITATIVA DISCRETA.

VARIABLE DOMINIO DE VARIACION1. Numero de 01 hijo. 02 hijos, 03 hijos, etc. Hijos.2. Numero de 50 estudiantes, 3000 estudiantes,

etc. Estudiantes3. Numero de 10 trabajadores, 34 trabajadores,

etc. trabajadores4. Numero de 30 empresas, 12, 23, etc. empresas

MAFRUNA 35

EJEMPLOS. variable cuantitativa continua.

VARIABLE DOMINIO DE VARIACION

1. Peso 54,5 Kg. 62,3Kg. 75,8 Kg. Etc.

2. Talla 1,67 m. 1,56 m. 1,78 m . etc.

3. Temperatura 28,5º C. 10,2º C. Etc.

MAFRUNA 36

MEDICION DE LAS VARIABLES

1. ESCALA NOMINAL: Dicotomicas, tricotomicas y politomicas.

2. ESCALA ORDINAL: jerarquías y orden.

3. ESCALA DE INTERVALO: Clasificación, orden y grado de distancia.

4. ESCALA DE RAZON O PROPORCION: Clasificación, orden, grado de distancia y punto de origen u origen natural.

MAFRUNA 37

REDONDEO DE DATOS

MAFRUNA 38

RECOLECCION DE DATOS

Se refiere a la a la obtención de la información pertinente de las unidades fundamentales o elementos introducidas en una muestra o población, por lo tanto en la recolección se deben de tomar en cuenta dos (2) puntos importantes.I.- Como obtener las unidades estadísticas yII.- Como realizar la medición de estas unidades estadísticas.

MAFRUNA 39

TECNICAS E INSTRUMENTOSLA OBSERVACION

Según el lugar o ámbito donde se encuentran los datos:-DOCUMENTAL-DE CAMPO-DIRECTA.-INDIRECTA-NO PARTICIPANTE-ACTIVASegún los medios utilizados:-ESTRUCTURADA-NO ESTRUCTURADA

-Guía o ficha de observación.-Lista de cotejos.

INVESTIGACION DOCUMENTAL O ANALISIS DE CONTENIDO-ACADEMICOS.-ACTAS E INFORMES.-PERSONALES.-FOTOGRAFIAS, PLANOS , VIDEOS, ETC.

-Guía o ficha de Investigación documental.

ENTREVISTA-ASISTEMATICA O LIBRE.-ESTRUCTURADA.-FOCALIZADA.-SIMULTANEA.-SUCESIVA.

-Guía o ficha de entrevista.

ENCUESTA-PERSONAL.-POR TELEFONO.-CORREO O POSTAL-VIRTUAL.

-Cuestionario.

EXAMEN - Prueba.

VALIDACIÓN Y CONFIABILIDAD DE LOS INSTRUMENTOS.

La validez se refiere al grado con que un instrumento mide la variable lo que dice

medir y no en otra cosa.

La confiabilidad, implica que el instrumento de medición se refiere al grado de presión o

exactitud de la medida.MAFRUNA 40

Tipos de validación y confiabilidad de instrumentos.

MAFRUNA 42

ORGANIZACIÓN DE LOS DATOS ESTADÍSTICOSLa información estadística que ha sido una vez recopilada debe ser examinada y

organizada. Esta etapa de organización de datos comprende 3 pasos muy importantes.

Primer paso.- corrección de datos.Respuestas inconsistentes, es decir contradictorias.Respuestas ilegibles: No se puede leer la escritura.Respuestas incompletas: Preguntas sin contestar.Necesidad de cálculos: por ejemplo de totales.

Segundo paso.- Clasificación de los datos.TIEMPO.- Basado por intervalos o periodos de tiempo, tales como años, meses, semanas, etc.LUGAR.- Se refiere a las clasificaciones por áreas geográficas tales como: Países regiones, etc.CANTIDAD.- Se refiere a la información cuantitativa puede ser clasificada de acuerdo al orden de magnitud de las cifras obtenidas de la información, tales como edad, peso, puntaje de calificación, etc.CUALIDAD.- Son los que se hace de acuerdo a alguna característica o atributos tales como: estado civil, tipos de religión, grado de instrucción, etc.

Tercer paso.- tabulación de los datos.Las tablas de frecuencia son de dos clases:Tablas de frecuencia con datos no agrupadosTablas de frecuencias con datos agrupados.

MAFRUNA 43

PRESENTACIÓN DE LOS DATOS ESTADÍSTICOSUna vez que los datos han sido recopilados, organizados y clasificados en

tablas de frecuencias, ya están listos para su interpretación de manera que puedan facilitar su análisis e interpretación. Dicha presentación se puede realizar en tres formas:

a)Forma literal.b)Forma tabular. Tablas de referencia y analíticas.c)Forma gráfica. C.a. Grafico de líneas.c.b. Grafico de barras. C.b.1. Grafico de barras simples. C.b.2. Grafico de barras agrupadas. C.b.3. Grafico de barras segmentadas.C.b.4. Grafico de barras bidireccionales. C.b.5 Pirámides de edad. c.c. Gráfico de figuras.

d. Diagramas Circulares. e. Mapas estadísticos

MAFRUNA 44

Encabezamiento de Columnas o Cabeza del Cuadro

ColumnaMatriz

Dato Cuerpo del Cuadro

Celda que contiene al dato

Gráfica de las partes de un cuadro.

Cuadro Nº:Titulo: …………………………………………………………………..

Nota ( *)………………………………………………………………………………………………..Fuente: ………………………………………………………………………………………………...

DISTRIBUCION DE FRECUENCIA

Tablas de Frecuencia• Los datos recopilados en la muestra se pueden

organizar en Tablas de Frecuencias.• Estas tablas muestran:

– las clases o categorías de respuesta de donde se obtuvieron los datos (o los intervalos de clase si los datos son cuantitativos)

– El número o proporción de veces que la clase se encontró en los datos recopilados.

Tablas de FrecuenciaDatos Cualitativos

Estado Civil(clase)

Número de ocurrencias

(frecuencia)

Porcentaje(frecuencia

relativa)

Soltero 22 22 %

Casado 45 45 %

Divorciado 20 20 %

Viudo 8 8 %

Otro 5 5 %

Total 100 personas 100 %

Tablas de Frecuencia

• Frecuencia (f): Resulta de contar el número de observaciones que "entran" en una clase

• Frecuencia Relativa (fr): Es la proporción de observaciones que "entran" en una clase:

n

ffr i

i

Tablas de FrecuenciaDatos Cuantitativos

• Con este tipo de datos se construyen intervalos de clase.

• Los intervalos de clase constan de:– un valor de inicio llamado Límite Inferior (LI)

– un valor final llamado Límite Superior (LS)

Tablas de FrecuenciaDatos Cuantitativos

• Amplitud de Intervalos: – Se calcula restando dos límites superiores

consecutivos:

ii LSLS 1ic

Tablas de FrecuenciaDatos Cuantitativos

• Marca de Clase: Es el punto medio del intervalo de clase. Se usa en los métodos estadísticos como valor estimado de las observaciones que cayeron dentro de ese intervalo

2LSLI

X iii

Tablas de FrecuenciaDatos Cualitativos y Cuantitativos

• Frecuencia Acumulada (fa): Es el número de observaciones acumuladas hasta la clase de referencia:

fa fi jj 1

i

Tablas de FrecuenciaDatos Cualitativos y Cuantitativos

• Frecuencia Relativa Acumulada (fra): es la proporción de observaciones acumuladas hasta la clase de referencia:

frafa

nii

Tablas de Frecuencia en Excel

1. Cargar el módulo de Análisis de Datos:– Herramientas

– Complementos

– Palomeo “Herramientas para Análisis”

Tablas de Frecuencia en Excel

2. Acceso la subrutina Histograma de módulo de Análisis de Datos:

– Herramientas

– Análisis de Datos

– Histograma: • Selecciono a los datos de la muestra como “rango de entrada”

• OPCIONAL: Selecciono a los límites superiores como “rango de clases”

Tablas de Frecuencia Bivariadas

• Se tabulan dos variables en una sola tabla.• También se llaman tablas de cruce o de contingencia.

Estado Civil Hombre Mujer Total por Estado Civil

Soltero 10 12 22

Casado 22 23 45

Divorciado 7 13 20

Viudo 2 6 8

Otro 4 1 5

Total por Sexo 45 55 100 personas

TÉCNICAS GRÁFICAS

Técnicas Gráficas

• Graficamos el contenido de la tabla de frecuencia.• Las más importantes gráficas:

– Pie

– Barras

– Histograma

– Polígono

Gráficas de Pie o de Sectores

• Se usa con datos cualitativos o cuantitativos.• A través de una regla de tres , un círculo se divide en

sectores.

• Cada “rebanada” representa la proporción de datos contenidos en una clase de la tabla de frecuencia.

grados fr 360i i

Gráficas de Pie o de Sectores2%

8%

25%

39%

17%

2%5%

2%

clase 1clase 2clase 3clase 4clase 5clase 6clase 7clase 8

Gráficas de Pie o de Sectoresen Excel:

• Selecciono la frecuencia de la tabla• Llamo al asistente para gráficas

– Selecciono una gráfica circular

– Coloco los rótulos de categoría: • categorías

• marcas de clase

– Coloco los rótulos de datos en “porcentaje”

Gráficas de Columnas o Barras

• Se usa con datos cualitativos o cuantitativos.• Se puede hacer con la frecuencia o con la frecuencia

relativa.• Se grafican rectángulos sobre un eje cartesiano en

donde cada rectángulo representa a cada clase en la tabla de frecuencia.

Gráficas de Columnas o Barras

1

5

15

23

10

1

3

1

0

5

10

15

20

25

clase 1 clase 2 clase 3 clase 4 clase 5 clase 6 clase 7 clase 8

Gráficas de Columnas o BarrasEn Excel:

• Selecciono la frecuencia o frecuencia relativa de la tabla

• Llamo al asistente para gráficas– Selecciono una gráfica de columnas o de barras

– Coloco los rótulos de categoría: • categorías

• marcas de clase

– Coloco los rótulos de datos

Histograma

• Es exclusiva para datos cuantitativos.• Se puede hacer con la frecuencia o con la frecuencia

relativa.• Se grafican rectángulos sobre un eje cartesiano en

donde el área de cada rectángulo representa a cada intervalo de clase en la tabla de frecuencia.

• Sirve para comparar las magnitudes representadas en cada intervalo de clase.

Histograma

1

5

15

23

10

1

3

1

0

5

10

15

20

25

clase 1 clase 2 clase 3 clase 4 clase 5 clase 6 clase 7 clase 8

HistogramaEn Excel (Opción 1)

• Selecciono la frecuencia de la tabla• Llamo al asistente para gráficas

– Selecciono una gráfica de columnas

– Coloco los rótulos de categoría: marcas de clase

– Coloco los rótulos de datos

– Reduzco el “ancho del rango” a cero.

NOTA: Este procedimiento es válido solo cuando la amplitud es la misma para cualquier intervalo de clase.

HistogramaEn Excel (Opción 2)

• Acceso la subrutina Histograma de módulo de Análisis de Datos:

– Herramientas– Análisis de Datos– Histograma:

• Selecciono a los datos de la muestra como “rango de entrada” • OPCIONAL: Selecciono a los límites superiores como “rango de

clases”• Selecciono la opción “Crear Gráfico”

• Ya en la gráfica, reduzco la distancia entre barras a cero.NOTA: Este procedimiento es válido solo cuando la amplitud es la misma para cualquier intervalo de

clase.

Polígono

• Es exclusiva para datos cuantitativos.• Se puede hacer con la frecuencia o con la frecuencia

relativa. • Es una gráfica de punto y línea sobre el eje cartesiano.• Sirve para observar la forma de la distribución de

frecuencias.

Polígono

• Lo importante en el polígono es mantener el área bajo la curva igual al área acumulada en el histograma.

– Añado una marca de clase anterior a la primera (restándole la amplitud)

– Añado una marca de clase posterior a la última (sumándole la amplitud)

– Les adjudico frecuencia igual a cero a estas marcas de clase adicionales

– Grafico utilizando estas marcas de clase adicionales.

Polígono

01

5

15

23

10

1

3

100

5

10

15

20

25

0 2 4 6 8 10 12

PolígonoEn Excel (Opción 1)

• Selecciono la frecuencia o frecuencia relativa de la tabla (ampliada)

• Llamo al asistente para gráficas– Selecciono una gráfica de dispersión XY, que muestre

los puntos unidos por líneas.

– Coloco las marcas de clase como “rótulos de categoría”

– Coloco los rótulos de datosNOTA: Este procedimiento es válido solo cuando la amplitud es la misma para cualquier

intervalo de clase.

PolígonoEn Excel (Opción 2)

• Realizo el histograma de frecuencias a través de la subrutina de Análisis de Datos con la tabla ampliada.

• Ya en la gráfica, cambio el tipo de gráfica a: Dispersión XY.

NOTA: Este procedimiento es válido solo cuando la amplitud es la misma para cualquier intervalo de clase.

TÉCNICAS NUMÉRICAS

Técnicas Numéricas

• Estos son los estadísticos muestrales.• Calculamos valores que “resumen” las características

de los datos en la muestra:– Tendencia Central

– Dispersión

– Forma

– Medidas de Posición

Técnicas NuméricasEn Excel Opción 1

• Acceso la subrutina Estadística Descriptiva del módulo de Análisis de Datos:

– Herramientas

– Análisis de Datos

– Estadística Descriptiva: • Selecciono a los datos de la muestra como “rango de entrada”

• Selecciono la opción “Resumen de Estadísticas”

Tendencia Central

• Las principales medidas son:– Media Aritmética

– Mediana

– Moda

– Media Geométrica

– Media aritmética ponderada

Tendencia Central Media Aritmética

• La media aritmética poblacional se denota como μ• La media aritmética muestral es el promedio de los

datos.

X =X

n

ii 1

n

En Excel Opción 2: función PROMEDIO

Tendencia Central Mediana

• Se define como el valor central.• El valor que delimita al 50% de los datos .• En Excel Opción 2: función MEDIANA

Tendencia Central Moda

• Es el valor más frecuente, el que se observa mayor número de veces

• Pueden existir varios o ningún valor de moda para un solo conjunto de datos, la distribución puede ser:

• Amodal cuando ningún valor se repite

• Unimodal cuando un solo valor es el más frecuente

• Bimodal cuando dos valores son los más frecuentes

• trimodal,...., polimodal

• En Excel Opción 2: función MODA

Relación entre Tendencia Central y la Simetría de la distribución

Simetría Relación

Simétrica o insesgada Moda = Mediana = Media

sesgo positivo o a la derecha

Moda > Mediana > Media

sesgo negativo o a la izquierda

Moda < Mediana < Media

Relación entre Tendencia Central y la Simetría de la distribución

Moda=Mediana=Media

Insesgada

Relación entre Tendencia Central y la Simetría de la distribución

Moda MedianaMedia

Sesgo Positivo (a la derecha)

Relación entre Tendencia Central y la Simetría de la distribución

ModaMedianaMedia

Sesgo Negativo (a la izquierda)

Tendencia Central Media Geométrica

• Es el crecimiento promedio. • El factor de crecimiento de la variable X:

i

1XX

Y1i

ii

Entonces, el factor de crecimiento promedio de la variable X:

nn21

nn21 111YYYG iii

Tendencia Central Media Geométrica

• La tasa de crecimiento de la variable X:

1XX

1Y1i

ii

i

Entonces, la tasa de crecimiento promedio de la variable X:

1-Gi La media aritmética siempre es mayor que la geométrica.

Tendencia Central Media Geométrica

• En Excel: función MEDIA.GEOM – usando como argumentos los factores de crecimiento de

la variable X = (1+i)

– Para calcular la tasa promedio de crecimiento, al resultado de MEDIA.GEOM se le resta 1.

• También se puede calcular:

n

1

n

XX

G

Tendencia Central Media Aritmética Ponderada

• Se calcula la media aritmética muestral, adjudicando diferente “importancia” a cada uno de los datos.

n

1ii

n

1iii

p

w

Xw=X

Dispersión

• Las principales medidas son:– Rango

– Desviación Media

– Varianza

– Desviación Estándar

– Coeficiente de Variación

Dispersión Rango

• Es la diferencia que existe entre el valor mas grande y el mas pequeño.

minmaxrango

Dispersión Desviación Media Absoluta

• Es el promedio de las distancias absolutas de los datos a su media aritmética.

En Excel: función DESVPROM

n

XX=M

n

1ii

D

Dispersión Varianza poblacional

• La varianza poblacional se denota como σ²• Es el promedio de los cuadrados de las distancias de

los datos a su media aritmética.

Es un estimador sesgado. Funciona solo para muestras “grandes”. En Excel Opción 2: función VARP

n

XX=

n

1i

2i

2

Dispersión Varianza muestral

• La varianza muestral se denota como S²• Se calcula igual que la varianza poblacional,

dividiendo entre n-1.

Es un estimador insesgado. Funciona para cualquier tamaño de muestra.

En Excel Opción 2: función VAR

1-n

XX=

n

1i

2i

2

S

Dispersión Desviación Estándar

• Mide la variación de los datos en términos absolutos. • Se interpreta como la distancia promedio de los datos

a su media aritmética.• Se expresa en las mismas unidades que las empleadas

en los datos. • Se calcula tomando la raíz cuadrada positiva de la

varianza.

Dispersión Desviación Estándar

• Desviación Estándar Poblacional:

2

2S=S

En Excel: función DESVESTP

Desviación Estándar Muestral:

En Excel: función DESVEST

Dispersión Desviación Estándar

• Para interpretar la dispersión absoluta, se construyen intervalos alrededor del promedio. Con esto se determina en dónde se sitúan los valores de una distribución de frecuencia en relación con la media aritmética. Esto se puede lograr utilizando:

– Teorema de Chebyshev

– Regla Emprírica

Dispersión: Desviación Estándar Teorema de Chebyshev

Cualquiera que sea la forma de la distribución de los datos:

• al menos el 75% de los valores (población) caerán dentro de 2 desviaciones estándar respecto de la media de la distribución:

2SX

X 3S

al menos el 89% de los valores (población) caerán dentro de 3 desviaciones estándar respecto de la media de la distribución:

Dispersión: Desviación Estándar Regla Empírica

Solo cuando la forma de la distribución de los datos es simétrica (insesgada):

• aproximadamente el 68% de los datos (población) se encuentran a una desviación estándar alrededor de la media de la distribución :

SX

Dispersión: Desviación Estándar Regla Empírica

• aproximadamente el 95% de los datos (población) se encuentran a 2 desviaciones estándar alrededor de la media de la distribución :

2SX

X 3S

aproximadamente el 99% de los datos (población) se encuentran a 3 desviaciones estándar alrededor de la media de la distribución :

Dispersión Coeficiente de Variación

• Mide la variación relativa de la variable con respecto a su promedio.

• Cuando deseamos comparar la dispersión de dos distribuciones, necesitamos medir la magnitud de la desviación estándar en relación con la magnitud de la media

• Expresa a la variación de los datos como porcentaje de su promedio.

XS

=CV

Forma

• Las medidas de forma son:– Sesgo

– Curtosis

FormaSesgo

• Es el grado de asimetría que tiene la distribución• Una curva insesgada tiene sesgo cero• Medimos en cuánto se aleja la distribución de una

insesgada: – Si el polígono de frecuencias tiene la mayor

acumulación a la izquierda, tiene sesgo positivo o a la derecha.

– Si el polígono de frecuencias tiene la mayor acumulación a la derecha, tiene sesgo negativo o a la izquierda

FormaSesgo

• En Excel Opción 2: función COEFICIENTE.ASIMETRIA

Coeficiente de Asimetría

Sesgo

= 0 No hay sesgo. La distribución es insesgada

> 0 La distribución tiene sesgo positivo o a la derecha.

< 0 La distribución tiene sesgo negativo o a la izquierda.

FormaCurtosis

• Mide qué tan “puntiaguda” es una distribución, con respecto a la Normal.

– La distribución Normal se considera mesocúrtica, es el término medio.

– Las distribuciones mas puntiagudas que la Normal se llaman leptocúrticas

– Las distribuciones menos puntiagudas que la Normal se conocen como platocúrticas

FormaCurtosis

Leptocúrtica

Mesocúrtica

Platocúrtica

FormaCurtosis

• En Excel Opción 2: función CURTOSIS

Función Curtosis Curtosis

= 3 Mesocúrtica

> 3 Leptocúrtica

< 3 Platocúrtica

Medidas de Posición

• Las medidas de posición son:– Cuartiles: Son tres y delimitan al 25%, 50% y 75% de

los datos acumulados.

– Deciles: Son nueve y delimitan al 10%, 20%, ... , 90% de los datos acumulados.

– Percentiles: Son noventa y nueve y delimitan al 1%, 2%, ... , 99% de los datos acumulados.

• Siempre acumulamos de izquierda a derecha.• En Excel: función PERCENTIL