ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia...

65
ESTADISTICA BASICA ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Mtra. Verónica Belén Rodríguez Hevia Hevia [email protected] [email protected] [email protected] [email protected] Julio de 2011 Julio de 2011

Transcript of ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia...

Page 1: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

ESTADISTICA BASICA ESTADISTICA BASICA

Mtra. Verónica Belén Rodríguez Mtra. Verónica Belén Rodríguez HeviaHevia

[email protected][email protected]@[email protected]

Julio de 2011Julio de 2011

Page 2: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

“Es el conjunto de técnicas que se emplean para la recolección, organización, análisis e interpretación de datos.” (Kazmier, 1998:1).

“El tema de la estadística moderna abarca la recolección, presentación y caracterización de información para ayudar tanto en el análisis de datos como en el proceso de toma de decisiones.” (Berenson y Levine, 1996:2)

“Método de toma de decisiones frente a la incertidumbre.” (Chou, 1977:1)

“Método científico de operar con los datos y de interpretarlos.” (Portus, 1994:3)

“Métodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea una causa intrínseca de los mismos.” (Montiel y otros, 1996:2)

“El análisis estadístico se usa para manipular , resumir e investigar datos con el fin de obtener información útil en la toma de decisiones.” (Hanke y Reitsch, 1997:3)

Definición de Estadística Definición de Estadística

Page 3: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

Para qué sirve la estadística?Para qué sirve la estadística?

La Ciencia se ocupa en general de fenómenos La Ciencia se ocupa en general de fenómenos observablesobservables

La Ciencia se desarrolla observando hechos, La Ciencia se desarrolla observando hechos, formulando leyes que los explican y realizando formulando leyes que los explican y realizando experimentos para validar o rechazar dichas leyesexperimentos para validar o rechazar dichas leyes

La La EstadísticaEstadística se utiliza como se utiliza como tecnología al tecnología al servicioservicio de las ciencias donde la variabilidad y la de las ciencias donde la variabilidad y la incertidumbre forman parte de su naturalezaincertidumbre forman parte de su naturaleza

Page 4: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

Casi todas las áreas del saber requieren del pensamiento estadístico. Las disciplinas de estudio que dependen ampliamente del análisis estadístico, incluyen -pero no se limitan a-, marketing, finanzas economía e investigación de operaciones. Los principios de contabilidad y gerencia financiera también se basan en principios estadísticos.

Contabilidad:•Para seleccionar muestras con propósitos de auditoría.•Para comprender los derroteros de costos en contabilidad de costos.

Finanzas:•Para estar al tanto de las medidas financieras en el transcurso del tiempo.•Para desarrollar formas de pronosticar valores de estas medidas en momentos futuros.

Administración:•Para describir las características de los empleados dentro de una organización.•Para mejorar la calidad de los productos fabricados o de los servicios procurados por la organización.

Mercadeo:•Para determinar la proporción de clientes que prefieren un producto en vez de otro y la razón de esto.•Para sacar conclusiones respecto a la estrategia de publicidad que sería más útil para el incremento de ventas de un producto.

ÁmbitoÁmbito de la Estadística: de la Estadística:

Page 5: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

DefiniciónDefinición La Estadística es la Ciencia de laLa Estadística es la Ciencia de la

Sistematización, recogida, ordenación y Sistematización, recogida, ordenación y presentaciónpresentación de los datos referentes a un de los datos referentes a un fenómeno que presenta variabilidad o fenómeno que presenta variabilidad o incertidumbre para su estudio metódico, con incertidumbre para su estudio metódico, con objeto de objeto de

deducir las leyesdeducir las leyes que rigen esos que rigen esos fenómenos, fenómenos,

y poder de esa forma hacer previsiones y poder de esa forma hacer previsiones sobre los mismos, tomar sobre los mismos, tomar decisionesdecisiones u u obtener obtener conclusionesconclusiones..

Descrip

tiva

Probabilidad

Infe

rencia

Page 6: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

TIPOS DE ESTADÍSTICATIPOS DE ESTADÍSTICA

ESTADÍSTICA INFERENCIAL :ESTADÍSTICA INFERENCIAL : Pueden definirse Pueden definirse como aquellos métodos que hacen posible la como aquellos métodos que hacen posible la estimación de una característica de una estimación de una característica de una población o la toma de una decisión población o la toma de una decisión referente a una población, basándose solo en referente a una población, basándose solo en los resultados de la muestra.los resultados de la muestra.

ESTADISTICA DESCRIPTIVA :ESTADISTICA DESCRIPTIVA : Puede definirse como Puede definirse como aquellos métodos que incluyen la recolección, aquellos métodos que incluyen la recolección, presentación y caracterización de un conjunto de presentación y caracterización de un conjunto de datos con el fin de describir apropiadamente las datos con el fin de describir apropiadamente las diversas características de ese conjunto de datos.diversas características de ese conjunto de datos.

Page 7: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

PENSAMIENTO PENSAMIENTO ESTADÍSTICOESTADÍSTICO

““CONJUNTO DE PROCESOS DEL PENSAMIENTO QUE CONJUNTO DE PROCESOS DEL PENSAMIENTO QUE SE ORIENTAN A LA FORMA DE ENTENDER, SE ORIENTAN A LA FORMA DE ENTENDER, ADMINISTRAR Y REDUCIR LA VARIACIÓN” ADMINISTRAR Y REDUCIR LA VARIACIÓN” (Berenson y Levine, 2001:4)(Berenson y Levine, 2001:4)

“CONJUNTO DE PRINCIPIOS Y VALORES QUE PERMITEN CONJUNTO DE PRINCIPIOS Y VALORES QUE PERMITEN

IDENTIFICAR LOS PROCESOS, CARACTERIZARLOS, IDENTIFICAR LOS PROCESOS, CARACTERIZARLOS,

CUANTIFICARLOS, CONTROLAR Y REDUCIR SU CUANTIFICARLOS, CONTROLAR Y REDUCIR SU

VARIACIÓN PARA VARIACIÓN PARA IMPLANTAR ACCIONES DE MEJORAIMPLANTAR ACCIONES DE MEJORA”. ”.

(Snee, 1993)(Snee, 1993)

Page 8: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

Pensamiento Pensamiento EstadísticoEstadístico

Mundo “real”

Problema

Factor 1 Factor 2 Factor p

Diseño de muestreo

Descripciónde los datos

Tablas y gráficos de frecuencias

Indicadores de centralidad(Moda, Mediana, Media)

Indicadores de dispersión(Recorrido, Varianza, Desv. Típica)

Coeficientes de correlación

InferenciaPruebas de hipótesis

Estimaciones

Page 9: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

La inferencia estadística es el proceso que consiste en inferir una conclusión acerca de alguna medida de población (parámetro), con base a algún estadístico obtenido de una muestra aleatoria, con un cierto nivel de confianza. Las pruebas de hipótesis ayudan a este proceso.

s

x

Población

Muestra

Page 10: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

DEFINICIONES BÁSICASDEFINICIONES BÁSICAS

UNIVERSO:UNIVERSO: Es un conjunto integrado por todos los Es un conjunto integrado por todos los elementos, seres u objetos que contienen las elementos, seres u objetos que contienen las características u observaciones que se requieren características u observaciones que se requieren en una investigación dada.en una investigación dada.

POBLACIÓN:POBLACIÓN: Es el conjunto integrado por todas Es el conjunto integrado por todas las mediciones u observaciones del universo de las mediciones u observaciones del universo de interés en la investigación. Por lo tanto pueden interés en la investigación. Por lo tanto pueden definirse varias poblaciones en un solo universo, definirse varias poblaciones en un solo universo, tantas como características a medir.tantas como características a medir.

MUESTRA:MUESTRA: Es una parte (sub-conjunto) de la Es una parte (sub-conjunto) de la población, obtenida con el propósito de investigar población, obtenida con el propósito de investigar propiedades que posee la población. Es decir, se propiedades que posee la población. Es decir, se pretende que dicho sub-conjunto, represente a la pretende que dicho sub-conjunto, represente a la población a la cual se extrajo.población a la cual se extrajo.

Page 11: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

II.- ESTADÍSTICA INFERENCIAL A) Procedimiento General de la Prueba Estadística de Hipótesis:

Paso 1: Plantear las Hipótesis. Hipótesis Nula (Ho): Negación de lo declarado en la Pueden ser: hipótesis de investigación. A) Paramétricas Hipótesis Alternativa (H 1 ) : Sentencia que se desea B) No-paramétricas probar con el estudio. Paso 2: Establecer el nivel de significación (). : máxima probabilidad de rechazar la Hipótesis Nula siendo verdadera. Su valor está en proporción inversa con la importancia que tiene para el investigador aceptar como cierta una hipótesis que es falsa. Por lo tanto, es una decisión del investigador de acuerdo con el riesgo máximo que acepta correr y, por supuesto, en función de los recursos con los que cuenta. Los posibles escena- rios se muestran a continuación:

Tabla 2: Escenarios de la prueba de hipótesis

Situación actual o "real" en la población Decisión de la prueba Ho cierta Ho falsa No rechazar Ho Decisión correcta (1-) Error tipo II () Rechazar Ho Error tipo I () Decisión correcta (1-) Paso 3: Determinar el tamaño de la muestra (n).

a) Grado de homogeneidad de las variables claves.

Factores que determinan el tamaño de n: b) Nivel de significación (). c) Error máximo admisible (e)

d) Costo o presupuesto

Page 12: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

Paso 4: Establecer la Regla de Decisión (RD). diferente (*) R.D. (modelo): Si E.P. es mayor o (+) que Valor tabla, se Rechaza Ho. menor (#) Donde: E.P. es el valor del Estadístico de la Prueba específica que corresponde. (*) Prueba de dos extremos o dos colas.. (+) Prueba de una cola (superior). (#) Prueba de una cola (inferior). Paso 5: Recopilar los datos. Paso 6: Calcular el Estadístico de la Prueba. Paso 7: Tomar la decisión estadística. Hay o no hay evidencias, con una confianza del (1-)%, a favor de la Hipótesis de Investigación. Usando SPSS, se reduce a: Si sig. < , se rechaza la Ho.

Page 13: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

ANALISIS ESTADÌSTICOANALISIS ESTADÌSTICO

““Ciencia que recoge, ordena y analiza Ciencia que recoge, ordena y analiza los datos de una muestra extraída de los datos de una muestra extraída de una determinada poblacion, para hacer una determinada poblacion, para hacer inferencias de esa poblacion valiéndose inferencias de esa poblacion valiéndose del cálculo de probabilidades” (Amon, del cálculo de probabilidades” (Amon, 1979)1979)

Nos permite:• Tomar decisiones• Solucionar problemas

Page 14: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

PARA QUE SIRVE EL ANÁLISIS ESTADÍSTICOPARA QUE SIRVE EL ANÁLISIS ESTADÍSTICO

CienciasCiencias

FormalesFormales (Matemáticas, Física, Medicina) (Matemáticas, Física, Medicina)

Deducción lógica.Deducción lógica.

EmpíricasEmpíricas (psicología, sociología, Economía,) (psicología, sociología, Economía,)

Generalización inductivaGeneralización inductiva

En las ciencias empíricas el objetivo fundamental es el de encontrar relaciones de tipo general (leyes), capaces de explicar eventos reales cuando se dan las circunstancias apropiadas. (Se descubren y verifican observando el mundo real).

La generalización inductiva, intenta ir desde lo que considera que es verdad para un número reducido de observaciones hasta la afirmación de que eso mismo es verdad para el total de observaciones posibles de la misma clase.

La generalización inductiva. En las ciencias empíricas las fuentes de variación existentes son numerosas y difícil de identificar, medir y controlar, por ello necesita una metodología especial que las valide: “El análisis estadístico”El análisis estadístico”

En situaciones aleatorias en que la misma causa puede producir cualquiera de un conjunto de resultados posibles (Respuesta al tratamiento de un paciente) es necesario recurrir al análisis estadístico para extraer conclusiones fiables. (Reducción de la incertidumbre).

Page 15: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

ANÁLISIS ESTADÍSTICOANÁLISIS ESTADÍSTICO

TIPOS DE VARIABLESTIPOS DE VARIABLES

VARIABLEVARIABLE : Característica que puede tomar diferentes valores dentro de un conjunto de datos.

Propiedad que puede variar y cuya variación es susceptible a medirse u observarse. Sampieri. (2003:143)

EJEMPLOS:EJEMPLOS: Sexo, atractivo físico, la religión, la agresividad verbal, presión arterial, nivel socio económico.

Las variables adquieren valor para la investigación científica cuando llegan a relacionarse con otras (formar parte de una hipótesis o una teoría).

Page 16: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

CLASIFICACIÓN DE LAS VARIABLESCLASIFICACIÓN DE LAS VARIABLES

VARIABLE

CUALITATIVA

ORDINAL

CUANTITATIVA

DISCRETA

CONTINUA

NOMINAL

Page 17: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

CualitativasCualitativasSi sus valores (Si sus valores (modalidadesmodalidades) no se pueden asociar ) no se pueden asociar naturalmente a un número (no se pueden hacer naturalmente a un número (no se pueden hacer operaciones algebraicas con ellos)operaciones algebraicas con ellos)

Nominales:Nominales: Si sus valores no se pueden ordenar Si sus valores no se pueden ordenar Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No)Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No)

Ordinales:Ordinales: Si sus valores se pueden ordenar Si sus valores se pueden ordenar Mejoría a un tratamiento, Grado de satisfacción, Intensidad del Mejoría a un tratamiento, Grado de satisfacción, Intensidad del

dolordolor

Cuantitativas o NuméricasCuantitativas o NuméricasSi sus valores son numéricos (tiene sentido hacer Si sus valores son numéricos (tiene sentido hacer operaciones algebraicas con ellos)operaciones algebraicas con ellos)

Discretas:Discretas: Si toma valores enteros Si toma valores enteros Número de hijos, Número de cigarrillos, Número de hijos, Número de cigarrillos, Num. de “cumpleaños”Num. de “cumpleaños”

Continuas:Continuas: Si entre dos valores, son posibles infinitos valores Si entre dos valores, son posibles infinitos valores intermedios.intermedios.

Altura, Presión intraocular, Dosis de medicamento administrado, Altura, Presión intraocular, Dosis de medicamento administrado,

Tipos de variablesTipos de variables

Page 18: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

NIVEL DE MEDICIÓN NIVEL DE MEDICIÓN

NOMINALNOMINAL

Nombra las observaciones en Nombra las observaciones en categorías mutuamente categorías mutuamente excluyente.excluyente.

Nombres o clasificaciones que Nombres o clasificaciones que se utilizan para datos en se utilizan para datos en categorías distintas y categorías distintas y separadas. separadas.

SexoSexo RazaRaza DiagnósticosDiagnósticos

ORDINALORDINAL

Son las que clasifican las Son las que clasifican las observaciones en categorías observaciones en categorías con un orden significativo. con un orden significativo.

Hay orden y jerarquíaHay orden y jerarquía

Nivel SocioeconómicoNivel Socioeconómico

Bajo, medio y alto.Bajo, medio y alto. ActitudActitud

En desacuerdo, Indeciso, En desacuerdo, Indeciso, De acuerdoDe acuerdo

INTERVALINTERVALOO

Solo toman valores enteros.Solo toman valores enteros.

0 Es Medidas en una escala 0 Es Medidas en una escala numérica en la cual el valor numérica en la cual el valor de cero es arbitrario pero la de cero es arbitrario pero la deferencia entre valores es deferencia entre valores es importante. importante.

arbitrario.arbitrario.

EdadEdadTemperaturaTemperatura

RAZON RAZON

Pueden tomar valores Pueden tomar valores decimales dentro de un decimales dentro de un intervalointervalo

0 Es absoluto0 Es absoluto

PesoPesoDistancias Km., pie Distancias Km., pie

Page 19: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

EL PAPEL DE LOS PAQUETES DE EL PAPEL DE LOS PAQUETES DE COMPUTACIÓN EN ESTADÍSTICACOMPUTACIÓN EN ESTADÍSTICA

SPSS (STATISTICAL PACKAGE FOR THE SOCIAL SCIENCE

10.0 en Español

MINITAD

SAS STATISTIC

EXCEL

Page 20: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

Descriptiva:Descriptiva: Procura definir las cualidades Procura definir las cualidades de un evento.de un evento.

Comparativa:Comparativa: Persigue establecer Persigue establecer similitudes o diferencias la presencia de similitudes o diferencias la presencia de una variable entre dos o mas grupos.una variable entre dos o mas grupos.

Correlacional:Correlacional: Busca encontrar relaciones Busca encontrar relaciones entre variablesentre variables

Explicativa:Explicativa: Establece la naturaleza de la Establece la naturaleza de la relación de causalidad entre una o relación de causalidad entre una o diversas variables independientes con una diversas variables independientes con una o unas variable dependienteo unas variable dependiente

Tipo de InvestigaciónTipo de Investigación

Page 21: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

TIPO DE INVESTIGACIÓN

PALABRAS CLAVES

TIPO DE VARIABLE

ORDINAL Y NOMINAL

INTERVALO Y RAZÓN

DESCRIPTIVA

CLASIFICAR, CATEGORIZAR EQUIPARARIGUALAR, CONTRASTAR

MODADISTRIBUCIONES DE FRECUENCIAGRÁFICOS, HISTOGRAMAS, PASTELES

MEDIA, MEDIANA, VARIANZA. DESVIACIÓN TÍPICACURTOSISASIMETRÍA

COMPARACIÓNCOMPARAR, DIFERENCIAR, EQUIPARAR, IGUALAR, CONTRASTAR

2 G GRUPOS

WILCOSON t de student

> 2 G GRUPOS

KRUSKAL WALLISFRIEDMAN

ANOVAPRUEBA DE MEDIAS(TUKEY, LSD)

RELACIÓNRELACIONAR, ASOCIARVINCULAR(UNIÓN NEXO)

CHI CUADRADO,RANGOS DE SPEARMAN

CORRELACIÓN DE PEARSON

CAUSA - EFECTO

CONSECUENCIACAUSAEFECTOINCIDENCIA

ANÁLISIS MULTIVARIADOCORRELACIONES CANÓNIGASFACTORES COMUNESANÁLISI CLUSTERANÁLISIS DISCRIMINANTES

REGRESIÓN SIMPLEREGRESIÓN MÚLTIPLE

Page 22: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

RELACIÓN ENTRE ESTADÍSTICA E INVESTIGACIÓNPROCESO DE INVESTIGACIÓN

OPERACIONES ESTADÍSTICAS CORRESPONDIENTES

1.- Formulación del PROBLEMA

Determinar si se requerirán o no procedimientos cuantitativos.

2.- Definición de VARIABLES

Definir: Indicadores, función, nivel de medición y escala para cada variable.

3.- Formulación de HIPOTES

Formular: Hipótesis nulas, hipótesis alternativas y nivel de significación.

4.- Elección del DISEÑO decidir si estudiar toda la población o sólo una decidir si estudiar toda la población o sólo una muestra extraída de ella.muestra extraída de ella.

5.- Selección de los INSTRUMENTOS

Determinar para cada instrumento: validez, confiabilidad.

6.- Selección de la MUESTRA

Determinar: el universo, la unidad muestral, el método de muestreo y el tamaño de la muestra.

7.- Selección de la Técnica de ANALISIS

Determinar si la técnica será: univariable, bivariable o multivariable; descriptiva o inferencial; paramétrica o no paramétrica; para una, para dos o para más muestras.

8.- Observación

9.- PROCESAMIENTO de Datos

Realizar las siguientes operaciones: codificación, tabulación, programación, computación e interpretación de los datos.

10.- Elaboración del INFORME

Elaborar tablas y gráficos

Page 23: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA

MEDIDAS DE LOCALIZACIÓN

MEDIDAS DE DISPERSIÓN

MEDIDAS DE FORMA

MEDIDAS DE POSICIÓN

DISTRIBUCIÓN DE FRECUENCIAS

Page 24: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

MEDIDAS DE TENDENCIA CENTRALMEDIDAS DE TENDENCIA CENTRAL Medidas de localizaciónMedidas de localización

Media AritméticaMedia Aritmética Se obtiene sumando todos los valores de una Se obtiene sumando todos los valores de una

población o muestra y dividiendo entre el número de población o muestra y dividiendo entre el número de valores sumados.valores sumados.

Los valores extremos influyen sobre la media, y en Los valores extremos influyen sobre la media, y en algunos casos puede distorsionarla tanto que llega a algunos casos puede distorsionarla tanto que llega a ser indeseable como medida de tendencia central.ser indeseable como medida de tendencia central.

N

x

n

xx

i

i

Page 25: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

Medidas de localizaciónMedidas de localización La ModaLa Moda

La moda de un conjunto de valores es aquel que La moda de un conjunto de valores es aquel que ocurre con mayor frecuenciaocurre con mayor frecuencia

Si todos los valores son diferentes, no hay moda.Si todos los valores son diferentes, no hay moda. Un conjunto de valores puede tener mas de una Un conjunto de valores puede tener mas de una

modamoda

Ejemplo:

¿Cual es la moda en los siguientes datos?

12 14 09 04 12 33 23 17 33 31 12 24 09 18

16 09 25 07 15

Page 26: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

Medidas de localizaciónMedidas de localización La MedianaLa Mediana

La mediana de un conjunto finito de valores es La mediana de un conjunto finito de valores es aquel valor que divide al conjunto de aquel valor que divide al conjunto de números números ordenadosordenados en dos partes iguales. en dos partes iguales.

Ninguna observación extrema en un conjunto de Ninguna observación extrema en un conjunto de datos afecta a la mediana, en consecuencia, datos afecta a la mediana, en consecuencia, siempre que una observación extrema esté siempre que una observación extrema esté presente, es adecuado usar la mediana en lugar presente, es adecuado usar la mediana en lugar de la media para describir un conjunto de datos.de la media para describir un conjunto de datos.

50%50% n + 1

2=

(Par)Me

Page 27: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

Tendencia centralTendencia centralson medidas que buscan posiciones (valores) con respecto a los son medidas que buscan posiciones (valores) con respecto a los

cuales los datos muestran tendencia a agruparse.cuales los datos muestran tendencia a agruparse.

Media:Media: Es la media aritmética (promedio) de los valores de una Es la media aritmética (promedio) de los valores de una variable. Suma de los valores dividido por el tamaño muestral.variable. Suma de los valores dividido por el tamaño muestral. Media de 2,2,3,7 es (2+2+3+7)/4=3,5Media de 2,2,3,7 es (2+2+3+7)/4=3,5 Conveniente cuando los datos se concentran Conveniente cuando los datos se concentran

simétricamente con respecto a ese valor. Muy sensible a simétricamente con respecto a ese valor. Muy sensible a valores extremos.valores extremos.

Centro de gravedad de los datosCentro de gravedad de los datos

Mediana: Mediana: Es un valor que divide a las observaciones en dos Es un valor que divide a las observaciones en dos grupos con el mismo número de individuos. Si el número de grupos con el mismo número de individuos. Si el número de datos es par, se elige la media de los dos datos centrales.datos es par, se elige la media de los dos datos centrales. Mediana de Mediana de 1,2,41,2,4,,55,,6,6,86,6,8 es 5 es 5 Mediana de Mediana de 1,2,41,2,4,,55,,66,6,8,9 ,6,8,9 es (5+6)/2=5,5es (5+6)/2=5,5 Es conveniente cuando los datos son asimétricos. No es Es conveniente cuando los datos son asimétricos. No es

sensible a valores extremos.sensible a valores extremos. Mediana de Mediana de 1,2,41,2,4,,55,,6,6,800 6,6,800 es 5. ¡La media es 117,7!es 5. ¡La media es 117,7!

Moda: Moda: Es el/los valor/es donde la distribución de frecuencia Es el/los valor/es donde la distribución de frecuencia alcanza un máximo.alcanza un máximo.

Page 28: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

Un objeto pequeño se pesó con un mismo instrumento, Un objeto pequeño se pesó con un mismo instrumento, separadamente por nueve estudiantes en una clase de separadamente por nueve estudiantes en una clase de ciencias. Los pesos obtenidos por cada estudiante (en ciencias. Los pesos obtenidos por cada estudiante (en gramos) se muestran a continuación:gramos) se muestran a continuación:

6.2 6.0 6.0 15.3 6.1 6.3 6.2 6.15 6.26.2 6.0 6.0 15.3 6.1 6.3 6.2 6.15 6.2

Los estudiantes quieren determinar con la mayor precisión Los estudiantes quieren determinar con la mayor precisión posible el peso real del objeto. ¿Cuál de los siguientes posible el peso real del objeto. ¿Cuál de los siguientes métodos les recomendarías usar?métodos les recomendarías usar?

___ a) Usar el número más común, que es 6.2 ___ a) Usar el número más común, que es 6.2

___ b) Usar 6.15, puesto que es el peso más preciso___ b) Usar 6.15, puesto que es el peso más preciso

___ c) Sumar los 9 números y dividir la suma por 9___ c) Sumar los 9 números y dividir la suma por 9

___ d) Desechar el valor 15.3; sumar los otros 8 números y ___ d) Desechar el valor 15.3; sumar los otros 8 números y dividir por 8.dividir por 8.

Page 29: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

Una profesora quiere cambiar la disposición de los asientos en su clase, con la Una profesora quiere cambiar la disposición de los asientos en su clase, con la esperanza de que ello incremente el número de preguntas que hacen sus esperanza de que ello incremente el número de preguntas que hacen sus alumnos. Primero, decide ver cuántas preguntas hicieron los estudiantes con la alumnos. Primero, decide ver cuántas preguntas hicieron los estudiantes con la colocación actual de los asientos. Un registro del número de preguntas hechas colocación actual de los asientos. Un registro del número de preguntas hechas por sus 8 estudiantes durante una clase se muestra a continuación:por sus 8 estudiantes durante una clase se muestra a continuación:

La profesora quiere resumir estos datos, calculando el número típico de La profesora quiere resumir estos datos, calculando el número típico de preguntas hechas ese día.preguntas hechas ese día.

¿Cuál de los siguientes métodos le recomendarías que usara?¿Cuál de los siguientes métodos le recomendarías que usara?___ a) Usar el número más común, que es el 2.___ a) Usar el número más común, que es el 2.___ b) Sumar los 8 números y dividir por 8.___ b) Sumar los 8 números y dividir por 8.___ c) Descartar el 22, sumar los otros 7 números y dividir por 7.___ c) Descartar el 22, sumar los otros 7 números y dividir por 7.___ d) Descartar el 0, sumar los otros 7 números y dividir por 7.___ d) Descartar el 0, sumar los otros 7 números y dividir por 7.

Page 30: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

Cuarenta estudiantes universitarios participaron en un estudio sobre el efecto del sueño sobre las puntuaciones en los exámenes. Veinte

estudiantes estuvieron voluntariamente despiertos toda la noche anterior al examen (grupo que no durmió), los otros 20 estudiantes (grupo de

control) se acostaron a las 11 de la noche anterior al examen. Las puntuaciones del examen se muestran en los gráficos siguientes. Cada

punto representa la puntuación de un estudiante particular.

Page 31: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

Examina los dos gráficos con cuidado. Luego escoge entre las 6 posibles conclusiones Examina los dos gráficos con cuidado. Luego escoge entre las 6 posibles conclusiones que se listan a continuación aquella con la que estés más de acuerdo.que se listan a continuación aquella con la que estés más de acuerdo.

___ a) El grupo que no durmió lo hizo mejor porque ninguno de estos ___ a) El grupo que no durmió lo hizo mejor porque ninguno de estos estudiantes puntuó por debajo de 40 y la máxima puntuación fue obtenida por estudiantes puntuó por debajo de 40 y la máxima puntuación fue obtenida por un estudiante de ese grupoun estudiante de ese grupo

___ b) El grupo que no durmió lo hizo mejor porque su promedio parece ser un ___ b) El grupo que no durmió lo hizo mejor porque su promedio parece ser un poco más alto que el promedio del grupo que durmió.poco más alto que el promedio del grupo que durmió.

___ c) No hay diferencia entre los dos grupos, porque hay un solapamiento ___ c) No hay diferencia entre los dos grupos, porque hay un solapamiento considerable en las puntuaciones de los dos grupos.considerable en las puntuaciones de los dos grupos.

___ d) No hay diferencia entre los dos grupos, porque la diferencia entre sus ___ d) No hay diferencia entre los dos grupos, porque la diferencia entre sus promedios es pequeña, comparada con la variación de sus puntuaciones.promedios es pequeña, comparada con la variación de sus puntuaciones.

___ e) El grupo que no durmió lo hizo mejor porque hubo en ese grupo más ___ e) El grupo que no durmió lo hizo mejor porque hubo en ese grupo más estudiantes que puntuaron 80 o por encima.estudiantes que puntuaron 80 o por encima.

___ f) El grupo de control lo hizo mejor, porque su promedio parece ser un poco ___ f) El grupo de control lo hizo mejor, porque su promedio parece ser un poco mayor que el promedio del grupo no durmió.mayor que el promedio del grupo no durmió.

Page 32: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

15 20 20 19 18 17 11 16 10 1515 20 20 19 18 17 11 16 10 15 12 14 13 15 14 16 14 19 13 1712 14 13 15 14 16 14 19 13 17 16 13 16 12 13 14 12 18 17 1516 13 16 12 13 14 12 18 17 15 10 16 11 16 12 17 19 15 13 1410 16 11 16 12 17 19 15 13 14

Calificaciones de 40 estudiantes Calificaciones de 40 estudiantes en la unidad curricular estadística en la unidad curricular estadística

II

Page 33: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

Medidas de DispersiónMedidas de Dispersión

La dispersión de un conjunto de La dispersión de un conjunto de observaciones se refiere a la variabilidad observaciones se refiere a la variabilidad que presentan estas.que presentan estas.

Una medida de dispersión conlleva Una medida de dispersión conlleva información respecto a la cantidad total información respecto a la cantidad total de variabilidad presente en el conjunto de variabilidad presente en el conjunto de datosde datos

Page 34: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

MEDIDAS DE DISPERSIÓN MEDIDAS DE DISPERSIÓN VarianzaVarianza

La varianza es una medida de la dispersión que emplea La varianza es una medida de la dispersión que emplea todos los valores de los datos. Se basa en la diferencia todos los valores de los datos. Se basa en la diferencia entre cada valor y la media.entre cada valor y la media.

La diferencia entre cada valor del dato XLa diferencia entre cada valor del dato Xii y el promedio ( x y el promedio ( x para una muestra y µ para una población) se llama para una muestra y µ para una población) se llama desviación respecto al promedio.desviación respecto al promedio.

Para una muestra la desviación se expresa como:Para una muestra la desviación se expresa como: (Xi – x);(Xi – x); parapara una población:una población: ( (Xi - Xi - µ)µ)

Para calcular la varianza, las desviaciones respecto al Para calcular la varianza, las desviaciones respecto al promedio se elevan al cuadrado. Podemos decir que: la promedio se elevan al cuadrado. Podemos decir que: la desviación estándar y la varianza evalúan la manera en desviación estándar y la varianza evalúan la manera en que fluctúan los valores respecto a la mediaque fluctúan los valores respecto a la media

Page 35: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

MEDIDAS DE DISPERSIÓN MEDIDAS DE DISPERSIÓN VarianzaVarianza

Para una muestra que contiene n observaciones X1, X2, Para una muestra que contiene n observaciones X1, X2, X3…….Xn la varianza de la muestra (representada por X3…….Xn la varianza de la muestra (representada por SS22) puede escribirse:) puede escribirse:

( X( X1 1 – X )– X )2 2 + ( X + ( X2 2 – X )– X )2 2 + ….........…. ( X + ….........…. ( Xii – – X )X )22

n - 1

S2 =

∑ ( Xi – X )2

S2 =

n - 1

La varianza de la muestra, es la suma de los cuadrados de las diferencias con relación a la media aritmética divida entre el tamaño de la muestra menos 1

∑ ( Xi – )2Nσ 2=

VARIANZA MUESTRAL

VARIANZA POBLACIONAL

Unidades de la varianza son al Unidades de la varianza son al cuadrado.cuadrado.

Page 36: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

MEDIDAS DE DISPERSIÓN MEDIDAS DE DISPERSIÓN Desviación estándarDesviación estándar

Indica como se agrupa o distribuye un conjunto de Indica como se agrupa o distribuye un conjunto de datos alrededor de la media.datos alrededor de la media.

La desviación estándar también se define como la raíz La desviación estándar también se define como la raíz cuadrada positiva de la varianza. cuadrada positiva de la varianza.

σ =

σ 2

s2s =

Desviación estándar poblaciónDesviación estándar población

Desviación estándar muestraDesviación estándar muestra

Page 37: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

Dispersión en distribuciones ‘normales’Dispersión en distribuciones ‘normales’

Centrado en la media y a una desv. típica de Centrado en la media y a una desv. típica de distancia hay aproximadamente el 68% de las distancia hay aproximadamente el 68% de las observaciones.observaciones.

A dos desviaciones típicas tenemos el 95% (aprox.)A dos desviaciones típicas tenemos el 95% (aprox.)

150 160 170 180 190

0.00

0.01

0.02

0.03

0.04

0.05

xs

68.5 %

150 160 170 180 190

0.00

0.01

0.02

0.03

0.04

0.05

x2s

95 %

Page 38: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

MEDIDAS DE DISPERSIÓN MEDIDAS DE DISPERSIÓN Coeficiente de variaciónCoeficiente de variación

El CV es una medida relativa de la variación. Siempre se El CV es una medida relativa de la variación. Siempre se expresa como porcentaje, no en términos de las unidades de expresa como porcentaje, no en términos de las unidades de los datos específicos.los datos específicos.

El CV mide la dispersión en los datos con relación a la mediaEl CV mide la dispersión en los datos con relación a la media

CV =S

X100 %( )

S = Desviación estándar de un conjunto de datos numéricos

X = Media aritmética

Si la media es 80 y la desviación típica 20 entonces CV = Si la media es 80 y la desviación típica 20 entonces CV = 20/80=0,25 = 25%20/80=0,25 = 25%

Es una cantidad Es una cantidad adimensionaladimensional.. Interesante para comparar la Interesante para comparar la variabilidad de variabilidad de diferentes variables.diferentes variables.

o Si el peso tiene CV =30% y la altura tiene CV =10%, los individuos Si el peso tiene CV =30% y la altura tiene CV =10%, los individuos o presentan más dispersión en peso que en altura.presentan más dispersión en peso que en altura.o No debe usarse cuando la variable presenta valores negativos o No debe usarse cuando la variable presenta valores negativos o donde el valor donde el valor o 0 sea una cantidad fijada arbitrariamente0 sea una cantidad fijada arbitrariamente Por ejemplo 0ºC ≠ 0ºFPor ejemplo 0ºC ≠ 0ºF

Page 39: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

MEDIDAS DE DISPERSIÓNMEDIDAS DE DISPERSIÓNLocalización Relativa Localización Relativa

valor Zvalor Z

Valor Z: Medida del número de desviaciones estándar que un Valor Z: Medida del número de desviaciones estándar que un valor se aleja de la mediavalor se aleja de la media

Zi =

Xi - X

S

Zi = valor z del elemento

X = media de la muestra

S = Desviación estándar de la muestra

Page 40: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

MEDIDAS DE FORMAMEDIDAS DE FORMA

Se refiere a la manera como se distribuyen los datos. La Se refiere a la manera como se distribuyen los datos. La distribución de los datos es distribución de los datos es simétricasimétrica o no lo es. o no lo es. Si no es Si no es simétrica recibe el nombre de distribución asimétrica o sesgada.simétrica recibe el nombre de distribución asimétrica o sesgada.

media > mediana: Sesgo positivo o a la derechamedia > mediana: Sesgo positivo o a la derecha

media = mediana: simetría o sesgo ceromedia = mediana: simetría o sesgo cero

media < medina: sesgo negativo o a la izquierdamedia < medina: sesgo negativo o a la izquierda

Para describir la forma, solamente se deben comparar Para describir la forma, solamente se deben comparar la media y la mediana. la media y la mediana.

Sesgo (+) Sesgo (-)

Page 41: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

15 20 20 19 18 17 11 16 10 1515 20 20 19 18 17 11 16 10 15 12 14 13 15 14 16 14 19 13 1712 14 13 15 14 16 14 19 13 17 16 13 16 12 13 14 12 18 17 1516 13 16 12 13 14 12 18 17 15 10 16 11 16 12 17 19 15 13 1410 16 11 16 12 17 19 15 13 14

Calificaciones de 40 estudiantes Calificaciones de 40 estudiantes en la unidad curricular Estadística en la unidad curricular Estadística

II

Page 42: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

MEDIDAS DE POSICIÓNMEDIDAS DE POSICIÓNNO CENTRALESNO CENTRALES

INFORMAN ACERCA DE LA POSICIÓN QUE OCUPA UN INFORMAN ACERCA DE LA POSICIÓN QUE OCUPA UN DATO DENTRO DE UNA DATO DENTRO DE UNA SERIE ORDENADASERIE ORDENADA EN FORMA EN FORMA CRECIENTE.CRECIENTE.

DECILESDECILES

Dividen el conjunto de datos en diez partes iguales. Dividen el conjunto de datos en diez partes iguales. Nueve deciles dividen las observaciones en diez partes Nueve deciles dividen las observaciones en diez partes iguales.iguales.

PERCENTILESPERCENTILES

Dividen el conjunto de datos en 100 partes iguales. El Dividen el conjunto de datos en 100 partes iguales. El percentil 90 es un valor tal que el 90% de todos los percentil 90 es un valor tal que el 90% de todos los valores son menores y el 10 son mayores que el.valores son menores y el 10 son mayores que el.

CUARTILESCUARTILES

Dividen el conjunto de datos en cuatro partes iguales. Se Dividen el conjunto de datos en cuatro partes iguales. Se necesitan solamente tres cuartiles para dividir los datos necesitan solamente tres cuartiles para dividir los datos en cuatro partes en cuatro partes

Page 43: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

Resumen sobre estadísticosResumen sobre estadísticos PosiciónPosición

Dividen un conjunto ordenado de datos en grupos con la Dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos entre ellos.misma cantidad de individuos entre ellos.

Cuantiles, percentiles, deciles,...Cuantiles, percentiles, deciles,...

Tendencia centralTendencia central Indican valores con respecto a los que los datos parecen Indican valores con respecto a los que los datos parecen

agruparse.agruparse. Media, mediana y modaMedia, mediana y moda

DispersiónDispersión Indican la mayor o menor concentración de los datos con Indican la mayor o menor concentración de los datos con

respecto a las medidas de centralización.respecto a las medidas de centralización. Desviación típica, coeficiente de variación, rango, varianzaDesviación típica, coeficiente de variación, rango, varianza

FormaForma AsimetríaAsimetría Apuntamiento o curtosisApuntamiento o curtosis

Page 44: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

DISTRIBUCIÓN DE FRECUENCIASDISTRIBUCIÓN DE FRECUENCIAStablas y gráficos para datos numéricostablas y gráficos para datos numéricos

Es una tabla de resumen en la cual los datos se colocan en Es una tabla de resumen en la cual los datos se colocan en agrupamiento o categorías establecidas en forma conveniente de agrupamiento o categorías establecidas en forma conveniente de clasesclases ordenadas numéricamente ordenadas numéricamente

Exponen la información recogida en la muestra, de forma que no se pierda Exponen la información recogida en la muestra, de forma que no se pierda nada de información (o poca).nada de información (o poca).

Frecuencias absolutas:Frecuencias absolutas: Contabilizan el número de individuos de cada Contabilizan el número de individuos de cada modalidadmodalidad

Frecuencias relativas (porcentajes):Frecuencias relativas (porcentajes): Idem, pero dividido por el total Idem, pero dividido por el total

Frecuencias acumuladas:Frecuencias acumuladas: Sólo tienen sentido para variables ordinales y Sólo tienen sentido para variables ordinales y numéricasnuméricas

Page 45: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

DISTRIBUCIÓN DE FRECUENCIASDISTRIBUCIÓN DE FRECUENCIAStablas y gráficos para datos numéricostablas y gráficos para datos numéricos

Obtención de intervalos de claseObtención de intervalos de clase Es conveniente que cada intervalo tenga la misma Es conveniente que cada intervalo tenga la misma

medida (o anchura). medida (o anchura).

ancho de Clase ancho de Clase = =

RANGO = RANGO = valor máximo de los datos – valor mínimo valor máximo de los datos – valor mínimo de los datosde los datos

Rango

número de clases deseado

Selección del número de clasesSelección del número de clases

una gran cantidad de observaciones requiere un una gran cantidad de observaciones requiere un mayor número de clases. Sin embargo una distribución mayor número de clases. Sin embargo una distribución de frecuencias debe tener como mínimo 5 clases, pero de frecuencias debe tener como mínimo 5 clases, pero no mas de 15 no mas de 15

Page 46: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

DISTRIBUCIÓN DE FRECUENCIAS RELATIVAS Y DISTRIBUCIÓN DE FRECUENCIAS RELATIVAS Y FRECUENCIAS PORCENTUALESFRECUENCIAS PORCENTUALES

FRECUENCIA RELATIVAFRECUENCIA RELATIVA

Se obtiene de dividir las frecuencias de cada clase entre el número Se obtiene de dividir las frecuencias de cada clase entre el número total de observaciones.total de observaciones.

Frecuencia de clase

n

Frecuencia relativa de clase

=

La distribución de frecuencias porcentuales, se obtiene La distribución de frecuencias porcentuales, se obtiene al multiplicar cada frecuencia relativa por 100al multiplicar cada frecuencia relativa por 100

Page 47: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

EJERCICIOEJERCICIOConvertir las notas de los estudiantes en datos agrupados.Convertir las notas de los estudiantes en datos agrupados.

1.- Determinar el Ancho de clase1.- Determinar el Ancho de clase

2. 2. Transformar - Recodificar - En variables diferentesTransformar - Recodificar - En variables diferentes

3. Pasar la variable al cuadro: 3. Pasar la variable al cuadro: Var. Numérica Var. De resultado:Var. Numérica Var. De resultado:

4. Asignarle nuevo nombre a la variable, con su correspondiente 4. Asignarle nuevo nombre a la variable, con su correspondiente

etiqueta y pulsar: etiqueta y pulsar: Cambiar: Cambiar:

5. 5. Valores antiguos y nuevosValores antiguos y nuevos

6. Colocar los anchos 6. Colocar los anchos de clase:de clase:

RangoRango

hastahasta

RangeRangethroughthrough

6. Colocar los anchos 6. Colocar los anchos de clase:de clase:

RangoRango

Del menor hastaDel menor hasta

RangeRangeLowest throughLowest through

6. Colocar los anchos de 6. Colocar los anchos de clase:clase:

RangoRango

-------- hasta el mayor-------- hasta el mayor

RangeRange---------- highest through---------- highest through

Page 48: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

7. Una vez colocado el ancho de clase, en 7. Una vez colocado el ancho de clase, en valor nuevovalor nuevo asignarle en asignarle en el cuadro de diálogo:el cuadro de diálogo:

del menor hasta, del menor hasta, el número 1. el número 1.

hastahasta el valor 2el valor 2

hasta el mayorhasta el mayor el número 3el número 3

88. Continuar - Aceptar . Continuar - Aceptar - Observar la nueva variable creada en la “vista de - Observar la nueva variable creada en la “vista de

variable” y en la “vista de datos”variable” y en la “vista de datos”

9. Vista de variables - 9. Vista de variables - ValoresValores - colocar los valores del ancho de clase y - colocar los valores del ancho de clase y

asignarle los valores 1, 2, 3.asignarle los valores 1, 2, 3.

10. 10. Analizar - Est. Descrip. – frecuencias - gráficos - Histogramas – con curva Analizar - Est. Descrip. – frecuencias - gráficos - Histogramas – con curva normal – continuar – aceptar.normal – continuar – aceptar.

11. Interprete los resultados11. Interprete los resultados

Page 49: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

DISTRIBUCIÓN DE FRECUENCIASDISTRIBUCIÓN DE FRECUENCIAStablas y gráficos para datos numéricostablas y gráficos para datos numéricos

DIAGRAMA DE BARRASvariables cuantitativas discretas y variables cualitativas.

Se construye en un plano cartesiano, colocando en el eje de las ordenadas (y), las frecuencias ordinarias absolutas (n), y situando en el eje de las abscisas (X) los valores que toma la variable. Cuando la variable es continua, lo recomendable no es un gráfico de barras sino un histograma.

0

10

20

30

40

50

60

70

80

90

100

20 40 60 80

Valores de la variable o Puntos medios

Fre

cu

en

cia

s a

bsolu

tas

Page 50: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

DISTRIBUCIÓN DE FRECUENCIASDISTRIBUCIÓN DE FRECUENCIAStablas y gráficos para datos numéricostablas y gráficos para datos numéricos

HISTOGRAMASHISTOGRAMAS (variables continuas)(variables continuas) Se utiliza para describir datos numéricos que están agrupados en Se utiliza para describir datos numéricos que están agrupados en

distribuciones de frecuencia, de frecuencia relativa o de porcentaje. distribuciones de frecuencia, de frecuencia relativa o de porcentaje.

Un histograma esUn histograma es una gráfica de barras verticales que se una gráfica de barras verticales que se construye en los límites de cada claseconstruye en los límites de cada clase

EDAD

90,080,070,060,050,040,030,020,0

GRÁFICO 1

DISTRIBUCIÓN SEGÚN LA EDAD10

8

6

4

2

0

Desv. típ. = 16,54

Media = 42,0

N = 20,00

En el eje horizontal aparecen los puntos

medios de cada intervalo de clase (marcas de clase)

Page 51: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

DISTRIBUCIÓN DE FRECUENCIASDISTRIBUCIÓN DE FRECUENCIAStablas y gráficos para datos numéricostablas y gráficos para datos numéricos

POLÍGONOS DE POLÍGONOS DE FRECUENCIA FRECUENCIA

(v. continuas)(v. continuas)

Se construye uniendo Se construye uniendo con segmentos de con segmentos de recta, los puntos recta, los puntos medios (marcas de medios (marcas de clase) – parte superior clase) – parte superior de cada intervalo de de cada intervalo de clase. Al unir las marcas clase. Al unir las marcas mediante líneas rectas mediante líneas rectas se obtiene el polígono se obtiene el polígono de frecuencia.de frecuencia.

Cuando se comparan dos o mas conjuntos de datos, resulta Cuando se comparan dos o mas conjuntos de datos, resulta imposible la construcción de histogramas en la misma gráfica. imposible la construcción de histogramas en la misma gráfica.

0102030405060708090

100

20 40 60 80

Puntos mediosFre

cu

en

cia

s a

bsolu

tas

Page 52: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

ANÁLISIS DESCRIPTIVOANÁLISIS DESCRIPTIVOSPSSSPSS

PROCEDIMIENTO: PROCEDIMIENTO: Frecuencias y DescriptivosFrecuencias y Descriptivos Si la variable que se desea describir es:Si la variable que se desea describir es:

Distribución de frecuenciasDistribución de frecuencias

CATEGÓRICA Diagrama de BarrasCATEGÓRICA Diagrama de Barras

Diagrama de sectoresDiagrama de sectores

Medidas de tendencia centralMedidas de tendencia central

CUANTITATIVA Medidas de dispersiónCUANTITATIVA Medidas de dispersión

Forma de la distribuciónForma de la distribución

Page 53: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

FRECUENCIAFRECUENCIAInforma sobre valores concreto que adopta una variable y Informa sobre valores concreto que adopta una variable y sobre el número (y porcentaje) de veces que se repite cada sobre el número (y porcentaje) de veces que se repite cada uno de esos valores.uno de esos valores.

Ejemplo:Ejemplo: Abrir archivo “datos de empleados” del spssAbrir archivo “datos de empleados” del spss

> >> >

Seleccionar variable catlab (Categoría Laboral)Seleccionar variable catlab (Categoría Laboral)

Analizar Estadísticos Descriptivos Frecuencia

Aceptar

Page 54: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

FRECUENCIAFRECUENCIACUANDO UTILIZAR CADA ESTADÍSTICOCUANDO UTILIZAR CADA ESTADÍSTICO

PERCENTILES *PERCENTILES * Al menos con variables ordinales. Carece Al menos con variables ordinales. Carece

de sentido con variables nominales de sentido con variables nominales

MEDIDAS DE TENDENCIA * Variables cuantitativas (intervalo o razón)MEDIDAS DE TENDENCIA * Variables cuantitativas (intervalo o razón)

CENTRAL * Puede calcularse con datos ordinales. La CENTRAL * Puede calcularse con datos ordinales. La

Mediana es un estadístico típicamente Mediana es un estadístico típicamente

ordinal.ordinal.

DISPERSIÓN * Variable cuantitativa (intervalo o razón)DISPERSIÓN * Variable cuantitativa (intervalo o razón)

* Puede calcularse con datos ordinales* Puede calcularse con datos ordinales

RANGO * Todo tipo de variables. Excepto RANGO * Todo tipo de variables. Excepto

nominalesnominales

ASIMETRÍA CURTOSIS * Variables cuantitativas. ASIMETRÍA CURTOSIS * Variables cuantitativas.

Page 55: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

FRECUENCIAFRECUENCIA GRAFICOSGRAFICOS

Analizar Estadísticos Descriptivos Frecuencia

Seleccionar variable Salario ( Salario actual)Seleccionar variable Salario ( Salario actual)

Gráficos

> >

HistogramaCon curva normal>

Page 56: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

DESCRIPTIVOSDESCRIPTIVOS

A Diferencia de lo que ocurre con el procedimiento A Diferencia de lo que ocurre con el procedimiento “frecuencias”, quecontiene opciones para describir tanto “frecuencias”, quecontiene opciones para describir tanto variables categóricas como variables cuantitativas continuas, variables categóricas como variables cuantitativas continuas, el procedimiento descriptivo está diseñado únicamente para el procedimiento descriptivo está diseñado únicamente para variable cuantitativas continuas.variable cuantitativas continuas.

Analizar Estadísticos Descriptivos Descriptivos

Seleccionar variable Seleccionar variable SaliniSalini ( Salario inicial); ( Salario inicial); SalarioSalario (salario actual); (salario actual); tiempemptiempemp (meses desde el contrato) (meses desde el contrato)

marcar las opciones de media, todas las dispersión marcar las opciones de media, todas las dispersión y todas las de distribución (forma)y todas las de distribución (forma)

>>

Opciones >

Page 57: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

ANÁLISIS DE VARIABLES CATEGÓRICASANÁLISIS DE VARIABLES CATEGÓRICASProcedimiento: Tablas de contingenciaProcedimiento: Tablas de contingencia

El sexo, raza, la clase social, el lugar de procedencia, la categoría El sexo, raza, la clase social, el lugar de procedencia, la categoría laboral, padecer o no de una enfermedad son algunos ejemplos de laboral, padecer o no de una enfermedad son algunos ejemplos de este tipo de variables. Son variables sobre las que únicamente es este tipo de variables. Son variables sobre las que únicamente es posible obtener una medida de tipo nominal (u ordinal con pocos posible obtener una medida de tipo nominal (u ordinal con pocos valores). SPSS permite estudiar este tipo de variables y detectar valores). SPSS permite estudiar este tipo de variables y detectar posibles pautas de asociación de asociación entre ellas.posibles pautas de asociación de asociación entre ellas.

El El Son tablas de doble entrada, en la que cada una presenta un criterio de clasificación (una variable categórica)

Analizar Tablas de contingenciaEstad. Descrip.> >

Page 58: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

EJEMPLOEJEMPLOAbra el archivo de datos “datos de empleados”Abra el archivo de datos “datos de empleados”

Analizar - Est. Desc. - Tablas de contingencia - Fila:Analizar - Est. Desc. - Tablas de contingencia - Fila: sexo; sexo; Columna:Columna: Categoría Laboral - Marcar la opción: Categoría Laboral - Marcar la opción: Mostrar los gráficos Mostrar los gráficos de barras agrupadasde barras agrupadas

Tabla de contingencia Sexo * Categoría laboral

Recuento

157 27 74 258

206 10 216

363 27 84 474

Hombre

Mujer

Sexo

Total

Administrativo Seguridad Directivo

Categoría laboral

Total

Sexo

MujerHombre

Re

cue

nto

300

200

100

0

Categoría laboral

Administrativo

Seguridad

Directivo

Page 59: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

EstadísticosEstadísticos

Chi-cuadradoChi-cuadrado Establece la relación existente entre dos Establece la relación existente entre dos variables categóricas.variables categóricas.

Permite contrastar la hipótesis de que las dos variables Permite contrastar la hipótesis de que las dos variables categóricas son independientes.categóricas son independientes.

HH00:: Las variables son independientesLas variables son independientes

HH11: Las variables son dependientes: Las variables son dependientes

EJEMPLO.EJEMPLO.

Abra el archivo de datos “datos de empleados”Abra el archivo de datos “datos de empleados”

Analizar - Est. Desc. - Tablas de contingencia - Fila: sexo; Columna: Analizar - Est. Desc. - Tablas de contingencia - Fila: sexo; Columna: Categoría laboral - Estadísticos - Chi-Cuadrado Categoría laboral - Estadísticos - Chi-Cuadrado

Pruebas de chi-cuadrado

79,277a 2 ,000

95,463 2 ,000

474

Chi-cuadrado de Pearson

Razón de verosimilitud

N de casos válidos

Valor glSig. asintótica

(bilateral)

0 casillas (,0%) tienen una frecuencia esperada inferior a 5.La frecuencia mínima esperada es 12,30.

a.

El valor Chi-Cuadrado toma un valor de 79,277 y tiene asociada un nivel de significación asociado de 0,000 por lo que se rechaza la H0 de independencia

Page 60: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

Correlación entre variables ordinalesCorrelación entre variables ordinales::SpearmanSpearman

El coeficiente de correlación de spearman es también una El coeficiente de correlación de spearman es también una medida de asociación lineal pero para variables ordinales: medida de asociación lineal pero para variables ordinales:

Se rechaza la hipótesis de independencia cuando el nivel Se rechaza la hipótesis de independencia cuando el nivel crítico sea menor que el nivel de significación establecido y crítico sea menor que el nivel de significación establecido y se concluirá que existe relación lineal significativa se concluirá que existe relación lineal significativa

Analizar>correlaciones>bivariadas>spearmanAnalizar>correlaciones>bivariadas>spearman

Correlaciones

1,000 ,826** -,063

, ,000 ,168

474 474 474

,826** 1,000 ,105*

,000 , ,023

474 474 474

-,063 ,105* 1,000

,168 ,023 ,

474 474 474

Coeficiente decorrelación

Sig. (bilateral)

N

Coeficiente decorrelación

Sig. (bilateral)

N

Coeficiente decorrelación

Sig. (bilateral)

N

Salario inicial

Salario actual

Meses desde el contrato

Rho de SpearmanSalario inicial Salario actual

Meses desdeel contrato

La correlación es significativa al nivel 0,01 (bilateral).**.

La correlación es significativa al nivel 0,05 (bilateral).*.

Page 61: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

Coeficiente de correlación entre variables Coeficiente de correlación entre variables

cuantitativas: Pearsoncuantitativas: Pearson Este coeficiente toma valores entre -1 y 1 un valor de 1 Este coeficiente toma valores entre -1 y 1 un valor de 1

indica relación lineal perfecta positiva un valor de -1 indica indica relación lineal perfecta positiva un valor de -1 indica relación lineal perfecta negativa. No implica causalidad.relación lineal perfecta negativa. No implica causalidad.

Se rechaza la hipótesis de independencia cuando el nivel Se rechaza la hipótesis de independencia cuando el nivel crítico sea menor que el nivel de significación establecido y crítico sea menor que el nivel de significación establecido y se concluirá que existe relación lineal significativa se concluirá que existe relación lineal significativa

Analizar>correlaciones>bivariadas>pearsonAnalizar>correlaciones>bivariadas>pearson

Correlaciones

1,000 ,880** -,020

, ,000 ,668

474 474 474

,880** 1,000 ,084

,000 , ,067

474 474 474

-,020 ,084 1,000

,668 ,067 ,

474 474 474

Correlación de Pearson

Sig. (bilateral)

N

Correlación de Pearson

Sig. (bilateral)

N

Correlación de Pearson

Sig. (bilateral)

N

Salario inicial

Salario actual

Meses desde el contrato

Salario inicial Salario actualMeses desde

el contrato

La correlación es significativa al nivel 0,01 (bilateral).**.

Page 62: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

Análisis de variables de respuestas Análisis de variables de respuestas múltiples: (procedimientos)múltiples: (procedimientos)

La expresión respuesta múltiple se utiliza para identificar La expresión respuesta múltiple se utiliza para identificar variables en las que los sujetos pueden dar más de una variables en las que los sujetos pueden dar más de una respuesta, es decir, variables en las que un mismo sujeto respuesta, es decir, variables en las que un mismo sujeto puede tener distintos valores.puede tener distintos valores.

Al intentar codificar VRM surge un problema: el SPSS solo Al intentar codificar VRM surge un problema: el SPSS solo permite utilizar variables con un solo código para cada permite utilizar variables con un solo código para cada caso:caso:

Se puede usar dos estrategias diferentes: Se puede usar dos estrategias diferentes:

a) Crear tantas variables dicotómicas como alternativa de a) Crear tantas variables dicotómicas como alternativa de respuestas tiene la pregunta (dicotomías múltiples) respuestas tiene la pregunta (dicotomías múltiples)

b) Crear tantas variables categóricas como respuestas b) Crear tantas variables categóricas como respuestas distintas hayan dado los sujetos. distintas hayan dado los sujetos.

Page 63: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

a) a) Crear tantas variables dicotómicas como Crear tantas variables dicotómicas como alternativa de respuestas tiene la pregunta alternativa de respuestas tiene la pregunta

(dicotomías múltiples) (dicotomías múltiples)

Ejemplo: Ejemplo:

Señale cual de los siguientes transportes ha Señale cual de los siguientes transportes ha usado durante el último mes.usado durante el último mes.

a) Autobúsa) Autobús

b) Metrob) Metro

c) Trenc) Tren

d) Taxid) Taxi

Page 64: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

datos correspondiente a una muestra de 20 encuestados

Id genero autobus metro tren taxi resp1 resp2 resp3

1 1 1 0 1 0 1 3 0

2 1 1 1 0 0 1 2 0

3 1 1 1 1 0 1 2 3

4 1 1 0 1 0 1 3 0

5 1 0 1 1 0 2 3 0

6 1 0 0 0 1 4 0 0

7 1 1 0 1 0 1 3 0

8 1 0 1 1 0 2 3 0

9 1 0 1 0 1 2 4 0

10 1 1 1 1 0 1 2 3

11 2 1 1 0 0 1 2 0

12 2 0 1 1 0 2 3 0

13 2 0 1 0 0 1 0 0

14 2 1 1 1 0 2 2 3

15 2 0 1 1 0 1 3 0

16 2 1 0 1 0 2 3 0

17 2 0 1 0 1 2 4 0

18 2 0 1 1 0 2 3 0

19 2 1 0 0 1 1 4 0

20 2 0 1 1 1 2 3 4

Page 65: ESTADISTICA BASICA Mtra. Verónica Belén Rodríguez Hevia veronica_rohevia@hotmail.comVeronica.rodriguez@uvmnet.edu Julio de 2011.

Analizar>Respuestas Múltiples>Definir Analizar>Respuestas Múltiples>Definir ConjuntoConjunto

Para crear un conjunto se debe comenzar seleccionando las variables que se desea incluir en el conjunto y trasladar a la lista Variables del Conjunto