Nociones Básicas de Estadística

45
Nociones Básicas de Estadística Dr. Gerardo Alfaro C. Dr. Fernando Ávila C.

description

Nociones Básicas de Estadística. Dr. Gerardo Alfaro C. Dr. Fernando Ávila C. Porque la Estadística?. "Algún día el pensamiento estadístico será tan nece­sario como la habilidad para leer y escribir“ (H. G. Wells) - PowerPoint PPT Presentation

Transcript of Nociones Básicas de Estadística

Page 1: Nociones Básicas de Estadística

Nociones Básicas de Estadística

Dr. Gerardo Alfaro C.Dr. Fernando Ávila C.

Page 2: Nociones Básicas de Estadística

Porque la Estadística?

• "Algún día el pensamiento estadístico será tan nece sario como la habilidad para leer y escribir“ (H. G. Wells)

• El problema que enfrentan los investigadores no es la escasez de información, sino cómo utilizar la información disponible para tomar las decisiones más adecuadas.

Page 3: Nociones Básicas de Estadística

• Desde la perspectiva de una toma de decisiones informada, cabe preguntarse por qué un investigador necesita saber estadística.

Cuatro razones fundamentales: 1. Para saber cómo presentar y describir la información en

forma adecuada 2. Para saber cómo obtener conclusiones sobre poblaciones

grandes basándose solamente en la información obtenida de las muestras

3. Para saber cómo mejorar los procesos 4. Para saber cómo obtener pronósticos confiables

Page 4: Nociones Básicas de Estadística

• Es común emplear los métodos estadísticos en las áreas funcionales de negocios: contabilidad, finanzas, administración y mercadotecnia. En contabilidad se utilizan los métodos estadísticos para seleccionar muestras con fines de auditoría y para comprender los determinantes del costo en la contabilidad de costos. En finanzas se utilizan los métodos estadísticos para elegir entre carteras alternativas de inversión y para detectar las tendencias en las medidas financieras a través del tiempo. En la administración se recurre a los métodos estadísticos para mejorar la calidad de los productos manufacturados o de los servicios que presta alguna organización. En mercadotecnia se aplican los métodos estadísticos para estimar la proporción de clientes que prefieren un producto en lugar de otro, además, para saber el porqué de su preferencia. También se utiliza para obtener conclusiones y determinar la estrategia publicitaria que resultará más útil para aumentar las ventas de un producto.

Page 5: Nociones Básicas de Estadística

Def. Estadística

• El termino estadística proviene del latín statisticum collegium (“consejo de Estado”) y de su derivado italiano statista (“hombre de Estado o político”). Por lo tanto, los orígenes de la estadística están relacionados con el gobierno y sus cuerpos administrativos.

• La estadística es el conjunto de técnicas que se emplean para la recolección, análisis e interpretación de datos.

• La ciencia que tiene por objeto aplicar las leyes de la cantidad a los hechos sociales para medir su intensidad, deducir las leyes que los rigen y hacer su predicción próxima.

Page 6: Nociones Básicas de Estadística

ESTADíSTICA DESCRIPTIVA VERSUS INFERENCIA ESTADíSTICA

• Estadística descriptiva: se refiere a los métodos de recolección, descripción, visualización y resumen de los datos, que pueden ser presentados en forma numérica o gráfica y la

• Inferencia estadística: la generación de los modelos y predicciones relacionadas a los fenómenos estudiados, teniendo en cuenta el aspecto aleatorio y la incertidumbre en las observaciones).

Page 7: Nociones Básicas de Estadística

OPERACIONALIZACIÓN

• En el proceso global de operacionalización hay que diferenciar dos nociones fundamentales: la conceptualización y la medición. a)La conceptualización: hace referencia al proceso teórico mediante el que se clarifican las ideas o constructos teóricos. Esta clarificación ha de hacerse de manera que la definición del constructo teórico comprenda el significado que se le suele asignar. b)La medición connota, en cambio, el proceso general que vincula las operaciones físicas de medición con las operaciones matemáticas de asignar números a objetos

Page 8: Nociones Básicas de Estadística

• El proceso completo implicaría, en consecuencia, un triple nexo que relaciona los conceptos teóricos con las operaciones físicas de medición, y de éstas con los símbolos matemáticos.

• Si queremos que nuestras teorías sean generalizables a través de una variedad de entornos, o con respecto a una variedad de fenómenos, obviamente tenemos que conceptualizar nuestras variables de forma que las proposiciones que contengan estas variables puedan aplicarse en tales entornos y fenómenos diversos.

Page 9: Nociones Básicas de Estadística

Medición de variables

• Por variable generalmente se entiende cualquier cualidad o característica de un objeto (o evento) que contenga, al menos, dos atributos (categorías o valores), en los que pueda clasificarse un objeto o evento determinado.

• Los atributos son las distintas categorías o valores que componen la variable. En función de ellos se clasifica a los objetos (o eventos) en un grupo u otro.

• Variables como la "edad" (años cumplidos), la "altura" (centímetros), o el "nivel de ingresos" (en pesos), toman valores (numéricos). Por el contrario, variables como "sexo" (varón ,mujer), "estado civil" (soltero, casado, viudo, separado, divorciado), o "satisfacción conyugal" (bastante satisfecho, satisfecho, ni satisfecho ni insatisfecho, insatisfecho, bastante insatisfecho) adoptan categorías.

Page 10: Nociones Básicas de Estadística

• La medición de una variable consiste, precisamente, en el proceso de asignar valores o categorías a las distintas características que conforman el objeto de estudio. Para que la medición se realice adecuadamente se recomienda, al menos, cumplir tres requisitos básicos:

• a)Exhaustividad:La medición de la variable ha de efectuarse de forma que ésta comprenda el mayor número de atributos (categorías o valores) posible.

• b)Exclusividad: Los distintos atributos que componen la variable deben ser mutuamente excluyentes. Por lo que deberán definirse de manera que cualquier observación sólo pueda clasificarse en términos de un único atributo.

• c) Precisión: Realizar el mayor número de distinciones posibles. Ello contribuye a la consecución de una información más precisa.

Page 11: Nociones Básicas de Estadística

Tipologías de variables según criterios de clasificación.

Nivel de medición

Variables cualitativas o no métricas. 1) Nominales 2) OrdinalesVariables cuantitativas o métricas. 3) De intervalo 4) De razón o proporción

Escala de medición 1) Continuas.2) Discretas

Función en la investigación

1) Independientes.2) Dependientes.

Nivel de abstracción1) Generales.2) Intermedias3) Empíricas o indicadores

 

Page 12: Nociones Básicas de Estadística

Variables nominales

• Aquellas variables cuyos atributos sólo cumplen las condiciones esenciales de exhaustividad y exclusividad. Únicamente se hallan compuestas por distintas denominaciones, entre las que no puede establecerse ningún tipo de relación (de orden o de otra clase): Ello limita las posibilidades de análisis estadísticos en este tipo de variables.

• A esta modalidad pertenecen las variables sexo, estado civil, nacionalidad, partido político, color del pelo, grupo sanguíneo, situación laboral; cualquier variable que indique una cualidad del objeto o evento que se analice, sin establecer ninguna graduación entre las distintas categorías que conforman la variable.

Page 13: Nociones Básicas de Estadística

Variables ordinales

• Variables cuyos atributos participan de las características anteriormente referidas, a las que se suma la posibilidad de poderse "ordenar", en el sentido de "mayor que" o "menor que "'. No obstante, continúa sin poderse conocer la magnitud exacta que diferencia a un atribulo de otro. Las variables ordinales son, igualmente, variables no métricas o cualitativas. Expresan una "cualidad" del objeto o acontecimiento, no una "cantidad".

• Como ejemplos pueden citarse las variables clase social, nivel de estudios, ideología política, satisfacción laboral, calificación académica, curso académico o cualquier otra que comprenda categorías "ordenables" (en un sentido u otro).

Page 14: Nociones Básicas de Estadística

Variables de intervalo

• Constituyen variables cuantitativas o métricas. Puede "cuantificarse" la distancia exacta que separa cada valor de la variable. Ello es posible gracias al establecimiento de alguna unidad física de medición estándar (años, pesos, horas, minutos, metros, grados). Lo que posibilita que pueda afirmarse, por ejemplo, que la distancia que separa a aquellas personas de 15 y 16 años es la misma entre aquellos de 72 y 73 años.

Page 15: Nociones Básicas de Estadística

Variables de proporción o razón

• A las características del nivel de intervalo se suma la posibilidad de establecer un cero absoluto. Lo que permite el cálculo de "proporciones" y la realización de cualquier operación aritmética. La mayoría de las variables de intervalo son, a su vez, de razón (ingresos, n° de habitantes, n° de veces que se asiste a un concierto.

• Ello lleva a algunos autores, como Blalock (1978), a afirmar que la distinción entre variables de intervalo y variables de razón es puramente académica más que real. Una vez que se ha determinado la magnitud de la unidad, resulta difícil concebir la posibilidad de fijar cero unidades.

Page 16: Nociones Básicas de Estadística

Tipos de variable según la escala de medición

• 1) Variables continuas: Aquellas variables en las que pueden hallarse valores intermedios entre dos valores dados, al conformar una escala ininterrumpida de valores.

• • 2) Variables discretas: Cuando en la escala de medición de la

variable no cabe la posibilidad de hallar dos valores intermedios, comprendidos entre dos atributos de la variable.

• La generalidad de las variables denominadas cualitativas (nominales y ordinales) son discretas. También lo son algunas cuantitativas, como el n.o de miembros de una familia (no puede haber 2 hijos y medio), o el n.o de coches vendidos.

Page 17: Nociones Básicas de Estadística

Tipos de variables según su función en la investigación

• 1) Variables independientes, explicativas o predictoras (X): Aquellas variables cuyos atributos se supone que influyen en los que adopta una segunda variable (la dependiente). Figuran en las hipótesis de la investigación e indican posible "causas" de la variación de la variable que centra el interés de la indagación (la dependiente o variable efecto)

• 2) Variables dependientes o criterio (Y): Variables cuyos atributos "dependen" -como su nombre indica- de los que adopten las variables independientes. Ambos tipos de variables corresponden a los objetivos de la investigación,

Page 18: Nociones Básicas de Estadística

Tipos de variables según su nivel de abstracción

• 1) Variables generales: Aquellas variables que son tan genéricas y abstractas que no pueden ser directamente observadas. Su medición exige que se traduzcan a variables intermedias e indicadores. Un ejemplo típico de variable genérica lo representa la variable "status social" porque necesita de indicadores concretos que ayuden a su medición.

• 2) Variables intermedias: Expresan alguna dimensión o aspecto parcial de los comprendidos en la variable genérica. Por ejemplo, el "nivel educativo" para la medición de la variable "status social".

• 3) Indicadores o variables empíricas: Representan aspectos específicos de las dimensiones que comprende un concepto abstracto o variable genérica. Se distinguen por ser directamente medibles. Por ejemplo, los "cursos académicos cumplidos" como indicador para la dimensión "nivel educativo".

Page 19: Nociones Básicas de Estadística

Diseño de la muestra

• Por población (o universo de estudio) comúnmente se entiende un conjunto de unidades, para las que se desea obtener cierta información. Las unidades pueden ser personas, familias, viviendas, escuelas, organizaciones, artículos de prensa ... ; y la información vendrá dictada por los objetivos de la investigación (condiciones de habitabilidad de la vivienda, reacción familiar ante el fracaso escolar, la práctica de la religión en las escuelas).

• En la definición y acotación de la población han de mencionarse características esenciales que la ubiquen en un espacio y tiempo concreto. Una vez definida la población, se procede al diseño de la muestra: la selección de unas unidades concretas de dicha población.

Page 20: Nociones Básicas de Estadística

Tamaño de muestra

A fin de obtener una muestra que sea representativa, suficiente y confiable, se puede

utilizar las siguientes expresiones para poblaciones finitas:

En donde:

n = número de elementos de la muestra

σ = el nivel de confianza. (1)

N = El universo

E= es el error permitido. (2)

Brunet (2003)

ó

la expresión propuesta por

(3)

Rosado M.A. (2003)

)1((

)1(22

2

ppE

Nppn

n

ppE

)1(

)1(***

)1(**22

2

ppzeN

ppzNn

Page 21: Nociones Básicas de Estadística

Métodos de muestreo

Probabilísticos

Simple

Sistemático

Estratificado

Por conglomerados

De rutas aleatorias

Page 22: Nociones Básicas de Estadística
Page 23: Nociones Básicas de Estadística

Ejemplo

• Propuesta de investigación• Identificación de variables• Población• Muestra• Nivel de medición de variables

Page 24: Nociones Básicas de Estadística

Medidas de tendencia central

• Las medidas de tendencia central (media, mediana y moda) sirven como puntos de referencia para interpretar las datos que se obtienen en un experimento.

El propósito de las medidas de tendencia central es: (caso calificaciones)• Mostrar en qué lugar se ubica la persona promedio o típica del

grupo.• Sirve como un método para comparar o interpretar cualquier

puntaje en relación con el puntaje central o típico. • Sirve como un método para comparar el puntaje obtenido por una

misma persona en dos diferentes ocasiones. • Sirve como un método para comparar los resultados medios

obtenidos por dos o más grupos

Page 25: Nociones Básicas de Estadística

• Las medidas de tendencia central más comunes son:

– La media aritmética: comúnmente conocida como media o promedio. Se representa por medio de una letra M o por una X con una línea en la parte superior.

– La mediana: la cual es el puntaje que se ubica en el centro de una distribución. Se representa como Md.

– La moda: que es el puntaje que se presenta con mayor frecuencia en una distribución. Se representa Mo.

Page 26: Nociones Básicas de Estadística

• Moda (Mo)Es la medida que indica cual dato tiene la mayor frecuencia en un conjunto de datos; o sea, cual se repite más.

Mediana (Med)• Es el valor central de un conjunto de valores ordenados en forma

creciente o decreciente. Dicho en otras palabras, la Mediana corresponde al valor que deja igual número de valores antes y después de él en un conjunto de datos agrupados.

• Según el número de valores que se tengan se pueden presentar dos casos:• Si el número de valores es impar, la Mediana corresponderá al valor

central de dicho conjunto de datos.• Si el número de valores es par, la Mediana corresponderá al promedio de

los dos valores centrales (los valores centrales se suman y se dividen por 2).

Page 27: Nociones Básicas de Estadística

Medidas de tendencia central

11.5minXXXMed 5..5(1/2)][(10/2)(1/2)][(n/2)

Un experto en normas laborales observa, en una muestra, la cantidad de tiempo requerido para la elaboración de 10 cartas comerciales en una oficina, con los siguientes resultados, enlistados en orden ascendente de acuerdo con el minuto más cercano: 5, 5, 5, 7, 9, 14, 15, 15, 16, 18. Determine la a) media, b) mediana y c) moda de este grupo de valores.

a) $109min10

109

nX X

b) c) Moda = valor más frecuente = 5.0

Page 28: Nociones Básicas de Estadística

• Cálculo de medidas puntuales con Excel utilizar funciones y análisis y si

• Base datos pedidos

Page 29: Nociones Básicas de Estadística

Medidas de dispersión

• Las Medidas de Dispersión nos resumen la información de la “muestra” o serie de datos, dándonos información acerca de la magnitud del alejamiento de la distribución de datos en relación a un valor central o de concentración de los datos.

• Rango• Varianza• Desviación Estándar• Coeficiente de Pearson

Page 30: Nociones Básicas de Estadística

RANGO ( R )

• Es la diferencia entre el valor máximo y el valor mínimo de un conjunto de datos, es fácil de calcular y sus unidades son las mismas que las de la variable. Posee algunos inconvenientes; no utiliza todas las observaciones (solo 2 de ellas), también puede verse afectada por alguna observación extrema.

• Su fórmula es: R = Dato máximo - Dato mínimo

Page 31: Nociones Básicas de Estadística

VARIANZA

• Mide la distancia existente entre los valores de la serie y la media. La varianza siempre será mayor que cero. Mientras más cerca se encuentren los valores de cero, estos valores están más concentrados alrededor de la media; además es el cuadrado de la desviación estándar. Su ecuación es:

Page 32: Nociones Básicas de Estadística

DESVIACION ESTÁNDAR

• Es la diferencia entre el valor de un dato y el valor de la media de su distribución, también mide la variabilidad de las observaciones con respecto a la media, es igual a la raíz cuadrada de la varianza. Esta medida de dispersión siempre es positiva. Su fórmula es.

Page 33: Nociones Básicas de Estadística

Coeficiente de Pearson

• comparar poblaciones en las que las unidades de medida son distintas, o que aún teniendo la misma unidad de medida difieren en sus magnitudes.

• Esta situación se nos presenta por ejemplo cuando tenemos que comparar la dispersión del peso y la altura o si queremos comparar la dispersión en las alturas de una población de caballos y otra de ratones.

• Coeficiente de variación para una muestra:

• Coeficiente de variación para una población:

Page 34: Nociones Básicas de Estadística

ASIMETRÍA

• Es una medida de forma de una distribución que permite identificar y describir la manera como los datos tiende a reunirse de acuerdo con la frecuencia con que se hallen dentro de la distribución. Permite identificar las características de la distribución de datos sin necesidad de generar el gráfico.

Donde: = media aritmética.Md = Mediana.s = desviación típica o estándar

Page 35: Nociones Básicas de Estadística

• El Coeficiente de Pearson varía entre -3 y 3• Si As < 0 ? la distribución será asimétrica negativa.• Si As = 0 ? la distribución será simétrica.• Si As > 0 ? la distribución será asimétrica positiva.

Page 36: Nociones Básicas de Estadística

• Cálculo de medidas puntuales con Excel utilizar funciones y análisis y si

• Base datos pedidos

Page 37: Nociones Básicas de Estadística

Distribuciones de probabilidad

• Cuando se asignan valores de probabilidad a todos los valores numéricos posibles de una variable aleatoria X, ya sea mediante un listado o a través de una función matemática, se obtiene como resultado una distribución de probabilidad.

• Para una variable aleatoria discreta, se pueden enlistar todos los valores numéricos posibles de la variable en una tabla con las probabilidades correspondientes. Existen diversas distribuciones estándar de probabilidad que pueden utilizarse como modelos para una amplia gama de variables aleatorias discretas en aplicaciones.

• Distribuciones observamos binomial, hipergeométrica y Poisson.

Page 38: Nociones Básicas de Estadística

Distribución Binomial

• La distribución binomial es una distribución discreta de probabilidad aplicable como modelo a diversas situaciones de toma de decisiones, siempre y cuando pueda suponerse que el proceso de muestreo se ajusta a un proceso Bernoulii. Un proceso Bernoulli es un proceso de muestreo en el que:

• (1) Sólo son posibles dos resultados mutuamente excluyentes en cada ensayo u observación. Por conveniencia, a estos resultados se les denomina éxito y fracaso.

• (2) Los resultados del conjunto de ensayos u observaciones, constituyen eventos independientes.

• (3) La probabilidad de éxito, que se denota mediante p, permanece constante de un ensayo a otro. Es decir, el proceso es estacionario.

Page 39: Nociones Básicas de Estadística

• Puede utilizarse la distribución binomial para determinar la probabilidad de obtener un número determinado de éxitos en un proceso Bernoulii. Se requieren tres valores: el número específico de éxitos (X), el número de ensayos u observaciones (n) Y la probabilidad de éxito en cada uno de los ensayos (P).

Page 40: Nociones Básicas de Estadística

Ejemplo

Una parte importante de las responsabilidades del servicio a clientes de una compañía de teléfonos se relaciona con la rapidez con que pueden reparar las fallas en el servicio residencial. Suponga que los datos históricos indican que la posibilidad de reparar las fallas el mismo día es 0.70.

a) Para las primeras cinco fallas reportadas en un día dado, ¿cuál es la probabilidad de que se reparen

1) las cinco el mismo día

n= 5 P(5)= 5C5 (0.70)5 (0.30)5-5 p= 0.70 P(5)= 1 (0.1681) q= 0.30 P(5)= 0.1681=16.81 % “La probabilidad de reparar las cinco el mismo día es de 16.81 %”.

Page 41: Nociones Básicas de Estadística

Distribuciones de probabilidad para variables aleatorias continuas:

VARIABLES ALEATORIAS CONTINUAS • A diferencia de una variable aleatoria discreta, una variable aleatoria

continua es la que puede tomar cualquier valor fraccionario en un rango determinado de valores. Como existe un número infinito de posibles mediciones fraccionarias, no pueden enlistarse todos los valores posibles con una probabilidad correspondiente. Más bien, se define una función de densidad de probabilidad. Esta expresión matemática da la función de X, y se representa mediante el símbolo f (X), para cualquier valor designado de la variable aleatoria X. A la gráfica de una función de este tipo se le denomina curva de probabilidad y el área entre dos puntos cualesquiera bajo la curva da la probabilidad de la ocurrencia aleatoria de un valor entre esos dos puntos.

Page 42: Nociones Básicas de Estadística

• Existen diversas distribuciones continuas de probabilidad comunes que son aplicables como modelos a una amplia gama de variables continuas en determinadas circunstancias. Existen tablas de probabilidades para esas distribuciones estándar, haciendo que resulte innecesario el método de la integración para determinar las áreas bajo la curva de probabilidad para estas distribuciones. Los modelos comunes de distribuciones de probabilidad continua que se describen son las distribuciones normal.

Page 43: Nociones Básicas de Estadística

Distribución normal de probabilidad

• La distribución normal de probabilidad es una distribución continua de probabilidad que es, al mismo tiempo, simétrica y mesokúrtica. Con frecuencia se describe a la curva de probabilidad que representa a la distribución normal como una campana.

Page 44: Nociones Básicas de Estadística

• La distribución normal de probabilidad es muy importante en inferencia estadística por tres razones principales:

• (1) Se sabe que las mediciones que se obtienen en muchos procesos aleatorios tienen esta clase de distribución.

• (2) Con frecuencia pueden utilizarse las probabilidades normales para aproximar otras distribuciones de probabilidad, tales como las distribuciones binomial y Poisson.

• (3) Las distribuciones de estadísticas como la media muestral y la proporción muestral tienen distribución normal cuando el tamaño de la muestra es grande, sin importar la forma de la distribución de la población de origen

Page 45: Nociones Básicas de Estadística

Ejemplo