Presentacion Estadistica I

14
ESTADISTICA Instituto universitario politécnico Santiago Mariño Sede Barcelona Escuela de ingeniería mantenimiento mecánico Barcelona – Anzoátegui

Transcript of Presentacion Estadistica I

Page 1: Presentacion Estadistica I

ESTADISTICA

Instituto universitario politécnico Santiago MariñoSede Barcelona

Escuela de ingeniería mantenimiento mecánicoBarcelona – Anzoátegui

Page 2: Presentacion Estadistica I

VARIABLESDefinición de variable: Se pueden definir como todo aquello que se va a medir, controlar y estudiar en una investigación o estudio. La capacidad de poder medir, controlar o estudiar una variable viene dado por el hecho de que ella varía, y esa variación se puede observar, medir y estudiar. Por lo tanto, es importante, antes de iniciar una investigación, que se sepa cuáles son las variables que se desean medir y la manera en que se hará. Es decir, las variables deben ser susceptibles de medición. De este modo una variable es todo aquello que puede asumir diferentes valores, desde el punto de vista cuantitativo o cualitativo. Las variables pueden ser definidas conceptual y operacionalmente.La definición conceptual es de índole teórica, mientras que la operacional da las bases de medición y la definición de los indicadores.Existen tres tipos de variables, la variable dependiente, independiente e interviniente.

Page 3: Presentacion Estadistica I

Tipos De VariablesVariable cualitativaLas variables cualitativas se refieren a características o cualidades que no pueden ser medidas con números. Podemos distinguir dos tipos:

Variable cuantitativaUna variable cuantitativa es la que se expresa mediante un número, por tanto se pueden realizar operaciones aritméticas con ella. Podemos distinguir dos tipos:

Variable cualitativa nominalUna variable cualitativa nominal presenta modalidades no numéricas que no admiten un criterio de orden.

Ejemplo: El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo.

Variable cualitativa ordinal o variable cuasi cuantitativaUna variable cualitativa ordinal presenta modalidades no numéricas, en las que existe un orden.

Ejemplos: La nota en un examen: suspenso, aprobado, notable, sobresaliente.Puesto conseguido en una prueba deportiva: 1º, 2º, 3º, ...Medallas de una prueba deportiva: oro, plata, bronce.

Variable discretaUna variable discreta es aquella que solo puede tomar un número finito de valores entre dos valores cualesquiera de una característica.

Ejemplo: El número de hermanos de 5 amigos: 2, 1, 0, 1, 3.

Variable continuaUna variable continua es aquella que puede tomar un número infinito de valores entre dos valores cualesquiera de una característica.

Ejemplos: La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.En la práctica medimos la altura con dos decimales, pero también se podría dar con tres decimales.

Page 4: Presentacion Estadistica I

Población y MuestraPoblación: Es la colección de datos que corresponde a las características de  la totalidad de individuos, objetos, cosas o valores en un proceso de investigación. Para su estudio, en general se clasifican en Poblaciones Finitas y Poblaciones Infinitas.

Poblaciones Finitas: Constan de un número determinado de elementos, susceptible a ser contado. Ejemplo: Los empleados de una fábrica, elementos de un lote de producción, etc.

Poblaciones Infinitas: Tienen un número indeterminado de elementos, los cuales no pueden ser contados.

Ejemplo: Los números naturales.

Así también las poblaciones pueden ser clasificadas en:reales son aquellas concretas, que ya existen. Ejemplo: Los aspirantes a un puesto de trabajo, los vendedores de una empresa. hipotéticas, son las formas imaginables Ejemplo: Estimaciones de la población económicamente activa dentro de diez años.

Muestra: “Es una parte representativa de la población que es seleccionada para ser estudiada, ya que la población es demasiado grande para ser estudiada en su totalidad” Allen Western. 

Page 5: Presentacion Estadistica I

Parámetros EstadísticosUn parámetro estadístico es un número que se obtiene a partir de los datos de una distribución estadística.Los parámetros estadísticos sirven para sintetizar la información dada por una tabla o por una gráfica.

Tipos de parámetros estadísticos

Medidas de centralizaciónNos indican en torno a qué valor (centro) se distribuyen los datos.La medidas de centralización son:Media aritméticaLa media es el valor promedio de la distribución.MedianaLa mediana es la puntación de la escala que separa la mitad superior de la distribución y la inferior, es decir divide la serie de datos en dos partes iguales.ModaLa moda es el valor que más se repite en una

distribución.

Medidas de posiciónLas medidas de posición dividen un conjunto de datos en grupos con el mismo número de individuos.Para calcular las medidas de posición es necesario que los datos estén ordenados de menor a mayor.La medidas de posición son:CuartilesLos cuartiles dividen la serie de datos en cuatro partes iguales.DecilesLos deciles dividen la serie de datos en diez partes iguales.PercentilesLos percentiles dividen la serie de datos en cien partes iguales.

Medidas de dispersiónLas medidas de dispersión nos informan sobre cuanto se alejan del centro los valores de la distribución.Las medidas de dispersión son:Rango o recorridoEl rango es la diferencia entre el mayor y el menor de los datos de una distribución estadística.Desviación mediaLa desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la media.VarianzaLa varianza es la media aritmética del cuadrado de las desviaciones respecto a la media.Desviación típicaLa desviación típica es la raíz cuadrada de la varianza.

Page 6: Presentacion Estadistica I

Ejemplo con histograma de parámetros estadísticos

Page 7: Presentacion Estadistica I

Escalas de medidasPara realizar un correcto análisis de los datos es fundamental conocer de antemano el tipo de medida de la variable, ya que para cada una de ellas se utiliza diferentes estadísticos. La clasificación más convencional de las escalas de medida las divide en cuatro grupos denominados Nominal, Ordinal, Intervalo y Razón.

NOMINALSon variables numéricas cuyos valores representan una categoría o identifican un grupo de pertenencia. Este tipo de variables sólo nos permite establecer relaciones de igualdad/desigualdad entre los elementos de la variable. La asignación de los valores se realiza en forma aleatoria por lo que NO cuenta con un orden lógico. Un ejemplo de este tipo de variables es el Género ya que nosotros podemos asignarle un valor a los hombres y otro diferente a las mujeres y por más machistas o feministas que seamos no podríamos establecer que uno es mayor que el otro.

ORDINALSon variables numéricas cuyos valores representan una categoría o identifican un grupo de pertenencia contando con un orden lógico. Este tipo de variables nos permite establecer relaciones de igualdad/desigualdad y a su vez, podemos identificar si una categoría es mayor o menor que otra. Un ejemplo de variable ordinal es el nivel de educación, ya que se puede establecer que una persona con título de Postgrado tiene un nivel de educación superior al de una persona con título de bachiller. En las variables ordinales no se puede determinar la distancia entre sus categorías, ya que no es cuantificable o medible

INTERVALOSon variables numéricas cuyos valores representan magnitudes y la distancia entre los números de su escala es igual. Con este tipo de variables podemos realizar comparaciones de igualdad/desigualdad, establecer un orden dentro de sus valores y medir la distancia existente entre cada valor de la escala. Las variables de intervalo carecen de un cero absoluto, por lo que operaciones como la multiplicación y la división no son realizables. Un ejemplo de este tipo de variables es la temperatura, ya que podemos decir que la distancia entre 10 y 12 grados es la misma que la existente entre 15 y 17 grados. Lo que no podemos establecer es que una temperatura de 10 grados equivale a la mitad de una temperatura de 20 grados.

RAZÓNLas variables de razón poseen las mismas características de las variables de intervalo, con la diferencia que cuentan con un cero absoluto; es decir, el valor cero (0) representa la ausencia total de medida, por lo que se puede realizar cualquier operación Aritmética (Suma, Resta, Multiplicación y División) y Lógica (Comparación y ordenamiento). Este tipo de variables permiten el nivel más alto de medición. Las variables altura, peso, distancia o el salario, son algunos ejemplos de este tipo de escala de medida.Debido a la similitud existente entre las escalas de intervalo y de razón, SPSS las ha reunido en un nuevo tipo de medida exclusivo del programa, al cual denomina Escala..

Page 8: Presentacion Estadistica I

EjemplosAnálisis Descriptivo de acuerdo al nivel de Medida No todos los procedimientos estadísticos son realmente útiles para la totalidad de los niveles de medida. Cada uno de los tipos de medida posee ciertas características, las cuales debemos tener en cuenta en el momento de realizar un análisis descriptivo. En la tabla [5-2], encontrarás algunos de los procedimientos que resultan ventajosos en los análisis descriptivos de los diferentes niveles de medida. Es necesario aclarar que esta tablaes sólo una muestra de las medidas que se pueden emplear; en algunos textos de estadística aparecen tablas más amplias y detalladas de los procedimientos.

Tabla 5-2 Si nos fijamos en la tabla 5-2, notaremos que los niveles Nominal y Ordinal cuentan con los mismos procedimientos de análisis, por lo que se agrupan como variables categóricas. A partir de este punto cuando nos refiramos a las variables categóricas debemos recordar que se alude a las variables de tipo Nominal yOrdinal. Es importante resaltar que para los análisis descriptivos no hay una gran diferencia entre estos dos tipos de variables, pero si existe diferencia en los análisis de Inferencia. Antes de conocer como se efectúan estos procedimientos en SPSS, es necesario exponer las razones por las que ciertos procedimientos no son de utilidad en algunos de los niveles de medida.

Variables Categóricas Para las variables que representan categorías o grupos de pertenencia, los principales procedimientos estadísticos, que se pueden utilizar en su análisis descriptivo son las frecuencias (Recuento), el Porcentaje, laModa, en algunos casos la mediana y los gráficos más favorables son el de Sectores y el de Barras. Para comprender mejor la razón de estos procedimientos vamos a realizar el análisis de la variable Género, la cual cuenta con los valores (1, 1, 1, 1, 1, 1, 1, 1, 2, 2); en donde el valor uno (1) representa al género Femenino y el valor Dos (2) al género Masculino. Las frecuencias y sus respectivos porcentajes para esta variable serían los expuestos en la tabla [5-3]. Ahora si hallamos las principales medidas de tendencia central, obtenemos los resultados expuestos en la tabla [5-4].

Figura 5-4 Si nos fijamos en los resultados notaremos que la Media toma el valor 1.2, el cual nos indica que en promedio los encuestados cuenta con un género de (1.2). Este resultado no posee una interpretación aplicable a la información de la variable, por lo que esta medida no es de utilidad en el análisis descriptivo. Si observamos la Mediana notaremos que toma el valor 1, que para el caso corresponde al género Femenino, pero si en vez de 10 valores tuviéramos únicamente dos (1 y 2), la mediana sería de (1.5), cuya interpretación no es aplicable a la información de la variable. La mediana se puede utilizar cuando estamos trabajando con variables que contienen un elevado número de categorías y su interpretación se debe manejar como un factor informativo para el investigador y no como una medida representativa en el reporte. Por último encontramos la Moda, la cual para el caso asume el valor 1 y nos indica que la categoría con mayor frecuencia dentro de la variable es la correspondiente al género Femenino. Las medidas de dispersión y distribución no son aplicables a este tipo de variables ya que sus ecuaciones nos permiten determinar como se comportan los datos respecto a un punto central o media. Si hallamos la desviación estándar para los datos delejemplo, obtendríamos un valor de 0.42164, que nos indicaría que el promedio del género presenta una variación de ±0.42, cuyo resultado no sería aplicable a la interpretación de la variable.

Page 9: Presentacion Estadistica I

Sumatoria razón, Proporción, Tasa y Frecuencia

La sumatoria o sumatorio (llamada también notación sigma) es una operación matemática que se emplea para calcular la suma de muchos o infinitos sumandos.La operación sumatoria se expresa con la letra griega sigma mayúscula Σ, y se representa así

Expresión que se lee: "sumatoria de Xi, donde i toma los valores desde 1 hasta n".i es el valor inicial, llamado límite inferior.n es el valor final, llamado límite superior.Pero necesariamente debe cumplirse que:i ≤ nSi la sumatoria abarca la totalidad de los valores, entonces no se anotan sus límites y su expresión se puede simplificar: Ahora, veamos un ejemplo: Si se quiere expresar la suma de los cinco primeros números naturales se puede hacer de esta forma:

RAZONEs un cociente en el que el numerador no está incluido en el denominador. A menudo las cantidades se miden en las mismas unidades, pero no es esencial. El rango oscila entre 0 e infinito.EjemplosCociente entre el número de casos de TBC en varones y mujeres en 2005:Razón= 135/53= 2,55Cociente entre los casos de TBC ocurridos en individuos con edades superiores a 55 y el grupo de individuos con edades inferiores a 55 :Razón=95/93=1,02

Page 10: Presentacion Estadistica I

PROPORCIONEs un cociente en el que el numerador está incluido en el denominador. Una proporción no es más que la expresión de la probabilidad de que un suceso ocurra.El rango esta comprendido entre 0 y 1 o bien en términos porcentuales de 0% a 100%, y no tiene dimensión.EjemplosCociente entre el número de casos ocurridos en varones y el total de casos en el año 2005.135/188=0,72      El 72% de los casos han ocurrido en varones.Cociente entre el número de casos ocurrido en individuos con más de 65 años y el total de casos en el año 2005.77/188=0,41      El 41% de los casos se han detectado en personas mayores de 65 años.

TASALa tasa es una forma especial de proporción o de razón que tiene en cuenta el tiempo. Es una medida que relaciona el cambio de una magnitud por unidad de cambio en otra magnitud (por regla general, tiempo). La utilización de las tasas es esencial para comparar experiencias entre poblaciones en diferentes tiempos, diferentes lugares o entre diferentes tipos de personas. Su rango oscila entre 0 e infinito y su medida es tiempo-¹.

EjemplosCociente entre el número de casos de TBC en varones durante el años 2005 y la población estimada de varones en el año 2005:135/516.329=0,000261     La tasa es de 26,1 casos de TBC por cada 100.000 habitantes varones en 1 año (2005).Cociente entre los casos de defunción por TBC y la población estimada en el año 2005:8/1076635=0,000007      La tasa de mortalidad es de 0,7 por 100.000 habitantes en 1 año.

Page 11: Presentacion Estadistica I

• Frecuencia absolutaLa frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio estadístico.Se representa por fi.La suma de las frecuencias absolutas es igual al número total de datos, que se representa por N.

Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se lee suma o sumatoria.

• Frecuencia relativaLa frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el número total de datos.Se puede expresar en tantos por ciento y se representa por ni.

La suma de las frecuencias relativas es igual a 1.

• Frecuencia acumuladaLa frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado.Se representa por Fi.

• Frecuencia relativa acumuladaLa frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el número total de datos. Se puede expresar en tantos por ciento.

EjemploDurante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas:32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la segunda hacemos el recuento y en la tercera anotamos la frecuencia absoluta.

x i Recuento f i F i n i N i

27 I 1 1 0 .032 0.032

28 I I 2 3 0 .065 0.097

29

6 9 0.194 0.290

30

7 16 0.226 0.0516

31

8 24 0.258 0.774

32 I I I 3 27 0.097 0.871

33 I I I 3 30 0.097 0.968

34 I 1 31 0.032 1

31 1

Page 12: Presentacion Estadistica I

Ejemplo General

Page 13: Presentacion Estadistica I

HistogramaFrecuencia

0 30 60 90 120 150 180 210 240

16

14

12

10

8 6 4

2

Numero de llamadas telefónicas

Page 14: Presentacion Estadistica I

Bibliografía Menden Hall, Willians y Reinmuth, James. (2000) Estadística para la Administración y Economía. 3era edición Grupo Editorial Iberoamericana. México. Ya- Lum. Chou. (2001) Análisis Estadístico. Nueva Editorial Iberoamericana. México.  Spigel Murray (1995). Estadística. Edición McGraw-Hill.

HTTP//:www.vitutor.com