Que Es La Estadistica

44
¿Qué es la Estadístic a?

description

Fundamentos de Estadística y Conceptos basicos

Transcript of Que Es La Estadistica

  • Qu es la Estadstica?

  • 292626313230272825293230292728303031313030312731282932333334312930Conjunto de DatosQu dicen para Usted estos datos?Edades de Empleados de una Empresa

  • 29262631323027282529323029272830303131303031273128293233333431293024 25 26 27 28 29 30 31 32 33 34 35Conjunto de DatosQu dicen para Usted estos datos?Edades de Empleados de una Empresa

  • Qu es la estadstica?Qu queremos significar por estadstica?

    Qu entendemos por estadstica descriptiva e inferencial?

    Qu es una poblacin y que una muestra?

    Qu es una variable, el dato y los datos?

    Cundo la informacin se refiere a un parmetro y cuando a una estadstica?

    Distinguir cuando una variable es cualitativa y cuando cuantitativa

    Distinguir entre una variable discreta y continua.

    Distinguir las distintas escalas de medicin nominal, ordinal, de intervalo y de razn

  • La Ciencia se ocupa en general de fenmenos observables

    La Ciencia se desarrolla observando hechos, formulando leyes que los explican y realizando experimentos para validar o rechazar dichas leyes

    Los modelos que crea la ciencia son de tipo determinista o aleatorio (estocstico)

    La Estadstica se utiliza como tecnologa al servicio de las ciencias donde la variabilidad y la incertidumbre forman parte de su naturalezaQu es la estadstica?

  • Qu es la estadstica?La Estadstica suministra un conjunto de herramientas tiles en la investigacin para:

    RecolectarDescribirOrganizare Interpretar

    para transformarlos en informacin, para la toma mas eficiente de decisiones.los Datos

  • Qu es la estadstica?EXACTITUD

    O

    PRECISIN?

  • Qu es la estadstica?La Estadstica es la ciencia de la

    Sistematizacin, recogida, ordenacin y presentacin de los datos referentes a un fenmeno que presenta variabilidad o incertidumbre para su estudio metdico, con objeto de

    deducir las leyes que rigen esos fenmenos,

    y poder de esa forma hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones.InferenciaProbabilidadDescriptiva

  • Qu es la estadstica?El objetivo de la Estadstica es hacer inferencias acerca de una poblacin, sobre la base de la informacin contenida en una muestra.

    En este sentido la estadstica se ocupa de la extraccin de la informacin contenida en datos y de su uso para hacer inferencias acerca de la poblacin de la que se extraen los datos.

  • Pasos en un estudio estadsticoPlantear hiptesis sobre una poblacinLos fumadores tienen ms bajas laborales que los no fumadoresEn qu sentido? Mayor nmero? Tiempo medio?

    Decidir qu datos recoger (diseo de experimentos)Qu individuos pertenecern al estudio (muestras)Fumadores y no fumadores en edad laboral.Criterios de exclusin Cmo se eligen? Descartamos los que padecen enfermedades crnicas?Qu datos recoger de los mismos (variables)Nmero de bajasTiempo de duracin de cada bajaSexo? Sector laboral? Otros factores?

    Recoger los datos (muestreo)Aleatorio Simple? Estratificado? Conglomerados? Sistemticamente?

    Describir (resumir) los datos obtenidostiempo medio de baja en fumadores y no (estadsticos)% de bajas por fumadores y sexo (frecuencias), grficos,...

    Realizar una inferencia sobre la poblacinLos fumadores estn de baja al menos 10 das/ao ms de media que los no fumadores.

    Cuantificar la confianza en la inferenciaNivel de confianza del 95%Significacin del contraste: p=2%No tenis que entenderlo, an

  • Mtodo cientfico y estadstica

  • Quienes usan la estadstica?Organismos oficiales.Diarios y revistas.Polticos.Deportes.Investigadores de Mercados.Control de calidad.Administradores.Investigadores cientficos.Mdicos.Economistas.Diseo de Experimentos.Investigadores Agrcolas.Compaas de Seguros (actuarial).Socilogos.CasinosEtc.

  • Tipos de EstadsticaEstadstica Descriptiva: Mtodo de recolectar, organizar, resumir y presentar los datos en forma informativa.

    Ejemplo 1: Los datos del Censo de poblacin de 2005.Ejemplo 2: La cantidad de robos ocurridos el ltimo mes en el el municipio clasificados por tipo y cuanta.Ejemplo 3: La cantidad de pacientes atendidos en el Hospital municipal el ltimo ao.Ejemplo 4: Clasificacin de los empleados de la compaa por departamentos, nivel de estudios, edad y estrato socioeconmico.

  • Tipos de EstadsticaEstadstica inferencial: Mtodos usados para determinar algo acerca de la poblacin, basado en una muestra.

    Poblacin(1) es la coleccin, o conjunto, de individuos, objetos o eventos cuyas propiedades sern analizadas.

    Muestra es un subconjunto de la poblacin de inters.Debera ser representativaEsta formada por miembros seleccionados de la poblacin (individuos, unidades experimentales).

    (1) Algunos autores utilizan Universo como sinnimo

  • Poblacin y MuestraPoblacinMuestra

  • Parmetro: Caracterstica medible en una poblacin. Se utilizan letras griegas para simbolizar un parmetro como ser (Media Poblacional) y (Desviacin Estndar).Ejemplos: La calificacin promedio de secundaria en el momento de admisin de todos los estudiantes que han asistido alguna vez a la Universidad del Valle o la proporcin de estudiantes del SENA cuyo lugar de origen era distinto del municipio del Centro de Formacin.

    Estadstica: Caracterstica medible en una muestra. Se utilizan letras del alfabeto espaol para simbolizarlas como ser x (Media de la Muestra) y s (Desviacin Muestral).Ejemplo: La edad promedio registrada en una encuesta de 150 empleados de una empresa de automoviles.Parmetro y Estadstica

  • Ejemplo 1: Una encuesta desarrollada por IBOPE, en marzo 2002, dice que el rating de radio en Cali esta encabezado por FM 98.3, La MEGA con un 1.5% seguido por FM 95.9 ROCK & POP con 1.18%

    Ejemplo 2: De acuerdo con una encuesta desarrollada por Prince & Cook sobre telefona residencial en el 2001, el gasto mensual promedio por cliente es de $34.530. A nivel nacional.

    Ejemplo 3: El DANE inform que la Encuesta Continua de Hogares (ECH) del mes de mayo de 2002 reporto la tasa mas alta de desempleo que ascendi al 24.3% a nivel nacional.Tipos de Estadstica(ejemplos de estadstica inferencial)

  • Variable: Caracterstica de inters sobre cada elemento individual de una poblacin o muestra. La informacin que disponemos de cada individuo es resumida en variables.

    Dato: Valor de la variable asociada a un elemento de la poblacin o muestra. Este valor puede ser un nmero, una palabra o un smbolo.

    Ejemplo: La familia Gonzlez tiene 4 miembros, sus ingresos mensuales son de $685, 2 son de sexo femenino y 2 masculino.Variable

  • Datos: Conjunto de valores recolectados para la variable de cada uno de los elementos que pertenecen a la poblacin o muestra.

    Ejemplo1: El conjunto de 54 cantidad de miembros recolectados de 54 familias residentes en Escobar.

    Ejemplo2: El conjunto de las calificaciones de los 43 estudiantes de estadstica de la carrera de SistemasVariable

  • Cualitativa o de Atributos Clasifica o describe un elemento de la poblacin. Los valores que puede asumir no constituyen un espacio mtrico, por lo tanto las operaciones aritmticas, como sumar y obtener promedios, no son significativas.

    Ejemplos: Sexo, Nacionalidad, Marcas de auto, Grado de Satisfaccin con la Universidad, etc..1-7Tipos de Variables

  • Tipos de VariablesCuantitativa o Numrica Cuantifica un elemento de la poblacin. Los valores que puede asumir constituyen un espacio mtrico, por lo tanto las operaciones aritmticas, como sumar y obtener promedios, son significativas.

    Ejemplos: Cantidad de Habitaciones, Nmero de hijos, Kilmetros recorridos, Tiempo de vuelo, Ingreso, etc..

  • Las variables cuantitativas se pueden clasificar a su vez en discretas o continuas.

    Cuantitativas Discretas: solo pueden asumir ciertos valores y normalmente hay huecos entre ellos. Son conteos normalmente.

    Ejemplo1: Cantidad de materias aprobadas.(1, 2,3 ......)Ejemplo2: Cantidad de hijos (1, 2, 3,4...)1-9Tipos de Variables

  • Cuantitativas Continuas: puede asumir cualquier valor dentro del rango de medicin. Normalmente se miden magnitudes como ser longitud, superficie, volumen, peso, tiempo, dinero.

    Ejemplo 1: Peso al nacer.Ejemplo 2: Salario de un empleadoEjemplo 3: Tiempo de viaje en bus entre Salomia y la Plaza de Caicedo.1-9Tipos de Variables

  • 1-12Escalas de MedicinLas variables cualitativas se miden en escala nominal o ordinal.

    Nominal: los elementos solo pueden ser clasificados en categoras pero no se da un orden o jerarqua. El numero es un cdigo.

    Ejemplo 1: Barrio de residencia de los alumnos. (1 Sena, 2 Floralia, 3 Obrero).Ejemplo 2: Color de ojos (1 Negros, 2 Castaos)Ejemplo 3: Simpatizante de un club de ftbol (1Cali, 2 Amrica)

  • 1-12Escalas de MedicinOrdinal: los elementos son clasificados en categoras que tienen un orden o jerarqua, la diferencia entre valores no se pueden realizar o no son significativas.

    Ejemplo 1: Grado de satisfaccin en el uso de un servicio pblico. (1 Excelente, 2 Bueno, 3 Regular, 4 Malo)

    Ejemplo 2: Tabla de posiciones del Campeonato Mundial de Futbol (1. Colombia, 2 Brasil, 3 Alemania)

  • Escalas de MedicinLas variables cuantitativas se miden en escala de intervalo o razn.

    Intervalo: los elementos son clasificados en categoras que tienen un orden o jerarqua, la diferencia entre valores se pueden realizar y son significativas. La diferencia entre dos valores consecutivos es de tamao constante y no existe el 0 absoluto, el 0 es relativo.

    Ejemplo: Temperatura en grados Celsius

  • Escalas de MedicinRazn: los elementos son clasificados en categoras que tienen un orden o jerarqua, la diferencia entre valores se pueden realizar y son significativas. Existe el 0 absoluto, es decir la ausencia de la variable medida.

    Ejemplo 1: Tiempo de vuelo.Ejemplo 2: Ingresos familiares

  • Resumen de Tipos de variables y Escalas de Medicin

  • Presentacin de los Datos

  • Presentacin ordenada de datosLas tablas de frecuencias y las representaciones grficas son dos maneras equivalentes de presentar la informacin. Las dos exponen ordenadamente la informacin recogida en una muestra.

    GneroFrec.Hombre4Mujer6

    Grfico1

    4

    6

    Hoja1

    Gnero

    Hombre4

    Mujer6

    Hoja1

    Hoja2

    Hoja3

  • Tablas de FrecuenciasExponen la informacin recogida en la muestra, de forma que no se pierda nada de informacin (o poca).

    Frecuencias absolutas: Contabilizan el nmero de individuos de cada modalidad

    Frecuencias relativas (porcentajes): Idem, pero dividido por el total

    Frecuencias acumuladas: Slo tienen sentido para variables ordinales y numricasMuy tiles para calcular cuantiles (ver ms adelante)Qu porcentaje de individuos tiene menos de 3 hijos? Sol: 83,8Entre 4 y 6 hijos? Soluc 1: 8,4%+3,6%+1,6%= 13,6%. Soluc 2: 97,3% - 83,8% = 13,5%

  • Datos desordenados y ordenados en tablasVariable: GneroModalidades:H = HombreM = Mujer

    Muestra:

    M H H M M H M M M H

    equivale a HHHH MMMMMM

    GneroFrecuencia.Frecuencia relativaporcentajeHombre44/10=0,4=40%Mujer66/10=0,6=60%10=tamao muestral

  • EjemploCuntos individuos tienen menos de 2 hijos?frec. indiv. sin hijos + frec. indiv. con 1 hijo = 419 + 255 = 674 individuos

    Qu porcentaje de individuos tiene 6 hijos o menos?97,3%

    Qu cantidad de hijos es tal que al menos el 50% de la poblacin tiene una cantidad inferior o igual?2 hijos

    50%

  • Grficos para variables cualitativasDiagramas de barrasAlturas proporcionales a las frecuencias (abs. o rel.)Se pueden aplicar tambin a variables discretas

    Diagramas de sectores (tartas, polares)No usarlo con variables ordinales.El rea de cada sector es proporcional a su frecuencia (abs. o rel.)

    PictogramasFciles de entender.El rea de cada modalidad debe ser proporcional a la frecuencia. De los dos, cul es incorrecto?.

  • Grficos diferenciales para variables numricasSon diferentes en funcin de que las variables sean discretas o continuas. Valen con frecuencias absolutas o relativas.

    Diagramas barras para variables discretasSe deja un hueco entre barras para indicar los valores que no son posibles

    Histogramas para variables continuasEl rea que hay bajo el histograma entre dos puntos cualesquiera indica la cantidad (porcentaje o frecuencia) de individuos en el intervalo.

  • Diagramas integralesCada uno de los anteriores diagramas tiene su correspondiente diagrama integral. Se realizan a partir de las frecuencias acumuladas. Indican, para cada valor de la variable, la cantidad (frecuencia) de individuos que poseen un valor inferior o igual al mismo. Se pasan de los diferenciales a los integrales por integracin y a la inversa por derivacin (en un sentido ms general del que se ve en bachillerato.)

  • Reduccin de DatosLas tcnicas utilizadas para la descripcin de datos se dividen, bsicamente, en dos bloques:

    Parmetros de centralizacin: Son aquellos cuyo objetivo es explicar mediante un valor numrico, cual es la tendencia mayoritaria de las observaciones de la coleccin de datos que se analizan. Dichos parmetros sern, entre otros, la media, la mediana y la moda.

    Parmetros de dispersin: Corresponden a aquellos parmetros cuyo objetivo es detectar el grado de proximidad de los datos respecto a los valores centrales. Dichos parmetros sern, entre otros, el rango, los cuartiles, la varianza y la desviacin estndar.

  • Reduccin de DatosMedidas de centralizacin

    Las medidas de centralizacin nos sirven para representar el valor medio de los datos, es decir, el valor que refleja el tamao del dato ms esperado. Ello nos indica la posicin en la que se encuentra en el centro de los datos.Media : Es la suma de un conjunto de observaciones dividido por el nmero total de observaciones realizadas.

    Media de la poblacinMedia de la muestra

  • Reduccin de DatosMediana : Es un nmero tal que, si ordenamos los datos de forma creciente o decreciente, cumple la condicin de ser mayor que una mitad y menor que la otra. Es decir, divide a la distribucin en dos partes iguales.

    Ordenamos los datos en orden creciente:

    10 10 12 12 13 14 15 16 16 16 18 20 20 21 22

    Moda : Es el valor que ms veces se repite en la distribucin. Si los datos de la distribucin estn agrupados en intervalos, la moda es el punto medio del intervalo que contiene el mayor nmero de frecuencias. Una distribucin de observaciones puede no tener moda, es decir, puede que no haya ningnvalor de la distribucin que aparezca con ms frecuencia.

    Siguiendo con el ejemplo anterior, agrupamos los datos segn su frecuencia, observamos que la moda ser el 16 que es valor que ms veces se repite.

  • Reduccin de DatosMedidas de dispersin

    Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de tendencia central, necesitamos conocer tambin la dispersin que presentan los datos en su distribucin con referencia a un parametro, con objeto de tener una visin de los mismos ms acorde con la realidad a la hora de describirlos e interpretarlos.

    Recorrido o amplitud: Es la diferencia entre el valor mximo de la distribucin y el valor mnimo.

    Cuartiles: As como la mediana divide a la distribucin en mitades, los cuartiles de una distribucin son los valores que dividen la distribucin en cuartos. El primer cuartil (Q1) deja un cuarto de las observaciones por debajo del mismo, y trescuartos por encima. El segundo cuartil (Q2) tiene dos cuartos por debajo y dos por encima (el segundo cuartil coincide con la mediana). El tercer cuartil (Q3) tiene tres cuartos de las observaciones por debajo y un cuarto por encima.

  • Reduccin de DatosDiagramas de caja

    El diagrama de caja es un grfico simple donde vienen representados los anteriores 5 valores anteriores (mnimo, primer cuartil, mediana (segundo cuartil), tercer cuartil y mximo)

  • Reduccin de DatosVarianza: Se define como la media aritmtica de las desviaciones de los datos observados con respecto a la media, elevadas al cuadrado.Desviacin Estndar: Es la raz cuadrada positiva de la varianza.

  • Reduccin de DatosCoeficiente de variacin: Es la relacin entre la desviacin estndar y la media.

    El coeficiente de variacin es muy til cuando queremos comparar dos o ms medidas de dispersin y stas estn en unidades diferentes o bien estn en las mismas unidades pero sus medias son muy distintas.EJEMPLO

  • Mtodos MultivariadosModelos de Regresin

    Anlisis de la varianza y Diseo de Experimentos

    Mtodos grficos exploratorios. Anlisis en Componentes Principales. Anlisis discriminante. Mtodos de Clasificacin Series temporales