Probabilidad y Estadistica Corte

Post on 05-Jan-2016

15 views 4 download

description

Probabilidad y Estadistica Corte

Transcript of Probabilidad y Estadistica Corte

Describir o pronosticar el comportamiento de la población con base en información obtenida de una muestra representativa de esa población

• Estadística descriptiva

La rama de la estadística que presenta técnicas para describir conjuntos de mediciones.

• Gráficas de barras

• Gráficas de pastel

• Gráficas de líneas presentadas por un candidato político

• Tablas numéricas en el periódico

• Promedio de cantidad de lluvia informado por el pronosticador del clima en la televisión local

• Las gráficas y resúmenes numéricos generados en computadoras son comunes en nuestra comunicación de todos los días

• La estadística descriptiva está formada por procedimientosempleados para resumir y describir las características importantes deun conjunto de mediciones.

• La estadística inferencial

Está formada por procedimientos empleados para hacer inferenciasacerca de características poblacionales, a partir de informacióncontenida en una muestra sacada de esta población.

• El objetivo de la estadística inferencial

es hacer inferencias (es decir, sacar conclusiones, hacer predicciones, tomar decisiones) acerca de las características de una población a partir de información contenida en una muestra.

¿Cómo puede hacer inferencias acerca de una poblaciónutilizando información contenida en una muestra?

1. Especifique las preguntas a contestar e identifique la población de interés.

2. Decida cómo seleccionar la muestra.

3. Seleccione la muestra y analice la información muestral.

4. Use la información del paso 3 para hacer una inferencia acerca de la población.

5. Determine la confiabilidad de la inferencia.

VARIABLES Y DATOS

• Variable

Es una característica que cambia o varía con el tiempo y/o para diferentes personas u objetos bajo consideración.

• Unidad experimental

Es el individuo u objeto en el que se mide una variable.

Resulta una sola medición o datos cuando una variable se mide en realidad en una unidad experimental.

• Población

Es el conjunto de mediciones de interés para el investigador.

• Muestra

Es un subconjunto de mediciones seleccionado de la población de interés.

Estudiante Promedio Genero Año Carrera

1 2.0 F Primero Psicología

2 2.3 F Pasante Matemáticas

3 2.9 M Segundo Ingles

4 2.7 M Primero Ingles

5 2.6 F Graduado Negocios

• Datos univariados

Cuando se mide una sola variable en una sola unidad experimental.

• Datos bivariados

Cuando se miden dos variables en una sola unidad experimental.

• Datos multivariados

Cuando se miden más de dos variables.

TIPOS DE VARIABLES

• Las variables cualitativas

Miden una cualidad o característica en cada unidad experimental.

Género

Especialidad

Afiliación política

Clasificación de gusto: excelente, bueno, regular, malo, Color de un dulce

TIPOS DE VARIABLES

• Las variables cuantitativas

Miden una cantidad numérica en cada unidad experimental.

Producen datos numéricos, por ejemplo estos:

• x = tasa preferencial de interés

• x = número de pasajeros en un vuelo de Los Ángeles a Nueva York

• x = peso de un paquete listo para ser enviado

• x = volumen de jugo de naranja en un vaso

• Variable discreta

Puede tomar sólo un número finito o contable de valores.

• Número de miembros de una familia

• Número de ventas de autos nuevos

• Número de llantas defectuosas devueltas para cambio son todos ellos ejemplos de variables discretas

TIPOS DE VARIABLES

• Variable continua

• Puede tomar infinitamente muchos valores correspondientes a los puntos en un intervalo de recta.

• Pueden tomar valores en cualquier punto a lo largo de un intervalo de recta

• Estatura • Peso • Tiempo• Distancia • Volumen

• Para cualesquier dos valores que se escojan, un tercer valor siempre puede hallarse entre ellos.

TIPOS DE VARIABLES

• Identifique cada una de las siguientes variables como cualitativas o cuantitativas:

1. El uso más frecuente de su horno de microondas (recalentar, descongelar, calentar, otros).

2. El número de consumidores que se niegan a contestar una encuesta por teléfono.

3. La puerta escogida por un ratón en un experimento de laberinto (A, B o C)

4. El tiempo ganador para un caballo que corre en el Derby de Kentucky

5. El número de niños en un grupo de quinto grado que leen al nivel de ese grado o mejor

TIPOS DE VARIABLES

• ¿Por qué deben preocuparse por diferentes clases de variables y los datos que generan?

• La razón es que los métodos empleados para describir conjuntos de datos dependen del tipo de datos que haya recolectado

GRÁFICAS PARA DATOS CATEGÓRICOS

• Una vez recolectados los datos, éstos pueden consolidarse y resumirse para mostrar la siguiente información:

• ¿Qué valores de la variable han sido medidos?

• ¿Con qué frecuencia se presenta cada uno de los valores?

• La frecuencia o número de mediciones en cada categoría

• La frecuencia relativa o proporción de mediciones en cada categoría

• El porcentaje de mediciones en cada categoría

• 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎 =𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎

𝑛

• 𝑃𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒 = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎 ∗ 100

• Las categorías para una variable cualitativa deben escogerse de modo que:

• Una medición pertenecerá a una categoría y sólo a una

• Cada medición tiene una categoría a la que se puede asignar

GRÁFICAS PARA DATOS CATEGÓRICOS

• Gráfica de pastel

Es la conocida gráfica circular que muestra la forma en que están distribuidas las medidas entre las categorías.

Ángulo = Frecuencia relativa X 360°

• Gráfica de barras

Muestra la misma distribución de medidas en categorías, con la altura de la barra midiendo la frecuencia con la que se observa una categoría en particular.

GRÁFICAS PARA DATOS CATEGÓRICOS

GRÁFICAS PARA DATOS CATEGÓRICOS

GRÁFICAS PARA DATOS CATEGÓRICOS

GRÁFICAS PARA DATOS CATEGÓRICOS

GRÁFICAS PARA DATOS CATEGÓRICOS

GRÁFICAS PARA DATOS CATEGÓRICOS

• Gráfica de Pareto

Gráfica de barras en la que las barras están ordenadas de mayor a menor.

GRÁFICAS PARA DATOS CATEGÓRICOS

GRÁFICAS PARA DATOS CUANTITATIVOS

Gráficas de pastel, Gráficas de barras y Gráfica de Pareto

• Gráficas de líneas

Cuando una variable cuantitativa se registra en el tiempo a intervalosigualmente espaciados (por ejemplo diario, semanal, mensual,trimestral o anual), el conjunto de datos forma una serie de tiempo.

La idea es tratar de distinguir un patrón o tendencia que sea probablede continuar en el futuro y luego usar ese patrón para hacerpredicciones precisas para el futuro inmediato.

GRÁFICAS PARA DATOS CUANTITATIVOS

• Gráficas de líneas

GRÁFICAS PARA DATOS CUANTITATIVOS

• Gráficas de puntos

GRÁFICAS PARA DATOS CUANTITATIVOS

• Gráficas de tallo y hoja

GRÁFICAS PARA DATOS CUANTITATIVOS

• Gráficas de tallo y hoja

GRÁFICAS PARA DATOS CUANTITATIVOS

• Gráficas de tallo y hoja

GRÁFICAS PARA DATOS CUANTITATIVOS

• Gráficas de tallo y hoja

GRÁFICAS PARA DATOS CUANTITATIVOS

Interpretación de gráficas con ojo crítico

Una vez creada una gráfica o gráficas, para un conjunto de datos, ¿qué se debe buscar al tratar de describir los datos?

1. Verificar las escalas horizontales y verticales, de manera que haya claridad respecto a lo que se mide.

2. Examinar el lugar de la distribución de datos. ¿Dónde está el centro de distribución del eje horizontal? Si se comparan dos distribuciones, ¿están centradas en el mismo lugar?

Interpretación de gráficas con ojo crítico

3. Examinar la forma de la distribución.

• ¿La distribución tiene un “pico”, un punto que es más alto que cualquier otro?

• ¿Hay más de un pico?

• ¿Hay un número aproximadamente igual de mediciones a la izquierda y derecha del pico?

4. Buscar cualesquiera mediciones poco comunes o resultados atípicos.• ¿Hay mediciones mucho mayores o menores que todas las otras?

DISTRIBUCIONES SEGÚN SUS FORMAS• Distribución simétrica

si los lados izquierdo y derecho de la distribución, cuando se divide en el valor medio, forman imágenes espejo.

• Distribución está sesgada a la derecha si una proporción más grande de las mediciones se encuentra a la derecha del valor pico. Las distribuciones sesgadas a la derecha contienen pocas mediciones anormalmente grandes.

• Distribución está sesgada a la izquierda si una proporción mayor de las mediciones está a la izquierda del valor pico. Las distribuciones sesgadas a la izquierda contienen pocas mediciones anormalmente grandes.

• Distribución unimodal si tiene un pico

• Distribución bimodal tiene dos picos. Las distribuciones bimodales representan a veces una combinación de dos poblaciones diferentes del conjunto de datos.

DISTRIBUCIONES SEGÚN SUS FORMAS

DISTRIBUCIONES SEGÚN SUS FORMAS

HISTOGRAMAS DE FRECUENCIA RELATIVA

Para un conjunto de datos cuantitativo es una gráfica de barras en la que la altura de la barra muestra “con qué frecuencia” (medida como proporción o frecuencia relativa) las mediciones caen en una clase o subintervalo particular.

Las clases o subintervalos se grafican a lo largo del eje horizontal.

HISTOGRAMAS DE FRECUENCIA RELATIVA

HISTOGRAMAS DE FRECUENCIA RELATIVA

HISTOGRAMAS DE FRECUENCIA RELATIVA

HISTOGRAMAS DE FRECUENCIA RELATIVA

HISTOGRAMAS DE FRECUENCIA RELATIVA

HISTOGRAMAS DE FRECUENCIA RELATIVA

HISTOGRAMAS DE FRECUENCIA RELATIVA

¿Cómo construyo un histograma de frecuencia relativa?

1. Escoja el número de clases, por lo general entre 5 y 12. Cuantos más datos se tengan, más clases deben usarse.

2. Calcule el ancho aproximado de clase al dividir la diferencia entre los valores máximo y mínimo entre el número de clases.

3. Redondee el ancho aproximado de clase hasta un número cómodo.

4. Si los datos son discretos, se puede asignar una clase para cada valor entero tomado por los datos. Para un número grande de valores enteros, puede que sea necesario agruparlos en clases.

HISTOGRAMAS DE FRECUENCIA RELATIVA

¿Cómo construyo un histograma de frecuencia relativa?

5. Localice las fronteras de clase. La clase más baja puede incluir la medición más pequeña. A continuación sume las clases restantes usando el método de inclusión izquierda.

6. Construya una tabla estadística que contenga las clases, sus frecuencias y sus frecuencias relativas.

7. Construya un histograma como una barra de gráfi cas, grafi cando intervalos de clase en el eje horizontal y frecuencias relativas como las alturas de las barras.

MEDIDAS DE CENTRO

Una de las primeras mediciones numéricas importantes es una medida de centro, es decir, una medida a lo largo del eje horizontal que localiza el centro de la distribución

LA MEDIA ARITMÉTICA O PROMEDIO

La media aritmética o promedio de un conjunto de n mediciones es igual a la suma de las mediciones dividida entre n.

𝑥 = 𝑀𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚𝑒𝑡𝑖𝑐𝑎 𝑜 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙𝜇 = 𝑀𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚𝑒𝑡𝑖𝑐𝑎 𝑜 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙

LA MEDIA ARITMÉTICA O PROMEDIO

MEDIANA

La mediana m de un conjunto de n mediciones es el valor de x que cae en la posición media cuando las mediciones son ordenadas de menor a mayor.

Encuentre la mediana para el conjunto de mediciones 2, 9, 11, 5, 6.

Encuentre la mediana para el conjunto de mediciones 2, 9, 11, 5, 6, 27

El valor 0.5(n + 1) indica la posición de la mediana del conjunto ordenado de datos. Si la posición de la media es un número que termina en el valor .5, usted necesita promediar los dos valores adyacentes.

Cuando un conjunto de datos tiene valores extremadamente pequeñosu observaciones muy grandes, la media muestral se traza hacia ladirección de las mediciones extremas

MEDIDAS DE CENTRO

La moda es la categoría que se presenta con más frecuencia o el valorde x que se presenta con más frecuencia.

Cuando las mediciones en una variable continua se han agrupado comohistograma de frecuencia o de frecuencia relativa, la clase con el picomás alto o frecuencia se llama clase modal, y el punto medio de esaclase se toma como la moda.

La moda por lo general se usa para describir conjuntos grandes dedatos, mientras que la media y la mediana se usan para conjuntos dedatos grandes y pequeños.

MODA

MODA

MEDIDAS DE VARIABILIDAD

RANGO

El rango R, de un conjunto de n mediciones sedefine como la diferencia entre la medición másgrande y la más pequeña.

RANGO

RANGO

• ¿Hay una medida de variabilidad que sea más sensible que el rango?

•Considere, como ejemplo, las mediciones muestrales5, 7, 1, 2, 4,

RANGO

VARIANZA DE UNA POBLACION

La varianza de una población de N mediciones es el promedio de los cuadrados de las desviaciones de las mediciones alrededor de su media µ.

𝑠2 para una varianza muestral y 𝜎2 para una varianza de población

La varianza poblacional se denota con 𝜎2 y está dada por la fórmula

VARIANZA DE UNA MUESTRA

La varianza de una muestra de n mediciones es la suma de las desviaciones cuadradas de las mediciones alrededor la media 𝑥 dividida entre (n - 1).

La varianza muestral se denota con 𝑠2 y está dada por la fórmula

VARIANZA DE UNA MUESTRA

DESVIACIÓN ESTÁNDAR

La desviación estándar de un conjunto de mediciones es igual a la raíz cuadrada positiva de la varianza.

FÓRMULA COMPUTACIONAL PARA CALCULAR s2

CALCULAR LA VARIANZA Y DESVIACIÓN ESTÁNDAR

VARIANZA Y DESVIACIÓN ESTÁNDAR

SOBRE LA SIGNIFICANCIA PRÁCTICA DE LA DESVIACIÓN ESTÁNDAR

Teorema de Chebyshev

Dado un número k mayor o igual a 1 y un conjunto de n mediciones, almenos [1 (1/k2)] de las mediciones estarán dentro de k desviacionesestándar de su media.

SOBRE LA SIGNIFICANCIA PRÁCTICA DE LA DESVIACIÓN ESTÁNDAR

SOBRE LA SIGNIFICANCIA PRÁCTICA DE LA DESVIACIÓN ESTÁNDAR

SOBRE LA SIGNIFICANCIA PRÁCTICA DE LA DESVIACIÓN ESTÁNDAR

SOBRE LA SIGNIFICANCIA PRÁCTICA DE LA DESVIACIÓN ESTÁNDAR

Otra regla para describir la variabilidad de unconjunto de datos no funciona para todos losconjuntos de datos, pero funciona muy bienpara datos que “se apilan” en la conocida formade montículo

SOBRE LA SIGNIFICANCIA PRÁCTICA DE LA DESVIACIÓN ESTÁNDAR

SOBRE LA SIGNIFICANCIA PRÁCTICA DE LA DESVIACIÓN ESTÁNDAR

SOBRE LA SIGNIFICANCIA PRÁCTICA DE LA DESVIACIÓN ESTÁNDAR

SOBRE LA SIGNIFICANCIA PRÁCTICA DE LA DESVIACIÓN ESTÁNDAR

MEDICIONES DE POSICIÓN RELATIVA

El puntaje z muestral es una medida de posición relativa definido

MEDICIONES DE POSICIÓN RELATIVA

MEDICIONES DE POSICIÓN RELATIVA

MEDICIONES DE POSICIÓN RELATIVA

MEDICIONES DE POSICIÓN RELATIVA

MEDICIONES DE POSICIÓN RELATIVA

MEDICIONES DE POSICIÓN RELATIVA

MEDICIONES DE POSICIÓN RELATIVA

MEDICIONES DE POSICIÓN RELATIVA

MEDICIONES DE POSICIÓN RELATIVA

MEDICIONES DE POSICIÓN RELATIVA

MEDICIONES DE POSICIÓN RELATIVA

GRAFICA DE CAJA

GRAFICA DE CAJA

GRAFICA DE CAJA

GRAFICA DE CAJA

GRAFICA DE CAJA

GRAFICA DE CAJA