1ra Clase de Curso ESTADISTICA

38
¿Qué es la Estadística?

Transcript of 1ra Clase de Curso ESTADISTICA

¿Qué es la Estadística?

Se entiende por estadística..

• Se refiere a información numérica.Ejemplo: 1. El salario inicial promedio de los egresados de

una licenciatura2. El numero promedio de automóviles Ford

vendidos mensualmente en el año pasado en la agencia Kistler de autos Ford.

3. El porcentaje de estudiantes de Harvard que terminaran su educación a nivel licenciatura.

• En los ejemplos anteriores una “estadística” es un numero o un porcentaje.

• Las estadísticas pueden presentarse gráficamente o en forma de enunciado.

• Volumen de ventas y participación en el mercado de Frito-Lay, respecto a los principales tipos de frituras en los supermercados de EEUU.

64%

75%

26%

56%

82%

Frituras de Papa

Totopos

Pretzels

Frituras diversas

Frituras de Maíz

0 100 200 300 400 500 600 700 800

La estadística se define como:• La ciencia que se ocupa de recolectar,

organizar, presentar, analizar e interpretar datos para ayudar a una toma de decisiones mas efectiva.

• Solo hasta que los datos hayan sido organizados es posible analizarlos e interpretarlos.

Ejemplos: Los Análisis de investigaciones de la empresa Merrill

Lynch evalúan muchas facetas de una determinada acción antes de elaborar una recomendación de “compra” o de “venta”.

El departamento de mercadotecnia en Lever Brothers, compañía productora de artículos de jabón, tiene la responsabilidad de presentar recomendaciones acerca de la rentabilidad potencial de un nuevo grupo de jabones faciales recién desarrollados con olor a frutas, como uva, naranja,y piña.

El gobierno de EEUU están interesados en las condiciones actuales de su economía y en la predicción de las tendencias económicas futuras.

¿Por qué Estudiar Estadística?• La primera razón es que en todos lados encontramos

información numérica. Presentamos Algunos Ejemplo: o La empresa General Electric reporto que en 1999 sus

ganancias fueron de $111 630 000 (dólares), mayores que los $100 469 000 que obtuvo en 1998. El precio de cierre al final de 1999 de una acción de títulos comunitarios fue $154.45, superior al de $102.00 que tenia la acción al final de 1998.

o Los egresados de Posgrado del programa de Maestría en Admisión de Empresas en la Universidad del Notre Dame, contaron con un sueldo promedio inicial de $54 000 dólares y 91% de ellos consiguieron trabajo a los tres meses de la graduación.

• ¿cómo podemos determinar si las conclusiones presentadas son razonables? ¿acaso las muestras fueron suficientemente grandes? ¿cómo se seleccionaron las unidades de la muestra?

Se necesita poder leer diagramas y graficas, y entender el análisis de la información numérica

• La segunda razón para tomar un curso de estadística es que las técnicas estadísticas se utilizan para tomar decisiones que afectan nuestra vida diaria. Ejemplo:

Las compañías de seguros utilizan análisis estadísticos para establecer las tarifas de los seguros de casa, automóvil, la vida y salud. Existen tablas que indican la probabilidad de que una mujer de 25 años de edad viva un año mas, cinco a mas, etc. Las primas de los seguros de vida se establecen basándose en estas probabilidades.

La Agencia de Protección al Medio Ambiente (en EUA) esta interesada en la calidad del agua en el Lago Erie. Periódicamente toman muestras del Liquido para establecer el nivel de contaminación y mantener el nivel de calidad.

Los investigadores médicos estudian las tasas de curación de enfermedades, basándose en el uso de diferentes medicamentos y distintas formas de tratamiento. Por ejemplo, ¿cuál es el efecto de tratar cierto tipo de daño la rodilla con cirugía o con terapia física? Si uno toma una aspirina diaria, ¿ esto reducirá el riesgo de sufrir un ataque cardiaco?.

• La tercera razón para tomar un curso de estadística es que el conocimiento de los métodos estadísticos ayuda a entender porque se toman ciertas decisiones, y aporta una mejor comprensión

respecto a la forma en la que nos afectan las decisiones. • Para poder tomar una decisión basada en la información:

1. Determinar si la información existente es adecuada o si se requiere información adicional.

2. Reunir información adicional, si es necesario, de tal forma que no haya resultados erróneos.

3. Resumir la información de modo útil e informativo.

4. Analizar la información disponible.

5. Sacar las conclusiones y realizar las inferencias, al tiempo que se evalúa el riesgo de llegar a una conclusión incorrecta.

• En resumen, existen por lo menos tres razones para estudiar: (1) los datos se encuentran en todos lados, (2) las técnicas estadísticas se utilizan para la toma de muchas decisiones que afectan nuestra vida,y (3) sin importar su línea de trabajo futura, usted tendrá que tomar decisiones que involucran datos

Tipos de estadística

• Estadística Descriptiva:Conjunto de métodos para organizar,

resumir y presentar los datos de manera informativa.

• Ejemplo: cuando el gobierno de EEUU reporta que la población de ese país era de 179 323 000 en 1960; 203 302 000 en 1970; 226 542 000 en 1990 y 265 000 000 en 2000.

• En EEUU hay 42 796 millas de carreteras interestatales. El sistema interestatal representa solo 1% de las carreteras del país, pero transporta 20% de todo el trafico. La carretera interestatal mas larga es la I-90 en la ciudad de Nueva York, que mide 70 millas. Alaska no tiene carreteras interestatales. Texas posee el mayor numero: 28 carreteras interestatales.

Estadística inferencial• También denominada inferencia estadística y

estadística inductiva. Por ejemplo, con fundamento en la encuesta realizada por el gobierno federal y publicada en el periodo con USA Today, solamente 46% de alumnos en el último grado de la educación media superior pueden resolver problemas relacionados con fracciones, decimales y porcentajes. Además, solo 77% de los mismos alumnos evaluaron correctamente el costo de la sopa, estas son inferencias relativas a la población.

• Estadística inderencial.- Conjunto de métodos utilizados para saber algo acerca de una población, basándose en una muestra.

• Población.- Conjunto de toda los posible individuos, objetos o medidas de interés.

• Muestra.- Una porción, o parte, de la población de interés.

Tipos de Variables• Existen dos tipos básicos de datos: (1) los

obtenidos a partir de una población cualitativa,y (2) los que resultan de una población cuantitativa. Cuando la características o variable en estudios es no numérica, se la denomina variable cualitativa o atributo. Ejemplos de estas variables son:genero sexual, religión, tipo automóvil, estado o lugar de nacimiento, y color de los ojos de la persona.

• Se denomina Variable cuantitativa, y la población se conoce como población cuantitativa. Ejemplos de variables cuantitativa son : el saldo en una cuenta de cheques, la edad de los presidentes de compañías, la duración de una acumulador de automóvil (42 meses), las velocidades de los vehículos que circulan por la carretera interestatal 5, cerca de Seattle, o bien el hijos es una familia.

• Las variables cuantitativas pueden ser discretas o continuas. Las Variables Discretas pueden asumir solo ciertos valores, y generalmente existen “brechas” o “Huecos” entre ellos. Ejemplos de variables discretas son : el numero de recamaras en una casa (1,2,3,4, etc), la cantidad de automóviles que pasan por la caseta de cobro en la carretera I-75 en Berea, Kentucky, en una hora (16,19,30, etc), y el numero de estudiantes en casa grupo del curso de estadística (25 en grupo A, 42 en grupo B, y 18 en el grupo C).Se cuenta el numero de automóviles que llegan a Berea en la carretera interestatal 75, y se evalúa la cantidad de estudiantes de estadística en cada grupo, Notese que una casa puede tener 3 o 4 recamaras, pero no 3.56 dormitorios. Por tanto, existe una “Brecha” entre los posibles valores. Por lo común, las variables discretas son resultados de un conteo.

• Las Observaciones de una Variable continua pueden tomar cualquier valor dentro de un intervalo determinado. Ejemplos de variables continuas son: la presión del aire en un neumático de automóvil y el peso de un cargamento de granos (que según la precisión de las basculas podría se igual a 15.0, 15.01, 15.013 toneladas, etc). La cantidad de cereal en una caja y el tiempo de vuelo para transportarlo por vía aérea desde Orlando hasta San Diego, son otras variables de índole continua. El vuelo de Orlando a San Diego puede tomar 7 horas y 30 minutos, o 7 horas con 30 minutos y 45 segundos, o bien 7 horas con 30 minutos y 45.1 segundos, dependiendo de la precisión cronométrica. Las variables continuas resultan generalmente de medir algo.

Niveles de Medición

• Los datos pueden clasificarse de acuerdo a los niveles de medición. Generalmente, el nivel de medición de un dato determina los cálculos que se pueden realizar para resumir `y presentar la información, y las pruebas estadísticas que pueden desarrollarse.

• Ejemplo, hay seis colores de dulces en una bolsa de lunetas M y M. Supongamos que al color café le asignamos el valor 1, al amarillo el 2, al azul 3, al naranja 4, al verde 5, y al rojo 6 . Para una bolsa de lunetas se suman los valores asignados a los colores, y el resultado se divide entre el numero de dulce, resultado que el color medio es 3.56.

• ¿esto significa que el color promedio es azul o naranja? Como segundo ejemplo tenemos una competencia de carreras en la pista de una escuela. Hay 8 competidores en la carrera de los 400 metros. Se reporta el orden de llegada y se indica que el valor promedio en el orden citado es 4.5. ¿qué indica este valor promedio en el orden de llegada? En Ambos casos, el nivel de medición no se utiliza en la forma adecuada.

• Existen cuatro niveles de medición: nominal, ordinal, de intervalo y de razón. El nivel” mas bajo”, o mas Primitivo , es el nominal. El mas alto, o el que proporciona la mayor cantidad de información acerca de la observación, es el nivel de medición de razón.

Datos de nivel Nominal• En el Nivel Nominal de la medición, las observaciones solamente se

pueden clasificar o contar. No existe algún orden especifico entre las clases. Un ejemplo del nivel nominal de medición es la clasificación en seis colores de las lunetas M y M. Simplemente se clasifican las lunetas según el color. No hay un orden natural; otro ejemplo,tabla 1.1

• Característica principal del nivel nominal de medición: no hay un orden especifico entre las categorías.

AT&T

MCI

Sprint

Otros

Total

108 115 800

20 577 310

8 238 740

7 130 620

144 062 470

75

14

6

5

100

Compañía Numero de llamadas Porcentaje

Uso de la telefónica de larga distancia según el proveedor de servicio.

• Tales categorías son mutuamente excluyentes, lo cual quiere decir que , por ejemplo, una llamada es especial no puede iniciarse tanto en AT&t como en MCI

Mutuamente excluyente Propiedad de un conjunto de categoría, implica que una persona, objeto o medición se ha de incluir en solo una categoría.

• Las categorías en la tabla 1.1 también son exhaustivas, lo que significa que cada miembro de la población, o de la muestra, debe aparecer solo en una de las categorías. Por tanto, si la llamada no se origino en ATT&T, MCI o Sprint, entra en la categoría “ Otras”

Exhaustivo Propiedad de un conjunto de categorías que implica que cada individuo, objeto o medición debe aparecer en una sola categoría.

• Los datos de Nivel Nominal tienen las Siguientes Propiedades:

1. Las categorías para los datos son mutuamente excluyentes y exhaustivas.

2. Las categorías para los datos no tienen un orden lógico.

Datos de Nivel ordinal• El siguiente nivel de datos es el nivel

ordinal. La tabla presenta las calificaciones dadas por los estudiantes al profesor James Brunner en un curso de “ introducción a las Finanzas” Clasificación Frecuencia

Excelente

Bueno

Regular

Malo

Muy Malo

6

28

25

12

3Clasificación de un profesor de finanzas

• En resumen, las propiedades del nivel de datos ordinal son:

1. Las categorías para los datos son mutuamente excluyentes y exhaustivas.

2. Dichas categorías para los datos se clasifican por intervalos, o se ordenan de acuerdo con las características particulares que poseen.

Datos de nivel de intervalo• El nivel de intervalo de la medición es el

siguiente nivel en orden ascendente. Incluye todas las características del nivel ordinal pero, además, la diferencia entre los valores tiene un tamaño constante.

Ejemplo

• Supóngase que las temperaturas mas altas en tres días consecutivos de invierno en la ciudad de Boston son 28,31 y 20 grados Fahrenheit(ºF). Estas temperaturas suelen ordenarse fácilmente, pero también se puede determinar la diferencia entre las mismas. Esto es posible gracias a que un “ grado Fahrenheit” representa una unidad constante de medición.

• Las propiedades de la escala de intervalo son :

1. Las categorías para los datos son mutuamente excluyentes y exhaustivas.

2. Las categorías en cuestión están ordenadas de acuerdo con la cantidad de la característica que poseen.

3. Diferencias iguales en la característica se representan por diferencias iguales en la medición.

Datos de Nivel Razon

• El nivel razón es el nivel de medición “ mas alto”. Esta medida tiene todas las características del nivel de intervalo, pero además el punto 0 si tiene significado, y la razón( o Cociente) entre dos números también es significativa.

• Las Propiedades del nivel de razón de los datos son:

1. Las categorías para los datos son mutuamente excluyentes y exhaustivas.

2. Las categorías en cuestión están ordenadas de acuerdo con la cantidad de la característica que poseen.

3. Diferencias iguales en las característica están representadas por diferencias iguales en los números que se han asignado a las categorías mencionadas.

4. El punto( o valor) 0 representa la ausencia de la característica.

• El Grafico representa el uso de la escala de medición de razón. Se indican los ingresos de cuatro combinaciones de padre e hijos.

Jimenez

Blanco

Ruiz

sanchez

80 000

90 000

60 000

75 000

40 000

30 000

120 000

130 000

Nombre de la familia Ingresos del padre Ingresos del Hijo

Observe que en la familia Jiménez el padre gana el doble de lo q gana su hijo. En la familia Ruiz el ingreso del hijo es el doble del ingreso del padre.

• El diagrama presenta las características principales de los diferentes niveles de medición.

Niveles de datos

Nominal Ordinal De intervalo De razón

Solo clasifican los datos

Ordena los datos por jerarquías

Las diferencias entre los valores tienen significado

El 0 y el cociente entre valores tienen significado

•Numero en la camiseta de un jugador

•Marca de un automóvil

•Calificación de un estudiando en su clase

•Posición del equipo en PAC 10

•Temperatura•Numero de pacientes atendidos

•Números de llamadas de ventas realizadas

•Distancia a la escuela