A0175 Estadistica I MAU01

100
ESTADÍSTICA I Claudio Álvaro Cerrón Landeo

description

f

Transcript of A0175 Estadistica I MAU01

Page 1: A0175 Estadistica I MAU01

ESTADÍSTICA I

Claudio Álvaro Cerrón Landeo

Page 2: A0175 Estadistica I MAU01

Cada autor es responsable del contenido de su propio texto.

De esta edición:

© Universidad Continental S.A.C 2013

Jr. Junin 355, Miraflores, Lima-18

Teléfono: 213 2760

Derechos reservados

Primera Edición: Setiembre 2013

Tiraje: 1000 ejemplares

Autor:

Claudio Alvaro Cerrón Landeo

Impreso en el Perú - Printed in Perú

Fondo Editorial de la Universidad Continental

Impreso en los Talleres Gráficos:

Xprinted Solución Gráfica S.R.L.

Todos los derechos reservados.

Esta publicación no puede ser reproducida, en todo ni en parte, ni registrada en o trasmitida por un sistema de recuperación de información, en ninguna forma ni por ningún medio sea mecánico, fotoquímico, electrónico, magnético, electroóptico, por fotocopia, o cualquier otro sin el permiso previo por escrito de la Universidad.

Page 3: A0175 Estadistica I MAU01

IINTRODUCCIÓN

PRESENTACIÓN DE LA ASIGNATURA 9

COMPETENCIA DE LA ASIGNATURA 9

UNIDADES DIDÁCTICAS 9

TIEMPO MÍNIMO DE ESTUDIO 9

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS 11

DIAGRAMA DE PRESENTACIÓN DE LA UNIDAD I 11

ORGANIZACIÓN DE LOS APRENDIZAJES 11

TEMA N°1: INTRODUCCIÓN 12

1 Ramas y objetivos de la Estadística 12

2 Fuentes de recolección de datos 14

3 Definiciones básicas 19

TEMA N° 02: RESUMEN Y GRÁFICA DE DATOS 21

1 Construcción de tableros de frecuencias cualitativos y cuantitativos 21

2 Tipos de gráficos estadísticos. Lectura y análisis 24

LECTURA SELECCIONADA Nº 1 31Seis grados de Kevin Bacon: ¿el estudio original utilizó buenos datos?

ACTIVIDAD N° 1 31

GLOSARIO 32

BIBLIOGRAFÍA DE LA UNIDAD I 32

AUTOEVALUACIÓN DE LA UNIDAD I 33

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS. INDICADORES ESTADÍSTICOS 35

DIAGRAMA DE PRESENTACIÓN DE LA UNIDAD II 35

ORGANIZACIÓN DE LOS APRENDIZAJES 35

TEMA N°1: MEDIDAS DE TENDENCIA CENTRAL 36

1 Media 36

2 Mediana 39

3 Moda 43

TEMA N° 2: MEDIDAS DE DISPERSIÓN 46

1 Rango o recorrido 46

ÍNDICE

Page 4: A0175 Estadistica I MAU01

2 Recorrido semi intercuartil 46

3 Desviación media 47

4 Varianza 47

5 Desviación típica o estándar 51

6 Coeficiente de variabilidad 53

TEMA N° 3: MEDIDAS DE POSICIÓN, ASIMETRÍA Y CURTOSIS 54

1 Cuantiles 54

2 Medidas de Curtosis 57

3 Medidas de Asimetría 58

LECTURA SELECCIONADA Nº 2 60¿Los premios de la Academia discriminan por la edad?

ACTIVIDAD N° 2 61

GLOSARIO 62

BIBLIOGRAFÍA DE LA UNIDAD II 62

AUTOEVALUACIÓN DE LA UNIDAD II 62

UNIDAD III: PROBABILIDAD 65

DIAGRAMA DE PRESENTACIÓN DE LA UNIDAD III 65

ORGANIZACIÓN DE LOS APRENDIZAJES 65

TEMA N°1: FUNDAMENTOS DE PROBABILIDAD Y REGLAS BÁSICAS 66

1 Definiciones básicas, sucesos y probabilidades 66

2 Regla de la suma y multiplicación 69

TEMA N°2: PROBABILIDAD TOTAL Y TEOREMA DE BAYES 72

1 Teorema de la probabilidad total 73

2 Teorema de Bayes 73

TEMA N°3: TÉCNICAS DE CONTEO 76

1 Técnicas de conteo 76

2 Combinaciones y permutaciones 77

LECTURA SELECCIONADA Nº 2 77¿Debe preocuparse de que le realicen una prueba de detección de drogas cuando solicite untrabajo? Estadística. Mario Triola. Pág. 137

ACTIVIDAD N° 3 77

GLOSARIO 78

Page 5: A0175 Estadistica I MAU01

BIBLIOGRAFÍA DE LA UNIDAD III 79

AUTOEVALUACIÓN DE LA UNIDAD III 79

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD 82

DIAGRAMA DE PRESENTACIÓN DE LA UNIDAD IV 82

ORGANIZACIÓN DE LOS APRENDIZAJES 82

TEMA Nº 1: DISTRIBUCIONES DE PROBABILIDAD DISCRETA 83

1 Variables aleatorias 83

2 Distribución de probabilidad binomial 86

3 Distribución de probabilidad hipergeométrica 87

4 Distribución de probabilidad de Poisson 87

TEMA Nº 2: DISTRIBUCIONES DE PROBABILIDAD NORMAL 88

1 Distribución normal estándar. Valor crítico z 89

2 Aplicaciones de la distribución normal estándar 92

Tablas de Distribución Normal 95

LECTURA SELECCIONADA Nº 4 96¿Los métodos estadísticos pueden demostrar que el proceso de selección de un jurado es discriminatorio?

ACTIVIDAD N° 4 96

GLOSARIO 97

BIBLIOGRAFÍA DE LA UNIDAD IV 98

AUTOEVALUACIÓN DE LA UNIDAD IV 98

ANEXO 99

Page 6: A0175 Estadistica I MAU01
Page 7: A0175 Estadistica I MAU01

Cuando escuchamos el término ESTADÍSTICA lo re-

lacionamos frecuentemente con el término datos

o datos individuales y porcentajes o cualquier infor-

mación relacionada con ellos. Sin embargo la ESTADÍSTICA

es más que eso, no es sólo una serie de datos o un gráfico

estadístico, involucra varias etapas que son materia de estudio

del presente manual autoformativo.

Podemos decir que la función principal de la estadística es jus-

tamente la recolección y agrupamiento de datos de diverso

tipo para construir con ellos informes estadísticos que nos den

idea sobre diferentes y muy variados temas, siempre desde un

punto de vista cuantitativo y no cualitativo. Esto es muy im-

portante remarcarlo ya que la estadística se convierte enton-

ces en una ciencia que nos habla de cantidades (por ejemplo,

cuántas personas viven en un país por metro cuadrado) pero

no nos da información directa sobre la calidad de vida de esas

personas.

Este análisis numérico que se realiza con los datos es muy im-

portante puesto que con ello fundamentaremos nuestra toma

de decisiones, desde una simple actividad diaria de alguna

persona hasta una complicada gestión en alguna empresa,

en cualquier campo de acción. Es por ello que se requiere

del conocimiento para poder disponer de datos apropiados,

suficientes, oportunos y de buena calidad así como manejar

una buena metodología y manejo de procesos que nos per-

mitan alcanzar el conocimiento deseado acerca de la realidad

para realizar una buena toma de decisiones. No hay que dejar

de ver que la ESTADÍSTICA al brindar apoyo a otras ciencias

requiere del buen manejo de procesos dirigidos a la toma y

análisis de datos asociándolos con el buen manejo del cálculo

de las probabilidades y con ciertos niveles de confiabilidad en

la toma de decisiones.

El presente Manual Autoformativo de ESTADÍSTICA I está

diseñado para que el lector pueda adquirir los conocimientos

necesarios para poder ejecutar los procesos relacionados con

la descripción y análisis de datos (ESTADÍSTICA DESCRIP-

TIVA) y el cálculo de probabilidades, utilizando con total

autonomía los conceptos, características y ejemplos sobre el

RESUMEN y Gráfica de datos descritos en la Primera Unidad;

Análisis Exploratorio de datos e Indicadores Estadísticos des-

critos en la Segunda Unidad; Probabilidad descrita en la ter-

cera Unidad y Distribuciones de Probabilidad descritas en la

Cuarta Unidad; complementadas en cada unidad con lecturas

seleccionadas, actividades y autoevaluaciones del aprendizaje.

Agradecemos a quienes de antemano tuvieron paciencia y

comprensión en la elaboración del presente manual y a aque-

llos alumnos con quienes pudimos optimizar el uso de la infor-

mación presente en esta PRIMERA EDICIÓN.

INTRODUCCIÓN

Page 8: A0175 Estadistica I MAU01
Page 9: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 9

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

COMPETENCIA DE LA ASIGNATURA

Conoce, aplica, analiza e interpreta eficientemente métodos y técnicas de estadística descriptiva y teoría de probabilidades para la toma de decisiones, valorando reflexi-vamente su importancia como herramienta en los diversos campos de la ciencia, demostrando ética en el manejo de la información.

UNIDADES DIDÁCTICAS

UNIDAD I UNIDAD II UNIDAD III UNIDAD IV

Introducción, RESUMEN y Gráfica de Datos.

Análisis Explorato-rio de Datos. Indica-dores Estadísticos.

Probabilidad. Distribuciones De Probabilidad.

TIEMPO MÍNIMO DE ESTUDIO

UNIDAD I UNIDAD II UNIDAD III UNIDAD IV

1a y 2a Semana

16 horas

3a y 4a Semana

16 horas

5a y 6a Semana

16 horas

7a y 8a Semana

16 horas

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

PRESENTACIÓN DE LA ASIGNATURA

Page 10: A0175 Estadistica I MAU01
Page 11: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 11

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

DIAGRAMA DE PRESENTACIÓN DE LA UNIDAD I

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

ORGANIZACIÓN DE LOS APRENDIZAJES

CONOCIMIENTOS PROCEDIMIENTOS ACTITUDES

Tema Nº 1: Introducción1 Ramas y Objetivos de la

Estadística. 2 Fuentes de recolección de

datos. 3 Definiciones básicas.

Lectura Seleccionada N° 01: Kresalja J. Baldo. El principio de subsidiariedad en materia económica. Análisis de las Constituciones de 1979 y 1993. Palestra. Lima. 2010. pp. 185-199..

Tema Nº 2: RESUMEN y Gráfica de Datos 1 Construcción de tableros

de frecuencias cualitativos y cuantitativos.

2 Tipos de gráficos estadísti-cos. Lectura y análisis.

Autoevaluación Nº 1

1. Define los conceptos bási-cos de Estadística.

2. Identifica y utiliza los méto-dos y las fuentes de recolec-ción de datos.

3. Identifica tipos de datos.

Actividad N° 1:Construye un organizador de conocimiento sobre el tema.

4. Construye tableros de fre-cuencia,

5. Describe, explora y compa-ra diferentes características de un conjunto de datos.

Actividad N° 2:Construye y analiza gráficos y tableros de frecuencia.

Control de Lectura N° 1:

1. Valora de manera reflexiva la importancia de la Estadística Descriptiva en todo campo de la ciencia.

CONTENIDOS

AUTOEVALUACIÓN

EJEMPLOS

BIBLIOGRAFÍA

ACTIVIDADES

Page 12: A0175 Estadistica I MAU01

12

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS

TEMA 1: INTRODUCCIÓN

Estimado alumno, en este tema conoceremos los conceptos básicos de la Estadística que nos permitirán diferenciar las fuentes de recolección de datos así como definir el tipo de estadística que estamos aplicando, sobre todo definir la variable y el tipo de variable que estás estudiando; del mismo modo es importante que diferencies lo que es paráme-tro y estadígrafo sobre todo cuáles son y para qué tipo de variables se aplican. Detalles que son sumamente importantes al momento de plantear un estudio de investigación estadística

1 RAMAS Y OBJETIVOS DE LA ESTADÍSTICA

1.1 DEFINICIÓN

Definir la estadística es una tarea difícil porque tendríamos que definir cada una de las técnicas que se emplean en los diferentes campos en los que inter-viene. Sin embargo, diremos, en forma general, que:

“La ESTADÍSTICA es la ciencia que le facilita al hombre el estudio de datos masivos, proporcionando un conjunto de métodos científicos para recolectar, resumir, clasificar, analizar e interpretar el comportamiento de los datos con respecto a una característica, materia de estudio o investigación, pasa de esa manera a sacar conclusiones valederas y efectuar predicciones razonables de ellos y así mostrar una visión de conjunto clara y de más fácil apreciación con respecto a la fuente de información que nos permiten tomar decisiones óptimas en casos de incertidumbre”

Estadística: Etimológicamente

El origen etimológico de la palabra “estadística” no está bien determinado, puesto que existen distintas opiniones y referencias. Para algunos viene de la voz griega STATERA que significa “balanza”, otros sostienen que deriva del la-tín STATUS que significa “situación” mientras que algunos autores afirman que procede del alemán STAAT que significa “estado” pues era función principal de los gobiernos de los estados establecer registros de población , nacimientos, defunciones, etc.

1.2 RAMAS DE LA ESTADÍSTICA

La estadística se divide en dos ramas que no son independientes; por el con-trario, son complementarias y entre ambas dan la suficiente ilustración sobre una posible realidad futura, con el fin de que quien tenga poder de decisión, tome las medidas necesarias para transformar ese futuro o para mantener las condiciones existentes.

En atención a su metodología, por sus procedimientos y alcances bien defini-dos, la ciencia estadística se clasifica en:

1.2 .1 ESTADÍSTICA DESCRIPTIVA O DEDUCTIVA:

Se encarga de la recolección, clasificación y descripción de datos mues-trales o poblacionales, para su interpretación y análisis. Su finalidad es obtener información, analizarla, elaborarla y simplificarla y presentán-dolos en forma clara; eliminando la confusión característica de los da-tos preliminares lo necesario para que pueda ser interpretada cómoda y rápidamente y, por tanto, pueda utilizarse eficazmente para el fin que se desee.

Permite la elaboración de cuadros, gráficos e indicadores bien calcula-dos; suficientemente claros, como para disipar las dudas y la oscuridad de los datos masivos.

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS

Page 13: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 13

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

1.2.2. ESTADÍSTICA INFERENCIAL O INDUCTIVA

La estadística inferencial sobre la base de la muestra estudiada saca con-clusiones, o sea, hace inferencia o inducción, en cuanto al universo o población, de donde se obtuvo dicha muestra, basándose en los datos simplificados y analizados; detectando las interrelaciones que pueden unirlos, las leyes que los rigen y eliminando las influencias del azar; lle-gando más allá de las verificaciones físicas posibles.

¿Cómo se selecciona la muestra?, ¿cómo se realiza la inferencia?, y ¿qué grado de confianza se puede tener en ella? son aspectos fundamentales de la estadística inferencial, para cuyo estudio se requiere un alto nivel de conocimientos de estadística, probabilidad y matemáticas. Compren-de la teoría de estimación y prueba de hipótesis.

1.3 OBJETIVOS

Los objetivos de la estadística pueden ser clasificados en tres grandes capítulos: descripción, análisis y predicción.

1.3.1. Descripción de grandes colecciones de datos empíricos reduciéndolos a un pequeño número de características que concentra la parte más impor-tante y significativa de la información proporcionada por los datos.

La descripción supone que los datos que vienen expresados en su forma natural deben ser clasificados y presentados sistemáticamente en cua-dros o tablas como una pequeña reducción de datos, esto se obtiene cuando el comportamiento y características de los datos se expresan por un conjunto de indicadores, medidas de resumen o estadígrafos.

La estadística se inicia estudiando el problema, puesto que es un trabajo preliminar de casi todas las investigaciones estadísticas; de este modo tanto como la reducción como la descripción de la información se estu-dia en la Estadística Descriptiva.

Es importante anotar que la descripción estadística de los fenómenos o hechos es el primer aspecto al cual se redujo la ciencia estadística duran-te mucho tiempo, aplicándose especialmente a los datos demográficos, sociales económicos, etc.

1.3.2. Análisis estadístico de datos experimentales y de los fenómenos observa-dos, toda la investigación estadística incluye un problema de análisis, con el objeto de formarse un concepto de la población o universo y adoptar decisiones; en este caso no es necesario observar toda a una población sino que será suficiente elegir una muestra representativa. La preocupación del análisis estadístico es inferir propiedades para una población sobre la base de resultados muestrales conocidos. Aquí se presenta varios problemas que presentan la Estadística, la estimación estadística, el cálculo de probabi-lidades, las pruebas estadísticas, etc. Éstos son aspectos que corresponde esencialmente a la Inferencia Estadística.

Todo análisis debe suponer la elección adecuada de una muestra represen-tativa, la que será estudiada en detalle para obtener conclusiones o resul-tados, que dentro de ciertos márgenes de aceptación sean válidas a toda la población de la cual fue elegida la muestra.

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS

Page 14: A0175 Estadistica I MAU01

14

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

1.3.3 Predicción o comportamiento de los fenómenos en el futuro, lo cual constituye la máxima aspiración práctica de toda ciencia. Este objetivo de predicción y previsión está implícito tanto en la descripción como en el análisis estadístico, puesto que en general interesa orientar la toma de de-cisiones con vigencia y afecto en el futuro.

Naturalmente que las estimaciones y proyecciones dependen del grado de conocimiento del comportamiento del pasado y presente de las variables en estudio.

Para concretar estos objetivos, la Estadística se vale por una parte del cen-so, que recopila datos del todo, analiza la distribución y variación de las características de los elementos que componen una población claramente definida; por otra parte del muestreo, que permite estimar o inferir carac-terísticas de un todo considerando una parte representativa. Basándose en el análisis de experiencias y evaluaciones pasadas y actuales, hace esti-maciones de fenómenos y características para un futuro, propone valores esperados. La estadística también se vale de una serie de artificios mate-máticos y del cálculo de probabilidades, para definir sobre la validez de supuestos, construir modelos y métodos estadísticos.

2 FUENTES DE RECOLECCIÓN DE DATOS

Finalmente, el Derecho Empresarial es considerado como el conjunto de normas que regulan la actividad empresarial, esto es, la de los actos de comercio y los suje-tos de comercio.

Así, existen varias disciplinas que alimentan el Derecho Empresarial en los distintos rubros de dicha la actividad empresarial. Así tenemos que, los actos de comercio y los sujetos de comercio son regulados por derecho civil y el derecho comercial; la organización laboral de la empresa está regulada por el derecho del trabajo; la actuación de la empresa con agentes extranjeros está regulada por el derecho in-ternacional; las implicancias contables y tributarias de la empresa está regulada por el derecho tributaria; etc.

1.2 FUENTES DE DATOS

Las fuentes de información están constituidas por cada uno de los lugares de donde se toman los datos. De acuerdo al tipo del lugar del cual procede esta información podemos clasificarlo de la siguiente manera:

1.2.1. Fuente Primaria

Los datos de la fuente primaria son obtenidos directamente de las uni-dades de observación mediante cualquier técnica o instrumento de reco-lección de datos originales.

1.2.2. Fuente Secundaria

Los datos de la fuente secundaria son aquellos datos que ya han sido pu-blicados con anterioridad, recolectados con fines diferentes de los que la investigación específica necesita.

Estos datos se encuentra como archivos registros administrativos boleti-nes, informes estadísticos requeridos en el ámbito nacional o sectorial elaborados por organismos especializados los que pueden ser públicos o privados.

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS

Page 15: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 15

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

2.1.3 Fuentes Internas

Los datos procedentes de Fuentes Internas son aquellos que se generan dentro de la propia organización por ejemplo, los recursos de la canti-dad de géneros o servicios producidos, el número de horas de trabajo consumidas en cada unidad de producción, la cantidad de materiales utilizados o desperdiciados y el número de ausencias al trabajo.

2.1.4 Fuente Externas

Son los datos que se generan fuera de los negocios u organizaciones. Entre las fuentes más importantes de esta clase de información, están las agencias gubernamentales, las asociaciones profesionales y comerciales y las publicaciones especializadas, empresas privadas.

2.2 MÉTODOS DE RECOLECCIÓN DE DATOS

Elegir el método de recolección de datos depende de las posibilidades de ac-ceso o contacto con los elementos investigados, del tamaño de la población o muestra, de la oportunidad de obtener datos y del presupuesto y exigencias del tiempo.

Los objetivos principales para la recolección son:

- Obtener los datos o respuestas a las variables analizadas.

- Proporcionar información adecuada y oportuna con fines de una óptima planificación.

Para seleccionar el método de recolección de datos se debe tener en cuenta lo siguiente:

a. Establecer Objetivos Claros

Antes de recoger la información se debe decidir qué se va a hacer con ella. Cualquier recolección de información ha de tener un objetivo específico y ser seguida por acciones.

La información es una guía para nuestras acciones. A partir de la informa-ción conocemos los hechos pertinentes y adoptamos acciones apropiadas basadas en esos hechos.

b. Definir su propósito

Una vez que se define el objetivo de la recolección de la información, tam-bién se determina los tipos de comparación que se necesitan, y esto a su vez identifica el tipo de datos que se deben de recoger.

c. Confiabilidad de las Mediciones

Está directamente relacionada a la adecuada selección de la muestra.

2.2.1 CENSO

Es un método de recolección de datos mediante el cual la información se obtiene analizando a la totalidad de los elementos que componen la población o universo bajo estudio. Un censo debe cumplir las condi-ciones de universalidad (censar a todos los elementos de la población) y simultaneidad (realizarse en un momento determinado). Un censo es equivalente a una fotografía de la población bajo estudio.

2.2.2 OBSERVACIÓN

Es un proceso permanente de investigación realizado con instrumentos y técnicas específicas según el ámbito de estudio. Es necesario que el in-vestigador cuente con un marco teórico y referencial sobre las variables y sus indicadores. Para lograr una observación científicamente válida se debe:

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS

Page 16: A0175 Estadistica I MAU01

16

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

- Preparar estrategia de obtención de información verídica

- Determinar controles de las variables.

- Planificación y determinación de método y tipo de observación.

Se pueden considerar los siguientes tipos de observación:

a. Natural: Es aquel tipo de observación que no maneja mayores reglas o procedimientos que las consideradas por el investigador quien se apoya en la creatividad, imaginación y capacidad organizativa.

b. Diferencial o selectiva: Es aquel tipo en el cual se determina un siste-ma de clasificaciones de los datos, destacando la diferencia entre los objetos o elementos de estudio (tamaño, color, categorías, etc.).

c. Experimental: Se caracteriza por existir un proceso pre establecido, y en el cual el investigador interviene para estimular, alterar algún componente del ente a estudiar con el fin de obtener un resultado esperado o reproducir un fenómeno.

d. Ordinaria o No participante: Es aquel tipo de observaciones en la cual el investigador se encuentra fuera de los sucesos.

e. Participante: Tipo de observación en la que el investigador está den-tro de la población.

De las características de cada uno de los tipos de observaciones, se puede concluir que es necesario contar con personal especializado, lo que sig-nificará un costo adicional y por otro lado es un método no conveniente cuando la población a estudiar es numerosa.

2.2.3 ENTREVISTA

Consiste en una interacción entre dos personas, el entrevistador (quien investiga) que formula una serie de preguntas relativas al tema de inves-tigación, y el entrevistado (quien tiene la información) que responde verbalmente o por escrito las información que le es solicitada.

Esta técnica se aplica a informantes claves, es decir, personas represen-tativas que manejan una gran cantidad de información referente a un tema de interés.

La ventaja de realizar una entrevista es que la información que se obtiene puede ser enriquecida con repreguntas, la observación directa permite constatar la veracidad de las respuestas. Al ser una interacción entre dos personas existen muchos factores que pueden distorsionar las respuestas del entrevistado por lo que el entrevistador debe ser una persona con mucho dominio de esta técnica.

Según la estructura de la entrevista, estas se clasifican en:

a. Entrevista No Estructurada:

La entrevista no estructurada es flexible y abierta, aunque los obje-tivos de la investigación rigen a las preguntas, su contenido, orden profundidad y formulación se encuentra por entero en manos del entrevistador. Si bien el investigador, sobre las bases del problema, los objetivos y las variables, elabora las preguntas antes de realizar la entrevista, modifica el orden, la forma de encauzar las preguntas o su formulación para adaptarlas a las diversas situaciones y características particulares de los sujetos de estudio.

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS

Page 17: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 17

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Este tipo de entrevista es muy útil en los estudios descriptivos y en las fases de exploración para el diseño del instrumento de recolección de datos.

Las ventajas de este método son:

• Esadaptableysusceptibledeaplicarseatodaclasedesujetosensituaciones diversas.

• Permiteprofundizarenlostemasdeinterés.

• Orientaaposibleshipótesisyvariablescuandoseexploranáreasnuevas.

Entre las desventajas se cita:

• Serequieremástiempo.

• Esmáscostosaporlainversióndetiempoconlosentrevistadores.

• Sedificultalatabulacióndedatos.

• Serequieredemuchahabilidadtécnicaparaobtenerlainforma-ción y mayor conocimiento del tema.

Aún con esas desventajas y dada la utilidad de la entrevista, en sus dos formas, todo investigador debe familiarizarse con su uso, ya que es probable que la aplique en cualquier tipo de investigación.

Aún con esas desventajas y dada la utilidad de la entrevista, en sus dos formas, todo investigador debe familiarizarse con su uso, ya que es probable que la aplique en cualquier tipo de investigación.

La entrevista no estructurada pueden clasificarse en:

• Entrevista formal:Es la modalidad menos estructurada posible de entrevista, ya que se reduce a una simple conversación sobre el tema en estudio. Lo importante no es definir los límites de lo tratado ni ceñirse a algún esquema previo, sino “hacer hablar” al entrevistado, de modo de obtener un panorama de los problemas más sobresa-lientes, de los mecanismos lógicos y mentales del entrevistado, y de los temas que para él resultan de importancia. Lo más importante es dar al entrevistado la sensación clara y definida de que puede hablar libremente, alentándolo y estimulándolo para que lo haga y cuidando de no influirlo demasiado con nuestras actitudes o las palabras que decimos.

• Entrevistafocalizada: Es prácticamente tan libre y espontánea como la anterior, pero tiene la particularidad de concentrarse en un único tema. El entrevistador deja hablar sin restricciones al entrevistado, proponiéndole apenas algunas orientaciones básicas pero, cuando éste se desvía del tema original, el entrevistador vuelve a centrar la conversación sobre el primer asunto.

Se emplea normalmente con el objeto de explorar a fondo alguna experiencia vivida por el entrevistado o cuando nuestros informantes son testigos presenciales de hechos de interés o de acontecimientos históricos. Requiere de gran habilidad en su desarrollo, para evitar tanto la dispersión temática como caer en formas más estructuradas de interrogación.

• Entrevistaporpautasoguías:Se guían por una lista de puntos que se van explorando en el curso de la entrevista. Los temas deben guardar una cierta relación entre sí. El entrevistador hace muy pocas pregun-tas directas, y deja hablar al entrevistado siempre que vaya tocando alguno de los temas señalados en la pauta o guía.

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS

Page 18: A0175 Estadistica I MAU01

18

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

b. Entrevista Estructurada

Se caracteriza por estar rígidamente estandarizada, replantean idén-ticas preguntas y en el mismo orden a cada uno de los participantes, quienes deben escoger la respuesta en 2, 3 ó más alternativas que se les ofrecen. Inclusive los comentarios introductorios y finales se formulan de la misma manera en todas las situaciones. Para orientar mejor la entrevista se elabora un formulario que contenga todas las preguntas. Sin embrago, al utilizar este tipo de entrevista el investi-gador tiene limitada libertad de formular preguntas independientes generadas por la interacción personal.

Algunas ventajas que presenta este tipo de entrevista son:

• Lainformaciónesmásfácildeprocesar,simplificandoelanálisiscom-parativo

• Elentrevistadornonecesitaserentrenadoarduamenteenlatécnica.

• Hayuniformidadeneltipodeinformaciónobtenida.

Pero también tiene desventajas, tales como:

• Esdifícilobtenerinformaciónconfidencial.

• Selimitalaposibilidaddeprofundizarenuntemaqueemerjaduran-te la entrevista.

2.2.4 ENCUESTA

Es una técnica que permite obtener información de una muestra repre-sentativa de una determinada población. Es un proceso a través del cual conseguimos datos de primera mano y todos ellos que permitan especi-ficar mejor el problema.

2.2.5 CUESTIONARIO

Es un plan formalizado para recolectar datos de los encuestados. La fun-ción del cuestionario es la medición del comportamiento pasado, de las actitudes y de las características del encuestado.

Es el método que utiliza un instrumento o formulario impreso, destina-do a obtener repuestas sobre el problema en estudio y que el investido o consultado llena por si mismo.

El cuestionario puede aplicarse a grupos o individuos estando presente el investigador o el responsable del recoger la información, o puede en-viarse por correo a los destinatarios seleccionados en la muestra.

Algunas ventajas del cuestionario son: su costo relativamente bajo, su capacidad para proporcionar información sobre un mayor número de personas en un periodo bastante breve y la facilidad de obtener, cuantifi-car, analizar e interpretar los datos.

Dentro de las limitaciones de este método figuran las siguientes: es poso flexible, la información no puede variar ni profundizarse.

Respecto al diseño del cuestionario, este varía según la experiencia del investigador, los objetivos a alcanzar, los tiempos de aplicación, el presu-puesto con que se cuenta, el tiempo para el estudio, entre otros.

Generalmente un cuestionario tiene cinco secciones:

a. Solicitud de cooperación: es un pequeño enunciado, diseñado para obtener la cooperación del encuestado con relación a la entrevista, Con-tiene la identificación de la organización que realiza la encuesta, se ex-

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS

Page 19: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 19

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

plica el objeto del estudio y se indica el tiempo que se requiere para completar la entrevista.

b. Datos de identificación: generalmente ocupan la primera sección del cuestionario y se relacionan con el nombre, dirección y número tele-fónico del encuestado. Los datos adicionales incluirían elementos tales como la hora y la fecha de la entrevista, además del nombre o código del entrevistador.

c. Datos de clasificación: Tratan sobre las características del encuestado. Estos datos los suministra directamente el encuestado en el caso de una encuesta por correo. En las personales y telefónicas el entrevistador reco-lecta los datos o, en algunos casos, puede estimar tipos más sensibles de datos basado en la observación.

d. Instrucciones: Se refieren a comentarios realizados al entrevistador o encuestado con relación a la forma de utilizar el cuestionario. Estos co-mentarios aparecen directamente en el cuestionario cuando se emplea una encuesta por correo.

e. Información solicitada: Constituye la parte más grande del cuestionario.

3 DEFINICIONES BÁSICAS

3.1 POBLACIÓN

Es el conjunto mayor o colección completa de todos los elementos (puntajes. personas, mediciones, etc.) que posee al menos una característica común ob-servable, cuyo estudio nos interesa o acerca de los cuales se desea información.

La población debe estar perfectamente definida en el tiempo y en el espacio, de modo que ante la presencia de un potencial integrante de la misma, se pueda decidir si forma parte o no de la población bajo estudio. Por lo tanto, al definir una población, se debe cuidar que el conjunto de elementos que la integran quede perfectamente delimitado.

La población puede ser según su tamaño de dos tipos:

a. Población finita: cuando se tiene un número determinado de elementos.

b. Población infinita: cuando el número de elementos es indeterminado, o tan grande que pudiesen considerarse infinitos.

Tamaño de la Población: Es el número total de elementos que tiene la pobla-ción estudiada y se denota con la letra “N”

3.2 MUESTRA

Es un subconjunto de la población a la cual se le efectúa la medición con el fin de estudiar las propiedades de la población de la cual es obtenida.

Una muestra debe ser representativa, esto es, guarda las mismas características de la población de donde fue seleccionada y debe ser adecuada en cuanto a la cantidad de elementos que debe tener con respecto a la población.

Existen diversos métodos para calcular el tamaño de la muestra y también para seleccionar los elementos que la conforman, pero es importante que sea re-

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS

Page 20: A0175 Estadistica I MAU01

20

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

presentativa de la población y sus elementos escogidos al azar para asegurar la objetividad de la investigación.

Tamaño de muestra: Es el número de elementos de la muestra y se denota con letra “n”.

3.3 PARÁMETROS ESTADÍSTICOS

Es un número que describe alguna característica de la población o medida de resumen de una población. Se considera como un valor verdadero de la carac-terística estudiada y para determinar su valor es necesario utilizar la informa-ción poblacional completa, y por lo tanto la decisión se toman con certidumbre total.

3.4 ESTADÍGRAFO O ESTADÍSTICO

Es un número que describe alguna característica de la muestra o medida de resumen de una muestra y la toma de decisión contiene un grado de incerti-dumbre.

3.5 DATO

Es el valor, respuesta o registro que adquiere una característica o variable aso-ciado a un elemento de la población o muestra, como resultado de la observa-ción, entrevista o recopilación en general. Puede ser un número, una palabra o un símbolo.

3.6 VARIABLE

Es una característica estudiada de las unidades estadísticas. Podemos mencio-nar los siguientes tipos:

a. Según la Naturaleza de la Variable

a.1 Variables Cualitativas o Estadísticas de Atributos

Cuando expresan una cualidad, característica o atributo, tiene carácter cualitativo, sus datos se expresan mediante una palabra, no es numérico.

Por ejemplo: estado civil, los colores, lugar de nacimiento, profesiones, actividad económica, causas de accidentes, etc.

a.2 Variables Cuantitativas

Cuando el valor de la variable se expresa por una cantidad, es de carácter numérico. El dato o valor puede resultar de la operación de contar o medir; por ejemplo: edad, número de hijos por familia, ingresos, vivien-das por centro poblado, niveles de desempleo, producción, utilidades de empresas, etc.

Las variables cuantitativas pueden ser: Discreta y Continua.

a.1.1 Variable Discreta

Cuando el valor de la variable resulta de la operación de contar, su valor está representado sólo por números naturales (enteros posi-tivos); Ejemplos: hijos por familia, número de accidentes por día, trabajadores por empresa, población por distritos, habitaciones por vivienda, etc.

a.1.2 Variable Continua

Cuando la variable es susceptible de medirse, es toda variable cuyo valor se obtiene por medición o comparación con una unidad o patrón de medida. Las variables continuas pueden tener cualquier valor dentro de su rango o recorrido, por tanto se expresa por cual-quier número real; Ejemplos: área de parcelas, ingresos moneta-rios, producción de maíz, peso, estatura, tiempo de servicios, horas trabajadas, niveles de empleo, etc.

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS

Page 21: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 21

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

b. Según la Escala de Medición

b.1 Variables Nominales

Son aquellas variables que establecen la distinción de los elementos en diversas categorías, sin implicar algún orden entre ellas, distribuye a la unidad de análisis en dos o más categorías. Ejemplos: sexo, estado civil, deportes de práctica, profesiones, lugar de nacimiento, etc.

b.2 Variables Ordinales

Aquellas variables que implican orden entre sus categorías, pero no gra-dos de distancia igual entre ellas, están referidas a un orden de jerarquía, donde las categorías expresan una posición de orden. Ejemplo: grado de instrucción, clases sociales, grado de simpatía, rango de agresividad, orden de merito, etc.

b.3 Variable de Intervalo

Son aquellas que suponen a la vez orden y grados de distancia iguales entre las diversas categorías, pero no tienen origen natural, sino conven-cional, tiene un cero relativo. Por ejemplo: coeficiente de inteligencia, temperatura, puntuación obtenida en una escala, etc.

b.4 Variables de Razón

Estas variables comprenden a la vez todos los casos anteriores, distinción, orden, distancia y origen único natural; el valor se expresa con un núme-ro real tiene un cero absoluto. Por ejemplo: edad, peso, ingresos, núme-ro de hijos, producción, accidentes de tránsito, etc.

TEMA 2: RESUMEN Y GRÁFICA DE DATOS

Ahora es momento de aplicar todos los conceptos, definiciones y características apren-didas en el tema anterior para poder realizar la representación de los datos estadísticos de manera gráfica o a través de un tablero estadístico. Debes tener en cuenta que antes de construir un tablero de frecuencias debes verificar quién es la variable, que tipo de variable es y qué valores asume.

1 CONSTRUCCIÓN DE TABLEROS DE FRECUENCIA CUALITATIVOS Y CUANTITATIVOS

La siguiente fase de la Estadística después de haber recolectado la información a través de un trabajo de campo, es la Organización y Clasificación de los Datos que debe ser consistente y veraz que nos permitirá posteriormente realizar una buena toma de decisiones.

1.1 CONCEPTOS BÁSICOS

Para iniciar la organización de datos definiremos algunos conceptos:

1.1.1 Clase

Es una división de la variable. Se denota como subíndice con la letra “i” y el número total de clases con “m”.

1.1.2 Frecuencia

Es las veces que se repite una clase de la variable. Estas son: Simples y Acumuladas

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS

Page 22: A0175 Estadistica I MAU01

22

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

a. Frecuencia Simple: Es aquella frecuencia que sólo correspondes a una clase de la variable entre ellas tenemos:

a.1 Frecuencia Absoluta Simple

La frecuencia absoluta simple de la clase ci es el número fi, de observacio-nes que presentan una modalidad perteneciente a esa clase.

Además se cumple que: nf

m

ii =∑

=1

a.2 Frecuencia Relativa Simple

Frecuencia Relativa Simple de la clase ci es el cociente hi, entre las fre-cuencias absolutas de dicha clase y el número total de observaciones, es

decir: nfihi =

Obsérvese que fi es el tanto por uno de observaciones que están en la clase

ci. También cumple: 11

=∑=

m

iih

a.3 Frecuencia Porcentual Simple

Frecuencia Porcentual Simple de la clase ci es el producto de pi, entre las frecuencias relativas de dicha clase por 100, es decir

100*ii hp =

Cumple lo siguiente: 1001

=∑=

m

iip

b. Frecuencias Acumuladas: Aquellas frecuencias que se obtienen por la suma de dos o más clases de la variable

b.1 Frecuencia Absoluta Acumulada

Fi, se calcula sobre variables cuantitativas, y es el número de elementos de la población cuya modalidad es inferior o equivalente a la modalidad ci:

∑=

=+++=i

1kki21 ff....ffFi

b.2 Frecuencia Relativa Acumulada

Hi, se calcula sobre variables cuantitativas, siendo el tanto por uno de los elementos de la población que están en alguna de las clases y que presen-tan una modalidad inferior o igual a la ci, es decir:

∑=

=+++==i

kki

ii hhhh

nFH

121 ...

b.3 Frecuencia Porcentual Acumulada

Pi, se calcula sobre variables cuantitativas, siendo el tanto por ciento de los elementos de la población que están en alguna de las clases y que presentan una modalidad inferior o igual a la ci, es decir :

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS

Page 23: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 23

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

1.2 Distribución de Frecuencias

Llamaremos distribución de frecuencias o tabla de frecuencias al arreglo de filas y columnas que contiene al conjunto de clases junto a las frecuencias co-rrespondientes a cada una de ellas. Una tabla estadística sirve para clasificar y ordenar los datos estadísticos.

1.2.1 Tablas Univariantes o unidimensionales

Se denomina así a las tablas de frecuencias que presentan información de una sola variable. Sus formas generales son las siguientes:

a. Variable cualitativa

b. Variable cuantitativa

b.1 Cuantitativa Discreta

b.2 Cuantitativa Continua

Si las clases van a estar conformadas por intervalos se debe seguir los siguientes pasos:

• Determinarelmínimo(Mín)yelmáximo(Máx)delconjuntode datos.

• CalcularelRango(R)dedatosmediante:R=Máx–Mín

• Elegirelnúmerodeclases(m):sepuedeutilizar lasiguiente

fórmula 45.2 nm = siempre es un valor entero, redondear según criterios de redondeo. El valor de m se puede elegir tam-bién a criterio y necesidades del investigador en un intervalo de 5<m<20.

• Se calcula la amplitud del intervalo (a) mediante:mRa =

siempre se redondea por exceso (esto es siempre aumentar una unidaden lacifraderedondeo.Ejemplosia=1.23y sedesearedondeara1decimalelvalordea=1.3).

• Debidoal redondeoporexcesoque se realizaenelpasoan-terior, se debe realizar el ajuste al rango (si el cociente de la amplitud es exacto no seguir este paso) mediante los siguiente pasos:

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS

Page 24: A0175 Estadistica I MAU01

24

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

- Calcularelnuevorango(R’)medianteR’=a*m.

- Calcularelexcesodelnuevorangoqueestarádadopord=R’-R.

- A la diferencia se divide en dos partes (d/2) y se le disminuye al Mín(Mín–d/2)yseleagregaalMáx(Máx+d/2)obteniendonuevos límites.

• Construirlosintervalosdeclasedelasiguientemanera:

1.2.2 Tablas bivariantes o bidimensionales

Se denominan así a las tablas que presentan información de dos variables en forma conjunta. Sus formas generales son las siguientes:

Tablas bivariantes de frecuencias absolutas

De igual manera se puede construir tablas bivariantes para frecuencias relativas o porcentuales de acuerdo a las necesidades de presentación de información.

Se pueden elaborar tablas de frecuencias de más variables, como por ejemplo de tres variables denominadas trivariantes o tridimensionales.

2 TIPOS DE GRÁFICOS ESTADÍSTICOS. LECTURA Y ANÁLISIS

2.1 Cuadro Estadístico:

Se utiliza para presentar la información estadística en forma ordenada y de fácil lectura para cualquier usuario, se presenta en informes finales y tiene las siguientes partes:

2.1.1 Componentes de un cuadro

Una gráfica, cuadro o una tabla, debe constar de:

Título adecuado: Claro y conciso, que responda a las preguntas: ¿Qué relaciona?, ¿cómo?, ¿cuándo?, y ¿dónde se hicieron las observaciones?.

El cuerpo: o cuadro en sí, donde debe considerar el o los tipos de varia-bles a relacionar, el público a quien va dirigido y presentarse las frecuen-cias que sean más necesarias.

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS

Page 25: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 25

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Notas Explicativas: En ella se presentan aclaraciones respecto a la infor-mación que se está presentando. Este componente es opcional.

Fuente: Corresponde al área de la empresa o institución responsable de la elaboración de la información.

2.2 Gráfico Estadístico

Una gráfica o diagrama estadístico es un dibujo complementario a una tabla o cuadro, que permite observar las tendencias de un fenómeno en estudio y facilita el análisis estadístico de las variables ahí relacionadas.

2.2.1 Componentes de una gráfica:

Una gráfica, cuadro o una tabla, debe constar de:

Título adecuado: Claro y conciso, que responda a las preguntas: ¿Qué relaciona?, ¿cómo?, ¿cuándo?, y ¿dónde se hicieron las observaciones?

El cuerpo: Es el gráfico en sí, cuya elección debe considerar el o los tipos de variables a relacionar, el público a quien va dirigido y el diseño artís-tico del gráfico.

Fuente: Corresponde al área de la empresa o institución responsable de la elaboración de la información.

2.2.2 Principales tipos de gráficos

Existe una gran cantidad de gráficos para la representación de datos es-tadísticos, entre los principales tenemos:

a. Gráfico de Barras:

El gráfico de barras, como su nombre lo indica, está constituido por ba-rras rectangulares de igual ancho, conservando la misma distancia de separación entre sí. Se utiliza básicamente para mostrar y comparar fre-cuencias de variables cualitativas o comportamientos en el tiempo, cuan-do el número de ítems es reducido.

Se construye de la siguiente manera la base de las barra la conforman las categorías de la variable y su altura se presenta con la frecuencias simples (absoluta, relativa o porcentual)

Se clasifican por:

Barras Simples: Compara valores entre categorías de una variable

Barras Dobles: Compara valores entre categorías de dos variables

Barras Múltiples Compara valores entre categorías de dos variables

Barras Verticales: Las categorías de la variable deben ubicarse en el eje X

BarrasHorizontales:Lascategoríasdelavariabledebenubicarseeneleje Y

Barras Apiladas: Compara entre categorías el aporte de cada valor en el total.

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS

Page 26: A0175 Estadistica I MAU01

26

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

b. Gráfico de Sectores Circulares (Pie):

Usualmente llamado gráfico de pastel, debido a su forma característica de una circunferencia dividida en sectores, por medio de radios que dan la sensación de un pastel tajado en porciones.

Se usa para representar variables cualitativas en porcentajes o cifras ab-solutas cuando el número de ítems no es superior a 5 y se quiere resaltar uno de ellos.

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS

Page 27: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 27

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

c. Gráfico de Líneas o Tendencia:

Usado básicamente para mostrar el comportamiento de una variable cuantitativa a través del tiempo. El gráfico de líneas consiste en segmen-tos rectilíneos unidos entre sí, los cuales resaltan las variaciones de la variable por unidad de tiempo.

Cuando se tienen varias variables a representar, con el fin de establecer comparaciones entre ellas (siempre que su unidad de medida sea la mis-ma); se utiliza plasmarlos en un sólo gráfico, el cual es el resultado de representar varias variables en un mismo plano. A este tipo de gráfico se le conoce como gráfico de líneas compuesto.

d. Histograma de Frecuencias:

Es un gráfico de barra pero unidas. Se utiliza básicamente para mostrar la distribución de frecuencias de variables cuantitativas. El histograma se construye dibujando barras contiguas que tienen como base la amplitud de cada intervalo y como alturas las frecuencias respectivas.

Distribuidora Chespi S.A.: Medición de la resistencia de conductores.

Fuente: Área de Ingeniería.

e. Polígono de Frecuencias:

Es un gráfico poligonal cerrado. Se utiliza básicamente para mostrar la distribución de frecuencias de variables cuantitativas. Para la construc-ción de un polígono de frecuencias, se marcan los puntos medios (mar-cas de clase) de cada uno los intervalos en la parte superior de cada barra del histograma de frecuencias, los cuales se unen con segmentos de recta.

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS

Page 28: A0175 Estadistica I MAU01

28

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Distribuidora Chespi S.A.: Medición de la resistencia de conductores.

Fuente: Área de Ingeniería.

f. Histograma de Frecuencias Acumuladas:

Se utiliza básicamente para mostrar la distribución de frecuencias acu-mulada de variables cuantitativas. El histograma de frecuencias acumula-das también es obtenido a partir de una distribución de frecuencias, to-mando en el eje horizontal las clases de la variable, y en el eje vertical las frecuencias acumuladas correspondientes a cada intervalo. Se constru-ye de la misma manera que un histograma, pero utilizando frecuencias acumuladas. Se puede mostrar mediante las barras o bien mediante un polígono abierto. Para la construcción de un histograma de frecuencias acumulado, se marcan los límites superiores de cada uno los intervalos en la parte superior de cada barra del histograma de frecuencias acumu-lado, los cuales se unen con segmentos de recta. Este gráfico se le conoce también con el nombre de Ojiva de frecuencias.

Distribuidora Chespi S.A.: Medición de la resistencia de conductores.

Distribuidora Chespi S.A.: Medición de la resistencia de conductores.

g. Diagramas de dispersión o nubes de puntos:

Este tipo de gráfico es útil para representar la relación existente entre dos variables de tipo cuantitativo

La representación gráfica de este tipo de variables es en realidad seme-jante a la representación de puntos en el plano, usando unos ejes de coordenadas. Cada pareja de valores da lugar a un punto en el plano y el conjunto de puntos que se obtiene se denomina “diagrama de dispersión o nube de puntos”.

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS

Page 29: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 29

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Televisores: Relación entre Unidades Vendidas y Precio

Precio (Dólares)

V

e

n

t

a

h. Pictograma:

Tiene la característica de que las unidades de la variable se debe repre-sentar con símbolos que lo identifique y su tamaño va en relación a la frecuencia de la categoría de la variable

i. Pirámide:

Se utiliza principalmente para presentar la distribución de la población por grupos etéreos y género

j. Diagrama de Pareto

El diagrama de Pareto permite ver que en muchos casos pocos factores pueden producir la mayoría de las consecuencias y se podría resumir en “pocos vitales y muchos triviales”. Por ejemplo, en Control de Calidad se puede mostrar que la mayoría de los defectos y el costo de los mismos surge de un número relativamente pequeño de causas.

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS

Page 30: A0175 Estadistica I MAU01

30

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

k. Tablas de contingencias

También llamadas tablas cruzadas o de doble entrada. Se utilizan cuando a las observaciones se les asocian con dos variables cualitativas simultá-neamente.

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS

Page 31: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 31

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

LECTURA SELECCIONADA N° 1

Seis grados de Kevin Bacon: ¿el estudio original utilizó buenos datos?

Estadística. Mario Triola. Pág. 3

“Seis grados de Kevin Bacon” es un juego popular reciente, que consiste en identificar a un actor o a una actriz de cine, y luego vincularlo con el actor Kevin Bacon. (En el momento en que se escribió esto, el juego podía jugarse en el sitio Web www.cs.virginia.edu/oracle). Consideremos a Richard Gere como ejemplo. Gere actuó en la película Cotton Club con Laurence Fishburne, que trabajó en la película Mystic River con Kevin Bacon. El vínculo Gere-Fishburne-Bacon tiene dos grados de separación porque no se cuenta la persona meta.

Este juego, creado por tres estudiantes (Craig Fass, Brian Turtle y Mike Ginelli) de Al-bright College, es una versión más especializada de “Small World Problem”, que plantea la siguiente pregunta: ¿Cuántos intermediarios (amigos, parientes y otros conocidos) se necesitan para conectar a cualesquiera dos personas elegidas al azar en la Tierra? Es de-cir, para cualesquiera dos personas en nuestro planeta, ¿cuál es el número de grados de separación? Este problema de conexión tiene aplicaciones prácticas en muchos campos, como las redes eléctricas, el uso de Internet, las neuronas del cerebro y la propagación de enfermedades.

El concepto de “seis grados de separación” surgió de un estudio realizado en 1967 por el psicólogo Stanley Milgram, quien originalmente describió que en Estados Unidos dos residentes al azar están conectados por un promedio de seis intermediarios. En su primer experimento, Milgram envió 60 cartas a personas de Wichita, Kansas, a quienes les pidió que renviaran esas cartas a una mujer específica en Cambridge, Massachusetts. A esas personas se les dio la instrucción de entregar en mano las cartas a conocidos que, según ellos, podrían contactar a la persona indicada, ya fuera directamente o a través de otros conocidos. Participaron 50 de las 60 personas, y tres cartas llegaron a su destino. Dos experimentos posteriores tuvieron tasas de terminación más bajas; pero finalmente Milgram alcanzó una tasa del 35 por ciento, y describió que cada cadena completa tenía un promedio de alrededor de seis intermediarios. Como consecuencia, los datos origi-nales de Milgram produjeron el concepto “seis grados de separación”.

Veamos dos preguntas clave: ¿Eran adecuados los datos originales de Milgram? ¿Los datos originales de Milgram justifican el concepto de “seis grados de separación?”

Un principio extremadamente importante en este capítulo, en este libro, y en la esta-dística en general, es que el método que se utiliza para reunir datos de muestras puede construir o destruir la validez de las conclusiones basadas en los datos. En la actualidad, a todos nosotros se nos bombardea con encuestas y resultados de encuestas. Algunas reúnen datos de muestras que son útiles porque describen de manera exacta caracte-rísticas importantes de poblaciones. Otras encuestas usan datos muestrales recolectados de tal forma que condenan los resultados a la creciente pila de basura de la mala infor-mación.

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

ACTIVIDAD N° 1

Esta actividad puede consultarla en su aula virtual.

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS

Page 32: A0175 Estadistica I MAU01

32

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

GLOSARIO

• Arreglouordenamientodedatos: Organización de los datos sin procesar en orden ascendente o descendente.

• Conjuntodedatos: Una colección de datos.

• Distribucióndefrecuencias:Presentación de un conjunto de datos en el que se mues-tra la frecuencia absoluta y/o relativa de los datos pertenecientes a cada intervalo.

• Estadígrafo:Característica de la muestra.

• Frecuenciaabsoluta: Número de datos que pertenecen a determinado intervalo.

• FrecuenciaRelativa:Proporción representativa de cada intervalo respecto al tamaño total.

•Histograma: Gráfica de un conjunto de datos compuesta por una serie de rectángulos cada uno con un ancho proporcional al rango de los valores de cada clase o intervalo y altura proporcional a la frecuencia.

• Intervalo: Conjunto de datos núméricos establecidos entre dos límites, inferior e infe-rior.

•Marcadeclase: Punto medio de cada intervalo, valor representativo de todos los datos que pertenecen a dicho intervalo.

•Muestra:Colección de algunos elementos, subconjunto de la población con las mis-mas características que la población bajo estudio, utilizada para describir a la pobla-ción de la cual proviene.

•Ojiva:Gráfica de una distribución de frecuencias acumuladas.

• Parámetro:Característica de la población.

• Población:Colección de todos los lementos que se están estudiando y sobre los cuales intentamos llegar a conclusiones.

• VariableCualitativaNominal: Aquella que asume valores cualitativos que no poseen jerarquías entre si.

• VariableCualitativaOrdinal: Aquella que asume valores cualitativos los cuáles si po-seen jerarquías entre si.

• VariableCuantitativaContinua: Aquella que asume valores cuantitativos que provie-nen de una medición.

• VariableCuantitativaDiscreta: Aquella que asume valores cuantitativos que provienen de un conteo.

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

BIBLIOGRAFÍA DE LA UNIDAD I

1. Triola Mario F. ESTADÍSTICA. Pearson Educación. México 2012

2. Berenson, Mark y Levine, David. Estadística Básica en Administración, Conceptos y aplicaciones.PrenticeHall,México2010

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS

Page 33: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 33

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

AUTOEVALUACIÓN DE LA UNIDAD I

1. A los clientes de un banco se les pide rellenen un cuestionario en el que se hicieron las siguientes preguntas,

Cuáles proporcionan datos cuantitativos o cualitativos? Asigne el código correspon-diente:

A=CualitativosNominalesB=CualitativosOrdinales

C=CuantitativosDiscretosD=CuantitativosContinuos

A. DADCB B. DBCAB C. CADCA

D. ADBCB E. BCBAC

2. En la siguiente tabla, se muestra el grado de instrucción de 1000 trabajadores de la liquidada empresa DOE RUN. Identifica cual de las afirmaciones es incorrecta.

A. El total de trabajadores con estudios superior técnico son 388.

B. El diagrama de sectores representa mejor este tipo de variable.

C. El 24.5% de los trabajadores son universitarios

D. Más del 50% tienen estudios básicos. (Primaria y secundaria).

E. Más del 60% de los trabajadores tienen estudios superiores o universitarios.

3. En la distribución de frecuencias

Los valores de A, B, C, D y E en ese orden son:

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS

Page 34: A0175 Estadistica I MAU01

34

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

A. 13, 72, 16, 135, 96.5%

B. 23, 62, 16, 137, 96.5%

C. 13, 72, 16, 138, 96%

D. 23, 62, 16, 135, 96%

4. El siguiente gráfico representa las preferencias de bebidas de los estudiantes de la Universidad “Continental”. Señale el enunciado incorrecto entre los presentados luego del gráfico.

A. Es un diagrama de barras agrupadas que representa la preferencia de bebidas por género.

B. La mayoría de los estudiantes de ambos géneros prefieren gaseosas.

C. De todos los estudiantes encuestados 22 prefieren otras bebidas.

D. Más del 50% de los estudiantes prefieren Frugos.

E. Sólo 33 de los estudiantes encuestados prefieren agua.

5. Se tiene la siguiente tabla de distribución de frecuencia:

Determine el tamaño de la muestra.

A. 120

B. 130

C. 140

D. 150

E. 160

UNIDAD I: INTRODUCCIÓN, RESUMEN Y GRÁFICA DE DATOS

Page 35: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 35

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

UNIDAD II: “ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS”

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

DIAGRAMA DE PRESENTACIÓN DE LA UNIDAD II

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

ORGANIZACIÓN DE LOS APRENDIZAJES

CONOCIMIENTOS PROCEDIMIENTOS ACTITUDES

Tema N° 1:Medidas de Tendencia Central 1. Media2. Mediana3. Moda

Tema N° 2: Medidas de Dispersión 1. Rango o recorrido2. Recorrido semi inter-

cuartil3. Desviación media4. Varianza5. Desviación típica o

estándar6. Coeficiente de variabili-

dadTema N° 3: Medidas de Posición, Asimetría y Curtosis 1. Cuantiles2. Medidas de Asimetría 3. Medidas de Curtosis

Lectura Seleccionada N° 2 ¿Los premios de la Aca-demia discriminan por la edad?

Autoevaluación N° 2

1. Calcula las medidas de tendencia central y las interpreta.

2. Calcula las medidas de dispersión y las inter-preta.

Actividad N° 1:Calcula indicadores estadís-ticos en distintas situacio-nes.

3. Calcula las medidas de posición y utiliza otros indicadores estadísticos para analizar conjuntos de datos.

Actividad N° 2:Resuelve ejercicios y pro-blemas aplicando las medi-das de dispersión.

Tarea Académica N° 1

Demuestra proactividad y ética en el desarrollo de la asignatura y en el manejo de la información.

CONTENIDOS

AUTOEVALUACIÓN

EJEMPLOS

BIBLIOGRAFÍA

ACTIVIDADES

Page 36: A0175 Estadistica I MAU01

36

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

TEMA Nº 1: MEDIDAS DE TENDENCIA CENTRAL

Estimado alumno es momento de conocer las medidas descriptivas que son conocidas a menudo como indicadores estadísticos que nos van ayudar a tener una idea del com-portamiento general de los datos sin tener la necesidad de analizarlos uno por uno, por ello es importante que tengamos en cuenta que lo que vamos a calcular son medidas representativas de los datos sobre los cuales ya podremos tomar algún tipo de decisión.

Las medidas de tendencia central, llamadas así porque tienden a localizarse en el centro de la información.

De tendencia porque no necesariamente son valores que la distribución presenta, sino valores hacia los cuales tiende o aproxima.

Centrales porque, normalmente, en el gráfico de frecuencias serán siempre valores me-dios centrales.

Las medidas de tendencia central responden a la necesidad de describir una colecti-vidad en función de una sola medida que la caracterice y distinga, ya sea porque son los más frecuentes (moda) o porque alrededor de ellos se agrupa la mayor parte de la población o muestra (media o mediana).

Las medidas de tendencia central, son también medidas de posición ya que, de todas maneras ocupan un lugar dentro de la información, los parámetros posicionales son muy útiles en la interpretación porcentual de la información.

Este tipo de medidas son de gran importancia en el manejo de las técnicas estadísticas, sin embargo, su interpretación no debe hacerse aisladamente de las medidas de disper-sión, ya que la representatividad de ellas está asociada con el grado de concentración de la información.

Las principales medidas de tendencia central son:

1. Media aritmética.

2. Mediana

3. Moda.

1 MEDIA ARITMÉTICA

Definida matemáticamente como el cociente entre la suma de todos los valores de la variable y el número de observaciones.

a. Simbología:

Si la media es calculada de una población se simboliza mediante µ

Si la media muestral es calculada de una muestra de una población se simboliza mediante x .

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

Page 37: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 37

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

b. Cálculo de la Media

b.1. Para datos no agrupados

Ejemplo 1:

La inversión anual (en miles de nuevos soles) de un grupo de pequeñas em-presas de la ciudad fueron:

10 12 40 10 30 14 16 20 25 28 30 26 30 10 18 17

13 17 21 14 15 19 27 22 14 11 13 15 18 20 30 39

Calcule e interprete la media.

Solución:

Obtenemos

Interpretación: En promedio las pequeñas empresas invierten 20 125 nuevos soles al año

b.2. Para datos agrupados

Ejemplo 2: Variable Discreta

Se selecciona al azar 280 vendedores de una gran compañía constructora de casas. A continuación se muestra el número de casas vendidas durante el últi-mo bimestre. Calcule e interprete la media

Solución:

Completando la siguiente tabla para el cálculo de la media aritmética

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

Page 38: A0175 Estadistica I MAU01

38

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

El promedio es:

Ejemplo 3: Variable Continua

La siguiente tabla de distribución de frecuencias corresponde al rendimiento de gasolina en kilómetros por litro de una muestra de 50 automóviles produ-cidos por Nissan México.

Solución:

Completando la siguiente tabla para el cálculo de la media aritmética

El promedio es:

Interpretación: _____________________________________________________

__________________________________________________________________

c. Propiedades de la media aritmética

1. La suma total de los n valores cuya media es x es igual a n.x .

Datos no agrupados :

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

Page 39: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 39

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

2.Sicadaunodelosnvaloresxiestransformadoen:yi=a.xi+b,siendoaybconstantes, entonces, la media de los n valores yi es:

Como casos particulares se tiene:

• Siyi=b,entonces . Si los n datos son una constante b, entonces la media es igual a esa constante b.

• Siyi=xi+b,entonces . Si a cada dato se le suma una constante b, la media queda sumada por esa constante b.

• Siyi=a.xi,entonces . Si a cada dato multiplica por una constan-te a, la media queda multiplicada por esa constante a.

3.La suma algebraica de las desviaciones de n datos xi con respecto a su media, es igual a cero.

4.La suma de los cuadrados de las desviaciones de n datos con respecto a su media es el valor mínimo.

d. Ventajas de la media aritmética

- Es fácil de entender y usar.

-Haceusodetodoslosdatosdeladistribución,porlocualesunamedidadetendencia central eficiente.

- Es el más conocido y popular de los promedios, el primero en el que piensan las personas, aunque no sepan estadística.

- El hecho de que su definición no sea lógica sino matemática hace que sea la medida de tendencia central usada con preferencia en Inferencia Estadística y en la mayoría de tests estadísticos.

e. Desventajas de la media aritmética

- Puede ser influenciada por valores extremos, que la hagan perder su valor como medida de tendencia central

- En ciertos casos puede no representar un valor observable, lo cual en el caso de variables discretas resulta artificioso.

- No puede calcularse para series cualitativas.

- Resulta tedioso calcular la media debido a que utilizamos cada uno de los pun-tos de dato de nuestro cálculo.

- Somos incapaces de calcular la media para un conjunto de datos que tiene clases de extremo abierto, ya sea en el inferior o en el superior de la escala.

2 MEDIANA

Su definición no es matemática sino lógica, entendemos por mediana aquel valor de la variable que divide en dos partes iguales a un conjunto ordenado de datos.

a. Simbología

Se simboliza con Me

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

Page 40: A0175 Estadistica I MAU01

40

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

b. Cálculo de la Mediana

b.1 Para datos no agrupados

Para el cálculo de la mediana los datos deben estar ordenados de menor a mayor, y deja a su izquierda y derecha el mismo número de elementos, es decir, el valor que ocupa el lugar central es la mediana.

Lo anterior tiene sentido en caso de que la serie tenga un número impar de elementos, si por el contrario tuviera un número par habría dos valores centrales, y en este caso se toma como mediana la media aritmética de los dos valores centrales.

Ejemplo 1-a: Si el número de datos es par

La inversión anual (en miles de soles) de un grupo de pequeñas empresas de la ciudad fueron:

Calcule e interprete la mediana.

Solución:

Primero debemos ordenar los datos en forma ascendente (de menor a ma-yor)

Luego el número de datos se divide en dos partes iguales

Seeligelosvalorescentralesdelavariablequetienelaposicióni=16yi=17que para el ejercicio son 18 y 18

La mediana será: Me =18

Interpretación:

El 50% de las pequeñas empresas han invertido como máximo 18 mil nuevos soles al año.

Ejemplo 1-b: Si el número de datos es impar

La inversión anual (en miles de nuevos soles) de un grupo de pequeñas em-presas de la ciudad fueron:

Calcule e interprete la mediana.

Solución:

Primero debemos ordenar los datos en forma ascendente (de menor a ma-yor)

Luego el número de datos se divide en dos partes iguales

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

Page 41: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 41

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Seeligeelvalorcentralesdelavariablequetienelaposicióni=17queparael ejercicio es 18

La mediana será:

Me = 18

Interpretación:

El 50% de las pequeñas empresas han invertido como máximo 18 mil nuevos soles al año.

b.2 Para datos agrupados

Se aplica el siguiente estadígrafo:

Ejemplo 2: Variable Discreta

Se selecciona al azar 280 vendedores de una gran compañía constructora de casas. A continuación se muestra el número de casas vendidas durante el último bimestre. Calcule e interprete la media

Calcule e interprete la mediana.

Solución:

Como los datos tabulados ya están ordenados, debemos encontrar el valor de la variable que ocupa la posición central, entonces dividimos al conjunto de

datos “n” en dos partes:

Entonces ubicamos en la tabla el valor que tenga la posición ___, para eso calculamos la frecuencia acumulada

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

Page 42: A0175 Estadistica I MAU01

42

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Entonces la mediana es:

Me=

Ejemplo 3: Variable Continua

La siguiente tabla de distribución de frecuencias corresponde al rendimiento de gasolina en kilómetros por litro de una muestra de 50 automóviles produ-cidos por Nissan México.

Calcule e interprete la mediana.

Solución:

Para aplicar los valores en la fórmula debemos encontrar la clase “j” denomi-nada “clase mediana”.

La clase mediana es aquella que contiene a la mitad de del conjunto de da-

tos, esto es el que contenga la posición , para eso calculamos la frecuencia acumulada:

Entonces aplicando en la fórmula:

Me=

Características de la mediana:

• Todo conjunto de datos medidos en escala de ordinal, intervalo o razón tiene una mediana.

• El valor de la mediana depende del número de datos observados.

• La mediana es un estadístico robusto, es decir, no se ve afectada por el valor de los extremos (mínimo y máximo). Por eso se le utiliza cuando hay datos inusuales o el polígono de frecuencias no es simétrico.

• La mediana no tiene propiedades matemáticas valiosas para poder usarlas en otros cálculos.

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

Page 43: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 43

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

3 MODA

Entendemos por moda el valor de la variable que más veces se repite, y en una dis-tribución de frecuencias el valor con mayor frecuencia absoluta simple

Puede darse el caso de que no haya moda (amodal), sólo una (unimodal), dos mo-das (bimodal) o varias modas (multimodal).

a. Simbología

Se simboliza con Mo

b. Cálculo de la Moda

b.1 Para Datos no agrupados

En este caso la determinación de la moda es inmediata por simple observa-ción. Aquel valor de la variable con mayor frecuencia es la moda.

Ejemplo 1:

La inversión anual (en miles de nuevos soles) de un grupo de pequeñas em-presas de la ciudad fueron:

Calcule e interprete la moda.

Solución:

Buscamos el valor que más se repita, en este caso es: Mo =30

Interpretación: Las pequeñas empresas con mayor frecuencia han invertido 30 mil nuevos soles al año.

b.2 Para Datos Agrupados

Se aplica el siguiente estadígrafo:

Ejemplo 2: Variable Discreta

Se selecciona al azar 280 vendedores de una gran compañía constructora de casas. A continuación se muestra el número de casas vendidas durante el último bimestre. Calcule e interprete la media

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

Page 44: A0175 Estadistica I MAU01

44

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Calcular e interpretar la Moda.

Solución:

El cálculo es bastante sencillo, sólo ubicamos el valor que tenga la mayor frecuencia, que para el ejercicio es:

Mo=

Ejemplo 3: Variable Continua

La siguiente tabla de distribución de frecuencias corresponde al rendimiento de gasolina en kilómetros por litro de una muestra de 50 automóviles produ-cidos por Nissan México.

Solución:

Para aplicar los valores en:

debemos encontrar la clase “j” denominada “clase modal”

La clase modal es aquella que tenga la mayor frecuencia, entonces para noso-tros es la clase que tiene la frecuencia ____

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

Page 45: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 45

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Entonces aplicando en la fórmula:

Características de la moda:

• La moda se puede calcular para cualquier escala de medición.

• El valor de la moda no se ve afectada por valores extremos.

• La moda se puede calcular aun cuando uno o más intervalos sean de extre-mo abierto.

• La moda no siempre es un valor único. Una serie de datos puede tener dos modas (bimodal) o más modas (multimodal).

• Algunas series de datos no tienen moda.

• La moda es una medida menos importante que la mediana o la media debi-do a su ambigüedad.

• La moda no tiene propiedades matemáticas valiosas para poder usarlas en otros cálculos.

IMPORTANTE:

Medidas de tendencia central y el sesgo de la distribución de frecuencias

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

Page 46: A0175 Estadistica I MAU01

46

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

TEMA Nº 2: MEDIDAS DE DISPERSIÓN

Estimado alumno, es muy usual que las decisiones que se tomen se basen exclusivamen-te en los indicadores estadísticos que estamos estudiando, por lo que no solo basta con obtener las medidas de tendencia central, es necesario saber también cuál es el nivel de homogeneidad que tienen las series de datos que estamos analizando, que tan alejados del promedio están cada uno de los datos y cual es justamente el promedio de ese ale-jamiento que le llamaremos desviación. El tema que a continuación te presento trata justamente de lo expuesto.

MEDIDAS DE DISPERSIÓN

El análisis estadístico o el estudio de una serie estadística no puede quedarse sólo en el cálculo de las medidas de tendencia central o de posición tales como la media, mediana, moda, percentiles, ya que no estaríamos siendo absolutamente fieles a la realidad, suele existir datos extremos inferiores y superiores a la media aritmética, los cuales no están siendo bien representados por este parámetro, hay veces que la media, por sí sola, no es muy significativa. Además puede ocurrir que series absolutamente distintas pueden tener medias iguales y este hecho no significa que las distribuciones sean exactamente iguales. Por lo tanto es necesario profundizar en su estudio, para lo cual se requiere ver si los valores de la variable están muy o poco separados de la media aritmética.

La media aritmética es más representativa cuanto más agrupados estén los valores de la serie respecto a ella y al revés y a la mayor o menor separación de los valores respecto a la media se le llama dispersión o variabilidad.

Para medir el grado de dispersión de una variable, se utilizan principalmente los si-guientes indicadores o medidas de dispersión:

7. Rango o recorrido

8. Recorrido semi intercuartil

9. Desviación media

10. Varianza

11. Desviación típica o estándar

12. Coeficiente de variabilidad

1 RANGO O RECORRIDO

Es la medida de dispersión más sencilla ya que sólo considera los dos valores extre-mos de una colección de datos, sin embargo, su mayor utilización está en el campo de la estadística no paramétrica.

Cálculo del Rango

R=Xmax–Xmin

2 RECORRIDO SEMI INTERCUANTIL

La desviación cuartil de un conjunto de datos está definida por:

Q=(Q3-Q1)/2

Donde Q3 y Q2 son el primer y tercer cuartil de los datos. A veces se usa el “Reco-rridointercuartilQ3–Q1“

El recorrido semi-intercuartil o desviación cuartil, da una idea de la dispersión del 50% de los datos centrales. Suele utilizarse cuando la mediana es el índice más representativo.

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

Page 47: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 47

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

3 DESVIACIÓN MEDIA

La desviación media, mide la distancia absoluta promedio entre cada uno de los datos, y el parámetro que caracteriza la información. Usualmente se considera la desviación media con respecto a la media aritmética:

Cuanto más alta es la desviación absoluta media mayor es la dispersión y menos representativa la media aritmética.

Cálculo de la Desviación Media

Para datos no agrupados Para datos agrupados

4 VARIANZA

La varianza es uno de los parámetros más importantes en estadística paramétrica, se puede decir que, teniendo conocimiento de la varianza de una población, se ha avanzado mucho en el conocimiento de la población misma.

Numéricamente definimos la varianza, como desviación cuadrática media de los datos con respecto a la media aritmética.

La varianza nos mide la mayor o menor representatividad de la media aritmética:

- Si la varianza es grande nos indica gran dispersión, la media aritmética no es re-presentativa.

- Si casi todos los valores están muy cercanos a la media aritmética entonces la va-rianza se acercará a cero, con lo que se dice que la serie es concentrada.

- La varianza nunca puede ser negativa.

De su forma de cálculo se desprenden dos problemas:

- Se expresa en unidades cuadradas (nuevos soles cuadrados, minutos cuadrados, etc.)

- Si la media aritmética no es una buena medida de tendencia central, la varianza que se basa en ella tampoco será una buena medida de dispersión.

a. Simbología

S2 : Varianza de la muestra

σ2 : Varianza de la Población

b.CálculodelaVarianza

b.1 Para Datos no Agrupados

Varianza de la Muestra Varianza de la Población

La inversión anual (en miles de nuevos soles) de un grupo de pequeñas empresas de la ciudad fueron:

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

Page 48: A0175 Estadistica I MAU01

48

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio AnotacionesCalcule la varianza

Solución:

Para aplicar: debemos calcular

(calculado en la página 33 )

Entonces aplicando a la fórmula de la varianza:

b.2 Para datos agrupados

Ejemplo 2: Variable Discreta

Se selecciona al azar 280 vendedores de una gran compañía constructora de casas. A continuación se muestra el número de casas vendidas durante el último bimestre. Calcule e interprete la media

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

Page 49: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 49

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Solución:

Para aplicar: debemos calcular

(calculado en página 33 )

Completando la siguiente tabla para el cálculo de la varianza

Lavarianzaes:=

Otra solución:

Se puede aplicar:

Completando la siguiente tabla para el cálculo de la varianza

Reemplazando en:

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

Page 50: A0175 Estadistica I MAU01

50

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Ejemplo 3: Variable Continua

La siguiente tabla de distribución de frecuencias corresponde al rendimien-to de gasolina en kilómetros por litro de una muestra de 50 automóviles producidos por Nissan México.

Solución:

Para aplicar: debemos calcular

(calculado en pág 34)

Completando la siguiente tabla para el cálculo de la varianza:

La varianza es:

Otra solución:

Se puede aplicar: |

Propiedadesdelavarianza

1. La varianza es un número real no negativo y viene expresado en unida-des cuadráticas, mientras que la desviación estándar viene expresada en

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

Page 51: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 51

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

las mismas unidades en las que vienen expresados los datos.

2. Sicadaunodelosnvaloresxiestransformadoen:yi=a.xi+b,siendoa y b constantes, entonces, la varianza de los n valores yi es:

Como casos particulares se tiene:

• Siyi=b,entonces . Si los n datos son iguales a una constante b, entonces la varianza (y la desviación estándar) es igual a cero.

• Siyi=xi+b,entonces . Si a cada dato se le suma una constan-te b, la varianza (y la desviación estándar) no cambian.

• Siyi=a.xi,entonces . Si a cada dato se le multiplica por una constante a, la varianza de los nuevos valores es igual a la varianza de los valores iniciales multiplicada por a2.

3. La varianza depende del valor de todos los datos y es sensible a la varia-ción de cada uno de ellos.

4. La varianza puede ser calculada también con datos agrupados en inter-valos, inclusive de amplitud diferente, siempre que se puedan determi-nar las marcas de clase.

5. Desigualdad de Tchebysheff: Independientemente de la forma de la distribución de frecuencias de los datos, el intervalo , donde k > 1, contiene por lo menos el:

de los datos.

5 DESVIACIÓN ESTÁNDAR O TÍPICA

Para eliminar el problema de la elevación al cuadrado de la varianza, se realiza una transformación consistente en calcular la raíz cuadrada de la varianza con lo que obtendríamos la desviación estándar o típica

Con lo que la desviación estándar o típica vendrá dada en las mismas unidades que los valores de la variable.

- La desviación estándar o típica siempre es positiva porque la varianza también lo es.

- La desviación estándar o típica es la medida de dispersión óptima, más exacta, más estable y más utilizada, sirviendo de base para las medidas de asimetría, estadísti-cos típicas y correlación.

- Cuanto más se acerca a cero la desviación más concentrada es la serie.

- Suele decirse que cuando la desviación estándar o típica es menor que la media aritmética la serie es concentrada y sí la desviación estándar o típica es mayor que la media aritmética la serie es dispersa.

Ejemplo 1:

La inversión anual (en miles de nuevos soles) de un grupo de pequeñas empresas de la ciudad fueron:

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

Page 52: A0175 Estadistica I MAU01

52

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Calcule e interprete la desviación estándar

Solución:

Interpretación: La inversión promedio anual de las pequeñas empresas varían ± 8 069 nuevos soles.

Ejemplo 2: Variable Discreta

Se selecciona al azar 280 vendedores de una gran compañía constructora de casas. A continuación se muestra el número de casas vendidas durante el último bimestre. Calcule e interprete la media

Solución:

entoncess=

Ejemplo 3: Variable Continua

La siguiente tabla de distribución de frecuencias corresponde al rendimiento de gasolina en kilómetros por litro de una muestra de 50 automóviles producidos por Nissan México.

Solución:

entoncess=

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

Page 53: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 53

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

6 COEFICIENTE DE VARIABILIDAD

Con frecuencia nos interesa establecer comparaciones de la dispersión, entre dife-rentes muestras que posean distintas unidades de medida (por ejemplo, nuevos so-les con dólares), las medidas de dispersión antes mencionadas no permiten realizar este tipo de comparaciones, pero es el coeficiente de variabilidad quien nos ayuda a realizar estas comparaciones.

El coeficiente de variabilidad es una medida de dispersión relativa (sin unidades de medida) tiene en cuenta el valor de la media aritmética, para establecer un número relativo, que hace comparable el grado de dispersión entre dos o más variables, y se define como:

Para determinar la homogeneidad (tiene menor variabilidad) de dos o más mues-tras que tienen diferente unidad de medida, se elige aquella que tenga el menor CV.

Ejemplo 1:

La inversión anual (en miles de nuevos soles) de un grupo de pequeñas empresas de la ciudad fueron:

Calcule e interprete el coeficiente de variación

Solución:

Para calcular el coeficiente de variación, debemos calcular la media y la desviación estándar, por los ejercicios anteriores tenemos: ys=8.069038047

Entonces

Interpretación: La inversión de las pequeñas empresas en altamente dispersas (he-terogénea)

Ejemplo 2: Variable Discreta

Se selecciona al azar 280 vendedores de una gran compañía constructora de casas. A continuación se muestra el número de casas vendidas durante el último bimestre. Calcule e interprete la media

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

Page 54: A0175 Estadistica I MAU01

54

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Solución:

Para calcular el coeficiente de variación, debemos calcular la media y la desviación estándar, por los ejercicios anteriores tenemos: ys=

Entonces

CV=__________________*100CV=

Ejemplo 3: Variable Continua

La siguiente tabla de distribución de frecuencias corresponde al rendimiento de gasolina en kilómetros por litro de una muestra de 50 automóviles producidos por Nissan México.

Solución:

Para calcular el coeficiente de variación, debemos calcular la media y la desviación estándar, por los ejercicios anteriores tenemos:

ys=

Entonces

CV=__________________*100

CV=

TEMA Nº 3: MEDIDAS DE POSICÍON, ASIMETRÍA Y CURTOSIS

1 CUANTILES

Sucede también con frecuencia que al investigador o al analista le interesa reducir la distribución de frecuencias de una variable a ciertas estructuras porcentuales que le sirvan como patrón para efectuar comparaciones entre segmentos equivalentes de otras distribuciones similares.

Los cuantiles son los valores de la variable debajo de los cuales caen determinados porcentajes de frecuencia.

a. Cuantiles más frecuentes

Centil:

También conocido como percententil o porcentil. El centil k, Pk. es el valor nu-mérico tal que el k por ciento de los datos ordenados está por debajo de ese valor yel(100–k)porcientodelosdatosestáporencimadeesevalor.

Decil:

Se denomina así a cada uno de los nueve centiles: P10, P20, P30… P90 y se les deno-ta como D1, D2, D3, …, D9 respectivamente.

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

Page 55: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 55

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Cuartil:

Se denomina así a cada uno de los tres centiles: P25, P50, P75 y se les denota como Q1, Q2 y Q3 respectivamente.

Además, se define el rango intercuartil (llamado también propagación media) como la diferencia entre el tercer cuartil y el primer cuartil en una serie de datos, es decir:

Rangointercuartil=Q3–Q1

b. Cálculo de los Percentiles

Si para calcular la mediana buscábamos el ordinal correspondiente a n/2, o lo queeslomismo50*n/100,paracalcularcualquierpercentilharemoslomismopero partiendo de que el ordinal que queremos buscar será el correspondiente ai*n/100.

Hecholoanteriorelcálculodecualquierpercentilsiguelosmismospasosquelos seguidos en el cálculo del percentil 50 (mediana).

Para Datos Agrupados

Ejemplo 2: Variable Discreta

Se selecciona al azar 280 vendedores de una gran compañía constructora de casas. A continuación se muestra el número de casas vendidas durante el último bimestre. Calcule e interprete:

1. Cuartil 1 5. Decil 9

2. Cuartil 2 6. Percentil 5

3. Cuartil 3 7. Percentil 78

4. Decil 3 8. Percentil 99

Cálculo de Cuartil 1:

Solución:

Como los datos tabulados ya están ordenados, debemos encontrar el valor de la variablequecontieneeli=25%delosdatos,entoncescalculamosel25%de“n”:

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

Page 56: A0175 Estadistica I MAU01

56

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Entonces ubicamos en la tabla el valor que tenga la posición ___, para eso calcu-lamos la frecuencia acumulada

Entonces el cuartil 1 es: Q1=P25=

1.Q1= 5.D9=

2.Q2= 6.P5=

3.Q3= 7.P78=

4.D3= 8.P99=

Ejemplo 3: Variable Continua

La siguiente tabla de distribución de frecuencias corresponde al rendimiento de gasolina en kilómetros por litro de una muestra de 50 automóviles producidos por Nissan México. Calcule:

1. Cuartil 1 5. Decil 9

2. Cuartil 2 6. Percentil 5

3. Cuartil 3 7. Percentil 78

4. Decil 3 8. Percentil 99

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

Page 57: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 57

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Cálculo de Cuartil 1

Solución:

Para aplicar los valores en: debemos encontrar la clase “j” denominada “clase del i-ésimo percentil”.

Laclasedeli-ésimopercentilesaquellaquecontieneeli%=25%delconjuntode

datos, esto es el que contenga la posición , para eso calculamos la frecuencia acumulada:

Entonces aplicando en la fórmula:

Q1=P25=

1. Q1= 5.D9=

2. Q2= 6.P5=

3. Q3= 7.P78=

4. D3= 8.P99=

2 MEDIDAS DE CURTOSIS

La curtosis es la característica de una distribución de frecuencias en la cual se com-para la dispersión de los datos observados cercanos al valor central con la disper-sión de los datos cercanos a ambos extremos de la distribución, Se aplica cuando la distribución es simétrica.

Se calcula mediante:

Interpretación:

Si K tiende a 0 la distribución es normal o mesocúrtica

Si K tiende a 0.5 es leptocúrtica

Si K tiende a -0.5 es platicúrtica

Ejemplo 2: Variable Discreta

Se selecciona al azar 280 vendedores de una gran compañía constructora de casas. A continuación se muestra el número de casas vendidas durante el último bimestre. Calcule e interprete el coeficiente de curtosis.

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

Page 58: A0175 Estadistica I MAU01

58

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Solución:

Para calcular el coeficiente de curtosis, debemos calcular:

P10= P75=

P25= P90=

Entonces : K=____________-

K=

Ejemplo 3: Variable Continua

La siguiente tabla de distribución de frecuencias corresponde al rendimiento de gasolina en kilómetros por litro de una muestra de 50 automóviles producidos por Nissan México. Calcule el coeficiente de curtosis:

Solución:

Para calcular el coeficiente de curtosis, debemos calcular:

P10= P75=

P25= P90=

Entonces : K=____________-

K=

3 MEDIDAS DE ASIMETRÍA

En la Parte I de Medidas de descriptivas, se mencionó la relación empírica de las tres medidas de tendencia central: Media, Mediana y Moda, la cual nos mostraba el tipo de distribución de una serie de datos. Ahora determinaremos esta relación pero mediante un indicador más representativo que se le conoce como el índice de Asimetría. El índice de asimetría de Pearson se define como

En distribuciones asimétricas se verifica que : , entonces el índice de asimetría es:

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

Page 59: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 59

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Interpretación:

SiAs=0,Ladistribuciónessimétrica,estoes

Si As > 0, La distribución es asimétrica positiva, esto es

Si As < 0, La distribución es asimétrica negativa, esto es

Ejemplo 1: Datos no clasificados

La inversión anual (en miles de nuevos soles) de un grupo de pequeñas empresas de la ciudad fueron:

Calcule e interprete el coeficiente de asimetría.

Solución:

Para calcular el coeficiente de asimetría, debemos calcular la media, la mediana y la desviación estándar, por los ejercicios anteriores tenemos:

Entonces:

Interpretación: La distribución de la inversión anual de las pequeñas empresas muestra una ligera distribución asimétrica positiva, esto es que más del 50% de las pequeñas empresas invierten menos de 20 125 nuevos soles al año.

Ejemplo 2: Variable Discreta

Se selecciona al azar 280 vendedores de una gran compañía constructora de casas. A continuación se muestra el número de casas vendidas durante el último bimestre. Calcule e interprete el coeficiente de asimetría.

Solución:

Para calcular el coeficiente de asimetría, debemos calcular la media, mediana y la desviación estándar, por los resultados de los ejercicios anteriores tenemos: x = ; Me=ys=

Entonces: As=_______________

As=

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

Page 60: A0175 Estadistica I MAU01

60

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Ejemplo 3: Variable Continua

La siguiente tabla de distribución de frecuencias corresponde al rendimiento de gasolina en kilómetros por litro de una muestra de 50 automóviles producidos por Nissan México. Calcule e interprete el coeficiente de variación.

Solución:

Para calcular el coeficiente de asimetría, debemos calcular la media, mediana y la desviación estándar, por los resultados de los ejercicios anteriores tenemos: x = ; Me=ys=

Entonces: As=_______________

As=

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

LECTURA SELECCIONADA N° 2

¿Los Premios de la Academia discriminan por la edad?

Estadística. Mario Triola. Pág. 75

Cada año se otorgan Óscares a la mejor actriz y al mejor actor. En la tabla se presenta una lista con las edades de los galardonados en el momento de la ceremonia de entrega de los premios. Las edades aparecen en orden, empezando con la primera ceremonia de los Premios de la Academia en 1928. [Notas: En 1968 hubo un empate en la catego-ría de mejor actriz, y se utilizó el promedio (la media) de las dos edades; en 1932 hubo un empate en la categoría de mejor actor, y se utilizó el promedio (la media) de las dos edades. Tales datos se basan en el artículo "Ages of Oscar-winning Best Actors and Ac-tresses", de Richard Brown y Gretchen Davis, en la revista Mathematics Teacher. En ese artículo, el año de nacimiento del ganador del premio se restó del año de la ceremonia; no obstante, las edades de la tabla se basan en la fecha de nacimiento del ganador y en la fecha de la ceremonia de premiación]. La pregunta básica que consideraremos es: ¿Haydiferenciasimportantesentrelasedadesdelasmejoresactricesylasedadesdelosmejores actores? ¿Al parecer los actores y las actrices son juzgados estrictamente por sus habilidades artísticas? O hien, ¿existe discriminación por la edad y las mejores actrices suelensermásjóvenesquelosmejoresactores?¿Hayalgunasotrasdiferenciaseviden-tes? Además de ser interesante, esto es importante porque nos brinda información so-bre la forma en que nuestra sociedad percibe a los hombres y a las mujeres en general.

Una comparación visual entre las edades de la tabla sería reveladora para las perso-nas que tienen una habilidad especial para observar un orden en este tipo de listas de números; sin embargo, para nosotros los simples mortales, es probable que la lista no revele mucha información. Afortunadamente, se dispone de métodos para investigar este tipo de conjuntos de datos, y pronto veremos que tales procedimientos revelan características importantes que nos permiten entender los datos. Seremos capaces de hacer comparaciones inteligentes y reveladoras; aprenderemos técnicas para resumir, graficar, describir, explorar y comparar conjuntos de datos como los de la tabla.

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

Page 61: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 61

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Tabla: Premios de la Academia: Edades de las mejores actrices y los mejores actores

Las edades (en años) aparecen en orden, empezando con la primera ceremonia de premiación.

El problema incluye las edades de los ganadores del Óscar a la mejor actriz y al mejor actor. Con lo aprendido utilizamos distribuciones de frecuencias y gráficas para inves-tigar si las edades de las actrices eran significativamente diferentes de las edades de los actores. Con base en los resultados obtenidos, parece que las actrices ganadoras del Óscar son más jóvenes que los actores ganadores de este premio.

En el presente capítulo continuamos investigando si existe una discrepancia en las eda-des, pero incluirnos nuevas herramientas que servirán para comparar los dos conjuntos de datos. Las distribuciones de frecuencias y las gráficas del capítulo anterior no resul-tan afectadas si los datos corresponden a una muestra o a una población completa. Sin embargo, esta diferencia sí afecta a algunas de las herramientas que se presentan en este capítulo. Se podría decir que los datos constituyen una población, ya que incluyen la edad de cada ganador del Óscar como mejor actor y mejor actriz desde la primera ceremonia de Premios de la Academia, celebrada en 1928, hasta los últimos resultados disponibles en el momento en que se escribe este libro. En vez de considerar que las edades son datos poblacionales, los manejaremos como datos muestrales que se obtu-vieron de una población más grande. Algunos puristas podrían manifestarse en contra de esto, pero es un enfoque común que nos permite enfrentar preguntas importantes como ésta: ¿Existe una diferencia significativa entre la edad promedio (media) de las mejores actrices y la edad promedio (media) de los mejores actores? Los métodos que se estudiaron en el capítulo anterior nos permitieron construir distribuciones de fre-cuencias y gráficas que resumen y presentan visualmente la distribución de los datos.

Los métodos que se presentan en este capítulo nos permitirán calcular valores numéri-cos de estadísticos importantes. (En el capítulo anterior aprendimos que un estadístico es una medición numérica que describe alguna característica de una muestra, en tanto que un parámetro es una medición numérica que describe alguna característica de una población). En vez de basarnos únicamente en distribuciones de frecuencias y gráficas, ahora empezaremos a incluir estadísticos importantes al comparar las edades de las mejores actrices y los mejores actores. Después de calcular los valores de estadísticos importantes, estaremos más preparados para comparar los dos conjuntos de datos y para responder la siguiente pregunta fundamental: ¿Existen diferencias sustanciales e importantes entre las edades de las mejores actrices y las edades de los mejores actores?

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

ACTIVIDAD N° 2

Esta actividad puede consultarla en su aula virtual.

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

Page 62: A0175 Estadistica I MAU01

62

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

GLOSARIO

- Asimetría: Coeficiente que mide la nivel de dispersión de una serie de datos respec-to a la media.

- Cuartil medio: La mitad de la suma de los cuartiles primero y tercero.

- Cuartiles: Los tres valores que dividen datos ordenados en cuatro grupos, con apro-ximadamente el 25% de los valores en cada grupo.

- Desviación Estandar: Medida de variación igual a la raíz cuadrada de la varianza.

- Media: La suma de un conjunto de valores, dividida entre el número de valores.

- Mediana: Valor que está a la mitad de un conjunto de valores acomodados en orden por magnitud.

- Medida correctiva: Acción que se realiza a un punto crítico para que pueda estar dentro de los límites de control.

- Medida de tendencia central: Valor que pretende indicar el centro de los valores de una colección de datos.

- Medida de variación: Cualquiera de varias medidas diseñadas para reflejar la mag-nitud de la variación o dispersión de un conjunto de valores.

- Moda: Valor que se presenta con mayor frecuencia.

- Multimodal: Se dice que un conjunto de datos es multimodal cuando tiene más de dos modas.

- Punto Crítico: Observación que está fuera de los límites de control.

- Rango de percentiles 10-90: Diferencia entre los percentiles décimo y nonagésimo.

- Sesgado: No simétrico y que se extiende más hacia un lado que hacia el otro.

- Sesgo negativo: Sesgado hacia la izquierda.

- Sesgo positivo: Sesgado hacia la derecha.

- Varianza: Promedio de las desviaciones cuadráticas de cada dato respecto a la media

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

BIBLIOGRAFÍA DE LA UNIDAD II

1. Triola Mario F. ESTADÍSTICA. Pearson Educación. México 2012

2. Berenson, Mark y Levine, David. Estadística Básica en Administración, Conceptos y aplicaciones.PrenticeHall,México2010

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

AUTOEVALUACIÓN DE LA UNIDAD II

1. Indique: “Estadígrafo que en valor es igual a la mediana”

a) Q1 b) P3 c) Q2

d) Q3 e) P5

2. Determine la proposición correcta respecto a la siguiente distribución de frecuen-cias

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

Page 63: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 63

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

a) No se puede calcular la media aritmética pero sí la mediana.

b) La media, mediana y moda sí se pueden calcular.

c) La media aritmética es el estado civil “casado”.

d) La mediana es el estado civil “casado”.

e) La medida de tendencia central más confiable en estos datos es la moda

3. En el cuadro adjunto, ¿cuál es el sueldo del 57% de la población mostrada?.

a) 62,48 b) 61,43 c) 67,23

d) 65,97 e) 63,88

4. Los siguientes datos muestran las calificaciones de una muestra de 10 personas so-metidas a una prueba de aptitud: 16; 19; 13; 20; 14; 16; 19; 18; 17; 15. Calcular la desviación estándar de dichas calificaciones.

a) 2,31 b) 16,34 c) 18,02

d) 18,23 e) 19,1

5. El histograma de la distribución correspondiente al peso de 100 alumnos de Bachi-llerato es el siguiente:

Calcule la desviación estándar de los pesos de los alumnos.

a) 2,9 Kg b) 4,3 Kg c) 1,8 Kg

d) 4,6 Kg e) 6,8 Kg

UNIDAD II: ANÁLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADÍSTICOS

Page 64: A0175 Estadistica I MAU01
Page 65: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 65

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

UNIDAD III: PROBABILIDAD

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

DIAGRAMA DE PRESENTACIÓN DE LA UNIDAD III

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

ORGANIZACIÓN DE LOS APRENDIZAJES

CONOCIMIENTOS PROCEDIMIENTOS ACTITUDES

2° Clase Presencial/ Virtual (Video conferencia)

Tema N° 1: Fundamentos de Probabilidad y Reglas Básicas.1. Definiciones básicas, suce-

sos y probabilidades.2. Regla de la suma y multipli-

cación Tema N° 2: Probabilidad Total y Teorema de Bayes1. Teorema de la probabili-

dad total.2. Teorema de Bayes.

Tema N° 3: Técnicas de Conteo1. Técnicas de conteo 2. Combinaciones y permu-

tacionesLectura seleccionada 1:¿Debe preocuparse de que le realicen una prueba de detec-ción de drogas cuando solicite un trabajo?.Autoevaluación N° 03

1. Identifica elementos de experimentos aleatorios.

2. Calcula la probabilidad de eventos aleatorios.

Actividad N°1:Aplica las propiedades funda-mentales de la probabilidad en distintas situaciones.

3. Calcula la probabilidad de eventos aleatorios.

4. Calcula la probabilidad utilizando técnicas de con-teo.

Actividad N°2:Resuelve ejercicios y proble-mas aplicando técnicas de conteo y el teorema de Bayes.

Control de Lectura Nº 2

Valora de manera reflexiva la importancia de las Proba-bilidades en todo campo de la ciencia.

CONTENIDOS

AUTOEVALUACIÓN

EJEMPLOS

BIBLIOGRAFÍA

ACTIVIDADES

Page 66: A0175 Estadistica I MAU01

66

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

UNIDAD III: PROBABILIDAD

TEMA Nº 1: FUNDAMENTOS DE PROBABILIDAD Y REGLAS BÁSICAS

En alguna ocasión te has preguntado cuál es la probabilidad de que suceda algún suce-so, como por ejemplo, la probabilidad de que mañana llueva, la probabilidad de que algún equipo de fútbol gane un partido, o la probabilidad de ganar un premio y hasta la probabilidad de acertar una pregunta con alternativas al marcarla al azar. Nos damos cuenta que vivimos en un mundo que es incapaz de predecir el futuro con total certeza lo cual genera el estudio y uso de la teoría de la probabilidad, la cual nos permitirá re-conocer y ordenar nuestras suposiciones para poder tomar alguna decisión de manera más concreta y con fundamento. Te invito entonces a conocer el mundo de las probabi-lidades teniendo una probabilidad alta de que te va a gustar.

1 DEFINICIONES BÁSICAS, SUCESOS Y PROBABILIDADES

1.1 PROBABILIDAD.

La probabilidad es una medida de la posibilidad que tiene un evento de ocurrir. Los valores de probabilidad siempre se asignan en una escala de cero a uno. Una probabilidad cercana a cero indica que el evento tiene muy pocas posibilidades de ocurrir, mientras que una probabilidad cercana a uno indica que es casi se-guro que ocurra dicho evento. La probabilidad proporciona la posibilidad de medir, expresar y analizar la incertidumbre asociada a eventos futuros.

1.2 EXPERIMENTO.

Dentro del punto de vista de la probabilidad se define un experimento como cualquier proceso que genera un conjunto de resultados bien definidos. En cualquier ejecución del experimento ocurrirá solamente uno de los posibles re-sultados experimentales.

A continuación se presentan algunos ejemplos de experimentos y sus resultados asociados.

Para analizar un experimento en particular es necesario definir cuidadosamente los resultados experimentales posibles.

1.3 ESPACIO MUESTRAL.

El espacio muestral es el conjunto de todos los resultados posibles generados por un experimento. Cada resultado experimental se conoce también como punto muestral y corresponde a un elemento del espacio muestral.

Si suponemos que S denota el espacio muestral entonces:

UNIDAD III: PROBABILIDAD

Page 67: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 67

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

1.4 DETERMINACIÓN DE PROBABILIDADES.

A partir de la comprensión de los conceptos de experimento y espacio mues-tral, veamos cómo pueden determinarse las probabilidades para los resultados experimentales. Al asignarse estas probabilidades se deben satisfacer dos reque-rimientos básicos de probabilidad.

1. Los valores de probabilidad asignados deben estar entre cero y uno. Si deno-ta el -ésimo resultado experimental y indica su probabilidad asociada, entonces:

2. La suma de todas las probabilidades asociadas a los resultados experimenta-les debe ser igual a uno. Si el espacio muestral tiene resultados experimen-tales, entonces:

Cualquier método para asignar valores de probabilidad a los resultados experi-mentales que satisfaga estos dos requerimientos y produzca medidas numéricas razonables es aceptable. En la práctica, se emplean con frecuencia el método clásico, el método de frecuencia relativa y el método subjetivo.

1.4.1 Método clásico

El método clásico de asignación de probabilidades supone que cada resul-tado experimental tiene la misma posibilidad de ocurrir. Si un experimen-to tiene resultados posibles el método clásico asignaría una probabilidad de a cada resultado experimental.

EJEMPLO 1: Si se considera el experimento de lanzar una moneda, en cualquiera de estos lanzamientos se observará Cara o Sello. Una supo-sición razonable, en caso la moneda no esté trucada, es que cualquiera de estos resultados experimentales es igualmente probable, es decir

.

EJEMPLO 2: Considere el experimento de lanzar un dado. Si el dado fue diseñado de modo que los seis resultados experimentales sean igualmente probables entonces se cumple que .

Este método fue elaborado originalmente para analizar probabilidades en los juegos de azar, donde la suposición de resultados igualmente probables frecuentemente es razonable. Sin embargo en muchas otras situaciones esta suposición no es válida por lo que se requieren métodos alternativos para asignar las probabilidades.

UNIDAD III: PROBABILIDAD

Page 68: A0175 Estadistica I MAU01

68

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

1.4.2 Método de frecuencia relativa

El método de frecuencia relativa está basado en los datos observados sobre el proceso o fenómeno bajo estudio. Para su determinación se necesita obtener datos mediante pruebas, entrevistas, etc. los cuales se resumen en una tabla de resultados (la tabla de distribución de frecuencias). La frecuencia relativa de un resultado (cantidad de resultados favorables en-tre total de resultados) se considera como la probabilidad de ocurrencia, siempre y cuando las condiciones bajo las cuales se obtuvieron los resulta-dos se mantengan a futuro.

1.4.3 Método subjetivo

Este método es apropiado cuando no se puede suponer de manera realista que todos los resultados experimentales son igualmente probables y cuan-do se dispone de pocos datos relevantes. Cuando se emplea este método podemos usar cualquier información disponible como nuestra experien-cia o intuición. Después de considerar toda esa información se especifica un valor de probabilidad que exprese nuestro grado de creencia, en una escala de cero a uno, sobre las posibilidades de ocurrir que tiene el resulta-do experimental de interés. Usando el método subjetivo puede esperarse que diferentes personas asignen probabilidades diferentes al mismo resul-tado experimental.

EJEMPLO 1: ¿Cuál es la probabilidad de que mañana por la tarde llueva?

EJEMPLO 2: ¿Cuál es la probabilidad de salir al parque y encontrar a tres personas que hayan probado la gaseosa de marca Inka Kola, la bebida de sabor nacional?

1.5 PROBABILIDAD DE UN EVENTO

Un evento es una colección específica de puntos muestrales. Considere el expe-rimentodelanzarundado,cuyoespaciomuestralesS={1,2,3,4,5,6}.SisedefineeleventoAcomoobtenerunnúmeroimpar,entoncesA={1,3,5}.Portanto, si el resultado experimental fuese 1, 3 o 5 se diría que ha ocurrido el even-to A. Si se conocen las probabilidades de los puntos muestrales, la probabilidad de un evento es igual a la suma de las probabilidades de los puntos muestrales que la componen. Es decir que

Siempre que podamos identificar todos los puntos muestrales de un experimen-to y asignarles las correspondientes probabilidades podemos usar el enfoque anterior para calcular la probabilidad de un evento cualquiera. Sin embargo, en muchos experimentos la cantidad de puntos muestrales es grande y su identifi-cación, al igual que la determinación de sus probabilidades, se vuelve demasiado compleja o, incluso, imposible. Mas adelante estudiaremos algunas relaciones básicas de probabilidad para calcular la probabilidad de un evento sin conocer todas las probabilidades individuales de los puntos muestrales que la componen.

Complemento de un evento

Para un evento A cualquiera, se define su complemento como el evento consis-tente en todos los puntos muestrales que no están en A. El complemento del evento A se denota con AC. La Figura muestra una representación conocida como Diagrama de Venn, que ilustra el concepto del complemento. El área rec-tangular representa el espacio muestral para el experimento y como tal contiene todos los puntos muestrales posibles. El círculo representa el evento A y solo contiene los puntos muestrales que le pertenecen. El resto del rectángulo som-breado contienen todos los puntos muestrales que no están en el evento A, el cual por definición es el complemento de A.

UNIDAD III: PROBABILIDAD

Page 69: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 69

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

En cualquier aplicación de probabilidad, el evento A y su complemento AC de-ben satisfacer la condición:

Despejando se tiene .

2 REGLA DE LA SUMA Y MULTIPLICACIÓN

2.1 REGLA DE LA SUMA (ADICIÓN)

La regla de la adición es una relación útil cuando tenemos dos eventos y estamos interesados en conocer la probabilidad que ocurra al menos uno de ellos. Es decir, si tenemos los eventos A y B, estamos interesados en conocer la probabi-lidad que ocurra el evento A, el evento B o ambos simultáneamente. Antes de presentar la ley de la adición se necesita exponer dos conceptos relacionados a la combinación de eventos: la unión y la intersección de eventos.

Para dos eventos A y B, la unión del evento A con el evento B es el evento que contienen todos los puntos muestrales que pertenecen a A o a B o a ambos. La unión se denota por . El diagrama de Venn que se muestra en la Figura describe la unión de los eventos A y B.

Para dos eventos A y B, la intersección de los eventos A y B es el evento que con-tienen todos los puntos muestrales que pertenecen tanto a A como a B, es decir, que son comunes a ambos conjuntos. La intersección se denota por . El diagrama de Venn que se muestra en la Figura describe la intersección de los eventos A y B.

UNIDAD III: PROBABILIDAD

Page 70: A0175 Estadistica I MAU01

70

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

La ley de la adición permite encontrar la probabilidad de la unión de dos even-tos usando la siguiente relación:

Ejemplo: La probabilidad que un sistema de comunicación de datos tenga una selectividad elevada es 0.72, la probabilidad que tenga alta fidelidad es 0.59 y la probabilidad que tenga ambas características es 0.37. ¿Cuál es la probabilidad que el sistema de comunicación de datos tenga al menos una de las característi-cas mencionadas? Si se definen los eventos:

A=Sistemadecomunicacióndedatostieneunaselectividadelevada

B=Sistemadecomunicacióndedatostienealtafidelidad

Entonces, la probabilidad pedida es: .

2.1.1 EVENTOS MUTUAMENTE EXCLUYENTES.

Se dice que dos o más eventos son mutuamente excluyentes si los eventos no tienen ningún punto muestral en común, es decir, no hay puntos mues-trales en la intersección de los eventos. Para que dos eventos A y B sean mutuamente excluyentes se debe cumplir que . La Figura proporciona un diagrama de Venn que muestra dos eventos mutuamente excluyentes.

Si los eventos A y B son mutuamente excluyentes, entonces

2.1.2 PROBABILIDAD CONDICIONAL.

En muchas situaciones es importante poder determinar la probabilidad de un evento cuando se sabe que ha ocurrido otro. Suponga que tenemos un evento A con probabilidad y que obtenemos información nueva o nos enteramos que ha ocurrido otro, denotado B. Si el evento A se rela-ciona con B, desearemos sacar ventaja de esta información al calcular una probabilidad nueva o revisada para el evento A.

Esta nueva probabilidad del evento A se escribe . El símbolo “/“ denota el hecho que estamos considerando la probabilidad del evento A dada la condición que ha ocurrido el evento B. Por lo tanto, la notación

se lee “la probabilidad de A dado B”.

Con dos eventos A y B, la probabilidad condicional para A dado B, y la probabilidad condicional para B dado A son como siguen:

y en cada caso.

Para obtener una comprensión intuitiva del uso de las relaciones anterio-res consideremos el diagrama de Venn de la figura siguiente. La región

UNIDAD III: PROBABILIDAD

Page 71: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 71

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

sombreada (tanto en gris claro como en gris oscuro) denota que el evento B ocurrió; la región sombreada en gris oscuro denota el evento . Sabemos que una vez que ha ocurrido B, la única forma en que podemos observar también el evento A es que ocurra el evento . Por lo tanto la razón entre y proporciona la probabilidad que obser-vemos el evento A cuando ya ocurrió el evento B.

Ejemplo: Se estima que la probabilidad que la empresa A tenga éxito al comercializar su nuevo producto en el mercado es 0.75, la probabilidad que la empresa B tenga éxito al comercializar su nuevo producto en el mercado es 0.62 y la probabilidad que ambas empresas tengan éxito con sus respectivos productos es 0.45. ¿Cuál es la probabilidad que la empresa A tenga éxito al comercializar su nuevo producto, si se sabe que la empresa B también lo tuvo?

Si se definen los eventos:

A=LaempresaAtieneéxitoalcomercializarsuproducto

B=LaempresaBtieneéxitoalcomercializarsuproducto

Entonces

2.1.3 EVENTOS INDEPENDIENTES.

Dos eventos A y B son independientes si:

o , de otro modo, los eventos son depen-dientes.

Por lo tanto, dados dos eventos A y B, la ocurrencia del evento A no influye en la ocurrencia del evento B.

Ejemplo: Se tienen los eventos

A: Extraer un naipe de la baraja y que este resulte de color rojo.

B: Extraer un naipe de la baraja y que este resulte una espada.

Luego deducimos que los eventos A y B son independientes.

2.2 REGLA DE LA MULTIPLICACIÓN.

La regla de la multiplicación se usa para encontrar la probabilidad de la inter-sección de dos eventos. Se obtiene a partir de la definición de probabilidad condicional.

Ejemplo: El departamento de circulación de un periódico sabe que el 84% de sus clientes se suscribe a la edición diaria (lunes a sábado). Además la proba-bilidad que un cliente, que ya tiene suscripción diaria, se suscriba también a la edición dominical es 0.75. ¿Cuál es la probabilidad que un cliente se suscriba tanto a la edición diaria como a la dominical del periódico?

UNIDAD III: PROBABILIDAD

Page 72: A0175 Estadistica I MAU01

72

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Si se definen los eventos:

A=Unclientesesuscribelaedicióndiaria

B=Unclientesesuscribelaedicióndominical

entonces , .

Luego:

Notar que para el caso especial de eventos independientes, la ley de la multiplicación se convierte en:

Por lo tanto, para calcular la probabilidad de la intersección de dos eventos inde-pendientes solo multiplicamos las probabilidades correspondientes.

Ejemplo: El éxito de un proyecto de inversión depende del trabajo de un inge-niero, un administrador y un abogado. Se sabe que la probabilidad de que el ingeniero falle en su labor es de 4%, la probabilidad de que el administrador falle es de 6% y la probabilidad de que el abogado falle es de 8%. Para que el proyecto sea exitoso, ninguno de los 3 debe fallar. Asumiendo que las labores de los tres integrantes son independientes entre sí, ¿cuál es la probabilidad de que al final el proyecto falle?

Sean los eventos

A=Elingenierofalleensulabor

B=Eladministradorfalleensulabor

C=Elabogadofalleensulabor

D=Elproyectofalle

Luego .

TEMA Nº 2: PROBABILIDAD TOTAL Y TEOREMA DE BAYES

Como has podido observar, la teoría de la probabilidad maneja ciertas leyes o reglas que debemos respetar, del mismo modo cuando tenemos un evento que pertenece a un sistema y que se puede realizar de manera conjunta con varios eventos disjuntos entre sì indistintamente dentro del mismo sistema es posible que nosotros calculemos cuál es la probabilidad total de la ocurrencia de dicho evento como lo veremos a continuación. Por ejemplo si en un aula hay varones y mujeres, podremos calcular la probabilidad total de elegir a algún alumno y que este alumno (sin considerar el género) no sea de Huancayo.

1 TEOREMA DE LA PROBABILIDAD TOTAL

Si conocemos la probabilidad de B en cada uno de los componentes de un sistema exhaustivo y excluyente de sucesos donde participan los sucesos A1, A2, A3 y A4, entonces podemos calcular la probabilidad de B como la suma:

P(B)=P(B∩ A1)+P(B∩A2)+P(B∩ A3)+P(B∩ A4)

P(B)=P(B|A1)P(A1)+P(B|A2)P(A2)+P(B|A3)P(A3)+P(B|A4)P(A4)

UNIDAD III: PROBABILIDAD

Page 73: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 73

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Por lo tanto si generalizamos, para la Ley de la Probabilidad Total:

Supongamos que A1, A2, ... ,An son una partición de E,

es decir que los sucesos son mútuamente excluyentes entre sí (Ai∩Aj=φ para todo par) y su unión es E entonces se cumple

2 TEOREMA DE BAYES

Una etapa importante del análisis de las probabilidades condicionales consiste en revisar dichos valores cuando se obtiene nueva información. Con esta nueva infor-mación actualizamos los valores iniciales de probabilidad encontrando probabili-dades revisadas, conocidas como probabilidades posteriores. El teorema de Bayes proporciona un medio para hacer estos cálculos de probabilidad. Los pasos en este proceso de revisión de probabilidades se muestran en la Figura siguiente.

Ejemplo: Suponga una empresa que compra componentes de dos proveedores. Sean los eventos:

A1 =Componentecompradoalproveedor1 A2=Componentecompradoal proveedor 2

Actualmente, el 65% de los componentes comprados provienen del proveedor 1 y el resto del proveedor 2. Por lo tanto, si se elige al azar un componente, asignaría-mos las probabilidades previas y .

La calidad de los componentes comprados depende del proveedor. Sean los even-tos:

B1=Componentecompradoseencuentraenbuenascondiciones

B2=Componentecompradoseencuentraenmalascondiciones

Las probabilidades condicionales de recibir un componente en buenas o malas condiciones (con base en datos históricos), según el proveedor, son:

El diagrama de árbol que se muestra en la Figura siguiente describe el proceso en que esta empresa recibe un componente de unos de los proveedores menciona-dos y luego descubre que se encuentra en buenas o malas condiciones como un experimento de dos etapas. De los cuatro resultados experimentales posibles, dos corresponden al caso en que el componente se encuentra en buenas condiciones y dos corresponden al caso contrario.

UNIDAD III: PROBABILIDAD

Page 74: A0175 Estadistica I MAU01

74

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Cada uno de los resultados experimentales es la intersección de dos eventos, de modo que podemos usar la regla de la multiplicación para calcular las probabilida-des. Es decir,

El proceso de calcular estas probabilidades conjuntas puede describirse con lo que en ocasiones se llama árbol de probabilidad. También se le denomina árbol de deci-siones, como se muestra en la Figura siguiente. De izquierda a derecha en el árbol, las probabilidades para cada una de las ramas en la primera etapa corresponden a las probabilidades iniciales, mientras que las probabilidades para cada rama en la segunda etapa son probabilidades condicionales. Para encontrar las probabilidades de cada resultado solo multiplicamos las probabilidades en las ramas que conducen al resultado. Observe que las probabilidades de los cuatro resultados experimenta-les suman uno.

UNIDAD III: PROBABILIDAD

Page 75: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 75

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

El teorema de Bayes es aplicable cuando los eventos para los que deseamos calcular probabilidades posteriores son mutuamente excluyentes y su unión es el espacio muestral completo. El teorema de Bayes puede extenderse al caso de n eventos mutuamente excluyentes A1, A2 , .... , An cuya unión cubre todo el espacio muestral. En tal caso, el teorema de Bayes para el cálculo de cualquier probabilidad posterior

se vuelve

, i =1,2......,n

donde se le conoce con el nombre de probabilidad total.

EJEMPLO: Suponga que los componentes del ejemplo anterior se usan en un pro-ceso de manufactura y que un componente en malas condiciones causa que una máquina se descomponga, ¿cuál es la probabilidad que el componente en malas condiciones provenga del proveedor 1? y ¿cuál es la probabilidad que provenga del proveedor 2? Con la información del árbol de probabilidad podemos usar el teorema de Bayes para responder a estas preguntas.

Proveedor 1:

Proveedor 2:

donde

Luego:

UNIDAD III: PROBABILIDAD

Page 76: A0175 Estadistica I MAU01

76

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

TEMA Nº 3: TÉCNICAS DE CONTEO

En el tema anterior nos hemos encontrado con un detalle muy importante que genera un gran error en las probabilidades si no se calcula bien: el tamaño del espacio mues-tral, el cual debe ser analizado con mucho cuidado sobre todo al determinar la estructu-ra que tiene para luego contabilizar el total de posibilidades que se tiene. Por esa razón cuando las posibilidades son inmensas y ya no se puede realizar un conteo de manera individual debemos aplicar alguna técnica que nos facilite el conteo, esa es la razón por la cual debemos optimizar las técnicas presentadas a continuación y que requiere en

varios casos del manejo del desarrollo de un factorial.

1 TÉCNICAS DE CONTEO

A menudo el espacio muestral con el que tenemos que calcular las probabilidades es grande, de tal manera que construyendo un diagrama de árbol o un tablero de contingencia no va a ser posible, es por esta razón que recurrimos a modelos matemáticos para poder calcular el tamaño de nuestro espacio muestra, pero es necesario antes conocer el principio de la adición y de la multiplicación en quienes se fundamentan los métodos de conteo.

1.1 REGLA DE LA ADICIÓN

Si un primer experimento tiene n1 resultados posibles y un segundo experi-mento tiene n2 resultados posibles. Entonces, la cantidad total de resultados experimentales luego de realizar el primer o segundo experimento, es decir solo uno de ellos, es n1 +n2.

Ejemplo: Una persona puede viajar de Lima a Cuzco por vía aérea o terrestre y tiene a su disposición 6 líneas aéreas y 5 líneas terrestres. ¿De cuantas formas puede realizar el viaje desde Lima hasta Cuzco?

El primer experimento consiste en elegir una línea aérea y tiene n1 =6 formas posibles de hacerlo, el segundo experimento consiste en elegir una línea terres-tre y tiene n1 =5formasposiblesdehacerlo.Luego,setienenn1 +n2=11formasposibles de realizar el viaje.

1.2 REGLA DE LA MULTIPLICACIÓN

Si un experimento se puede describir como una sucesión de k etapas, en las que hay n1 resultados posibles en la primera etapa, n2 en la segunda, etc. Entonces, la cantidad total de resultados experimentales es n1 × n2 .... ×nk .

Ejemplo: ¿Cuántas parejas de bailes de diferente sexo se puede formar con 3 varones y 5 damas?

El experimento consiste en formar parejas de baile. La primera etapa consiste en elegir al varón y se puede hacer de n1=3formas.Lasegundaetapaconsisteen escoger a la dama y se puede realizar de n2=5formas.Luego,sepuedenformar n1 × n2=15parejasdebaile.

2 COMBINACIONES Y PERMUTACIONES

2.1 COMBINACIONES

Las combinaciones permiten contar la cantidad de resultados experimentales cuando se deben seleccionar objetos entre un total de N , por lo general más grande, donde el orden de selección no se considera importante. La cantidad de combinaciones de N objetos tomando n a la vez es

UNIDAD III: PROBABILIDAD

Page 77: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 77

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

donde

Ejemplo: Se tiene un grupo de 30 estudiantes del curso Estadistica , ¿de cuantas maneras diferentes se podría elegir a 3 delegados para que representen a la sección?

El orden de selección de los tres delegados no es importante. Luego, existen formas diferentes de elegirlos.

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

ACTIVIDAD N° 3

Esta actividad puede consultarla en su aula virtual.

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

LECTURA SELECCIONADA N° 2

¿Debe preocuparse de que le realicen una prueba de detección de drogas cuando solicite un trabajo? Estadística. Mario Triola. Pág. 137

¿Debe preocuparse de que le realicen una prueba de detección de drogas cuando soli-cite un trabajo?

Según la American Management Association, alrededor del 70% de las empresas esta-dounidenses realizan pruebas de detección de drogas al menos a algunos empleados y aspirantes. El U.S. National Institute on Drug Abuse afirma que aproximadamente el 15% de los jóvenes entre 18 y 25 años consumen drogas ilegales. Quest Diagnostic esti-ma que el 3% de la fuerza laboral general de Estados Unidos consume marihuana. Su-pongamos que usted solicitó un empleo, tiene excelentes aptitudes (las cuales incluyen la aprobación exitosa de un curso de estadística), le hicieron una prueba de consumo de marihuana y no le dieron el empleo. Usted podría sospechar que no pasó el examen de marihuana, aun cuando no consume esta droga.

Análisis de los resultados

Latablamuestralosresultadosdelaprueba"1-Panel-THC"paraidentificarelconsumode marihuana. Este dispositivo de prueba cuesta $5.95 y la empresa Drug Test Success lo distribuye. Los resultados de la prueba fueron confirmados con cromatografía de gases y espectrometría de masas, que la empresa describe como "el método de confirmación preferido". (Esos resultados se basan en el uso de 50 ng/mL como nivel de corte para determinar la presencia de marihuana). Con base en los resultados de la tabla 4-1, ¿qué probabilidades hay de que la prueba indique que usted consumió marihuana, aunque no sea así? Cuando una prueba muestra la presencia de alguna condición, como una enfermedad o los residuos de alguna droga, se dice que el resultado de la prueba es positivo. Cuando la prueba indica un resultado positivo, pero la condición en realidad no está presente, el resultado es un falso positivo. Es decir, un falso positivo es un error en el que la prueba indica la presencia de una condición, cuando en realidad esta últi-ma no se presenta. En este caso, el aspirante al empleo podría sentirse angustiado por la probabilidad de un resultado falso positivo, ya que sería un error que provocaría de manera injusta la negación del empleo. (El contratante podría sentirse preocupado por otro tipo de error, un falso negativo, que se presenta cuando una prueba indica que el aspirante no consume marihuana, cuando en realidad sí lo hace. Este falso negativo podría causar la contratación de un individuo que consume marihuana, y este error puede ser grave para algunos trabajos, como los que realizan los pilotos, los cirujanos o los ingenieros de trenes).

UNIDAD III: PROBABILIDAD

Page 78: A0175 Estadistica I MAU01

78

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

En este capítulo analizaremos preguntas relevantes como éstas: Dados los resultados muestrales de la tabla, ¿cuál es la probabilidad de un resultado falso positivo? ¿Cuál es la probabilidad de un resultado falso negativo? ¿Esas probabilidades son lo suficiente-mente bajas como para que los aspirantes y los contratantes no se preocupen por tomar decisiones incorrectas motivadas

por resultados erróneos de las pruebas?

Tabla: Resultados de exámenes sobre el consumo de marihuana

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

GLOSARIO

- Experimento: La aplicación de un tratamiento y la posterior observación de sus efectos sobre los sujetos.

- Probabilidad Condicionada: Probabilidad de que ocurra un evento después de que haya ocurrido otro.

- Probabilidad Condicional: La probabilidad de un suceso, dado que algún otro suce-so ya ocurrió.

- Probabilidad Conjunta: Probabilidad de que ocurran dos eventos de manera simul-tanea.

- Probabilidad Subjetiva: Conjetura o estimado de una probabilidad con base en un conocimiento de las circunstancias relevantes.

- Probabilidad: Medida de la posibilidad de que ocurra un suceso dado; se expresa como un número entre 0 y 1 .

- Regla de Combinación: Regla para determinar el número de combinaciones dife-rentes de elementos seleccionados.

- Regla de la adición: Regla para determinar la probabilidad de que, en un solo ensa-yo, ocurra el suceso A o el suceso B, o bien, de que ocurran ambos.

- Regla de la multiplicación: Regla para determinar la probabilidad de que ocurra el suceso A en un ensayo y de que ocurra el suceso B en un segundo ensayo.

- Regla de Permutación: Regla para determinar el número de arreglos diferentes de elementos seleccionados.

- Regla del conteo fundamental: Regla que dice que, para una secuencia de dos su-cesos en la que el primer suceso puede ocurrir de m maneras y el segundo de n maneras,lossucesosjuntospuedenocurrirenuntotaldem•nmaneras.

- Regla del Factorial: Regla que afirma que n objetos distintos se pueden acomodar de n! maneras distintas.

- Regla del suceso infrecuente: Si, bajo un supuesto dado, la probabilidad de un re-sultado específico observado es muy pequeña, se concluye que posiblemente el supuesto no sea correcto.

- Suceso Compuesto: Combinación de sucesos simples.

- Suceso Simple: Resultado experimental que no puede descomponerse más.

- Suceso: Resultado de un experimento.

- Sucesos Dependientes: Sucesos para los cuales la ocurrencia de cualquier suceso individual afecta las probabilidades de ocurrencia de los demás sucesos.

- Sucesos Disjuntos o mutuamente excluyentes: Sucesos que no pueden ocurrir de manera simultánea.

UNIDAD III: PROBABILIDAD

Page 79: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 79

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

- Sucesos Independientes: Sucesos para los cuales la ocurrencia de cualquiera de ellos no afecta las probabilidades de ocurrencia de los demás.

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

BIBLIOGRAFÍA DE LA UNIDAD III

1. Triola Mario F. ESTADÍSTICA. Pearson Educación. México 2012

2. Introducción a la Probabilidad.Décimo Segunda Edición. William Mendenhall, Ro-bert Beaver. Cengage Learning. 2008

3. Estadística y Muestreo. Ciro Martinez Bencardino. Colombia 2012. ECOE Edicio-nes.

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

AUTOEVALUACIÓN DE LA UNIDAD III

1. LaprobabilidaddequelapróximasemanalluevaenHuancayoesuntípicocasodeprobabilidad:

a) Clásica b) Subjetiva c) Binomial

d) Total e) Empírica o de frecuencia relativa

2. La siguiente definición: “Conforme un procedimiento se repite una y otra vez, la probabilidad de frecuencias relativas (o empíricas) de un suceso, tiende a aproxi-marse a la probabilidad real”, corresponde a:

a) Teorema de Bayes

b) Probabilidad total

c) Regla del suceso infrecuente

d) Probabilidad condicional

e) Ley de los números grandes

3. DetermineelvalordelaprobabilidaddelcomplementodeA,siP(A)=0.274

a) 0.672 b) 0 c) 0.726 d) 1 e) 0.762

4. Considere el caso de una pequeña empresa de ensamble en la que hay 50 emplea-dos. Se espera que todos los trabajadores terminen su trabajo a tiempo y que pase la inspección final. A veces, alguno de los empleados no satisface el estándar de desempeño, ya sea porque no termina a tiempo su trabajo o porque no ensambla bien una pieza. Al final del período de evaluación del desempeño, el jefe de pro-ducción encuentra que 5 de los 50 trabajadores no terminaron su trabajo a tiempo, 6 de los 50 trabajadores ensamblaron mal una pieza y 2 de los 50 trabajadores no terminaron su trabajo a tiempo y armaron mal una pieza. Después de analizar los datos del desempeño, el jefe de producción decide despedir a los trabajadores que no terminaron a tiempo su trabajo o que armaron mal alguna pieza. ¿Cuál es la probabilidad de que el jefe de producción despida a un trabajador?

a) 0,14 b) 0,16 c) 0,18 d) 0,2 e) 0,24

UNIDAD III: PROBABILIDAD

Page 80: A0175 Estadistica I MAU01

80

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

5. De una baraja de 52 cartas extraemos sin reposición y en forma sucesiva dos cartas. Si en la primera extracción se obtuvo espada. ¿Cuál es la probabilidad de que en la segunda extracción salga espada nuevamente?

a) 0,059 b) 0,24 c) 0,67 d) 0,0022 e) 0,834

6. Una compañía dedicada al transporte público explota tres líneas de una ciudad de forma que el 50% de los autobuses cubre el servicio de la primera línea, el 20% cubre la segunda y el 30% cubre el servicio de la tercera línea. Se sabe que la pro-babilidad de que diariamente un autobús se averíe es del 3%, 2% y 5%, respectiva-mente, para cada línea. Determine la probabilidad de que, en un día, un autobús sufra una avería.:

a) 0,34 b) 0,00034 c) 3,4 d) 0,034 e) 0,0304

7. Mariela desea adquirir el libro de Estadística de Mario Triola, el cual es vendido en 8 librerías diferentes de la calle Calixto, en 7 galerías del Tambo y en 6 librerías cercanas al campus de la UCCI. ¿De cuántas maneras podrá adquirir dicho libro?

a) 15 b) 13 c) 14 d) 20 e) 21

8. Viviana tiene 3 blusas de diferente color, 3 pantalones diferentes, 4 minifaldas y 2 pares de zapatos diferentes. ¿De cuántas formas distintas puede vestirse con estas prendas para ir a sus clases, considerando que el profesor de Estadística ha prohi-bido a las mujeres ir a clase con minifalda?:

a) 5/9 b)2/18 c)5/18 d) 9/12 e)9/17

9. Una caja contiene 4 bolas blancas y 5 bolas rojas. Se extraen consecutivamente 2 bolas sin reemplazo. Calcular la probabilidad de que se extraigan una bola blanca y una roja, en ese orden.

10. Identifica el enunciado falso con respecto a las COMBINACIONES:

a) Se tiene un total de “n” diferentes elementos disponibles.

b) Los reordenamientos de los mismos elementos son considerados iguales.

c) Se selecciona “r” de los “n” elementos, donde r<n.

d) Se expresa como:

e) La agrupación ABC ≠ CBA

UNIDAD III: PROBABILIDAD

Page 81: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 81

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

DIAGRAMA DE PRESENTACIÓN DE LA UNIDAD IV

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

ORGANIZACIÓN DE LOS APRENDIZAJES

CONOCIMIENTOS PROCEDIMIENTOS ACTITUDES

Tema N° 01:Distribuciones de Probabilidad Discreta1. Variables aleatorias2. Distribución de probabili-

dad binomial.3. Distribución de probabili-

dad hipergeométrica.4. Distribución de probabili-

dad de Poisson.

Tema N° 2: Distribuciones De Probabilidad Normal1. Distribución normal están-

dar. Valor crítico z. 2. Aplicaciones de la distribu-

ción normal estándar.

Lectura Seleccionada N°4 ¿Los métodos estadísticos pue-den demostrar que el proceso de selección de un jurado es discriminatorio? Autoevaluación N° 04

Procedimientos:1. Identifica la distribución de

probabilidad discreta de un experimento aleatorio

2. Calcula e interpreta la pro-babilidad del evento de in-terés.

Actividad N°1:Calculan la probabilidad en distintas distribuciones

Procedimientos:3. Identifica la distribución de

probabilidad continua de un experimento aleatorio

4. calcula e interpreta la pro-babilidad de distribuciones normales.

Actividad N°2:Resuelve ejercicios y proble-mas aplicando la distribución normal. Tarea Académica Nº 2

Demuestra proactividad y ética en el desarrollo de la asignatura y en el manejo de la información.

CONTENIDOS

AUTOEVALUACIÓN

EJEMPLOS

BIBLIOGRAFÍA

ACTIVIDADES

Page 82: A0175 Estadistica I MAU01

82

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD

Debes tener en cuenta que las distribuciones de probabilidad están relacionadas con la distribución de frecuencias. De hecho, podemos pensar en la distribución de proba-bilidad como una distribución de frecuencias teórica. Una distribución de frecuencias teórica es una distribución de probabilidades que describe la forma en que se espera que varíen los resultados. Debido a que estas distribuciones tratan sobre expectativas de que algo suceda, resultan ser modelos útiles para hacer inferencias y tomar decisiones de incertidumbre.

TEMA 01: DISTRIBUCIONES DE PROBABILIDAD DISCRETA

1 VARIABLES ALEATORIAS:

1.1 DEFINICION BÁSICA DE VARIABLES ALEATORIAS

En la Unidad anterior se define un experimento como cualquier proceso que genera resultados bien definidos. Se considera de interés el proceso de asignar valores numéricos a los resultados experimentales. Para hacerlo, se introduce la noción de variable aleatoria.

Para cualquier experimento en particular, una variable aleatoria puede definirse de modo que cada resultado experimental posible genere exactamente un valor numérico para la variable aleatoria, es decir que una variable aleatoria es la des-cripción numérica del resultado de un experimento.

Ejemplo

Una variable aleatoria puede clasificarse como discreta o continua dependien-do de los valores numéricos que pueda asumir. Una variable aleatoria que solo puede tomar una secuencia finita o infinita numerable de valores es una variable aleatoria discreta. El número de ventas logradas, número de artículos defectuo-sos y número de clientes atendidos por día son ejemplos de variables aleatorias discretas. Una variable aleatoria que toma una secuencia infinita no numerable de valores es una variable aleatoria continua, por ejemplo: tiempo requerido (en minutos) para trasladarse de la UCCI al hogar.

1.2 DISTRIBUCIÓN DE PROBABILIDAD DE UNA VARIABLE ALEATORIA DIS-CRETA

La función de distribución de probabilidad, denotada por , proporciona la pro-babilidad que la variable aleatoria discreta tome el valor especifico . En la construcción de una distribución de probabilidad discreta siempre deben satis-facerse dos condiciones:

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD

Page 83: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 83

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Ejemplo: Una empresa compra juguetes y su proveedor los entrega en cajas de 50 unidades. Luego de la comercialización de los juguetes y de acuerdo a las devoluciones realizadas por sus propios clientes ha determinado el número de juguetes defectuosos en las últimas 500 cajas compradas. La información se muestra a continuación:

SealavariablealeatoriaX=Númerodejuguetesdefectuososporcajade50uni-dades. La función de distribución de probabilidad se puede obtener calculando la frecuencia relativa para cada valor de X.

1.3 VALOR ESPERADO DE UNA VARIABLE ALEATORIA DISCRETA

El valor esperado de una variable aleatoria discreta es un promedio ponderado de todos los valores posibles de la misma, donde los pesos son las probabilidades asociadas con los valores. El valor esperado de una variable aleatoria discreta se calcula con la siguiente expresión:

El valor esperado de una variable aleatoria es el valor medio, o promedio. Para experimentos que pueden repetirse muchas veces, el valor esperado puede in-terpretarse como el valor promedio a largo plazo para la variable aleatoria. Sin embargo, el valor esperado no necesariamente es el número que pensamos asu-mirá la variable aleatoria la próxima vez que se realice el experimento.

Ejemplo: Si se desea calcular el valor esperado de la variable aleatoria definida en el ejemplo anterior.

Luego, el valor esperado de X es 0.95 juguetes defectuosos.

1.4 VARIANZA DE UNA VARIABLE ALEATORIA DISCRETA

El valor esperado nos da una idea acerca del valor promedio o central para la variable aleatoria, pero es importante tener además una medida de la disper-sión o variabilidad de los valores posibles de la variable aleatoria. La varianza es una medida usada para representar la dispersión o variabilidad en los valo-res de una variable aleatoria. La varianza de una variable aleatoria discreta se calcula con la siguiente expresión:

Una medida de dispersión relacionada es la desviación estándar, , la cual se define como la raíz cuadrada positiva de la varianza.

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD

Page 84: A0175 Estadistica I MAU01

84

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Ejemplo: Si se desea calcular la varianza y desviación estándar de la variable aleatoria definida en el ejemplo anterior.

Aplicaciones

La siguiente tabla muestra la distribución del número de errores que un pu-blicista comete al elaborar una pieza publicitaria.

a. Encuentre el valor de “a” para que dicha distribución sea de probabilidad.

b. Si se elige una pieza publicitaria. ¿cuál es la probabilidad que el publicista cometa a lo más 3 errores?

c. Calcule e interprete el valor esperado.

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD

Page 85: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 85

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

2 DISTRIBUCIÓN DE PROBABILIDAD BINOMIA

La distribución de probabilidad binomial es una distribución discreta de probabi-lidad que se relaciona con un experimento binomial, el cual tiene cuatro propie-dades:

• Elexperimentoconsistedeunasucesiónden intentos o ensayos idénticos.

• Encadaintentooensayosonposiblesdosresultados.Aunolollamaremoséxitoy al otro fracaso.

• Laprobabilidaddeobtenerunéxito,p,nocambiadeunintentooensayoaotro.

• Losintentosoensayossonindependientes.

EnunexperimentobinomiallavariablealeatoriadeinteréssedefinecomoX=Nú-mero de éxitos obtenidos en los intentos o ensayos. Esta variable aleatoria puede tomar los valores 0,1,2,...,n . La función de distribución de probabilidad asociada con esta variable aleatoria es:

Lo anterior puede escribirse como . El valor esperado y variancia de una variable aleatoria con distribución binomial son respectivamente.

Ejemplo 1: La probabilidad de que cualquier símbolo particular de código se trans-mita erróneamente a través de un sistema de comunicaciones es 0.10. En la trans-misión de los símbolos los errores ocurren de manera independiente unos de otros. Suponga que se envía un mensaje formado por 10 símbolos. ¿Cuál es la probabili-dad que se transmitan erróneamente solo 2 símbolos?

SeaX=Númerodesímbolostransmitidoserróneamentedeltotalde10,entonces. La función de distribución de probabilidad es

Luego, .

Ejemplo 2: Con respecto al Ejemplo anterior, ¿cuál es la probabilidad de transmitir como máximo tres símbolos erróneamente?

Propiedades de la distribución binomial

a)lamedia:μ=np

b) la varianza: σ2=npq

c) cuando p es menor que 0.5, la distribución binomial está sesgada hacia la dere-cha.

d) conforme p aumenta, el sesgo es menos notable.

e)cuandop=0.5,ladistribuciónbinomialessimétrica.

f) cuando p es mayor que 0.5, la distribución esta sesgada hacia la izquierda.

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD

Page 86: A0175 Estadistica I MAU01

86

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

3 DISTRIBUCIÓN DE PROBABILIDAD HIPERGEOMÉTRICA

La distribución de probabilidad hipergeométrica está estrechamente relacionada con la distribución binomial, pero difieren en dos puntos: en la distribución hiper-geométrica los ensayos no son independientes y la probabilidad de éxito varía de ensayo a ensayo.

En la notación usual, r denota el número de elementos considerados como éxitos quehayenunapoblacióndetamañoN,yN–rdenotaelnúmerodeelementosconsiderados como fracasos que hay en dicha población. La función de probabili-dad hipergeométrica se usa para calcular la probabilidad de que en una muestra aleatoriadenelementos,seleccionadossinreemplazo,setenganxéxitosyn–xfracasos. La función de distribución de probabilidad asociada con esta variable alea-toria es:

Lo anterior puede escribirse como . El valor esperado y variancia

de una variable aleatoria con distribución hipergeométrica son y

respectivamente.

Ejemplo: Una empresa fabrica fusibles que empaca en cajas de 12 unidades cada una. Suponga que un inspector selecciona al azar tres de los 12 fusibles de una caja para inspeccionarlos. Si la caja contiene 5 fusibles defectuosos, ¿cuál es la probabi-lidad que el inspector encuentre más de un fusible defectuoso?

SeaX=Númerodefusiblesdefectuososencontradosporelinspectorenlamuestrade tamaño 3, entonces . La función de distribución de probabilidad es

4 DISTRIBUCIÓN DE PROBABILIDAD DE POISSON

En esta sección se describe una variable aleatoria discreta que se usa con frecuen-cia para estimar la cantidad de sucesos u ocurrencias en determinado intervalo detiempooespacio.Porejemplo, lavariablealeatoriadeinteréspodríaserX=Númerodeclientesdelosclientesalbancoporhora,X=Númerodereparacionesnecesariasporcada10kilómetrosecarreteraoX=Númerodefugasen100millasde un oleoducto. Si se satisfacen las dos propiedades siguientes, la variable aleatoria X=Númerodeocurrenciasendeterminadointervalodetiempooespacioesunavariable aleatoria discreta que se describe con la distribución de probabilidad de Poisson:

• Laprobabilidaddeunaocurrenciaes igualendos intervaloscualesquieradeigual longitud.

• Laocurrenciaonoocurrenciaencualquier intervaloes independientede laocurrencia o no ocurrencia en cualquier otro intervalo.

La función de probabilidad de Poisson es:

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD

Page 87: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 87

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Lo anterior puede escribirse como , donde λ es la tasa o número prome-dio de ocurrencias en determinado intervalo de tiempo o espacio y . El valor esperado y variancia de una variable aleatoria con distribución de Poisson son numéricamente iguales al parámetro de la distribución, es decir .

Ejemplo 1: La división de mantenimiento de telefonía está tratando de decidir cuántos reparadores necesita para proporcionar un nivel aceptable de servicio a sus clientes. El número de quejas que llegan al centro de servicio sigue una distribu-ción de Poisson, con una tasa promedio de 30 llamadas al día. ¿Cual es la probabili-dad de recibir en el centro de servicio más de 20 quejas en medio día?

SeaX=Númerodequejasquelleganalcentrodeservicioenmediodía,entonces. La función de distribución de probabilidad es:

Ejemplo 2: Con respecto al Ejemplo anterior, ¿cuál es la probabilidad que llegue al centro de servicio menos de 25 quejas al día?

Sea X = Número de quejas que llegan al centro de servicio por día, entonces. La función de distribución de probabilidad es:

Luego, .

TEMA Nº 2: DISTRIBUCION DE PROBABILIDAD NORMAL

1 DISTRIBUCIÓN NORMAL ESTÁNDAR. VALOR CRÍTICO Z.

1.1 DISTRIBUCIÓN NORMAL ESTÁNDAR

La distribución normal es una de las distribuciones más usadas e importantes. Se ha desenvuelto como una herramienta indispensable en cualquier rama de la ciencia , la industria y el comercio. Muchos eventos reales y naturales tienen una distribución de frecuencias cuya forma es muy parecida a la distribución normal.

La distribución normal es llamada también campana de Gauss por su forma acampanada

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD

Page 88: A0175 Estadistica I MAU01

88

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Propiedades de la distribución normal

• Ladistribuciónnormaltieneformadecampana.

• Ladistribuciónnormalesunadistribucióndeprobabilidadquetienemediaµ=0ydesviaciónestándarσ =1.

• Eláreabajolacurvaolaprobabilidaddesdemenosinfinitoamásinfinitovale1.

• Ladistribuciónnormales simétrica,esdecircadamitaddecurva tieneunárea de 0.5.

• Laescalahorizontaldelacurvasemideendesviacionesestándar.

• Laformaylaposicióndeunadistribuciónnormaldependendelosparáme-tros µ y σ , en consecuencia hay un número infinito de distribuciones norma-les.

Existe una relación del porcentaje de población a la desviación estándar. En la figura observamos por ejemplo que el área bajo la curva para tiene un porcen-taje de 68.26%, ±2 σ =95.46%y±3 σ =99.73%

La población incluye todos los datos, la muestra es una porción de la población.

Tomando como referencia una distribución normal estándar con parámetros: µ=0yσ2=1.Setrabajaconladistanciaentrexyµ en función de la desviación estándar. Tal como se muestra a continuación:

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD

Page 89: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 89

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Notación:

Z ~ Normal (0,1) y se lee: “Z tiene distribución normal estándar con medio 0 y varianza igual a 1”

1.2 VALOR CRÍTICO Z

Determina el número de desviaciones estándar σ entre algún valor X y la media de la población µ. Para calcular el valor de Z usamos la siguiente fórmula.

La distribución de probabilidad f (Z) es una distribución normal con media 0 y desviación estándar 1; esto es Z se distribuye normalmente con media cero ydesviaciónestándar=1Z~N(0,1):Lagráficadedensidaddeprobabilidadsemuestra en la figura.

La distribución f (Z) se encuentra tabulada en la tabla de distribución normal estándar. En esta tabla podemos determinar los valores de Z o la probabilidad de determinado valor Z.

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD

Page 90: A0175 Estadistica I MAU01

90

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Ejemplo 1: El gerente de personal de una gran compañía requiere que los soli-citantes a un puesto efectúen cierta prueba y alcancen una calificación de 500. Si las calificaciones de la prueba se distribuyen normalmente con media 485 y desviación estándar 30 ¿Qué porcentaje de los solicitantes pasará la prueba?

Calculando el valor de Z obtenemos:

Buscamos el valor correspondiente Z en las tabla de distribución normal. Z0.5=.69146=69.146%.siendoestalaprobabilidaddequelacalificaciónseamenor a 500 P (X<500). Dado que el porcentaje pedido es la solución es 1-.69146=.3085,30.85%delosparticipantespasaránlaprueba.

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD

Page 91: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 91

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Ejemplo 2:

Encuentre la probabilidad siguiente usando la tabla Z.

P(-1.23 < Z < 0)

Solución: Buscamos el valor Z1..23 en las tablas siendoeste = .89065. restando.89065-.05=.3905,estevaloreslaprobabilidadde0a1.23queesexactamentelamismade–1.23a0porsimetría.Porlotantolaprobabilidades.3905

2 APLICACIONES DE LA DISTRIBUCIÓN NORMAL ESTÁNDAR.

APROXIMACIÓN NORMAL A LA BINOMIAL

Cuando las muestras son pequeñas, en una distribución binomial se obtienen fácil-mente probabilidades asociadas a un evento mediante la fórmula de la binomial. Cuando las muestras son grandes, el cálculo nos llevaría bastante tiempo. La distri-bución normal es a menudo una buena aproximación a una distribución binomial cuando np y nq son mas grandes que 5.

con n = 20 y p = .5 con n = 60 y p = .5

Para utilizar la distribución normal como una aproximación de la binomial debe-mos estar seguros de que la distribución de interés es en efecto una distribución biniomial, para lo cual debe reunir los siguientes criterios:

1. Haysolodosposiblesresultadoséxitoofracaso

2. Resulta de un conteo

3. Cada prueba es independiente

4. La probabilidad del éxito es constante en cada prueba

5. Hayunnúmerofijodepruebas.

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD

Page 92: A0175 Estadistica I MAU01

92

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Ejemplo 1

La probabilidad de que un paciente se recupere de una rara enfermedad de la san-gre es 0.4. Si se sabe que 100 personas contrajeron esa enfermedad,

a) ¿Cuál es la probabilidad de que menos de 30 sobrevivan?

b) ¿Cuál es la probabilidad de que exactamente 5 sobrevivan?

c) ¿Cuál es la probabilidad de que a lo más 30 sobrevivan?

El primer paso es verificar si el experimento cumple con los requisitos de una dis-tribución binomial, y si es el caso calcular la media y la desviación estándar de la distribución.

a) P(x < 30 )

Para resolver el problema con la fórmula de la distribución binomial se tendría que calcular 30 binomiales, desde la binomial de cero hasta la binomial de 29. Mediante el uso de la aproximación normal a la binomial el procedimiento es mucho más corto.

El primer paso es aplicar al valor de x el factor de corrección de continuidad, que es simplemente sumar o restar 0.5 al valor de x, dependiendo del problema. En este caso queremos la probabilidad de que x valga menos de 30, no incluye al 30, entonces se le resta 0.5. En seguida se aplica la fórmula de Z, utilizando el valor de x=29.5,yenseguidabuscareláreaenlatabla:

b) P(x = 35 )

En una distribución continua la probabilidad de que la variable aleatoria sea exacta-mente determinado valor no se puede calcular y se estima que es cero, mientras que en una distribución discreta la probabilidad se calcula sumando y restando el factor de corrección de continuidad para estimar el área entre ambos puntos.

Sin embargo, cuando tenemos un caso como este, lo correcto y lo más fácil es calcu-lar la probabilidad con la fórmula de la binomial, y obtenemos el resultado exacto.

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD

Page 93: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 93

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

c) P( x ≤ 30 )

Aquí se pide la probabilidad de que x tome valores desde 0 hasta 30 inclusive, como el 30 está incluido el factor de corrección de continuidad se suma.

Ejemplo 2

Calcular la probabilidad de que al lanzar una moneda 100 veces, el número de caras obtenido esté comprendido entre 45 y 55.

Se tiene:

Y la probabilidad pedida es, con la aproximación realizada:

Ejemplo 3: La presión sanguínea de ciertos enfermos sigue una ley normal de me-dia90mm.Hgydedesviacióntípica12mm.Hg.Hallar laprobabilidaddequeelegido un paciente al azar:

a)Supresiónseamayorde115mm.Hg.

b)Supresiónestécomprendidaentre80y100mm.Hg.

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD

Page 94: A0175 Estadistica I MAU01

94

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Tipificando los valores 90, 80 y 100 tenemos:

Laprobabilidaddequelapresiónseamayorde115mm.Hg.es:

Ylaprobabilidaddequelapresiónestécomprendidaentre80y100mm.Hg:

Ejemplo 4: Diferencias y relaciones entre la distribución binomial y la normal.

El porcentaje de españoles con estudios medios es del 35 %. Elegidos ocho al azar, calcular la probabilidad de que entre 3 y 5 (ambos incluidos) tengan estudios me-dios, aplicando:

a) La distribución binomial.

b) La aproximación normal de la binomial.

Aplicandoladistribuciónbinomialconn=8,p=0,35yq=0,65,setiene:

Aplicando la aproximación normal a la binomial con:

Y, tipificando para aplicar la aproximación normal a la binomial:

Con lo cual la probabilidad será:

Y se ve que la aproximación no es aquí buena porque n es muy inferior a 30 y p es muy distinto de 0,5.

TABLAS DE DISTRIBUCIÓN NORMAL

Área bajo la curva normal

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD

Page 95: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 95

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

TABLAS DE DISTRIBUCIÓN NORMAL

Área bajo la curva normal

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD

Page 96: A0175 Estadistica I MAU01

96

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

ACTIVIDAD N° 4

Esta actividad puede consultarla en su aula virtual.

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

LECTURA SELECCIONADA N° 4

¿Los métodos estadísticos pueden demostrar que el proceso de selección de un jurado es discriminatorio?

Estadística. Mario Triola. Pág.199

Después de que un acusado ha sido condenado por algún crimen, en ocasiones se in-terpone una apelación con el argumento de que el acusado fue condenado por un jurado de personas diferentes a él. Uno de los criterios es que el proceso de selección del jurado debe garantizar que los miembros representen a la población de la región. En un caso célebre, el doctor Benjamin Spock, escritor del libro Baby and Child Cure, fue condenado por conspiración al fomentar la resistencia al reclutamiento durante la guerra de Vietnam. Su defensor argumentó que el doctor Spock estaba en desventaja, pues los 12 miembros del jurado eran hombres. Las mujeres se habrían mostrado más comprensivas, ya que, en general, se oponían más a la guerra; además, el doctor Spock era muy reconocido entre el público femenino como médico infantil. Un especialista en estadística testificó que el jurado tenía una proporción consistentemente menor de mujeres que los otros seis jurados del mismo distrito. La condena del doctor Spock fue anulada por otras razones. En la actualidad los integrantes de los jurados de las cortes federales se deben elegir de manera aleatoria.

En 1972, Rodrigo Partida, méxico-estadounidense, fue condenado por robo con i nten-todeviolación.SucondenafuedictadaenelcondadodeHidalgo,queselocalizaenTexas,enlafronteraconMéxico.EnelcondadodeHidalgohabía181,535personasque podían formar parte del jurado, y el 80% de ellas eran méxico-estadounidenses.

De las 870 personas llamadas a servir como jueces, el 39% (339) eran méxico-estadou-nidenses. Tiempo después, se apeló la condena de Partida (Castaneda contra Partida) con base en la gran discrepancia entre el 80% de méxico-estadounidenses disponibles para fungir como jueces y el hecho de que sòlo fuera seleccionado el 39% de este grupo.

En este capítulo estudiaremos el problema de Castaneda contra Partida en especial a partir de las siguientes preguntas fundamentales:

1. Puesto que los méxico-estadounidenses constituyen el 80% de la población y dado que Partida fue sentenciado por un jurado de 12 personas de las que sólo el 58% de los jueces (7) eran méxico-estadounidenses, ¿podemos concluir que este jurado fue elegido en un proceso que discrimina a los méxico-estadounidenses?

2. Dado que los méxico-estadounidenses constituyen el 80% de la población total de 181535 habitantes y que durante un período de más de 11 años sólo el 39% de los individuos llamados a servir como jueces eran méxico-estadounidenses, ¿podemos concluir que el proceso de selección del jurado discriminó a este grupo? (Sabemos que, debido al azar, las muestras varían naturalmente hasta cierto punto de lo que se esperaría a nivel teórico. Sin embargo la discrepancia entre la tasa del 80% de méxi-co-estadounidenses de la población y el 39% de los méxico-estadounidenses llama-dos a servir como jueces es lo suficientemente grande para explicarse por el azar?)

Este ejemplo explica la importancia de una comprensión básica de los métodos estadís-ticos en el terreno legal. Es probable que los abogados que carecen de conocimientos estadísticos no puedan ofrecer un buen servicio a sus clientes. En una ocasión el autor testificó en la suprema Corte del estado de Nueva York y al analizar la situación, se dio cuenta de que la falta de comprensión de conceptos estadísticos básicos podría ser muy perjudicial para el cliente de un abogado.

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD

Page 97: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 97

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

GLOSARIO

- Distribución binomial: Distribución donde los sucesos tienen la misma probabili-dad, con la presencia de éxito y fracaso y en un número fijo de ensayos.

- Distribución de Poisson: Distribución de probabilidad discreta que se aplica a ocu-rrencias de algún suceso durante un intervalo de tiempo, distancia, área, volumen u otra unidad similar que se especifique.

- Distribución de probabilidad: Conjunto de valores de una variable aleatoria junto con sus probabilidades correspondientes.

- Distribución hipergeométrica: Se diferencia de la binomial en que la probabilidad de los sucesos no se mantiene constante.

- Distribución muestral de proporciones: Distribución de probabilidad de las propor-ciones muestrales, donde todas las muestras tienen el mismo tamaño muestral n.

- Distribución normal: Distribución de probabilidad con forma de campana, simétri-ca y asintótica por ambos extremos.

- Distribución normal estándar: Distribución normal con una media igual a cero y una desviación estándar igual a 1

- Valorcríticoz:Número de veces que la diferencia entre la observación dada y la media contiene a la desviación estándar.

- Valor esperado: Promedio ponderado de los resultados de un experimento.

- Variable Aleatoria: Variable que toma diferentes valores como resultado de un expe-rimento aleatorio.

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

BIBLIOGRAFÍA DE LA UNIDAD IV

1. Triola Mario F. ESTADÍSTICA. Pearson Educación. México 2012

2. Toma Inafuko-Rubio Donet. Estadística Aplicada. Centro de Investigación Univer-sidad del Pacífico. 2012

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

AUTOEVALUACIÓN DE LA UNIDAD IV

1. La encargada de los préstamos en un banco estima, con base en sus años de expe-riencia, que la probabilidad de que un solicitante no sea capaz de pagar su présta-mo es 0.025. El mes pasado realizó 40 préstamos. ¿Cuál es la probabilidad de que 3 préstamos no sean pagados oportunamente?

A) 0,6 B) 61% C) 6%

D) 0,625 E) 0,94

2. El arribo de buses de pasajeros al terminal de la Empresa de Transportes “Cruz del Sur” es un proceso de Poisson, con un promedio de 2 arribos por hora. Calcular la probabilidad de que ningún bus arribe en una hora.

A) 0,1527 B) 0,0165 C) 0,1353

D) 0,1254 E) 0,1758

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD

Page 98: A0175 Estadistica I MAU01

98

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

3. SeaZ~N(0,1).HalleP[-2≤Z≤-1.57]

A) 0.0678 B) 0.0542 C) 0.0354

D) 0.0478 E) 0.5147

4. Una población normal tiene una media de 20,00 y una desviación estándar de 4,00. Halleelvalor“z”correspondientea25,00

A) 1,25 B) 1,26 C) 1,27

D) 1,28 E) 1,29

5. Un estudio reciente de los sueldos por hora del personal de una empresa mostró que el salario medio por hora es de 16,50 Nuevos Soles, con una desviación están-dar de 3,50 nuevos soles. Si se selecciona al azar a un trabajador de la empresa ¿cuál es la probabilidad de que gane más de 20 nuevos soles la hora?

A) 0,1680 B) 0,1580 C) 0,1587

D) 0,1682 E)0,8415

l

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD

Page 99: A0175 Estadistica I MAU01

ESTADÍSTICA I MANUAL AUTOFORMATIVO 99

Diagrama Objetivos Inicio

Desarrollode contenidos

Actividades Autoevaluación

Lecturasseleccionadas

Glosario Bibliografía

Recordatorio Anotaciones

CLAVE DE RESPUESTAS AUTOEVALUACIONES.

ANEXO

Page 100: A0175 Estadistica I MAU01