Modulo Estadistica UCT

63
UNIVERSIDAD CATÓLICA DE TRUJILLO BENEDICTO XVI Programa de Complementación Académica Asignatura: ESTADÍSTICA Y PROBABILIDAD APLICADA A LA EDUCACIÓN Ing. JOHAN HERBERT NARRO VARGAS Trujillo, Perú 2013 UNIVERSIDAD CATÓLICA DE TRUJILLO BENEDICTO XVI

Transcript of Modulo Estadistica UCT

Page 1: Modulo Estadistica UCT

UNIVERSIDAD CATÓLICA DE TRUJILLO

BENEDICTO XVI

Programa de Complementación Académica

Asignatura:

ESTADÍSTICA Y PROBABILIDAD APLICADA A LA EDUCACIÓN

Ing. JOHAN HERBERT NARRO VARGAS

Trujillo, Perú

2013

UNIVERSIDAD CATÓLICA DE TRUJILLO BENEDICTO XVI

Page 2: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas ii

E-mail: [email protected]

AUTORIDADES UNIVERSITARIAS

Gran Canciller y Fundador de la UCT: Mons. Dr. Héctor Miguel Cabrejos Vidarte, OFM.

Vice Gran Canciller: Rvdo Padre Francisco Castro Lalupú.

Rector: Dr. Alcibíades Helí Miranda Chávez.

Vicerrector Académico: Mg. José Andrés Cruzado Albarrán.

Gerente General: Rvdo Padre César Lázaro Lescano.

Delegado de la Asociación Civil ante la UCT: Mons. Ricardo Exequiel Angulo Bazauri

Gerente de Administración y Finanzas: Ing. Marco Antonio Dávila Cabrejos.

Secretario General: Lic. Jorge Isaac Manrique Catalán

FACULTAD DE HUMANIDADES

Decano: Dr. José Theódulo Esquivel Grados.

PROGRAMA DE COMPLEMENTACIÓN ACADÉMICA

Director General: Mg. José Andrés Cruzado Albarrán.

.

Page 3: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas iii

E-mail: [email protected]

Contenidos

Presentación ............................................................................................................................................ 1

Capítulo I: Conceptos y Generalidades ................................................................................................... 2

1.1. Aspectos generales de Estadística ........................................................................................... 2

1.1.1. Definición de Estadística ................................................................................................. 2

1.1.2. Áreas del Análisis Estadístico ......................................................................................... 2

1.1.3. Población ......................................................................................................................... 4

1.1.4. Muestra ............................................................................................................................ 4

1.1.5. Variable ........................................................................................................................... 5

1.2. Obtención de información ....................................................................................................... 5

1.2.1. Muestreo .......................................................................................................................... 6

1.2.2. Muestreo No Probabilístico ............................................................................................. 6

1.2.3. Muestreo Probabilístico ................................................................................................... 7

1.3. Tablas de frecuencia ................................................................................................................ 9

1.4. Gráficos estadísticos .............................................................................................................. 11

1.4.1. Barras............................................................................................................................. 12

1.4.2. Histogramas y Polígonos de frecuencias ....................................................................... 12

1.4.3. Circulares....................................................................................................................... 13

1.4.4. Barras subliminales ....................................................................................................... 13

1.4.5. Pictogramas ................................................................................................................... 13

Ejercicios del Capítulo I ................................................................................................................ 14

Capítulo II: Medidas Resúmenes .......................................................................................................... 16

2.1. Medidas de Posición .............................................................................................................. 16

2.1.1. Media aritmética ............................................................................................................ 16

2.1.2. Mediana ......................................................................................................................... 17

2.1.3. Moda .............................................................................................................................. 19

2.1.4. Percentiles ..................................................................................................................... 20

2.2. Medidas de Dispersión .......................................................................................................... 20

2.2.1. Desviación Media .......................................................................................................... 20

2.2.2. Varianza y Desviación típica ......................................................................................... 22

2.2.3. Coeficiente de variación y asimetría de Pearson ........................................................... 24

Ejercicios del Capítulo II ............................................................................................................... 25

Capítulo III: Probabilidad ...................................................................................................................... 26

Page 4: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas iv

E-mail: [email protected]

3.1. Conjuntos y Probabilidad ...................................................................................................... 26

3.1.1. Generalidades de Conjuntos .......................................................................................... 26

3.1.2. Operaciones con Conjuntos ........................................................................................... 27

3.1.3. Experimentos aleatorios ................................................................................................ 29

3.1.4. Espacio muestral ............................................................................................................ 29

3.1.5. Probabilidad, axiomas y teoremas ................................................................................. 30

3.1.6. Probabilidad Condicional .............................................................................................. 31

3.1.7. Sucesos Independientes ................................................................................................. 32

3.1.8. Teorema de Bayes ......................................................................................................... 32

3.1.9. Análisis Combinatorio ................................................................................................... 32

3.2. Variables Aleatorias y distribuciones de probabilidad .......................................................... 34

3.2.1. Variable aleatoria .......................................................................................................... 34

3.2.2. Distribución de Probabilidad discreta ........................................................................... 35

3.2.3. Función de Distribución discreta ................................................................................... 35

3.2.4. Distribución de Probabilidad continua .......................................................................... 36

3.2.5. Función de Distribución continua ................................................................................. 37

3.3. Varianza y desviación típica de variables aleatorias ............................................................. 37

3.3.1. Varianza y desviación típica de una VA discreta .......................................................... 37

3.3.2. Varianza y desviación típica de una VA continua ......................................................... 37

3.4. Distribuciones de Probabilidad con nombre Propio .............................................................. 38

3.4.1. Distribución Binomial o de Bernoulli ........................................................................... 38

3.4.2. Distribución Normal ...................................................................................................... 38

3.4.3. Distribución de Poisson ................................................................................................. 39

3.4.4. Distribución Hipergeométrica ....................................................................................... 39

3.4.5. Distribución Chi-Cuadrado ........................................................................................... 39

3.4.6. Distribución t de Student ............................................................................................... 39

Ejercicios del Capítulo III ............................................................................................................. 40

Capítulo IV: Estadísticos para la prueba de Hipótesis .......................................................................... 42

4.1. Ensayos de Hipótesis y significación .................................................................................... 42

4.1.1. Decisiones Estadísticas .................................................................................................. 42

4.1.2. Hipótesis estadísticas. Hipótesis nula ............................................................................ 42

4.1.3. Errores de Tipo I y Tipo II ............................................................................................ 43

4.1.4. Nivel de significación .................................................................................................... 43

4.1.5. Ensayos referentes a Distribuciones Normales ............................................................. 43

Page 5: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas v

E-mail: [email protected]

4.1.6. Ensayos de una y dos colas ........................................................................................... 45

4.1.7. Ensayos relacionados con diferencias de medias y proporciones ................................. 46

4.1.8. Ensayos relacionados con la Distribución t de Student ................................................. 48

4.1.9. Ensayos relacionados con la Distribución chi-Cuadrado .............................................. 48

4.2. Curva de ajuste, regresión y correlación ............................................................................... 49

4.2.1. Curva de Ajuste ............................................................................................................. 49

4.2.2. Método de mínimos cuadrados ...................................................................................... 50

4.2.3. Recta de Mínimos cuadrados en términos de varianzas y covarianzas muestrales ....... 51

4.2.4. Error típico de la estima ................................................................................................ 51

Ejercicios del Capítulo IV ............................................................................................................. 53

Apéndice A ............................................................................................................................................ 54

Apéndice B ............................................................................................................................................ 55

Apéndice C ............................................................................................................................................ 56

Apéndice D ............................................................................................................................................ 57

Referencias ............................................................................................................................................ 58

Page 6: Modulo Estadistica UCT

Presentación

Permanentemente recibimos información referente al área en que trabajamos y es necesario

hacer uso de ella, puesto que será útil para el proyecto en que deseemos embarcarnos.

La información es importante para la toma de decisiones en muchos problemas. Para esto

necesitamos un procesamiento adecuado de los datos que nos permita obtener conclusiones

certeras. En caso contrario, si no se aplica un buen procesamiento, es posible que en base a los

resultados tomemos una mala decisión.

La estadística es un campo del conocimiento que permite al investigador deducir y evaluar

conclusiones acerca de una población a partir de información proporcionada por una muestra.

Específicamente, la estadística trata de teoremas, herramientas, métodos y técnicas que se

pueden usar en: Recolección, selección y clasificación de datos; Interpretación y análisis de

datos; Deducción y evolución de conclusiones y de su confiabilidad, basada en datos

muéstrales.

Los métodos de la estadística fueron desarrollados para el análisis de datos muestreados, así

como para propósitos de inferencia sobre la población de la que se seleccionó la muestra. La

estadística como ciencia, cubre un extenso campo donde poder aplicarla. Se divide en:

estadística descriptiva y estadística inferencial, que desempeñan funciones distintivas, pero

complementarias en el análisis.

Es importante que todo profesional que utilice la estadística como herramienta auxiliar de

trabajo, posea un mínimo de conocimientos y habilidades prácticas en aquellas técnicas que le

facilitarán el buen desarrollo de esta actividad.

El presente módulo tiene como objetivo general dar a conocer de forma concisa los teoremas,

herramientas, métodos y técnicas necesarios para el correcto análisis de los datos y que nos

permita obtener correctos resultados. Para ello se han estructurado los contenidos en cuatro

capítulos.

El primer capítulo trata sobre definición, historia y tipos de Estadística, así como los

conceptos de los términos a ser utilizados, terminando el capítulo con tablas de frecuencia y

gráficos estadísticos.

El segundo capítulo tratará sobre estadígrafos de posición y dispersión, mientras que el tercer

capítulo estará dedicado a las probabilidades.

En el cuarto capítulo concluiremos con el estudio de ensayos de hipótesis y significación.

El Autor.

Page 7: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 2

E-mail: [email protected]

Capítulo I: Conceptos y Generalidades

La educación es un factor crucial de desarrollo social y económico, así como un factor

esencial para la cohesión social, el diseño de políticas educativas exige que los actores

involucrados en las mismas tengan acceso a información pertinente, confiable y valida. Es

aquí donde la estadística educativa empieza a ser de gran importancia para la educación

porque mediante la interpretación de los datos se elaboran los objetivos del sector educativo,

se diseñan los proyectos y/o programas y, asignan las responsabilidades de cada componente

del sistema educativo del país.

Mediante un análisis cuantitativo podemos conocer el sistema escolarizado, las escuelas,

alumnos, personal docente y administrativo e indicadores, describir los movimientos y el

aprovechamiento de los alumnos por nivel educativo, sostenimiento y modalidad con

representaciones gráficas, tanto a nivel país como por regiones; también se registrar los

principales indicadores de retención, deserción, aprobación, reprobación y eficiencia terminal,

lo que permite conocer la situación de cada una de las regiones en materia educativa, así como

también, identificar cuáles presentan indicadores deficientes y qué regiones alcanzaron

mejores resultados.

1.1. Aspectos generales de Estadística

Resulta importante conocer los fundamentos básicos de la estadística, ya que

constituye una excelente herramienta de trabajo que nos permitirá conocer de manera

certera datos sobre los cuales tomar decisiones y así seguir progresando.

1.1.1. Definición de Estadística

La estadística es una rama de la matemática que

se refiere a la recolección, análisis e

interpretación de los datos obtenidos en un

estudio. Es aplicable a una amplia variedad de

disciplinas, desde la física hasta las ciencias

sociales, ciencias de la salud como la Psicología y

la Medicina, y usada en la toma de decisiones en áreas de negocios e

instituciones gubernamentales.

1.1.2. Áreas del Análisis Estadístico

Describiremos brevemente cada una de las áreas en que puede dividirse el

análisis estadístico:

a. Diseño: Planeamiento y desarrollo de investigaciones.

b. Descripción: Resumen y exploración de datos.

c. Inferencia: Hacer predicciones o generalizaciones acerca de

características de una población en base a la información de una muestra

de la población.

Page 8: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 3

E-mail: [email protected]

a. Diseño

Es una actividad crucial. Consiste en definir como se desarrollará la

investigación para dar respuesta a las preguntas que motivaron la misma.

La recolección de los datos requiere en general de un gran esfuerzo, por lo

que, dedicar especial cuidado a la etapa de planificación de la

investigación ahorra trabajo en las siguientes etapas. Un estudio bien

diseñado resulta simple de analizar y las conclusiones suelen ser obvias.

Un experimento pobremente diseñado o con datos inapropiadamente

recolectados o registrados puede ser incapaz de dar respuesta a las

preguntas que motivaron la investigación, más allá de lo sofisticado que

sea el análisis estadístico.

Aún en los casos en que se estudian datos ya registrados, en que estamos

restringidos a la información existente, los principios del buen diseño de

experimentos, pueden ser útiles para ayudar a seleccionar un conjunto

razonable de datos que esté relacionado con el problema de interés.

b. Descripción

Los métodos de la Estadística Descriptiva o Análisis Exploratorio de Datos

ayudan a presentar los datos de modo tal que sobresalga su estructura. Hay

varias formas simples e interesantes de organizar los datos en gráficos que

permiten detectar tanto las características sobresalientes como las

características inesperadas. El otro modo de describir los datos es

resumirlos en uno o dos números que pretenden caracterizar el conjunto

con la menor distorsión o pérdida de información posible.

Explorar los datos, debe ser la primera etapa de todo análisis de datos.

¿Por qué no analizarlos directamente? En primer lugar porque las

computadoras no son demasiado hábiles (sólo son rápidas), hacen aquello

para lo que están programadas y actúan sobre los datos que les ofrecemos.

Datos erróneos o inesperados serán procesados de modo inapropiado y ni

usted, ni la computadora se darán cuenta a menos que realice previamente

un análisis exploratorio de los datos.

c. Inferencia

Inferencia Estadística hace referencia a un conjunto de métodos que

permiten hacer predicciones acerca de características de un fenómeno

sobre la base de información parcial acerca del mismo. Los métodos de la

inferencia nos permiten proponer el valor de una cantidad desconocida

(estimación) o decidir entre dos teorías contrapuestas cuál de ellas explica

mejor los datos observados (test de hipótesis). El fin último de cualquier

estudio es aprender sobre las poblaciones. Pero es usualmente necesario, y

más práctico, estudiar solo una muestra de cada una de las poblaciones.

Page 9: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 4

E-mail: [email protected]

1.1.3. Población

Es el conjunto de todos los elementos (individuos) que presentan una

característica común determinada, observable y medible. Por ejemplo, si el

elemento es una persona, se puede estudiar las características edad, peso,

nacionalidad, sexo, etc.

Los elementos que integran una población pueden corresponder a personas,

objetos o grupos (por ejemplo, familias, fábricas, empresas, etc.).

Las características de la población se resumen en valores llamados parámetros.

1.1.4. Muestra

Muestra es un subconjunto, extraído de la población (mediante técnicas de

muestreo), cuyo estudio sirve para inferir características de toda la población.

Una fórmula muy extendida que orienta sobre el cálculo del tamaño de la

muestra para datos globales es la siguiente:

Donde:

n: es el tamaño de la muestra.

z: es es una constante que depende del nivel de confianza que asignemos.

El nivel de confianza indica la probabilidad de que los resultados de

nuestra investigación sean ciertos: un 95,5 % de confianza es lo mismo

que decir que nos podemos equivocar con una probabilidad del 4,5%. Los

valores de z más utilizados y sus niveles de confianza son:

Valor de k 1,15 1,28 1,44 1,65 1,96 2,24 2,58

Nivel de confianza 75% 80% 85% 90% 95% 97,5% 99%

e: es el error muestral deseado. El error muestral es la diferencia que puede

haber entre el resultado que obtenemos preguntando a una muestra de la

población y el que obtendríamos si preguntáramos al total de ella.

Ejemplo: si los resultados de una encuesta dicen que 100 personas

comprarían un producto y tenemos un error muestral del 5%, entonces

comprarán el producto entre 95 y 105 personas.

p: es la proporción de individuos que poseen en la población la

característica de estudio. Este dato es generalmente desconocido y se suele

suponer que p=q=0.5 que es la opción más segura.

Si el tamaño de la población es pequeño, entonces el tamaño de la muestra se

tendrá que reajustar de acuerdo a la siguiente fórmula:

Page 10: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 5

E-mail: [email protected]

Donde:

n´: Tamaño de la muestra necesario, reajustado.

n: Tamaño de la muestra según la primera fórmula.

N: Tamaño de la población.

1.1.5. Variable

Se llama variable a una característica que se observa en una población o

muestra, y a la cual se desea estudiar. La variable puede tomar diferentes

valores dependiendo de cada individuo. Una variable se puede clasificar de la

siguiente manera:

a. Variable cuantitativa: es aquella que toma valores numéricos. Dentro de

ella, se subdividen en:

Continua: son valores reales. Pueden tomar cualquier valor dentro de

un intervalo. Ej. Peso, estatura, sueldos.

Discreta: toma valores enteros. Ej. N° de hijos de una familia, n° de

alumnos de un curso.

b. Variable cualitativa: es aquella que describe cualidades. No son numéricas

y se subdividen en:

Nominal: son cualidades sin orden. Ej. Estado civil, preferencia por

una marca, sexo, lugar de residencia.

Ordinal: son cualidades que representan un orden y jerarquía. Ej.

Nivel educacional, días de la semana, calidad de la atención, nivel

socioeconómico.

1.2. Obtención de información

Los datos son generalmente imperfectos en el sentido que aun cuando posean

información útil no nos cuentan la historia completa. Es necesario contar con métodos

que nos permitan extraer información a partir de los datos observados para

comprender mejor las situaciones que los mismos representan.

Algunas técnicas de análisis de datos son sorprendentemente simples de aprender y

usar más allá del hecho que la teoría matemática que las sustentan puede ser muy

complejo. Todos, aún los estadísticos, tenemos problemas al enfrentarnos con listados

de datos. Existen muchos métodos estadísticos cuyo propósito es ayudarnos a poner de

manifiesto las características sobresalientes e interesantes de nuestros datos que

pueden ser usados en casi todas las áreas del conocimiento.

Los métodos estadísticos pueden y deberían ser usados en todas las etapas de una

investigación, desde el comienzo hasta el final. Existe el convencimiento de que la

estadística trata con el ANÁLISIS DE DATOS (quizás porque esta es la contribución

Page 11: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 6

E-mail: [email protected]

más visible de la estadística), pero este punto de vista excluye aspectos vitales

relacionados con el DISEÑO DE LAS INVESTIGACIONES. Es importante tomar

conciencia que la elección del método de análisis para un problema, se basa tanto en el

tipo de datos disponibles como en la forma en que fueron recolectados.

1.2.1. Muestreo

En ocasiones en que no es posible o conveniente realizar un censo (analizar a

todos los elementos de una población), se selecciona una muestra, entendiendo

por tal una parte representativa de la población. El muestreo es por lo tanto una

herramienta de la investigación científica, cuya función básica es determinar

que parte de una población debe examinarse, con la finalidad de hacer

inferencias sobre dicha población.

La muestra debe lograr una representación adecuada de la población, en la que

se reproduzca de la mejor manera los rasgos esenciales de dicha población que

son importantes para la investigación. Para que una muestra sea representativa,

y por lo tanto útil, debe de reflejar las similitudes y diferencias encontradas en

la población, es decir ejemplificar las características de ésta.

Los errores más comunes que se pueden cometer son:

Hacer conclusiones muy generales a partir de la observación de sólo una

parte de la Población, se denomina error de muestreo.

Hacer conclusiones hacia una Población mucho más grandes de la que

originalmente se tomó la muestra. Error de Inferencia.

Recordar: En estadística se usa la palabra población para referirse no sólo a

personas sino a todos los elementos que han sido escogidos para su estudio y el

término muestra se usa para describir una porción escogida de la población.

1.2.2. Muestreo No Probabilístico

A veces, para estudios exploratorios, el muestreo probabilístico resulta

excesivamente costoso y se acude a métodos no probabilísticos, aun siendo

conscientes de que no sirven para realizar generalizaciones (estimaciones

inferenciales sobre la población), pues no se tiene certeza de que la muestra

extraída sea representativa, ya que no todos los sujetos de la población tienen la

misma probabilidad de ser elegidos. En general se seleccionan a los sujetos

siguiendo determinados criterios procurando, en la medida de lo posible, que la

muestra sea representativa.

En algunas circunstancias los métodos estadísticos permiten resolver los

problemas de representatividad aun en situaciones de muestreo no

probabilístico, por ejemplo los estudios de caso-control, donde los casos no son

seleccionados aleatoriamente de la población.

Page 12: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 7

E-mail: [email protected]

Entre los métodos de muestreo no probabilísticos más utilizados en

investigación encontramos:

a. Muestreo por cuotas:

También denominado en ocasiones "accidental". Se asienta generalmente

sobre la base de un buen conocimiento de los estratos de la población y/o

de los individuos más "representativos" o "adecuados" para los fines de la

investigación. Mantiene, por tanto, semejanzas con el muestreo aleatorio

estratificado, pero no tiene el carácter de aleatoriedad de aquél.

En este tipo de muestreo se fijan unas "cuotas" que consisten en un

número de individuos que reúnen unas determinadas condiciones, por

ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y residentes en

Gijón. Una vez determinada la cuota se eligen los primeros que se

encuentren que cumplan esas características. Este método se utiliza mucho

en las encuestas de opinión.

b. Muestreo intencional o de conveniencia:

Éste tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener

muestras "representativas" mediante la inclusión en la muestra de grupos

supuestamente típicos. Es muy frecuente su utilización en sondeos

preelectorales de zonas que en anteriores votaciones han marcado

tendencias de voto.

También puede ser que el investigador seleccione directa e

intencionadamente los individuos de la población. El caso más frecuente

de este procedimiento el utilizar como muestra los individuos a los que se

tiene fácil acceso (los profesores de universidad o colegios emplean con

mucha frecuencia a sus propios alumnos).

c. Bola de nieve:

Se localiza a algunos individuos, los cuales conducen a otros, y estos a

otros, y así hasta conseguir una muestra suficiente. Este tipo se emplea

muy frecuentemente cuando se hacen estudios con poblaciones

"marginales", delincuentes, sectas, determinados tipos de enfermos, etc.

d. Muestreo Discrecional:

A criterio del investigador los elementos son elegidos sobre los que él cree

que pueden aportar al estudio.

1.2.3. Muestreo Probabilístico

Los métodos de muestreo probabilísticos son aquellos que se basan en el

principio de equiprobabilidad. Es decir, aquellos en los que todos los

individuos tienen la misma probabilidad de ser elegidos para formar parte de

Page 13: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 8

E-mail: [email protected]

una muestra y, consiguientemente, todas las posibles muestras de tamaño n

tienen la misma probabilidad de ser seleccionadas. Sólo estos métodos de

muestreo probabilísticos nos aseguran la representatividad de la muestra

extraída y son, por tanto, los más recomendables. Dentro de los métodos de

muestreo probabilísticos encontramos los siguientes tipos:

a. Muestreo aleatorio simple:

El procedimiento empleado es el siguiente: 1) se asigna un número a cada

individuo de la población y 2) a través de algún medio mecánico (bolas

dentro de una bolsa, tablas de números aleatorios, números aleatorios

generados con una calculadora u ordenador, etc.) se eligen tantos sujetos

como sea necesario para completar el tamaño de muestra requerido.

Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad

práctica cuando la población que estamos manejando es muy grande.

b. Muestreo aleatorio sistemático:

Este procedimiento exige, como el anterior, numerar todos los elementos

de la población, pero en lugar de extraer n números aleatorios sólo se

extrae uno. Se parte de ese número aleatorio i, que es un número elegido al

azar, y los elementos que integran la muestra son los que ocupa los lugares

i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k,

siendo k el resultado de dividir el tamaño de la población entre el tamaño

de la muestra: k= N/n. El número i que empleamos como punto de partida

será un número al azar entre 1 y k.

El riesgo este tipo de muestreo está en los casos en que se dan

periodicidades en la población ya que al elegir a los miembros de la

muestra con una periodicidad constante (k) podemos introducir una

homogeneidad que no se da en la población. Imaginemos que estamos

seleccionando una muestra sobre listas de 10 individuos en los que los 5

primeros son varones y los 5 últimos mujeres, si empleamos un muestreo

aleatorio sistemático con k=10 siempre seleccionaríamos o sólo hombres o

sólo mujeres, no podría haber una representación de los dos sexos.

c. Muestreo aleatorio estratificado:

Trata de obviar las dificultades que presentan los anteriores ya que

simplifican los procesos y suelen reducir el error muestral para un tamaño

dado de la muestra. Consiste en considerar categorías típicas diferentes

entre sí (estratos) que poseen gran homogeneidad respecto a alguna

característica (se puede estratificar, por ejemplo, según la profesión, el

municipio de residencia, el sexo, el estado civil, etc.). Lo que se pretende

con este tipo de muestreo es asegurarse de que todos los estratos de interés

estarán representados adecuadamente en la muestra.

Page 14: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 9

E-mail: [email protected]

Cada estrato funciona independientemente, pudiendo aplicarse dentro de

ellos el muestreo aleatorio simple o el estratificado para elegir los

elementos concretos que formarán parte de la muestra. En ocasiones las

dificultades que plantean son demasiado grandes, pues exige un

conocimiento detallado de la población. (Tamaño geográfico, sexos,

edades,...).

La distribución de la muestra en función de los diferentes estratos se

denomina afijación, y puede ser de diferentes tipos:

Afijación Simple: A cada estrato le corresponde igual número de

elementos muéstrales.

Afijación Proporcional: La distribución se hace de acuerdo con el peso

(tamaño) de la población en cada estrato.

Afijación Óptima: Se tiene en cuenta la previsible dispersión de los

resultados, de modo que se considera la proporción y la desviación

típica. Tiene poca aplicación ya que no se suele conocer la desviación.

d. Muestreo aleatorio por conglomerados:

Los métodos presentados hasta ahora están pensados para seleccionar

directamente los elementos de la población, es decir, que las unidades

muéstrales son los elementos de la población.

En el muestreo por conglomerados la unidad muestral es un grupo de

elementos de la población que forman una unidad, a la que llamamos

conglomerado. Las unidades hospitalarias, los departamentos

universitarios, una caja de determinado producto, etc., son conglomerados

naturales. En otras ocasiones se pueden utilizar conglomerados no

naturales como, por ejemplo, las urnas electorales. Cuando los

conglomerados son áreas geográficas suele hablarse de "muestreo por

áreas".

El muestreo por conglomerados consiste en seleccionar aleatoriamente un

cierto número de conglomerados (el necesario para alcanzar el tamaño

muestral establecido) y en investigar después todos los elementos

pertenecientes a los conglomerados elegidos.

1.3. Tablas de frecuencia

La estadística descriptiva o análisis exploratorio de datos ofrece modos de presentar y

evaluar las características principales de los datos a través de tablas, gráficos y

medidas resúmenes.

El modo más simple de presentar datos categóricos es por medio de una tabla de

frecuencias. Esta tabla indica el número de unidades de análisis que caen en cada una

de las clases de la variable cualitativa.

Page 15: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 10

E-mail: [email protected]

Cuando los datos estadísticos de que se dispone son numerosos, es difícil realizar

cálculos sobre ellos. Por esta razón se organizan en tablas de manera de facilitar el

trabajo.

Una tabla de frecuencia es la ordenación de la información obtenida de una muestra,

en el estudio de una sola variable.

Cuando se dispone de un gran número de datos, es útil distribuirlos en categorías

dentro de una tabla para facilitar el análisis. Se explicara con un ejemplo:

Ejemplo 01: en una encuesta de presupuesto familiar, se ha obtenido la siguiente

información respecto al número de hijos en 21 familias:

3, 1, 2, 0, 3, 2, 1, 1, 3, 3, 2, 4, 2, 2, 0, 2, 1, 3, 4, 2, 3

Variable X: Número de hijos

Observamos que la variable X toma valores entre 0 y 4, es decir existen en éste grupo

5 categorías o clases.

Contamos el número de familias en cada categoría y construimos la tabla

Clase

Xi

Frecuencia

fi

Frec. Acumulada

Fi=fi-1+fi

Frec. Relativa

hi=fi/n

Frec. Rel. Acum.

Hi=hi-1+hi

0 2 0+2=2 2/21=0.095 0+0.095=0.095

1 4 2+4=6 4/21=0.190 0.095+0.190=0.286

2 7 6+7=13 7/21=0.333 0.286+0.333=0.619

3 6 13+6=19 6/21=0.286 0.619+0.286=0.905

4 2 19+2=21 2/21=0.095 0.905+0.095=1

Total n = 21 1 Tabla 01: Distribución de frecuencias de la variable X, número de hijos por familia.

Observamos algunos detalles importantes:

o n es la suma de la columna fi, es decir, siempre debe dar como resultado el tamaño

de la muestra.

o En la columna de frecuencia absoluta acumulada se va sumando los valores de la

columna fi, por lo tanto el último valor debe ser igual a n.

o La columna frecuencia relativa (hi) representa en % de familias en cada categoría.

Por ejemplo, en la categorías con 3 hijos a un 28.6% de familias. Esta columna

debe sumar 1.

o La Hi acumula los valores de la frecuencia relativa, por lo tanto el último valor

debe ser 1. Ejemplo H4: el 90.5% de las familias encuestadas tienen a los más 3

hijos.

Page 16: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 11

E-mail: [email protected]

En el caso de analizar una variable continua, la tabla de frecuencia cambia sólo en el

comienzo. También se verá en un ejemplo:

Ejemplo 02: Salarios semanales de 40 personas en nuevos soles:

90 62 102 85 92 106 110 95 105 112

108 86 110 68 118 99 98 74 91 80

80 100 79 93 93 104 77 106 98 73

95 85 91 83 67 119 108 115 74 88

Se efectúan los siguientes pasos:

a. Se buscan los valores mínimo (Xmin=……) y máximo (Xmax=……)

b. Se calcula el rango (R). R = Xmax - Xmin = …… - ……. = ……

c. La cantidad de intervalos no debe ser menor de 5 ni mayor de 18. Por lo general

tiene el mismo ancho. Una forma de calcular el nº de intervalos para generar la

tabla de frecuencias es mediante la siguiente formula: k = 1 + 3.322log(n).

Para nuestro ejemplo entonces el número de intervalos “k” será:

k = 1 + 3.322log(……)

k = …….

d. Se calcula la amplitud de cada intervalo c = R / k. Para nuestro caso será:

c = …

e. Se construye la tabla:

Intervalos

[Xinf – Xsup>

Marca de Clase

fi Fi hi Hi

61 - .

. - 121

Total Tabla 02: Distribución de frecuencias de la variable X, salarios semanales

1.4. Gráficos estadísticos

En este apartado presentaremos formas simples de resumir

y representar gráficamente conjuntos de datos.

El objetivo de construir gráficos es poder apreciar los datos

como un todo e identificar sus características sobresalientes.

El tipo de gráfico a seleccionar depende del tipo de variable que nos interese

representar por esa razón distinguiremos en la presentación gráficos para variables

categóricas y para variables numéricas.

Page 17: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 12

E-mail: [email protected]

1.4.1. Barras

Se construye sobre el sistema de ejes cartesianos. Es un procedimiento gráfico

para representar los datos nominales u ordinales. Para cada categoría se traza

una barra vertical en que la altura es la frecuencia absoluta de la categoría. El

ancho de la barra es arbitrario.

Imagen 02: Gráfico de barras

También se utiliza si la variable en estudio es numérica discreta.

1.4.2. Histogramas y Polígonos de frecuencias

Se construyen sobre el sistema de coordenadas cartesianas. Se utiliza cuando la

variable en estudio es continua o esta agrupada en una tabla de frecuencia con

intervalos en cada categoría.

En el eje X se identifica la variable en estudio y en el eje Y sé gráfica la

frecuencia absoluta o la frecuencia relativa. Consiste en una serie de

rectángulos en donde su altura depende del valor de cada frecuencia.

Cada categoría de la variable se representa por una barra. El ancho de cada

barra depende de la amplitud del intervalo.

Tomando como referencia los datos del ejemplo 02, se tiene el siguiente

gráfico:

Imagen 02: Polígono de frecuencias

0

20

40

60

80

100

120

140

1 2 3 4 5 6

0

2

4

6

8

10

12

56 66 76 86 96 106 116 126

fre

cue

nci

a

Salario semanal en S/.

Page 18: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 13

E-mail: [email protected]

El polígono se gráfica uniendo la punta superior de cada barra por segmento de

recta. Para que el polígono quede cerrado se considera un punto en la recta

horizontal, antes y después de las anotadas.

1.4.3. Circulares

Esta es otra forma de representar los datos, en especial cuando se trata de

cualidades. En un gráfico dibujado dentro de un círculo.

Es necesario en primer lugar calcular el porcentaje de cada categoría respecto

del total y luego repartir proporcionalmente estos porcentajes en los 360° del

círculo.

Imagen 03: Gráfico de torta

1.4.4. Barras subliminales

Es un gráfico de barras muy apropiado para comprobar subdivisiones en la

variable. Por ejemplo: % de estudiantes en diferentes carreras, separadas por

sexo. Cada barra es un 100%.

100%

80%

60% Hombres

40% Mujeres

20%

0%

A B C D

Imagen 04: Barras subliminales

1.4.5. Pictogramas

Un pictograma es la representación de datos estadísticos por medio de

símbolos que por su forma sugieren la naturaleza del dato. Así: podemos

representar el número de conferencias realizadas por las Universidades A (100

conferencias) y B (40 conferencias).

Imagen 05: Pictograma

7% 12%

18%

28%

20%

15% 66

76

86

96

106

Page 19: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 14

E-mail: [email protected]

Ejercicios del Capítulo I

i. Clasificar las siguientes variables:

- Número de alumnos por carrera.

- Comuna en que viven los alumnos del curso de estadística

- Color de ojos de un grupo de niños

- Notas de unidad

- Monto de pagos por concepto de aranceles en la universidad

- Sumas posibles de los números obtenidos al lanzar dos dados

- Estatura de los alumnos

- Peso del contenido de un paquete de cereal

- Monto de la venta de un artículo en $

- Número de acciones vendidas

- Nivel de atención en el Banco

- Nivel de actitud académica

- AFP a que pertenece un individuo

- Edad de los alumnos

ii. Se desea conocer el tamaño de la muestra de la Población de estudiantes de nivel

secundario de la urbanización Primavera de la ciudad de Trujillo con un nivel de

confianza de 97.5 % y un error de 5%.

n =

iii. Con los datos del ejercicio anterior reajustar la muestra sabiendo que el tamaño de la

población es de 1500 alumnos.

n´ =

iv. En la tabla de frecuencia siguiente faltan datos, complételos.

Valores fi Fi hi Hi

0 2

1 5

2 9

3 14 0.7

4 0,2

5

Totales

Page 20: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 15

E-mail: [email protected]

v. En la tabla de frecuencia siguiente faltan datos, complételos.

Yi-1 - Yi Yi fi Fi hi Hi

- 100 2

150 7

0,2

0,8

30

Total

vi. Los datos de la tabla de frecuencia que se presenta a continuación muestran los

resultados obtenidos por un grupo de alumnos en una prueba de habilidad de lectura,

Xi-1 – Xi+1 Xi fi Fi hi Hi

[32 - 35) 33,5 5 5 0,04 0,04

35 – 38 36,5 12 17 0,11 0,15

38 – 41 39,5 18 35 0,16 0,31

41 – 44 42,5 19 54 0,17 0,48

44 – 47 45,5 26 80 0,23 0,71

47 – 50 48,5 19 99 0,17 0,88

50 – 53 51,5 13 112 0,12 1,00

n = 112 1,00

¿Cómo interpretas los números en negrita?

vii. Realizar para cada una de las tablas de frecuencias de los ejercicios iv y vi sus

respectivos gráficos.

Page 21: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 16

E-mail: [email protected]

Capítulo II: Medidas Resúmenes

En este capítulo introduciremos distintas formas de resumir la

distribución muestral o poblacional de una variable NUMÉRICA.

Resumir un conjunto de datos es pasar de una visión detallada a

una generalización simple e informativa tratando de preservar las

características esenciales.

¿Por qué resumir? Para simplificar la comprensión y la comunicación de los datos.

Las medidas resúmenes son útiles para comparar conjuntos de datos cuantitativos y para

presentar los resultados de un estudio y se clasifican en dos grupos principales:

Medidas de posición o localización o tendencia central ⇒ describen un valor

alrededor del cual se encuentran las observaciones.

Medidas de dispersión o escala ⇒ pretenden expresar cuan variable es un conjunto de

datos.

2.1. Medidas de Posición

Son estadígrafos de tendencia central que son interpretados como valores que permiten

resumir a un conjunto de datos dispersos, podría asumirse que estas medidas equivalen

a un centro de gravedad que adoptan un valor representativo para todo un conjunto de

datos predeterminados.

2.1.1. Media aritmética

La media aritmética de una variable estadística es la suma de todos sus

posibles valores, ponderada por las frecuencias de los mismos.

a. Para datos no tabulados

Ejemplo 03: Se tienen las notas de una prueba de matemáticas de los

alumnos del 5° grado de educación primaria de la I.E. Buena Educación.

15, 12, 08, 18, 13, 11, 09, 16, 20, 19, 17, 15, 14, 16, 18. La media

aritmética será:

La media de notas de los alumnos del 5° grado de primaria de la I.E.

Buena Educación es 14.73.

Page 22: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 17

E-mail: [email protected]

b. Para datos tabulados

Ejemplo 04: Con los datos de la Tabla 02, calculamos el promedio de los

salarios semanales.

El salario semanal de los 40 trabajadores es en promedio de S/. 93.00 nuevos

soles.

2.1.2. Mediana

Es otra medida de posición o tendencia central. Se define como aquel valor de

la variable que supera la mitad de las observaciones y a su vez es superado por

la otra mitad de ellas. Por esta razón, se la considera como el valor central, ya

que se divide a los datos en 2 grupos (las observaciones deben estar ordenadas

de mayor a menor).

a. Para datos no tabulados

Se ordenan las observaciones de menor a mayor y se ubica el valor central.

Si la constante de datos (n) es par, se promedian los 2 valores centrales. En

cambio, si n es impar habrá solo un valor en el centro.

Ejemplo 05: Sean los datos

4 5 5 6 8 9 9 10

n=8 (par)

Ejemplo 06: Sean los datos

14 15 15 16 17 18 19 19 20

n = 9 (impar)

Page 23: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 18

E-mail: [email protected]

b. Para datos tabulados

Si los datos están tabulados no es posible individualizar el valor de la

mediana, pero si es factible determinar el intervalo donde se encuentra.

La fórmula para encontrar la mediana es:

(

)

Donde:

Xinf : es el valor inferior del intervalo mediano.

c : es la amplitud del intervalo.

Fi-1 : es la frecuencia acumulada anterior al intervalo mediano.

fi : es la frecuencia del intervalo mediano

n : es el número total de datos.

Ejemplo 07: Obtener la mediana de la distribución adjunta:

Xinf – Xsup fi Xi Fi

0 - 10 60 5 60

10 - 20 80 15 140

20 - 30 30 25 170

30 - 40 20 65 190

40 - 50 10 300 200

n=200

Calculamos n/2 para poder determinar el intervalo mediano n/2= 200/2 =

100.

La Fi más próxima que supera al valor calculado n/2=100 es F2=140, por

lo tanto el intervalo mediano será 10 – 20>. Entonces:

(

)

De lo que se puede afirmar que el 50% de los datos es mayor a 15,

mientras que el 50% restante es menor a 15.

Page 24: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 19

E-mail: [email protected]

2.1.3. Moda

Llamaremos moda a cualquier máximo relativo de la distribución de

frecuencias, es decir, cualquier valor de la variable que posea una frecuencia

mayor que su anterior y su posterior.

a. Para datos no tabulados

Se busca el valor más repetido.

Ejemplo 08: Para los datos

2 5 3 4 1 5 3

4 6 4 3 2 1 4

La Moda será, Mo = 4

b. Para datos tabulados

Se utiliza la siguiente fórmula:

(

)

Donde:

Xinf : es el valor inferior del intervalo con mayor frecuencia.

c : es la amplitud del intervalo.

fi-1 : es la frecuencia anterior al intervalo modal.

fi : es la frecuencia del intervalo modal.

fi+1 : es la frecuencia posterior del intervalo modal.

n : es el número total de datos.

Ejemplo 09: Utilizando los datos de la Tabla 02, calculamos la moda

(

)

(

)

De lo cual podemos afirmar que el salario semanal más frecuente de los

trabajadores es de S/. 98.14 nuevos soles.

Page 25: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 20

E-mail: [email protected]

2.1.4. Percentiles

Para una variable discreta, se define el percentil de orden k, como la

observación, Pk, que deja por debajo de si el k% de la población. Se calcula

con la siguiente fórmula:

(

)

2.2. Medidas de Dispersión

Los estadísticos de tendencia central o posición nos indican donde se sitúa un grupo

de puntuaciones. Los de variabilidad o dispersión nos indican si esas puntuaciones o

valores están próximas entre sí o si por el contrario están o muy dispersas.

Una medida razonable de la variabilidad podría ser la amplitud o rango, que se

obtiene restando el valor más bajo de un conjunto de observaciones del valor más alto.

Es fácil de calcular y sus unidades son las mismas que las de la variable, aunque posee

varios inconvenientes:

No utiliza todas las observaciones (sólo dos de ellas);

Se puede ver muy afectada por alguna observación extrema;

El rango aumenta con el número de observaciones, o bien se queda igual. En

cualquier caso nunca disminuye.

En el transcurso de esta sección, veremos medidas de dispersión mejores que la

anterior. Estas se determinan en función de la distancia entre las observaciones y

algún estadístico de tendencia central.

2.2.1. Desviación Media

Se define la desviación media como la media de las diferencias en valor

absoluto de los valores de la variable a la media, es decir, si tenemos un

conjunto de n observaciones, x1, ..., xn, entonces

∑| |

Si los datos están agrupados en una tabla estadística es más sencillo usar la

relación

∑| |

Como se observa, la desviación media guarda las mismas dimensiones que las

observaciones. La suma de valores absolutos es relativamente sencilla de

calcular, pero esta simplicidad tiene un inconveniente: Desde el punto de vista

geométrico, la distancia que induce la desviación media en el espacio de

observaciones no es la natural. Esto hace que sea muy engorroso trabajar con

ella a la hora de hacer inferencia a la población.

Page 26: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 21

E-mail: [email protected]

Ejemplo 10: Para el siguiente conjunto de datos, calcular su desviación media.

2 5 3

4 6 4

Entonces, primero calculamos la media

Luego, la desviación media será

∑| |

| | | | | | | | | | | |

Ejemplo 11: Sea la siguiente tabla de distribución de frecuencias

correspondiente a la variable X, estatura de los alumnos de un determinado

colegio.

Xinf Xsup Xi fi

0.99 1.16 1.075 4

1.16 1.33 1.245 6

1.33 1.50 1.415 8

1.50 1.67 1.585 9

1.67 1.84 1.755 8

1.84 2.01 1.925 5

Total

40 Tabla 03: Distribución de frecuencias de estaturas de alumnos

Calculamos la media, y completamos la tabla de distribución

Xinf Xsup Xi fi Xi.fi |Xi-Xprom| |Xi-Xprom|*fi

0.99 1.16 1.075 4 4.3 0.4505 1.8020

1.16 1.33 1.245 6 7.47 0.2805 1.6830

1.33 1.50 1.415 8 11.32 0.1105 0.8840

1.50 1.67 1.585 9 14.265 0.0595 0.5355

1.67 1.84 1.755 8 14.04 0.2295 1.8360

1.84 2.01 1.925 5 9.625 0.3995 1.9975

Total

40 61.02

8.7380

Page 27: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 22

E-mail: [email protected]

Luego la desviación media será,

∑| |

2.2.2. Varianza y Desviación típica

La Desviación estándar, también llamada desviación típica, es una medida

de dispersión usada en estadística que nos dice cuánto tienden a alejarse los

valores puntuales del promedio en una distribución. Específicamente, la

desviación estándar es "el promedio de la distancia de cada punto respecto del

promedio". Se suele representar por una S o con la letra sigma según se

calcule en una muestra o en la población.

Una desviación estándar grande indica que los puntos están lejos de la media, y

una desviación pequeña indica que los datos están agrupados cerca de la media.

Imagen 06: Nivel de dispersión de datos

Page 28: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 23

E-mail: [email protected]

La fórmula para calcular la desviación típica en datos no tabulados es:

√∑

Mientras que en datos tabulados se calcula con la siguiente fórmula:

√∑

(∑ )

Ejemplo 12: Con los datos de la tabla 03, determinar la desviación típica, para

ello completamos la tabla

Xinf Xsup Xi fi Xi.fi fi.

0.99 1.16 1.075 4 4.3 4.6225

1.16 1.33 1.245 6 7.47 9.3002

1.33 1.50 1.415 8 11.32 16.0178

1.50 1.67 1.585 9 14.265 22.6100

1.67 1.84 1.755 8 14.04 24.6402

1.84 2.01 1.925 5 9.625 18.5281

Total

40 61.02 95.7188

Luego con los datos obtenidos calculamos la desviación típica:

√∑

(∑ )

El valor de la varianza es S2, entonces para nuestro caso, la varianza será:

Page 29: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 24

E-mail: [email protected]

2.2.3. Coeficiente de variación y asimetría de Pearson

El coeficiente de variación elimina la dimensionalidad de las variables y tiene

en cuenta la proporción existente entre medias y desviación típica. Se define

del siguiente modo:

Las distribuciones pueden tener diferentes formas, y una manera de

caracterizar la forma es observar su simetría. Una distribución de frecuencias

puede ser simétrica o asimétrica. Para saber si es simétrica tenemos que tomar

una referencia, es decir, ver respecto a qué es simétrica. El coeficiente de

asimetría de Pearson, mide la desviación de la simetría, expresando la

diferencia entre la media y la mediana con respecto a la desviación estándar del

grupo de mediciones. Su fórmula es:

Si As = 0 diremos que la distribución es simétrica, en ese caso las

desviaciones a la derecha y a la izquierda de la media se compensan.

Si As < 0 diremos que es asimétrica negativa ya que la mayoría de las

observaciones están a la derecha de la proyección de la media.

Si As > 0 diremos que es asimétrica positiva ya que la mayoría de las

observaciones están a la izquierda de la proyección de la media.

Imagen 07: Tipos de asimetría

Page 30: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 25

E-mail: [email protected]

Ejercicios del Capítulo II

i. Una empresa ha realizado un test físico entre sus empleados para comprobar la

capacidad de esfuerzo que posee cada uno de ellos. Una de las medidas que componen

el mismo es el número de pulsaciones después de una determinada actividad física,

que está altamente relacionada con las que se realizan a lo largo de una jornada

laboral. Los datos conseguidos han sido distribuidos en una tabla de frecuencias. La

tabla resultante es la que se presenta:

Número de pulsaciones Número de empleados

70 - 75 3

75 – 80 3

80 – 85 7

85 – 90 10

90 – 95 12

95 - 100 8

Se pide:

a) media aritmética, mediana, cuartil inferior, percentil 60 y desviación típica.

b) ¿Qué tanto por cien de empleados tuvieron menos de 83 pulsaciones?

ii. Sea la siguiente tabla de distribución de frecuencias:

Intervalos Xi fi

160 – 162 161 2

163 – 165 164 5

166 – 168 167 7

169 – 171 170 9

172 – 174 173 12

175 – 177 176 13

178 – 180 179 14

181 – 183 182 15

184 – 186 185 20

187 – 189 188 22

TOTAL 119

Determinar:

a) Promedio

b) Mediana

c) Moda

d) Percentil 60

e) Desviación media

f) Desviación típica

g) Coeficiente de variación y coeficiente de asimetría

Page 31: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 26

E-mail: [email protected]

Capítulo III: Probabilidad

Si el único propósito del investigador es describir los

resultados de un experimento concreto, los métodos

analizados en los capítulos anteriores pueden considerarse

suficientes. No obstante, si lo que se pretende es utilizar la

información obtenida para extraer conclusiones generales

sobre todos aquellos objetos del tipo de los que han sido

estudiados, entonces estos métodos constituyen sólo el

principio del análisis, y debe recurrirse a métodos de

inferencia estadística, los cuales implican el uso inteligente

de la teoría de la probabilidad.

Comenzamos este bloque interpretando la noción de probabilidad y la terminología

subyacente a esta área de las matemáticas, ya que la probabilidad constituye por sí misma un

concepto básico que refleja su relación con la faceta del mundo exterior que pretende estudiar:

los fenómenos aleatorios, los cuales obedecen unas ciertas reglas de comportamiento. De

alguna manera, el concepto de probabilidad, se relaciona o nos recuerda las propiedades de la

frecuencia relativa.

A partir de ella, y junto con las definiciones de probabilidad condicionada y la de sucesos

independientes, se deducen los teoremas fundamentales del Cálculo de Probabilidades. Nos

centraremos posteriormente en el eslabón que une la teoría de la probabilidad y la estadística

aplicada: la noción de variable aleatoria, mostrando de esta manera, como puede emplearse la

teoría de la probabilidad para sacar conclusiones precisas acerca de una población en base a

una muestra extraída de ella, y que muchos de los estudios estadísticos son de hecho, estudio

de las propiedades de una o más variables aleatorias.

Tal como hemos citado anteriormente, en las aplicaciones prácticas es importante poder

describir los rasgos principales de una distribución, es decir, caracterizar los resultados del

experimento aleatorio mediante unos parámetros. Llegamos así al estudio de las

características asociadas a una variable aleatoria introduciendo los conceptos de esperanza y

varianza matemática, relacionándolos con los conceptos de media y varianza de una variable

estadística.

3.1. Conjuntos y Probabilidad

El concepto de conjunto es un pilar fundamental de la probabilidad y la estadística y

de la matemática en general. Un conjunto puede considerarse como una colección de

objetos, llamados miembros o elementos.

3.1.1. Generalidades de Conjuntos

a. Notación de un conjunto

En general se denota un conjunto con las letras del alfabeto en mayúsculas

(A, B, C, …, Z) y los elementos con las letras en minúsculas.

Page 32: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 27

E-mail: [email protected]

Si un elemento “a” pertenece a un determinado conjunto “A” se representa

así: a A y si un elemento “x” no pertenece a un conjunto “B” se

representa así: x B.

Un conjunto puede estar expresado por extensión, o por comprensión.

Ejemplo: sea el conjunto A de las vocales.

Por extensión

A = {a, e, i, o, u}

Por Comprensión

A = {x/x es una vocal}

b. Subconjunto

Si todos los elementos de un conjunto A también pertenecen a B, llamamos

a A un subconjunto de B, el cual se denota A B y se lee “A está

contenido en B”.

c. Conjunto universal y conjunto vacío

El conjunto Universo se denota con U, mientras que el conjunto nulo o

vacío se denota con .

d. Representación Gráfica de un conjunto

Un conjunto puede ser representado gráficamente por cualquier figura

geométrica, así:

Imagen 08: Representaciones gráficas de un Conjunto

3.1.2. Operaciones con Conjuntos

a. Unión

Ejemplo 13: Sean los conjuntos A = {1,2,3,4,5}, B = {1,3,5,7}, se

determinará A B.

A B = {1,2,3,4,5} {1,3,5,7}

A B = {1,2,3,4,5,1,3,5,7} se omiten los elementos repetidos, entonces

A B = {1,2,3,4,5,7}

A B C D E F G

Page 33: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 28

E-mail: [email protected]

b. Intersección

Ejemplo 13: Sean los conjuntos A = {1,2,3,4,5}, B = {1,3,5,7}, se

determinará A B.

A B = {1,2,3,4,5} {1,3,5,7}, sólo se consideran los elementos

comunes a ambos conjuntos.

A B = {1,3,5}

c. Diferencia

Ejemplo 14: Sean los conjuntos A = {1,2,3,4,5}, B = {1,3,5,7}, se

determinará A - B.

A - B = {1,2,3,4,5} - {1,3,5,7}, sólo se consideran los elementos del

conjunto A que no se repiten en B.

A - B = {2,4}

d. Complemento

Ejemplo 15: Sea el conjunto universal U = {c,a,m,o,t,e} y sea el conjunto

A = {m,o,t,e}, el complemento de A respecto al universo U será:

A’ = U – A

A’ = {c,a,m,o,t,e} - {m,o,t,e}

A’ = {c,a}

Page 34: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 29

E-mail: [email protected]

3.1.3. Experimentos aleatorios

Todos estamos familiarizados con la importancia de los experimentos en la

ciencia y en la ingeniería.

Sin embargo, hay experimentos en los cuales los resultados no son

esencialmente los mismos a pesar de que las condiciones sean

aproximadamente idénticas. Tales experimentos se denominan experimentos

aleatorios. Los siguientes son algunos ejemplos:

Ejemplo 16: Si lanzamos una moneda el resultado del experimento es un sello,

simbolizado por S, o una cara, simbolizado por C, es decir uno de los

elementos del conjunto {S,C}

Ejemplo 17: Si lanzamos un dado, el resultado es un número perteneciente al

siguiente conjunto {1,2,3,4,5,6}

Ejemplo 18: Se tiene un lector óptico para revisar examenes, el resultado del

experimento es que algunos examenes tendrán nota desaprobatoria. Así,

cuando se revise un examen el resultado es un elemento del conjunto

{0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20}

Ejemplo 19: Si lanzamos un dado dos veces, el resultado es un elemento

perteneciente al siguiente conjunto {CC,CS,SC,SS}

Hasta aquí podemos decir que un experimento es aleatorio si se verifican las

siguientes condiciones:

1. Se puede repetir indefinidamente, siempre en las mismas condiciones;

2. Antes de realizarlo, no se puede predecir el resultado que se va a obtener;

3. El resultado que se obtenga, e, pertenece a un conjunto conocido

previamente de resultados posibles.

3.1.4. Espacio muestral

Al conjunto, de resultados posibles de un experimento, lo denominaremos

espacio muestral y lo denotaremos normalmente mediante la letra δ. Los

elementos del espacio muestral se denominan sucesos elementales. Cualquier

subconjunto de δ será denominado suceso aleatorio, y se denotará

normalmente con las letras A, B,...

Obsérvese que los sucesos elementales son sucesos aleatorios compuestos por

un sólo elemento. Por supuesto los sucesos aleatorios son más generales que

los elementales, ya que son conjuntos que pueden contener no a uno sólo, sino

a una infinidad de sucesos elementales y también no contener ninguno.

Page 35: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 30

E-mail: [email protected]

Ejemplo 20: Si se lanza un dado, el espacio muestral será δ = {1,2,3,4,5,6}.

Son sucesos aleatorios A = {1,2}, B = {1,3}, C = {1,4}, D = {x/x es un número

par menor que 7}, …

Suceso Seguro: es el mismo δ

Suceso imposible: es aquel que nunca se verifica como resultado del

experimento aleatorio. Se representa con .

Ejemplo 21: Si se lanza una moneda 2 veces, se puede determinar:

El espacio muestral, δ = {CC,CS,SC,SS}

Los siguientes sucesos aleatorios:

A el suceso “por lo menos se obtenga una cara”. A = {CS,SC,SS}

B el suceso “el segundo lanzamiento sea un sello”. B = {CS,SS}

Nota a tener en cuenta: A los sucesos se les puede aplicar operaciones con

conjuntos.

3.1.5. Probabilidad, axiomas y teoremas

En cualquier experimento aleatorio siempre hay incertidumbre sobre si un

suceso específico ocurrirá o no. Como medida de la oportunidad o probabilidad

con la que podemos esperar que un suceso ocurra es conveniente asignar un

número entre 0 y 1. Si estamos seguros de que el suceso ocurrirá decimos que

su probabilidad es 100% ó 1, pero si estamos seguros de que el suceso no

ocurrirá decimos que su probabilidad es cero.

Existen dos procedimientos importantes por medio de los cuales podemos

obtener estimativos para la probabilidad de un suceso, a saber:

a. Enfoque clásico o a priori

Si un suceso A puede ocurrir en h maneras diferentes de un número total

de n maneras posibles, todos igualmente factibles, entonces la probabilidad

del suceso es:

Ejemplo 22: Supóngase que deseamos la probabilidad de que resulte una

cara en un solo lanzamiento de una moneda. Puesto que hay dos maneras

igualmente factibles del resultado de la moneda (n=2), simplemente "cara"

y “sello” (suponiendo que la moneda no se pierda ni caiga verticalmente),

y de estas dos maneras una cara puede aparecer en una sola manera (h=1),

entonces la probabilidad requerida es:

Page 36: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 31

E-mail: [email protected]

La probabilidad de que resulte una cara en un lanzamiento es de 50%.

b. Enfoque como frecuencia relativa o a posteriori

Si después de n repeticiones de un experimento, donde n es muy grande,

un suceso ocurre h veces, entonces la probabilidad del suceso es h/n. Esto

también se llama la probabilidad empírica del suceso.

Ejemplo 23: Si lanzamos una moneda 1000 veces y hallamos que 532

veces resultan caras estimamos que la probabilidad de una cara es:

c. Axiomas de la Probabilidad

P(A) ≥ 0

P(δ) = 1

P(AB) = P(A) + P(B), si A y B son mutuamente excluyentes.

d. Teoremas importantes sobre Probabilidad

- Si A1 A2. P(A1) P(A2) y P(A2 – A1) = P(A2) - P(A1)

- Para cada suceso 0 P(A) 1

- P() = 0

- P(A’) = 1 - P(A)

- Si A y B son sucesos cualesquiera, entonces P(AB) = P(A) + P(B) –

P(AB)

3.1.6. Probabilidad Condicional

Sean A y B dos sucesos tales que P(A)> 0. Denotamos por P(B|A) la

probabilidad de B dado que A ha ocurrido. Puesto que se sabe que A ha

ocurrido, se convierte en el nuevo espacio muestral remplazando el original δ.

De aquí llegamos a la definición

|

Ejemplo 24: Hallar la probabilidad de que en un sólo lanzamiento de un dado

resulte un número menor que 4, (a) no se da ninguna otra información, (b) se

da que el lanzamiento resultó en un número impar,

Page 37: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 32

E-mail: [email protected]

(a) Si B es el suceso {menor que 4}, entonces

(b) Si A es el suceso {número impar} observamos que P(A)=3/6=1/2.

También P(AB)=2/6:1/3. Entonces

|

|

3.1.7. Sucesos Independientes

Si P(B|A) = P(B), es decir la probabilidad de que B ocurra no está afectada por

la ocurrencia o no ocurrencia de A, entonces decimos que A y B son sucesos

independientes. Esto es equivalente a:

P(AB) = P(A).P(B)

3.1.8. Teorema de Bayes

Supóngase que A1, A2,..., An son sucesos mutuamente excluyentes cuya unión

es el espacio muestral δ, es decir uno de los sucesos debe ocurrir. Entonces si A

es cualquier suceso tenemos el siguiente teorema importante:

| |

∑ |

3.1.9. Análisis Combinatorio

En muchos casos el número de puntos muestrales en un espacio muestral no es

muy grande y así la enumeración o cuenta directa de los puntos del muestreo

necesarios para obtener las probabilidades no es difícil. Sin embargo, surgen

problemas cuando la cuenta directa se convierte en una imposibilidad práctica.

En tales casos se emplea el análisis combinatorio, que podría llamarse una

forma sofisticada de contar.

a. Principio fundamental de cuenta

Si una cosa puede realizarse en n1 maneras diferentes y después de esto

una segunda cosa puede realizarse en n2 maneras diferentes,…, y

finalmente una k-ésima cosa puede realizarse en nk maneras diferentes,

entonces todas las k cosas pueden realizarse en el orden especificado en n1

n2 … nk maneras diferentes.

Page 38: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 33

E-mail: [email protected]

Ejemplo 25: Si un hombre tiene 2 camisas y 4 corbatas entonces tiene

2*4=8 maneras de escoger una camisa y luego una corbata.

b. Permutaciones

Supóngase que se dan n objetos diferentes y deseamos ordenar r de estos

objetos en una línea puesto que hay n maneras de escoger el primer objeto,

y luego de hacer esto n - 1 maneras de escoger el segundo objeto, … , y

finalmente n - r + 1 formas de escoger el r-ésimo objeto, se deduce por el

principio fundamental de cuenta que el número de ordenaciones, o

permutaciones diferentes como generalmente se les llama está dado por:

nPr = n(n - l)(n - 2). . . (n - r + l)

Ésta fórmula también puede ser expresada en términos de factoriales, a

saber:

Ejemplo 26: El número de ordenaciones o permutaciones diferentes que

consisten de 3 letras cada una y que pueden formarse de las 7 letras A, B,

C, D, E, F, G es

Supóngase ahora que un conjunto que consiste de n objetos de los cuales

n1 son de un tipo (es decir no pueden distinguirse entre sí), n2 son de un

segundo tipo,…, nk son del k-ésimo tipo. Lógicamente n = n1 + n2 +… + nk

Así el número de permutaciones diferentes de los objetos es:

nPn1, n2, … , nk

c. Combinaciones

En una permutación estamos interesados en el orden de la distribución de

los objetos. Así abc es una permutación diferente a cba. Sin embargo, en

muchos problemas estamos interesados solamente en seleccionar o escoger

los objetos sin interesar su orden. Dichas selecciones se llaman

combinaciones. Así abc y cba son la misma combinación.

Page 39: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 34

E-mail: [email protected]

El número total de combinaciones de r objetos seleccionados de n, se

denota por:

(

)

Ejemplo 27: El número de maneras en las cuales 3 cartas pueden

escogerse de un total de 8 cartas diferentes es

(

)

(

)

(

)

3.2. Variables Aleatorias y distribuciones de probabilidad

3.2.1. Variable aleatoria

Supóngase que a cada punto de un espacio muestral asignamos un número. Así

definimos una función en el espacio muestral. Esta función se llama variable

aleatoria (o variable estocástica) o más precisamente función aleatoria (función

estocástica). Comúnmente se denota por una letra mayúscula como X o Y. En

general una variable aleatoria tiene algún significado físico, geométrico u otro.

Ejemplo 28: Supóngase que se lanza una moneda dos veces de tal forma que el

espacio muestral es δ = {CC,CS,SC,SS}. Represéntese por X el número de

caras que pueden resultar. Con cada punto muestral podemos asociar un

número para X como se muestra en la Tabla 04. Así en el caso de CC (es decir

2 caras) X = 2 en tanto que para SC (1 cara) X = 1. Se concluye que X es una

variable aleatoria.

Punto Muestral CC CS SC SS

X 2 1 1 0 Tabla 04: Asociación de suceso X con puntos muestrales

Debe observare que también podrían definirse otras muchas variables

aleatorias en este espacio muestral, por ejemplo el cuadrado del número de

caras, el número de caras menos el número de sellos, etc.

Una variable aleatoria que tiene un número finito de valores se denomina

variable aleatoria discreta, mientras que si una variable aleatoria tiene un

número infinito no contable de valores se denomina variable aleatoria continua.

Page 40: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 35

E-mail: [email protected]

3.2.2. Distribución de Probabilidad discreta

Es conveniente introducir la función de probabilidad, también conocida como

la distribución de probabilidad, definida por

P(X = x) =

En general es una función de probabilidad si

- ≥ 0

- ∑

Ejemplo 29: Hallar la función de probabilidad correspondiente a la variable X

del ejemplo 28. Supóngase que la moneda es honrada. Entonces tenemos:

Luego: Recordar que X es la variable aleatoria que representa el número de

caras, así:

Así, la función de probabilidad está dada en la Tabla 05

x 0 1 2

f(x) Tabla 05

3.2.3. Función de Distribución discreta

La función de distribución acumulada, o simplemente la función de

distribución, para una variable aleatoria X se define por

P(X x) = F(x)

Si X únicamente toma un número finito de valores x1, x2, … , xn entonces la

función de distribución está dada por

{

Page 41: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 36

E-mail: [email protected]

Ejemplo 30: Hallar la función de Probabilidad para la variable aleatoria X del

ejemplo 29.

Así, con los datos de la Tabla 05 la función de probabilidad es:

{

{

3.2.4. Distribución de Probabilidad continua

Se define mediante la existencia de una función f(x) tal que:

- ≥ 0

- ∫

Entonces definimos la probabilidad de que X se encuentre entre a y b como:

Una función f(x) que satisface los requisitos anteriores se llama función de

probabilidad o distribución de probabilidad para una variable aleatoria

continua, pero con mayor frecuencia se denomina función de densidad de

probabilidad o simplemente función de densidad.

Ejemplo 31: Sea la función de densidad f(x) =

, 0 x 3. Determinar

P(1X2)

|

Page 42: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 37

E-mail: [email protected]

3.2.5. Función de Distribución continua

Definimos la función de distribución F(x) para una variable aleatoria continua

por:

F(x) = P(X x) = P( ) ∫

Ejemplo 32: Halla la función de distribución para la variable aleatoria

continua X del ejemplo 31

Tenemos:

F(x) = P(X x) = ∫

Si x < 0, entonces F(x)=0

Si 0 x 3, entonces

∫ ∫

Si x ≥ 3, entonces

∫ ∫

(

)

Por lo tanto la función de distribución será:

{

3.3. Varianza y desviación típica de variables aleatorias

3.3.1. Varianza y desviación típica de una VA discreta

Si X es una variable aleatoria discreta con función de probabilidad f(x),

entonces la varianza es

Y la desviación típica es:

3.3.2. Varianza y desviación típica de una VA continua

Si X es una variable aleatoria continua con función de probabilidad f(x),

entonces la varianza es

Page 43: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 38

E-mail: [email protected]

3.4. Distribuciones de Probabilidad con nombre Propio

3.4.1. Distribución Binomial o de Bernoulli

Supóngase que tenemos un experimento como lanzar una moneda o un dado

repetidamente, extraer una bola de una urna repetidamente, etc. Cada

lanzamiento o escogencia se llama una prueba. Con cada prueba hay una

probabilidad asociada con un suceso particular como la cara en la moneda, el 4

en el dado o la selección de una bola roja. En algunos casos la probabilidad no

cambia de una prueba a la siguiente (como en el lanzamiento de la moneda o

del dado). A estas pruebas se les llama independientes y se conocen como las

pruebas de Bernoulli en memoria de James Bernoulli quien las investigó a

finales del siglo XVII.

Sea p la probabilidad de que un suceso ocurra en una sola prueba de Bernoulli

(llamada la probabilidad de éxito). Entonces q = 1 – p es la probabilidad de que

el suceso no ocurra en una sola prueba (llamada la probabilidad de fracaso). La

probabilidad de que el suceso ocurra x veces en n pruebas (es decir que ocurran

x éxitos y n – x fracasos) está dada por la función de probabilidad

donde la variable aleatoria discreta X denota el número de éxitos en n pruebas.

Ejemplo 33: La probabilidad de obtener exactamente 2 caras en 6

lanzamientos de una moneda es

(

)

(

)

A tener en cuenta: Propiedades de la distribución binomial:

3.4.2. Distribución Normal

Uno de los más importantes ejemplos de una distribución de probabilidad

continua es la distribución normal, algunas veces denominada la distribución

gaussiana. La función de densidad para la distribución está dada por

Page 44: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 39

E-mail: [email protected]

donde y son la media y la desviación típica respectivamente. La función de

distribución correspondiente está dada por

√ ∫

Los valores de la distribución normal pueden ser encontrados en el Apéndice

A.

3.4.3. Distribución de Poisson

Sea X una variable aleatoria discreta que puede tomar los valores 0, 1, 2, . . . tal

que la función de probabilidad de X esté dada por

Donde es una constante positiva dada. Los valores de f(x) pueden obtenerse

empleando el Apéndice B.

A tener en cuenta: Propiedades de la distribución binomial:

3.4.4. Distribución Hipergeométrica

Sea X una variable aleatoria discreta, su función de probabilidad es:

(

)(

)

( )

3.4.5. Distribución Chi-Cuadrado

Sean X1, X2, … , Xv, v variables aleatorias independientes distribuidas

normalmente con media cero y varianza 1. Considérese la variable aleatoria

Donde se llama chi-cuadrado. Se define la distribución chi-cuadrado con v

grados de libertad como

∫ (

)

3.4.6. Distribución t de Student

Los valores de la distribución t pueden obtenerse empleando el Apéndice C.

Page 45: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 40

E-mail: [email protected]

Ejercicios del Capítulo III

i. Sea A el conjunto de todos los números reales cuyos cuadrados son iguales a 25.

Indique cómo describir en A por (a) el método de comprensión y (b) el método de

extensión.

ii. Determinar cuáles de las proposiciones siguientes son verdaderas y corregir las que

son falsas.

{x/x x} = {}

Si A = {x/x

2 = 4, x>9} y B = {

x/x l}, entonces A B.

iii. Se extrae una carta aleatoriamente de una baraja de 52 cartas. Describir el espacio

muestral si (a) no se tiene en consideración el palo (b) si se tiene en cuenta el palo.

iv. Refiriéndose al experimento del Problema iii sea, A el suceso {se extrae un rey} o

sencillamente {rey} y B el suceso {se extrae un trébol} o sencillamente {trébol}.

Describir los sucesos (a) A B, (b) A B, (c) A B', (d) A’ B’, (e) A - B, (f) A’ –

B’, (g) (AB) (AB’).

v. Una carta se extrae aleatoriamente de una baraja de 52 cartas. Encontrar la

probabilidad de que sea (a) un as, (b) una jota de corazones, (c) un tres de tréboles o

un seis de diamantes, (d) un corazón, (e) cualquier palo excepto corazones, (f) un diez

o una pica (g) ni un cuatro ni un trébol.

vi. Una bola se extrae aleatoriamente de una caja que contiene 6 bolas rojas, 4 bolas

blancas y 5 bolas azules. Determinar la probabilidad de que sea (a) roja, (b) blanca, (c)

azul, (d) no roja, (e) roja o blanca.

vii. Encontrar la probabilidad de no obtener un total de 7 u 11 en ninguno de los dos

lanzamientos de un par de dados honrados.

viii. Se va a conformar un comité de 3 miembros compuesto por un representante de los

trabajadores, uno de la administración y uno del gobierno. Si hay 3 candidatos de los

trabajadores, 2 de la administración y 4 del gobierno, determinar cuántos comités

diferentes pueden conformarse, empleando el principio fundamental de cuenta.

ix. ¿De cuántas maneras pueden 10 personas sentarse en una banca si sólo hay 4 puestos

disponibles?

x. Se quieren sentar 5 hombres y 4 mujeres en una fila de modo que las mujeres ocupen

los sitios pares. ¿De cuántas formas pueden sentarse?

xi. Se ordenan en una fila 5 bolas rojas, 2 bolas blancas y 3 bolas azules: Si las bolas de

igual color no se distinguen entre sí ¿de cuántas formas posibles pueden ordenarse?

Page 46: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 41

E-mail: [email protected]

xii. De un total de 5 matemáticos y 7 físicos, se forma un comité de 2 matemáticos y 3

físicos. ¿De cuántas formas puede formarse, si (a) puede pertenecer a él cualquier

matemático y físico, (b) un físico determinado debe pertenecer al comité, (c) dos

matemáticos determinados no pueden estar en el comité?

xiii. ¿Cuántos números artísticos se pueden preparar con 5 alumnos (Juan, Jorge, Luis,

Miguel y Lidia) de mi sección?

xiv. Organizo un torneo de ajedrez en el aula. Daniel y María juegan 12 partidas de ajedrez

de las cuales Daniel gana 6, María gana 4 y 2 terminan en tablas. María pide la

revancha y acuerdan jugar un torneo consistente en 3 partidas. Hallar la probabilidad

de que (a) Daniel gane las tres partidas, (b) dos partidas terminen en tablas, (c) Daniel

y María ganen alternativamente, (d) María gane al menos una partida.

xv. Si el 20 % de los alumnos egresados de una institución educativa emigran al

extranjero, determinar la probabilidad de que de 4 alumnos escogidos aleatoriamente

(a) 1, (b) 0, (c) menos de 2, emigren.

xvi. El peso medio de 500 estudiantes varones de una universidad es de 68.5 kg y la

desviación tipificada es de 10 kg. Suponiendo que los pesos están distribuidos

normalmente, hallar el número de estudiantes que pesan (a) entre 48 y 71 kg, (b) más.

de 91 kg.

xvii. Si la probabilidad de que un alumno sufra un desmayo debido a la manifestación de un

movimiento telúrico, es 0.001, determinar la probabilidad de que de un total de 2000

alumnos (a) exactamente 3, (b) más de 2 individuos sufran desmayo durante un sismo.

xviii. Luego de un incidente de mal comportamiento en una institución educativa se han

detenido en un aula a 10 alumnos involucrados, de los cuales 6 si participaron del

incidente y 4 de ellos no. Se realiza un experimento en el cual se selecciona un alumno

del aula aleatoriamente y se determina su responsabilidad. Hallar la probabilidad de

que después de 5 pruebas del experimento se hallan escogido 3 alumnos responsables

del mal comportamiento.

xix. Hallar para (a) v = 60 y (b) v = 100 grados de libertad.

Page 47: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 42

E-mail: [email protected]

Capítulo IV: Estadísticos para la prueba de Hipótesis

4.1. Ensayos de Hipótesis y significación

4.1.1. Decisiones Estadísticas

Muy a menudo, en la práctica se tienen que tomar decisiones sobre

poblaciones, partiendo de la información muestral de las mismas. Tales

decisiones se llaman decisiones estadísticas Por ejemplo, se puede querer

decidir a partir de los datos del muestreo, si un suero nuevo es realmente

efectivo para la cura de una enfermedad, si un sistema educacional es mejor

que otro, si una moneda determinada está o no cargada, etc.

4.1.2. Hipótesis estadísticas. Hipótesis nula

Para llegar a tomar decisiones, conviene hacer determinados supuestos o

conjeturas acerca de las poblaciones que se estudian. Tales supuestos que

pueden ser o no ciertos se llaman hipótesis estadísticas y, en general, lo son

sobre las distribuciones de probabilidad de las poblaciones.

En muchos casos se formulan las hipótesis estadísticas con el solo propósito de

rechazarlas o invalidarlas. Por ejemplo, si se quiere decidir si una moneda está

cargada, se formula la hipótesis de que la moneda está bien, es decir, p : 0.5;

donde p es la probabilidad de cara. Análogamente, si se quiere decidir sobre si

un procedimiento es mejor que otro, se formula la hipótesis de que no hay

diferencia entre los procedimientos (es decir, cualquier diferencia observada se

debe meramente a fluctuaciones en el muestreo de la misma población). Tales

hipótesis se llaman también hipótesis nulas y se denotan por H0.

Cualquier hipótesis que difiera de una hipótesis dada se llama hipótesis

alternativa. Por ejemplo, si una hipótesis es p=0.5, hipótesis alternativas son

p=0.7; p=0.56; p>0.5. Una hipótesis alternativa de la hipótesis nula se denota

por H1.

Si en el supuesto de que una hipótesis determinada es cierta, se encuentra que

los resultados observados en una muestra aleatoria difieren marcadamente de

aquellos que cabía esperar con la hipótesis y con la variación propia del

muestreo, se diría que las diferencias observadas son significativas y se estaría

en condiciones de rechazar la hipótesis (o al menos no aceptarla de acuerdo

con la evidencia obtenida). Por ejemplo, si en 20 lanzamientos de una moneda

se obtienen 16 caras, se estaría inclinado a rechazar la hipótesis de que la

moneda está bien, aunque sería posible que fuese un rechazamiento erróneo.

Los procedimientos que facilitan el decidir si una hipótesis se acepta o se

rechaza o el determinar si las muestras observadas difieren significativamente

de los resultados esperados se llaman ensayos de hipótesis, ensayos de

significación o reglas de decisión.

Page 48: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 43

E-mail: [email protected]

4.1.3. Errores de Tipo I y Tipo II

Si se rechaza una hipótesis cuando debería ser aceptada, se dice que se comete

un error del Tipo I. Si por el contrario, se acepta una hipótesis que debería ser

rechazada, se dice que se comete un error del Tipo II. En cualquiera de los dos

casos se comete un error al tomar una decisión equivocada.

Para que cualquier ensayo de hipótesis o reglas de decisión sea bueno, debe

diseñarse de forma que minimice los errores de decisión. Esto no es tan

sencillo como pueda parecer puesto que para un tamaño de muestra dado, un

intento de disminuir un tipo de error, va generalmente acompañado por un

incremento en el otro tipo de error.

En la práctica, un tipo de error puede tener más importancia que el otro, y así

se tiende a conseguir poner una limitación al error de mayor importancia. La

única forma de reducir al tiempo ambos tipos de error es incrementar el tamaño

de la muestra, lo cual puede ser o no ser posible.

4.1.4. Nivel de significación

La probabilidad máxima con la que en el ensayo de una hipótesis se puede

cometer un error del Tipo I se llama nivel de significación del ensayo. Esta

probabilidad se denota frecuentemente por α; generalmente se fija antes de la

extracción de las muestras, de modo que los resultados obtenidos no influyen

en la elección.

En la práctica se acostumbra a utilizar niveles de significación del 0.05 ó 0.01,

aunque igualmente pueden emplearse otros valores.

Si, por ejemplo se elige un nivel de significación del 0.05 ó 5%, al diseñar un

ensayo de hipótesis, entonces hay aproximadamente 5 ocasiones en 100 en que

se rechazaría la hipótesis cuando debería ser aceptada, es decir, se está con un

95% de confianza de que se toma la decisión adecuada. En tal caso se dice que

la hipótesis ha sido rechazada al nivel de significación del 0.05, lo que significa

que se puede cometer error con una probabilidad de 0.05.

4.1.5. Ensayos referentes a Distribuciones Normales

Para aclarar las ideas anteriores, supóngase que con una hipótesis dada, la

distribución muestral de un estadístico S es una distribución normal con media

y desviación típica . Entonces la distribución de la variable tipificada dada

por

es una normal tipificada (media 0, varianza 1) y se muestra en la Imagen 09.

Page 49: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 44

E-mail: [email protected]

Imagen 09

Como se indica en la figura, se puede estar con el 95% de confianza de que, si

la hipótesis es cierta, el valor de z obtenido de una muestra real para el

estadístico S se encontrará entre - 1.96 y 1.96 (puesto que el área bajo la curva

normal entre estos valores es 0.95).

Sin embargo, si al elegir una muestra aleatoria se encuentra que z para ese

estadístico se halla fuera del recorrido - 1.96 a 1.96, lo que quiere decir que es

un suceso con probabilidad de solamente 0.05 (área sombreada de la figura) si

la hipótesis fuese verdadera. Entonces puede decirse que esta z difiere

significativamente de la que cabía esperar bajo esta hipótesis y se estaría

inclinado a rechazar la hipótesis.

El área total sombreada 0.05 es el nivel de significación del ensayo. Representa

la probabilidad de cometer error al rechazar la hipótesis es decir, la

probabilidad de cometer error del Tipo I. Así pues, se dice que la hipótesis se

rechaza al nivel de significación del 0.05 o que la z obtenida del estadístico

muestral dado es significativa al nivel de significación del 0.05.

El conjunto de las z que se encuentran fuera del rango -1.96 a 1.96 constituyen

lo que se llama región crítica o región de rechazo de la hipótesis o región de

significación. El conjunto de las z que se encuentran dentro del recorrido - 1.96

a 1.96 puede entonces llamarse región de aceptación de la hipótesis o región de

no significación.

De acuerdo con lo dicho hasta ahora, se puede formular la siguiente regla de

decisión o ensayo de hipótesis o significación:

o Se rechaza la hipótesis al nivel de significación del 0.05 si la z obtenida

para el estadístico S se encuentra fuera del recorrido - 1.96 a 1.96 (es decir,

z > 1.96 ó z - 1.96). Esto equivale a decir que el estadístico muestral

observado es significativo al nivel del 0.05.

o Se acepta la hipótesis (o si se desea no se toma decisión alguna) en caso

contrario.

Debe ponerse de manifiesto que pueden igualmente emplearse otros niveles de

significación.

Page 50: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 45

E-mail: [email protected]

Ejemplo 34: Para ensayar la hipótesis de que una moneda está bien hecha, se

toma la siguiente regla de decisión:

o Se acepta la hipótesis si el número de caras en una serie de 100

lanzamientos se encuentra entre 40 y 60, ambos inclusive;

o De otro modo, se rechaza.

(a) Determinar la probabilidad de aceptar la hipótesis y la probabilidad de

rechazar la hipótesis, siendo ésta cierta.

La probabilidad de obtener entre 40 y 60 caras inclusive en 100 lanzamientos

de una moneda, según la distribución binomial, es:

La media y la desviación típica está dado por:

(

)

√ (

) (

)

En una escala discreta, entre 40 y 60 caras inclusive es lo mismo que entre 39.5

y 60.5 caras.

Entonces la probabilidad pedida es = área bajo la curva normal entre z=-2.10 y

z=2.10 = 2(área entre z=0 y z=2.10), dato que es extraído del Apéndice A. Así:

Probabilidad pedida = 2(0.4821) = 0.9642

Entonces la probabilidad de aceptar la hipótesis es de 96.42%, mientras que la

probabilidad de rechazar la hipótesis será:

1-0.9642 = 0.0358 = 3.58%

4.1.6. Ensayos de una y dos colas

En el ensayo anterior se atendía a los valores extremos del estadístico S o su

correspondiente z a ambos lados de la media, es decir, en las dos "colas" de la

distribución. Por esta raz6n, tales ensayos se llaman ensayos de dos colas o

ensayos bilaterales.

Page 51: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 46

E-mail: [email protected]

Sin embargo, con frecuencia se puede estar solamente interesado en los valores

extremos a un solo lado de la media, es decir, en una "cola" de la distribución,

como por ejemplo, cuando se está ensayando la hipótesis de que un proceso es

mejor que otro (que es diferente a ensayar si un proceso es mejor o peor que

otro). Tales ensayos se llaman ensayos de una cola o ensayos unilaterales. En

tales casos, la región crítica es una región a un lado de la distribución, con área

igual al nivel de significación.

La Tabla 06, que da los valores críticos de z para ensayos de una y dos colas a

distintos niveles de significación, será de utilidad para propósitos de referencia.

Valores críticos de z para otros niveles de significación, se pueden encontrar

utilizando la tabla que da las áreas bajo la curva normal.

Nivel de significación α 0.10 0.05 0.01 0.005 0.002

Valores críticos de z para

ensayos unilaterales

-1.28 ó

1.28

-1.645 ó

1.645

-2.33 ó

2.33

-2.58 ó

2.58

-2.88 ó

2.88

Valores críticos de z para

ensayos bilaterales

-1.645 y

1.645

-1.96 y

1.96

-2.58 y

2.58

-2.81 y

2.81

-3.08 y

3.08

Tabla 06

4.1.7. Ensayos relacionados con diferencias de medias y proporciones

La variable tipificada en base a la media muestral ( ), la media poblacional

u y la desviación típica de una muestra de tamaño n está dada por:

Asimismo, Para ensayar la hipótesis Ho de que una población normal tiene de

media u utilizamos (en muestras pequeñas, n <30)

La distribución de T sigue una distribución t de Student.

En la diferencia de medias y proporciones muestrales de 2 muestras

grandes de tamaño n1 y n2 extraídas de poblaciones respectivas que tienen de

media y y desviaciones típicas y se puede establecer:

Page 52: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 47

E-mail: [email protected]

Con la variable tipificada dada por

Asimismo

√ (

)

Haciendo:

Con la variable tipificada dada por

Varianzas. Para ensayar la hipótesis H0 de que una población normal tiene

varianza consideramos la variable aleatoria

Que tiene la distribución chi-cuadrado con n-1 grados de libertad.

Ejemplo 35: Se hizo un examen a dos clases formadas por 40 y 50 estudiantes

respectivamente. En la primera clase la puntuación media fue de 74 con una

desviación típica de 8, mientras que en la segunda clase la puntuación media

fue de 78 con una desviación típica de 7. ¿Hay una diferencia significativa

entre el resultado de las dos clases al nivel de significación de 0.05?

Supóngase que las dos clases provienen de dos poblaciones que tienen de

medias respectivas y . Entonces, se tiene que decidir entre las hipótesis:

o H0 : = , y la diferencia se debe simplemente al azar.

o H1 : , hay una diferencia significativa entre las dos clases.

Bajo la hipótesis H0, ambas clases provienen de la misma población. La media

y la desviación típica de la diferencia de medias están dadas por:

Page 53: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 48

E-mail: [email protected]

Entonces:

Por ser un ensayo bilateral, los resultados son significativos al nivel de 0.05 si

Z se encuentra entre -1.96 y 1.96. De aquí se deduce que al nivel de 0.05 hay

una diferencia significativa entre las dos clases y la segunda es probablemente

mejor.

4.1.8. Ensayos relacionados con la Distribución t de Student

Ejemplo 36: En el pasado una máquina ha producido arandelas con un grosor

de 0.050 pulgadas. Para determinar si la máquina sigue en buenas condiciones

de producción, se toma una muestra de 10 arandelas, que resulta tener un

grosor medio de 0.053 pulgadas y una desviación típica de 0.003 pulgadas.

Ensayar la hipótesis de que la máquina está en buenas condiciones de

producción al nivel de significación del 0.05

Se desea decidir entre las hipótesis:

o Ho: u = 0.050, y la máquina se encuentra en buenas condiciones.

o H1: u 0.050, y la máquina no se encuentra en buenas condiciones.

De modo que se requiere un ensayo bilateral.

Bajo la hipótesis H0 se tiene

Para un ensayo bilateral al nivel de significación del 0.05 se adopta la regla de

decisión:

- Se acepta H0 si t se encuentra en el intervalo –t975 a t975 lo cual para 10-

1=9 grados de libertad es el intervalo -2.26 a 2.26. (Usando Apéndice

C)

- Se rechaza H0 en caso contrario.

Puesto que T=3, se rechaza H0 al nivel de 0.05 de significancia.

4.1.9. Ensayos relacionados con la Distribución chi-Cuadrado

Ejemplo 37: En el pasado la desviación típica de los pesos de ciertos paquetes

de 40.0 onzas, llenados por una máquina era de 0.25 onzas. Una muestra

aleatoria de 20 paquetes dio una desviación típica de 0.32 onzas. ¿Es el

aparente incremento de variabilidad significativa al nivel de significación del

0.05?

Page 54: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 49

E-mail: [email protected]

Hay que decidir entre las dos hipótesis:

o H0: = 0.25 onzas, y los resultados observados se deben al azar.

o H1: > 0.25 onzas, y la variabilidad se ha incrementado.

El valor de X2 para la muestra es:

Mediante un ensayo unilateral, se rechaza H0 al nivel de significación del 0.05

si el valor de X2 muestral fuese mayor que

.

Utilizando el Apéndice D determinamos para v = 20 -1 = 19 grados de

libertad que es igual a 30.1. Por lo tanto, se rechaza H0 al nivel de significación

del 0.05.

4.2. Curva de ajuste, regresión y correlación

4.2.1. Curva de Ajuste

Muy a menudo en la práctica se encuentra que existe una relación entre dos (o

más) variables, y se desea expresar esta relación en forma matemática

determinando una ecuación que conecte las variables. Un primer paso es la

colección de datos indicando los valores correspondientes de las variables. Por

ejemplo, si x y y denotan la estatura y peso de un adulto; entonces una muestra

de n individuos resultaría en las estaturas x1, x2,.. .,xn y los pesos

correspondientes y1, y2, ... , yn. El paso siguiente es dibujar los puntos (x1,

y1), (x2, y2), …, (xn, yn) en un sistema de coordenadas rectangulares. El

conjunto resultante de puntos se llama a veces diagrama de dispersión.

Del diagrama de dispersión es posible frecuentemente visualizar una curva que

se aproxime a los datos. Dicha curva se llama curva de aproximación. En la

Imagen 10 por ejemplo se observa que los datos se aproximan bien por una

recta y decimos que existe una relación lineal entre las variables.

Sin embargo, en la Imagen 11 aunque existe una relación entre las variables

ésta no es una relación lineal y por esto la llamamos relación no lineal. En la

Imagen 12 parece que no hay ninguna relación entre las variables.

Imagen 10 Imagen 11 Imagen 12

Page 55: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 50

E-mail: [email protected]

El problema general de hallar ecuaciones de curvas de aproximación que se

ajusten a conjuntos de datos dados se denomina curva de ajuste. En la práctica

el tipo de ecuación se sugiere frecuentemente del diagrama de dispersión. Así

para la Imagen 10 podríamos utilizar una recta

Mientras que para la Imagen 11 ensayaríamos una curva cuadrática o

parabólica

Uno de los propósitos principales de la curva de ajuste es estimar una de las

variables (Variable dependiente) de la otra (la variable independiente). El

proceso de estimación se conoce como regresión. Si y se va a estimar a partir

de x por medio de alguna ecuación la llamamos ecuación de regresión de y

sobre x y a la curva correspondiente curva de regresión de y sobre x.

4.2.2. Método de mínimos cuadrados

Definición. De todas las curvas de aproximación de un conjunto de puntos de

datos dados, la curva que tenga la propiedad de que

es la mejor curva de ajuste.

Una curva con esta propiedad se dice que ajusta los datos en el sentido de

mínimos cuadrados y se llama curva de regresión de mínimos cuadrados o

simplemente curva de mínimos cuadrados. Por lo tanto una recta con esta

propiedad se llama recta de mínimos cuadrados, una parábola con esta

propiedad se llama parábola de mínimos cuadrados, etc.

Empleando la definición anterior podemos demostrar que la recta de mínimos

cuadrados de aproximación al conjunto de datos (x1, y1), ..., (xn, yn) tiene la

ecuación

donde las constantes a y b están dadas por

∑ ∑ ∑ ∑

∑ ∑

∑ ∑ ∑

∑ ∑

Page 56: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 51

E-mail: [email protected]

4.2.3. Recta de Mínimos cuadrados en términos de varianzas y covarianzas

muestrales

Las varianzas y covarianzas muestrales de x, y están dadas por

En términos de éstas, las rectas de regresión de mínimos cuadrados de y sobre x

y de x sobre y pueden escribirse respectivamente como

4.2.4. Error típico de la estima

√∑

Ejemplo 38: Ajustar una recta de mínimos cuadrados a los datos de la Tabla 07

x 1 3 4 6 8 9 11 14

y 1 2 4 4 5 7 8 9 Tabla 07

Se grafican los puntos y se puede observar que la tendencia de los puntos es lineal,

como se puede apreciar en la Imagen 13

Imagen 13: Gráfica de los puntos

0

1

2

3

4

5

6

7

8

9

10

0 2 4 6 8 10 12 14 16

Page 57: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 52

E-mail: [email protected]

La ecuación de la recta estará dada por

Se reordenan los datos en la siguiente Tabla 08, los mismos que servirán para calcular

los valores de a y b.

x y xy

1 1 1 1 1

3 2 9 6 4

4 4 16 16 16

6 4 36 24 16

8 5 64 40 25

9 7 81 63 49

11 8 121 88 64

14 9 196 126 81

∑ 56 40 524 364 256 Tabla 08

Así

∑ ∑ ∑ ∑

∑ ∑

∑ ∑ ∑

∑ ∑

Por lo tanto la recta de mínimos cuadrados será:

Page 58: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 53

E-mail: [email protected]

Ejercicios del Capítulo IV

i. En un experimento sobre percepción extrasensorial (E.S.P.) un individuo (sujeto) en

una habitación fue preguntado sobre el color (rojo o azul) en una carta elegida por otro

individuo en otra habitación de un conjunto de 50 cartas bien barajadas. Es

desconocido para el sujeto cuántas cartas rojas o azules hay en el lote. Si el sujeto

identifica correctamente 32 cartas. Determinar si los resultados son significativos al

nivel de significación de (a) 0.05 y (b) 0.01.

ii. Una muestra de 300 votantes del distrito A y 200 del distrito B mostró que el 66% y el

48% respectivamente, estaban a favor de un candidato dado. Al nivel de significación

del 0.05 ensayir la hipótesis de que (a) haya diferencia entre los distritos, (b) el

candidato sea preferido en el distrito A.

iii. La estatura media de 50 estudiantes de un colegio que tomaban parte en las pruebas

atléticas fue de 68.2 pulgadas con desviación típica de 2.5 pulgadas, mientras que 50

estudiantes que no mostraban interés en tal participación tenían una estatura media de

67.5 pulgadas con desviación típica de 2.8 pulgadas. Ensayar la hipótesis de que los

estudiantes que participan en las pruebas atléticas son más altos que los otros.

iv. Un ensayo sobre resistencia a la rotura de 6 cuerdas fabricadas por una compañía

mostró una resistencia media de 7750 lb y una desviación típica de 145 lb mientras

que el fabricante sostenía que la resistencia media de sus cuerdas era de 8000Ib. ¿Se

puede admitir la afirmación del fabricante al nivel de significación del (a) 0.05

v. El I. Q. (cociente de inteligencia) de 16 estudiantes de una zona de una ciudad dio una

media de 107 con una desviación típica de 10, mientras que el I.Q. de 14 estudiantes

de otra zona de la ciudad dio una media de 112 con desviación típica de 8. ¿Hay

diferencia significativa entre el I. Q. de los dos grupos al nivel de significación del (a)

0.01

vi. La Tabla 09 muestra las respectivas estaturas x, y de una muestra de 12 padres y sus

hijos mayores. (a) Construir un diagrama de dispersión. (b) Hallar la recta de regresión

de mínimos cuadrados de y sobre x. (c) Determinar el error típico de la estima

Estatura x del padre 65 63 67 64 68 62 70 66 68 67 69 71

Estatura y del hijo 68 66 68 65 69 66 68 65 71 67 68 70

Page 59: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 54

E-mail: [email protected]

Apéndice A

Page 60: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 55

E-mail: [email protected]

Apéndice B

Page 61: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 56

E-mail: [email protected]

Apéndice C

Page 62: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 57

E-mail: [email protected]

Apéndice D

Page 63: Modulo Estadistica UCT

Estadística y probabilidad aplicada a la Educación

Docente: Ing. Johan Herbert Narro Vargas 58

E-mail: [email protected]

Referencias

Rojo, B. (2010) Elementos Básicos de Estadística Educacional, Centro de Educación a

Distancia - Universidad Católica del Norte.

Córdoba, M. (2003). Estadística descriptiva e inferencial. Lima: Moshera S. R. Ltda.

Lázaro, M. (2000). Inferencia Estadística. Lima: San marcos.

Levin, J. (1978). Fundamentos de Estadística en la investigación social. México: Harla.

Orihuela, P. (2000). Estadística. Lima: San Marcos.

Triola, M. (2000). Estadística Elemental (7ª ed.). México: Addison Wesley Longman.

Welkowtiz, Z. et al. (1981). Estadística aplicada a las ciencias de la educación. Madrid:

Santillana S.A.