Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

39
Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública 1 Licenciatura en Seguridad Pública 5°Cuatrimestre Programa de la asignatura: Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población Clave: 010920518/020920518 Universidad Abierta y a Distancia de México

Transcript of Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Page 1: Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población

Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública

1

Licenciatura en Seguridad Pública

5°Cuatrimestre

Programa de la asignatura:

Estadística para la investigación en

seguridad pública

Unidad 2. Estadística inferencial para una

población

Clave:

010920518/020920518

Universidad Abierta y a Distancia de México

Page 2: Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población

Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública

2

Índice

Unidad 2. Estadística inferencial para una población ........................................................... 3

Presentación de la unidad ................................................................................................... 3

Propósitos ............................................................................................................................ 3

Competencia específica ....................................................................................................... 3

Presentación de la unidad ................................................................................................... 4

2.1. Estimación puntual y por intervalo de la media ............................................................. 5

2.1.1. Estimador puntual y sus propiedades ........................................................................ 6

2.1.2. Distribución muestral de la media, normal y “t de Student” ........................................ 7

2.1.3. Teorema del límite central ........................................................................................ 14

2.1.4. Intervalo de confianza para la media ........................................................................ 14

2.2. Estimación puntual y por intervalo de la proporción .................................................... 17

2.2.1. Estimador puntual y sus propiedades ...................................................................... 18

2.2.2. Distribución muestral de la proporción ..................................................................... 18

2.2.3. Cálculo de un intervalo de confianza para la proporción .......................................... 19

Actividad 1. Estimadores puntuales ................................................................................... 21

Actividad 2. Estimaciones puntuales e intervalos de confianza .......................................... 22

2.3. Prueba de hipótesis .................................................................................................... 22

2.3.1. Conceptos generales de la metodología .................................................................. 23

2.3.2. Prueba de hipótesis de la media .............................................................................. 25

2.3.3 Relación entre una prueba de hipótesis de la media y un intervalo de confianza ...... 31

2.3.4. Prueba de hipótesis de la proporción ....................................................................... 32

2.3.5. Relación entre una prueba de hipótesis de la proporción y un intervalo de confianza34

Actividad 3. Pruebas de hipótesis ...................................................................................... 35

Actividad 4. Problemario .................................................................................................... 36

Autoevaluación .................................................................................................................. 36

Evidencia de aprendizaje. Resolución de ejercicios sobre pruebas de hipótesis e intervalos

de confianza ...................................................................................................................... 37

Actividades de Autorreflexión ............................................................................................. 37

Cierre de la unidad ............................................................................................................ 38

Fuentes de consulta .......................................................................................................... 39

Fuentes cibergráficas ......................................................................................................... 39

Page 3: Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población

Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública

3

Unidad 2. Estadística inferencial para una población

Presentación de la unidad

En la presente unidad se describe el propósito de la estadística inferencial; se presenta el

significado de estimador puntual y por intervalo, de distribución muestral, y se analiza

cómo obtener conclusiones acerca de una población a partir de una muestra.

Se estudian únicamente dos distribuciones muestrales: la de la media y la de la proporción.

Se presentan las condiciones, características y metodología para determinar sus

estimadores puntuales y por intervalo.

De igual manera, se presenta y analiza el significado de realizar una prueba de hipótesis,

de la metodología que se sigue para hacerla y se realizan pruebas de hipótesis para la

media y la proporción.

Finalmente, se muestra la relación entre una prueba de hipótesis y un intervalo de

confianza.

Propósitos

Los propósitos de esta unidad son:

Comprender los alcances de la estadística inferencial.

Comprender el significado de estimador puntual y por intervalo.

Determinar los estimadores puntuales y por intervalo de las distribuciones

muestrales de la media y la proporción.

Comprender y utilizar la metodología de las pruebas de hipótesis para la media y la

proporción.

Reconocer la relación entre una prueba de hipótesis y un intervalo de confianza.

Competencia específica

Analizar la información de una muestra para identificar las dinámicas de la

población de estudio, mediante la resolución de problemas con técnicas de

estadística inferencial.

Page 4: Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población

Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública

4

Presentación de la unidad

Como se sabe, la teoría del muestro permite obtener información acerca de una población

finita a través de muestras extraídas al azar, sin embargo, es más práctico y

frecuentemente más importante inferir información de una población mediante varias

muestras extraídas de ella.

Lo anterior lo hace la inferencia estadística o estadística inferencial, basándose en la

teoría del muestro y el objetivo es estimar una medida descriptiva de la población (por

ejemplo, la media o la varianza) a partir de la medida descriptiva de la muestra (media o

varianza muestral); a los primeros se les llama parámetros y a los segundos estadísticos.

Debido a lo anterior, es claro que para una población en particular, los parámetros son fijos

y frecuentemente desconocidos, mientras que los estadísticos varían dependiendo de la

muestra.

A continuación se muestran algunos de los parámetros más comunes y sus

correspondientes estadísticos:

Medida descriptiva Parámetro Estadístico

Media _

x

Varianza 2 2s

Desviación estándar s

Proporción p _

p

Los principales tipos de inferencia que se realizan son:

Estimación puntual o por intervalo

Prueba de hipótesis

Dado que las inferencias estadísticas que se hacen acerca de la población se realizan por

medio de muestras, lo natural es usar la media y la varianza (estadísticos) como

estimadores de los parámetros correspondientes.

Para poder llevar a cabo lo anterior, existen dos problemas:

Determinar si la estimación está sesgada

Determinar la cercanía del valor del estadístico con el valor del parámetro que se

está estimando.

Page 5: Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población

Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública

5

Para analizar el sesgo, considérese que se toman una gran cantidad de muestras de una

población con media y que se determina la media de cada una de las muestras,

obteniendo los valores

_

ix , con estos es posible construir una distribución cuya media

_

x

tiene un valor que puede estar cercano o no al valor de la media poblacional . Si el valor

de la de la media de la distribución de medias

_

x es cercano al de la población , se

dice que

_

x es un estimador insesgado de .

En general, si la media de la distribución muestral de un estadístico es igual a su

correspondiente parámetro, el estadístico se llama estimador insesgado del parámetro,

si no es igual se denomina estimador sesgado. Los valores correspondientes de tales

estadísticos se conocen como estimaciones insesgadas o sesgadas, respectivamente.

Hay dos tipos de estimación de parámetros.

1) Estimación puntual: es la que está dada por un valor numérico.

2) Estimación por intervalo: son aquellas que están dadas por dos números, entre

los que, muy probablemente, está el valor del parámetro poblacional.

Es importante no confundir un estimador puntual con una estimación puntual; debe

recordarse que la segunda es un valor particular obtenido de un estimador puntual.

2.1. Estimación puntual y por intervalo de la media

Si se consideran todas las posibles muestras de tamaño n que pueden extraerse de una

población y que se calcula la media

__

ix de cada una de las muestras, con estos valores

se puede construir una distribución de la cual también se puede encontrar la media __

x

como usualmente se ha hecho.

Por la forma en que se calcula __

x

, puede verse que un estimador puntual es una función

de un conjunto de observaciones de la población y es un “punto” en el sentido de que se

refiere a un solo valor.

Del mismo modo, la información contenida en las

__

ix calculadas, permite construir un

intervalo dentro del cual puede estar contenido el valor del parámetro .

Page 6: Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población

Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública

6

2.1.1. Estimador puntual y sus propiedades

Puede ser claro que por medio de las muestras es posible hacer una estimación de

cualquiera de los parámetros de una población, de manera que no es fácil determinar cuál

de los estadísticos es el más apropiado. Los siguientes cuatro criterios permiten hacer esta

elección:

Inestabilidad: es preferible usar un estimador no sesgado, es decir, cuando

ocurre que la esperanza del estadístico es igual al valor del parámetro, por

ejemplo:

_

xE.

Ahora bien, aun cuando lo anterior se cumpla, puede ocurrir algo como lo mostrado

en la siguiente gráfica:

__

x

En este caso, la elección del estimador, usando solo este criterio, no resulta

suficiente.

Consistencia: se dice que el estimador del parámetro es consistente si el valor

del estimador se aproxima al valor del parámetro de la población cuando el

tamaño de la muestra se hace más y más grande.

Por ejemplo, para la distribución muestral de medias tenemos que:

x

xE

nx

de aquí puede apreciarse que conforme n se hace más grande,

el cociente se hace cada vez más pequeño, por lo que la

división se acerca más al cero; ahora bien, que la desviación

estándar sea cercana a cero, significa que los valores de x se

encuentran muy cerca y alrededor del valor de .

Eficiencia: se dice que el estimador del parámetro es eficiente cuando tiene la

menor de las varianzas entre todos los posibles estimadores.

Page 7: Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población

Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública

7

Suficiencia: se dice que el estimador es suficiente si genera tanta o más

información acerca del parámetro de la que podría proporcionar otro estimador

cuando se utiliza la misma muestra.

2.1.2. Distribución muestral de la media, normal y “t de Student”

En general, existen tres tipos de información que se desea conocer sobre una distribución:

¿Dónde está el centro?

¿Qué tanto varía?

¿Cómo está repartida?

Por supuesto, querríamos conocer esta misma información respecto a una distribución

muestral, por ejemplo la distribución muestral de x . Con el siguiente ejemplo, se muestra

la manera en que se procede para obtener la información y dar respuesta a las preguntas

previas.

Ejemplo (1) Considere que en la siguiente tabla se representa a toda una población, que

consiste en el número de pizzas que la sucursal de cierta empresa vende en

una hora determinada del día:

Sucursal Número de pizzas

Calle Real 2

Puente grande 3

Plaza 6

El centro 8

Niño perdido 9

A continuación se pide que se hagan algunos procedimientos y cálculos, y se dan

recomendaciones y resultados para verificar.

a) Haz los cálculos pertinentes para demostrar que:

60.5 , 440.72 y 728.2

b) Haz una lista de todas las posibles muestras de tamaño 2 que se pueden

generar de dicha población, considerando que se hace un muestreo con

remplazo (son 25 en total)

Page 8: Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población

Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública

8

Núm. de

pizzas 2 3 6 8 9

2

3

6

8

9

c) Determina la media de cada una de las muestras y verifica que se obtienen los

valores de la tabla del inciso d). Con los datos de la tabla del inciso a), completa

la distribución de medias muestrales:

__

x 2 2.5 3 4 4.5 5 5.5 6 7 7.5 8 8.5 9

__

xXP 25

1 25

1 25

4 25

2 25

2

d) Haz los cálculos pertinentes para demostrar que la media de la distribución de

medias muestrales es:

60.5__ x

e) Haz los cálculos pertinentes para demostrar que la varianza y la desviación

estándar de la distribución de medias muestrales son, respectivamente:

720.32 x y 923.1x

f) Grafica las distribuciones de probabilidad de los incisos b) y d) y analiza las

gráficas usando los valores de las medias y desviaciones estándar para cada

distribución.

Lo que se hará a continuación es un tratamiento común y consiste en agrupar las

medias en intervalos; recuérdese que existen distintos criterios para determinar el

número k de intervalos. Si se usa el criterio 2

25

22

nk, siendo k el menor

número que cumple con la desigualdad, se concluye que 4k , es decir, se deben

usar cuatro intervalos; sin embargo, también se puede determinar el número de

intervalos haciendo 25 nk

Page 9: Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población

Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública

9

g) Para el presente ejercicio, se considera el que 5k . Realiza los cálculos

necesarios y completa la tabla siguiente.

Límites de clase Marca de clase

__

x Frecuencia de

clase

2.0 – 3.4 2.7 4

3.4 – 4.8 4

4.8 – 6.2 9

6.2 – 7.6 4

7.6 - 9.0 4

h) Grafica el histograma para los datos del inciso h)

Al analizar los resultados obtenidos hasta ahora, es posible ver que:

La media de la población y la media de la distribución de medias muestrales es

igual, es decir:

__

x

La varianza de la población es el doble de varianza de la distribución de medias

muestrales, es decir:

x22 2

El rango de la población es el mismo que el de la distribución de medias

muestrales.

La población tenía una distribución de probabilidad uniforme, mientras que la

distribución de medias muestrales parece ser una distribución normal.

Tratar de generar una distribución de medias muestrales para muestras de tamaño 3, es

un ejercicio que puede llevarse a cabo con un poco de paciencia y que lleva a tener casi

las mismas conclusiones que las descritas anteriormente; el único cambio es que

x22 3 , lo que da una pista sobre la relación existente entre la varianza de la población

y la varianza de la distribución de medias muestrales.

Otro ejercicio interesante, mucho menos costoso en tiempo y que se recomienda hacer, es

construir la distribución de medias muestrales cuando el muestreo se realiza sin

restitución. Si se consideran los casos 2n y 3n , en cada uno de ellos solo hay 10

muestras, y las conclusiones son parecidas, estas se enuncian a continuación:

Page 10: Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población

Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública

10

La media de la población y la media de la distribución de medias muestrales es

igual, es decir:

__

x

La varianza de la población es n veces la varianza de la distribución de medias

muestrales, es decir: __22xn

El rango de la población es el mismo que el de la distribución de medias

muestrales.

La distribución de medias muestrales tiende a una distribución normal conforme

aumenta el tamaño de la muestra.

En resumen, la distribución de medias muestrales es normal con media y varianza

nx

22 __

. Esto significa que es posible calcular la probabilidad de que un valor de x se

encuentre en un rango de valores, para lo que se deberá estandarizar mediante

n

xz

Como puede apreciarse, a través de la información generada de una muestra, es posible

caracterizar a toda una población, ya que la distribución de medias muestrales se

comporta como una distribución normal.

Sin embargo, todo el análisis se puede llevar a cabo porque se conoce a toda la población

y consecuentemente, se conocen sus parámetros. Sin embargo, lo más frecuente es que

no sea posible trabajar con todos los elementos de la población, porque esta fuera muy

grande, sino únicamente con una muestra (pequeña en comparación con el tamaño de la

población). En este caso, la distribución de probabilidad que se usa es denominada t de

Student.

Las condiciones bajo las que se usa esta distribución son:

Población con distribución normal. Si esto no sucede, no es posible usar t de

Student.

Varianza desconocida. Por tal motivo se debe estimar mediante la varianza

muestral.

Page 11: Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población

Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública

11

Las características (Nieves & Dominguez, 2010. 382) de la distribución t de Student, son: 1. Tiene media igual a cero.

2. Están distribuidas simétricamente alrededor de su media.

3. Hay una distribución diferente para cada grado de libertad.

4. Tienen varianzas mayores que uno, pero, a medida que aumenta el número de

grados de libertad, la varianza tiende a uno.

5. En comparación con la distribución normal estándar, las curvas son más bajas

en la media, pero sus colas son más altas.

Para la distribución t de Student, la “estandarización” es

ns

xt

La t calculada de esta manera, tiene una función de probabilidad t de Student con 1n

grados de libertad

Ejemplo (2)

Una compañía fabricante de lámparas, asegura que estas tienen una vida media útil de

60 meses y una desviación estándar de 6 meses, para verificar la información, una

empresa prueba una muestra aleatoria de 50 lámparas.

a) ¿Qué tipo de distribución se puede usar para inferir sobre la media

poblacional? Justificar.

b) ¿Cuál es la estandarización pertinente?

c) ¿Cuál es la probabilidad de encontrar una muestra con una vida útil

promedio de menos de 58 meses?

Solución:

a) Como el tamaño de muestra es grande 30n y la desviación estándar

es conocida, se puede usar la distribución normal.

b) La estandarización que se puede usar es

n

xxz

x

x

c) Lo que se pide es

58__

xP . Para determinar el valor de esta

probabilidad, primero se debe estandarizar 58__

x , es decir:

35.2

506

2

506

6058

z

Al consultar en la tabla para la distribución normal:

Page 12: Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población

Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública

12

0094.035.2__

xP

Este resultado significa que la probabilidad es de 0.0094, o bien, que en el 0.94% de

las ocasiones que se tome una muestra se tendrán lámparas que duren menos de 58

meses. Aunque debe aclararse que esto será así solo si la información que

proporciona el fabricante es cierta.

Ejemplo (3)

Un fabricante de cigarrillos afirma que su producto tiene un contenido promedio de

nicotina de 1.83 miligramos. Se toma una muestra aleatoria de 8 de estos cigarrillos y se

determina que el contenido de nicotina de cada uno de ellos es: 2.0, 1.7, 2.1, 1.9, 2.2,

2.1, 2.0 y 1.6 miligramos.

a) Calcular la media y la desviación estándar de la muestra.

b) ¿Qué tipo de distribución se puede usar para inferir sobre la media

poblacional? Justificar.

c) ¿Cuál es la estandarización pertinente?

d) Con esta información, y con una certeza del 95%, se quiere responder la

pregunta: ¿la afirmación del fabricante es cierta?

Solución:

a) Para determinar la media de la muestra.

95.1

8

6102122291127102

1

........

n

x

x

n

i

i

Para determinar la desviación estándar de la muestra, primero se calcula la varianza:

0.0429

7

95.16.195.10.295.11.295.12.2

95.19.195.11.295.17.195.102

1

2222

2222

1

2__

2

.

n

xx

s

n

i

i

Entonces, la desviación estándar es 2071.0s

b) Como no conocemos el valor de , la estamos estimando a partir de s ,

y además, la muestra es pequeña, se debe usar la distribución t de

Page 13: Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población

Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública

13

Student para inferir sobre la media poblacional.

c) La estandarización que se usa para la distribución t de Student es

ns

xt

d) Al sustituir en la expresión anterior, y realizar los cálculos indicados, se

tiene:

1.64

8207.0

83.195.1

ns

xt

Al buscar el valor de t en la distribución t de Student con 7 grados de libertad, se ve que t

está contenido en la región del 90%

89.1

7,05.0

t

89.1

7,05.0t64.1t

Probabilidad de 0.9

Lo anterior quiere decir que con una certeza del 90%, la información del fabricante es

cierta; por tanto, la afirmación del fabricante no es cierta con el nivel de certeza que dijo

tener.

Page 14: Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población

Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública

14

2.1.3. Teorema del límite central

Como ya se mencionó, hay tres cosas que es deseable conocer acerca una distribución:

¿Dónde está el centro?

¿Qué tanto varía?

¿Cómo está repartida?

El siguiente enunciado, conocido como el Teorema del límite central, proporciona

información sobre los tres aspectos.

Si se toman todas las muestras posibles, de tamaño n, sin remplazamiento, de una

población finita de tamaño N, con media µ y desviación estándar σ, entonces la

distribución de las medias muestrales:

Serán de tipo normal cuando la población de la que proceden las muestras

es de tipo normal, en caso contrario, se aproximará a una normal para

valores grandes de n 30n .

Tendrán media __

x

Tendrán desviación estándar n

x

o

1

N

nN

nx

respectivamente.

El término 1

N

nN es conocido como factor de corrección por población

finita y puede omitirse cuando Nn 05.0 , es decir, cuando el tamaño de la

muestra es menos del 5% del tamaño de la población.

2.1.4. Intervalo de confianza para la media

Si para una población normal se quiere conocer la probabilidad de que un valor esté

contenido entre la media y una desviación estándar usando la gráfica para la distribución

normal, fácilmente puede verse que la región en la que debería estar el valor es la parte

central y se puede tener una idea del valor esperado:

Page 15: Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población

Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública

15

2

3

2

3

Por otra parte, y sabiendo que la gráfica es simétrica, la probabilidad se puede escribir

012102

1001

zPzP

zPzP

xPxPxP

Al buscar en la tabla correspondiente, se concluye:

6826.0

3413.02

xP

De manera similar, se puede demostrar que:

%44.9522 xP

%74.9933 xP

Sin embargo, en muchas ocasiones lo que se desea conocer es la probabilidad de que la

media poblacional esté contenida en un cierto rango de valores, si se conoce el valor de la

media de una muestra.

A continuación se muestra cómo determinar un intervalo para el cual existe una

probabilidad conocida de que la media poblacional esté contenida en dicho intervalo.

Ejemplo (4)

Se desea saber entre qué valores puede estar la media de la población con una

probabilidad del 0.95

Solución: se expresa la probabilidad dada en términos del intervalo donde puede estar

contenido el valor normalizado y se despeja :

Page 16: Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población

Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública

16

95.096.196.1

95.096.196.1

95.096.196.1

__

__

nx

nP

n

xP

zP

95.096.196.1

95.096.196.1

__

__

nx

nP

nx

nP

De donde, finalmente, se obtiene que:

95.096.196.1____

n

xn

xP

Esto quiere decir que la media de la población se encuentra contenida en el

rango dado por n

xn

x

96.196.1____

, que también puede ser

expresado como un intervalo

nx

nx

96.1,96.1

____

; a este intervalo se

le denomina intervalo de confianza para una probabilidad de 0.95

El resultado encontrado significa que para una población, el intervalo de

confianza depende de la media de la muestra, sin embargo, aunque cada

muestra que se tome proporciona un intervalo diferente, esta metodología

garantiza que la media de la población está contenida en el 95% de ellos.

La siguiente tabla de valores, permite determinar el valor correspondiente de z para un

intervalo de confianza dado.

Nivel de

confianza 99.7 99.0 98.0 96.0 95.5 95.0 90.0 80.0 68.3

z 3.00 2.58 2.33 2.05 2.00 1.96 1.65 1.28 1.00

Cuando se está considerando la distribución muestral de medias para estimar , el

intervalo de confianza para la media poblacional se encuentra con la expresión dada a

continuación, siendo z el valor correspondiente al nivel de confianza deseado:

nzx

nzx

____

Page 17: Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población

Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública

17

La “fórmula” significa que, conociendo __

x y , puede encontrarse un intervalo que

contenga a con una confianza dada. Otras formas de expresar el intervalo de

confianza:

xx

zxzx , y

nzx

nzx

,

2.2. Estimación puntual y por intervalo de la proporción

Frecuentemente, la información que se obtiene de una muestra es solamente un sí o un

no. Por ejemplo:

Una encuesta reveló que el 80% de las amas de casa compran sus artículos de

primera necesidad en las tiendas de autoservicio.

Un estudio indicó que el 60% de los hombres de entre 28 y 50 años creen que los

dos cónyuges deben compartir los gastos del hogar.

Estos ejemplos muestran el significado de “Proporción: fracción, razón o porcentaje que

indica la parte de la muestra de la población que posee un rasgo de interés particular”

(Lind, Marchall &Wathen, 2008. 310)

El valor de la proporción se determina mediante n

xp __

, siendo x el número de éxitos y n

el número de elementos de la muestra; este valor se usa como un estimador de la

proporción de éxitos en la población de estudio.

Debido a la forma de encontrar la proporción, es natural pensar en una distribución

binomial como el modelo para las proporciones, siempre y cuando el tamaño de la muestra

sea pequeño 30n ya que en caso contrario, resulta mucho mejor utilizar la

aproximación normal a la binomial.

Por lo anterior, se utiliza la distribución normal para calcular la estimación de la proporción

por intervalo; que equivale a encontrar el intervalo de confianza para p poblacional.

Page 18: Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población

Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública

18

2.2.1. Estimador puntual y sus propiedades

Se sabe que n

xp __

y que la variable x tiene un modelo de probabilidad binomial, cuya

media es np y varianza npq , por tanto, pn

np

p

__

Lo anterior quiere decir que la media de la distribución muestral de proporciones es la

probabilidad de éxito p .

En el caso de la varianza se tiene que 2

2

n

npq

2.2.2. Distribución muestral de la proporción

Considérese una población en la que los elementos son o éxitos o fracasos, en la que la

probabilidad de éxito es p , siendo pq 1 la probabilidad de fracaso.

Si se obtienen todas las posibles muestras de tamaño n y para cada muestra se determina

la proporción __

p de éxito y con esta información se construye una distribución de

probabilidad, esta tiene las siguientes propiedades:

la media es pp

__

la desviación estándar es n

qp

p

__

La distribución construida se denomina distribución muestral de proporciones y tiene

las siguientes características:

1. Proviene de una población con distribución binomial:

a. Los datos de la muestra son el resultado de contar.

b. Únicamente hay dos resultados posibles: éxito o fracaso.

c. La probabilidad de éxito es constante de un evento a otro.

d. Los eventos son independientes.

2. Si se cumple que 5pn y 5qn se puede recurrir a la distribución normal para

aproximar a la binomial y la estandarización es

n

qp

ppz

__

Page 19: Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población

Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública

19

2.2.3. Cálculo de un intervalo de confianza para la proporción

En este caso, la mejor manera de explicar cómo se determina un intervalo de confianza

para las proporciones es resolviendo el siguiente:

Ejemplo (7)

Se desea estimar el porcentaje de varones adultos de cierta ciudad que fuman al menos

una cajetilla de cigarrillos al día. Supóngase que se toma una muestra aleatoria de 300

individuos y que de ellos, 36 individuos fuman.

Responder las siguientes tres preguntas, que también fueron respondidas para .

a) ¿Cuál es la exactitud de la proporción de la muestra como estimación de

p ?

b) ¿Qué tamaño de muestra se necesitaría si deseamos una probabilidad

de 0.95 de que el error de la estimación no exceda a 0.02 unidades?

c) ¿Cuál es el intervalo de confianza a 95% para p ?

Solución:

Por principio debemos resaltar el hecho de que el tamaño de muestra es lo bastante

grande para justificar el uso de los métodos de la curva normal.

a) Como la proporción de la muestra n

xp __

tiene una distribución normal

entonces tiene:

media p

y desviación estándar 300

pq

n

pq

Se considera una probabilidad de 0.95 de que __

p se encuentre a una distancia menor de

1.96 desviaciones estándar de p , es decir, el error de estimación debe ser menor que

30096.1

pq; por otra parte, como p es desconocida, debe estimarse haciendo:

12.0300

36

__

n

xp

Por tanto, el error de estimación es aproximadamente

037.0300

)88.0)(12.0(96.1

Page 20: Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población

Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública

20

Es decir, con una probabilidad de 0.95, la estimación de la muestra __

p no difiere de p por

más de 0.037 unidades, lo que da una buena idea de la exactitud del valor de muestra

0.12 como estimación de p .

b) Para determinar el tamaño de la muestra necesaria, para obtener una

precisión dada en la estimación de p , se selecciona n de manera que el

número apropiado de desviaciones estándar de __

p sea igual al error máximo

deseado en la estimación.

Sea e el error de estimación máximo seleccionado y sea z el valor

correspondiente a la probabilidad deseada para no exceder este error

máximo. Entonces n debe satisfacer la ecuación en

pqz , de donde

2

2

e

pqzn

Para el problema que estamos resolviendo, sabemos que p no se conoce,

de manera que debe estimarse según el valor de la muestra, es decir,

usando 12.0__

p y para 02.0e y 96.1z tenemos:

1014

02.0

88.012.096.12

2

n

Por tanto, se necesitará una muestra adicional de 714 para obtener la

precisión deseada de la estimación.

c) El intervalo de confianza del 95% para p se calcula usando el mismo

razonamiento que para , solo que __

p toma el lugar de __

x , con lo que se

tiene:

157.0083.0

300

88.012.096.112.0

300

88.012.096.112.0

96.196.1

______

______

p

p

n

qppp

n

qpp

Por tanto, un intervalo de confianza al 95% para p está dado por

157.0083.0 p

Page 21: Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población

Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública

21

Es necesario aclarar que la solución a cada uno de esto incisos está basada en

métodos de muestras grandes; afortunadamente los métodos son bastante buenos

también para muestras pequeñas, siempre que 5np para 5.0p y 5nq para

5.0p

Actividad 1. Estimadores puntuales

Hemos aprendido el significado de estimador puntual y revisado sus propiedades; así

mismo, analizamos el significado de intervalo de confianza y encontramos estos intervalos

para las distribuciones muestrales de la media y la proporción.

El objetivo de la actividad es que, a partir de la información proporcionada, reconozcas la

distribución que debes usar para realizar las estimaciones.

Para completar la información presentada aquí y reforzar lo aprendido, realiza lo siguiente:

1. Elabora un mapa conceptual donde se vean claramente las diferencias entre las

estimaciones puntuales para poblaciones grandes y pequeñas.

2. Por último, describe cómo se determina un intervalo de confianza y elabora un

reporte donde integres los resultados previos con tus conclusiones.

3. Al terminar, envía tu documento a la sección de tareas, con la nomenclatura

EISP_U2_A1_XXYZ, y espera la retroalimentación del Facilitador(a).

*Consulta la rúbrica de evaluación para conocer los criterios que serán tomados en cuenta

al momento de calificar tu trabajo.

Page 22: Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población

Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública

22

Actividad 2. Estimaciones puntuales e intervalos de confianza

El objetivo de esta actividad es que compartas información y que verifiques la información

de tus compañeros(as).

Entra al Foro denominado Estimaciones puntuales e intervalos de confianza y realiza lo

siguiente:

1. Lee con atención los ejercicios que ahí se presentan.

2. Documéntate sobre los tópicos que se correspondan con los ejercicios planteados.

3. Responde los ejercicios y sube tus aportaciones al foro.

4. Revisa las aportaciones de tus compañeros(as), compara sus opiniones con las tuyas

e intercambia comentarios a fin de establecer un diálogo fructífero y de cercanía.

*Consulta la rúbrica de evaluación para conocer los criterios que serán tomados en cuenta

al momento de calificar tu trabajo.

2.3. Prueba de hipótesis

Una hipótesis estadística es una aseveración o conjetura respecto a una o más

poblaciones; por lo anterior, es muy importante tener claro que una hipótesis estadística se

formula sobre la población o distribución que se está estudiando, no sobre la muestra.

Para realizar una prueba de hipótesis es necesario establecer dos hipótesis estadísticas,

conocidas como hipótesis nula e hipótesis alternativa, respectivamente.

La hipótesis nula 0H siempre se usa para establecer que el parámetro de interés, que es

desconocido, es igual a un valor dado. Por ejemplo, si no se conoce la media poblacional

µ, la hipótesis nula es: 00 : H

La hipótesis alternativa 1H establece que el parámetro es menor que (<), mayor que (>), o

diferente de (≠) el valor especificado.

Page 23: Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población

Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública

23

Ejemplo (8)

Se sabe que la tasa de incineración de un sólido es una variable aleatoria que puede

describirse mediante una distribución de probabilidad.

Se quiere saber si la media de la taza de incineración (parámetro) es distinta de s

cm50

Expresar la hipótesis nula y la hipótesis alternativa:

Solución:

Como en la hipótesis nula 0H se establece que el parámetro desconocido es igual a un

valor especificado que sí se conoce, se tiene que la hipótesis nula es:

s

cmH 50:0

En el caso de la hipótesis alternativa 1H , esta es para establecer que el parámetro es

diferente del valor especificado para 0 , por lo que la hipótesis alternativa o hipótesis de

investigación es:

s

cmH 50:1

2.3.1. Conceptos generales de la metodología

Al procedimiento mediante el cual se toma la decisión sobre una hipótesis en particular, se

le denomina prueba de hipótesis.

Los procedimientos para realizar una prueba de hipótesis dependen de la información

contenida en una muestra aleatoria de la población de interés; si la información es

consistente con la hipótesis, se concluye que esta es verdadera, y en caso contrario que

es falsa.

La hipótesis nula 0H debe formularse de manera que al rechazarla se apoye la conclusión

de la investigación; mientras que la hipótesis de investigación debe expresarse como la

hipótesis alternativa 1H .

Page 24: Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población

Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública

24

Ejemplo (9)

Se seleccionará una muestra aleatoria de cigarrillos producidos a partir de hojas

secadas con un nuevo método y se medirá el contenido de nicotina. Se quiere saber si el

contenido medio de nicotina por cigarrillo es menor que 1.5 miligramos.

Solución:

Lo primero que se debe identificar es el parámetro de interés, que en este caso es la

media poblacional.

En segundo lugar, debe establecerse claramente lo que se quiere probar; según el

enunciado, se quiere probar que la media sea menor o igual a 1.5 miligramos, es decir,

que: mg15 .

Por tanto, la formulación del juego de hipótesis es:

mgH 15:0

mgH 15:1

Al tomar decisiones, se pueden cometer dos tipos de errores, cuyos nombres y

descripciones son:

Error tipo I. Se refiere al hecho de rechazar la hipótesis nula 0H cuando esta es

verdadera.

Error tipo II. Hace referencia al hecho de no rechazar la hipótesis nula 0H cuando

esta es falsa.

Podemos resumir en el siguiente cuadro:

Decisión 0H es verdadera 0H es falsa

No rechazar 0H No error Error tipo II

Rechazar 0H Error tipo I No error

Puesto que una decisión está basada en variables aleatorias, es posible asignarle

probabilidades a los errores, y estos son representados como:

α = P (error tipo I)

= P( rechazar | es verdadera)

α también recibe por nombre nivel de significancia.

β = P( error tipo II)

= P( No rechazar | es falsa)

Page 25: Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población

Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública

25

A continuación se describe el procedimiento general para realizar una prueba de hipótesis:

1. Leer cuidadosamente el problema para identificar el parámetro de interés.

2. Estructurar la hipótesis nula 0H , sin olvidar que contiene a la igualdad.

3. Especificar la hipótesis alternativa 1H , tomando en cuenta que se trata de la

hipótesis de investigación, esto quiere decir que se espera rechazar 0H y, en

consecuencia, aceptar 1H .

4. Escoger un nivel de significancia para α (controla la probabilidad de cometer el

error tipo I)

5. Escoger una estadística de prueba apropiada.

6. Tomar una muestra aleatoria del parámetro.

7. Con los datos, calcular el estadístico de prueba.

8. Decidir si 0H debe ser o no rechazada y reportar los resultados en el contexto del

problema.

2.3.2. Prueba de hipótesis de la media

Debido a lo descrito anteriormente, las pruebas de hipótesis para un parámetro poblacional

asumen una de estas tres formas:

01

00

:

:

H

H Esta es denominada prueba de cola derecha.

01

00

:

:

H

H Esta es denominada prueba de cola izquierda.

01

00

:

:

H

H Esta es denominada prueba de dos colas.

A continuación se describirá cómo se realiza la prueba de hipótesis para la media

poblacional, y luego se resolverá un ejemplo, en los casos en los que:

es conocida.

es desconocida, el tamaño de la muestra es pequeño y la población es normal.

Prueba de hipótesis para la media poblacional con conocida

Los supuestos para poder realizar la prueba de hipótesis son:

La población o distribución de interés tiene media µ y varianza .

La población se distribuye normalmente y es aplicable el teorema de límite central.

El estadístico de prueba es

n

xz

00

Page 26: Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población

Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública

26

A continuación se analizan los tres casos presentados al inicio de este apartado, aunque

no en el mismo orden.

1) El primer juego de hipótesis es

01

00

:

:

H

H

Si la hipótesis nula es verdadera, el 0z que se calcula caerá en la región de no

rechazo de 0H , en caso contrario, 0z caerá en la región de rechazo, lo que

significa que la muestra produjo un valor inusual del estadístico de prueba; lo

anterior quiere decir que la información contenida en la muestra no apoya el

supuesto de que 0H es verdadera.

La regla de decisión se define como:

Se debe rechazar 0H si 2

0 zz o 2

0 zz

No se debe rechazar 0H si 2

02

zzz

2z

2z

Región de rechazo Región de rechazoRegión de no rechazo de Ho

0

2

2

1

2) El segundo juego de hipótesis es:

01

00

:

:

H

H

La regla de decisión se define como:

Se debe rechazar 0H si zz 0

No se debe rechazar 0H si zz 0

z

Región de rechazoRegión de no rechazo de Ho

0

1

Page 27: Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población

Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública

27

3) El tercer juego de hipótesis es:

01

00

:

:

H

H

La regla de decisión se define como:

Se debe rechazar 0H si zz 0

No se debe rechazar 0H si zz 0

z

Región de rechazoRegión de no rechazo de Ho

0

1

Ejemplo (10)

Una muestra aleatoria de 100 muertes registradas en México durante el año pasado,

muestra una vida promedio de 71.8 años. Suponiendo una desviación estándar

poblacional de 8.9 años, ¿esto parece indicar que la vida media hoy en día es diferente

que 70 años? Utilice un nivel de significancia de 0.05.

Solución:

Siguiendo los pasos descritos anteriormente:

Parámetro media poblacional (µ)

Hipótesis nula años 70:0 H

Hipótesis alternativa años 70:1 H

Nivel de significancia 05.0

Probabilidad del 0.95

95% de confianza

Estadística 0z

Datos años 8.71__

x , años 9.8

Estandarización 02.2

1009.8

708.710

z

Valor crítico 96.12

z

Decisión Rechazar dado que 2

0 zz

Conclusión La vida media hoy día es

diferente a 70 años.

Page 28: Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población

Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública

28

96.12

z 96.12

z

Región de rechazo Región de rechazoRegión de no rechazo de Ho

1

02.20 z

Ejemplo (11)

Del ejemplo anterior se vio que la media es distinta a 70 años, ahora se tiene interés en

saber si la vida media, hoy en día, es mayor que 70 años. Utilice un nivel de significancia

de 0.05.

Solución: siguiendo los pasos descritos con anterioridad tenemos:

1) Parámetro media poblacional (µ)

2) Hipótesis nula años 70:0 H

3) Hipótesis alternativa años 70:1 H

4) Nivel de significancia 05.0

Probabilidad del 0.95

95% de confianza

5) Estadística 0z

6) Datos años 8.71__

x , años 9.8

7) Estandarización 02.2

1009.8

708.710

z

Valor crítico 96.1z

8) Decisión Rechazar y aceptar

dado que zz 0

Conclusión La vida media hoy día es mayor

a 70 años.

Page 29: Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población

Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública

29

645.1z

Región de rechazoRegión de no rechazo de Ho

02.20 z

Prueba de hipótesis para la media poblacional con no conocida

Los supuestos para poder realizar la prueba de hipótesis son:

El tamaño de muestra es pequeño.

La media y varianza 2 son desconocidas.

Tenemos una muestra aleatoria de tamaño n de una población normal de la cual se

determinan __

x y 2s .

El estadístico de prueba es

ns

xt 0

0

, es decir, una distribución t de Student con

n-1 grados de libertad.

A continuación se analizan los tres casos presentados al inicio de este apartado, aunque

no en el mismo orden.

1) El primer juego de hipótesis es

01

00

:

:

H

H

La regla de decisión se define como:

Se debe rechazar 0H si 2

0 tt o 2

0 tt

No se debe rechazar 0H si 2

02

ttt

2t

2t

Región de rechazo Región de rechazoRegión de no rechazo de Ho

0

2

2

1

Page 30: Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población

Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública

30

2) El segundo juego de hipótesis es:

01

00

:

:

H

H

La regla de decisión se define como:

Se debe rechazar 0H si 1,0 ntt

No se debe rechazar 0H si 1,0 ntt

t

Región de rechazoRegión de no rechazo de Ho

1

3) El tercer juego de hipótesis es:

01

00

:

:

H

H

La regla de decisión se define como:

Se debe rechazar 0H si 1,0 ntt

No se debe rechazar 0H si 1,0 ntt

t

Región de rechazoRegión de no rechazo de Ho

1

Ejemplo (12)

El instituto eléctrico Edison publica cifras del número anual de kilowatt-hora (kWh) que

gastan varios aparatos electrodomésticos. Se afirma que una aspiradora gasta un

promedio de 46 kWh al año. Si una muestra aleatoria de 12 hogares indica que las

aspiradoras gastan un promedio de 42 kWh al año con una desviación estándar de 11.9

kWh. ¿La información de la muestra sugiere, a un nivel de significancia de 0.05, que las

aspiradoras gastan en promedio menos de 46 kWh anualmente? Suponga que el gasto

de kWh es normal.

Solución:

Siguiendo los pasos descritos anteriormente:

1) Parámetro media poblacional (µ)

2) Hipótesis nula kWhH 46:0

3) Hipótesis alternativa kWhH 46:1

Page 31: Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población

Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública

31

4) Nivel de significancia 05.0

5) Estadística 0t

6) Datos kWhx 42__

, kWhs 9.11

7) Estandarización 16.1

129.11

46420

t ,

con 1 grados de libertad

Valor crítico 796.111,05.0 t

8) Decisión No rechazar pues 1,0 ntt

Conclusión La información contenida en la

muestra no permite afirmar que el

gasto promedio de kWh es menor que

46.

2.3.3 Relación entre una prueba de hipótesis de la media y un intervalo

de confianza

La prueba de hipótesis para la inferencia estadística está estrechamente relacionada con

el enfoque de intervalo de confianza porque la estimación del intervalo de confianza

incluye el cálculo de límites para los que es “razonable” que el parámetro en cuestión se

encuentre dentro de ellos.

Para el caso de una media poblacional µ con conocida, la prueba de hipótesis y la

estimación del intervalo de confianza se basan en la variable aleatoria estandarizada

n

xz

La prueba de 00 : H contra 01 : H a un nivel de confianza de %1100

equivale a calcular un intervalo de confianza de %1100 sobre µ y rechazar si

no está dentro del intervalo calculado y de no rechazarla si está dentro del intervalo de

confianza.

Con un valor observado ̅, no rechazar con una confianza %1100 implica:

nzx

nzx

z

n

xz

zzz

2

__

02

__

2

0

__

2

20

2

Page 32: Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población

Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública

32

Así, regresando al ejemplo (10), acerca de las muertes registradas en México, el intervalo

de confianza del 95% se determina haciendo:

5444.730556.70

100

9.896.18.71

100

9.896.18.71

0

0

Como no está en el intervalo, se rechaza . Con esto, se llega a la conclusión de

que la vida media hoy día es diferente que 70 años.

2.3.4. Prueba de hipótesis de la proporción

Las pruebas de hipótesis para la proporción, asumen una de las formas:

01

00

:

:

ppH

ppH

01

00

:

:

ppH

ppH

01

00

:

:

ppH

ppH

Las dos primeras son denominadas pruebas de una cola y la tercera prueba de dos

colas. En este caso, el estadístico a utilizar es:

n

pp

ppz

00

00

1

Ejemplo (13)

Un informe reciente de la industria de seguros indicó que el 40% de las personas

implicadas en accidentes de tránsito menores había tenido por lo menos un accidente

los pasados cinco años. Un grupo de asesoría decidió investigar dicha afirmación, pues

creía que la información era muy grande. Una muestra de 200 accidentes de este año

mostró que 74 personas también estuvieron involucradas los pasados cinco años,

utilizando un nivel de confianza del 99%.

Solución:

Siguiendo los pasos descritos para la prueba de hipótesis:

1) Parámetro Proporción poblacional (p)

2) Hipótesis nula 4.0:0 pH

3) Hipótesis alternativa 4.0:1 pH

4) Nivel de significancia 01.0

5) Estadística de prueba 0z

Page 33: Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población

Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública

33

6) Datos 37.0p , 63.0q , 200n

7) Estandarización

87.0

200

40.0140.0

40.037.00

z

Valor crítico 33.2z

8) Decisión No rechazar 0H porque zz 0

Conclusión La información contenida en la muestra

no permite afirmar que la proporción es

menor que 0.4

Ejemplo (14)

Se considera que una medicina comúnmente prescrita para aliviar la tensión nerviosa es

efectiva en el 60% de los casos. Resultados experimentales con un nuevo medicamento

muestran que 70 de 100 adultos que padecen de tensión nerviosa, tuvieron alivio al

tomar el medicamento. ¿La evidencia es suficiente para concluir que el nuevo

medicamento es más eficaz que la que prescrita comúnmente? Utilizar un nivel de

confianza de 95%.

Solución:

Siguiendo los pasos descritos para la prueba de hipótesis:

1) Parámetro Proporción poblacional (p)

2) Hipótesis nula 6.0:0 pH

3) Hipótesis alternativa 6.0:1 pH

4) Nivel de significancia 05.0

5) Estadística de prueba 0z

6) Datos 7.0p , 3.0q , 100n

7) Estandarización

04.2

100

60.0160.0

6.07.00

z

Valor crítico 65.1z

8) Decisión Rechazar 0H porque zz 0 y

aceptar 1H

Conclusión Se puede afirmar que la nueva

medicina es más eficaz a la que se

prescribe actualmente.

Page 34: Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población

Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública

34

2.3.5. Relación entre una prueba de hipótesis de la proporción y un

intervalo de confianza

Igual que la prueba de hipótesis de la media se relaciona con su intervalo de confianza, la

prueba de hipótesis de la proporción también se relaciona con su respectivo intervalo de

confianza.

En el caso de una proporción poblacional p la estructura de la prueba de hipótesis y de la

estimación del intervalo, se basan en la variable aleatoria

n

pp

ppz

00

0

__

01

, mientras que

la prueba de 00 : ppH contra 01 : ppH a un nivel de confianza %1100 es

equivalente a calcular un intervalo de confianza de %1100 sobre p.

Por tanto, se rechaza 0H si 0p no está dentro del intervalo de confianza, y si 0p está

dentro del intervalo de confianza, la hipótesis no se rechaza.

Se sabe que con un valor observado __

p , no rechazar 0H con una confianza %1100

implica:

20

2 zzz

Es decir

|

1 200

0

__

2 z

n

pp

ppz

De donde se obtiene:

n

ppzpp

n

ppzp 00

2

__

000

2

__ 11

Así, retomando el ejemplo (14) tenemos que el intervalo de confianza del 95% se

desarrolla de la siguiente manera:

Page 35: Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población

Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública

35

789.06101.0

089.07.0089.07.0

100

7.017.096.17.0

100

7.017.096.17.0

0

0

0

p

p

p

Como 6.00 p cae fuera del intervalo de confianza, entonces rechazamos 0H con lo cual

llegamos a la misma conclusión acerca de la mayor eficacia del nuevo medicamento.

Actividad 3. Pruebas de hipótesis

Hemos aprendido cómo realizar pruebas de hipótesis, cómo determinar un intervalo de

confianza y cuál es la relación entre estos.

El objetivo de la actividad es que con la información proporcionada realices las pruebas de

hipótesis, para que decidas sobre la validez de las aseveraciones planteadas en los

diversos problemas.

Para completar la información presentada aquí y reforzar lo aprendido, realiza lo siguiente:

1. Revisa el archivo Actividad 3 Prueba de hipótesis. Ahí encontrarás ejercicios sobre

pruebas de hipótesis e intervalos de confianza y determina la relación existente entre

ambos.

2. Consulta a tu Facilitador(a) y a tus compañeros(as) en caso de tener alguna duda.

3. Integra en un archivo las soluciones a los ejercicios una vez que estés seguro de que

no hay errores y súbelo a la plataforma.

4. Después de desarrollar los puntos que se solicitan, envía tu documento a la sección de

tareas, con la nomenclatura EISP_U2_A3_XXYZ, y espera la retroalimentación del

Facilitador(a).

*Consulta la rúbrica de evaluación para conocer los criterios que serán tomados en cuenta

al momento de calificar tu trabajo.

Page 36: Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población

Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública

36

Actividad 4. Problemario

El objetivo de esta actividad es que pongas a prueba los conocimientos adquiridos durante

el curso resolviendo ejercicios asociados con cada uno de los temas y subtemas.

Para completar esta actividad realiza lo siguiente:

1. Revisa el archivo Actividad 4. Problemario. Ahí encontrarás ejercicios sobre pruebas

de hipótesis para la media y la proporción, así como para los intervalos de confianza

correspondientes.

2. Resuelve cuidadosamente cada uno de los problemas según vayas avanzando en el

curso.

3. Consulta a tu Facilitador(a) y a tus compañeros(as) en caso de tener alguna duda.

4. Integra en un archivo las soluciones a los ejercicios una vez que estés seguro de que

no hay errores y súbelo a la plataforma.

5. Después de desarrollar los puntos que se solicitan, envía tu documento a la sección de

tareas, con la nomenclatura EISP_U2_A4_XXYZ, y espera la retroalimentación del

Facilitador(a).

*Consulta la rúbrica de evaluación para conocer los criterios que serán tomados en cuenta

al momento de calificar tu trabajo.

Autoevaluación

Con la finalidad de realizar un ejercicio de repaso acerca de los conceptos más

importantes estudiados en la unidad, resuelve el ejercicio de autoevaluación que se

encuentra en la pestaña de la unidad.

Page 37: Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población

Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública

37

Evidencia de aprendizaje. Resolución de ejercicios sobre pruebas de

hipótesis e intervalos de confianza

La evidencia de aprendizaje tiene como propósito que integres todas tus actividades como

portafolio.

1. Revisa el archivo EA. Resolución de ejercicios sobre pruebas de hipótesis e intervalos

de confianza. Ahí encontrarás ejercicios sobre pruebas de hipótesis e intervalos de

confianza.

2. Resuelve cuidadosamente cada uno de los problemas.

3. Consulta a tu Facilitador(a) y a tus compañeros(as) en caso de tener alguna duda.

4. Escribe las soluciones a los ejercicios, en un archivo de Word, una vez que estés

seguro de que no hay errores.

5. Envía tu documento a la sección de tareas, con la nomenclatura EISP_U2_EA_XXYZ,

y espera la retroalimentación del Facilitador(a).

*Consulta la rúbrica de evaluación para conocer los criterios que serán tomados en cuenta

al momento de calificar tu trabajo.

Actividades de Autorreflexión

Además de enviar tu trabajo de la Evidencia de aprendizaje, es importante que ingreses al

foro Preguntas de Autorreflexión y consultes las preguntas que tu Facilitador(a) presente.

A partir de ellas, debes:

1. Elaborar tu autorreflexión en un archivo de texto llamado EISP_U2_ATR_XXYZ.

2. Enviar tu archivo mediante la herramienta Autorreflexión.

Page 38: Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población

Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública

38

Cierre de la unidad

En la primera parte de la unidad hemos visto cómo se construye la metodología para hacer

inferencia sobre una población. Vimos cómo se genera una distribución muestral de

medias, estudiamos la manera de determinar los estadísticos que la caracterizan y la

forma en que estos se relacionan con sus parámetros correspondientes. También

conocimos una nueva distribución de probabilidad para muestras pequeñas, el significado

de estimador puntual y por intervalo, así como la metodología para encontrarlos.

En la segunda parte usamos los contenidos previos para el cálculo de los estimadores

puntual y por intervalo de la proporción.

Finalmente, conocimos la metodología para dar certeza a las hipótesis de investigación y

la usamos al realizar pruebas de hipótesis para la media y la proporción.

Con todo lo anterior, obtuvimos los conocimientos y herramientas necesarias que nos

permitirán comparar dos muestras poblacionales independientes para interpretar

información que oriente en la toma de decisiones a través de técnicas de estadística

inferencial.

Page 39: Unidad 2. Estadistica Inferencial Para Una Poblacion Vfff

Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población

Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública

39

Fuentes de consulta

Hoel, Paul G. (1991). Estadística Elemental (4ª edición). México: CECSA.

Kazmier, L. Díaz Mata, A. (2006). Estadística aplicada a administración y a la

economía (4ª edición). España: McGraw Hill.

Lind, Douglas A.; Mason, Robert D.; Marchal, William G. (2001). Estadística para

administración y economía (3ª edición). México: Mc. Graw Hill.

Lind, Douglas A.; Marchal, William G.; Whaten, Samuel A. (2008). Estadística

aplicada a los negocios y la economía (13ª edición). México: Mc. Graw Hill.

Mayes, Anne C., Mayes,, David G. (1980). Fundamentos de estadística para

economía (1ª edición). México: Limusa.

Naiman, A., Rosenfeld, R., Zirkel, G. (1987). Introducción a la Estadística (3ª

edición). México: McGraw Hill.

Nieves Hurtado, A., Domínguez Sánchez, F. C. (2010). Probabilidad y Estadística

para ingeniería. México: Mc. Graw Hill.

Pagano, R. R. (2011). Estadística para las ciencias del comportamiento (9ª

edición). México: Cengage Learning.

Ross, Sh. M. (2008). Introducción a la estadística. España: Editorial Reverté.

Fuentes cibergráficas

El problema de la estimación de la proporción de la población. Recuperado el 28 de

febrero de 2012, de:

http://www.terra.es/personal2/jpb00000/testimaciondelaproporcion.htm

Ruiz Martínez, Marcel. Pruebas de hipótesis. Recuperado el 28 de febrero de 2012

<http://marcelrzm.comxa.com/EstadisticaInf/33PruebaParaLaMedia.pdf>.

Test de Hipótesis. Recuperado el 28 de febrero de 2012, de:

http://sauce.pntic.mec.es/~jpeo0002/Archivos/PDF/T05.pdf

Alvarez Vinajeras, Giselle. Prueba de Hipótesis. Recuperado el 28 de febrero de

2012, de: http://www.cesma.usb.ve/~giselle/FC1623/guiaestiicapituloIV.prn.pdf