Estadistica inferencial
-
Upload
inmaculada-leiva-tapia -
Category
Education
-
view
1.502 -
download
10
description
Transcript of Estadistica inferencial
ESTADÍSTICA INFERENCIAL:
1)ESTIMACIÓN DE LA MEDIA. 2)ESTIMACIÓN DE LA PROPORCIÓN. 3)CONTRASTES DE HIPÓTESIS.
© Inmaculada Leiva Tapia IES Alborán
2
DISTRIBUCIÓN NORMAL: LA CAMPANA DE GAUSS
3
1 2 3 4 5 60
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0,16
0,18
1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 60
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0,16
0,18
11,33
1,672
2,332,67
33,33
3,674
4,334,67
55,33
5,676
0,0000
0,0200
0,0400
0,0600
0,0800
0,1000
0,1200
0,1400
11,25
1,51,75
22,25
2,52,75
33,25
3,53,75
44,25
4,54,75
55,25
5,55,75
6
0,0000
0,0050
0,0100
0,0150
0,0200
0,0250
0,0300
0,0350
0,0400
0,0450
0,0500
Las distribuciones de probabilidad correspondientes al promedio en el lanzamiento de 1,2,3 y 4 dados son,respectivamente:
Se observa que,cuantos más dados intervienen,más se parece la distribución de los promedios a la curva normal.Todas las distribuciones tienen la misma media (µ = 3,5).Cuantos más dados intervienen,menor desviación típica tiene la distribución (σ = 1,71/√n? )
1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 60
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0,16
0,18
4
El calificativo de “normal” para esta distribución se debe a la enorme frecuencia con que aparece en las situaciones más variadas. Entre las muchas variables que se distribuyen normalmente podemos citar:
Caracteres morfológicos: tallas,pesos,...Caracteres fisiológicos:efectos de una
misma dosis de un fármaco,niveles de glucemia,de colesterol,...Caracteres sociológicos: consumo de
ciertos productos por individuos de un mismo grupoCaracteres físicos: resistencia a la rotura
de piezas aparentemente idénticas,errores al medir reiteradamente una magnitud,....
Y,en general, cualquier característica que se obtenga como suma de muchos factores.
Por su forma acampanada,se denomina campana de Gauss (ya que fue descrita por el matemático alemán Carl Friedrich Gauss), curva de Gauss o curva normal.
DISTRIBUCIÓN NORMAL: LA CAMPANA DE GAUSS
5
N(µ,σ) Su media,mediana y moda coinciden en µGráfica simétrica respecto de la recta vertical x=µ Valor máximo en la media x=µTiene al eje OX como asíntota horizontalTiene inflexiones en los puntos de abscisas µ-σ
y µ+σ .El área bajo la curva vale 1.
Para la función de distribución (acumulativa) de unavariable aleatoria que sigue una N(0,1),se tiene que Φ(k) es el área encerrada por la gráfica de la normal y el eje OX, desde -∞ hasta k :
Φ(k) = P(z ≤ k) = área bajo la curva normal,a la izquierda de k.
Para cada valor de µ (media) y cada valor de σ (desviación típica) hay una curva normal que se representa por N(µ,σ). La campana de Gauss o curva normal, es una función de probabilidad continua,simétrica cuyo máximo coincide con la media µ
Características de la N(µ,σ):
6
Sin embargo,el reparto de probabilidades en las curvas normales es idéntico,y sólo depende de los parámetros µ y σ.
Mayor desviación típica σ (mayor dispersión) → curva más aplanada.Menor desviación típica σ (menor dispersión) → curva más alargada.
COMPARANDO DISTRIBUCIONES NORMALES
7
Tienen especial interés los siguientes intervalos:
El 99,8 % de los valores de la poblaciónse desvían de la media en menos de 3 veces la desviación típica σ.
El 96 % de los valores de la poblaciónse desvían de la media en menos de2 veces la desviación típica σ.
El 68 % de los valores de la poblaciónse desvían de la media en menos de 1 vez la desviación típica σ.
El 99,99 % de los valores de la poblaciónse desvían de la media en menos de 4 veces la desviación típica σ.
8
PracticaVeamos el reparto de probabilidades en las curvas normales,yalgunos intervalos más usuales .
PROBABILIDADES EN DISTRIBUCIONES NORMALES
9
En conclusión todas las distribuciones normales son similares,y por ello se puede utilizar una de ellas como modelo.Esta será la distribución normal estándar N(0,1), es decir,aquellaque tiene media 0 y desviación típica 1.Las probabilidades asociadas a la normal estándar,están tabuladaspara valores positivos y menores de 4.
10
PROBABILIDADES EN LA
NORMAL ESTÁNDAR N(0,1)
11
z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,090,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,53590,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,57530,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,61410,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,65170,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,68790,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,72240,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,75490,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,78520,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,81330,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,83891,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,86211,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,88301,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,90151,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,91771,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,93191,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,94411,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,95451,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,96331,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,97061,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,97672,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,98172,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,98572,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,98902,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,99162,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,99362,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,99522,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,99642,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,99742,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,99812,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,99863,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,99903,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,99933,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,99953,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,99973,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,99983,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,99983,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,99993,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,99993,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,99993,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
TABLA DE LA NORMAL ESTÁNDAR
Para la función de distribución (acumulativa) de unavariable aleatoria que sigue una N(0,1),se tiene que Φ(k) es el área encerrada por la gráfica de la normal y el eje OX, desde -∞ hasta k :
Φ(k) = P(z ≤ k) = área bajo la curva normal,a la izquierda de k.
En la tabla sólo aparecen las probabilidades P(z ≤ k) para valores de k entre 0 y 4, pudiendo variar k de centésima en centésima,y aproximando dichas probabilidades hasta las diezmilésimas. La tabla tiene un doble uso: directo( dado k, hallar la probabilidad P) e inverso (dada la probabilidad P, hallar k)
Φ(k)=
12
z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,090,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,53590,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,57530,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,61410,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,65170,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,68790,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,72240,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,75490,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,78520,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,81330,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,83891,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,86211,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,88301,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,90151,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,91771,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,93191,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,94411,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,95451,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,96331,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,97061,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,97672,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,98172,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,98572,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,98902,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,99162,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,99362,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,99522,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,99642,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,99742,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,99812,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,99863,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,99903,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,99933,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,99953,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,99973,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,99983,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,99983,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,99993,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,99993,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,99993,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
k = 0.26 Φ(0.26) = P(z < 0.26) = ?Φ(0.26) = P(z < 0.26 ) = 0.6026
13
z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,090,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,53590,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,57530,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,61410,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,65170,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,68790,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,72240,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,75490,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,78520,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,81330,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,83891,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,86211,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,88301,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,90151,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,91771,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,93191,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,94411,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,95451,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,96331,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,97061,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,97672,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,98172,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,98572,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,98902,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,99162,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,99362,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,99522,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,99642,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,99742,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,99812,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,99863,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,99903,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,99933,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,99953,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,99973,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,99983,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,99983,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,99993,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,99993,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,99993,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
Φ(k) = P(z < k ) = 0.9875k = 2.24 Φ(2.24) = P(z < 2.24) = 0.9875
14
Por ser una función de probabilidad,el área total bajo la curva es 1.
ɸ(3) = P(z < 3) = 0,9987ɸ(3,5) = P(z < 3,5) = 0,9998ɸ(3,9) = P(z < 3,9) = 1,0000
Observa en la tabla:
P(-∞ < z <+∞) = 1
1) Área total bajo la curva
Pero en la normal no seránecesario recurrir a valores tan alejados de la media.
Un valor cualquiera z está en el intervalo ( -∞,+∞) en el 100% de los casos.
15
Por ser simétrica la curva respecto del eje OY, el área a la izquierda de 0 y el área a la derecha de 0, tienen el mismo valor, que será la mitad del área total 1.
2) Áreas a izquierda y derecha del origen
16
Si k es positivo , P(z < k) representa el área que queda a la izquierda de k, comprendida entre la curva normal estándar y el eje de abscisas.
ɸ(k) = P(z < k) = [ área bajo la curva normal,a la izquierda de k ]
Se busca directamente en la tabla: ɸ(0,92) = P(z < 0,92) = 0,8212
3) Área a la izquierda de abscisas positivas
Practica
17
Si k es positivo, P(z > k) representa el área que queda a la derecha de k, comprendida entre la curva normal estándar y el eje de abscisas.
P(z > 0,69) = 1 – P(z < 0,69) = 1 – ɸ(0,69) = 1 – 0,7549 = 0,2451
P(z > k) = 1 - P(z < k) = 1 - ɸ(k) = [ área bajo la curva normal,a la derecha de k ]
4) Área a la derecha de abscisas positivas
Practica
18
Pero el área a la derecha esP(z > k) = 1 – ɸ(k)
P(z < -0,42) = P(z > 0,42) = 1 – P(z < 0,42) = 1 – ɸ(0,42) = 1 – 0,6628 = 0,3372
Si k es positivo,el área a la izquierda de la abscisa negativa P(z < -k) es,por simetría,igual que el área a la derecha de la abscisa opuesta positiva P(z > k)
5) Área a la izquierda de abscisas negativas
19
P(z < -0,42) = P(z > 0,42)
Si k es positivo, el área a la izquierda P(z < -k) espor simetría igual que el área a la derecha P(z > k)
Lo repetimos de nuevo,paso a paso:
5) Área a la izquierda de abscisas negativas Paso 1
20
Pero el área a la derecha esP(z > k) = 1 – ɸ(k)
P(z > 0,42) = 1 – P(z < 0,42)
5) Área a la izquierda de abscisas negativas Paso 2
21Buscamos en la tabla P(z < 0,42) = 0,66276
5) Área a la izquierda de abscisas negativas Paso 3
221 – P(z < 0,42) = 1 – ɸ(0,42) = 1 – 0,6628 = 0,3372
5) Área a la izquierda de abscisas negativas Paso 4
23
Si k es positivo, el área a la izquierda P(z < -k) es,por simetría, igual que el área a la derecha P(z > k).Por tanto,
P(z < -k) = P(z > k) = 1 – ɸ(k)
P(z < -0,42) = P(z > 0,42) = 1 – P(z < 0,42) = 1 – ɸ(0,42) = 1 – 0,6628 = 0,3372
Paso 55) Área a la izquierda de abscisas negativas
24P(z < 0,42) = ɸ(0,42) = 0,6628
6) Área a la derecha de abscisas negativas
Si k es positivo, el área a la derecha P(z > -k) es,por simetría,igual al área a la izquierda de k.Por tanto,
P(z > -k) = P(z < k) = ɸ(k)
P(z > -0.42) = P(z < 0,42) = ɸ(0,42) = 0,6628
25
7) Área en un intervalo
P(0,25 < z < 1,61) = P(1,61) - P(0,25) = 0,9463 – 0,5987 = 0,3476
Practica
El área comprendida en un intervalo [a,b],se calcula como diferencia entre el área a la izquierda de b (extremo superior) y el área a la izquierda de a (extremo inferior): P(a < z < b) = P(z < b) – P(z < a)
26
PROBABILIDADES EN UNA NORMAL GENERALIZADA N(µ,σ)
27
Tipificación de la variable
Practica
Medimos en cuántas desviaciones típicas se separaun valor x de la variable normal,de su media:
28
Intervalos característicos asociados a una probabilidad en N(0,1)
29
Intervalos característicos asociados a una probabilidad en N(μ,σ)
El área dentro del intervalo es p = 1 - α.El área fuera del intervalo,corresponde a dos colas simétricas;el valor de cada una es α/2.
30
Intervalos característicos asociados a una probabilidad Paso 1
31
Intervalos característicos asociados a una probabilidad Paso 2
32
Intervalos característicos asociados a una probabilidad Paso 3
33
Intervalos característicos asociados a una probabilidad Paso 4
Practica
34
Intervalos característicos asociados a una probabilidad Paso 5
Practica
35
DISTRIBUCIÓN DE LAS MEDIAS MUESTRALES. TEOREMA CENTRAL DEL LÍMITE.APLICACIONES.
36Practica
37
1 2 3 4 5 60
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0,16
0,18
1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 60
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0,16
0,18
11,33
1,672
2,332,67
33,33
3,674
4,334,67
55,33
5,676
0,0000
0,0200
0,0400
0,0600
0,0800
0,1000
0,1200
0,1400
11,25
1,51,75
22,25
2,52,75
33,25
3,53,75
44,25
4,54,75
55,25
5,55,75
6
0,0000
0,0050
0,0100
0,0150
0,0200
0,0250
0,0300
0,0350
0,0400
0,0450
0,0500
Las distribuciones de probabilidad correspondientes al promedio en el lanzamiento de 1,2,3 y 4 dados son,respectivamente:
Se observa que,cuantos más dados intervienen,más se parece la distribución de los promedios a la curva normal.Todas las distribuciones tienen la misma media (µ = 3,5).Cuantos más dados intervienen,menor desviación típica tiene la distribución (σ = 1,71/√n? )
1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 60
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0,16
0,18
38
Teorema central del límite
Practica
39
El teorema es válido cualquiera que sea la distribución de partida,tanto si es discreta como si es continua.
Si la población de partida es normal,entonces también lo será la distribución de las medias muestrales,independientemente del tamaño n de la muestra.
Aunque la población de partida no sea normal,la distribución de medias muestrales puede ser a veces muy similar a la normal,incluso para valores pequeños de n (por ejemplo,al promediar el resultado obtenido al lanzar varios dados).
Para n ≥30 (“muestras grandes”) es seguro que se consigue una gran aproximación a la normal,cualquiera que sea la distribución de partida.
Observaciones sobre el TCL
40
Consecuencias del TCL
41
Control de las medias muestrales
42
Control de la suma de todos los individuos de la muestra
Practica
43
ESTADÍSTICA INFERENCIAL:
1)ESTIMACIÓN DE LA MEDIA. 2)ESTIMACIÓN DE LA PROPORCIÓN. 3)CONTRASTES DE HIPÓTESIS.
44
La Estadística inferencial tiene dos grandes ramas:
La Estadística inductiva:
su objeto es la estimación de parámetros de la población,conociendo el valor del correspondiente parámetro en una muestra.
La Estadística hipotético-deductiva:
su objeto es el contraste de hipótesis que consiste en decidir si aceptar o rechazar hipótesis realizadas sobre parámetros de una población,contrastándolas con el valor obtenido de dicho parámetro en una muestra concreta,extraída aleatoriamente de la población (y que se obtiene después de realizado el test de hipótesis). A esta rama de la Estadística se le llama también teoría de la decisión.
Estadística inferencial
La Estadística inferencial es una parte de la estadística que comprende los métodos y procedimientos para deducir propiedades de una población estadística, a partir del conocimiento de una pequeña parte de la misma (muestra). Los resultados así obtenidos siempre tienen cierto grado de incertidumbre, que se mide en términos de probabilidad (y, a veces, de porcentaje).
45
ESTIMACIÓN POR INTERVALOS
46
A partir de una muestra aleatoria de tamaño n, podemos estimar el valor de un parámetro de la población del siguiente modo: Dando un intervalo dentro del cual confiamos que esté el parámetro: intervalo de confianza. Hallando la probabilidad de que tal cosa ocurra: nivel de confianza.
La eficacia de una estimación se mide de dos formas: Con el tamaño del intervalo de confianza ( intervalo más pequeño → mayor precisión) Con el nivel de confianza ( mayor nivel de confianza → más seguridad )
Estimación mediante intervalos
Las tres variables que intervienen en los problemas de estimación son: n = tamaño de la muestra E = error máximo admisible (siempre se fijan dos de ellas y se halla la tercera) (1 – α) = nivel de confianza
Haremos estimaciones de la media y de la proporción de una población.
47
ESTIMACIÓN DE LA MEDIA
48
Intervalo de confianza para estimación de la media
Se desea estimar la media μ de una población x con desviación típica σ conocida. Se toma una muestra aleatoria de tamaño n, de la que se obtiene la media muestral x .
Si la población x es N(μ σ), o bien si n ≥ 30, el intervalo de confianza para la estimación de μ,con un nivel de confianza de (1 – α) ·100% es el intervalo simétrico centrado en x ( x – E, x + E) = ( x - zα/2 ·σ/√n , x + zα/2 ·σ/√n ) en el que P( x – E < μ < x + E ) = 1 – α.
E = zα/2 ·σ/√n se llama error máximo admisible ( semiamplitud o radio del intervalo de confianza). Depende de (1 – α) y de n del siguiente modo:
cuanto mayor es n (aumenta tamaño de la muestra), menor es E (intervalo más pequeño) → estimación más precisa
cuanto mayor sea (1 – α), (aumenta la seguridad), mayor es E (intervalo más grande) → estimación menos precisa
49
Relación entre nivel de confianza,error y tamaño de la muestra
La fórmula E = zα/2 ·σ/√n relaciona las tres variables. Siempre se fijan dos de ellas,y se calcula la tercera; por ello hay tres tipos de ejercicios:
Conocidos (1 – α) , n ==> E ?
Conocidos (1 – α) , E ==> n ? Conocidos E , n ==> (1 – α) ?
50
Intervalo de confianza para estimación de la media:1) Hallar el error máximo admisible E
51
Intervalo de confianza para estimación de la media:2) Hallar el tamaño n de la muestra
52Practica
Intervalo de confianza para estimación de la media:3) Hallar el nivel de confianza (1 - α)
53
DISTRIBUCIÓN BINOMIAL
54
Si en una experiencia aleatoria,nos interesa únicamente un suceso A,y aceptamos como únicos resultados que ocurra A o que no ocurra A(con lo cual ocurre su contrario A'), diremos que la experiencia es dicotómica.
Al suceso A se le llama éxito y a su probabilidad P(A) = p Para el suceso contrario A',su probabilidad es P(A') = q = 1 – p
Se repite n veces una experiencia dicotómica. Sea x el número de éxitos (nº veces que ocurre A).Entonces x es una variable discreta que toma los valores 1,2,3,.....,n. La distribución de probabilidad de x se llama distribución binomial B(n,p). La probabilidad de que x tome el valor k viene dada por
P x=k = nk pk · qn−k
Los parámetros de esta distribución son: media μ = np ; desviación típica σ = √npq
Distribución binomial
55
Aproximación de la binomial a la normal
Si np ≥ 5 y nq ≥ 5, entonces la binomial se aproxima de forma casi perfecta a una curva normal con la misma media y desviación típica que la binomial de partida:
np ≥ 5 y nq ≥ 5 ==> B(n,p) ≈ N(np ,√npq)
56
DISTRIBUCIÓN DE LAS PROPORCIONES MUESTRALES
57
Sea una población donde p es la proporción de individuos que posee una determinada característica C.Tomamos muestras del mismo tamaño n.En cada una de esas muestras habrá una proporción pr de individuos con C.¿Cómo se distribuye la variable pr?
Distribución de las proporciones muestrales
Demostración: Si x = nº individuos en cada muestra de tamaño n con la característica C, x es B(n,p). Si además np ≥ 5 y nq ≥ 5,entonces: x es B(n,p) ≈ N(np ,√npq). Si pr = proporción de individuos de la muestra con la característica C,entonces pr = x/n y,por tanto,la distribución de pr es como la de x,pero con los parámetros media y desv. típica divididos por n: pr es N(np/n ,√npq/n) = N(p ,√pq/n)
PROPOSICIÓN:si np ≥ 5 y nq ≥ 5, entonces la proporción pr de individuos con la característica C en las muestras de tamaño n,es una variable estadística que sigue una distribución normal de media p y de desviación típica √pq/n: np ≥ 5 y nq ≥ 5 ==> pr es N(p ,√pq/n )
58
Control de las proporciones muestrales
59
ESTIMACIÓN DE LA PROPORCIÓN
60
Intervalo de confianza para estimación de la proporción
Se desea estimar la proporción p de individuos de una población con una característica C. Se toma una muestra aleatoria de tamaño n,y se obtiene en ella la proporción muestral pr.
Si n·p ≥ 5 y n·q ≥ 5,y además la muestra es grande (n ≥ 30), entonces el intervalo de confianza para la estimación de la proporción p en la población,con un nivel de confianza de (1 – α) ·100% , es el intervalo simétrico centrado en pr:
( pr – E, pr + E) = ( pr - zα/2 ·√pr·(1-pr)/n , pr + zα/2 ·√pr·(1-pr)/n )
en el que se cumple que P( pr – E < p < pr + E ) = 1 – α.
La fórmula E = zα/2 ·√pr·(1-pr)/n relaciona las tres variables. Siempre se fijan dos de ellas,y se calcula la tercera;por ello hay tres tipos de ejercicios:
Conocidos (1 – α) , n ==> E ?
Conocidos (1 – α) , E ==> n ? Conocidos E , n ==> (1 – α) ?
61
Intervalo de confianza para estimación de la proporción: 1) Hallar el error máximo admisible E
62
Intervalo de confianza para estimación de la proporción:2) Hallar el tamaño n de la muestra
63
Intervalo de confianza para estimación de la proporción:3) Hallar el nivel de confianza (1 - α)
Practica
64
CONTRASTES DE HIPÓTESIS
65
Enunciación: de las hipótesis nula H0 y alternativa H1.
Deducción de conclusiones: suponiendo cierta la hipótesis nula H0 , el parámetromuestral (media x o proporción pr ,de las muestras),se distribuye mediante una normal con parámetros conocidos.Entonces,se elige un nivel de significación α y se construye la zona de aceptación,que es el intervalo (o semirrecta) fuera del cual sólo se encuentran el α·100% de los casos“raros” de la población.
Verificación: se extrae ahora una muestra de tamaño n, y en ella se calcula el parámetromuestral.
Decisión: si el valor del parámetro muestral obtenido cae dentro de la zona de aceptación, se acepta la hipótesis nula con un nivel de significación α. En caso contrario,se rechaza la hipótesis nula y se acepta la alternativa.
Hay dos tipos de contrastes: bilateral y unilateral.
Pasos para efectuar un contraste de hipótesis:
66
Contrastes de hipótesis para la media (bilateral)
67
Contrastes de hipótesis para la media (unilateral,a la izquierda)
68
Contrastes de hipótesis para la media (unilateral,a la derecha)
69
Contrastes de hipótesis para la proporción (bilateral)
70
Contrastes de hipótesis para la proporción(unilateral,a la izquierda)
71
Contrastes de hipótesis para la proporción(unilateral,a la derecha)
72© Inmaculada Leiva Tapia IES Alborán
FIN