Cálculo y EstadísTICa. Primer...

20
Cálculo y EstadísTICa. Primer Semestre. EstadísTICa Curso Primero Graduado en Geomática y Topografía Escuela Técnica Superior de Ingenieros en Topografía, Geodesia y Cartografía. Universidad Politécnica de Madrid Capítulo IV DISTRIBUCIONES CONTINUAS NOTABLES. Manuel Barrero Ripoll. Mª Ángeles Castejón Solanas. Mª Luisa Casado Fuente. Luis Sebastián Lorente. Departamento de Ingeniería Topográfica y Cartografía Universidad Politécnica de Madrid

Transcript of Cálculo y EstadísTICa. Primer...

Page 1: Cálculo y EstadísTICa. Primer Semestre.asignaturas.topografia.upm.es/matematicas/Estadistica/...4.5.1 Propiedades de la Distribución Chi-Cuadrado de n grados de libertad 4.5.2 Las

Cálculo y EstadísTICa. Primer Semestre. EstadísTICa

Curso Primero Graduado en Geomática y Topografía

Escuela Técnica Superior de Ingenieros en Topografía, Geodesia y Cartografía.

Universidad Politécnica de Madrid

Capítulo IV

DISTRIBUCIONES CONTINUAS NOTABLES.

Manuel Barrero Ripoll. Mª Ángeles Castejón Solanas.

Mª Luisa Casado Fuente. Luis Sebastián Lorente.

Departamento de Ingeniería Topográfica y Cartografía

Universidad Politécnica de Madrid

Page 2: Cálculo y EstadísTICa. Primer Semestre.asignaturas.topografia.upm.es/matematicas/Estadistica/...4.5.1 Propiedades de la Distribución Chi-Cuadrado de n grados de libertad 4.5.2 Las

2-IV Escuela Técnica Superior de Ingenieros en Topografía Geodesia y Cartografía

Page 3: Cálculo y EstadísTICa. Primer Semestre.asignaturas.topografia.upm.es/matematicas/Estadistica/...4.5.1 Propiedades de la Distribución Chi-Cuadrado de n grados de libertad 4.5.2 Las

IV DISTRIBUCIONES CONTINUAS NOTABLES

4 Distribuciones continuas.

4.1 Distribución Uniforme 4

4.2 Distribución exponencial 5

4.2.1 Propiedades

4.2.2 La función de Excel para la Distribución Exponencial. Exp(λ).

4.3 Distribución Normal 7

4.3.1 Definición

4.3.2 Propiedades de f(x)

4.3.3 Distribución Normal Estandar

4.3.4 Las funciones de Excel para la Distribución Normal

4.3.5 Resumen de funciones de Excel

4.4 Normalidad. Métodos descriptivos 12

4.4.1 Ajuste de una distribución experimental mediante una Distribución Normal

4.5 Distribución 2χ de Pearson 14

4.5.1 Propiedades de la Distribución Chi-Cuadrado de n grados de libertad

4.5.2 Las funciones de Excel para la Distribución Chi-Cuadrado

4.6 Distribución t_Student 16

4.6.1 Propiedades básicas de la distribución t_Student

4.6.2 Las funciones de Excel para la distribución t_Student

4.7 Distribución Fisher_Snedecor 18

4.7.1 Propiedades de la distribución de Fisher-Snedecor

4.7.2 Las funciones de Excel para la distribución de Fisher-Snedecor

Universidad Politécnica de Madrid 3-IV

Page 4: Cálculo y EstadísTICa. Primer Semestre.asignaturas.topografia.upm.es/matematicas/Estadistica/...4.5.1 Propiedades de la Distribución Chi-Cuadrado de n grados de libertad 4.5.2 Las

4-IV Escuela Técnica Superior de Ingenieros en Topografía Geodesia y Cartografía

4.1 Distribución Uniforme. U( a, b ) Sea X una variable aleatoria que toma valores en el intervalo real [ ]a, b . Decimos que X sigue

una distribución uniforme U(a, b) cuando su función de densidad es:

ab −1

a b

( )1 si a x b

f x b a0 en otro caso

⎧ ≤ ≤⎪= −⎨⎪⎩

Función de densidad de la v.a. U(a,b).

Figura 4.1.1

La función de distribución de la variable U(a, b) y su gráfica son por tanto

( ) ( )

0 si x ax-aP X x F x si a x bb-a1 si b x

<⎧⎪⎪≤ = = ≤ ≤⎨⎪

<⎪⎩

b a

1

Función de distribución de la v.a. U(a,b)

Figura 4.1.2

La media y varianza de la variable aleatoria X U(a, b)∈ son:

[ ] a bE X2+

μ = = [ ] ( )22 b a

V X12−

σ = =

Ejemplo. De una estación parte un tren cada 10 minutos. Si designamos por X la variable aleatoria “tiempo de espera desde que un viajero entra en el andén hasta que parte”, calcular:

- La función de densidad de X. - La probabilidad de esperar menos de dos minutos. - El tiempo medio de espera. - La probabilidad de esperar dos minutos y medio.

Si el viajero llega en cualquier momento y todos los momentos tienen la misma probabilidad, la variable aleatoria tiempo de espera sigue una distribución U(0,10).

- Por tanto, la función de densidad de la variable X es

1 si 0 x 10 f (x) 10

0 en otro caso

⎧ ≤ ≤⎪= ⎨⎪⎩

- La probabilidad de esperar menos de dos minutos será: 2

0

1 2P(X 2) dx 0.210 10

< = = =∫

- El tiempo medio de espera es [ ] 10E X 52

μ = = = minutos.

[email protected]

Page 5: Cálculo y EstadísTICa. Primer Semestre.asignaturas.topografia.upm.es/matematicas/Estadistica/...4.5.1 Propiedades de la Distribución Chi-Cuadrado de n grados de libertad 4.5.2 Las

IV DISTRIBUCIONES CONTINUAS NOTABLES

- Si el reloj aprecia hasta los segundos, el viajero espera dos minutos y medio si el tren

llega entre 2,29 y 2.31 minutos, por tanto 2.31

2.29

1P(2.29 x 2.31) dx 0.00210

< < = =∫ .

4.2 Distribución Exponencial. Exp(λ) La variable aleatoria exponencial describe frecuentemente el tiempo (o espacio) entre sucesos consecutivos de Poisson, donde λ representa el número de sucesos de Poisson por unidad de tiempo (o espacio). Una variable aleatoria continua X que toma valores no negativos sigue una distribución exponencial de parámetro λ>0 cuando su función de densidad es:

xf (x) e−λ= λ con x >0

λ=1 λ=3 λ=5

λ=10

Figura 4.2.1 Su función de distribución es:

( ) [ ]x

t x

0

F x P X x e dt 1 e−λ −= ≤ = λ = −∫ λ , con x 0>

4.2.1 Propiedades

- La media y la varianza de la variable aleatoria exponencial son:

[ ] t

0

1E X x e dt∞

−λμ = = λ =λ∫ ; [ ]

2 22 t

20

1 1V X E x x e dt∞

−λ⎡ ⎤⎛ ⎞ ⎛ ⎞σ = = − = − λ =⎢ ⎥⎜ ⎟ ⎜ ⎟

1λ λ λ⎝ ⎠ ⎝ ⎠⎢ ⎥⎣ ⎦

- Se dice que la distribución exponencial no tiene memoria. Para cualquier valor de

a>0 y de b>0 se verifica:

( ) ( )( )

P X a X a bX a bP X a P X a> > +> + => >∩ ( )

( )a b

ba

e e P X be

−λ +−λ

−λ= = = > .

Ejemplo. El tiempo de reparación de cierta avería mecánica tiene una distribución exponencial de media 50 minutos.

a) Calcular la probabilidad de que el tiempo de reparación sea menor que 40 minutos. [email protected]

Universidad Politécnica de Madrid 5-IV

Page 6: Cálculo y EstadísTICa. Primer Semestre.asignaturas.topografia.upm.es/matematicas/Estadistica/...4.5.1 Propiedades de la Distribución Chi-Cuadrado de n grados de libertad 4.5.2 Las

6-IV Escuela Técnica Superior de Ingenieros en Topografía Geodesia y Cartografía

b) Si el coste de mano de obra es de 50 euros por hora y se factura por intervalos de 10 minutos. ¿Cuál es la probabilidad de que una reparación cueste 100 euros?

Si definimos una variable aleatoria T que representa el tiempo (en minutos) de reparación y T

sigue una distribución exponencial de media 1 50μ = =λ

entonces, su función de densidad es:

( )1 t501f t e , t>0

50−

= .

a) La probabilidad de que un tiempo de reparación sea menor de 40 minutos es:

( )40 1 t

50

0

1P t 40 F(40) e dt 0.5506750

−< = = ≈∫

b) Una reparación costará 100€ cuando la duración de la reparación sea mayor que 110’ y menor que 120’. Así pues:

( )120 1 t

50

110

1P 110 t 120 F(120) F(110) e dt 0.0200950

−< < = − = ≈∫

4.2.2 La función de Excel para la Distribución Exponencial. Exp(λ).

En Excel, existe una función para el cálculo de F(x) = )xX(P ≤ en una distribución Exp(λ): “DISTR.EXP(x;λ;1)” siendo x el valor de la variable y λ el parámetro de la distribución. Veamos con un ejemplo la forma de utilizar esta función. En una distribución exponencial de parámetro λ=0.1 calcular el valor de P(X 2)≤ . Pulsando el botón insertar función y en este caso al resaltar de la categoría “Estadísticas” con la opción “DISTR.EXP” se despliega una ventana como la de la figura 4.2.2, donde debemos rellenar el valor de la variable (x > 0) de la cual se desea conocer su probabilidad, el valor del parámetro (λ > 0) y en “acum” escribimos el valor uno para obtener la probabilidad, o un “0” para obtener el valor de la ordenada de ( f(x) ) para el valor x dado.

P(X 2) 0.18127≤ =

Figura 4.2.2 [email protected]

Page 7: Cálculo y EstadísTICa. Primer Semestre.asignaturas.topografia.upm.es/matematicas/Estadistica/...4.5.1 Propiedades de la Distribución Chi-Cuadrado de n grados de libertad 4.5.2 Las

IV DISTRIBUCIONES CONTINUAS NOTABLES

4.3 Distribución Normal. ( )N ,μ σLa distribución normal es el modelo más utilizado e importante de la teoría estadística moderna. Existen multitud de experimentos cuyos resultados se ajustan a esta distribución.

4.3.1 Definición. Una variable aleatoria X sigue una distribución normal de parámetros µ y

σ que representamos de forma abreviada por ( )N ,μ σ , si y sólo si, su función de densidad es:

( )22

x121f (x) e

2

−μ−

σ=σ π

, con x−∞ < < ∞ ; −∞ <μ <∞ y . 0σ >

4.3.2 Propiedades de f(x). Existe una serie de propiedades básicas que debemos conocer acerca de la función de densidad y de la función de distribución de una variable aleatoria normal:

• 1. La función de densidad es no negativa ( ( )f x 0≥ ).

• 2. El área encerrada por f(x) y el eje X es la unidad ( f (x)dx 1∞

−∞

=∫ ).

• 3. La función f(x) tiene la asíntota horizontal y=0 .

• 4. Por ser una función exponencial f (x) es una función continua en x−∞ < < ∞ .

• 5. Es una función simétrica respecto de la recta x = μ ; ( ( ) (f x f x )μ + = μ − .

• 6. Existe un omáximo en x M=μ = .

• 7. En los valores x existe un punto de inflexión=μ±σ .

• 8. La media es el propio parámetro μ ;

[ ]E x xf (x)dx∞

−∞

= =∫2

2(x )

21 xe dx2

−μ∞ −σ

−∞

= μσ π ∫

• 9. La desviación típica es el parámetro σ ;

[ ] ( )2 2V x x f (x)dx∞

−∞

= −μ =∫ σ , por tanto la desviación típica es σ .

• 10. De las propiedades 8 y 9 se deduce que la función de densidad de una distribución normal queda perfectamente determinada conocidos los valores de μ y σ.

• 11. De las propiedades 5 y 6 se deduce que oM M= μ = .

• 12. La función de distribución de la variable aleatoria X N( , )∈ μ σ es:

( )( )2

2tx21F x P(X x) e dt

2

−μ−

σ

−∞

= ≤ =σ π∫

Universidad Politécnica de Madrid 7-IV

[email protected]

Page 8: Cálculo y EstadísTICa. Primer Semestre.asignaturas.topografia.upm.es/matematicas/Estadistica/...4.5.1 Propiedades de la Distribución Chi-Cuadrado de n grados de libertad 4.5.2 Las

8-IV Escuela Técnica Superior de Ingenieros en Topografía Geodesia y Cartografía

• 13 La forma de la función de densidad puede observarse en la figura (4.3.1).

Figura 4.3.1

• 14. En las siguientes figuras podemos observar cómo cambia la gráfica de la función de densidad f(x) según los valores de σ y µ.

Normales con diferente media e igual varianza. μ=0,1,2 y σ=1.

Normales con igual media y diferente varianza. μ=1 fija y σ=1,2,3.

Figura 4.3.2

• 15. La combinación lineal de variables aleatorias normales e independientes es una variable aleatoria normal.

Si X1~ , X2 ~ ,…, Xn ~1 1N( , )μ σ 2 2N( , )μ σ n nN( , )μ σ son independientes, entonces:

X= 1 2X X ... X± ± ± n ( )2 2 21 2 n 1 2 nN ... , ...≈ μ ±μ ± ±μ σ +σ + +σ .

[email protected]

Page 9: Cálculo y EstadísTICa. Primer Semestre.asignaturas.topografia.upm.es/matematicas/Estadistica/...4.5.1 Propiedades de la Distribución Chi-Cuadrado de n grados de libertad 4.5.2 Las

IV DISTRIBUCIONES CONTINUAS NOTABLES

4.3.3 Distribución Normal Estandar. N(0,1). Si X es una variable aleatoria N(μ, σ),

entonces, la variable aleatoria xZ −μ=

σ es una distribución normal de media μ=0 y

desviación típica σ=1, por tanto, su función de densidad viene dada por:

( )21 z

21f z e2

−=

π y z− ∞ < < ∞ .

En efecto,

[ ] [ ] [ ]x 1E z E E x E 0=μ =μ

⎛ ⎞−μ⎡ ⎤= = − μ⎜ ⎟⎢ ⎥σ σ⎣ ⎦ ⎝ ⎠=

[ ] [ ]2

x 1V z V V x−μ⎡ ⎤= = −μ =⎢ ⎥σ σ⎣ ⎦[ ] [ ]

22

0

1 V x V 1==σ

⎛ ⎞+ μ =⎜ ⎟σ ⎝ ⎠

.

Este cambio de variable, XZ −μ=

σ resultado de aplicar una traslación y un cambio de escala

a la variable X, se le denomina tipificación de la variable. 4.3.4 Las funciones de Excel para la distribución normal. Mediante Excel, podemos utilizar dos formas distintas para obtener la probabilidad de un valor en una variable normal:

• Distribución Normal Estándar: . )1,0(NX ≈

• Distribución Normal: . ),(NX σμ≈

La diferencia radica en cómo debemos ingresar los datos, y es por ello, por lo que utilizamos ejemplos aclaratorios. Ejemplo. Calcular P(Z 2.5)≤ en una distribución N(0,1). En este caso al resaltar de la categoría “Estadísticas” la opción “DISTR.NORM.ESTAND” se despliega una ventana en la que debemos rellenar el valor de la variable z del cual se desea conocer su probabilidad.

P(X 2.5)≤

Figura 4.3.3 [email protected]

Universidad Politécnica de Madrid 9-IV

Page 10: Cálculo y EstadísTICa. Primer Semestre.asignaturas.topografia.upm.es/matematicas/Estadistica/...4.5.1 Propiedades de la Distribución Chi-Cuadrado de n grados de libertad 4.5.2 Las

10-IV Escuela Técnica Superior de Ingenieros en Topografía Geodesia y Cartografía

Otra forma de proceder es escribir directamente la función Excel: =DISTR.NORM.ESTAND(2,5)

P(Z 2.5) 0.9937903≤ = Figura 4.3.4

Ejemplo. Calcular P(X 2.5)≤ en una distribución N(2,3). En este caso existen dos posibilidades de calcular la probabilidad.

• 1º Tipificamos la variable y procedemos de la forma anterior.

• 2º Directamente con la ventana o función “DISTR.NORM(µ,σ)”. Veamos la primera forma, en este caso debemos calcular primero el valor tipificado Z:

XZ −μ= ⇒

σ ( ) 2.5 2 1P X 2.5 P Z P Z

3 6−⎛ ⎞ ⎛ ⎞≤ = ≤ = ≤⎜ ⎟ ⎜ ⎟

⎝ ⎠ ⎝ ⎠

Por tanto

1F 0.566186

⎛ ⎞ =⎜ ⎟⎝ ⎠

FUNCIÓN

Figura 4.3.5

Si procedemos directamente utilizando la ventana de diálogo de la función “DISTR:NORM”, esta ventana nos solicita, el valor de la variable del cual deseamos conocer su probabilidad y los parámetros de la distribución, es decir, media y desviación típica. Además, debemos poner un uno en la casilla “Acum” ya que en este caso deseamos calcular la probabilidad acumulada hasta 2.5.

)5.2X(P ≤

Figura 4.3.6 En el caso del problema inverso, es decir, hallar el valor de la variable aleatoria (percentil) a partir de la probabilidad del valor buscado, conocidas la media y la desviación típica, también podemos elegir entre las dos siguientes alternativas: [email protected]

Page 11: Cálculo y EstadísTICa. Primer Semestre.asignaturas.topografia.upm.es/matematicas/Estadistica/...4.5.1 Propiedades de la Distribución Chi-Cuadrado de n grados de libertad 4.5.2 Las

IV DISTRIBUCIONES CONTINUAS NOTABLES

• “ =Distribución Normal Estándar Inversa”; Z N(0,1) ≈ .

• “ =Distribución Normal Inversa”; X N( , ) ≈ μ σ .

Como en el caso anterior la diferencia radica en como debemos ingresar los datos. Ejemplo. En una distribución N(0,1), hallar el valor de x que verifica . P(Z x) 0.5333≤ = FUNCIÓN

F(0.0835)=0.5333

Figura 4.3.7 Ejemplo. En una distribución N(2,3) hallar el valor de x que verifica . P(X x) 0.5333≤ =

La función Excel correspondiente en este caso es:

Universidad Politécnica de Madrid 11-IV

FUNCIÓN

x=2.25093 es el valor de la variable cuya probabilidad es 0.5333

=DISTR.NORM.INV(0,5333; 2; 3)

Figura 4.3.8 La ventana de dialogo correspondiente a la función DISTR.NORM.INV es: FUNCIÓN

0.5333)P(X =≤ x

Figura [email protected]

Page 12: Cálculo y EstadísTICa. Primer Semestre.asignaturas.topografia.upm.es/matematicas/Estadistica/...4.5.1 Propiedades de la Distribución Chi-Cuadrado de n grados de libertad 4.5.2 Las

12-IV Escuela Técnica Superior de Ingenieros en Topografía Geodesia y Cartografía

4.3.5 Resumen de funciones de EXCEL

Función Excel Sintaxis.

DISTR.NORM. X N ( , ) ≈ μ σF(x) P(X x)= ≤

DISTR.NORM(x; µ;σ;acum) x: valor de la variable. acum.= “1” para obtener F( . x) P(X x)= ≤Acum.= “0” para obtener la ordenada en x.

DISTR.NORM.ESTAND. Z N(0,1) ≈F(z) P(Z z)= ≤

DISTR.NORM.ESTAND(z) z: valor de la variable normalizada.

DISTR.NORM.INV. p P(X x)= ≤ DISTR.NORM.INV(p;µ;σ)

DISTR.NORM.ESTAND.INV. p P(Z z)= ≤ DISTR.NORM.ESTAND.INV(p).

Tabla 4.3.1

4.4 Normalidad. Métodos descriptivos Más adelante, harán inferencias estadísticas acerca de la población a partir de la información obtenida de una muestra. En la mayoría de las técnicas que estudiarán se supone que la muestra o muestras han sido obtenidas de una población normal. Por tanto, antes de aplicar dichas técnicas aprenderemos varios métodos descriptivos para verificar si los datos de la muestra proceden de una distribución aproximadamente normal.

• 1º Construimos un histograma de frecuencias relativas para los datos. Si los datos son aproximadamente normales, la gráfica será similar a la de la curva normal y simétrica respecto de la media.

• 2º Calculamos el intervalo intercuartílico y la desviación típica muestral, S, si los

datos son aproximadamente normales, entonces,

3 1Q Q 1,3S−

Estas verificaciones de normalidad son fáciles de aplicar y de gran utilidad, pero, sólo son métodos descriptivos. Es posible aunque poco probable, que los datos no sean normales aunque se verifiquen las condiciones anteriores. Así pues, con estos métodos sólo podemos decir que es razonable pensar que los datos provienen de una distribución normal. Existen métodos analíticos para el estudio de la normalidad y que estudiaran en otras asignaturas.

4.4.1 Ajuste de una distribución experimental con una distribución normal. Más adelante estudiaran que:

• Si la población es normal, la media muestral es el estimador centrado más eficiente de la

media poblacional ( ) X μ = .

[email protected]

Page 13: Cálculo y EstadísTICa. Primer Semestre.asignaturas.topografia.upm.es/matematicas/Estadistica/...4.5.1 Propiedades de la Distribución Chi-Cuadrado de n grados de libertad 4.5.2 Las

IV DISTRIBUCIONES CONTINUAS NOTABLES

• Si la población es normal, la varianza muestral o cuasivarianza es el estimador centrado más eficiente de la varianza de la población ( )2 2Sσ = .

• De los apartados anteriores se deduce que la distribución normal que mejor se aproxima

es aquella que tiene por media y varianza, X y , respectivamente. 2S

Población Muestra

Universidad Politécnica de Madrid 13-IV

Ejemplo. De un experimento se ha obtenido la siguiente distribución de frecuencias.

Si admitimos que se distribuye según una distribución normal, realizar el mejor ajuste para dicha distribución. Solución. Podemos observar que el polígono de frecuencias absolutas tiene la forma acampanada de una distribución normal. Si calculamos la media, la cuasivarianza y los cuartiles obtenemos:

X 5.01= ; S 12S 1.3= ;5 .16= ; 1Q 4.24= ; ; 3Q 5.7= 9por tanto

3 1Q Q 1.34S−

=

observamos que también se verifica la segunda condición de las dadas para aceptar la normalidad de la muestra y por tanto la distribución normal que mejor se ajusta es:

N(5.01, 1.16). [email protected]

x 0 a 1 1 a 2 2 a 3 3 a 4 4 a 5 5 a 6 6 a 7 7 a 8 8 a 9 9 a 10

in 1 4 19 91 202 217 95 16 4 1

X , S ( )N X, S

N( , )μ σ

Figura 4.4.1

1 4 19

91

202 217

95

160

50100150200250

0 a 1 1 a 2 2 a 3 3 a 4 4 a 5 5 a 6 6 a 7 7 a 8

Histograma

4 1

8 a 9 9 a 10

Figura 4.4.2

Page 14: Cálculo y EstadísTICa. Primer Semestre.asignaturas.topografia.upm.es/matematicas/Estadistica/...4.5.1 Propiedades de la Distribución Chi-Cuadrado de n grados de libertad 4.5.2 Las

14-IV Escuela Técnica Superior de Ingenieros en Topografía Geodesia y Cartografía

4.5 Distribución 2χ de Pearson

Sean Z1, Z2,….,Zn, n variables aleatorias independientes entre sí, todas ellas con distribuciones

N(0, 1). La variable n

2n

i 1

Z=

χ = ∑ 2i es una variable aleatoria que recibe el nombre de chi-

cuadrado con n grados de libertad.

Su función de densidad viene dada por

x n 22 2

n2

e xf (x)n22

−−⋅

=⎛ ⎞⋅Γ⎜ ⎟⎝ ⎠

siendo 0 x Y n>2< < ∞ .

n la función de densidad según sea el valor

1 Propiedades de la distribución Chi-cuadrado de n grados de libertad

. El dominio de la variable es

Figura 4.5.1

E figura 4.5.1 notamos cómo cambia la forma de la

de “n” en la distribución 2nχ .

4.5.

1. La distribución 2χ sólo depende del parámetro n.n

[ )∞,0 . 2

3. Su media, varianza y desviación típica son respectivamente

[ ]0

E x xf (x)dx n∞

μ = = =∫ ; [ ] ( )22∞

V x x f (x)dx 2n−∞

= = −μ =∫ ⇒ 2nσ =σ .

4. Son sus coeficientes de asimetría 18gn

= , y de curtosis 212gn

= .

Note que, a medida que n aume ca de la función de densidad se hará mnte, la gráfi ássimétrica y menos apuntada y ( )2

n N n, 2nχ ⎯⎯→ .

5. i y son independientes entonces 21

2nχ 2

2nχ 1

2 2n nχ +χS es una distribución

endientes chi-

lu_seb@ s

1 2

2n n+χ .

Esta propiedad se generaliza para la suma de n variables aleatorias indepcuadrado. topografia.upm.e

Page 15: Cálculo y EstadísTICa. Primer Semestre.asignaturas.topografia.upm.es/matematicas/Estadistica/...4.5.1 Propiedades de la Distribución Chi-Cuadrado de n grados de libertad 4.5.2 Las

IV DISTRIBUCIONES CONTINUAS NOTABLES

4.5.2 Las funciones de Excel para la Distribución Chi-cuadrado. 2nχ

Debido a que esta distribución es muy usada en estimación y contrastes de hipótesis, lo que más nos interesa en este curso, es el cálculo de la P(X x)≤ y del valor x de la variable que verifica F(x)=α.

Función Excel Sintaxis DISTR.CHI Calcula la probabilidad acumulada a la derecha de un valor x, en una distribución . 2

nχ2nP( x)χ ≥ = α

DISTR.CHI(x;gl) x: valor de la variable. gl: grados de libertad.

PRUEBA.CHI.INV Devuelve el percentil x que acumula a su derecha una determinada probabilidad α. 2

nP( x)χ ≥ = α

PRUEBA.CHI.INV(α;gl) α: probabilidad.

gl: nº de grados de libertad.

Universidad Politécnica de Madrid 15-IV

Observe que las funciones DISTR.CHI y PRUEBA.CHI.INV proporcionan el área α situada a la derecha del valor x y el valor x que deja a su derecha un área α, respectivamente.

α

x

Figura 4.5.2 Ejemplo. Calcular: a) , b) , c) , 2

11P( 4.575)χ > 210P(4,865 15.987)< χ < 2

11P( 10.1)χ <

d) hallar el valor de x tal que 210P( x) 0.5χ < =

Utilizaremos la función “ =DISTR.CHI ” para los apartados a, b y c, y la función “=PRUEBA.CHI.INV” para el apartado d) para obtener:

211P( 4.575) 0.949992χ > =

210P(4.865 15.987) 0.800007< χ < =

=0.478505 ),(),( 110P1110P 2

11211 >χ−=<χ

[email protected] Figura 4.5.3

2 210 10P( x) 0.5 1 P( x) 0.5χ < = ⇒ − χ > = 2

10P( x) 0.5⇒ χ > = x 9.341816⇒ =

Page 16: Cálculo y EstadísTICa. Primer Semestre.asignaturas.topografia.upm.es/matematicas/Estadistica/...4.5.1 Propiedades de la Distribución Chi-Cuadrado de n grados de libertad 4.5.2 Las

16-IV Escuela Técnica Superior de Ingenieros en Topografía Geodesia y Cartografía

Otra alternativa es usar las ventanas de diálogo para las funciones anteriores. Así, para los apartados a) y d) se obtienen las siguientes ventanas:

Figura 4.5.4

4.6 Distribución t de Student. tn

Sean Z y dos variables aleatorias independientes, la variable Z con distribución N(0,1) y χ χ

con distribución entonces, la variable aleatoria 2nχ n 2

n

Zt

n

sigue una distribución “t de

student ” con n grados de libertad (abreviadamente ). nt

Su función de densidad es:

n 12 2

n 1n x2f (x)

n nn2

+−

+⎛ ⎞Γ⎜ ⎟ ⎛ ⎞+⎝ ⎠= ⋅⎜ ⎟⎛ ⎞ ⎝ ⎠πΓ⎜ ⎟⎝ ⎠

, siendo, y n 1> x−∞ < < ∞ .

4.6.1 Propiedades básicas de la distribución t_Student. tn

• Su distribución sólo depende del parámetro “n”, llamado grados de libertad.

• El dominio de la variable es ( ) .,−∞ ∞

• Es simétrica respecto del valor x = 0.

• Su media y varianza son:

[ ]E x 0μ = = si n y 1> [ ]2 nV xn 2

σ = =−

si n respectivamente. 2>

• Son sus coeficientes de asimetría y curtosis 1g 0= y 25g

n 4=

− respectivamente.

• Para n grande (n>30), la distribución t_student se aproxima a una distribución .N(0,1)

• El caso particular de t1 se conoce con el nombre de Distribución de Cauchy.

[email protected]

Page 17: Cálculo y EstadísTICa. Primer Semestre.asignaturas.topografia.upm.es/matematicas/Estadistica/...4.5.1 Propiedades de la Distribución Chi-Cuadrado de n grados de libertad 4.5.2 Las

IV DISTRIBUCIONES CONTINUAS NOTABLES

4.6.2 Las funciones de Excel para la distribución t_Student. Las funciones que proporciona Excel para el cálculo de la P(X x)≤ y del valor x de la variable aleatoria que

verifica F(x)=α= , son las siguientes: x

0

f (t)dt∫

Función Excel Sintaxis DISTR.T Calcula el valor de si elegimos una cola, o el valor de

nP(t t)>

nP( t t)≥ si elegimos dos colas.

DISTR.T(t;n;colas) t: valor de la v. a.

-n el nº de grados de libertad.

DISTR.T.INV Devuelve el valor “t” de

la variable, tal que ( )nP t t2α

> = .

DISTR.T.INV(α;n) α; En esta función siempre es la probabilidad acumulada en dos colas.

Tabla 4.6.1

Ejemplo

Universidad Politécnica de Madrid 17-IV

Calcular las probabilidades: a) 9P(t 1.37)≥

b) );2.1t(P 9 ≤

c) ( )5.2tP 11 >

d) El valor de t, tal que

20.0)tt(P 16 =≥

[email protected]

1 cola

Figura 4.6.3

9 9P(t 1.2) 1 P(t 1.2) 0.869613

≤ = − ≥ ≈

Figura 4.6.4

2 colas ( )029506.0

5.2tP 11 > 

Figura 4.6.2

9P(t 1.37)0.101945

≥ ≈1 cola

Siempre ( ) 2 colas

16P t t 0.2t 0.864667

≥ = ⇒

⇒ ≈

Figura 4.6.5

Page 18: Cálculo y EstadísTICa. Primer Semestre.asignaturas.topografia.upm.es/matematicas/Estadistica/...4.5.1 Propiedades de la Distribución Chi-Cuadrado de n grados de libertad 4.5.2 Las

18-IV Escuela Técnica Superior de Ingenieros en Topografía Geodesia y Cartografía

e) El valor de t, tal que 10P(t t) 0.9≤ =

10P(t t) 0.9≤ = 10P(t t) 0.1⇒ > = ⇒ 10P( t t) 0.2> =

10P( t t) 0.2> =

t 1.372184≈

Figura 4.6.6

Por tanto

La ventana de diálogo para la distribución “DISTR.T” y el ejercicio a) será:

9P(t 1.37)≥

Figura 4.6.7

La ventana de diálogo para la distribución “DISTR.T.INV” y el ejercicio d) será: 16P(t t) 0.20≥ =

0.2 0.2

Resultado t

Figura 4.6.8 [email protected]

Page 19: Cálculo y EstadísTICa. Primer Semestre.asignaturas.topografia.upm.es/matematicas/Estadistica/...4.5.1 Propiedades de la Distribución Chi-Cuadrado de n grados de libertad 4.5.2 Las

IV DISTRIBUCIONES CONTINUAS NOTABLES

4.7 Distribución de Fisher-Snedecor. F(n,m)

Sean X e Y dos variables aleatorias independientes con funciones de distribución y 2mχ

2nχ ,

respectivamente. La variable aleatoria m,n

XmF Yn

= sigue una distribución de Fisher-Snedecor

con m y n grados de libertad.

La función de densidad viene determinada por la función

( )

n m2 2

m n2

m nn (mx)2 si x 0

m nf (x) x mx n2 2

0 si x 0

+

⎧ +⎛ ⎞Γ⎜ ⎟⎪ ⎝ ⎠⎪ >⎪= ⎛ ⎞ ⎛ ⎞⎨ +Γ Γ⎜ ⎟ ⎜ ⎟⎪ ⎝ ⎠ ⎝ ⎠⎪≤⎪⎩

4.7.1 Propiedades de la Distribución de Fisher-Snedecor. Algunas de las propiedades más importantes de la distribución de Fisher-Snedecor son:

• Si entonces la variable m,nX F≈ n,m1 FX≈ .

• Si entonces . nX t≈ 21,nX F≈

• La media de la distribución F(m, n) es: m

(m 2)μ =

−, siendo m > 2.

• La varianza de la distribución F(m, n) es: 2

22

2m (m n 2)n(m 4)(m 2)

+ −σ =

− −, siendo m > 4.

Función Sintaxis

g1=n; grados de libertad en el numerador. g2=m; grados de libertad en el denominador.

DISTR.F Conocido el valor de la v. a. X, devuelve el valor del área α situada a la derecha de x, es decir:

P(X x)> = α

DISTR.F(x;g1;g2) x: valor de la variable.

DISTR.F.INV Conocida el área α , halla el valor de la variable que deja a su derecha un área α ; P(X x)> = α

DISTR.F.INV(p:g1;g2) P: probabilidad que deja a su derecha el valor x.

Tabla 4.7.1

[email protected]

Universidad Politécnica de Madrid 19-IV

Page 20: Cálculo y EstadísTICa. Primer Semestre.asignaturas.topografia.upm.es/matematicas/Estadistica/...4.5.1 Propiedades de la Distribución Chi-Cuadrado de n grados de libertad 4.5.2 Las

20-IV Escuela Técnica Superior de Ingenieros en Topografía Geodesia y Cartografía

9.7.2 Las funciones de Excel para la Distribución de Fisher-Snedecor. . n,mX F≈

Al igual que en las distribuciones anteriores estudiaremos el cálculo de la , y el valor

x, de la variable aleatoria que verifica F(x)=

P(X x)≤

α =x

0

f (t)dt∫ .

Ejemplo. Hallar ( )4,9P F 2.8< . Función Excel: =1-DISTR.F(2,8;4;9)

( ) ( )4,9 4,9P F 2.8 1 P F 2.8< = − ≥

( )4,9P F 2.8 0.908069< ≈

Figura 4.7.1

La ventana de diálogo para esta función es:

( )4,9

x 2.8 n 4 m 9

P F 2.8 1 P

1 0

===

< = −

= −=

( )4,9F 2.8

.091930.9

≥ =

=0807

Figura 4.7.2

Ejemplo. Hallar el valor k tal que P(X<k)=0.95, siendo 4,9X F≈ .

Función Excel: =DISTR.F.INV(0.05;4;9)

( )P(X k) 0.95 P F k 0.05 F(K) 0.05< = ⇒ > = ⇒ =

k 3.633089≈ Figura 4.7.3

[email protected]