Estadística y Programación Aplicada a la Química

151
Estadística y Programación aplicada a la Química Introducción al análisis de datos experimentales Dr. Pedro Alberto Enríquez Palma Área de Química Física Departamento de Química Licenciatura en Química, Universidad de La Rioja

Transcript of Estadística y Programación Aplicada a la Química

Page 1: Estadística y Programación Aplicada a la Química

Estadística y Programación aplicada a la Química

Introducción al análisis de datos experimentales

Dr. Pedro Alberto Enríquez Palma Área de Química FísicaDepartamento de QuímicaLicenciatura en Química, Universidad de La Rioja

Page 2: Estadística y Programación Aplicada a la Química

Índice general

1. Errores, incertidumbres, precision y exactidud. 51.1. Errores e incertidumbres. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61.2. Cifras o digitos significativos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101.3. Ejercicios y problemas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

1.3.1. Soluciones a los ejercicios. . . . . . . . . . . . . . . . . . . . . . . . . . . 131.4. Lecturas recomendadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2. Teoría estadística de los errores(I). Probabilidad 152.1. Definición de probabilidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

2.1.1. El espacio muestral. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162.1.2. Definición empírica de probabilidad. . . . . . . . . . . . . . . . . . . . . . 162.1.3. Definición aximática de probabilidad. . . . . . . . . . . . . . . . . . . . . 182.1.4. Probabilidad condicional. . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.2. Funciones de distribución de probabilidad.. . . . . . . . . . . . . . . . . . . . . . . 202.2.1. Distribuciones de probabilidad de variables aleatorias discretas.. . . . . . . 212.2.2. Distribuciones de probabilidad de variables aleatorias continuas. . . . . . . 24

2.3. Ejercicios y problemas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292.3.1. Soluciones a los ejercicios. . . . . . . . . . . . . . . . . . . . . . . . . . . 30

2.4. Lecturas recomendadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

3. Teoría estadística de los errores(II). Esperanza matemática 333.1. Esperanza matemática de una magnitud aleatoria. . . . . . . . . . . . . . . . . . . 34

3.1.1. Magnitudes aleatorias discretas. . . . . . . . . . . . . . . . . . . . . . . . 343.1.2. Magnitudes aleatorias continuas. . . . . . . . . . . . . . . . . . . . . . . . 343.1.3. Propiedades de la esperanza matemática. . . . . . . . . . . . . . . . . . . . 343.1.4. Momentos de una distribución.. . . . . . . . . . . . . . . . . . . . . . . . . 35

3.2. Propiedades generales y propiedades muestrales de una magnitud aleatoria. . . . . . 383.2.1. Media general de una magnitud aleatoria. . . . . . . . . . . . . . . . . . . 393.2.2. Media muestral de una magnitud aleatoria. . . . . . . . . . . . . . . . . . . 39

1

Page 3: Estadística y Programación Aplicada a la Química

0.0 Índice general

3.2.3. Varianza de una magnitud aleatoria.. . . . . . . . . . . . . . . . . . . . . . 393.2.4. Dispersion o varinza muestral de una magnitud aleatoria. . . . . . . . . . . 42

3.3. Mediana y moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 443.4. Ejercicios y problemas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

3.4.1. Soluciones a los ejercicios. . . . . . . . . . . . . . . . . . . . . . . . . . . 463.5. Lecturas recomendadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

4. Distribuciones de probabilidad de variables aleatorias discretas 494.1. Distribución uniforme. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 504.2. Distribución binomial. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

4.2.1. Teorema de Moivre. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 554.3. Distribución de Poisson. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

4.3.1. La distribución de Poisson como límite de la distribución binomial. . . . . . 574.3.2. La distribución de Gaussiana o normal como límite de la distribución de Poisson58

4.4. Ejercicios y problemas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 594.4.1. Soluciones a los ejercicios. . . . . . . . . . . . . . . . . . . . . . . . . . . 62

4.5. Lecturas recomendadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

5. Distribuciones de probabilidad de variables aleatorias continuas 675.1. Distribución uniforme. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 695.2. Distribución normal o Gaussiana. . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

5.2.1. ¿Qué variables aleatorias siguen una distribución normal?. . . . . . . . . . 755.3. La distribución t de Student. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

5.3.1. ¿Qué variables aleatorias siguen una distribución t de Student?. . . . . . . . 815.4. La distribuciónχ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

5.4.1. ¿Qué variables aleatorias siguen una distribuciónχ2 ? . . . . . . . . . . . . 845.4.2. Relación entre la distribuciónχ2 y la distribución normal. . . . . . . . . . . 87

5.5. La distribución F de Fisher. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 885.5.1. ¿Qué variables aleatorias de interés siguen una distribución F de Fisher?. . . 88

5.6. Ejercicios y problemas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 925.6.1. Soluciones a las cuestiones. . . . . . . . . . . . . . . . . . . . . . . . . . . 955.6.2. Soluciones a los ejercicios. . . . . . . . . . . . . . . . . . . . . . . . . . . 96

5.7. Lecturas recomendadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .103

6. Intervalos de probabilidad e intervalos de confianza 1056.1. Distribución de probabilidad del error aleatorio.. . . . . . . . . . . . . . . . . . . . 1066.2. Intervalos de probabilidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .106

6.2.1. Definición. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1066.2.2. Intervalos de probabilidad de las medidas. . . . . . . . . . . . . . . . . . . 1076.2.3. Intervalos de probabilidad de las medias. . . . . . . . . . . . . . . . . . . . 1086.2.4. Intervalos de probabilidad de las varianzas. . . . . . . . . . . . . . . . . . 108

6.3. Intervalos de confianza. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1096.3.1. Definición. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .109

6.4. Calculo de intervalos de confianza para la media. . . . . . . . . . . . . . . . . . . . 1136.4.1. Datos distribuidos normalmente con varianzaσ2(x) conocida . . . . . . . . 113

2

Page 4: Estadística y Programación Aplicada a la Química

0 Índice general

6.4.2. Datos distribuidos normalmente con varianza finita y con n grande. . . . . . 1136.4.3. Datos distribuidos normalmente con varianzaσ2(x) desconocida. . . . . . . 1146.4.4. Datos que siguen una distribución desconocida con varianza finita y con n

pequeña. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1166.5. Calculo de intervalos de confianza para la varianza. . . . . . . . . . . . . . . . . . 1166.6. Cálculo de intervalos de confianza para la diferencia de las medias. . . . . . . . . . 117

6.6.1. Datos distribuidos normalmente con varianzasσ21(x) y σ2

2(y) conocidas . . . 1186.6.2. Datos distribuidos normalmente con varianzasσ2

1(x) y σ22(y) desconocidas

pero iguales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1186.6.3. Datos que siguen cualquier distribución con varianza finita y conn1 y n2

grandes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1196.6.4. Datos distribuidos normalmente con varianzasσ2

1(x) y σ22(y) desconocidas y

distintas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1206.7. Análisis de datos emparejados. . . . . . . . . . . . . . . . . . . . . . . . . . . . .1206.8. Ejercicios y problemas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1236.9. Lecturas recomendadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .130

7. Cálculo de errores 1317.1. Cálculo de errores en medidas directas. . . . . . . . . . . . . . . . . . . . . . . . .132

7.1.1. Errores de escala. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1327.1.2. Errores de sistemáticos. . . . . . . . . . . . . . . . . . . . . . . . . . . .1327.1.3. Errores accidentales o aleatorios. . . . . . . . . . . . . . . . . . . . . . . . 132

7.2. Desestimación de medidas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1357.2.1. El ensayo de la Q de Dixon. . . . . . . . . . . . . . . . . . . . . . . . . . .1357.2.2. La técnica de laτ de Thompson modificada. . . . . . . . . . . . . . . . . . 136

7.3. Cálculo de errores de medidas indirectas. . . . . . . . . . . . . . . . . . . . . . . . 138

I Apéndices 141

A. Tablas estadísticas 143A.1. Área bajo la curva normal tipificada. . . . . . . . . . . . . . . . . . . . . . . . . .143A.2. Valores de las percentilastp para un distribución t de Student conν grados de lbertad 145A.3. Valores de las percentilasχ2

p para un distribuciónχ2 de Student conν grados de lbertad146A.4. Valores de las percentilasF0,95(ν1, ν2) para un distribución F. . . . . . . . . . . . . 147A.5. Valores de las percentilasF0,99(ν1, ν2) para un distribución F. . . . . . . . . . . . . 148

3

Page 5: Estadística y Programación Aplicada a la Química

0.0 Índice general

4

Page 6: Estadística y Programación Aplicada a la Química

1

Errores, incertidumbres, precision y exactidud.

Contenidos ✍ Errores e incertidumbres. Concepto de error. Tipos de errores. Errorde escala y resolución. Exactitud y precisión.✍ Cifras y dígitos significativos.Normas de redondeo y truncamiento.

Objetivos ✓ Errores e incertidumbre

☞ Comprender el concepto de error

☞ Distinguir entre los errores sistemáticos y aleatorios

☞ Reconocer el error de escala

☞ Comprender los conceptos de precisión, exactitud y sesgo

✓ Cifras significativas

☞ Determinar el número de cifras significativas de un número

☞ Escribir correctamente un número en notación científica

☞ Redondear correctamente un resultado

5

Page 7: Estadística y Programación Aplicada a la Química

1.1 1.1. Errores e incertidumbres

1.1. Errores e incertidumbres

En la determinación experimental de una magnitud no podemos definirerror como la diferenciaentre el valorobservadode la magnitud y su valorreal: no conocemos este supuesto valor real sólodisponemos de aproximaciones a ese valor obtenidas en otros experimentos o a partir de prediccionesteóricas. Sin embargo, podemos acotar el intervalo de valores que puede asumir esa magnitud alrealizar la medida.

Suponga que conocemos el valor real del observable1, A. A la diferencia entre el valor del obser-vableA y el valor obtenido en la medida,ai, la denominaremos error absoluto,ei:

ei = |A − ai| (1.1)

Como es imposible determinarA, no podemos determinarei. Lo que si podemos hacer es estimarel intervalo de valores en que esperamos encontrarA de modo que la diferencia entre la medida,ai, yA sea menor o igual que un cierto error,εi:

εi = |A − ai| (1.2)

A − ai ≤ εi ≥ A + ai (1.3)

Así, es conveniente representar el valor real que intentamos aproximar (y no conocemos) con unintervalo centrado en la medidaai:

A = ai ± εi (1.4)

εi es elerror absoluto o incertidumbre de la medida.Podemos distinguir tres tipos de contribuciones a la disparidad entre las observaciones experimen-

tales y el valor real:

errores ilegítimos

errores sistemáticos

errores aleatorios

Los errores ilegítimos2 son aquellos causados por errores de cálculo o en la realización del expe-rimento. Afortunadamente estos son fácilmente detectables, ya sea porque el resultado de la medidaes un valor físicamente improbable o porque los resultados difieren considerablemente de otras deter-minaciones. Estos errores se corrigen repitiendo las operaciones erroneas o el experimento.

Los errores sistemáticos (o determinados) son aquellos que afectan a las distintas medidas de unmodo previsible. Su determinación no es siempre fácil, puesto que no siempre es posible estimar suefecto y sólo pueden detectarse mediante un análisis detallado del procedimiento experimental. Si eltipo y magnitud de este error es conocido, la medida puede ser corregida para compensar por este

1observable: propiedad que puede medirse experimentalmente2También llamados errores groseros o accidentales

6

Page 8: Estadística y Programación Aplicada a la Química

1 1.Errores, incertidumbres, precision y exactidud.

error. En otros casos la incertidumbre asociada a este efecto ha de ser estimada y combinada conaquella asociada a los errores aleatorios.

Un caso particular de error sistemático es elerror de escala. Este resulta de la capacidad limitada,resolución, para distinguir dos valores muy próximos de la magnitud medida. La resolución es portanto una característica del instrumento y siempre tiene un valor distinto de cero. Salvo que el cons-tructor indique lo contrario, su valor puede estimarse como un medio de la unidad que correspondea las divisiones más próximas de la escala (lectura analógica) o a los cambios más pequeños de uncontador (lectura digital).

Ejemplo 1. Error de escala

Considere un termómetro con una graduación en divisiones de decimas de grado. El error deescala puede estimarse como en 0.05o C.Este error es constante y afecta a todos las medidas efectuadas. Así, si leemos una temperaturade 36.5oC, al tener en cuenta la resolución del termómetro, podemos expresar el valor de latemperatura como 36.50± 0.05 oC. Es decir, la temperatura está comprendida entre 36.45 y36.55oC.

Ejemplo 2. Error sistemático

Para una determinación de una longuitud se utilizó un metro de aluminio.Las medidas fueron realizadas a una temperatura de 20oC, obteniendose una media de las me-didas de 1.982 m.Tras completar el experimento se advirtió que el metro se habia calibrado a 25oC y que elaluminio utilizado tenia un coeficiente de expansión lineal de 0.005 m.oC−1. Es decir, las lecturasdel metro a 20oC no son correctas.

7

Page 9: Estadística y Programación Aplicada a la Química

1.2 1.1. Errores e incertidumbres

¿Pueden corregirse el resultado obtenido?. Para corregir el error tendemos en cuenta como afectala temperatura a las medidas del metro:

l(T ) = l(25oC)× (1 − 0,005T )

dondel(T ) es la longitud del metro a distintas temperaturas, yT la temperatura en grados Cel-sius.Utilizando esta ecuación se obtiene que el valor de la longitud es 1.977± 0.005 m. Este valordifiere del valor sin corregir.

Los errores aleatorios (accidentales o indeterminados) son debidos a factores que sufren pequeñasvariaciones durante la medida y que hacen que medidas sucesivas de la misma magnitud difieran.Por ejemplo, el resultado de una pesada en una balanza de precisión puede verse afectado por lasvibraciones del platillo, las vibraciones producidas por otros aparatos presentes en el laboratorio,etc. En general la fuente de estos errores no es conocida y por su carácter aleatorio pueden tratarseestadísticamente.

La figura 1.1. muestra el efecto de errores sistemáticos y accidentales sobre el resultado de unamedida.

Algunas definiciones relacionadas con los errores son:

exactitud segun la ISO [3] se define como "grado de concordancia entre el resultado de un ensayo yel valor de referencia aceptado". Tiene en cuenta todas las fuentes de error del experimento.

precisión propiedad relacionada con la magnitud de los errores aleatorios. Cuanto mayor es la preci-sión, menor es la magnitud de los errores aleatorios.

sesgomedida del error sistemático. Unas medidas sesgadas tienden a ser mayores o menores que elvalor de referencia.

Ejemplo 3. Precisión y sesgo

La tabla recoge los resultados de volumetrías de 10 ml de NaOH 0.1 M con HCl 0.1 M realizadaspor distintos experimentadores. Teniendo en cuenta, la media, desviación típica y la distribuciónde los datos podemos describir la exactitud, precisión y sesgo de los datos [3, tabla 1.1].

experimentador volumen (ml) precisión y sesgoA 10.08 10.11 10.09 10.10 10.12 preciso sesgadoB 9.88 10.14 10.02 9.80 10.21 impreciso insesgadoC 10.19 9.79 9.69 10.05 9.78 impreciso sesgadoD 10.04 9.98 10.02 9.97 10.04 preciso insesgado

En general, los errores sistemáticos y accidentales tienen distinta fuentes y pueden ser tratadosindependientemente, la incertidumbre de una medida puede expresarse como

εtotal = εsistematica + εaleatorio (1.5)

8

Page 10: Estadística y Programación Aplicada a la Química

1 1.Errores, incertidumbres, precision y exactidud.

Figura 1.1: Comparación de errores sistemáticos y accidentales. Los errores sistemáticos están asocia-dos con la exactitud de la medida mientras que los errores accidentales o aleatorios con su precisión.

Figura 1.2: Distribución de las medidas de la tabla del ejemplo 3 [3, figura1]

9

Page 11: Estadística y Programación Aplicada a la Química

1.2 1.2. Cifras o digitos significativos

1.2. Cifras o digitos significativos

Para indicar el valor de una magnitud experimental se han de proporcionar el máximo número decifras significativas que permita la precisión del experimento.

Cualquier número en valor absoluto puede expresarse como una serie de potencias

|x| =∞∑

m=i

αi 10m (1.6)

dondeαm es un dígito del 0 al 9, e i es un entero tal que

1 ≤ |x|10i

≤ 10 (1.7)

Las cifras significativas se definen como:

1. el dígito menos significativo es aquel no nulo más a la izquierda

2. el dígito más significativo es aquel más a la derecha que tenga el mismo orden de magnitud quela incertidumbre del experimento

3. el número total de dígitos significativas comprende todos aquellos que van del dígito más almenos significativo

Ejemplo 4. Número de cifras significativas

¿Cuantas cifras significativas tiene el número0, 00370?.En el número0, 00370 los tres primeros dígitos no son significativos puesto que sólo sirven paraindicar el orden de magnitud de la medida.El último cero si es significativo puesto que el número0,00370 es diferente a0, 00369, 0, 00371,0, 00372, . . . . El número tiene3 cifras significativas.Note que0,00370 es diferente a0,0037 porque este número sólo tiene dos cifras significativas.

Una consecuencia del resultado del ejemplo anterior es que hay que tener cuidado cuando escribi-mos el resultado de una medida en distintas unidades. Hay que tener cuidado con el número de cifrassignificativas. Por ejemplo, el equivalente en gramos de3,2 Kg es3,2 103g no3200 g. Esta númerono es correcto puesto que supondría que el resultado del peso en Kg lo conocemos con cuatro cifrassignificativas.

Un método que evita ambigüedades a la hora de determinar que cifras son significativas es expre-sar los números en notación científica. En esta notación el número se expresa como el producto deotro número (mantisa) que contiene las cifras significativas, la primera de las cuales ocupa la columnade las unidades, por una potencia de diez.

10

Page 12: Estadística y Programación Aplicada a la Química

1 1.Errores, incertidumbres, precision y exactidud.

Ejemplo 5. Notación científica

El número 150000 puede expresarse en notación científica como

1.5 105→ si tiene dos cifras significativas.

1.50 105→ si tiene tres cifras significativas.

1.500 105→ si tiene cuatro cifras significativas.

Cuando una magnitud se calcula con un número de cifras superior al de cifras significativas con-viene suprimir las no significativas. A este procedimiento se le denomina redondeo. Al suprimir estasse introduce un error (error de truncamiento) que afectará a las operaciones en las que se incluya estamagnitud. Este error ha de minimizarse, e intentar mantenerlo por debajo de la incertidumbre de lamedida. Para ello seguiremos las reglas siguientes:

1. Si el primer dígito despreciado esmenor que 5no se modifica el dígito más significativo.

2. Si el primer dígito despreciado esmayor que 5se suma uno al dígito más significativo.

3. Si el primer dígito despreciado es 5, suma uno al dígito más significativo si éste es impar; no semodifica en caso contrario. Aunque esta regla parezca arbitraria, se puede demostrar que de nousarse esta u otra similar, induciríamos un error sistemático.

Otra regla a tener en cuenta al determinar las cifras significativas supone que si no se proporcionaningún dato relativo a la incertidumbre de la medida consideramos que todas sus cifras son signi-ficativas y que estas son el mayor número que se puede leer con la escala del aparato usado en lamedida.

Ejemplo 6. Redondeo y truncamiento

Redondee los siguientes número al número de cifras significativas adecuado:

7,56128± 0,02 →7,56± 0,02

7,56128± 0,1 →7,6± 0,1

1,2451± 0,01 →1,24± 0,01

1,245± 0,01 →1,24± 0,01

1,235± 0,01 →1,24± 0,01

413,73500± 0,05 →(4,1374± 0,0005)102

11

Page 13: Estadística y Programación Aplicada a la Química

1.3 1.3. Ejercicios y problemas

1.3. Ejercicios y problemas

Errores

Cuestión 1.1 Verdadero o falso.Los errores aleatorios de una medida son impredecibles. Sin embargo, la media de estos errores

es cero.

Cuestión 1.2 Verdadero o falso.Los errores sistemáticos de una medida pueden permanecer constantes o variar de una manera

predecible (aunque no conozcamos la forma de esa variación).

Cuestión 1.3 Verdadero o falso.Los errores sistemáticos no pueden eliminarse calculando la media de un conjunto de medidas.

Cuestión 1.4 Eliga la respuesta adecuadaCuando se resta el blanco a una serie de medidas se intenta eliminar una fuente de error aleato-

rio|sistemático|escala.

Ejercicio 1.1 Una muestra patrón de suero sanguíneo humano contiene 42.0 g de albúmina por litro.Cinco laboratorios (A-E) realizan cada uno seis determinaciones (en el mismo día) de la concentra-ción de albúmina, con los siguientes resultados (en gl−1):

laboratorio concentración de albumina, gl−1

A 42.5 41.6 42.1 41.9 41.1 42.2B 39.8 43.6 42.1 40.1 43.9 41.9C 43.5 42.8 43.8 43.1 42.7 43.3D 35.0 43.0 37.1 40.5 36.8 42.2E 42.2 41.6 42.0 41.8 42.6 39.0

Comentar el sesgo, precisión y exactitud de cada uno de estos conjuntos de resultados.

[3, Ejercicio 1]

Ejercicio 1.2 Utilizando la misma muestra y el método del ejercicio anterior, el laboratorio A rea-liza otras seis determinaciones posteriores de la concentración de albúmina, esta vez en seis díassucesivos. Los valores obtenidos son 41.5, 40.8, 43.3, 41.9, y 41.7 g.l−1. Comentar estos resultados.

[3, Ejercicio 2]

Ejercicio 1.3 Se ha determinado cuatro veces el número de lugares de unión por molécula en unamuestra de anticuerpos monoclonados, con resultados de 1.95, 1.95, 1.92 y 1.97.

Comentar el sesgo, precisión y exactidud de estos resultados

[3, Ejercicio 3]

12

Page 14: Estadística y Programación Aplicada a la Química

1 1.Errores, incertidumbres, precision y exactidud.

Cifras significativas

Cuestión 1.5 Explique la diferencia entre redondeo y trncamiento

Ejercicio 1.4 Indique el número de cifras significativas y exprese en notación cientifica las siguientesmagnitudes:

(a) 12.08 m. (b) 5.43 1012 s−1 (c) 0.12 10−3cal(d) 0.0250 g (e) 2500.2 Å (f) 10.5 102 eV

Ejercicio 1.5 A partir de los resultados de un experimento se calculo que el valor de la energía deionización del rubidio es de 403.028 kJ mol−1. Por otra parte se estimo que la incertidumbre dedicho calculo en 0.2 kJmol−1. Indique el resultado con el número correcto de cifras significativas.

1.3.1. Soluciones a los ejercicios

Errores

Ejercicio 1.1 Los resultados de la media g.l−1 para los laboratorios A-E son: 41.9, 41.9, 43.2, 39.1,41.5. De aquí:

A - preciso, poco sesgo, media exacta

B - precisión pobre, poco sesgo, media exacta pero no muy fiable

C - preciso pero sesgado a valores altos, exactitud pobre

D - precisión pobre, sesgado a valores bajos, pobre exactitud

E -similar a A, pero el último resultado podría ser un valor anómalo

Ejercicio 1.2 El laboratorio A aún muestra poco sesgo, pero la precisión es más pobre, reflejandoreproducibilidad (es decir, precisión entre días) pero no repetibilidad (precisión dentro de días).

Ejercicio 1.3 El número de posiciones de enlace debe ser un número entero, 2 en este caso, demanera que los resultados son precisos, pero sesgados a valores bajos. El sesgo no es importante, yaque pueden de ducirse dos posiciones de enlace.

Cifras significativas

Ejercicio 1.4 (a) Cuatro cifras significativas.→ 1.208 101 m.(b) Tres cifras significativas.→ 5.43 1012 s−1.(c) Dos cifras significativas.→ 1.2 10−4 cal.(d) Tres cifras significativas.→ 2.50 10−2 g.(e) Cinco cifras significativas.→ 2.5002 103 Å.(f) Tres cifras significativas.→ 1.05 103 eV.

Ejercicio 1.5 4,03± 0,20 kJ.mol−1

13

Page 15: Estadística y Programación Aplicada a la Química

1.4 1.4. Lecturas recomendadas

1.4. Lecturas recomendadas

Para completar la preparación de este tema recomendamos la lectura de:

☞ Capítulo 1. Introduccióndel libro de Miller y Miller[3]. XEl texto es claro y del mismo nivel que el del curso. Aunque el libro está orientado hacia lasaplicaciones de la Quimiometría en Química Analítica, los contenidos son de carácter general.

☞ Introduccióndel texto de Spiridonov y Lopatkin[7].

☞ Chapter 1. Uncertainties in measurementsdel libro de Bevington y Robinson[1]

14

Page 16: Estadística y Programación Aplicada a la Química

2

Teoría estadística de los errores(I). Probabilidad

Contenidos ✍ Introducción . Error aleatorio y probabilidad.✍ Definición de probabilidad. Espacio muestral y sucesos. Magnitudaleatoria discreta y continua. Definición empírica de probabilidad. Defini-ción axiomática de probabilidad.✍ Funciones de distribución de probabilidad: variables aleatorias dis-cretas.Función de probabilidad o función de frecuencia. Función de dis-tribución de probabilidad acumulada.✍ Funciones de distribución de probabilidad: variables aleatoriascontinuas.Función de distribución de probabilidad o de densidad de pro-babilidad. Función de distribución de probabilidad integrada.

Objetivos ✓ Definición de probabilidadErrores e incertidumbre

☞ Comprender la relación entre el error aleatorio y la probabilidad

☞ Conocer la definición axiomática de probabilidad y las consecuenciasque se derivan de ésta

☞ Comprender la relación entre frecuencia de un suceso y probabilidad deque este se produzca

✓ Funciones de distribución de probabilidad

☞ Realizar cálculos básicos de probabilidad para variables aleatorias dis-cretas

☞ Realizar cálculos básicos de probabilidad para variables aleatorias con-tinuas

15

Page 17: Estadística y Programación Aplicada a la Química

2.1 2.1. Definición de probabilidad

Como vimos en el tema 1, los errores accidentales son debidos a las fluctuaciones de las distintasvariables que influyen sobre el experimento. Esto se manifiesta en que medidas repetidas en condi-ciones aparentemente idénticas difieren. Por este carácter aleatorio, los errores accidentales puedentratarse estadísticamente.

El objetivo de la teoría estadística de los errores es múltiple: obtener una apreciación óptima delvalor de la magnitud medida, estimar el error accidental en su determinación, verificar si el resultadoes compatible con determinadas hipótesis que puedan establecerse sobre la magnitud que se mide,etc.

Toda teoría estadística de los errores se basa en dos postulados generales:(a) la medida experimental de una magnitud es una variable aleatoria que cumple la ley de estabi-

lidad estadística o de los grandes números según la cual las medidas se concentran en torno a un valormedio, que cuando el número de observaciones es grande (en el límite de infinito) se convierte en unvalor constante, independiente del número de observaciones.

(b) la probabilidad de que observemos un valor distinto del valor medio puede caracterizarsemediante una función(función de distribución de probabilidad).

La forma concreta de la función de distribución de probabilidad puede ser establecida a partir demedidas experimentales o, postulada y posteriormente contrastada con los experimentos. Al postulardistintas distribuciones de probabilidad se tendrá una determinada teoría estadística y la interpola-ción de los resultados experimentales será diferente. Generalmente consideraremos que la función dedistribución que caracteriza nuestras medidas es una función de distribución normal o Gaussiana1.

2.1. Definición de probabilidad

2.1.1. El espacio muestral

En teoría estadística al conjunto de todos los posibles resultados de una medida se le denominaespacio muestral, S.Por ejemplo,

(i) En un experimento se miden el número de partículas emitidas por una fuente radiactiva. Elespacio muestral está formado por los números 0, 1, 2, ... Puesto que la magnitud determinada en elexperimento es unamagnitud aleatoria discreta, el espacio muestral es un conjunto contable.

(ii) En un experimento se determina el volumen necesario de ácido que hay que utilizar paraalcanzar el punto de equivalencia en una valoración ácido-base. El volumen puede tomar cualquiervalor, tal que V> 0. La magnitud estudiada es unamagnitud aleatoria continuay el espacio muestralpuede ser cualquier número real positivo (V> 0) y el espacio muestral es unconjunto no contable.

Cada posible subconjunto del espacio muestral se le denominasuceso, A. Un suceso que corres-ponde al resultado de una medida constituye unsuceso elemental o simple.

2.1.2. Definición empírica de probabilidad

Intuitivamente identificamos la probabilidad de un suceso con la frecuencia con la que esperamosque este ocurra. Podeamos definir la probabilidad de sucesoA, P(A), como la frecuencia con que este

1Estudiaremos esta función de distribución de probabilidad en el tema 5Distribuciones de probabilidad de variablesaleatorias continuas

16

Page 18: Estadística y Programación Aplicada a la Química

2 2.Teoría estadística de los errores(I). Probabilidad

se produce en un experimento. De acuerdo con esta definición

P (A) =nA

N(2.1)

dondenA es el número de veces que se repite el suceso A, yN es el número total de experimentos.

Aunque esta definición sea suficiente para satisfacer nuestra intuición tiene serias limitaciones.Entre otras:

P(A) depende del número total de medidas.

P(A) depende del experimento: al repetir el experimento el valor de P(A) puede variar.

Ejemplo 1. Limitaciones de la definición empírica de probabilidad

Para demostrar las limitaciones de la definición empírica de probabilidad examinaremos un ex-perimento consistente en contar el número de caras que aparecen al lanzar cuatro monedas alaire.Para estimar la frecuencia esperada para cada suseso calcularemos el número de veces que espe-ramos observar un evento,nA, (contar dos caras) frente al número total posibles combinacionesde caras y cruces.

Número de caras combinaciones nA P (A)

0 XXXX 1 116

1 CXXX, XCXX 4 416

XXCX, XXXC2 CCXX, CXCX, CXXC 6 6

16

XCCX, XCXX, XXCC3 CCCX, CXCC, 4 4

16

CXCC, XCCC4 CCCC 1 1

16

Utilizando un programa de ordenador se simuló el experimento de lanzar cuatro monedas alaire un gran número de veces. Para calcular el número de caras que se espera observar en cadaexperimento se calculo este comoN × P (A).

17

Page 19: Estadística y Programación Aplicada a la Química

2.1 2.1. Definición de probabilidad

Número de caras 0 1 2 3 416 lanzamientosEsperado 1 4 6 4 1Experimento 1 2 7 2 4 1Experimento 2 3 4 4 5 0160 lanzamientosEsperado 10 40 60 40 10Experimento 3 9 40 61 38 121600 lanzamientosEsperado 100 400 600 400 100Experimento 3 125 403 567 409 9616000 lanzamientosEsperado 1000 4000 6000 4000 1000Experimento 3 1009 3946 5992 4047 1006

En el ejemplo anterior se observa que el acuerdo entre la predicción teórica (número de obser-vaciones esperadas) y el resultado experimental mejora con el número de ensayos. Esto indica queconforme el número de experimentos aumenta la frecuencia muestral o experimental se aproxima ala frecuencia teórica. Este observación ilustra laley de los grandes números: para valores suficiente-mente grandes del número de medidas, N, las frecuencias muestrales se aproximan a la probabilidadconforme aumenta de N.

2.1.3. Definición aximática de probabilidad

Supongamos que tenemos un espacio muestralS. Para cada sucesoA de este espacio muestral,asociamos un número real P(A). Entonces P es una función real que se denominafunción de proba-bilidad y P(A) la probabilidad del sucesoA, si se cumplen los axiomas siguientes:

Axioma 1. Para cada sucesoA, P (A) ≥ 0.

Axioma 2. Para el suceso cierto o seguro:P (S) = 1.

Axioma 3. Para dos sucesos cualesquiera, A y B, la probabilidad del sucesoque se obtenga A o seobtenga B, P (A ∪B), viene dada por

P (A ∪ B) = P (A) + P (B)− P (A ∩ B) (2.2)

que se simplifica cuando los sucesos son mutuamente excluyentes (P (A ∩ B) = 0)

P (A ∪ B) = P (A) + P (B) (2.3)

como se ilustra en el diagramas de Venn de la figura2.1.

Esta propiedad puede generalizarse a cualquier número de sucesos.

18

Page 20: Estadística y Programación Aplicada a la Química

2 2.Teoría estadística de los errores(I). Probabilidad

Figura 2.1: Diagrama de Venn que ilustra el significado deP (A ∩ B).

Algunas consecuencias de estos axiomas son:

☞Para cada suceso P(A):

0 ≤ P (A) ≤ 1 (2.4)

es decir la probabilidad de un suceso está entre cero y uno.

☞El suceso imposible tiene probabilidad nula,P (∅) = 0.

☞Si A’ es el suceso complemento de A entonces:

P (A′) = 1− P (A) (2.5)

2.1.4. Probabilidad condicional

La probabilidad de que dos sucesos A y B ocurran simultáneamente,P (A ∩B), viene dada por

P (A ∩B) = P (A)P (B|A) = P (B)P (A|B) (2.6)

dondeP (B|A) es la probabilidad condicional de que suceda B si ha ocurrido A.

Si A y B son sucesos independientes,P (B|A) = P (B),

P (A ∩B) = P (A)× P (B) (2.7)

19

Page 21: Estadística y Programación Aplicada a la Química

2.2 2.2. Funciones de distribución de probabilidad.

Ejemplo 2. Calculos con probabilidades condicionales

Suponga que dispone de una bolsa con tres bolas rojas y cuatro bolas azules. Calcule la proba-bilidad de extraer una bola roja y después una azul, si (a) no reemplaza la bola extraída, y (b) sereemplaza la bola extraída.(a)

P (R1 ∩ A2) = P (R) P (A|R) =3

7× 4

6= 0,29

P (R) =bolas rojas

bolas=

3

7

P (A|R) =bolas azules

bolas=

4

6

(b)

P (R1 ∩ A2) = P (R) P (A|R) = = P (R) P (A) =3

7× 4

7= 0,24

P (R) =bolas rojas

bolas=

3

7

P (A|R) =bolas azules

bolas=

4

7

2.2. Funciones de distribución de probabilidad.

Debido a los errores aleatorios los resultados de medidas realizadas en idénticas condiciones pro-ducen valores distintos. Esto supone que las medidas experimentales sonmagnitudes aleatorias.

De acuerdo con los posibles resultados de la medida podemos tener:

Magnitudes discretas: pueden tomar valores discretos y corresponden avariables aleatoriasdiscretas.

Magnitudes continuas pueden tomar cualquiera de los valores de un intervalo finito o infinitoy corresponden avariables aleatorias continuas..

En la primera categoría entra un experimento de conteo de fotones. En este se mide el númerode fotones que cuenta un fotomultiplicador en la unidad de tiempo. Este sólo puede ser un númeronatural: 0,1,2,..., 200, . . . , puesto que no podemos contar fracciones de fotón. A la segunda categoríapertenecen las medidas de conductividad de una disolución de electrolitos que pueden tomar cualquiervalor dentro de un intervalo: el resultado de la medida es un número real.

En adelante para hacer referencia a la magnitud aleatoria utilizaremos letras mayúsculas, mientrasque para los resultados de un experimento utilizaremos letras minúsculas.

20

Page 22: Estadística y Programación Aplicada a la Química

2 2.Teoría estadística de los errores(I). Probabilidad

2.2.1. Distribuciones de probabilidad de variables aleatorias discretas.

Sea X una variable aleatoria discreta. Supongamos que los valores que puede tomar estan dadospor x1, x2, x3, . . . ordenados en orden creciente de valor.

La probabilidad de obtener el valorxi, P (xi), viene dada por

P (xi) = f(xi) (2.8)

dondef(xi) es lafunción de probabilidad o función de frecuencia de X.De acuerdo con la definición axiomática de probabilidad,f(xi) cumple:

f(xi) ≥ 0 (2.9)

N∑i=1

f(xi) = 1 (2.10)

donde N es el número total de posibles valores que puede tomar xi.Se define como función de distribución probabilidad acumulada o función de distribución de X,

F (xk) a la probabilidad de que la variable aleatoria tome un valor x tal quex ≤ xk,

F (xk) = P (X ≤ xk) (2.11)

donde xk es cualquier número real en el intervalo -∞ < x < +∞.Es importante que tenga en cuenta que cuando trabajamos conmagnitudes aleatorias discretas:

f(xi), función de probabilidad o función de frecuencia de X. Probabilidad de que la variablealeatoriaX tome el valorxi

F (xi): función de distribución probabilidad acumulada. Probabilidad de que la variable alea-toriaX tome cualquier valor,xj que cumplaxj ≤ xi

¿Cómo se calculaF (xk)?F(xk) se puede calcular a partir de f(x) como

F (xk) =∑

xi≤xk

f(xi) (2.12)

F (xk) es una función monótona creciente.

21

Page 23: Estadística y Programación Aplicada a la Química

2.2 2.2. Funciones de distribución de probabilidad.

Si X toma únicamente un número finito de valores x1, x2, x3, . . . xk entonces la función de distri-bución acumulada viene dada por:

F (xk) =

0 −∞ < xk < x1

f(x1) −∞ < xk < x2

f(x1) + f(x2) −∞ < xk < x3

. . . . . .f(x1) + f(x2) + · · ·+ f(xn) −∞ < xk < xn+1

. . . . . .1 xk < +∞

(2.13)

Ejemplo 3. Cálculo de la función de distribución de probabilidad acumulada,F (xk), deuna variable aleatoria discreta

Considere la variable aleatoria X="número de caras que se obtiene al lanzar cuatro monedas alaire".Determinar las funciones de probabilidad y de distribución de X.

x 0 1 2 3 4f(x) 1

16416

616

416

116

F (xk) puede obtenerse a partir def(x) utilizando la ecuación2.12

F (xk) =∑

xi≤xk

f(xi)

x < 0 x < 1 x < 2 x < 3 x < 4 x ≥ 0F (x) 0 1

16516

1116

1516

1

22

Page 24: Estadística y Programación Aplicada a la Química

2 2.Teoría estadística de los errores(I). Probabilidad

Figura 2.2: Funciones de probabilidad,f(xi) y de distribución de probabilidad acumulada,F (xk)para el ejemplo 3.

23

Page 25: Estadística y Programación Aplicada a la Química

2.2 2.2. Funciones de distribución de probabilidad.

2.2.2. Distribuciones de probabilidad de variables aleatorias continuas

Sea una variable continua X. La función de distribución de probabilidad o función de densidadde probabilidad ,f(x), proporciona la probabilidad de que la magnitud aleatoria se encuente en elintervalo[x, x + dx]

P (x ≤ X ≤ x + dx) = f(x) (2.14)

De acuerdo con la definición axiomática de probabilidad,f(x) cumple:

f(x) ≥ 0 (2.15)

∫ +∞

−∞f(x)dx = 1 (2.16)

La probabilidad de que X se encuentre en el intervalor[a, b] viene dada por

P (a ≤ X ≤ b) =

∫ b

a

f(x)dx (2.17)

Es importante tener en cuenta que para una variable aleatoria continua,P (X = xi) = 0,

P (a ≤ X ≤ b) = P (a ≤ X < b) = P (a < X ≤ b) = P (a < X < b) (2.18)

Figura 2.3: Funciones de densidad de probabilidad,f(x) de una variable aleatoria continua. Signifi-cado deP (a ≤ x ≤ b) =

∫ b

af(x)dx.

24

Page 26: Estadística y Programación Aplicada a la Química

2 2.Teoría estadística de los errores(I). Probabilidad

Por analogía con las funciones de distribución de probabilidad discretas se puede definir lafunciónde distribución de probabilidad integrada de una variable aleatoria continua, F (xi), continua como:

F (xi) = P (X ≤ xi) = P (−∞ ≤ X ≤ xi) =

∫ xi

−∞f(u)du (2.19)

A partir de esta definición se pueden obtener las siguientes relaciones:

P (a ≤ X ≤ b) =

∫ b

a

f(x)dx =

∫ b

−∞f(x)dx −

∫ a

−∞f(x)dx = F (b)− F (a) (2.20)

P (X > a) = 1− P (X ≤ a) = 1− F (a) (2.21)

ya que x>a es el suceso complementario a x≤ a.Algunas propiedades de F(x) son:

En todo el intervalo en que f(x) es continua,

f(x) =dF (x)

dx

Si x2 >x1 tendremos que F(x2) >F(x1). Es decir F(x) es monótona creciente.

F (−∞) = 0 y F (+∞) = 1

Figura 2.4: Funciones de distibución de probabilidad,F (x). Significado deP (a ≤ x ≤ b) = F (b)−F (a)

25

Page 27: Estadística y Programación Aplicada a la Química

2.2 2.2. Funciones de distribución de probabilidad.

Ejemplo 4. Cálculo de la constante de normalización de una función de distribución deprobabilidad, f(x), de una variable aleatoria continua

Hallar la constante c para que la función de densidad de probabilidad

f(x) =

0 x < 0

cx2 0 ≤ x ≤ 30 x > 3

sea una función de distribución de probabilidad y calcular P(1<x<2).Para que f(x) sea una función de distribución de probabilidad debe cumplir la condición (verecuación2.16) ∫ +∞

−∞f(x)dx = 1

Sustituyendo en la ecuación2.16∫ +∞

−∞f(x)dx =

∫ 3

0

c x2dx =1

3cx3

∣∣∣∣30

= 9 c = 1

se obtiene quec = 1/9.Utilizando la ecuación2.17

P (a ≤ X ≤ b) =

∫ b

a

f(x)dx

se obtiene

P (1 ≤ X ≤ 2) =

∫ 2

1

1

9x2dx =

1

27x3

∣∣∣∣21

=7

27

Ejemplo 5. Cálculo de la función de distribución de probabilidad integrada,F (x), de unavariable aleatoria continua

Sea x una variable aleatoria con función de densidad de probabilidad normalizada

f(x) =

0 x < 0

1− x 0 ≤ x ≤ 1x− 1 1 ≤ x ≤ 2

0 x > 2

(a) Determine F(x), (b) calculeP (0 ≤ X ≤ 1) y (c) P (x = 0, 1/2, 1, 3/2, 2).

26

Page 28: Estadística y Programación Aplicada a la Química

2 2.Teoría estadística de los errores(I). Probabilidad

(a) Para calcular F(x) utilizaremos la ecuación2.19

F (x) =

∫ x

−∞f(u)du

Parax < 0, F (x) = 0.En el intervalo0 ≤ x ≤ 1,

F (x) =

∫ x

−∞f(u)du =

∫ x

−∞(1− u) du = t− 1

2t2∣∣∣∣x0

= x− 1

2x2

En el intervalo1 ≤ x ≤ 2,

F (x) =

∫ x

−∞f(u)du =

∫ 1

−∞(1− u) du +

∫ 2

1

(u− 1) du

= t− 1

2t2∣∣∣∣10

+1

2t2 − t

∣∣∣∣x1

=1

2x2 − x + 1

En el intervalox > 2,F (x) = 1, ya que la función de densidad de probabilidad está normalizada.

F (x) =

0 x < 0

x− 12x2 0 ≤ x ≤ 1

12x2 − x + 1 1 ≤ x ≤ 2

1 x > 2

(b) Teniendo en cuenta que - ecuación2.20

P (a ≤ X ≤ b) = F (b)− F (a)

P (0 ≤ X ≤ 1) = F (1)− F (0) = 0,5

(c) P (x = 0, 1/2, 1, 3/2, 2) = P (0) + P (1/2) + P (3/2) + P (2) = 0, por ser la variable x unavariable continua.

27

Page 29: Estadística y Programación Aplicada a la Química

2.2 2.2. Funciones de distribución de probabilidad.

Ejemplo 6. Cálculof(x) a partir de F (x)

Sea x una variable aleatoria con función de distribución de probabilidad

F (x) =

0 x < 0

12x2 0 ≤ x ≤ 1

2x− 12x2 − 1 1 ≤ x ≤ 21 x > 2

Hallar f(x)

f(x) =dF (x)

dx

0 x < 0x 0 ≤ x ≤ 1

2− x 1 ≤ x ≤ 20 x > 2

Concepto de cuantila

Finalmente, se define como laβ cuantila,xβ, el valor de la variable aleatoria X para el que secumple

F (xβ) = P (x ≤ xβ) = β (2.22)

Habitualmente se utilizan las 100β percentila. Por ejemplo, la cuantila 0.1 (o la percentila 10)corresponde al valor de la variable aleatoria,x0,1, tal queF (x0,1) = 0,1.

28

Page 30: Estadística y Programación Aplicada a la Química

2 2.Teoría estadística de los errores(I). Probabilidad

2.3. Ejercicios y problemas

Funciones de distribución de probabilidad

Cuestión 2.1 Elija la mejor respuesta.Considere una variable alatoria continua X. La función de distribución o densidad de probabilidad,f(x),proporciona:

(a) f(x) = P (X = x)

(b) f(x) = P (x < X < x + dx)

(c) f(x) = P (x ≤ X < x + dx)

(d) f(x) = P (x < X ≤ x + dx)

(e)f(x) = P (x ≤ X ≤ x + dx)

(e)f(x) = P (x ≤ X)

(f) Las respuestas b,c,d,e son correctas, ya que son equivalentes(g) Ninguna de las anteriores. La respuesta correcta es .........

Cuestión 2.2 Verdadero o falso. Jusitfique la respuesta.Para una variable alatoria continua X,P (X = xi) = 0

Cuestión 2.3 Indique las respuesta o respuestas correctas.Considere una variable alatoria continua X con función de densidad de probabilidadf(x), P(X<a)viene dado por

(a)∫ a

−∞ f(x)dx (b) 1−∫ a

−∞ f(x)dx (c)∫∞

af(x)dx

(d) 1−∫∞

af(x)dx (e)F (a) (e)1− F (a)

(f) Ninguna de las anteriores.

Ejercicio 2.1 Dada la función de densidad de probabilidad

f(x) =

0 x < 0

19x2 0 ≤ x ≤ 30 x > 3

(a) Encuentre la función de distribución, F(x), correspondiente. (b) Utilice este resultatado paracalcularP (1 ≤ x ≤ 2).

Ejercicio 2.2 La función de distribución de la variable aleatoria X es

F (x) =

{0 x < 0

1− e−2x x ≥ 0

(a) Encuentre la función de densidad, f(x), correspondiente. (b) Utilice las funciones de distribucióny densidad para calcular la probabilidad de que X>2. (c) Utilice las funciones de distribución ydensidad para calcular la probabilidad de que−3 ≤ X ≤ 4.

29

Page 31: Estadística y Programación Aplicada a la Química

2.3 2.3. Ejercicios y problemas

Ejercicio 2.3 Una variable aleatoria X tiene una función de densidad

f(x) =c

x2 + 1

donde−∞ < x < ∞(a) Encuentre el valor de la constante c. (b) Encuentre la probabilidad de queX2 se encuentre

entre 1/3 y 1.

Ejercicio 2.4 Dada la función de distribución de probabilidad

f(x) =

0 x < ak a ≤ x ≤ b0 x > b

Determine el valor de k. ¿Qué valor tendrán esta magnitud si a = -e y b = e?.

2.3.1. Soluciones a los ejercicios

Funciones de distribución de probabilidad

Ejercicio 2.1 (a)

F (x) =

0 x < 0x3

270 ≤ x ≤ 3

1 x > 3

(b) 727

Ejercicio 2.2 (a)

f(x) =

{0 x < 0

2e−2x x ≥ 0

(b) e−4. (c) 1 − e−8

Ejercicio 2.3 (a) De acuerdo con la ecuación2.16∫ +∞

−∞f(x)dx = 1

∫ +∞

−∞

c

x2 + 1dx = c tan−1 x

∣∣∞−∞ = c

[π2−(−π

2

)]= 1

c = 1/π

(b) Si 13≤ X2 ≤ 1, los valores de X pueden estar en los intervalos−

√3

3≤ X ≤ −1 y

√3

3≤ X ≤

1.Por lo tanto la probabilidad requerida es

30

Page 32: Estadística y Programación Aplicada a la Química

2 2.Teoría estadística de los errores(I). Probabilidad

1

π

∫ −√

33

−1

dx

x2 + 1

1

π

∫ √3

3

1

dx

x2 + 1=

2

π

∫ √3

3

1

dx

x2 + 1

=2

π

[tan−1(1)− tan−1(

√3

3)

]=

2

π

[π4− π

6

]=

1

6

2.4. Lecturas recomendadas

Para completar la preparación de este tema recomendamos la lectura de:

☞ Capítulo 1. Magnitudes aleatorias y sus caracterísitcas.del texto de Spiridonov y Lopatkin[7].XRepasa los conceptos básicos de probabilidad y función de distribución de propabilidad. Ade-cuado para revisar la teoría del tema.

☞ Capítulo 2. Variables aleatorias y distribución de probabilidaddel libro de Spiegel y cols.[5].En el capítulo recomendado los autores tratan temas no estudiados en esta asignatura como lasdistribuciones de probabilidad conjunta, ... Se recomienda revisar las secciones cuyos conteni-dos coinciden con los del curso: Variables aleatorias. Distribuciones de probabilidad discreta.Funciones de distribución para variables aleatorias. Funciones de distribución para variablesaleatorias discretas. Funciones de distribución para variables aleatorias continuas. Interpreta-ciones gráficas.También se recomienda la realización de los ejercicios suplementarios 2.47 a 2.53.X

☞ Tema 2. Variables aleatorias y distribuciones de probabilidad.del texto de Walpole y Myers[6].Se recomienda la consulta de las secciones: 1.Concepto de variable aleatoria; 2. Distribucióndiscreta de probabilidad; 3. Distribución continua de probabilidad; y 4. Distribuciones empíri-cas.

31

Page 33: Estadística y Programación Aplicada a la Química
Page 34: Estadística y Programación Aplicada a la Química

3

Teoría estadística de los errores(II). Esperanza matemática

Contenidos ✍ Esperanza matemática de una magnitud aleatoriaDefinición de es-peranza matemática. Propiedades de la esperanza matemática Momentosde una distribución. Media y varianza.✍ Propiedades generales y propiedades muestrales de una magnitudaleatoria Media general de una magnitud aleatoria,µ. Media muestralde una magnitud aleatoria,x. Varianza de una magnitud aleatoria,σ2(x).Dispersion o varinza muestral de una magnitud aleatoria,s2(x).

Objetivos ✓ Comprender el concepto de esperanza matemática✓ Calcular la esperanza matemática ,E {y(x)}, de una funcióny(x) de unavariable aleatoria discreta conocida f(x)✓ Calcular la esperanza matemática ,E {y(x)}, de una funcióny(x) de unavariable aleatoria continua conocida f(x)✓ Conocer y utilizar las propiedades de la esperanza matemática✓ Calcular los momentos de orden k respecto del parámetroc, Mk de unavariable aleatoria discreta o continua✓ Distinguir entre magnitudes generales y mmuestrales✓ Comprender la diferencia entremux y x✓ Comprender la diferencia entreσ2(x) y s2(x)✓ Evaluarmux y σ2(x) de una magnitud aleatoria✓ Calcularla media y la varianza muestral de un conjunto de medidas

33

Page 35: Estadística y Programación Aplicada a la Química

3.1 3.1. Esperanza matemática de una magnitud aleatoria

3.1. Esperanza matemática de una magnitud aleatoria

3.1.1. Magnitudes aleatorias discretas

Sea una magnitud aleatoria discreta,x, y una funcióny(x). Si f(x) es la función de distribuciónde probabilidad de la variablex, se define comoesperanza matemáticade la funcióny(x),

E {y(x)} =k∑

i=1

y(xi) · f(xi) (3.1)

donde la suma se extiende a todos los posibles valores de x.

3.1.2. Magnitudes aleatorias continuas

Sea una magnitud aleatoria continua,x, y una funcióny(x). Si f(x) es la función de densidad deprobabilidad de la variablex, se define comoesperanza matemáticade la funcióny(x),

E {y(x)} =

∫ ∞

−∞y(x) · f(x) dx (3.2)

donde la suma se extiende a todos los posibles valores de x.

3.1.3. Propiedades de la esperanza matemática

Algunas propiedades de la esperanza matemática son:

Si c es una constante (magnitud no aleatoria) tendremos que

E {c} = c (3.3)

E {c y(x)} = c · E {y(x)} (3.4)

Si la magnitud aleatoriax es la suma de n magnitudes aleatorias independientes

x = x1 + x2 + . . . + xn (3.5)

su esperanza matemática es la suma de la esperanza matemática las n magnitudes sumadas

E {x} = E {x1} + E {x2} + . . . + E {xn} (3.6)

34

Page 36: Estadística y Programación Aplicada a la Química

3 3.Teoría estadística de los errores(II). Esperanza matemática

Si la magnitud aleatoriay es una función no lineal de n magnitudes aleatorias independientes

y = f(x1, x2, . . . , xn) (3.7)

que varia poco en intervalos pequeños de variación de los argumentos, el valor deE {y} esaproximadamente

E {y} = f (E {x1} , E {x2} , . . . E {xn}) (3.8)

3.1.4. Momentos de una distribución.

Dada una variable aleatoria, x, discreta o continua, se llamamomento de orden k respecto delparámetro c, Mk a las esperanza matemática de la variable(x− c)k

Mk = E{(x− c)k

}(3.9)

Si c = 0 tenemos losmomentos respecto del origena los que suele representarse porαk

αk = E{(x)k

}(3.10)

Dos momentos de importantes sonα0 = 1 y α1 = µX (valor medio de x o media de x).

α0 = E{(x)0

}= E {1} = 1 (3.11)

α1 = E{(x)1

}= E {x} = µx (3.12)

Si c = µX hablamos demomentos centraleso momentos respecto de la media. Suele represetarseporµk y vienen dados por

µk = E{(x− µx)

k}

(3.13)

Momentos de importantes sonµ0 = 1, µ1 = 0 y µ2 = σ2x (varianza de x).

µ2 = E{(x− µx)

2}

= σ2x (3.14)

35

Page 37: Estadística y Programación Aplicada a la Química

3.1 3.1. Esperanza matemática de una magnitud aleatoria

Ejemplo 1. Cálculo de la media y la varianza de una variable aleatoria discreta

Considere la variable aleatoriaX que tiene la siguiente función de distribución de probabilidad

x 8 12 16 20 24f(x) 1

816

38

14

112

Cálcule la media y la varianza de X.La media viene dada por la ecuación3.12

µx = E {x}

Sustituyendo

µx =∑

x · f(x) = 8 · 1

8+ 12 · 1

6+ 16 · 3

8+ 20 · 1

4+ 24 · 1

12= 16

La varianza viene dada por la ecuación3.14

σ2x = E

{(x− µx)

2}

σ2x = E

{(x− µx)

2}

=∑

(x− 16)2 · f(x)

= (8− 16)2 · 1

8+ (16− 12)2 · 1

6+ (16− 16)2 · 3

8+ (20− 16)2 · 1

4+ (24− 16)2 · 1

12

= 64 · 1

8+ 16 · 1

6+ 0 · 3

8+ 16 · 1

4+ 64 · 1

12= 20

La varianza también viene dada por

σ2x = E

{(x2)

}− µ2

x

E{x2}

=∑

x2 · f(x) = 64 · 1

8+ 144 · 1

6+ 256 · 3

8+ 400 · 1

4+ 24 · 1

12= 276

σ2x = E

{(x− µx)

2}

= 276− (16)2 = 276− 256 = 20

Como muestran los resultados los dos métodos utilizados para calcular la varianza son equiva-lentes.

36

Page 38: Estadística y Programación Aplicada a la Química

3 3.Teoría estadística de los errores(II). Esperanza matemática

Ejemplo 2. Cálculo de la media y la varianza de una variable aleatoria continua

Sea la variable aleatoria X que tiene por función de densidad

f(x) =dF (x)

dx

0 −∞ < a < xk a < x < b0 x < b

Calcular la media y la varianza de X.Antes de poder calcular la media y la varianza tenemos que determinar el valor de k.Para que f(x) sea una función de densidad de probabilidad debe cumplir (ver ecuación2.16)∫ +∞

−∞f(x)dx = 1

Es decir, ∫ b

a

kdx = k · (b− a) = 1

por tantok = 1/(b− a)La media viene dada por (ecuación3.12)

µx = E {x} =

∫ +∞

−∞x · f(x) dx

µx =

∫ b

a

x

b− adx =

b + a

2

La varianza viene dada por la ecuación3.14

σ2x = E

{(x− µx)

2}

que es equivalente a

σ2x = E

{x2}− µ2

x

E{x2}

=

∫ +∞

−∞x2 · f(x) dx =

∫ b

a

x2

b− adx =

1

3

x3

b− a

∣∣∣∣ba

=1

3

b3 − a3

b− a

σ2x =

1

12(b − a)2

37

Page 39: Estadística y Programación Aplicada a la Química

3.2 3.2. Propiedades generales y propiedades muestrales de una magnitud aleatoria

3.2. Propiedades generales y propiedades muestrales de una mag-nitud aleatoria

De acuerdo con los postulados de la teoría estadística de los errores tras un número suficiente-mente grande de experimentos, lo valores obtenidos para la magnitud medida tienden a agruparsealrededor de un valor, y su dispersión alrededor de este valor está caracterizada por una función dedistribución de probabilidad. En general, una vez conocida la forma de la distribución de probabili-dad, basta para caracterizarla un número limitado deconstantes. Estos parámetros que caracterizanal conjunto de todas las medidas que puedan obtenerse de un experimento en ciertas condiciones sedenominanparámetros poblacionales.

El conjunto de medidas obtenidas en una serie experimentos se denominamuestra. Como el nú-mero de medidas que componen la muestra normalmente es pequeño, los parámetros que caracterizanla muestra,propiedades o parámetros muestrales. En general los parámetros muestrales no coincidencon los parámetros poblacionales. Sin embargo, podemos obtener valores aproximados de losparáme-tros poblacionales a partir de los parámetros muestrales (estimas) 1.

Una propiedad de las estimas es que sonvariables aleatoriasmientras que losparámetros po-blacionalesson valores constantes y característicos de la función de distribución de probabilidadasociada a los errores aleatorios.

Finalmente, una cuestión de notación. En esta sección designaremos las propiedades poblaciona-les utilizando el alfabeto griego, mientras que utilizaremos el alfabeto latino para propiedades mues-trales.

Propiedades generales de las estimas

Si T es una estima del parámetro poblacionalθ, T debe cumplir entre otros criterios que

E {T} = µT = θ. Esto equivale a decir que la estima T no es una estima sesgada.

La estima es consistente. Es decir, cuanto mayor es el número de medidas utilizadas para cal-cularT , mayor es la proximidad entre los valores deT y θ

Propiedades muestrales de uso frecuente

Para describir nuestras medidas haremos referencia a dos tipos de propiedades muestrales:

un número alrededor del que las medidas se agrupan:media muestral, x.

un número que da una medida de la dispersión de los valores alrededor de la media:la desvia-ción típica muestral, s(x).

Utilizaremos la media muestral,x como estima del valor real. Como medida de la incertidumbrede cada medida utilizaremos la desviación típica de nuestros datos,s(x), mientras que para acotar laincertidumbre de la estima de la media utilizaremos la desviación típica muestral de la media,s(x).

1Existen distintos métodos para obtener estimas. Algunos de ellos son el método de máxima verosimilitud, el métodode mínimos cuadrados, el método de los momentos y el método Bayesiano. La descripción de estos métodos excede losobjetivos del curso

38

Page 40: Estadística y Programación Aplicada a la Química

3 3.Teoría estadística de los errores(II). Esperanza matemática

3.2.1. Media general de una magnitud aleatoria

El valor medio de la magnitud aleatoria x para el conjunto general es la esperanza matemática dela magnitud aleatoria

µx = E {x} (3.15)

3.2.2. Media muestral de una magnitud aleatoria

La media muestral de la magnitud aleatoria x se define como el valor medio de los valores obser-vados x1,x2, . . . ,xn,

x =x1 + x2 + . . . + xn

n=

1

n∑j=1

xj (3.16)

3.2.3. Varianza de una magnitud aleatoria.

La varianza o dispersión de una magnitud aleatoria x se define como la esperanza matemática delas desviaciones respecto a la media general:

σ2x = E

{(x− µx)

2}

(3.17)

Al valor positivo de la raíz cuadrada de la varianza,σ(x), se le llama desviación cuadrática media,desviación típica o desviación normal.

Algunas propiedades de la varianza son:

Si c es una constante (magnitud no aleatoria) tendremos que:

σ2(c) = 0 (3.18)

σ2(c x) = c2 σ2(x) (3.19)

Si la magnitud aleatoriax es la suma de n magnitudes aleatorias independientes

x = x1 + x2 + . . . + xn (3.20)

la varianza dex es la suma de las varianzas de las n magnitudes sumadas

σ2(x) = σ2(x1) + σ2(x2) + . . . + σ2(xn) (3.21)

39

Page 41: Estadística y Programación Aplicada a la Química

3.2 3.2. Propiedades generales y propiedades muestrales de una magnitud aleatoria

Sin embargo,σ(x) viene dado por

σ(x) =√

σ2(x1) + σ2(x2) + . . . + σ2(xn) (3.22)

La varianza se puede calcular a partir de los momentos respecto del origenα1 y α2:

σ2(x) = E{x2}− µ2

x (3.23)

Si la magnitud aleatoriay es una función no lineal de n magnitudes aleatorias independientes

y = f(x1, x2, . . . , xn) (3.24)

que varia poco en intervalos pequeños de variación de los argumentos, el valor deσ2(y) esaproximadamente

σ2(y) =

(∂f

∂x1

)2

σ2(x1) +

(∂f

∂x2

)2

σ2(x2) + . . .

(∂f

∂xn

)2

σ2(xn) (3.25)

Esta propiedad es útil para el cálculo de la incertidumbre de magnitudes complejas.

Ejemplo 3. Varianza de una magnitud indirecta

Utilizando un puente de Wheatstone, la resistencia de una disolución de electrolitos,W , puedecalcularse mediante la ecuación

W = R · 1000− a

a= R ·

(1000

a− 1

)dondeR es el valor de una resistencia patrón conocida ya es la lectura de la resistencia que seobtiene experimentalmente cuando se equilibra el puente de Wheatstone.Calcule la incertidumbre deW . Considere que la incertidumbre deR es despreciable.De acuerdo con la ecuación3.30

σ2(y) =

(∂f

∂x1

)2

σ2(x1) +

(∂f

∂x2

)2

σ2(x2) + . . .

(∂f

∂xn

)2

σ2(xn)

que en nuestro caso se reduce a

σ2(W ) =

(∂W

∂a

)2

σ2(a)

40

Page 42: Estadística y Programación Aplicada a la Química

3 3.Teoría estadística de los errores(II). Esperanza matemática

(∂W

∂a

)= −R · 1000

a2

σ2(W ) = R2 · 106

a4σ2(a)

Ejemplo 4. Varianza de una magnitud indirecta (II)

Determine la incertidumbre en la medida de la entalpia para la reacción

NH3(g) + 54O2(g) � O(g) + 3

2H2O(g) ∆Hr R.1

Considere las reacciones:

H2O(g) � H2O(l) ∆H2 R.2

12N2(g) + 3

2H2(g) � NH3(g) ∆H3 R.3

12H2(g) + 1

2O2(g) � H2O(g) ∆H4 R.4

12NO(g) � 1

2N2(g) + 1

2O2(g) ∆H5 R.5

Utilizando la ley de Hess podemos expresar∆Hr en función de las entalpias de las reaccionesR.2 a R.5

∆Hr = −3

2∆H2 − ∆H3 +

3

2∆H4 − ∆H5

y de acuerdo con las propiedades de la dispersión muestral, ecuación3.30, la incertidumbre en∆Hr es

σ2(∆Hr) = (3

2)2σ2(∆H2) + σ2(∆H3) + (

3

2)2σ2(∆H4) + σ2(∆H5)

41

Page 43: Estadística y Programación Aplicada a la Química

3.2 3.2. Propiedades generales y propiedades muestrales de una magnitud aleatoria

3.2.4. Dispersion o varinza muestral de una magnitud aleatoria

La dispersión muestral de una magnitud aleatoria prodría definirse como

s∗2 =1

n

n∑j=1

(xj − µx)2 (3.26)

Esta expresión presupone que conocemos el valor deµx. Como sólo disponemos de una estima deesta magnitud, la media muestral,x. Si sustituimos la media muestral por la media poblacional con loque tendriamos:

s∗2 =1

n

n∑j=1

(xj − x)2 (3.27)

Sin embargo cuando comprobamos la propiedades de esta estma observamos que la estima deσ(x)2

que obtenemos,s∗2 es una estima sesgada:E{s∗2} < σ2(x).Podemos obtener una buena estima sustituiyendo N en el cociente en la expresión de s2∗ por el

número de grados de libertad. El número grados de libertad es el número de observaciones indepen-dientes, es decir aquellas en exceso a las necesarias para determinar los parametros que aparecen enla ecuación. En este caso, el número de grados de libertad es N-1 pues al menos necesitamos 1 datopara determinar la media muestral.

s2(x) =1

n− 1

n∑j=1

(xj − x)2 (3.28)

En este casoE{s2(x)} = σ2(x). s2(x) es la varianza muestral de x.Como en el caso de la varianza, si la magnitud aleatoriay es una función no lineal de n magnitudes

aleatorias independientes

y = f(x1, x2, . . . , xn) (3.29)

que varia poco en intervalos pequeños de variación de los argumentos, el valor des2(y) es aproxima-damente

s2(y) ≈(

∂f

∂x1

)2

s2(x1) +

(∂f

∂x2

)2

s2(x2) + . . .

(∂f

∂xn

)2

s2(xn) (3.30)

Esta propiedad es útil para el cálculo de la incertidumbre de magnitudes complejas o indirectas2.

2Cálculos de propagación de errores

42

Page 44: Estadística y Programación Aplicada a la Química

3 3.Teoría estadística de los errores(II). Esperanza matemática

Ejemplo 5. Calculo de la media y la varianza muestral

En una serie de experimentos para determinar la entalpia neutralización del HCl y NaOH a300 K se obtuvieron los siguientes valores:

∆H(kcal/mol) : 54,4, 56,4, 57,5, 56,6, 57,0, 56,5, 58,4, 57,0, 55,2

Determine el valor de media y la desviación típica de las medidas.La media muestral viene dada por la ecuación3.16

x =x1 + x2 + . . . + xn

n=

1

n∑j=1

xj

mientras que la varianza muestral se calcula utilizando la ecuación3.28

s2(x) =1

n− 1

n∑j=1

(xj − x)2

Medida xi xi − x (xi − x)2

1 54.4 -2.15 4.62252 56.4 -0.16 0.02563 57.5 0.94 0.88364 56.6 -0.04 0.00165 57.0 0.44 0.19366 56.5 -0.06 0.00367 58.4 1.84 3.38568 57.0 0.44 0.19369 55.2 -1.36 1.8496

SUMA 509.0 0.0 11.593

Sustituyendo en las ecuaciones3.16y 3.28se obtienex = 509,0/9 = 56,56 kcal.mol−1.s2 = 11,1593/8 = 1,3949( kcal.mol−1)2 y s = 1,18 kcal.mol−1.El resultado final∆H = 56,6± 1,2 kcal.mol−1.

43

Page 45: Estadística y Programación Aplicada a la Química

3.3 3.3. Mediana y moda

3.3. Mediana y moda

La media, o esperanza, de una variable aleatoria X proporcion una medida de la tendencia centralpara los valores de una distribución. Otras medidas de la tendencia central frecuentemente usadas son:

Moda Para una variable aleatoria discreta es el valor que ocurre con más frecuencia o, en el que tienela mayor probabilidad de ocurrencia. Algunas veces tenemos dos, tres o más len probabilidadesrelativamente grandes de ocurrencia. En tales casos, decimos que la bimodal, trimodal o multi-modal, respectivamente.En el caso de una variable aleatoria continua X es el valor o valores de X donde la función dedensidad de probabilidad tiene un máximo relativo.

Mediana Valor de x para el cualP (X < x) = 12

y P (X > x) ≤ 12. En el caso de una variable

continua tenemosP (X < x) = 12

= P (X > x), y la mediana separa la curva de densidad endospartes con áreas iguales de 1/2 cada una. En el caso de una distribución discreta, no existeuna mediana única

44

Page 46: Estadística y Programación Aplicada a la Química

3 3.Teoría estadística de los errores(II). Esperanza matemática

3.4. Ejercicios y problemas

Cuestión 3.1 Demuestre

µ0 = 1

Cuestión 3.2 Demuestre

µ1 = 0

Cuestión 3.3 Demuestre

σ2x = E

{x2}− µ2

x

Cuestión 3.4 Verdadero o falso. Jusitfique la respuesta.La media muestral,x es una variable aleatoría

Cuestión 3.5 Verdadero o falso. Jusitfique la respuesta.La varianza,σ2(x) es una variable aleatoría

Cuestión 3.6 Verdadero o falso. Jusitfique la respuesta.La mediaµx y la varianzaσ2(x) son dos propiedas características de una variable aleatoria

Esperanza matemática de una magnitud aleatoria

Ejercicio 3.1 Dada la función de densidad de probabilidadSea la variable aleatoria X que tiene por función de densidad

f(x) =dF (x)

dx

0 −∞ < x < 0x 0 ≤ x < 1

2− x 1 ≤ x ≤ 20 x > 2

Calcular la media y la varianza de X.

Calculo de magnitudes muestrales

Ejercicio 3.2 Al realizar cinco medidas del indice de refracción de una mecla se obtuvieron lossiguientes valores:

1.591, 1.521,1.528,1.570,1.587

45

Page 47: Estadística y Programación Aplicada a la Química

3.4 3.4. Ejercicios y problemas

Ejercicio 3.3 Los resultados de una serie de medidas de la temperatura con un termometro agrupa-dos en clases de anchura 0.1 K son

T / K 298 298.1 298.2 298.3 298.4 298.5Fi 0.2 0.2 0.3 0.1 0.1 0.1

Dibuje el histograma asociado a estos datos.

Ejercicio 3.4 En una serie de experimentos se determino la capacidad de absorber metales pesadospresentes en el medio natural de ciertas especies de pescado. Los siguientes datos corresponden amedidas de la concentración promedio de cadmio (mg Cd por Kg de pez) para una especie en distintosbancos del Atlántico.

13.1 8.4 16.9 2.7 9.6 4.5 12.55.5 12.7 17.1 10.8 18.9 27.0 18.06.4 13.1 8.5 7.5 12.1 8.0 11.45.1 5.6 5.5 5.0 10.1 4.5 7.97.9 8.9 3.7 9.5 14.1 7.7 5.76.5 10.8 14.7 14.4 5.1

Determine la media y la desviación típica de los datos. Dibuje el histograma correspondiente.

Ejercicio 3.5 Una medida de la eficiencia de una torre de destilación es la velocidad de producciónde vapor. En la tabla se recogen una serie de valores correspondientes a esta propiedad.

1170 1620 1495 1170 1710 1710 15301260 1440 1800 1170 1260 1170 16401800 1800 1530 1350 1800 1530 11701440 1530 1260 1350 1350 1350 14401170 1710 1620 1350 1730 1800 18001530 1440 1620

Determine la media y la desviación típica de los datos. Dibuje el histograma y diagrama defrecuencias asociado a estos datos. ¿Por debajo de que valor se encuentra el 90 % de los datos?.

3.4.1. Soluciones a los ejercicios

Esperanza matemática de una magnitud aleatoria

Ejercicio 3.1 La media viene dada por (ecuación3.12)

µx = E {x} =

∫ +∞

−∞x · f(x) dx

46

Page 48: Estadística y Programación Aplicada a la Química

3 3.Teoría estadística de los errores(II). Esperanza matemática

µx =

∫ 1

0

x · x dx +

∫ 2

1

x · (2− x) dx

=x3

3

∣∣∣∣10

+ x2 − x3

3

∣∣∣∣21

=1

3+

2

3= 1

La varianza viene dada por la ecuación3.14

σ2x = E

{(x− µx)

2}

= E{x2}− µ2

x

E{x2}

=

∫ 1

0

x2 · x dx +

∫ 2

1

x2 · (2− x) dx

=x4

4

∣∣∣∣10

+2x3

3− x4

4

∣∣∣∣21

=1

4+

14

3− 15

4=

7

6

σ2x =

7

6− (1)2 =

1

6

3.5. Lecturas recomendadas

Para completar la preparación de este tema recomendamos la lectura de:

☞ Capítulo 1. Magnitudes aleatorias y sus caracterísitcas.del texto de Spiridonov y Lopatkin[7].XRevisa los contenidos del tema. Adecuado para revisar la teoría del tema.

☞ Capítulo 3. Esperanza matemáticadel libro de Spiegel y cols.[5].En el capítulo recomendado los autores tratan temas no estudiados en esta asignatura como lasfunciones generatrices, ... Se recomienda revisar las secciones cuyos contenidos coinciden conlos del curso.Se recomienda revisar los ejercicios resueltos 3.1, 3.2, 3.19(a).X

☞ Tema 3.Esperanza matemática.del texto de Walpole y Myers[6].Se recomienda la consulta de las secciones: 1. Media de una variable aleatoria, 2. Varianza ycovarianza.

47

Page 49: Estadística y Programación Aplicada a la Química
Page 50: Estadística y Programación Aplicada a la Química

4

Distribuciones de probabilidad de variables aleatorias discretas

Contenidos ✍ Distribución uniforme Descripción y propiedades.✍ Distribución binomial Descripción y propiedades. Teorema de Moivre.✍ Distribución de PoissonDescripción y propiedades. La distribuciónde Poisson como límite de la distribución binomial. Convergencia de ladistribución de Poisson a la distribución de Gauss.

Objetivos ✓ Reconocer las características de la distribución uniforme de una variablealeatoria discreta✓ Reconocer las características de un experimento de Bernuilli✓ Realizar calculos de probabilidades de variables aleatorias que siguen undistribución binomial✓ Calcularµ y σ de variables que siguen un distribución binomial✓ Utilizar el teorema de Moivre para calcular probabilidades de resultados deun experimento de Bernuilli utilizando una distribución normal✓ Realizar calculos de probabilidades de variables aleatorias que siguen undistribución de Poisson✓ Calcularµ y σ de variables que siguen un distribución de Poisson✓ Utilizar la distribución normal para calcular probabilidades de resultadosde un experimento de Poisson✓ Utilizar la distribución de Poisson para calcular probabilidades de resul-tados de un experimento de Bernuilli en el límite de probabilidades de exitobajas y número de pruebas grande

49

Page 51: Estadística y Programación Aplicada a la Química

4.2 4.1. Distribución uniforme

4.1. Distribución uniforme

¿Qué variables aleatorias siguen esta función de probabilidad?. Esta distribución de probabilidadcorresponde a variables aleatorias discretas que pueden tormar n valores, xi= x1, x2,..., xn y todos susposibles valores tienen la misma probabilidad.

La función de distribución de probabilidad es

f(x) = P (X = xi) =1

ndondei = 1, 2, . . . , n (4.1)

La media y la varianza de la distribución vienen dadas por

µ =n + 1

2(4.2)

σ2 =n2 − 1

12(4.3)

Ejemplo 1. Distribución de probabiblidad uniforme

Considere la variable aleatoriaX que corresponde a lanzar un dado y leer la cara superior deldado. Si el dado no está trucado, todos los resultados tienen la misma probabilidad y la funciónde distribución de probabilidad de esta variable aleatoria es

x 1 2 3 4 5 6f(x) 1

616

16

16

16

16

El diagrama de barras muestra la función de distribución de probabilidad.

50

Page 52: Estadística y Programación Aplicada a la Química

4 4. Distribuciones de probabilidad de variables aleatorias discretas

4.2. Distribución binomial

¿Qué variables aleatorias siguen esta función de probabilidad?. Las variables que siguen la distri-bución binomial corresponden a los experimentos que cumplen

tenemos un número fijon de experimentos (pruebas)

el resultado de cada experimento sólo puede tener dos valores (exitoy fracaso)

el resultado de un experimento es independiente de los anteriores y no influye en los posteriores

Estos experimentos también son conocidos comopruebas de Bernuilli.Seap (probabilidad de éxito) la probabilidad de que un suceso ocurra en una sola prueba de

Bernuilli y q = 1− p (probabilidad de fracaso) será la probabilidad de que ocurra el suceso opuesto. La probabilidad de obtenerx éxitos enn ensayos (x éxitos,n− x fracasos) esta dada por la funciónde probabilidad

f(x) = P (X = x) = PB(X = x; n, p) =

(n

x

)pxqn−x =

n!

x!(n− x)!pxqn−x (4.4)

donde la variable aleatoria X denota el número de éxitos enn pruebas. Esta función de probabilidaddiscreta se denominadistribución binomial o de Bernuilli. Una variable aleatoria con está distribu-ción de probabilidad se dice que está distribuida binomialmente.

La media y la varianza de la distribución vienen dadas por

µ = np (4.5)

σ2 = npq = np(1− p) (4.6)

Ejemplo 2. Cálculo de probabiblidades de una variable binomial

Determine la probabilidad de obtener 2 caras en un seis lanzamientos de una moneda al aire.¿Es este experimento una prueba de Bernuilli?

tenemos un número fijo de experimentosn = 6

el resultado de cada experimento sólo puede tener dos valores (cara, p = 0,5 y cruz,q = 0,5)

el resultado de cada experimento (lanzar una moneda al aire) es independiente de losanteriores y no influye en los posteriores

Utilizando la ecuación4.4calcularemos la probabildad del resultado

PB(X = 2; 6, 0,5) =

(6

2

)0,520,56−2 =

6!

2!4!0,520,54 = 15× 0,25× 0,0625 = 0,235

51

Page 53: Estadística y Programación Aplicada a la Química

4.2 4.2. Distribución binomial

Ejemplo 3. Cálculo de probabiblidades de una variable binomial (II)

Suponga que la probabilidad de que los resultados de un experimento sean aceptables es 0.6.Si el experimento se repite 5 veces, obtenga la distribución de resultados útiles y determine laprobabilidad de obtener al menos dos resultados útiles.¿Estamos ante una prueba de Bernuilli?.

tenemos un número fijo de experimentosn = 5

el resultado de cada experimento sólo puede tener dos valores (resultado aceptable,p =0,6 y resultado no aceptable,q = 0,4). Tenga en cuenta que no nos estamos preguntandopor el valor de la propiedad que medimos, sino por la validez del experimento.

los resultado de cada experimento son independientes entre si

Para deteminar la función de distribución utilizaremos la ecuación4.4p = 0,6, q = 1−0,6 = 0,4y n = 5

PB(X = 0; 5, 0,6) =(50

)0,600,45 = 0,01024 PB(X = 1; 5, 0,6) =

(51

)0,610,44 = 0,07680

PB(X = 2; 5, 0,6) =(52

)0,620,43 = 0,23040 PB(X = 3; 5, 0,6) =

(53

)0,630,42 = 0,34560

PB(X = 4; 5, 0,6) =(54

)0,640,41 = 0,2592 PB(X = 5; 5, 0,6) =

(55

)0,650,40 = 0,07776

De modo que la función de distribución de probabilidad viene dada por

x 0 1 2 3 4 5f(x) 0.01024 0.07680 0.23040 0.34560 0.2592 0.07776

El diagrama de barras muestra la función de distribución de probabilidad.

52

Page 54: Estadística y Programación Aplicada a la Química

4 4. Distribuciones de probabilidad de variables aleatorias discretas

La probabilidad de realizar más de dos experimentos con resultados aceptables podemos calcu-larla como

P (X > 2) = P (X = 3) + P (X = 4) + P (X = 5) = 0,6826

También podemos tener en cuenta que el suceso complementario del calculado es obtenerX ≤ 2y utilizando la ecuación2.5podemos calcular la probabilidad

P (X > 2) = 1− P (X ≤ 2) = 1− (P (X = 2) + P (X = 1) + P (X = 0)) = 0,68256

los dos tratamientos que son equivalentes como esperabamos

Ejemplo 4. Cálculo de la varianza de una variable descrita por un distribución binomial

Un físico de partículas hace medidas de la distribución angular de mesones K. Los resultados dela medida pueden serhacia delante o hacia atrás. Ambos procesos son igualmente probables.En un experimento de calibrado se realizaron 1000 medidas y se obtuvieron 472 mesones en ladirecciónhacia delantey 528 mesones en la direcciónhacia atrás. ¿Cuál es la desviación típicade los resultados?.El experimento descrito cumple con las condiciones de un experimento de Bernouilli con unaprobabilidad de éxitop = 0,5.Para calcular la desviación típica del experimento utilizaremos la ecuación4.6

σ2 = npq = np(1− p) (4.7)

σ =√

np(1− p) (4.8)

Sutituyendo,

σ =√

1000× 0,5× 0,5 = 15,8 (4.9)

Ejemplo 5. Cálculo de patrones de intensidad en un espectro de masas

Considere un halocarburo trisustituidoRX3. Si el sustituyente es Br, éste presenta dos isótoposde masas 79 y 81, con abundancias relativas 0.5069 y 0.4931.Determine cuantos picos esperaría observar en el espectro de masas delRBr3 y que intensidadrelativa esperaría que tuvieran los picos del espectro.En un espectro de masas se representa intensidad frente a masa de modo que la intensidad obte-nida a una masa dada,M , es proporcional al número de moléculas de masaM presentes en lamuestra.

53

Page 55: Estadística y Programación Aplicada a la Química

4.2 4.2. Distribución binomial

Si X1 ≡ Br79 y X2 ≡ Br81, los isotopos de bromo pueden presentarse en la especieRBr3 en lascombinaciones

RX1X1X1, RX1X1X2 , RX1X2X2 y RX2X2X2

Es decir, aparecerán cuatro picos en el espectro de masas distintas.La intensidad relativa de los picos depende de la frecuencia con la que se observe cada una delas combinaciones. Como estamos trabajando con número de moléculas muy grandes� 1019,podemos suponer que la intensidad relativa con la que observamos cada pico, que depende dela frecuencia con la que observamos cada una de los halocarburos, es igual a la probailidad deobservar un halocarburo de la masa indicada.La probabilidad de obtener cada halocarburo viene dada por una distribución binomial conn =3, p = 0,5069 y q = 0,4931.

P (RBr793 ) = PB(X = 3; 3, 0,5069) =

(3

3

)0,506930,49310 = 0,1302

P (RBr792 Br81) = PB(X = 2; 3, 0,5069) =

(3

2

)0,506920,49311 = 0,3801

P (RBr79Br812 ) = PB(X = 1; 3, 0,5069) =

(3

1

)0,506910,49312 = 0,3698

P (RBr813 ) = PB(X = 0; 3, 0,5069) =

(3

0

)0,506900,49313 = 0,1199

La distribución de intesidades de los picos puede representrase con un diagrama de barras dondeM es la masa de la especieRBr79

3 , M + 2 es la masa de la especieRBr792 Br81, M + 3 es la masa

de la especieRBr79Br812 , y M + 3 la masa de la especieRBr81

3 .

54

Page 56: Estadística y Programación Aplicada a la Química

4 4. Distribuciones de probabilidad de variables aleatorias discretas

4.2.1. Teorema de Moivre

Para tamaños de la muestra tales que los valores del producto npq>5 (tamaños de muestra gr-nades), el comportamiento de la distribución binomial se asemeja al de una distribución normal conmediaµ = np y varianzaσ2 = npq. Esta propiedad es conocida como teorema de Moivre.

Como la distribución binomial es una distribución de variables discretas, hay que hacer una correc-ción de continuidad de modo que al utilizar la aproximación de la distribución binomial a una distri-bución gaussiana las probabilidades se calculan como

PB(X = a; n, p) =PG(a− 0,5 ≤ X ≤ a + 0,5)

PB(a < X < b; n, p) =PG(a + 0,5 ≤ X ≤ b− 0,5)

PB(a ≤ X ≤ b; n, p) =PG(a− 0,5 ≤ X ≤ b + 0,5)

Este teorema permite calcular de una manera sencilla valores de la probabilidad de una distribu-ción binomial en condiciones en las que es imposible evaluar esta magnitud utilizando la ecuación4.4

PB(X = x; n, p) =n!

x!(n− x)!pxqn−x (4.10)

4.3. Distribución de Poisson

Esta distribución describe el número de sucesos que ocurren en un intervalo de tiempo fijo oen un volumen del espacio o por unidad de producto dado cuando los elementos están distribuidosaleatoriamente de acuerdo con una frecuencia de ocurrencia o densidad promedio. Es decir, el númerode éxitos que observamos en cada unidad de tiempo, área o producto es totalmente al azar (sóloconocemos su valor medio) y que cada intervalo de tiempo es independiente de otro intervalo dado,así como cada área es independiente de otra área dada y cada producto es independiente de otroproducto dado.

Esta definición es un tanto abstracta y se comprende mejor con algunos ejemplos de variablesque tienen este comportamiento: número de partículas emitidas por una fuente radiativa en un tiempodefinido, número de fotones emitidos por una molécula en su desexcitación fluorescente desde unestado excitado, número de errores cometidos por página al transcribir un texto,número de bacteriaspor cm2 de cultivo, etc.

El espacio muestral de la variable X distribuida de acuerdo con una distribución de Poisson sonlos enteros {0,1,2, ...} y la función de distribución viene dada por:

f(x) = P (X = x) =1

x!λxe−λ x = 0, 1, 2, . . . (4.11)

dondeλ es una constante positiva.La media y la varianza de esta distribución vienen dadas por

µ = λ (4.12)

55

Page 57: Estadística y Programación Aplicada a la Química

4.3 4.3. Distribución de Poisson

σ2 = λ (4.13)

Ejemplo 6. Cálculo de la varianza de una variable que sigue una distribución de Poisson

Como parte de un experimento para determinar la vida media de dos isótopos radiactivos deplata, se registraron simultáneamente el número de partículas emitidas en intervalos de dos se-gundos en las cercanías de la plata. Los experimentos se repitieron 20 veces y se obtuvo un valormedio de 1.69 partículas por segundo.¿Cuál es la desviación típica de las medidas?.La distribución de Poisson describe el número de sucesos que ocurren en un intervalo de tiempofijo cuando los elementos están distribuidos aleatoriamente de acuerdo con una frecuencia deocurrencia.De modo queµ = λ = 1,69 y σ2 = λ = 1,69. La desviación típica viene dada por

σ =√

λ =√

1,69 = 1,30 partículas por segundo

Ejemplo 7. Cálculo de probabilidades de una variable que sigue una distribución de Poisson

En un experimento de detección de neutrinos se observaron 8 neutrinos coincidentes con laobservación óptica de la explosión de la supernova 1987A.(a) Calcule la probabilidad de realizar esta observación si en promedio se detectan 2 neutrinospor día.(b) Calcule la probabilidad de la observación teniendo en cuenta que los ocho neutrinos se ob-servaron en el espacio de 10 minutos.(a)λ = 2 neutrinos.dia−1

Utilizando la ecuación4.11

P (X = x) =1

x!λxe−λ (4.14)

P (X = 8) =1

8!28e−2 = 9,0 10−4 (4.15)

La probabilidad es muy baja. Puede esperarse una correlación entre la explosión de la supernovay la detección de los neutrinos.(b) En este casoλ = 2

24∗6 = 0,014Utilizando de nuevo la ecuación4.11

P (X = 8) =1

8!0,0148e−0,014 = 3,3 10−20 (4.16)

La ocurrencia del suceso obsevado es extremadamente improbable y posiblemente se correlacio-ne con la explosión de la supernova u otro proceso no observado.

56

Page 58: Estadística y Programación Aplicada a la Química

4 4. Distribuciones de probabilidad de variables aleatorias discretas

4.3.1. La distribución de Poisson como límite de la distribución binomial

La distribución de Poisson también representa el límite de la distribución binomial cuando el nú-mero de éxitos es mucho menor que el número de ensayos (µ � n), es decirn grande y probabilidadde un éxito muy baja (p � 1)

Ejemplo 8. Cálculo de probabilidades: comportamientos límite

La probabilidad de que un individuo sufra una reacción al inyectarle un suero es 0.001. Deter-minar la probabilidad de que de un total de 2000 personas más de dos individuos sufran unareacciónEl caso descrito corresponde a un experimento de Bernouilli conµ = np = 2000 · 0,001 = 2.Utilizar la ecuación4.4

PB(X = x; n, p) =n!

x!(n− x)!pxqn−x (4.17)

no es un método razonable para calcular probabilidades de ocurrencia.Teniendo en cuenta queµ = λ = 2 � 2000 podemos utilizar en nuestros cálculos la ecuación4.11

P (X = x) =1

x!λxe−λ (4.18)

La probabilidad de que más de dos individuos sufran reacción viene dada por

P (X > 2) =1− P (X ≤ 2) = P (0) + P (1) + P (2)

=

[20 e−2

0!+

21 e−2

1!+

22 e−2

2!

]= 0,323

57

Page 59: Estadística y Programación Aplicada a la Química

4.3 4.3. Distribución de Poisson

4.3.2. La distribución de Gaussiana o normal como límite de la distribuciónde Poisson

Para valores grandes deλ la función de distribución de Poisson puede aproximarse mediante unadistribución de probabilidad gaussiana conµ = λ y σ2 = λ.

Figura 4.1: Distribuciones de Poisson para distintos valores deλ. Observe como la forma de la distri-bución se aproxima a distribución normal conforme aumenta el valor deλ.

58

Page 60: Estadística y Programación Aplicada a la Química

4 4. Distribuciones de probabilidad de variables aleatorias discretas

Figura 4.2: Relación entre las distribuciones binomial, Poisson y Gauss o normal.

4.4. Ejercicios y problemas

Cuestión 4.1 Considere una distribución binomialPB(x; n, p) con n = 6, y p=0.5.Calcule su media.

Cuestión 4.2 Considere una distribución binomialPB(x; n, p) con n = 6, y p=0.5.Calcule la varianza.

Cuestión 4.3 Considere una distribución binomialPB(x; n, p) con n = 6, y p=0.25.Calcule su media.

Cuestión 4.4 Considere una distribución binomialPB(x; n, p) con n = 6, y p=0.25.Calcule la varianza.

Cuestión 4.5 En la realización de un programa informático el número de errores cometidos porpágina sigue una distribución de Poisson de varianza 2.

¿Cuál es la probabilidad de no cometerlos en un programa de 20 páginas?

59

Page 61: Estadística y Programación Aplicada a la Química

4.4 4.4. Ejercicios y problemas

Ejercicios de repaso

Ejercicio 4.1 En la teoría cinética de los gases, la probabilidad de que una molécula de un gas idealtenga una velocidad entre v y v + dv está dada por

P (v) = cv2e−mv2

2kT dv

donde k es la constante de Boltzmann y T la temperatura en Kelvin del gas.Determine (a) la constante c, (b) la velocidad media y (c) la velocidad más probable.Nota: Para resolver el problema utilice una tabla de integrales.

Ejercicio 4.2 La duración en horas de un componente eléctrico es una variable aleatoria con unafunción de distribución acumulada dada por

F (X) =

{1− e−

x50 x > 0

0 x ≤ 0

Determine:(a)la función densidad de probabilidad y (b) la probabilidad de que la duración del com-ponente exceda las 70 horas.

Ejercicio 4.3 Calcular la varianza deg(x) = 2x + 3, donde X es una variable aleatoria con distri-bución de probabilidad

x 0 1 2 3f(x) 1

418

12

18

Ejercicio 4.4 Sea X una variable aleatoria con la siguiente distribución de probabilidad:

x -3 6 9f(x) 1

618

12

Calculeµg(x) dondeg(x) = (2x + 1)2.

Distribución binomial

Ejercicio 4.5 Se considera una variable aleatoria de Bernoulli que toma el valor 1 con probabilidad0.01. Se toma una muestra de tamañoo n.

Calcular el valor mínimo que debe tener n para que la probabilidad de obtener al menos una vezcomo resultado un 1 sea mayor o igual que 0.95.

Ejercicio 4.6 Si la probabilidad de que el vapor se condense en un tubo de aluminio de cubiertadelgada a 10 atm de presión es de 0.40, si se prueban 12 tubos de ese tipo y bajo esas condiciones,determine la probabilidad de que: a) el vapor se condense en 4 de los tubos, b) en más de 2 tubos secondense el vapor, c) el vapor se condense en exactamente 5 tubos.

60

Page 62: Estadística y Programación Aplicada a la Química

4 4. Distribuciones de probabilidad de variables aleatorias discretas

Ejercicio 4.7 La probabilidad de que el nivel de ruido de un amplificador de banda ancha exceda de2 dB (decibelios) es de 0.15, si se prueban 10 amplificadores de banda ancha, determine la probabi-lidad de que; a) en solo 5 de los amplificadores el nivel de ruido exceda los 2 dB, b) por lo menos en2 de los amplificadores, el ruido exceda de 2 dB, c) encuentre el número esperado de amplificadoresque se exceden de un nivel de ruido de 2 dB y su desviación estándar.

Ejercicio 4.8 En un experimento se comprobó que la aplicación de un tratamiento químico aumen-taba la resistencia a la corrosión de un material en un 80 % de los casos.

Si se tratan ocho piezas, determine(i) Probabilidad de que el tratamiento sea efectivo para más de cinco piezas.(ii) Probabilidad de que el tratamiento sea efectivo para al menos tres piezas.(iii) Número de piezas para las que espera que el tratamiento sea efectivo.

Ejercicio 4.9 Considere el espectro de masas de un halocarburoCnH2n+2−xClx con x = 1,2 y 3.Suponiendo que n = 3 y que dispone de una muestra en la que los tres compuestos están presentes enigual concentración, determine las masas en las que esperaría encontrar un pico en el espectro y laintensidad relativa de los picos. Tenga en cuenta que el cloro presenta dos isótopos Cl35 y Cl37 conabundancias relativas 0.67 y 0.33 respectivamente. Suponga que todo el hidrogeno y el carbono delas muestras corresponde a los isótopos H1 y C12.

Ejercicio 4.10 Se dispone de un cristal que tiene dos tipos de impurezas que absorben radiación dela misma longitud de onda. Una de ellas emite un electrón tras la absorción de un fotón, mientrasque la segunda no emite electrones. Las impurezas están en igual concentración y distribuidas ho-mogeneamente en el cristal. Sin embargo, la sección eficaz de absorción, que es una medida de laprobabilidad de absorber un fotón, es 90 veces mayor para la impureza que emite electrones que elde la impureza que no los emite.

Suponiendo que sobre el cristal inciden 200 fotones y que este es lo suficientemente grande paraabsorber todos, calcule la probabilidad de que al menos se emitan tres electrones.

Distribución de Poisson

Ejercicio 4.11 Si un banco recibe en promedio 6 cheques sin fondo por día, ¿cuáles son las proba-bilidades de que reciba, a) cuatro cheques sin fondo en un día dado, b) 10 cheques sin fondos encualquiera de dos días consecutivos?

Ejercicio 4.12 En la inspección de una hojalata producida por un proceso electrolítico continuo, seidentifican 0.2 imperfecciones en promedio por minuto.

Determine las probabilidades de identificar a) una imperfección en 3 minutos, b) al menos dosimperfecciones en 5 minutos, c) un máximo de una imperfección en 15 minutos.

Ejercicio 4.13 Consideremos que el número de trozos de chocolate en una determinada galleta sigueuna distribución de Poisson. Queremos que la probabilidad de que una galleta seleccionada al azartenga por lo menos tres trozos de chocolate sea mayor que 0.8.

Encontrar el valor entero más pequeño de la media de la distribución que asegura esta probabi-lidad.

61

Page 63: Estadística y Programación Aplicada a la Química

4.4 4.4. Ejercicios y problemas

Ejercicio 4.14 La variable X representa el número de llamadas a un teléfono en una hora y sigueuna distribución de Poisson con parámetro igual a 3,5.

(a) Calcular la probabilidad de que no se produzcan llamadas en la próxima hora.(b) Hallar la probabilidad de que se reciban al menos dos llamadas en las dos próximas horas.(c) ¿Cuánto tiempo podemos estar fuera si se quiere que la probabilidad de que el teléfono suene

en nuestra ausencia sea como máximo 0,5?

Aproximación de la distribución binomial a la distribucion de Poisson

Ejercicio 4.15 Un fabricante de maquinaria pesada tiene instalados en el campo 3840 generadoresde gran tamaño con garantía. Sí la probabilidad de que cualquiera de ellos falle durante el año dadoes de 1/1200 determine la probabilidad de que a) 4 generadores fallen durante el año en cuestión, b)que más 1 de un generador falle durante el año en cuestión.

Ejercicio 4.16 Se sabe que el 5Determine la probabilidad de que 2 de 100 libros encuadernados en ese taller, tengan encuader-

naciones defectuosas, usando, la aproximación de Poisson a la distribución binomial

Ejercicio 4.17 En un proceso de manufactura, en el cual se producen piezas de vidrio, ocurren de-fectos o burbujas, ocasionando que la pieza sea indeseable para la venta. Se sabe que en promedio1 de cada 1000 piezas tiene una o más burbujas. ¿Cuál es la probabilidad de que en una muestraaleatoria de 8000 piezas, menos de 3 de ellas tengan burbujas?

4.4.1. Soluciones a los ejercicios

Distribución binomial

Ejercicio 4.5 De acuerdo con el problema si llamanos éxito a obtener 1 tendremosp = 0,01 yq = 0,99.

Sea S = número de éxitos en n ensayos Bernoulli

PB(S ≥ 1; n, 0,01) = 1− PB(S < 1; n, 0,01) = 1− PB(S = 0; n, 0,01)

Utilizando la ecuación4.4

PB(X = x; n, p) =n!

x!(n− x)!pxqn−x (4.19)

PB(S ≥ 1; n, 0,01) = 1− PB(S < 1; n, 0,01) = 1− n!

0!n!0,0100,99n = 1− 0,99n ≥ 0,95 (4.20)

1− 0,99n ≥ 0,95 → 0,05 ≥ 0,99n → log 0,05 ≥ n log 0,99 → n ≥ log 0,05

log 0,99' 299 (4.21)

62

Page 64: Estadística y Programación Aplicada a la Química

4 4. Distribuciones de probabilidad de variables aleatorias discretas

Ejercicio 4.6 a) n = 12x representa la variable que define el número de tubos en que el vapor se condensax = {0, 1, 2, 3, . . . , 12}exito:p = P (se condense el vapor en un tubo de Al a 10 atm) = 0,40fracaso:q = P (no se condense el vapor en un tubo de Al a 10 atm) = 1− p = 0,60 = 0,21284

PB(X = {3, 4, ..., 12}; 12, 0,40) = P (x = 3)+P (x = 4)+. . .+P (x = 12) = 1−P (X = {0, 1, 2}; 12, 0,40) =

Utilizando la ecuación4.4se obtiene

PB(X ≥ 3; 12, 0,40) = 1− (0,002176 + 0,0174096 + 0,06385632) = 1− 0,08344192 = 0,91656

c) PB(X = 5; 12, 0,40) = 0,22703

Ejercicio 4.7 a) n = 10x representa la variable que define el número de amplificadores de banda ancha que su nivel de

ruido excede de 2 dB,x = {0, 1, 2, 3, . . . , 10}.exito:p = P (un amplificador exceda su nivel de ruido de 2 dB) = 0,15fracaso:q = P (un amplificador no exceda su nivel de ruido de 2 dB) = 1− p = 0,85PB(X = 5; 10, 0,15) = 0,00849b) PB(X ≥ 2; 10, 0,15) = 1 − PB(X ≤ 1; 10, 0,15) = 1 − (0,1968 + 0,3474) = 1 − 0,5444 =

0,4557c) µ = np = 1,5 ∼= 2, se espera que 2 de los 10 amplificadores probados se excedan de un nivel

de ruido de 2 dB.σ =

√npq = 1,1291 ∼= 1

Distribución de Poisson

Ejercicio 4.11 a) x representa la variable que define el número de cheques sin fondo que llegan albanco en un día cualquiera,x = {0, 1, 2, 3, . . .}. λ = 6 es el número medio de cheques sin fondo pordía.

La probabilidad de recibir cuatro cheques sin fondo en un dia puede calcularse con la ecuación4.11

P (X = x) =1

x!λxe−λ (4.22)

P (X = 4) =1

4!64e−6 =

1296 · 0,00248

24= 0,13392

b) x representa la variable que define el número de cheques sin fondo que llegan al banco en undía cualquiera,x = {0, 1, 2, 3, . . .}. λ = 2 × 6 = 12 es el número medio de cheques sin fondo pordía.

Utilizando de nuevo la ecuación4.11obtenemos

P (X = 10) =1

10!1210e−10 =

6,1973691010 · 6,15110−6

3628800= 0,104953

63

Page 65: Estadística y Programación Aplicada a la Química

4.4 4.4. Ejercicios y problemas

Ejercicio 4.12 a) x representa la variable que define el número de que nos define el número deimperfecciones en la hojalata cada 3 minutosx = {0, 1, 2, 3, . . .} . λ = 0,2 × 3 = 0,6 es el númeromedio de imperfecciones en tres minutos.

Utilizando de nuevo la ecuación4.11obtenemos

P (X = 1) =1

1!0,61e−0,6 =

0,6 · 0,548845

1= 0,329307

b) x representa la variable que define el número de que nos define el número de imperfeccionesen la hojalata cada 5 minutosx = {0, 1, 2, 3, . . .} . λ = 0,2 × 5 = 1 es el número medio deimperfecciones en tres minutos.

Utilizando de nuevo la ecuación4.11obtenemos

P (X ≥ 2) = P (X = 2, 3, . . .) = 1− P (X ≤ 1) = 1− P (0)− P (1)

P (X ≥ 2) = 1−(

1

0!10e−1 +

1

1!11e−1

)= 1− (0,367918 + 0,36718) = 0,26416

c) x representa la variable que define el número de que nos define el número de imperfeccionesen la hojalata cada 15 minutosx = {0, 1, 2, 3, . . .} . λ = 0,2 × 15 = 3 es el número medio deimperfecciones en tres minutos.

Utilizando de nuevo la ecuación4.11obtenemos

P (X ≤ 1) = P (X = 0)+P (X = 1) =1

0!30e−3 +

1

1!31e−3 = 0,0498026+0,149408 = 0,1992106

Ejercicio 4.13 SeaX = número de trozos de chocolate en una galleta donde queremos evaluarP (X >3; λ) > 0,8

P (X > 3) = 1− P (X ≤ 2) = 1− P (0)− P (1)− P (2) = 1− e−λ − λe−λ

1− λ2e−λ

2

Dando valores aλ = 1, 2, ..., 5 se obtiene

λ 0 1 2 3 4 5P (X > 3) 0.0803014 0.3233236 0.5768099 0.7618967 0.8753480

El valor más cercano a 0,8 lo proporcionaλ = 4.

64

Page 66: Estadística y Programación Aplicada a la Química

4 4. Distribuciones de probabilidad de variables aleatorias discretas

4.5. Lecturas recomendadas

Para completar la preparación de este tema recomendamos la lectura de:

☞ Capítulo 1. Magnitudes aleatorias y sus caracterísitcas.del texto de Spiridonov y Lopatkin[7].XRevisa los contenidos del tema. Adecuado para revisar la teoría del tema.

☞ Capítulo 4. Distribuciones de Probabilidad especialdel libro de Spiegel y cols.[5].Se recomienda revisar los ejercicios resueltos:

• Distribución binomial 4.1 a 4.6, y 4.9X

• Distribución de Poisson 4.22X

Como ejercicios de repaso se recomienda realizar los ejercicios:

• Distribución binomial 4.63, 4.64, 4.65,4.67, 4.68, 4.69

• Distribución de Poisson 4.90, 4.93

Los comportamientos límite de estas distribuciones binonial y de Poisson se estudiarán en eltema 5.

☞ Capítulo 4. Algunas distribuciones discretas de probabilidad.del texto de Walpole y Myers[6].

65

Page 67: Estadística y Programación Aplicada a la Química
Page 68: Estadística y Programación Aplicada a la Química

5

Distribuciones de probabilidad de variables aleatoriascontinuas

Contenidos ✍ Distribución uniforme Descripción y propiedades.✍ Distribución normal o gaussianaDescripción y propiedades. Descrip-ción y propiedades. Distribución de las medias de muestras de tamañofinito. Teorema del límite central. Intervalos de confianza para la mediamuestral. Aproximación de la distribución binomial y de Poisson a la dis-tribución normal.✍ Distribución t de StudentDescripción y propiedades.✍ Distribución χ2 Descripción y propiedades. Intervlos de probabilidadpara la varianza muestral.✍ Distribución F de Fisher Descripción y propiedades. Comparación devarianzas.

Objetivos ✓ Reconocer las características de la distribución uniforme de una variablealeatoria continua✓ Reconocer las características de una distribución normal o gaussiana.✓ Realizar cálculos de probabilidades de variables aleatorias que siguen undistribución normal✓ Comprender el significado de los intervalos de probabilidad2σ y 3σ de unavariable alaeatoria normal✓ Conocer las características de la distribución de medias muestrales unavariable aleatoria normal✓ Comprender las consecuencias del teorema del límite central y sus limita-ciones✓ Utilizar la distribución normal para calcular intervalos de probabilidad devariables que siguen una distribución binomial o de Poisson

67

Page 69: Estadística y Programación Aplicada a la Química

5.0

Objetivos ✓ Reconocer las características de una distribuciónt de Student✓ Calcular intervalos de probabilidad de variables que siguen una distribuciónt de Student✓ Determinar los límites del intervalo de confianza de la media muestral✓ Reconocer las características de una distribuciónχ2 de Student✓ Utilizar la distribuciónχ2 para calcular intervalos de confianza de la va-rianza muestral✓ Reconocer las características de una distribuciónF de Fisher✓ Utilizar la distribuciónF de Fisher para la comparación de varianzas mues-trales✓ Conocer las diferencas entre hipótesis nula,H0, e hipótesis alternativa,H1,y la relación de ambas con los intervalos de probabilidad

68

Page 70: Estadística y Programación Aplicada a la Química

5 5. Distribuciones de probabilidad de variables aleatorias continuas

5.1. Distribución uniforme

Una variable aleatoria X sigue una distribución uniforme en el intervalo [a,b] cuando su funcióndensidad de probabilidad es

f(x) =

0 x < a1

b−aa ≤ x ≤ b

0 x > b(5.1)

Su función de densidad de probabilidad integrada es

F (x) =

0 x < a

x−ab−a

a ≤ x ≤ b

1 x > b(5.2)

La media y la varianza de la distribución vienen dadas por

µ =a + b

2(5.3)

σ2 =(b− a)2

12(5.4)

Esta distribución sólo depende de los parámetrosa y b que están comprendidos en el intervalo(−∞, +∞).

Figura 5.1: Distribución de densidad de probabilidad de una variable uniforme continua.

69

Page 71: Estadística y Programación Aplicada a la Química

5.2 5.2. Distribución normal o Gaussiana

5.2. Distribución normal o Gaussiana

La función de densidad de probabilidad de una variable x que sigue una función de distribuciónnormal o gausiana viene dada por

f(x) =1√

2 π σ(x)e− (x−µx)2

2σ2(x) (5.5)

dondeµx y σ(x) son la media y la desviación típica de X respectivamente, y la variable alatoria puedeestar comprendida en el intervalo−∞ < x < +∞.

Si una variable aleatoria sigue una distribución normal sólo necesitamos conocerµx y σ(x) paracaracterizar la distribución de los datos.

La función de distribución de probabilidad viene dada por

F (x) = P (x ≤ x) =1√

2π σ(x)

∫ x

−∞e− (x−µx)2

2σ2(x) dx (5.6)

En el trabajo con variables aleatorias que siguen una distribución normal es conveniente utilzar lavariable normalizadaz, que se calcula como

z =x− µx

σ(x)(5.7)

Esta variable tiene la ventaja de que cualesquiera sean los valores deµx y σ(x), z siempre si-gue una distribución normal con mediaµz = 0 y desvición típicaσ(z) = 1. En general f(z) o F(z)se evaluan utilizando un programa informático o utilizando tablas1 (ver apéndices).Por comodidadutilizaremos tablas e ilustraremos su uso en los ejemplos.

Figura 5.2: Distribución de densidad de probabilidad de Gauss estanzarizada.

1En la tabla del apéndice correspondiente a la distribución normal se tabula P(0<Z<z).

70

Page 72: Estadística y Programación Aplicada a la Química

5 5. Distribuciones de probabilidad de variables aleatorias continuas

Figura 5.3: Distribución de densidad de probabilidad de Gauss con idéntica mediaµx = 0 y distintavarianzaσ2(x) = 1 (línea continua) yσ2(x) = 0,25 (línea discontinua).

Ejemplo 1. Cálculo de probabiblidades de una variable normal (I)

Hallar la probabilidad de que la magnitud aleatoria z (µz=0, σ(z)=1) este comprendida en elintervalo (-1.96,1.96).Teniendo en cuenta los postulados que definen la probabilidad:

P (−1,96 ≤ z ≤ 1,96) = P (−1,96 ≤ z ≤ 0) + P (0 ≤ z ≤ 1,96)

La distribución gausiana es una distribución simétrica

P (−z ≤ Z) = P (z ≤ Z)

P (−1,96 ≤ z ≤ 1,96) = 2 P (0 ≤ z ≤ 1,96)

De acuerdo con el apéndice 1

P (0 ≤ Z ≤ 1,96) = 0,475

y

P (−1,96 ≤ Z ≤ 1,96) = 2 ∗ 0,475 = 0,990

71

Page 73: Estadística y Programación Aplicada a la Química

5.2 5.2. Distribución normal o Gaussiana

Figura 5.4: Distribución de densidad de probabilidad de Gauss que difieren en la mediaµx = 0 yµx = 1 pero tienen idénticaσ2(x) = 1.

Ejemplo 2. Cálculo de probabiblidades de una variable normal (II)

Hallar la probabilidad de que el resultado de una observación única de una variable aleatoriadistribuida normalmente no exceda la media en más de±2σ.El problema nos pide que calculemosP (µ− 2σ ≤ x ≤ µ + 2σ).Para calcular la probabilidad primero determinaremos los valores de la variable tipificada quecorresponden a los límites del intervaloxmin = µx − 2σ(x) y xmax = µx + 2σ(x)

z =x− µx

σ(x)=

(µx ± 2σ(x))− µx

σ(x)= ±2

Como disponemos de una tabla de la distribución gausiana estandarizada (ver apendice 1) quenos proporcionaP (0 ≤ x ≤ z), utilizaremos la simetría de la distribución gaussina para calcularP (0 ≤ z ≤ 2):

P (x− 2σ ≤ z ≤ x + 2σ) = P (−2 ≤ z ≤ 2) = 2P (0 ≤ z ≤ 2)

Consultando el apéndice 1 obtenemos

P (0 ≤ z ≤ 2) = 0,4772

72

Page 74: Estadística y Programación Aplicada a la Química

5 5. Distribuciones de probabilidad de variables aleatorias continuas

de modo que

P (−2 ≤ z ≤ 2) = 2 ∗ 0,4772 = 0,9544

De acuerdo con el ejemplo anterior, si las observaciones (medidas) cumplen la ley de distribuciónnormal, la probabilidad de que el resultado de una medida este en el intervaloµ ± 2σ es 0.9544. Demodo análogo se deduce que la probabilidad de que se obtenga una observación en el intervaloµ±3σes 0.9974. De esto se deduce que la probabilidad de que las observaciones se encuentren fuera de estosintervalos son muy pequeñas, 0.046 y 0.0026, respectivamente. Por ello, las magnitudes2σ y 3σ seutilizan con frecuencia para determinar el error máximo admisible y despreciar resultados fuera deestos intervalos. Sin embargo, hay que tener en cuenta queσ(x) hace referencia a la desviación típicapoblacional. En general sólo tenemos una estima de esta magnitud, la desviación típica muestral,s(x). Como veremos más adelante, esto nos obliga a utilizar la distribuciónt de Student para calcularlos límites del error admisible.

Figura 5.5: Representación de un conjunto de 5000 medidas de la temperatura que siguen una distri-bución normal. Como puede observar, la mayor parte de los datos están concentrados en el intervaloµx ± 2σ(x), y es escaso el número de datos fuera del intervaloµx ± 3σ(x).

73

Page 75: Estadística y Programación Aplicada a la Química

5.2 5.2. Distribución normal o Gaussiana

Ejemplo 3. Cálculo de probabiblidades de una variable normal (III)

Calcule la probabilidad de que la concentración de cloruros,c, en una muestra de agua este enel intervalo 31,50 a 38,50 mg/l si la concentración media de cloruros es 35,00 mg/l con unadesviación típica de 3,5 mg/l.Calculamos la variable normal tipificada que corresponde a cada uno de los límites del intervalos:

zmin =31,5− 35

3,5= −1,0

zmax =38,5− 35

3,5= 1,0

de modo que

P (28,5 ≤ c ≤ 38,5) = P (−1 ≤ z ≤ 1) = 2 ∗ P (0 ≤ z ≤ 1) = 0,6826

Este resultado supone que si nuestros resultados siguen una distribución normal, esperamos queel 68.26% de las medidas se encuentren en el intervaloµx ± σ(x). En el caso estudiado esteintervalo comprende las concentraciones28,5 ≤ c ≤ 38,5 mg/l.

Ejemplo 4. Cálculo de probabiblidades de una variable normal (IV)

Cierta magnitud X sigue una distribución normal de media 3 y varianza 4. ¿Cuál es la probabili-dad de observar los resultados X> 3.5, X< 1.2 y 2.5<X < 3.5?.

P (X > 3,5) =P (Z > 0,25) = 1− P (Z < 0,25)

=0,5− P (0,00 ≤ Z ≤ 0,25) = 0,4013

P (X < 1,2) =P (Z < −0,9) =

=0,5− P (−0,9 ≤ Z ≤ 0,0)

=0,5− P (0,0 ≤ Z ≤ 0,9) = 0,1841

P (2,5 < X < 3,5) =P (−0,25 < Z < 0,25)

=P (−0,25 ≤ Z ≤ 0,0) + P (0,0 ≤ Z ≤ 0,25)

=2 ∗ P (0,0 ≤ Z ≤ 0,25) = 2 ∗ 0,0987 = 0,1974

74

Page 76: Estadística y Programación Aplicada a la Química

5 5. Distribuciones de probabilidad de variables aleatorias continuas

5.2.1. ¿Qué variables aleatorias siguen una distribución normal?

La media muestral x de una variable X que sigue una distribución normal

Teorema 5.1Si una variable aleatoria x1 sigue una distribución normal de media µ1 y varianza σ2

1 , y otra variablealeatoria x2 sigue una distribución normal de media µ2 y varianza σ2

2 , y ambas son independientes, lavariable aleatoria x3 = x2 ± x1 sigue una distribución normal de media µ3 y varianza σ2

3

µ3 =µ1 + µ2 (5.8)

σ23 =σ2

1 + σ22 (5.9)

Esta propiedad puede extenderse a la suma de n variables aleatorias independientes distribuidasnormalmente.

Corolorario 5.1La variable aleatoria media muestralx de muestras de tamaño n de una variable aleatoria X que sigueuna distribución normal

f(x) = PN(x; µx, σ(x))

de media µx

µx = µx (5.10)

y varianza, σ2(x)

σ2(x) =σ2(x)

n(5.11)

En este caso la magnitud tipificadaz viene dada por

z =x− µx

σ(x)=

x− µx

σ(x)/√

n(5.12)

75

Page 77: Estadística y Programación Aplicada a la Química

5.2 5.2. Distribución normal o Gaussiana

Figura 5.6: Funciones de densidad de probabilidad gaussianas. Comparación de la distribución de losdatos (negra) y las distribución de las medias de muestras de tamañon (azul).

Ejemplo 5. Cálculo de probabiblidades de una variable normal: distribución de las medias

Una aleación de cobre contiene una media de 41.26 % de este metal (determinado como la mediade las determinaciones de varios laboratorios) con una desviación típica de 0.12 %.¿Cuál es la probabilidad de que al realizar un análisis de nueve muestras se obtengan porcentajesde cobre entre el 41.30 % y el 41.50 %?. ¿Y se tomaran dieciséis muestras?.En este ejemploµ(x) = 41,26 y σ(x) = 0,12 , donde x es el resultado de la medida. De acuerdocon el corolario 5.1,x esta distribuido normalmente con mediaµx = µx = 41,26 y desviacióntípicaσ(x) = σ(x)/

√n tendremos

(a) con nueve muestras

σ(x) =0,12√

9= 0,04

y las variables tipificadas correspondientes serán:

z =x− µx

σ(x)/√

n

z =x1 − µx

σ(x)/√

n=

41,30− 41,26

0,04= 1,0

z =x2 − µx

σ(x)/√

n=

41,50− 41,26

0,04= 6,0

76

Page 78: Estadística y Programación Aplicada a la Química

5 5. Distribuciones de probabilidad de variables aleatorias continuas

Figura 5.7: Distribución de frecuencias de las medias muestrales de conjuntos den medidas de unavariable que sigue una distribución gaussiana. En todos los diagramas se utilizaron las mismas 500medidas pero se utilizaron distinto número de medidas para calcular las medias,n = (a) 1, (b)5, (c)10, y (d) 25.

de modo que

P (1,0 ≤ z ≤ 6,0) = P (z ≤ 6,0)− P (z ≤ 1,0) = 1,0000− 0,8413 = 0,1587

(b) con dieciseis muestras

σ(x) =0,12√

16= 0,03

y las variables tipificadas correspondientes serán:

z =x1 − µx

σ(x)/√

n=

41,30− 41,26

0,03= 1,33

z =x2 − µx

σ(x)/√

n=

41,50− 41,26

0,03= 8,0

de modo que

P (1,33 ≤ z ≤ 8,0) = P (z ≤ 8,0)− P (z ≤ 1,33) = 1,0000− 0,9082 = 0,0918

77

Page 79: Estadística y Programación Aplicada a la Química

5.2 5.2. Distribución normal o Gaussiana

La media muestral x de cualquier variable aleatoria obtenida a partir de un número grande demedidas

Teorema 5.2Teorema del límite central. Sean las magnitudes aleatorias x1, x2, . . ., xn que siguen la misma distri-bución de probabilidad y a la que corresponde una media µx y una varianza σ2(x) finitas. Conformeaumenta el valor de n la distribución de la variable aleatoria media muestral, x se aproxima a unadistribución normal de media µx y varianza σ2(x)/n.

La importancia de este teorema estriba en que permite, si la muestra es lo suficientemente grande,calcular estimas aceptables deµ y σ2(x) sin necesidad de conocer f(x).

Matemáticamente esta es una ley asintótica, es decir, la identidad con la distribución gaussianasólo se consigue si la población original es normal, pero su comportamiento es muy próximo a ésteconforme aumenta el tamaño de la muestran utilizada para calcular estas estimas.

Figura 5.8: Distribución de frecuencias de las medias muestrales den medidas de un conjunto de 500datos que siguen una distribución uniforme. En la figura puede observarse como la distribución evo-luciona desde la distribución uniformen = 1 ha distribuciones de tipo gaussiano conforme aumentan. En todos los diagramas se utilizaron las mismas 500 medidas pero estas se agruparon en conjuntosde distinto tamaño,n, para calcular las medias,n = (a) 1, (b)5, (c) 10, y (d) 25.

78

Page 80: Estadística y Programación Aplicada a la Química

5 5. Distribuciones de probabilidad de variables aleatorias continuas

Una variable discreta que sigue una distribución binomial cuando el número de experimentos,n, es grande

De acuerdo con el teorema de Moivre, para tamaños de la muestra tales que los valores del produc-to npq>5 (tamaños de muestra grnades), el comportamiento de la distribución binomial se asemeja alde una distribución normal con mediaµ = np y varianzaσ2 = npq. Esta propiedad es conocida comoteorema de Moivre.

Como la distribución binomial es una distribución de variables discretas, hay que hacer una correc-ción de continuidad de modo que al utilizar la aproximación de la distribución binomial a una distri-bución gaussiana las probabilidades se calculan como

PB(X = a; n, p) =PG(a− 0,5 ≤ X ≤ a + 0,5)

PB(a < X < b; n, p) =PG(a + 0,5 ≤ X ≤ b− 0,5)

PB(a ≤ X ≤ b; n, p) =PG(a− 0,5 ≤ X ≤ b + 0,5)

Este teorema permite calcular de una manera sencilla valores de la probabilidad de una distribu-ción binomial en condiciones en las que es imposible evaluar esta magnitud utilizando la ecuación4.4

PB(X = x; n, p) =n!

x!(n− x)!pxqn−x (5.13)

Figura 5.9: Distribución de probabilidad para una variable binomial conn = 25, p = 0,5 y q = 0,5 yla distribución normal conµx = np = 12,5 y σ2(x) = npq = 6,25.

79

Page 81: Estadística y Programación Aplicada a la Química

5.3 5.3. La distribución t de Student

Una variable discreta que sigue una distribución de Poisson conλ grande

Para valores grandes deλ la función de distribución de Poisson puede aproximarse mediante unadistribución de probabilidad gaussiana conµ = λ y σ2 = λ.

Figura 5.10: Relación entre las distribuciones binomial, Poisson y Gauss o normal.

5.3. La distribución t de Student

Una variable aleatoria continua t, que puede tomar valores en el intervalo0 ≤ t < ∞ y tiene unafunción densidad de probabilidad

f(t) =1√πν

Γ(

ν+12

)Γ(

ν2

) (1 +t2

ν

)−( ν+12 )

(5.14)

se dice que está distribuida de acuerdo con una distribuciónt de Student conν grados de libertad2.Es importante observar en la ecuación5.14 que la función de distribución está completamente

caracterizada por un solo parámetro:ν el número de grados de libertad.La media no depende del número de grados de libertad y es

µt = 0 (5.15)

mientras que la varianza sólo depende del número de grados de libertad

σ2(t) =ν

ν − 2(5.16)

Cuandoν es grande,σ2(t) ≈ 1. Además, puede demostrarse que para valores grandes deν (ν ≥20) se puede considerar a la función t de Student se comporta como una distribución normal de media0 y varianza 1.

2En la expresión de f(t),Γ(z) es la función gamma de Euler, que viene dada porΓ(z) =∫∞0

νz−1e−νdν conν > 0

80

Page 82: Estadística y Programación Aplicada a la Química

5 5. Distribuciones de probabilidad de variables aleatorias continuas

Figura 5.11: Distribución t de Student con distintos grados de libertad.

5.3.1. ¿Qué variables aleatorias siguen una distribución t de Student?

Teorema 5.3Sean Z e Y dos variables aleatorias independientes. Si Y está normalmente distribuida con media 0 yvarianza 1, mientras que Z tiene una distribución chi-cuadrado χ2 con ν grados de libertad. Entoncesla variable aleatoria T

T =y√z/ν

(5.17)

sigue una distribución t de Student con ν grados de libertad.

Utilizando este teorema se puede demostrar que la variable aleatoriat definida como

t =x− µx

s(x)=

x− µx

s(x)/√

n(5.18)

está distribuida con arreglo a una distribución t de Student conν = n− 1 grados de libertad.En el apéndice 2 se proporcionan los valores de las percentilastp para distribuciones t de Student

conν grados de libertad. La percentila es el valor que toma la variable aleatoria, t en nuestro caso,para que se cumpla que

P (t(ν) ≤ tp(ν)) = p (5.19)

81

Page 83: Estadística y Programación Aplicada a la Química

5.3 5.3. La distribución t de Student

Ejemplo 6. Cálculo del intervalo de probabiblidad de una variable que sigue la distribuciónt de Student

Usando la tabla del apéndice A.2 determine el intervalo simétrico en el que se encontrará lavariable t con una probabilidad del 95 % si tienenν=9 grados de libertad.En este ejemplo nos piden determinar lOS valores de t que cumplan

P (t1(ν) ≤ t ≤ t2(ν)) =0,95

P (t ≤ t1(ν)) =0,025

P (t ≥ t2(ν)) =0,025

En las tablas del apéndice A.2 podemos encontrar los valores detp tales que

P (t(ν) ≤ tp(ν)) = p

que equivalen a los valores para los que

P (t(ν) ≥ tp(ν)) = 1− p

Teniendo en cuenta que la distribución t de Student es simétrica respecto de su media y queµt = 0, para un intervalo también simétrico tendremos

P (−t 1+p2

(ν) ≤ t ≤ t 1+p2

(ν)) = p

En este ejemplo,p = 0,95 y ν = 9. En la tabla del apéndice A.2 encontramost,975(9) = 2,26,de modo que el intervalo de probabilidad viene dado por

−t,975 ≤ t ≤ t,975

−2,26 ≤ t ≤ 2,26

82

Page 84: Estadística y Programación Aplicada a la Química

5 5. Distribuciones de probabilidad de variables aleatorias continuas

Ejemplo 7. Cálculo del intervalo de confianza de la media

En un experimento para la determinación de cloruros se utilizo una técnica cromatográfica. Enesta técnica la concentración de la especie detectada es proporcional al área del pico asociado ala especie detectada. En un análisis de 9 muestras de agua de lluvia se obtuvo un valor medio deláreax = 0,6752 cm2 y una desviación típicas(x) = 0,002821 cm2.A partir de estos datos, determine el intervalo de valores en que espera que se encuentre el valormedio del área con una probabilidad de 0.95.Si la media de las áreas de los picos siguen una distribución gaussiana, la variable t, ecuación5.18,

t =x− µx

s(x)=

x− µx

s(x)/√

n(5.20)

seguirá una distribución t de Student conν = 9− 1 = 8 grados de libertad.Por tanto esperamos que

P (−t,975(8) ≤ t ≤ t,975(8)) = 0,95

y

−t,975(8) ≤x− µx

s(x)/√

n

t,975(8) ≥ x− µx

s(x)/√

n

x− t,975(8)s(x)√

n≤ µx

µx ≤ x + t,975(8)s(x)√

n

De donde sigue que esperamos que la media se encuentre en el intervalo

x− t,975(8)s(x)√

n≤ µx ≤ x + t,975(8)

s(x)√n

0,6752− 2,310,002821√

9≤ µx ≤ 0,6752 + 2,31

0,002821√9

0,6730 ≤ µx ≤ 0,6772

con una probabilidad de 0.95.Es habitual expresar este intervalo comoµx = 0,6752± 0,0021.

83

Page 85: Estadística y Programación Aplicada a la Química

5.4 5.4. La distribuciónχ2

5.4. La distribución χ2

Se dice que una variable aleatoria sigue una distribución chi-cuadrado oχ2 con ν grados delibertad si su función de distribución de probabilidad tiene la forma

P (χ2 ≤ x)

{0 si x < 0

1√2Γ( ν

2)

∫ x

0u

ν2−1e−

ν2 du si x > 0

(5.21)

Note que la función de distribución esta caracterizada por un sólo parámetro,ν.Para esta distribución

µχ2 = ν (5.22)

σ2(χ2) = 2ν (5.23)

Figura 5.12: Distribucionesχ2 con distintos grados de libertad,ν.

En el apéndice 3 se recogen los valores de las percentilas de distribucionesχ2 con ν grados delibertad, es decir

P (χ2(ν) ≤ X2) = χ2p(ν) = p (5.24)

5.4.1. ¿Qué variables aleatorias siguen una distribuciónχ2 ?Teorema 5.4Suponga que dispone de n magnitudes aleatorias independientes x1, x2, x3, . . ., xn distribuidas deacuerdo con una distribución normal de parámetros µx y σ(x).

Si definimos la variable Ui tal que

Ui =xi − µx

σ(x)(5.25)

84

Page 86: Estadística y Programación Aplicada a la Química

5 5. Distribuciones de probabilidad de variables aleatorias continuas

la suma

χ2 =n∑

i=1

U2i =

n∑i=1

(xi − µx)2

σ2(x)(5.26)

está distribuida de acuerdo con una distribución χ2 con ν = n grados de libertad.

A partir de este teorema se puede demostrar que la variable aleatoriaX2

X2 = (n− 1)s2(x)

σ2(x)(5.27)

sigue una distribuciónχ2 conν = n− 1 grados de libertad.

Ejemplo 8. Intervalos de probabilidad de variables que siguen una distribuciónχ2

Suponga que hace cinco medidas de una cantidad distribuida normalmente con mediaµ = 0,05y se obtienen los valores 0.041, 0.064, 0.055, 0.046, 0.060.Estime la varianza de la distribución. Suponga que la varianza es conocida y tiene el va-lor σ2(x) = 1,0 10−4. Determine si el valor deX2 obtenido se encuentra en el intervaloP (χ2

0,025(ν) ≤ x2 ≤ χ20,975(ν)).

x =

∑xi

n=

0,2666

5= 0,0532

s2(x) =

∑(xi − x)2

n− 1= 9,17 10−5

De acuerdo con el teoremaX2

X2 = (n− 1)s2(x)

σ2(x)= 4

9,17 10−5

1 10−5= 3,68

sigue una distribuciónχ2 conν = 4 grados de libertad.De acuerdo con las tablas del apándice A.3,

P (χ20,025(ν = 4) ≤ X2) = 0,484

P (χ20,975(ν = 4) ≤ X2) = 11,1

Es decir el valor dex2 obtenido está dentro del intervalo indicado

85

Page 87: Estadística y Programación Aplicada a la Química

5.4 5.4. La distribuciónχ2

Ejemplo 9. Intervalos de probabilidad de la varianza muestral

Se desea contrastar la hipótesis de que la varianza de una población normal esσ2(x) = 1(u.a.)2.Para ello se realizaron 9 medidas de esa magnitud obteniendose un valor de la varianza muestrals2(x) = 1,71(u.a.)2.Determine si este resultado es compatible con la hipótesis propuesta (hipótesis nula). Utilicecomo criterio para aceptar la hipótesis nula que si la hipótesis es cierta se cumple queχ2

0,025(ν) ≤X2 ≤ χ2

0,975(ν).Determine el intervalo de valores des2(x) compatibles con la hipótesis nula.Calculamos el valor de la variableX2

X2 = (n− 1)s2(x)

σ2(x)= 8

1,71

1,0= 13,6

De acuerdo con las tablas del apándice A.3,

P (χ20,025(ν = 8) ≤ X2) = 2,18

P (χ20,975(ν = 8) ≤ X2) = 17,5

Ya que el criterio se cumple aceptamos la hipótesis nula.El intervalo de valores deX2 compatibles con la hipótesis nula vendrá dado por

χ20,025(ν = 8) ≤ (n− 1)

s2(x)

σ2(x)≤ χ2

0,975(ν = 8)

2,18 ≤ (n− 1)s2(x)

σ2(x)≤ 17,5

2,18σ2(x)

n− 1≤ s2(x) ≤ 17,5

σ2(x)

n− 1

0,273 ≤ s2(x) ≤ 2,192

86

Page 88: Estadística y Programación Aplicada a la Química

5 5. Distribuciones de probabilidad de variables aleatorias continuas

Ejemplo 10. Intervalos de confianza de la varianza

En un experimento se determino la densidad de un polímero en disolución. En el experimentose realizaron 5 medidas y se obtuvo una varianza muestrals2(x) = 14,1.(u.a.)2. Determinen elintervalo simétrico en el que espera encontrar la varianza con una probabilidad p = 0.9.Que el intervalo sea simétrico supone que

P (χ21(ν) ≤ X2 ≤ χ2

2(ν)) =0,90

P (X2 ≤ χ21(ν)) =0,05

P (X2 ≥ χ22(ν)) =0,05

Suponiendo que las medidas están distribuidas normalmente,

χ20,05(ν = 4) ≤ (n− 1)

s2(x)

σ2(x)≤ χ2

0,95(ν = 4)

χ0,052(ν = 4)

(n− 1)s2(x)≤ 1

σ2(x)≤ χ0,952(ν = 4)

(n− 1)s2(x)

(n− 1)s2(x)

χ20,95(ν = 4)

≤ σ2(x) ≤ (n− 1)s2(x)

χ20,05(ν = 4)

414,1

9,49≤ σ2(x) ≤ 4

14,1

0,711

5,94 ≤ σ2(x) ≤ 78,8

Propiedad aditiva

Teorema 5.5Sean X2

1 y X22 dos variables aleatorias independientes. Si X2

1 sigue una distribución χ2 con ν1 gradosde libertad y X2

2 sigue una distribución χ2 con ν2 grados de libertad, X23 = X2

1 + X22 sigue una

distribución χ2 con ν = ν1 + ν2 grados de libertad.

5.4.2. Relación entre la distribuciónχ2 y la distribución normal

Cuandoν es grande la distribuciónχ2 se aproxima a una distribución normal con mediaµ = ν yvarianzaσ2 = ν.

87

Page 89: Estadística y Programación Aplicada a la Química

5.5 5.5. La distribución F de Fisher

5.5. La distribución F de Fisher

Una variable aleatoria u está distribuida de acuerdo con una distribución F de Fisher conν1 y ν2

grados de libertad si su función de densidad de probabilidad está dada por

f(u) =Γ(ν1+ν2

2)

Γ(ν1

2)Γ(ν2

2)ν

ν1/21 ν

ν2/22 uν2/2−1 (ν1u− ν2)

− ν1+ν22 (5.28)

dondeu > 0.Para esta distribución,

µu =ν2

ν2 − 2si ν2 > 2 (5.29)

σ2(u) =2ν2

2(ν1 + ν2 − 2)

ν1(ν2 − 2)2(ν2 − 4)si ν2 > 4 (5.30)

5.5.1. ¿Qué variables aleatorias de interés siguen una distribución F de Fis-her?

Teorema 5.6Sean V1 y V2 dos variables aleatorias independientes distribuidas de acuerdo con distribuciones χ2

con ν1 y ν2 grados de libertad. Entonces la variable aleatoria f dada por

f =V1/ν1

V2/ν2

(5.31)

sigue una distribución F con ν1 y ν2 grados de libertad.

Una consecuencia de este teorema es

F1−p(ν1, ν2) =1

Fp(ν2, ν1)(5.32)

88

Page 90: Estadística y Programación Aplicada a la Química

5 5. Distribuciones de probabilidad de variables aleatorias continuas

Corolorario 5.2Sean dos muestras aleatorias independientes de tamaños m y n, respectivamente, que se obtienende poblaciones normales con varianzas σ2

1(x) y σ22(y) respectivamente. De acuerdo con el teorema

anterior, la variable aleatoria

f =ms2

1(x)/(m− 1)σ21(x)

ns22(y)/(n− 1)σ2

2(y)(5.33)

obedece una ley de Fisher con ν1 = m− 1 y ν2 = n− 1 grados de libertad.En el caso en que σ2

1 = σ22 , la expresión anterior se simplifica a

f =s21(x)

s22(y)

(5.34)

Los apéndices A.4 y A.5 se recogen los valores de F conν1 y ν2 grados de libertad para los quela función de distribución de probabilidad iguala a 0.95 y 0.99 . Es decir se tabulan los valores de lavariable aleatoria f que cumplen:

P (f ≤ F0,95; ν1, ν2) = 0,95

P (f ≤ F0,95; ν1, ν2) = 0,99

Ya que en generalFp(ν1, ν2) 6= Fp(ν2, ν1), para calcularFexp designaremos los valores des1 y s2

de modo ques21 > s2

2

Ejemplo 11. Comparación de varianzas (I)

La varianzas muestrales obtenidas al aplicar dos métodos A y B para determinar el valor de unamagnitud son

s2(A) =45,34 10−4

s2(B) =11,11 10−4

En ambos experimentos se realizaron 9 medidas. ¿Es mayor la varianza en el método A que ladel método B?.Supondremos que las medidas están distribuidas normalmente.Formularemos la hipétesis nulaH0 : σ2

1 = σ22, de modo que si esta hipótesis es cierta, de acuerdo

con el corolario5.2, la variable aleatoria

fexp =s2(A)

s2(B)(5.35)

sigue una distribución F conν1 = m− 1 = 8 y ν2 = n− 1 = 8 grados de libertad.

89

Page 91: Estadística y Programación Aplicada a la Química

5.5 5.5. La distribución F de Fisher

Utilizaremos como criterio para aceptar esta hipótesis que el valor defexp que obtenemos searazonablemente probable, es decir que este comprendida en el intervalo que comprende al 95 %de las medidas si la hipótesis nula es cierta,

fexp ≤ F0,95(8, 8)

Si esto no se cumple, supondremos valida la hipótesis alternativaH1 : σ21 > σ2

2, que queremoscontrastar.Calculamosfexp

fexp =45,34 10−4

11,11 10−4= 4,0 (5.36)

En la tabla del apéndice A.4 encontramosF0,95(8, 8) = 3,44 de modo quefexp > F0,95(8, 8),rechazamosH0, las varianzas son iguales, y aceptamos la hipotesis alternativa: la varianza delmétodo A es mayor que la del método B.

Ejemplo 12. Comparación de varianzas (II)

Un ingeniero químico estudió la variabilidad de dos dispositivos de monitorización de un procesodentro de una planta. En el estudio de la variabilidad de ambos equipos obtuvo el siguienteresultado

Equipo 1.s21 = 13,5 n1 = 12

Equipo 2.s22 = 10,53 n2 = 10

Tras analizar los datos, ¿puede afirmar el ingeniero que la variabilidad del primer equipo esmayor que la del segundo?.Supondremos que las medidas están distribuidas normalmente.Formularemos la hipétesis nulaH0 : σ2

1 = σ22, es decir, no hay diferencias en la variabilidad. Si

esta hipótesis es cierta, de acuerdo con el corolario5.2, la variable aleatoria

fexp =s21

s22

(5.37)

sigue una distribución F conν1 = m− 1 = 11 y ν2 = n− 1 = 9 grados de libertad.Utilizaremos como criterio para aceptar esta hipótesis que el valor defexp que obtenemos searazonablemente probable, es decir que este comprendida en el intervalo que comprende al 95 %de las medidas si la hipótesis nula es cierta,

fexp ≤ F0,95(11, 9)

Si esta condición no se cumple, supondremos valida la hipótesis alternativaH1 : σ21 > σ2

2, quees la hipótesis que queremos contrastar.

90

Page 92: Estadística y Programación Aplicada a la Química

5 5. Distribuciones de probabilidad de variables aleatorias continuas

Calculamosfexp

fexp =13,5

10,53= 1,31 (5.38)

En la tabla del apéndice A.4 encontramosF0,95(11, 9) = 3,10 de modo quefexp < F0,95(11, 9).AceptamosH0,las varianzas son iguales. Esto quiere decir que la variabilidad de los dos métodoses la misma.

Ejemplo 13. Comparación de varianzas (III)

La f.e.m. de una pila Cu|Zn fue medida con dos aparatos distintos. Con el primer aparato seobtuvo una varianza muestrals2

1(x) = 0,152 con 11 medidas. Con el segundo aparato el resultadofues2

2(x) = 0,011 con 6 medidas.¿Es consistente este resultado con la hipótesisσ2

1(x) = σ22(x)?.

Si la hipótesis es cierta, de acuerdo con el corolario5.2, la variable aleatoria

fexp =s21

s22

(5.39)

sigue una distribución F conν1 = m− 1 = 10 y ν2 = n− 1 = 5 grados de libertad.Consideraremos que la hipótesis se cumple si

fexp ≤ F0,99(10, 5)

Calculamosfexp

fexp =0,152

0,011= 13,82 (5.40)

Por tanto, no podemos aceptar la hipótesis propuesta (hipótesis nula) por que la probabilidad deobtener ese resultado es muy pequeña. Es decir, el valor obtenido corresponde a un intervalo enel que de ser cierta la hipótesis nula encontraríamos el 1 % de los resultados experimentales.

91

Page 93: Estadística y Programación Aplicada a la Química

5.6 5.6. Ejercicios y problemas

5.6. Ejercicios y problemas

Cuestión 5.1 Dada la función de distribución normal, encuentre el área bajo la curva que cae

(a) a la izquierda de z = 1.43

(b) a la derecha de z = -0.89

(c) entre z = -2.16 y z=-0.65

(d) a la izquierda de z = -1.39

(e) a la derecha de z = 1.96

(f) entre z = -0.48 y z=1.74

Cuestión 5.2 Dada una distribución normal estándar, encuentre el valor de k, tal que:

(a) P (Z < k) = 0,0427

(b) P (Z > k) = 0,2946

(c) P (−0,93 < Z < k) = 0,7235

Cuestión 5.3 Dada una distribución normal conµ = 30 y σ = 6, encuentre:

(a) el área de la curva normal a la derecha de x=17

(b) el área de la curva normal a la izquierda de x=22

(c) el área de la curva normal entre x=32 y x=41

(d) el valor de x que tiene el 80 % del área de la curva normal a la izquierda

(e) los dos valores de x que contienen un intervalo central del 75 % del área de la curva normal

Cuestión 5.4 Si un conjunto de observaciones están normalmente distribuidas, ¿qué porcentaje deestas difiere de la media en

(a) más de1,3 σ

(b) menos de0,52 σ

Cuestión 5.5 Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de unapoblación con varianzaσ2 = 6 tenga una varianzas2

(a) mayor a 9.1

(b) entre 3.462 y 10.745

92

Page 94: Estadística y Programación Aplicada a la Química

5 5. Distribuciones de probabilidad de variables aleatorias continuas

Cuestión 5.6 Dada una muestra aleatoria de tamaño 24 de una distribución normal, encuentre k demanera que:

(a) P (−2,069 < t < k) = 0,965

(b) P (k < t < 2,807) = 0,095

(c) P (−k < t < k) = 0,90

Cuestión 5.7 Para una distribuciónχ2 encuentre

(a) χ20,975 cuandoν=15

(b) χ20,99 cuandoν=7

(c) χ20,95 cuandoν=24

Cuestión 5.8 Para una distribuciónχ2 encuentre

(a) χ20,95 cuandoν = 5

(b) χ20,95 cuandoν = 19

(c) χ20,99 cuandoν = 12

Cuestión 5.9 Para una distribuciónχ2 encuentreχ2α de manera que:

(a) P (X2 < χ2p) = 0,99 cuandoν = 4

(b) P (X2 < χ2p) = 0,025 cuandoν = 19

(c) P (37,652 < X2 < χ2p) = 0,045 cuandoν=25

Cuestión 5.10Encuentre

(a) t0,025 cuandoν = 14

(b) Encuentre−t0,01 cuandoν = 10

(c) Encuentret0,995 cuandoν = 7

Cuestión 5.11Para una distribución F encuentre:

(a) F0,95(ν1 = 7, ν2 = 15)

(b) F0,95(ν1 = 15, ν2 = 7)

(c) F0,99(ν1 = 24, ν2 = 19)

93

Page 95: Estadística y Programación Aplicada a la Química

5.6 5.6. Ejercicios y problemas

Distribución normal

Ejercicio 5.1 Dada una distribución normal estándar, encuentre el área bajo la curva que yace, (a)a la derecha de z = 1.84 y (b) entre z = -1.97 y z= 0.86.

Ejercicio 5.2 Para una distribución normal estándar, encuentre el valor de k, tal que (a) P(Z>k) =0.3015 y (b) P(k<Z<-0.18) = 0.4197.

Ejercicio 5.3 Dada una distribución normal conµx = 50 y s(x) = 10, encuentre la probabilidad deque X tome un valor entre 45 y 62.

Ejercicio 5.4 Dada una distribución normal conµx = 300 y s(x) = 500, encuentre la probabilidadde que X tome un valor mayor que 362.

Ejercicio 5.5 Dada una distribución normal conµx = 40 y s(x) = 6, encuentre el valor de x quetiene (a) 45

Ejercicio 5.6 Cierto tipo de batería de almacenamiento dura, en promedio, 3.0 años, con una desvia-ción típica de 0.5 años. Suponga que la duración de las baterías se distribuye normalmente, encuentrela probabilidad de que una batería dure menos de 2.3 años.

Ejercicio 5.7 Una empresa eléctrica fabrica focos que tienen una duración media de 800 horas y unadesviación típica de 40 horas. Si la duración de los focos sigue una distribución normal, encuentrela probabilidad de que un foco se funda en el intervalo de 778 a 834 horas.

Ejercicio 5.8 En un proceso industrial el diámetro de un cojinete es una parte importante de uncomponente. El comprador establece que las especificaciones en el diámetro sean 3.0± 0.1 cm. Sesabe que en el proceso el diámetro de un cojinete tiene una distribución normal con media 3.0 cm yuna desviación típica de 0.005 cm. En promedio, ¿cuántos cojinetes se descartarán?.

Ejercicio 5.9 El 6.3 % de las observaciones de una magnitud que sigue una distribución normal tieneun valor superior a 3.287, mientras que el 51.2 % tiene valores mayores que 2.897. Calcule la mediay la varianza de la distribución.

Ejercicio 5.10 Considere un experimento de medida del pH de una disolución acuosa caracterizadopor µpH= 5.50 yσ2(pH) = 0.06.

Determine el intervalo de valores en el que espera encontrar el 95 % de las medias muestrales delos experimentos que combinen el resultado de 25 determinaciones del pH de la disolución indicada.

Distribución t de student.

Ejercicio 5.11 Considere una variable aleatoria distribuida de acuerdo con una distribuciónt deStudent con 9 grados de libertad.

Encuentre el valor det1 para el cual

a) P (T > t1) = 0,05

b) P (T > t1) = 0,025

94

Page 96: Estadística y Programación Aplicada a la Química

5 5. Distribuciones de probabilidad de variables aleatorias continuas

c) P (−t1 < T < t2) = 0,99

d) P (−t1 < T < t2) = 0,975

e) P (T ≥ t1) = 0,90

Ejercicio 5.12 Considere una variable aleatoria distribuida de acuerdo con una distribuciónt.Encuentre el valor det1 que satisfaga cada una de las siguientes condiciones

a) P (−t1 < T < t1) = 0,90 y ν = 25.

b) P (T < −t1) = 0,025 y ν = 20.

c) P (T ≥ t1) = 0,55 y ν = 16

Ejercicio 5.13 Para una variable U que sigue una distribución t de Student conν = 10 encuentrelos valores de c que cumplen

a) P (U > c) = 0,05.

b) P (−c ≤ U ≤ c) = 0,98.

c) P (U ≤ c) = 0,20.

d) P (U ≥ c) = 0,90.

Distribución χ2

Ejercicio 5.14 Un fabricante de baterías para automóvil garantiza que sus baterías durarán, enpromedio, 3 años con una desviación estándar de 1 año.

Si 5 de estas baterías tienen duraciones de l.9, 2.4, 3.0 ,3.5 y 4.2 años, ¿puede seguir el fabricanteconvencido aún de que la duración de sus baterías tiene una desviación estándar de 1 año?

Ejercicio 5.15 Hallar los valoresχ21(ν) y χ2

2(ν) tales que conν = 20,el área bajo la curva sea de0.95, tales queχ2

1(ν) < χ22(ν), y las áreas a la derecha deχ2

2(ν) y a la izquierda deχ21(ν) sean

iguales.Note que sin estas consideraciones hay infinitos pares de valoresχ2

1(ν) y χ22(ν) que cumplen esta

condición.

5.6.1. Soluciones a las cuestiones

Cuestion 5.1 a) 0.9236, b) 0.8133 c) 0.2424 d) 0.0823 e) 0.0250 f) 0.6435

Cuestion 5.2 a) -1.72 b) 0.54 c) 1.28

Cuestion 5.3 a) 0.9850 b) 0.0918 c) 0.3371 d) 35.04 e) 23.1 y e) 36.9

Cuestion 5.4 a)19.36 % b) 39.70 %

95

Page 97: Estadística y Programación Aplicada a la Química

5.6 5.6. Ejercicios y problemas

Cuestion 5.5 a) 0.05 b) 0.94

Cuestion 5.6 a) 2.500 b) 1.319 c) 1.714

Cuestion 5.7 a) 27.488 b) 18.475 c) 36.415

Cuestion 5.8 a) 11.1 b) 30.144 c) 26.217

Cuestion 5.9 a) 13.277 b) 8.91 c) 46.928

Cuestion 5.10a) -2.145 b) 2.76 c) 3.499

Cuestion 5.11a) 2.71 b) 3.51 c) 2.92

5.6.2. Soluciones a los ejercicios

Distribución normal

Ejercicio 5.1 (a)

P (z ≥ 1,84) = 0,5− P (0 ≤ z ≤ 1,84) = 0,5− 0,4671 = 0,0329

(b)

P (−1,97 ≤ z ≤ 0,86) = P (−1,97 ≤ z ≤ 0) + P (0 ≤ z ≤ 0,86)

= P (0 ≤ z ≤ 1,97) + P (0 ≤ z ≤ 0,86)

= 0,4756 + 0,3051 = 0,7807

(a) (b)

96

Page 98: Estadística y Programación Aplicada a la Química

5 5. Distribuciones de probabilidad de variables aleatorias continuas

Ejercicio 5.2 (a)

P (z > k) = 0,3015 → P (0 ≤ z ≤ k) = 0,5− 0,3015 = 0,1985

Consultando en la tabla del apéndice 1 obtenemosk = 0,52.(b)

P (k ≤ z ≤ −0,18) = P (k ≤ z ≤ 0)− P (−0,18 ≤ z ≤ 0)

= P (0 ≤ z ≤ k)− P (0,0 ≤ z ≤ 0,18)

= P (0 ≤ z ≤ k)− 0,0714

De modo que

0,4197 = P (0 ≤ z ≤ k)− 0,0714

P (0 ≤ z ≤ k) = 0,4911

Consultando en la tabla del apéndice 1 obtenemosk = −2,37.

(c) a (d) b

Ejercicio 5.3P (45 ≤ x ≤ 62) = P (z1 ≤ z ≤ z2)

donde

z1 =x1 − µx

σ(x)=

45− 50

10= −0,5

z2 =x2 − µx

σ(x)=

62− 50

10= 1,2

97

Page 99: Estadística y Programación Aplicada a la Química

5.6 5.6. Ejercicios y problemas

de modo que

P (45 ≤ x ≤ 62) = P (−0,5 ≤ z ≤ 1,2)

= P (−0,5 ≤ z ≤ 0) + P (0,0 ≤ z ≤ 1,2)

= P (0 ≤ z ≤ 0,5) + P (0,0 ≤ z ≤ 1,2)

= 0,1915 + 0,3849

= 0,5764

Ejercicio 5.4P (x > 362) = P (z > z2)

donde

z2 =x2 − µx

σ(x)=

362− 300

50= 1,24

de modo que

P (x > 362) = P (z > 1,24)

= 0,5− P (0 ≤ z ≤ 1,24)

= 0,5− 0,3925

= 0,1075

Ejercicio 5.5 (a) De acuerdo con el enunciado del problema

P (z1 < z) = P (z > −z1) = 0,45

Para obtener el valor dez1 tendremos en cuenta que

P (0 < z < −z1) = 0,5− P (z > −z1) = 0,5− 0,45 = 0,05

98

Page 100: Estadística y Programación Aplicada a la Química

5 5. Distribuciones de probabilidad de variables aleatorias continuas

Consultando en la tabla obtenemosP (0 ≤ z ≤ 0,13) = 0,05, es decirz1 = −0,13Para obtenerx hacemos uso de la definición de variable reducida

z =x − µx

σ(x)= −0,13 → x = 40− 6 · 0,13 = 39,22

(b)De acuerdo con el enunciado del problema

P (z > z1) = 0,14

Para obtener el valor dez1 tendremos en cuenta que

P (0 < z < z1) = 0,5− P (z > −z1) = 0,5− 0,14 = 0,36

Consultando en la tabla obtenemosP (0 ≤ z ≤ 1,08) = 0,36, es decirz1 = 1,08Para obtenerx hacemos uso de la definición de variable reducida

z =x − µx

σ(x)= −0,13 → x = 40− 6 · 1,08 = 46,48

99

Page 101: Estadística y Programación Aplicada a la Química

5.6 5.6. Ejercicios y problemas

Ejercicio 5.6 El valor de la variable reducida es

z =x − µx

σ(x)

=2,3 − 3,0

0,5

= − 1,4

De modo que

P (x < 2,3) = P (z < −1,4) = 0,5− P (0 < z < −1,4) = 0,5− P (0 < z < 1,4) = 0,081

Ejercicio 5.7 Queremos calcular

P (778 < x < 834) = P (x < 834)− P (x < 778) = P (z < z1)− P (z < z2)

Procedemos a calcular las variables reducidasz1 y z2

z1 =778 − 800

40= −0,55

z2 =834 − 800

40= 0,85

de modo que

P (x < 778) = P (z < −0,55) = 0,5−P (−0,55 < z < 0,0) = 0,5−P (0,0 < z < 0,55) = 0,2912

P (x < 34) = P (z < 0,85) = 0,5 + P (0,0 < z < 0,85) = 0,8023

P (778 < x < 834) = P (x < 834)− P (x < 778) = 0,8023− 0,2912 = 0,5111

Ejercicio 5.8 Los cojinetes que se descartarán son aquellos que esten fuera del intervalo (2.9,3.1)cm. Para calcular la fracción de cojinetes que se descartan calcularemos la fracción de cojinetes queesperamos que esten dentro del intervalo,P (2,9 < x < 3,1)

Las variables reducidas vienen dadas por

z1 =2,99 − 3,0

0,005= −2,0

z2 =3,01 − 3,0

0,005= +2,0

P (2,9 < x < 3,1) = P (−2 < z < 2) = 2P (0 < z < 2) = 0,9544

Esperamos que un 4.56 % de los cojinetes no cumplan las especificaciones.

Ejercicio 5.9 µ = 2,90043 , σ2 = 0,0625

100

Page 102: Estadística y Programación Aplicada a la Química

5 5. Distribuciones de probabilidad de variables aleatorias continuas

Distribución t de student

Ejercicio 5.11 (a) P (T > t1) = 0, 05Teniendo en cuenta que la probabilidad del suceso seguro es 1 (ver definición axiomática de

probabilidad):

P (T ≤ t1) + P (T > t1) =1,00

P (T ≤ t1) + 0,05 =1,00

P (T ≤ t1) =0,95

Consultando la tabla de la distribución t de Student tenemost1 = t0,95(ν = 9) = 1,83.(b) Siguiendo el mismo procedimiento que en la sección a obtenemost1 = t0,975(ν = 9) = 2,26.(c) P (−t1 < T < t2) = 0, 99Si el intervalo no es símetrico hay infinitos pares de valores det1 y t2 que cumplen la condición

prescrita para definir los límites del intervalo. Sin embargo, sólo hay un par de valores det1 y t2 talesque si−t1 = t2, P (−t1 < T < t2) = 0, 99.

Teniendo en cuanta la simetría de la distribución t de Student, la condición

P (−t2 < T < t2) = P (−t2 ≤ T ≤ 0) + P (0 ≤ T ≤ t2) = 0,99

P (T ≤ −t2) + P (T ≥ t2) = 2,0× P (T ≥ t2) = 0,01

P (T ≥ t2) = 0,005

Utilizando los razonamientos de la sección a tenemos quet2 = t0,995(ν = 9). Consultando latabla de la distribución t de Student tenemos−t1 = t2 = t0,995(ν = 9) = 3,25.

(d) P (t1 < T < t2) = 0, 975Siguiendo el mismo razonamiento que en la parte (c) obtenemost2 = −t1 = t0,9875(ν = 9) =

2,73. El valor de la percentilat0,9875(ν = 9) no está incluido en la tabla. Se puede aproximarutilizando una interpolación lineal entre los valores de la tabla couespondientes a las percentilast0,975(ν = 9) y t0,99(ν = 9).

(e)P (T ≥ t1) = 0, 90Teniendo en cuenta la simetría de la distribución t de Student

P (T ≥ t1) = P (T ≤ −t1) = 0, 90

de modo quet1 = −t0,9(ν = 9) = −1, 38

101

Page 103: Estadística y Programación Aplicada a la Química

5.6 5.6. Ejercicios y problemas

Ejercicio 5.13 (a) P (U > c) = 0,05Teniendo en cuenta que la probabilidad del suceso seguro es 1 (ver definición axiomática de

probabilidad):

P (U > c) + P (U ≤ c) = 1

0,05 + P (U ≤ c) = 1

P (U ≤ c) = 0,95

Consultando la tabla de la distribución t de Student tenemosc = t0,95(ν = 9) = 1,83.(b) P (−c ≤ U ≤ c) = 0,98Teniendo en cuanta la simetría de la distribución t de Student, tenemos

P (−c ≤ U ≤ c) = P (−c ≤ U ≤ 0) + P (0 ≤ U ≤ c) = 0,98

P (U ≤ −c) + P (U ≥ c) = 2, 0xP (U ≥ c) = 0,02

P (U ≥ c) = 0,01

Finalmente tenemosc = t0,99(ν = 10) = 2,76.(c)P (U < c) = 0,20Teniendo en cuanta la simetría de la distribución t de Student tenemos

P (U < c) = P (U > −c) = 0,20

de modo que

P (U < −c) = 0,80

Consultando la tabla de la distribución t de Student tenemosc = −t0,80(ν=10)=−0,879.(d) P (U ≥ c) = 0,20Teniendo en cuenta la simetría de la distribución t de Student

P (U ≥ c) = P (U ≤ −c) = 0,90

de modo quec = −t0,9(ν = 10) = −1, 37

Distribución χ2

Ejercicio 5.14 La varianza muestral ess2(x) = 0,815. Suponiendo que las vida media de las bate-rias sigue una distribución normal, la variable aleatoria (ecuación5.27)

X2 = (n− 1)s2(x)

σ2(x)

sigue una distribuciónχ2(ν = n− 1).

102

Page 104: Estadística y Programación Aplicada a la Química

5 5. Distribuciones de probabilidad de variables aleatorias continuas

Sustituyendo obtenemos

X2 =4× 0,815

1= 3,26

Consultando el apéndice A.3 tenemos que el intervalo simétrico que contiene el 95 % de lasmedidas está comprendido entreχ2

0,025(ν = 4) = 0,484 y χ20,975(ν = 4) = 11,143. El resultado

obtenido esta dentro del intervalo y no contradice la hipótesis inicialσ2(x) = 1

5.7. Lecturas recomendadas

Para completar la preparación de este tema recomendamos la lectura de:

☞ Capítulo 2. Estadística de medidas repetidas.del texto de Miller y Miller[3]. XX

☞ Capítulo 1. Magnitudes aleatorias y sus caracterísitcas.del texto de Spiridonov y Lopatkin[7].XRevisa los contenidos del tema. Adecuado para revisar la teoría del tema.

☞ Capítulo 4. Distribuciones de Probabilidad especialdel libro de Spiegel y cols.[5].Adecuado para revisar ejercicios. En este tema los autores del libro también se tratan otrasdistribuciones como la multinomial, hipergeométrica, Cauchy o gamma. No se han estudiadoporque no son de apliación frecuente en Química. Es mejor obviar las secciones en las que seexplican esas distribuciones pues no son imprescindibles para comprender el tratamiento de lasdistribuciones normal, t,χ2 o F.

Se recomienda la revisión de los siguientes ejercicios:

• Distribución normal. Ejercicios 4.12 a 4.15

• Aproximación normal a la distribución binomial. Ejercicios 4.17 a 4.19

• La distribución chi cuadrado. Ejercicios 4.38 a 4.40

• La distribuciónt de Student. Ejercicios 4.43 y 4.44

• La distribuciónF . Ejercicios 4.47

En el caso de los ejercicios relacionados con la distribución normal se ilustra como identificarlos parámetros de la distribución normal y el uso de las tablas para la evaluación de probabi-lidades. El resto de los ejercicios que se recomienda revisar, ilustran como utilizar las tablasde las percentilas de las distribucionest, χ2 y F . Sirven para revisar como se usan las tablasestad´sticas y adquirir confianza en su manejo.

☞ Capítulo 4. Funciones de variables aleatorias.del texto de Walpole y Myers[6]. De este capí-tulo es útil la revisión de las secciones:

6.4 Muestreo aleatorio.

6.5 Algunas estadísticas importantes.

103

Page 105: Estadística y Programación Aplicada a la Química

5.7 5.7. Lecturas recomendadas

6.8 Distribuciones muestrales de medias.

6.9 La distribución muestral de(n− 1)s2/σ2

6.10 La distribución t

6.11 La distribución F

104

Page 106: Estadística y Programación Aplicada a la Química

6

Intervalos de probabilidad e intervalos de confianza

Contenidos ✍ Intervalos de probabilidad Definición. Cálculo del intervalo de proba-bilidad de la media. Cálculo del intervalo de probabilidad de la varianza.✍ Intervalos de confianzaDefinición.✍ Cálculo del intervalo de confianza de la media✍ Cálculo del intervalo de confianza de la diferencia de las medias✍ Cálculo del intervalo de confianza de la varianza para variablesnormalmente distribuidas

Objetivos ✓ Comprender las diferencias entre intervalo de probabilidad e intervalo deconfianza✓ Conocer las características que diferencian un intervalo de probabilidad yun intervalo de confianza✓ Calcular intervalos de probabilidad de una magnitud aleatoria.✓ Calcular intervalos de confianza de la media de una variable gaussiana✓ Calcular intervalos de confianza de la varianza de una variable gaussiana✓ Calcular el intervalo de confianza de la diferencia de la media de variablesgaussianas✓ Comparar datos apareados utilizando el test de lat de Student para datosapareados

105

Page 107: Estadística y Programación Aplicada a la Química

6.1. Distribución de probabilidad del error aleatorio.

Considere un conjunto de medidas x1, x1 , . . ., xn de una magnitud. En ausencia de error sistemá-tico sólo debemos tener en cuenta elerror aleatorio. Por tanto, el resultado de una medida, xi, vienedado por la suma del valor real,µx, y el error aleatorio asociado a esa medidaεi.

xi = µx + εi (6.1)

Para estimar el valor real,µx, necesitamos conocer que función de densidad de probabilidad des-cribe el error aleatorio. Asumiremos que ei sigue una distribución normal de mediaµε = 0 y varianzaσ2(ε). Comoεi sigue una distribución normal yµx es una constante, los resultados de las medidasxi

también siguen una distribución normal. La media de la distribución normal de las medidas esµx ysu varianza,s2(x), es igual que la varianza del error aleatorio,σ2(x) = σ2(ε).

Estas propiedades se demuestran fácilmente utilizando las propiedades de la esperanza matemáti-ca

µxi= E [xi] = E [(µx + εi)] = µx + E [(εi)] = µx + µεi

= µx + 0 = µx (6.2)

σ2(xi) = E[(xi − µxi

)2] = E[((µx + εi)− (µx + µεi

))2] = E[((εi − µεi

)2] = σ2(εi) (6.3)

El error aleatorio puede que no este distribuido normalmente. En algunos casos es evidente, porejemplo cuando sabemos que nuestros datos siguen una distribución uniforme, binomial o de Poisson.En otros casos es necesario comprobar que los datos se ajustan a una distribución de probabilidad pos-tulada (gaussiana, log-normal, exponencial, etc). Realizar esta comprobación es importante cuando elmétodo utilizado para calcular las estimas poblacionales no es robusto. Un método de cálculo de es-timas no es robusto cuando (i) que los datos utilizados no se ajusten a la distribución de probabilidadpostulada para desarrollar el método, implica que (ii) las estimas de los parámetros poblacionales quese obtienen pueden ser erróneas.

6.2. Intervalos de probabilidad

6.2.1. Definición

Seax una estima del parámetro poblacionalξ (por ejemplo, la media o la varianza).Se define como elintervalo de probabilidadde la estimax del parámetroξ con un nivel de

probabilidadp al intervalo de valores dex

xmın = ξ − emın 6 x 6 ξ + emax = xmax (6.4)

que cumple

P (xmın 6 x 6 xmax) = p (6.5)

Page 108: Estadística y Programación Aplicada a la Química

6 6.Intervalos de probabilidad e intervalos de confianza

Los límites del intervalo de probabilidadxmin y xmax son valoresconstantesy se calculan cono-cidos la forma de la función de distribución (o de densidad de probabilidad) y los parámetros que lacaracterizan (media, varianza).

Se pueden definir infinitos intervalos de probabilidad de una estimax de un parámetro poblacionalξ con un nivel de probabilidadp.

Nosotros trabajaremos con intervalos de tres tipos:

✓ P (xmın 6 x) = p (6.6)

✓ P (x 6 xmax) = p (6.7)

✓ P (xmın 6 x 6 xmax) = p (6.8)

Para este último intervalo imponemos la condición adicional de que probabilidad de obtener un valordex fuera del intervalo de probabilidad sea igual en ambos lados. Es decir

➠ P (xmax 6 x) =1− p

2

➠ P (xmax 6 x) =1− p

2

(6.9)

6.2.2. Intervalos de probabilidad de las medidas

Hemos supuesto que los errores aleatorios siguen una distribución normal. Por tanto, las medidasexperimentales aisladas también siguen una distribución normal. Como la distribución normal essimétrica respecto de la media cuando se calcula el intervalo de probabilidad de una medida frecuentetrabajar con intervalos simétricos alrededor de la media

A′ = µ−D 6 xi 6 µ + D = A (6.10)

dondeD es una constante que se elige dependiendo del valor de nivel probabilidad p del intervalo,

P (µ−D 6 xi 6 µ + D) = p (6.11)

D suele fijarse como un múltiplo deσ, D = kσ. Así la probabilidad asociada al intervalo dependeexclusivamente del valor dek:

k = 1,00 P (A′ 6 xi 6 A) = P (−1,00 6 z 6 1,00) = 2,0 ∗ P (0 6 z 6 1,00) = 0,68

k = 1,96 P (A′ 6 xi 6 A) = P (−1,96 6 z 6 1,96) = 2,0 ∗ P (0 6 z 6 1,96) = 0,95

k = 2,00 P (A′ 6 xi 6 A) = P (−2,00 6 z 6 2,00) = 2,0 ∗ P (0 6 z 6 2,00) = 0,955

k = 3,00 P (A′ 6 xi 6 A) = P (−3,00 6 z 6 3,00) = 2,0 ∗ P (0 6 z 6 3,00) = 0,997

107

Page 109: Estadística y Programación Aplicada a la Química

6.2 6.2. Intervalos de probabilidad

6.2.3. Intervalos de probabilidad de las medias

El intervalo de probabilidad se calcula del mismo modo que el intervalo de probabilidad de losdatos pero teniendo que paran medidas (ver sección5.2.1):

µ (x) = µ (x) (6.12)

σ2 (x) =σ2 (x)

n(6.13)

Ejemplo 1. Cálculo del intervalo de probabilidad de un conjunto de medidas

En una práctica de laboratorio se midió el pH de una disolución. El análisis del conjunto de losresultados condujo a los valoresµpH = 5,00 y σ2(pH) = 0,04.Determine el intervalo de valores que comprende el 95 % de las medidas del pH.Para una distribución normal estandarizada (ver sección5.2y apéndice 1) tenemos

P (−1,96 6 z 6 1,96) = 2 P (0 6 z 6 1,96) = 0,95

dondez =

x− µx

σ(x)

De donde sigue que los límites del intervalo que queremos calcular cumplen

z =pH − µpH

σ(pH)= ±1,96 →

{−1,96 = pHmın−5,0

0,2→ pHmın = 4,61

+1,96 = pHmax−5,00,2

→ pHmın = 5,39

El intervalo de pH donde se encuentra el 95 % de las medidas es [4.80,5.20].

6.2.4. Intervalos de probabilidad de las varianzas

La varianza muestrals2(x) sigue una distribuciónχ2 (ver sección5.4.1). Esta distribución esasimétrica, y los valores de las cuantilas que necesitamos para calcular los límites del intervalo deprobabilidad,A′ y A, dependen del nivel de probabilidad elegido,p y del número de medidas,n.

Si la muestra comprenden medidas y queremos calcular el intervalo de probabilidad con un nivelde probabilidadp, el intervalo de probabilidad des2(x) viene dado por

σ2(x)

(n− 1)· χ2

1−p2

(ν) 6 s2(x) 6σ2(x)

(n− 1)· χ2

1− p2(ν) (6.14)

108

Page 110: Estadística y Programación Aplicada a la Química

6 6.Intervalos de probabilidad e intervalos de confianza

Figura 6.1: Si la magnitudX está normalmente distribuida, yD = 1,96σ, la probabilidad de que elresultado de una medidax se encuentre entre los valoresA′ y A esPN(A′ ≤ x ≤ A) = 0,95

6.3. Intervalos de confianza

6.3.1. Definición

Seax una estima del parámetro poblacionalξ .Se define como elintervalo de confianzadel parámetrox con un nivel de confianza1 − α como

el intervalo de valores dex

x′mın = x− emın 6 ξ 6 x + emax = x′max

que cumple

P (x′mın 6 ξ 6 x′max) = p = 1− α

1− α es el nivel o grado de confianza del intervalo[x1, x2]. El nivel de confianza es una medidade la probabilidad de que el parámetrox esté dentro del intervalo[x1, x2].

α es el grado de significación y da idea de la probabilidad de que el parámetrox esté fuera delintervalo estimado.

Una diferencia importante entre los intervalos de probabilidad y los intervalos de confianza esla naturaleza de los extremos. En un intervalo de probabilidad con un nivel de probabilidadp losextremos del intervaloxmin y xmax son constantes, no cambian al repetir el experimento. En unintervalo de confianza con un nivel de confianza1 − α = p, los extremos del intervalo sonx′min yx′max son números aleatorios. Esto se debe al hecho de que para calcularlos utilizamos la estima de

109

Page 111: Estadística y Programación Aplicada a la Química

6.3 6.3. Intervalos de confianza

ξ, x, que es una variable aleatoria. Por tanto, los extremos dependen de los datos empleados paracalcularx y pueden ser distintos en distintos experimentos.

Consideremos un experimento en queσ2(x) es conocida con gran precisión. Se realiza una mediday se obtiene un valorxi. El valor dexi puede no coincidir conµ pero está incluido dentro del intervalode probabilidadp dado por

que corresponde al intervalo de valores en el que esperamos obtenerxi con una probabilidadp,conocidos los valores deµx y σ2(x). Esto es,xi está comprendido entreA′ y A en la figura6.2.

Si no conocemosµx sólo podemos intentar estimar el intervalo en que esperamos que encontrar aµx (constante) conocido el valor de su estimaxi (variable aleatoria), es decir

µ− kσ 6 xi 6 µ + kσ (6.15)

Esto corresponde a queM está comprendida entreB′ y B en la figura6.2

xi − kσ 6 µ 6 xi + kσ (6.16)

Figura 6.2: Comparación de (a) intervalo de probabilidad,µx− kσ ≤ xi ≤ µx + kσ, y (b) el intervalode confianzaxi − kσ ≤ µx ≤ xi + kσ. Basado en la figura 6.2 del texto de J. Mandel reseñado en labibliografía.

Aunque las dos expresiones anteriores son equivalentes algebraicamente, tienen distinto signifi-cado. La primera (6.15) expresa el hecho de que la variable aleatoriax está comprendida entre lasconstantesµx − kσ y µx + kσ (un intervalo de probabilidad). La segunda (6.16) implica que espera-mos que la constanteµ que se encuentre en un intervalo definido por dos variables aleatoriasxi−kσ yxi + kσ (un intervalo de confianza). La interpretación teórica de los intervalos de confianza es debidaa Neyman y Pearson: el intervalo de confianza expresa la probabilidad de queµx este comprendidaen el intervalo aleatorio que se extiende dexi − kσ axi − kσ (en el intervalo B’ B de la figura6.2).

Si cada experimento consta den medidas, la estima deµx es la media muestral, . El intervalo deprobabilidad para la media muestral es

µ− kσ√n

6 x 6 µ + kσ√n

(6.17)

110

Page 112: Estadística y Programación Aplicada a la Química

6 6.Intervalos de probabilidad e intervalos de confianza

mientras que el intervalos de confianza de la media poblacional es

x− kσ√n

6 µ 6 x + kσ√n

(6.18)

La figura6.3ilustra el concepto del concepto de intervalo de confianza. En las figura se representanlos resultados de una serie de medidas con sus respectivos intervalos de confianza. Cada medida hacereferencia a una estimación independiente del parámetroµx. Debido a la naturaleza aleatoria de loserrores, las estimas fluctúan alrededor del valorµx. Las barras de error representan los intervalos deconfianza de las estimas deµx basadas en la medidaxi o en la media muestral den medidas,x.Las barras de error de cada medida equivalen a los intervalos de confianza B’B de la figura6.2. Ellímite inferior de la barra de error representa el valorx− k σ(x)/

√n, mientras que el límite superior

representa el valor de ax+k σ(x)/√

n. En el diagrama suponemos que todas las estimas se realizaronutilizandon medidas, en consecuencia la longitud de los intervalos de confianza es constante e iguala2k σ(x)/

√n .

Observe que en la figura6.3no todos los intervalos de confianza cortan la línea discontinua (quecorresponde al valor del parámetroµx). El nivel de confianza asociado de cada intervalo puede in-terpretarse como la frecuencia con la que esperamos que los intervalos obtenidos experimentalmenteincluyan el valor real de la magnitud que estemos estimando (µx en este ejemplo) cuando dibujáramosuna gráfica como la de la figura6.3y el número de medidas fuera muy grande.

Figura 6.3: Intervalos de confianza de la media cuando la varianzaσ2(x) es conocida. La longitud delos segmentos es constante pero la posición de sus puntos medios es una variable aleatoria. Note quela longitud de los segmentos es proporcional al número de medidas utilizadas para calcularx. Basadoen la figura 6.3 del texto de J. Mandel reseñado en la bibliografía.

111

Page 113: Estadística y Programación Aplicada a la Química

6.4 6.3. Intervalos de confianza

Si tanto la mediaµx como la varianzaσ2(x) son desconocidas, utilizaremos las estimas muestralesdeµxy σ2(x), x y s2(x) para calcular el intervalo de confianza de m. Sabemos que

t =x− µx

s(x)/√

n(6.19)

es una variable aleatoria que sigue una distribución una distribución t de Student conν = n − 1grados de libertad (ver sección5.3.1). Con esta expresión podemos obtener un intervalo centrado enla media muestral (intervalo de confianza)

|x− µx| 6 tp ·s(x)√

n(6.20)

x− tp ·s(x)√

n6 µx 6 x + tp ·

s(x)√n

(6.21)

donde el valor detp depende del número de medidas y del nivel de confianza (p = 1− α).Además, puesto ques(x) es una variable aleatoria, la longitud del intervalo de confianza varia

de muestra a muestra. La figura6.4 ilustra el concepto del concepto de intervalo de confianza en estecaso. En las figura se representan los resultados de una serie de medidas con sus respectivos intervalosde confianza. Cada medida hace referencia a una estimación independiente del parámetroµx. Debidoa la naturaleza aleatoria de los errores, las estimas fluctúan alrededor del valorµx. Además como losextremos del intervalo se calculan utilizando la varianza muestral,s2(x), la longitud de los intervalosde confianza es una variable aleatoria.

Figura 6.4: Intervalos de confianza de la media cuando la varianzaσ2(x) se desconoce. Comos(x)varia de experimento a experimento, tanto la longitud de los intervalos como sus puntos medios sonvariables aleatorias. Además, la longitud de los segmentos también es proporcional al número demedidas utilizadas para calcularx. Basado en la figura 6.3 del texto de J. Mandel reseñado en labibliografía.

112

Page 114: Estadística y Programación Aplicada a la Química

6 6.Intervalos de probabilidad e intervalos de confianza

6.4. Calculo de intervalos de confianza para la media

6.4.1. Datos distribuidos normalmente con varianzaσ2(x) conocida

Suponga que dispone den observacionesx1, x2, . . ., xn distribuidos de acuerdo con una distribu-ción normal de mediaµx y varianzaσ2(x), PN(x; µx, σ

2(x)) y de la que no conocemosµx.Puesto que la media muestral sigue una distribución normal,PN(x; µx, σ(x)/n el intervalo de

confianza deµx con un nivel de confianza1− α es

x− k1−α2· σ(x)√

n6 µx 6 x + k1−α

2· σ(x)√

n(6.22)

(x− k1−α

2· σ(x)√

n, x + k1−α

2· σ(x)√

n

)(6.23)

x± k1−α2· σ(x)√

n(6.24)

dondek1−α/2 toma un valor tal que se cumple

P

(x− k1−α

2· σ(x)√

n6 µx 6 x + k1−α

2· σ(x)√

n

)= P

(−k1−α

26

µx − x

σ(x)/√

n6 k1−α

2

)= 1− α

(6.25)

6.4.2. Datos distribuidos normalmente con varianza finita y con n grande

Suponga que dispone de n observacionesx1, x2, . . ., xn que siguen la misma distribución deprobabilidad con mediaµx y varianzaσ2(x) finita, ambas desconocidas pero con un valor den grande(n ≥ 50). De acuerdo con el teorema del límite central (ver5.2.1), x, sigue una distribución normalde mediaµx y varianzaσ2(x).

Así, la variable aleatoria

z =x− µ

σ(x)

√n (6.26)

sigue una distribución normal de mediaµz = 0 y varianza varianzaσ2(z) = 1, PN(z; 0, 1).Para valores grandes den podemos hacer la aproximación

σ2(x) ∼= s2(x) (6.27)

De modo que el intervalo de confianza de la media con un nivel1− α viene dado por

x− k1−α2· σ(x)√

n6 µx 6 x + k1−α

2· σ(x)√

n(6.28)

113

Page 115: Estadística y Programación Aplicada a la Química

6.4 6.4. Calculo de intervalos de confianza para la media

x± k1−α2· σ(x)√

n(6.29)

dondek1−α/2 toma un valor tal que se cumple

P

(x− k1−α

2· σ(x)√

n6 µx 6 x + k1−α

2· σ(x)√

n

)= P

(−k1−α

26

µx − x

σ(x)/√

n6 k1−α

2

)= 1− α

(6.30)¿Cuando es n lo suficientemente grande?. El valor de n depende de la función de distribución que

caracteriza al conjunto de datos estudiado. El tema va más allá de los contenidos de este curso. Comoreferencia podemos utilizarn ≥ 50.

Ejemplo 2. Cálculo del intervalo de confianza de la media (I)

Para una variable aleatoria x distribuida normalmente con varianzaσ2(x) = 1 se obtuvieron lossiguientes datos : +0.250, +1.620, + 0.014, -0.366, + 0.756, + 0.608, -2.150, +1.162.Determine el intervalo de confianza del 95 % de la media poblacionalEl intervalo de confianza viene dado por las ecuaciones6.22, 6.23ó 6.24. Por comodidad utili-zaremos la ecuación6.24

x± k1−α2· σ(x)√

n

Calculamosx = 0,205 y σ(x) = σ(x)/√

n = 1/3Puesto que el nivel de confianza es del 95 %,

P(−k 6 µ−x

σ(x)

√n 6 k

)= 2P

(0 6 µ−x

σ(x)

√n 6 k

)= 0,95

P(0 6 µ−x

σ(x)

√n 6 k

)= 0,475 → k = 1,96

Sustituyendo en la ecuación6.24obtenemos

0,205± 1,96 · 1

3= 0,653

6.4.3. Datos distribuidos normalmente con varianzaσ2(x) desconocida

Suponga que dispone den observacionesx1, x2, . . ., xn distribuidos de acuerdo con una distri-bución normal de mediaµx y varianzaσ2(x), PN(x; µx, σ

2(x)), pero que desconoce la media y lavarianza.

Para obtener el intervalo de confianza haremos uso de que la variable aleatoria (ver5.3.1)

t =x− µx

s(x)/√

n(6.31)

114

Page 116: Estadística y Programación Aplicada a la Química

6 6.Intervalos de probabilidad e intervalos de confianza

que está distribuida de acuerdo con una distribución t de Student conν = n − 1 grados de libertad.Recuerde que la distribución t de Student es simétrica respecto a t = 0.

Por tanto

x− t1−α2(ν = n− 1) · s(x)√

n6 µx 6 x + t1−α

2(ν = n− 1) · s(x)√

n(6.32)

(x− t1−α

2(ν = n− 1) · s(x)√

n, x + t1−α

2(ν = n− 1) · s(x)√

n

)(6.33)

x± t1−α2(ν = n− 1) · s(x)√

n(6.34)

dondetp(n = 1− n) corresponde al valor det tal que

P(−t1−α

2(ν = n− 1) 6 t(ν = n− 1)

)= 1− α (6.35)

−t1−α2(ν = n− 1) · s(x)√

n6

µx − x

s(x)/√

n6 t1−α

2(ν = n− 1) (6.36)

Ejemplo 3. Cálculo del intervalo de confianza de la media (II)

Considere los de resultados de un experimento en los que se determinó la densidad de un polí-mero de alto peso molecular:ρ = 1,25510 g.cm−3, s(ρ) = 3,7 10−4 g.cm−3 y n = 5.Determine el intervalo de confianza del 95 % de la media poblacionalEl intervalo de confianza viene dado

x± t1−α2(ν = n− 1) · s(x)√

n(6.37)

Puesto que el nivel de confianza es del 95 %,

ρ =1,25510± t0,975(ν = 4)3,7 10−4

√5

= 1,25510± 2,7763,7 10−4

√5

=1,25510± 0,0005 g.cm−3

115

Page 117: Estadística y Programación Aplicada a la Química

6.5 6.5. Calculo de intervalos de confianza para la varianza

Ejemplo 4. Cálculo del intervalo de confianza de la media (III)

Diez análisis de la concentración de albúmina dieron una media de 20.92µg/l y una desviacióntípica de 0.45µg/l.Calcule el intervalo de confianza del 95El intervalo de confianza viene dado

x± t1−α2(ν = n− 1) · s(x)√

n(6.38)

Puesto que el nivel de confianza es del 95 %,

c =20,92± t0,975(ν = 8)0,45√

9= 20,92± 2,31

0,45

3

=20,92± 035 g.cm−3

6.4.4. Datos que siguen una distribución desconocida con varianza finita y conn pequeña

En este caso no podemos decir nada. Para poder aplicar el teorema del límite central (ver necesi-tamos más medidas.

6.5. Calculo de intervalos de confianza para la varianza

Considere que dispone de un conjuntos den observaciones independientesx1, x2, . . ., xn quesiguen una distribución normalPN(x; µx, σ

2(x)) de la que se desconoceµx y σ2(x).Se puede demostrar que la variable aleatoria

X2 =n∑

i=1

(xi − x)2

σ2 (x)= (n− 1)

s2 (x)

σ2 (x)(6.39)

sigue una distribuciónχ2 conν = n− 1 grados de libertad.Por tanto,

P

(χ2

α/2(ν) 6 (n− 1) · s2 (x)

σ2 (x)6 χ2

1−α/2(ν)

)= 1− α (6.40)

dondeχ2α/2 y χ2

1−α/2 son las cuantilas deα/2 y 1− α/2 de las distribuciónχ2(ν). Reordenando estaexpresión se obtiene

P

((n− 1) · s2 (x)

χ21−α/2(ν)

6 σ2 (x) 6(n− 1) · s2 (x)

χ2α/2(ν)

)= 1− α (6.41)

116

Page 118: Estadística y Programación Aplicada a la Química

6 6.Intervalos de probabilidad e intervalos de confianza

y el intervalo de confianza con un nivel de confianza a viene dado por((n− 1) · s2 (x)

χ21−α/2(ν)

,(n− 1) · s2 (x)

χ2α/2(ν)

)(6.42)

Note que el intervalo no es simétrico respecto des2(x).

Ejemplo 5. Cálculo del intervalo de confianza de la varianza

Considere de nuevo el experimento de la determinación de la densidad de un polímero. En unatanda de experimentos se obtuvos2(ρ) = 14,0 10−8 g2.l−2, n = 5.Determine el intervalo de confianza deσ2(ρ) conα = 0,90.El intervalo de confianza viende dado por(

(n− 1) · s2 (x)

χ21−α/2(ν)

,(n− 1) · s2 (x)

χ2α/2(ν)

)Tenemos:

(n− 1) · s2 = 5,6 10−7

Consultando el apéndice 3, obtenemosχ20,05(ν = 4) = 0,711 y χ2

0,95(ν = 4) = 9,49.Sustituyendo (

5,67 10−7

9,49,5,67 10−7

0,711

)= (0,60, 7,97) 10−7

6.6. Cálculo de intervalos de confianza para la diferencia de lasmedias

Considere que dispone de un conjuntos de observaciones independientesx1, x2, . . ., xn1 e y1, y2,. . ., yn2 conn1 y n2 medidas cada uno.

Seanµ1 y µ2 las medias poblacionales dex e y respectivamente . En esta sección explicaremoscomo calcular el intervalo de confianza deµ1 − µ2.

117

Page 119: Estadística y Programación Aplicada a la Química

6.6 6.6. Cálculo de intervalos de confianza para la diferencia de las medias

6.6.1. Datos distribuidos normalmente con varianzasσ21(x) y σ2

2(y) conocidas

La suma de dos variables aleatorias gaussianas sigue también una distribución gaussiana (ver5.2.1).

Si x sigue una distribuciónPN(x; µx, σ21(x)) e y una distribuciónPN(x; µy, σ

22(y)). La variable

aleatoriad = x− y sigue una distribución gaussianaPN(d; µ1 − µ2, σ21(x)/n1 + σ22(y)/n2).

Por tanto la variable d, definida como

d =(x− y)− (µ1 − µ2)(

σ21

n1+

σ22

n2

)1/2(6.43)

sigue una distribuciónPN(d; 0, 1) y el intervalo de confianza viene dado por

(x− y)± z(1−α2 )

(σ2

1

n1

+σ2

2

n2

)1/2

(6.44)

6.6.2. Datos distribuidos normalmente con varianzasσ21(x) y σ2

2(y) desconoci-das pero iguales

Considere dos variables aleatorias tales quex sigue una distribuciónPN(x; µx, σ21(x)) e y una

distribuciónPN(x; µy, σ22(y)). La variable aleatoriad = x − y sigue una distribución gaussiana

PN(d; µ1 − µ2, σ21(x)/n1 + σ22(y)/n2).

Si las varianzas no son conocidas pero podemos suponer queσ21(x) = σ22(y), se puede suponer

que la variable aleatoriat

t =(x− y)− (µ1 − µ2)

s (x− y)(

1n1

+ 1n2

)1/2(6.45)

sigue una distribución t de Student conν = n1 + n2 − 2 grados de libertad.La estima deσ2(x− y), s2(x− y) se calcula utilizando la ecuación

s2 (x− y) =

∑(x− x)2 +

∑(y − y)2

n1 + n2 − 2=

(n1 − 1) s21 + (n2 − 1) s2

2

n1 + n2 − 2(6.46)

El intervalo de confianza viene dado por

(x− y)± t1−α

2(n1 + n2 − 2) s (x− y)

(1

n1

+1

n2

)1/2

(6.47)

118

Page 120: Estadística y Programación Aplicada a la Química

6 6.Intervalos de probabilidad e intervalos de confianza

Ejemplo 6. Cálculo del intervalo de confianza de la diferencia de las medias

En la comparación de dos métodos de preparación de polímeros, se obtuvieron los siguientesresultados para la densidad media de las disoluciones de polímero preparadas en cada método.

Método 1.barρ = 1,21510 g.cm- 3 s2 (ρ) = 1,4 10−7 g.cm- 3 n1 = 5

Método 1.barρ = 1,21650 g.cm- 3 s2 (ρ) = 6,5 10−7 g.cm- 3 n2 = 4

Determine el intervalo de confianza del 90 % de la diferencia de las medias. ¿Hay una diferenciasignificativa en la densidad del polímero generado en estos métodos?.El intervalo de confianza viende dado por

(x− y)± t1−α

2(n1 + n2 − 2) s (x− y)

(1

n1

+1

n2

)1/2

donde

(x− y) = −1,4 10−3

s2 (x− y) =(n1 − 1) s2

1 + (n2 − 1) s22

n1 + n2 − 2=

(4 · 14 + 3 · 60,5) 10−8

(5 + 4− 2)= 33,9 10−8

s (x− y) = 5,82 10−4

s (x− y)

(1

n1

+1

n2

)1/2

= 2,91 10−4 t0,95 (ν = 7) = 1,895

(6.48)

Sustituyendo se obtiene el intervalo de confianza de la diferencia de las medias:

∆ρ12 = (−1,4 ± 0,5) 10−3 g.l−1 (6.49)

Note que el intervalo de confianza no incluye el cero lo que indica que con un nivel de confianzadel 90 % las densidades de los polímeros producidos por ambos métodos son diferentes.

6.6.3. Datos que siguen cualquier distribución con varianza finita y conn1 yn2 grandes

De acuerdo con el teorema del límite central (ver5.2.1) para valores grandes den1 y n2, lasvariables aleatorias

zX =x− µx

σ(x)

√n1 zY =

y − µy

σ(y)

√n2 (6.50)

siguen distribuciones normales de media 0 y varianza 1.0.

119

Page 121: Estadística y Programación Aplicada a la Química

6.7 6.7. Análisis de datos emparejados

Para valores grandes de n podemos hacer la aproximación

σ2(x) ∼= s2(x)

σ2(y) ∼= s2(y)(6.51)

de modo que el intervalo de confianzaµ1 − µ2 de la media con un nivel de confianza1− α es

(x− y)± z(1−α2 )

(s21

n1

+s22

n2

)1/2

(6.52)

6.6.4. Datos distribuidos normalmente con varianzasσ21(x) y σ2

2(y) desconoci-das y distintas

Consideremos las variablesx e y con distribucionesPN(x; µ1, σ21(x)) y PN(x; µ1, σ

21(x)), de las

que no conocemos sus varianzas pero sospechamos queσ21(x) 6= σ2

2(y).Para estimar el intervalo de confianza de la media utilizaremos el estadístico

t =(x− y)− (µ1 − µ2)(

s21

n1+

s22

n2

)1/2(6.53)

que sigue una distribución t de Student conν grados de libertad que se calculan redondeando el valorobtenido de la expresión

ν =

(s21

n1+

s22

n2

)2(s41

n21(n1−1)

+s42

n22(n2−1)

)ν1 = n1 − 1 ν2 = n2 − 1

(6.54)

a un número entero.Finalmente, el intervalo de confianza viene dado por

(x− y)± t1−α

2(ν)

(s21

n1

+s22

n2

)1/2

(6.55)

6.7. Análisis de datos emparejados

A menudo se compararan dos métodos de análisis estudiando muestras de ensayo que contienensustancialmente diferentes cantidades de analito. Por ejemplo, suponga que se desea comparar dosmétodos para la determinación de la concentración de paracetamol en pastillas. Con este fin, se ana-lizan diez pastillas de diez lotes diferentes para ver si difieren los resultados obtenidos por los dosmétodos. Como siempre existe variación entre las medidas debida al error aleatorio de la medida.Además, las diferencias entre las tabletas y entre los métodos pueden contribuir también a la varia-ción entre las medidas. Esto último es lo que interesa en este ejemplo: se desea saber si los métodosproducen resultados significativamente diferentes. Estudiar la diferencia entre las médias de los resul-tados obtenidos con cada método no es apropiado en este caso porque no separa la variación debida

120

Page 122: Estadística y Programación Aplicada a la Química

6 6.Intervalos de probabilidad e intervalos de confianza

al método de la que resulta de la variación entre las pastillas: se dice que los dos efectos se «con-funden». Esta dificultad se soslaya observando la diferencia,d, entre cada par de resultados dadospor los dos métodos. Si no existen diferencias entre los dos métodos, entonces estas diferencias seobtienen de una población con mediaµd = 0. Para probar la hipótesis nula, se prueba sid difieresignificativamente de cero utilizando el estadísticot.

Para contrastar sin resultados emparejados se extraen de la misma población, es decir,H0 : µd =0, se calcula el estadísticot:

t =d

s(d)/√

n(6.56)

donded y S(d) son la media y la desviación estándar, respectivamente, ded, la diferencia entre losvalores que forman cada par de medidas. El número de grados de libertad det esν = n− 1.

Los contrastes por parejas descritos no requieren que las precisiones de los dos métodos sean igua-les. Suponen que las dife rencias,d, están distribuidas normalmente. En efecto, esto exige que cadaconjunto de medidas se distribuya normalmente y que la precisión y sesgo (si acaso) de cada métodosean constantes en el intervalo de valores en que se realizaron las medidas. Los datos pueden constarde medidas individuales, como en o de medias de medidas repetidas. Sin embargo, es necesario quese realice el mismo número de medidas sobre cada muestra por el primer método y análogamente porel segundo método: es decir, n medidas de cada muestra por el método 1 y por el método 2, dondem y n deben ser iguales. Hay diferentes circunstancias por las cuales puede ser necesario o deseablediseñar un experimento, de manera que cada muestra sea analizada por cada uno de los dos métodos,proporcionando resultados que están emparejados de forma natural.

Algunos ejemplos son:

1. La cantidad de muestra disponible a examen es suficiente para sólo una determinación por cadamétodo.

2. Las muestras a examen pueden presentarse durante un extenso período de tiempo por lo que esnecesario eliminar los efectos de las variaciones en condiciones ambientales como temperatura,presión, etc.

3. Los métodos se van a comparar utilizando una amplia variedad de muestras de diferente proce-dencia y posiblemente con concentraciones muy distintas

Ejemplo 7. Contraste de datos emparejados

Los datos de la tabla recogen los resultados de medias de la concentración de paracetamol (enmg) para un lote de 10 pastillas

Lote 1 2 3 4 5 6 7 8 9 10UV 84.63 84.38 84.08 84.41 83.82 83.55 83.92 83.69 84.06 84.03NIR 83.15 83.72 83.84 84.20 83.92 84.16 84.02 83.60 84.13 84.24

¿Hay una diferencia significativa entre los resultados obtenidos por los dos métodos?

121

Page 123: Estadística y Programación Aplicada a la Química

6.7 6.7. Análisis de datos emparejados

Las diferencias entre los pares de válores (restando el segundo al primero son):

Lote 1 2 3 4 5 6 7 8 9 10UV 84.63 84.38 84.08 84.41 83.82 83.55 83.92 83.69 84.06 84.03NIR 83.15 83.72 83.84 84.20 83.92 84.16 84.02 83.60 84.13 84.24

d +1.48 +0.66 +0.24 +0.21 -0.10 -0.61 -0.10 +0.09 -0.07 -0.21

Estos valores tienen una mediad = 0,159 y desviación típicas(d) = 0,570.Si H0 : µd = 0,de acuerdo con la ecuación6.56

texp =d

s(d)/√

n< t0,95(ν = 9)

texp = 0,88 que es menor que el valor críticot0,95(ν = 9) = 2,26. Es decir, ambos métodos noproporcionan resultados significativamente diferentes para la concentración de paracetamol.

122

Page 124: Estadística y Programación Aplicada a la Química

6 6.Intervalos de probabilidad e intervalos de confianza

6.8. Ejercicios y problemas

Cuestión 6.1 Indique la mejor respuestaLa variable aleatoriax esta distribuida de acuerdo con una distribución

(a) normal

(b) t de Student conν = n grados de libertad

(c) t de Student conν = n− 1 grados de libertad

(d) χ2 conν = n− 1 grados de libertad

(e) F conν1 = n− 1 y ν2 = n grados de libertad

(f) Ninguna de las anteriores

Cuestión 6.2 Indique la mejor respuestaLa variable aleatoriay = (x− µx)/(s(x)/

√n) esta distribuida de acuerdo con una distribución

(a) normal

(b) t de Student conν = n grados de libertad

(c) t de Student conν = n− 1 grados de libertad

(d) χ2 conν = n− 1 grados de libertad

(e) F conν1 = n− 1 y ν2 = n grados de libertad

(f) Ninguna de las anteriores

Cuestión 6.3 Indique la mejor respuestaLa variable aleatorias2(x) de datos que siguen una distribución normal esta distribuida de acuer-

do con una distribución

(a) normal

(b) t de Student conν = n grados de libertad

(c) t de Student conν = n− 1 grados de libertad

(d) χ2 conν = n− 1 grados de libertad

(e) F conν1 = n− 1 y ν2 = n grados de libertad

(f) Ninguna de las anteriores

123

Page 125: Estadística y Programación Aplicada a la Química

6.8 6.8. Ejercicios y problemas

Cuestión 6.4 Verdadero o falso. Jusitfique la respuesta.Seax una estima del parámetro poblacionalξ.

El intervalo de probabilidad de la estimax del parámetroξ con un nivel de probabilidadp es elintervalo de valores dex que cumple

Se define como el intervalo de probabilidad de la estimax del parámetroξ con un nivel deprobabilidadp al intervalo de valores dex

xmın = ξ − emın 6 x 6 ξ + emax = xmax (6.57)

que cumple

P (xmın 6 x 6 xmax) = p (6.58)

Hay infinitos intervalos de probabilidad que cumple esta condición

Cuestión 6.5 Indique aquellas afirmaciones que sean correctasUn intervalo de probabilidad simétrico

(a) sólo existe para datos que siguen distribuciones de probabilidad simétricos

(b) está centrado alrededor de la media

(c) para x está centrado enµx

(d) parax está centrado enµx

(e) paras2(x) no está centrado enσ2(x)

(f) cumple que➠ P (xmax 6 x) = 1−p2

y ➠ P (xmax 6 x) = 1−p2

Cuestión 6.6 Indique la mejor respuestaLos límitesx1 y x2 del intervalo de probabilidad simétrico

xmın = ξ − emın 6 x 6 ξ + emax = xmax (6.59)

con nivel de probabilidadp son

(a) constantes

(b) números aleatorios

(c) Ninguna de las anteriores. Justifique la respuesta

Cuestión 6.7 Defina intervalo de confianza.

Cuestión 6.8 Cuando se trabaja con intervalos de confianza, ¿qué indicamos con el nivel de con-fianza del intervalo?.

124

Page 126: Estadística y Programación Aplicada a la Química

6 6.Intervalos de probabilidad e intervalos de confianza

Cuestión 6.9 Indique aquellas afirmaciones que sean correctasLos intervalos de confianza con nivel de confianza1− α para la media pueden calcularse como

(a) x± z1−α2· σ(x)√

n

(b) µx ± z1−α2· σ(x)√

n

(c) x± t1−α2(ν = n− 1) · s(x)√

n

(d) µx ± t1−α2(ν = n− 1) · s(x)√

n

Problema 6.1 Para investigar la reproducibilidad de un método para la determinación de selenio enalimentos, se realizaron nueve medidas sobre un lote de arroz tostado, con los siguientes resultados:

0,07 0,07 0,08 0,07 0,07 0,08 0,08 0,09 0,08 µg.g−1

Calcular la media, desviación estándar y desviación estándar relativa de estos resultados.

La desviación estándar relativa se define como100× s(x)/x.

Problema 6.2 Siete medidas del pH de una solución reguladora proporcionaron los siguientes resul-tados:

5,12 5,20 5,15 5,17 5,16 5,19 5,15

Calcular los límites de confianza para el verdadero pH al nivel de confianza del (i) 95(Suponer que no existen errores sistemáticos.)

Problema 6.3 Diez análisis repetidos de la concentración de mercurio en una muestra de condensa-do de gas comercial proporcionaron los siguientes resultados:

23,3 22,5 21,9 21,5 19,9 21,3 21,7 23,8 22,6 24,7 ng.ml−1

Calcular la media, desviación estándar, desviación estándar relativa de estos resultados y límites deconfianza de la media al 99

Problema 6.4 Seis análisis repetidos de otra muestra proporcionaron los siguientes valores:

13,8 14,0 13,2 11,9 12,0 12,1 ng.ml−1

Calcular la media, desviación estándar, desviación estándar relativa de estos resultados y límites deconfianza de la media al 99

Problema 6.5 Se midió la concentración de plomo en el fluido sanguíneo para una muestra de 50niños de un colegio próximo a una calle con mucho tráfico. La media muestral fue 10.12 ng.ml−1 y ladesviación estándar fue 0.64 ng.ml−1.

Calcular el intervalo de confianza al 95 % para la concentración media de plomo de todos losniños de la escuela.

Problema 6.6 Considere los datos del problema6.5.¿Qué tamaño debería tener la muestra para reducir la longitud del intervalo de confianza a 0.2

ng.ml−1 (es decir:±0,1 ng.ml−1)?

125

Page 127: Estadística y Programación Aplicada a la Química

6.8 6.8. Ejercicios y problemas

Problema 6.7 Para la evaluación de un método para la determinación de fluoreno en agua de mar,se adicionó a una muestra sintética de agua de mar 50 ng.ml−1 de fluoreno.

Diez muestras repetidas de la concentración de fluoreno en la muestra tuvieron una media de 49.5ng.ml−1 con una desviación estándar de 1.5 ng.ml−1.

Calcule los límites de confianza de la media al 95 %.¿Está el valor adicionado de 50 ng.ml−1 dentro de los límites de confianza al 95 % ?

Problema 6.8 Se utilizó una disolución 0.1 M de ácido para valorar 10 ml de una solución de álcali0.1 M , registrándose los siguientes volúmenes de ácido:

9,88 10,18 10,23 10,39 10,21 ml

Calcule los límites de confianza de la media al 95 % y utilícelos para decidir si existe algunaevidencia de error sistemático.

Problema 6.9 En un método nuevo para determinar selenourea en agua, se obtuvieron los valorespara muesstras de agua de grifo adicionadas con 50 ng.ml−1 de selenourea

50.4 50.7 49.1 49.0 51.1

¿Hay alguna evidencia de error sistemático?

Problema 6.10 En una comparación de dos métodos para la determinación de cromo en muestrasde hierba de centeno se obtuvieron los siguientes resultados (mg.Kg−1)

Método 1 Media = 1.48 d.e. = 0.28Método 2 Media = 2.33 d.e. = 0.31

Para cada método se realizaron 5 determinaciones. ¿Estos dos métodos proporcionan resultadoscuyas medias difieren significativamente?

Problema 6.11 En una serie de experimentos para la determinación de estaño en productos ali-menticios las muestras fueron llevadas a ebullición con HCl a reflujo para diferentes tiempos. Losresultados fueron:

Tiempo de reflujo (min) Estaño encontrado30 55 57 59 56 56 5975 57 55 58 59 59 59

¿Es significativa la diferencia entre las cantidades encontradas obtenidas para los dos de ebulli-ción?

Problema 6.12 Los datos de la siguiente tabla proporcionan la concentración de tiol (mM) en ellisado sanguíneo de dos grupos de voluntarios siendo el primer grupo "normal2el segundo sufriendoartritis reumatoide

¿Es significativa la diferencia entre las cantidades de tiol en sangre encontradas para los distintosgrupos de voluntarios?.

126

Page 128: Estadística y Programación Aplicada a la Química

6 6.Intervalos de probabilidad e intervalos de confianza

Normal 1.84 1.92 1.94 1.92 1.85 1.91 2.07Reumatoide 2.81 4.06 3.62 3.27 3.27 3.76

Problema 6.13 Para evaluar un método espectrofotométrico para determinar titanio, se aplicó elmétodo a muestras de aleaciones conteniendo diferentes cantidades certificadas de titanio. Los resul-tados ( % Ti) se muestran a continuación.

Muestra Valor celtificado Media Desviación estándar1 0.496 0.482 0.02572 0.995 1.009 0.02483 1.493 1.505 0.02874 1.990 2.002 0.0212

Para cada aleación se realizaron 8 determinaciones repetidas.Para cada aleación, contraste si el valor medio difiere significativamente del valor certificado.

Problema 6.14 La tabla recoge los resultados de la medida de una propiedad mediante dos técnicasexperimentales diferentes.

Lote Ensayo espectrométrico UV Espectroscopía de reflectancia en el IR cercano1 84.63 83.152 84.38 83.723 84.08 83.844 84.41 84.205 83.82 83.926 83.55 84.167 83.92 84.028 83.69 83.609 84.06 84.1310 84.03 84.24

¿Son las diferencias entre pares de medidas significativas?.

Problema 6.15 Los siguientes datos proporcionan la recuperación de brofnuro adicionado a mues-tras con contenido vegetal, medido mediante un método cromatográfico gas-líquido. La cantidad debromuro potásico añadido a cada tipo de vegetal fue la misma.

Tomate (µg.g−1) 777 790 759 790 770 758 764Pepino (µg.g−1) 782 773 778 765 789 797 782

(a) Contrastar si la recuperación en los dos vegetales tiene varianzas, que difieran significativa-mente.

(b) Contrastar si las tasas de recuperación medias difieren significativamente.Siete medidas del pH de una solución reguladora proporcionaron los siguientes resultados:

127

Page 129: Estadística y Programación Aplicada a la Química

6.8 6.8. Ejercicios y problemas

Problema 6.16 La siguiente tabla proporciona la concentración de norepinefrina (µmol por g decreatinina) en la orina de voluntarios sanos de veinte años.

Hombres 0.48 0.36 0.55 0.45 0.46 0.47Mujeres 0.35 0.37 0.27 0.29

¿Existe evidencia que la concentración de norepinefrina difiera entre sexos?

Problema 6.17 Seis análisis repetidos de otra muestra proporcionaron los siguientes valores:

13,8 14,0 13,2 11,9 12,0 12,1 ng.ml−1

Calcular la media, desviación estándar, desviación estándar relativa de estos resultados y límites deconfianza de la media al 99

Problema 6.18 La siguiente tabla recoge resultados de un trabajo en el que fueron comparados dosmétodos diferentes para la determinación de cromo en materiales orgánicos.

Agujas de pino Método 1 media= 2.15 d.e. = 0.26Método 2 media =2.45 d.e. = 0.14

Hojas de haya Método 1 media= 5.12 d.e. = 0.80Método 2 media =7.27 d.e. = 0.44

Planta acuática Método 1 media= 23.08 d.e. = 2.63Método 2 media =32.01 d.e. = 4.66

En cada caso la media es el promedio de 5 valores.Para cada material probar si la media de los resultados obtenidos por los dos métodos difiere

significativamente.

Problema 6.19 Un nuevo procedimiento enzimático de análisis por inyección en flujo para determi-nar peróxido de hidrógeno en agua fue comparado con un método volumétrico redox convencionalcon permanganato potásico aplicando ambos métodos a muestras de peróxido de uso farmacéutico.

La siguiente tabla proporciona la cantidad de peróxido de hidrógeno, enmg.ml−1. Cada valor esla media de cuatro réplicas.

Muestra Método enzimático Método del permanganato1 31.1 32.62 29.6 31.03 31.0 30.3

Probar si los resultados obtenidos por ambos métodos difieren significativamente.

Problema 6.20 Las siguientes cifras se refieren a la concentración de albúmina, engl−1, en el suerosanguíneo de 16 adultos sanos:

Hombres 37 39 37 42 39 45 42 39Mujeres 44 40 39 45 47 47 43 41

¿Difiere significativamente la concentración media para hombres y mujeres?.

128

Page 130: Estadística y Programación Aplicada a la Química

6 6.Intervalos de probabilidad e intervalos de confianza

Problema 6.21 Se comparó un nuevo método espectroscópico de absorción atómica de llama paradeterminar antimonio en la atmósfera con el método colorimétrico recomendado. Para muestras deatmósfera urbana, se obtuvieron los siguientes resultados:

Antimonio encontrado (mg.m−3)Muestra Método nuevo Método estándar

1 22.2 25.02 19.2 19.53 15.7 16.64 20.4 21.35 19.6 20.76 15.7 16.8

¿Hay diferencias significativas entre los resultados obtenidos por los dos métodos?

129

Page 131: Estadística y Programación Aplicada a la Química

6.9 6.9. Lecturas recomendadas

6.9. Lecturas recomendadas

Para completar la preparación de este tema recomendamos la lectura de:

☞ Capítulo 3. Contrates de significación.del texto de Miller y Miller[3]. XX

☞ Chapter 7. Point Estimators, Confidence Intervalsdel texto de Graham[2]Útil para completar el estudio del tema

☞ Chapter 6. The Precission and Accuracy of Measurementsdel texto de Mandel[4]Útil para completar el estudio del tema

130

Page 132: Estadística y Programación Aplicada a la Química

7

Cálculo de errores

Contenidos ✍ Calculo de errores en medidas directas.Cálculo de errores. Deses-timación de medidas: el test Q de Dixon. El test de laτ de Thompsonmodificada.✍ Calculo de errores en medidas indirectasError de escala: determina-ción del error máximo y más probable. Error aleatorio. Combinación deerrores.✍ Media ponderada de medidas independientes

Objetivos ✓ Reconocer✓ Reconocer✓ Realizar✓ Comprender✓ Conocer✓ Comprender✓ Utilizar

131

Page 133: Estadística y Programación Aplicada a la Química

7.1 7.1. Cálculo de errores en medidas directas

7.1. Cálculo de errores en medidas directas

En general podemos expresar el resultado de una medida como

x = µ± εi

donde la incertidumbre,εi, podemos expresarla como

εi = εsistemtico + εescala + εaleatorio

Nuestro objetivo es estimar la magnitud de cada una de estas incertidumbres que pasaremos adiscutir una a una.

7.1.1. Errores de escala

La contribución del error de escala a la incertidumbre la podemos considerar constante para cadamedida. Utilizaremos como valor del error de escala la mitad de la escala de medida del aparato, a noser que las especificaciones del aparato indiquen lo contrario.

7.1.2. Errores de sistemáticos

La determinación de los errores sistemáticos no es siempre sencilla. En los casos más benignosson constantes o varían de manera conocida (por ejemplo, si utilizamos un aparato mal calibrado)y las medidas pueden corregirse. En general, para acotar los errores sistemáticos es necesario hacerexperimentos de calibrado y utilizar técnicas de diseño de experimentos.

En este curso supondremos que los errores sistemáticos están enmascarados por otras fuentes deerror.

7.1.3. Errores accidentales o aleatorios

Para estimar su valor tenemos que proponer un modelo para la función de distribución de proba-bilidad de las medidas. En adelante supondremos que nuestras medidas están distribuidas de acuerdocon una función de distribución gaussiana o que podemos utilizar el teorema del límite central. Paradecidir si la incertidumbre en las medidas se ajusta a este modelo debemos hacer uso de las técnicasde ensayo de hipótesis y diseño de experimentos.

Supongamos que tenemosn medidas independientes x1, x1 , . . ., xn de una magnitud obtenidasen un mismo aparato, utilizando el mismo método e iguales condiciones iniciales. Esta condiciónequivale a decir que las medidas son muestras de la misma población y están caracterizadas porla misma distribución de probabilidad. Si suponemos que los errores están distribuidos de acuerdocon una distribución gausiana, el valor de la magnitud a determinar coincidirá con su media,µ. Laincertidumbre en las medidas estará relacionada con su desviación típica,σ(x), que es una medida dela dispersión de los datos alrededor de la mediadi = xi − µ.

Si no conocemos niµ ni σ(x) sólo podemos estimar su valor. Para determinar las estimas deµy σ(x) tenemos que utilizar métodos de determinación de estimas. Frecuentemente se utilizan lastécnicas de máxima verosimilitud y el método de mínimos cuadrados. Aplicando estos métodos seobtiene:

132

Page 134: Estadística y Programación Aplicada a la Química

7 7.Cálculo de errores

(1) La estima de la media general de la magnitud coincide con la media aritméticax, de las obser-vaciones:

x =1

n

n∑i=1

xi

(2) ) La estima de la varianza de las medidas es la varianza muestral

s2(x) =1

n− 1

n∑i=1

(xi − x)2

(3) y la varianza de la media muestral viene dada por

s2(x) =s2(x)

n

Para estimar el grado de proximidad de la media muestral,x, a la media poblacional,µ, utilizare-mos el intervalo de confianza de la media. Los límites del intervalo de confianza se fijan de maneraque la media está contenida en este intervalo con una probabilidad predeterminada. En general seemplean valores del coeficiente de confianza,1− α , entre1− α = 0,95 y 1− α = 0,99.

Indicaremos el resultado de nuestras medidas como

x± k1−α2· σ(x)√

n(7.1)

si conocemos,σ, ó siσ(x) es desconocida.

x± t1−α2(ν = n− 1) · s(x)√

n(7.2)

Note quek = 1,96(1− α = 0,95) y k = 2,575(1− α = 0,95).

Ejemplo 1. Cálculo de incertidumbres (I)

En la determinación de la molaridad de una disolución de ácido sulfúrico por valoración conhidróxido sódico de concentración conocida, se han obtenido los siguientes resultados: 0.4311,0.4315, 0.4310, 0.4313, 0.4312 y 0.4311 M.Determine el valor medio, la desviación típica de las medidas, la desviación típica de la mediamuestral y la incertidumbre (error accidental) con un nivel de confianza del95 %.

133

Page 135: Estadística y Programación Aplicada a la Química

7.2 7.1. Cálculo de errores en medidas directas

i xi di = xi − x di2

1 0.4311 −110−3 1,10−6

2 0.4315 +310−3 9,10−6

3 0.4310 −210−3 4,10−6

4 0.4313 +110−3 1,10−6

5 0.4312 010−3 0,10−6

6 0.4311 −110−3 1,10−6

n = 6∑

xi = 2,5872∑

di = 0∑

d2i = 1,6 10−5

x = 0,4312 M s(x) =

√∑d2

i

n− 1= 1.789910−3M s(x) =

s(x)√n

= 7,30410−4

Dado queσ(x) es desconocida.

x± t1−α2(ν = n− 1) · s(x)√

n

t.975(ν = 5) = 2,57

[H2SO4] = 0,431± 0,002 M

Ejemplo 2. Cálculo de incertidumbres (II)

Diez medidas del cociente de áreas de dos picos en un experimento de cromatografía líquidadieron los siguientes resultados: 0.4911, 0.4898, 0.4923, 0.4919, 0.4999, 0.4961, 0.4947, 0.4986,0.4902, 0.4822.Determine el valor medio, la desviación típica de las medidas, la desviación típica de la mediamuestral y la incertidumbre (error accidental) con un nivel de confianza del95 %.

n = 10∑

xi = 4,9268∑

di = 0∑

d2i = 2,3 10−4

x = 0,4927 s(x) =

√∑d2

i

n− 1= 0,0051 s(x) =

s(x)√n

= 0,0016

Dado queσ(x) es desconocida.

x± t1−α2(ν = n− 1) · s(x)√

n

t.975(ν = 9) = 2,26

x = 0,4927± 2,26 · 0,0016 = 0,4927± 0,0036

134

Page 136: Estadística y Programación Aplicada a la Química

7 7.Cálculo de errores

7.2. Desestimación de medidas

Puede suceder que algunas medidas se alejen demasiado del resto por lo que pueden considerarsecomo poco representativas de las magnitudes que se quieren medir. Estas medidas deben eliminarseya que utilizarlas afecta al valor de las estimas de las magnitudes que queremos calcular.

Consideramos que una medida es errática cuando la probabilidad de obtener ese valor es muy baja.Podemos considerar que una medida es poco probable cuando está fuera del intervalo de confianza,sin embargo este criterio sólo es fiable si el número de medidas es relativamente grande (n >10) o seconoceµ con gran exactitud.

Cuando el número de observaciones es pequeño tenemos que utilizar otro criterio.Vamos a consi-derar dos métodos para detectar medidas erráticas:

El ensayo de la Q de Dixon

La técnica de laτ de Thompson modificada

7.2.1. El ensayo de la Q de Dixon

En este método se comparan la diferencia entre el valor sospechoso y la medida más próxima aéste con el rango de las medidas (diferencia entre el mayor y menor valores observados:xmax y xmin).

La variable que utilizamos como referencia es el cociente de ambas magnitudes, la Q de Dixon:

Q =xsospechoso − xmás próximo

xmáximo− xmínimo(7.3)

Si el valor de Q es mayor que el valor crítico de Q para un nivel de confianza del95 % desestima-remos el valor sospechoso.

n 4 5 6 7 8 9 10Qcrit 0.831 0.717 0.621 0.570 0.524 0.492 0.464

Cuadro 7.1: Valores críticos de Q con un nivel de confianza del 95%

Ejemplo 3. Desestimación de valores mediante el método de la Q de Dixon

En la medida de una cinética de primer orden se obtuvieron los siguientes valores de k (s−1):4.51, 4.54, 4.52, 4.66, 4.51, 4.50, 4.48, 4.49, 4.51, 4.52.Determine el valor de k. Verifique si tiene que despreciar alguna de las observaciones.

135

Page 137: Estadística y Programación Aplicada a la Química

7.2 7.2. Desestimación de medidas

A partir de los datos experimentales podemos obtener

i 1 2 3 4 5 6 7 8 9 10ki 4.51 4.54 4.52 4.66 4.51 4.50 4.48 4.49 4.51 4.52

ki − k 0.01 0.02 0.00 0.14 0.01 0.02 0.04 0.03 0.00 0.01

k = 4.52 s−1, s(k) = 0.05 s−1, s(k) = 0.02 s−1

Para la medida 4,k4 − k � s(k). Esta medida parece sospechosa.Determinaremos si hay que despreciar la medida 4:

Qexp =4,66− 4,54

4,66− 4,48= 0,67 > Qcrit(n = 10) = 0,452

Descartamos la medida de k= 4.66 y repetimos el cálculo deQexp.

Qexp =4,54− 4,52

4,54− 4,48= 0,33 < Qcrit(n = 9) = 0,492

No descartamos ningún otro dato. Repitiendo los calculo obtenemosk = 4.51 s−1, s(k) = 0.018s−1, s(k) = 0.006 s−1.

k = 4,51± 0,01 s−1

con un nivel de confianza del 95 %.

Sin embargo, este método no es útil si en la muestra están presentes dos valores erráticos muypróximos o muy separados entre si. Por ejemplo considere los valores:

2.1 2.0 2.1 2.3 2.9 2.3 3.1 2.2 2.0 2.3

En este caso

Qexp =3,1− 2,9

3,1− 2,0= 0,18 < Qcrit(n = 10) = 0,464

el método no es capaz de discernir la presencia de dos valores erráticos muy próximos. Es necesarioaplicar técnicas que tenga en cuenta la posibilidad de observar dos o más valores erráticos.

7.2.2. La técnica de laτ de Thompson modificada

Este es el método recomendado en el documentoMeasurement Uncertainty (ANSI/ASME, 1986).En este método se siguen los siguientes pasos:

(1) Se calcula la mediax y la desviación típicas(x) de lasn medidas.

(2) Se ordenan las medidas de menor a mayor.

(3) Los valores mínimo y máximo son marcados como posibles valores erráticos (outliers).

136

Page 138: Estadística y Programación Aplicada a la Química

7 7.Cálculo de errores

Figura 7.1: Ilustración de un ejemplo donde el test Q de Dixon no es capaz de discirminar los datoserráticos. Este ejemplo ilustra la importancia de hacer una representación gráfica de los datos.

(4) Para es los dos valores sospechosos se calcula el valor absoluto de su desviación respecto de lamedia:

δi = |xi − x| (7.4)

(5) El mayor valor deδi se compara con el productoτ · s(x), dondeτ depende del número demedidas realizadas (ver tabla7.2).

(6) Si δi > τ · s(x) se desechaxi y se repiten los pasos (1) a (5) hasta que el valor con mayorδi

cumplaδi < τ · s(x)

n 3 4 5 6 7 8 9 10 11 12 13τ 1.150 1.393 1.572 1.656 1.711 1.749 1.777 1.798 1.815 1.829 1.840

Cuadro 7.2: Valores de laτ de Thompson para distintos números de medidas

137

Page 139: Estadística y Programación Aplicada a la Química

7.3 7.3. Cálculo de errores de medidas indirectas

Ejemplo 4. Desestimación de valores mediante el método deτ de Thompson modificada

Nueve medidas de conductividad de una disolución dieron los siguientes resultados: 12.02,12.05, 11.96, 11.99, 12.10, 12.03, 12.00, 11.95, 12.16 mS.Determine si hay algun valor errático(1) Calculamosc y s(x).

c = 12.03 mS

s(c) = 0.07 mS

(2) Calculamosδmin y δmax.

δmin = |cmin - c| = |11.95 - 12.03| = 0.08 mS

δmax = |cmax - c| = |12.16 - 12.03| = 0.13 mS

(3) Calculamos el valor crítico deδ. Conn = 9, τ = 1,777.

δcrit = 1,777× 0,07 = 0,12

(4) Rechazamos el valorxmax.Cuando repetimos el proceso obtenemosc= 12.01 mS,s(c) = 0.05 mS, y ningún valor deberdesecharse.

7.3. Cálculo de errores de medidas indirectas

En este caso la magnitud que queremos determinar,φ, no se puede medir directamente sino quese expresa como una función den magnitudes mensurablesθ1, θ2, . . ., θn.

Como de las magnitudesθ1, θ2, . . ., θn tienen un error experimental, sólo podemos obtener susestimas experimentalesx1, x2, . . ., xn.

¿Cómo podemos estimar el valor deφ y acotar su incertidumbre?. Se puede demostrar que unaestima quasi-insesgada deφ es

y = f (x1, x2, ..., xn) (7.5)

Al igual que para medidas directas podemos escribir

y = φ + ε(y) (7.6)

donde

ε(y) = εsist(y) + εescala(y) + εaleatorio(y) (7.7)

Como en el estudio de las magnitudes directas ignoramos los errores sistemáticos. Si fueran co-nocidos su tratamiento seria semejante al error de escala.

138

Page 140: Estadística y Programación Aplicada a la Química

7 7.Cálculo de errores

A la hora de evaluar la incertidumbre de las medidas podemos considerar tres casos:

Sólo es necesario considerar el error de escala. Este es el caso en el que no podemos estimarεaleatorio, o εescala � εaleatorio.

Sólo es necesario considerar el error aleatorio:εescala � εaleatorio.

Las magnitudes deεescala y εaleatorio son comparables y no podemos despreciar ninguno.

139

Page 141: Estadística y Programación Aplicada a la Química

7.3 7.3. Cálculo de errores de medidas indirectas

140

Page 142: Estadística y Programación Aplicada a la Química

Parte I

Apéndices

141

Page 143: Estadística y Programación Aplicada a la Química
Page 144: Estadística y Programación Aplicada a la Química

APÉNDICE A

Tablas estadísticas

A.1. Área bajo la curva normal tipificada

143

Page 145: Estadística y Programación Aplicada a la Química

A.2 A.1. Área bajo la curva normal tipificada

144

Page 146: Estadística y Programación Aplicada a la Química

A A.Tablas estadísticas

A.2. Valores de las percentilastp para un distribución t de Stu-dent conν grados de lbertad

145

Page 147: Estadística y Programación Aplicada a la Química

A.3A.3. Valores de las percentilasχ2p para un distribuciónχ2 de Student conν grados de lbertad

A.3. Valores de las percentilasχ2p para un distribución χ2 de Stu-

dent conν grados de lbertad

146

Page 148: Estadística y Programación Aplicada a la Química

A A.Tablas estadísticas

A.4. Valores de las percentilasF0,95(ν1, ν2) para un distribuciónF

Recuerde queν1 es el número de grados de libertad del numerador yν2 es el número de grados delibertad del denominador.

147

Page 149: Estadística y Programación Aplicada a la Química

A.5 A.5. Valores de las percentilasF0,99(ν1, ν2) para un distribución F

A.5. Valores de las percentilasF0,99(ν1, ν2) para un distribuciónF

Recuerde queν1 es el número de grados de libertad del numerador yν2 es el número de grados delibertad del denominador.

148

Page 150: Estadística y Programación Aplicada a la Química

Bibliografía

[1] P. R. Bevington and D. K. Robinson.Data Reduction and Error Analysis for the Physical Scien-ces. Second edition.McGraw-Hill, New York, 1994.

[2] Richard C. Graham.Data Analisis for the Chemical Sciences. VCH, New York, 1993.X.

[3] Jane C. Miller James N. Miller.Estadística y Quimiometría para Química Analítica. PrenticeHall, Madrid, 2002.X.

[4] John Mandel.The Statistical Analysis of Experimental Data.Dover, New York, 1984.

[5] R. Alu Srinivasan Murray R. Siegel, John Schiller.Probabilidad y Estadística. ColecciónSchaum. McGraw-Hill, Bogotá, 2a edition, 2001.

[6] R.H. Myers R. Walpole.Probabilidad y Estadística. McGraw-Hill, Madrid, 1992.

[7] V. P. Spiridonov and A. A. Lopatkin.Tratamiento matemático de datos fisicoquímicos. Segundaedición.MIR, Moscú, 1983. TCX.

149

Page 151: Estadística y Programación Aplicada a la Química

Índice alfabético

desestimación de medidas,135Q Dixon,135

distribuciónuniforme,50binomial,51χ2, 84de Bernuilli,51de Poisson,55

relación con distribución binomial,57relación con distribución normal,58, 80

F de Fisher,88Gaussiana,70normal,70t de Student,80

relación con distribución normal,80uniforme continua,69

errorerror de escala,7error de truncamiento,11error absoluto,6

espacio muestral,16esperanza matemática

media,35, 39µx, 39momentos centrales,35momentos de una distribución,35momentos respecto del origen,35propiedades,34, 35varianza,35

exactitud,8

incertidumbre,6

Intervalos de confianza,109, 112de diferencia de las medias,117de la media,113de la varianza,116definición,109diferencia de la media para datos empare-

jados,120intervalos de probabilidad

definición,106para las medias,108para las medidas,107para las varianzas,108

ley de los grandes números,18

media muestral,x, 39, 133mediana,44medida errática,135moda,44

precisión,8prueba de Bernuilli,51

redondeo,11

sesgo,8

teorema de Moivre,55, 79teorema del límite central,78

varianza,σ2(x), 39varianza muestral,s2(x), 42, 133

150