Estadística

288
UNIVERSIDAD DE GRANADA Grado en Ingeniería Informática ESTADÍSTICA Curso: 2011/2012 Clase: Primero - Grupo: B Aviso legal: los archivos están sujetos a derechos de propiedad intelectual y su titularidad corresponde a los usuarios que los han subido a SWAD. Esto es solo una recopilación de toda la asignatura impartida en la UGR.

description

Recopliación de la asignatura.

Transcript of Estadística

Page 1: Estadística

UNIVERSIDAD DE GRANADA

Grado en Ingeniería

Informática ESTADÍSTICA

Curso: 2011/2012 Clase: Primero - Grupo: B

Aviso legal: los archivos están sujetos a derechos de propiedad intelectual y su titularidad corresponde a los usuarios que los han subido a SWAD. Esto es solo una

recopilación de toda la asignatura impartida en la UGR.

Page 2: Estadística

TEORÍA

Curso: 2011/2012 Clase: Primero - Grupo: B

Page 3: Estadística

Grado en Ingenierıa Informatica

Estadıstica

Rocıo Raya [email protected]

Curso 2011/2012

Dpto. Estadıstica e I.O.Universidad de Granada

Page 4: Estadística

Tema 1. Estadıstica Dscriptiva Unidimensional Introduccion: Conceptos basicos

TEMA 1. ESTADISTICA DESCRIPTIVA

UNIDIMENSIONAL

INTRODUCCION: CONCEPTOS BASICOS

La observacion de fenomenos que acontecen en la vida real permiten establecer unaclasificacion de los mismos:

Fenomeno determinista: Un fenomeno es determinista si al repetirlo en identicascondiciones se obtiene el mismo resultado.

Fenomeno aleatorio: Un fenomeno es aleatorio si al repetirlo en analogascondiciones puede presentar resultados diferentes.

La estadıstica se ocupa principalmente de los fenomenos aleatorios, encontrandose

ante un conjunto de observaciones que presentan una variabilidad difıcil de explicar y que

requieren un tratamiento especial (”tratamiento estadıstico”) para poder efectuar

conclusiones. Por lo tanto, la estadıstica es una rama de las matematicas que trata de la

recopilacion, el analisis, la interpretacion y la representacion de una gran cantidad de

datos numericos.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 2 / 157

Page 5: Estadística

Tema 1. Estadıstica Dscriptiva Unidimensional Introduccion: Conceptos basicos

Las etapas de un estudio estadıstico son las siguientes:

1. Recogida de datos

2. Ordenacion, tabulacion y graficos

3. Descripcion de caracterısticas

−→ Estadıstica descriptiva

4. Analisis formal

−→ Inferencia estadıstica

Definicion

Se denomina poblacion al conjunto objeto de estudio, es decir, cualquier conjunto deunidades con ciertas caracterısticas comunes, sobre las que se desea informacion.

Definicion

Cada uno de los elementos de la poblacion se denomina unidad estadıstica o individuo.

La poblacion puede ser finita o infinita, segun que los elementos que la formen sepresenten en numero finito o infinito.

Definicion

Se denomina muestra a un subconjunto representativo de la poblacion.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 3 / 157

Page 6: Estadística

Tema 1. Estadıstica Dscriptiva Unidimensional Introduccion: Conceptos basicos

Definicion

Se llaman caracteres a las propiedades que se desean observar en los elementos de lapoblacion y que han de tener todos y cada uno de ellos.

En un estudio particular pueden considerarse una sola caracterıstica o varias a la vez.

Definicion

Las modalidades son cada una de las formas en que puede presentarse un caracter.

Para estar bien definidas deben cumplir dos requisitos: exhaustividad eincompatibilidad.

Modalidades exhaustivas: Se dice que las modalidades de un caracter son exhaustivas sicubren todas las posibles formas en que este se manifiesta.

Modalidades incompatibles: Se dice que las modalidades de un caracter sonincompatibles cuando cada individuo solo puede presentar una de lasmodalidades.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 4 / 157

Page 7: Estadística

Tema 1. Estadıstica Dscriptiva Unidimensional Introduccion: Conceptos basicos

Clasificacion de caracteres segun las modalidades:

Cuantitativos: Un caracter es cuantitativo cuando sus modalidades son mediblesnumericamente. Los caracteres cuantitativos se denominan tambienvariables estadısticas. Se subdividen en dos grupos:

Variables estadısticas discretas: Son aquellas que tienen un numerofinito o infinito numerable de modalidades. Las modalidades sonvalores aislados.Variables estadısticas continuas: El numero de modalidades es nonumerable. Las posibles modalidades son todos los valores de unintervalo.

Cualitativos: Un caracter es cualitativo cuando sus modalidades no son mediblesnumericamente. Un caracter cualitativo recibe tambien el nombre deatributo.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 5 / 157

Page 8: Estadística

Tema 1. Estadıstica Dscriptiva Unidimensional Distribucion de frecuencias

DISTRIBUCION DE FRECUENCIAS

Definicion

La distribucion de frecuencias de una variable estadıstica es el conjunto de valoresordenados de la variable con sus frecuencias correspondientes.

Formalmente se representa por el conjunto de pares ordenados.

Variable cualitativa Variable cuantitativaDiscreta Continua

(Mi;ni)ki=1 (xi;ni)

ki=1 (Ii;ni)

ki=1

o o o

(Mi; fi)ki=1 (xi; fi)

ki=1 (Ii; fi)

ki=1

Mi: cada una de las modalidades de una variable cualitativa.

xi: cada uno de los valores numericos que puede tomar una variable estadısticadiscreta.

Ii: cada uno de los intervalos que constituyen las modalidades de una variableestadıstica continua, considerando que Ii = (ei−1; ei], siendo ei−1 y ei los extremosinferior y superior, respectivamente, del intervalo.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 6 / 157

Page 9: Estadística

Tema 1. Estadıstica Dscriptiva Unidimensional Distribucion de frecuencias

Se considera un caracter X con k modalidades, x1, x2, . . . , xk. Las frecuenciasasociadas a la modalidad xi son:

Definicion

Frecuencia absoluta (ni): Numero de individuos de la poblacion que presentan dichamodalidad, es decir, el numero de veces que se repite. Como las modalidades deben serincompatibles y exhaustivas se verifica que

N =

k∑

i=1

ni

siendo N el numero total de observaciones.

Definicion

Frecuencia relativa (fi): Proporcion de individuos de la poblacion que presentan dicha

modalidad. Es decir, fi =ni

N. Se verifica que

k∑

i=1

fi = 1

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 7 / 157

Page 10: Estadística

Tema 1. Estadıstica Dscriptiva Unidimensional Distribucion de frecuencias

Definicion

Frecuencia absoluta acumulada (Ni): Numero de individuos que presentan un valor de lavariable menor o igual que el considerado, por lo tanto, es la suma de las frecuenciasabsolutas hasta la i-esima modalidad,

Ni = n1 + n2 + ...+ ni =

i∑

j=1

nj ⇒ Nk = N =

k∑

i=1

ni

Definicion

Frecuencia relativa acumulada (Fi): Proporcion de individuos de la poblacion quepresentan un valor de la variable menor o igual que el considerado, por lo tanto, es lasuma de las frecuencias relativas hasta la i-esima modalidad,

Fi = f1 + f2 + ...+ fi =

i∑

j=1

fj ⇒ Fk = 1 =

k∑

i=1

fi

Tambien puede calcularse como Fi =Ni

N

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 8 / 157

Page 11: Estadística

Tema 1. Estadıstica Dscriptiva Unidimensional Tablas de frecuencias

TABLA DE FRECUENCIAS DE UNA VARIABLE ESTADISTICA DISCRETA

Se considera una variable estadıstica discreta, X, que toma los valores x1, . . . ,

xi, . . . , xk. La tabla estadıstica con los tipos de frecuencias estudiados se construye de lasiguiente forma:

xi ni Ni fi Fi

x1 n1 N1 f1 F1

x2 n2 N2 f2 F2

......

......

...xi ni Ni fi Fi

......

......

...xk nk Nk = N fk Fk = 1

Total N 1

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 9 / 157

Page 12: Estadística

Tema 1. Estadıstica Dscriptiva Unidimensional Tablas de frecuencias

TABLA DE FRECUENCIAS DE UNA VARIABLE ESTADISTICA CONTINUA

En las variables de tipo continuo se agrupan los valores de la variable en intervalos oclases que se denotan como Ii = (ei−1, ei]

Cada clase esta representada por su punto medio, que recibe el nombre de marca declase, y se denota por xi, por lo tanto, se obtiene como

xi =ei−1 + ei

2

Se define amplitud del intervalo a la diferencia entre los extremos del intervalo,

ai = ei − ei−1

Los intervalos de una poblacion pueden elegirse de igual o distinta amplitud.

El numero de intervalos, k, a utilizar no esta determinado de forma fija y por tanto, se

usa un k que permita trabajar comodamente y represente bien la estructura de los datos.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 10 / 157

Page 13: Estadística

Tema 1. Estadıstica Dscriptiva Unidimensional Tablas de frecuencias

La tabla de frecuencias correspondiente a las variables estadısticas de tipo continuo conlas frecuencias estudiadas es la siguiente:

Ii = (ei−1, ei] xi ni Ni fi Fi ai

(e0, e1] x1 n1 N1 f1 F1 a1

......

......

......

...(ei−1, ei] xi ni Ni fi Fi ai

......

......

......

...(ek−1, ek] xk nk Nk = N fk Fk = 1 ak

Total N 1

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 11 / 157

Page 14: Estadística

Tema 1. Estadıstica Dscriptiva Unidimensional Representaciones graficas

La representacion grafica tiene por objeto proporcionar una sıntesis visual de ladistribucion de frecuencias, haciendo resaltar detalles que no resultan facilmenteperceptibles directamente en la tabla estadıstica.

REPRESENTACIONES GRAFICAS DE VARIABLES ESTADISTICAS DISCRETAS

Diagrama de barras: Sobre un sistema cartesiano serepresentan en el eje de abscisas los valores de la variabley sobre cada uno de estos valores se levantan barras dealtura igual a su frecuencia absoluta o a su frecuenciarelativa.

Polıgono de frecuencias: Es la lınea que se obtieneuniendo con segmentos, en el diagrama de barras, lospuntos medios de los extremos superiores de las barrasrecibe el nombre de polıgono de frecuencias.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 12 / 157

Page 15: Estadística

Tema 1. Estadıstica Dscriptiva Unidimensional Representaciones graficas

REPRESENTACIONES GRAFICAS DE VARIABLES ESTADISTICASCONTINUAS

Histograma: El histograma se construye representandolos intervalos en el eje de abscisas y la densidad defrecuencia en el eje de ordenadas. Se dibujan rectangulosde base la amplitud ai y de altura la densidad de

frecuencia, hi, siendo hi =ni

ai

o hi =fi

ai

.

Polıgono de frecuencias: Es la lınea que se obtieneuniendo con segmentos, los puntos medios de losextremos superiores de los rectangulos que forman elhistograma.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 13 / 157

Page 16: Estadística

Tema 1. Estadıstica Dscriptiva Unidimensional Representaciones graficas

REPRESENTACIONES GRAFICAS DE VARIABLES ESTADISTICASCUALITATIVAS

Diagrama de barras: En unos ejes cartesianos serepresentan sobre el eje de abscisas las distintasmodalidades del caracter y sobre el eje de ordenadas losvalores de las frecuencias absolutas. A continuacion, enel eje de abscisas se levantan rectangulos de baseconstante y de altura proporcional a la frecuenciaabsoluta correspondiente.

Grafico de sectores: En esta representacion un cırculo sedivide en tantos sectores circulares como modalidadestenga el caracter, teniendo cada sector el areaproporcional a la frecuencia absoluta correspondiente.Los grados de cada sector se obtienen resolviendo la

proporcion ni

N= αi

o

360o

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 14 / 157

Page 17: Estadística

Tema 1. Estadıstica Dscriptiva Unidimensional Representaciones graficas

OTRAS REPRESENTACIONES GRAFICAS: DIAGRAMA DE TALLOS Y HOJAS

Se traza una lınea vertical. Todas las cifras menos la ultima se escriben a la izquierdade la lınea (forman el tallo). La ultima cifra se escribe a la derecha (forma la hoja).Cada tallo define una clase y se escribe solo una vez. El numero de hojas representa lafrecuencia de dicha clase.

Las hojas se ordenan en cada una de las ramas. De esta manera los propios datos dan

una idea visual de la zona con mayor frecuencia de observaciones. Si se gira el grafico

90o, se obtiene el histograma clasico. Cuando se obtienen tallos con ramas muy largas,

es conveniente dividir cada tallo en dos.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 15 / 157

Page 18: Estadística

Tema 1. Estadıstica Dscriptiva Unidimensional Caracterısticas de variables estadısticas

MEDIDAS DE POSICION CENTRAL

Definicion

Las medidas de posicion tratan de resumir y sintetizar el conjunto de datos mediante unvalor numerico.

Si este valor numerico se situa hacia el centro de la distribucion se habla, entonces, demedidas de posicion central. Las principales medidas de posicion central son: la media,la mediana y la moda. Se estudiaran tambien otras medidas de posicion no centralllamadas cuantiles. En cada medida se distingue para su calculo entre los casos discretoy continuo.

Definicion

Media aritmetica: Sea una variable X, con valores x1, x2, . . . , xk y frecuencias absolutasn1, n2, . . . , nk. Entonces, se define la media, y se denota por x, como la sumaponderada de los valores de la variable por sus frecuencias.

- Caso discreto: x =∑k

i=1xifi =

1

N

∑k

i=1xini siendo N el numero total de

observaciones.

- Caso continuo: En este caso los intervalos se representan por su marca de clase,definiendose la media de forma analoga al caso de variable estadıstica discreta.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 16 / 157

Page 19: Estadística

Tema 1. Estadıstica Dscriptiva Unidimensional Caracterısticas de variables estadısticas

Definicion

Mediana: Se define la mediana y se denota por Me, como aquel valor de la variableestadıstica que divide en dos conjuntos iguales a los valores de la variable supuestosordenados de forma ascendente segun el caracter.

- Caso discreto:

1 Si no existe un valor xi con Fi = 0.5, entonces la mediana es el primer valorde la variable tal que Fi > 0.5

2 Si existe un valor xi con Fi = 0.5, entonces la mediana sera la mediaaritmetica de los valores xi y xi+1, es decir,

Me =xi + xi+1

2

- Caso continuo:

1 Si existe algun intervalo Ii, tal que Fi = 0.5, entonces Me = ei2 Si no existe un intervalo Ii, tal que Fi = 0.5, se selecciona el primer intervalo

en el que Fi > 0.5. A este intervalo se le denomina intervalo mediano, sedenota por IMe. El valor exacto de la mediana se obtiene aplicando alintervalo mediano la siguiente formula:

Me = ei−1 +0.5− Fi−1

fi· ai

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 17 / 157

Page 20: Estadística

Tema 1. Estadıstica Dscriptiva Unidimensional Caracterısticas de variables estadısticas

Definicion

Moda: Se define la moda y se nota por Mo, como el valor mas frecuente de ladistribucion, o lo que es lo mismo, el que mas se repite.

La moda puede no ser unica (mas de una modalidad tienen igual frecuencia maxima) oincluso no existir (cuando todos las modalidades de la variable tengan igual frecuencia).

- Caso discreto: En este caso, la moda es el valor de la variable que corresponde a lamaxima frecuencia absoluta.

Mo = xi tal que ni = maxjnj

- Caso continuo: En primer lugar, se elige el intervalo modal, IMo = (ei−1, ei], que esaquel que tenga maxima altura o densidad de frecuencia hi = max

jhj . El valor

exacto de la moda se obtiene aplicando al intervalo modal la siguiente formula:

Mo = ei−1 +(hi − hi−1)

(hi − hi−1) + (hi − hi+1)· ai

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 18 / 157

Page 21: Estadística

Tema 1. Estadıstica Dscriptiva Unidimensional Caracterısticas de variables estadısticas

OTRAS MEDIDAS DE POSICION. CUANTILES

Sea X una variable estadıstica y sea α un numero real tal que 0 < α < 1. En general,un cuantil de orden α de la variable X, divide a la poblacion en dos partes, de talmanera que una proporcion α de la poblacion es menor que dicho valor y el resto mayor.

Definicion

Cuartiles: Son tres valores que distribuyen la serie de datos, ordenada de forma creciente,en cuatro tramos iguales, en los que cada uno de ellos contiene el 25% de lasobservaciones. Se denotan por Q1, Q2 y Q3.

Definicion

Deciles: Son nueve valores que distribuyen la serie de datos, ordenada de formacreciente, en diez tramos iguales, en los que cada uno de ellos contiene el 10% de lasobservaciones. Se denotan por: D1, D2, . . . , D9.

Definicion

Percentiles: Son noventa y nueve valores que distribuyen la serie de datos, ordenada deforma creciente, en cien tramos iguales, en los que cada uno de ellos contiene el 1% delas observaciones. Se denotan por: P1, P2, . . . , P99.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 19 / 157

Page 22: Estadística

Tema 1. Estadıstica Dscriptiva Unidimensional Caracterısticas de variables estadısticas

Calculo de un cuantil

Para calcular un cuantil C(α) se razona de manera analoga al calculo de la mediana.

- Caso discreto:

1 Si no existe un valor xi con Fi = α, entonces el cuantil de orden α es elprimer valor de la variable tal que Fi > α.

2 Si existe un valor de la variable xi que verifique Fi = α, entonces el cuantil deorden α sera

C(α) =xi + xi+1

2

- Caso continuo:

1 Si existe algun intervalo Ii, tal que Fi = α, entonces C(α) = ei2 Si no existe un intervalo Ii, tal que Fi = α, se selecciona el primer intervalo en

el Fi > α. Dicho intervalo contiene el cuantil y para determinar el valor exactose utiliza la interpolacion con la siguiente formula:

C(α) = ei−1 +α− Fi−1

fi· ai

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 20 / 157

Page 23: Estadística

Tema 1. Estadıstica Dscriptiva Unidimensional Caracterısticas de variables estadısticas

MEDIDAS DE DISPERSION

Las medidas de dispersion informan de lo proximas o alejadas que estan lasobservaciones entre sı o en relacion con un valor de referencia que normalmente es unamedida de centralizacion. De esta forma, se pueden considerar las medidas de tendenciacentral como muy representativas del conjunto, poco representativas, o en algunos casos,nada representativas, dependiendo de los valores adoptados por las medidas dedispersion.

Se considera la variable estadıstica X que toma los valores x1, x2, . . . , xk (con variableestadıstica continua se consideran las marcas de clase de los intervalos) y frecuenciasn1, n2, . . . , nk.

Definicion

Rango o recorrido: Es la medida de dispersion mas simple y se calcula como la diferenciaentre el valor maximo y el mınimo de la variable.

R = maxi=1,...,k

xi − mini=1,...,k

xi

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 21 / 157

Page 24: Estadística

Tema 1. Estadıstica Dscriptiva Unidimensional Caracterısticas de variables estadısticas

Definicion

Recorrido Intercuartılico: Es la diferencia entre el tercer y primer cuartil. Presenta laventaja de que elimina el efecto distorsionante de los valores extremos.

RIQ = Q3 −Q1

Definicion

Varianza: Se define la varianza y se denota por σ2, como la media aritmetica de loscuadrados de las desviaciones entre los valores de la variable estadıstica y la mediaaritmetica.

σ2 =

k∑

i=1

(xi − x)2fi =1

N

k∑

i=1

(xi − x)2ni

La varianza siempre sera mayor o igual que cero. Mientras mas se aproxime a cero,

mas concentrados estan los valores en torno a la media. Por el contrario, mientras mayor

sea la varianza, mas dispersos estan. El inconveniente que presenta es que no esta

acotada superiormente, por lo que cuando los valores son grandes no se tiene una clara

interpretacion.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 22 / 157

Page 25: Estadística

Tema 1. Estadıstica Dscriptiva Unidimensional Caracterısticas de variables estadısticas

Calculo simplificado de la varianza (Teorema de Konig)

Se obtiene una expresion mas simple y sencilla para calcular la varianza

σ2 =

k∑

i=1

x2i fi − x

2 =1

N

k∑

i=1

x2ini − x

2

Definicion

Desviacion Tıpica: La varianza es una medida de dispersion que viene dada en unidadesal cuadrado. Para mantener la misma unidad de medida de las observaciones, se definela desviacion tıpica, y se denota por σ, como la raız cuadrada positiva de la varianza,

σ =

k∑

i=1

(xi − x)2fi =

1

N

k∑

i=1

(xi − x)2ni =

1

N

k∑

i=1

x2ini − x

2

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 23 / 157

Page 26: Estadística

Tema 1. Estadıstica Dscriptiva Unidimensional Caracterısticas de variables estadısticas

Definicion

Coeficiente de variacion de Pearson: Se define el coeficiente de variacion de Pearson deuna variable estadıstica X, y se denota por CVx, como el cociente entre la desviaciontıpica y la media aritmetica,

CVx =σx

x

Se utiliza para comparar la dispersion de dos o mas distribuciones en las que lasvariables vienen expresadas en unidades distintas ya que es una medida de dispersionrelativa sin dimension, invariante respecto a cambios de escala. Presenta la ventaja deutilizar toda la informacion que suministra la distribucion.

El coeficiente de variacion representa el numero de veces que la desviacion tıpica

contiene a la media aritmetica, por tanto, cuanto mayor sea el coeficiente de variacion

significa que mayor numero de veces contiene la desviacion tıpica a la media aritmetica y

entonces la media aritmetica es menos representativa.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 24 / 157

Page 27: Estadística

Tema 1. Estadıstica Dscriptiva Unidimensional Caracterısticas de variables estadısticas

MEDIDAS DE FORMA: MEDIDAS DE SIMETRIA

Para medir la asimetrıa de una distribucion se utiliza el coeficiente de asimetrıa deFisher, que viene dado por

γ1 =µ3

σ3

donde µ3 =1

N

n∑

i=1

(xi − x)3ni = m3 − 3m1m2 + 2m31. Es invariante frente a cambios

de origen y escala.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 25 / 157

Page 28: Estadística

Tema 1. Estadıstica Dscriptiva Unidimensional Caracterısticas de variables estadısticas

Interpretacion (medida de simetrıa):

Cuando la distribucion es simetrica existe la mismaconcentracion de valores a la derecha y a la izquierda dela media. En este caso la suma de los valores menos lamedia al cubo sera nula por lo que γ1 = 0. Ademasx = Me = Mo.

Si γ1 > 0, se tiene una distribucion asimetrica a laderecha o positiva y se caracteriza porque surepresentacion grafica presenta cola a la derecha. Eneste caso Mo ≤ Me ≤ x.

Si γ1 < 0, se tiene una distribucion asimetrica a laizquierda o negativa y se caracteriza porque surepresentacion grafica presenta cola a la izquierda. Eneste caso x ≤ Me ≤ Mo.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 26 / 157

Page 29: Estadística

Tema 1. Estadıstica Dscriptiva Unidimensional Caracterısticas de variables estadısticas

MEDIDAS DE FORMA: MEDIDAS DE APUNTAMIENTO O CURTOSIS

Las medidas de apuntamiento o curtosis permiten analizar el grado de concentracionque presentan los valores alrededor de la zona central de la distribucion.

Para medir la curtosis de una distribucion se utiliza el coeficiente de curtosis de Fisher,que viene dado por

γ2 =µ4

σ4− 3

donde µ4 =1

N

n∑

i=1

(xi − x)4ni = m4 − 4m1m3 + 6m21m2 − 3m4

1. Es invariante frente a

cambios de origen y escala.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 27 / 157

Page 30: Estadística

Tema 1. Estadıstica Dscriptiva Unidimensional Caracterısticas de variables estadısticas

Interpretacion:

Si γ2 = 0, la distribucion se denomina mesocurtica. Presenta un grado deconcentracion medio alrededor de los valores centrales de la variable.

Si γ2 > 0, la distribucion es mas apuntada que la distribucion normal, y sedenomina leptocurtica. Presenta un elevado grado de concentracion alrededor delos valores centrales de la variable.

Si γ2 < 0, la distribucion es menos apuntada que la distribucion normal, y sedenomina platicurtica. Presenta un reducido grado de concentracion alrededor delos valores centrales de la variable.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 28 / 157

Page 31: Estadística

Tema 2. Estadıstica Descriptiva Bidimensional Distribucion de frecuencias bidimensional

TEMA 2. ESTADISTICA DESCRIPTIVA

BIDIMENSIONAL

INTRODUCCION

Se considera que se realiza el estudio de dos caracteres simultaneamente, X e Y ,sobre cada uno de los N individuos que integran la poblacion. La variable que representael estudio conjunto de esos dos caracteres se denota por (X,Y ) y recibe el nombre devariable estadıstica bidimensional.

Se denotan x1, . . . , xi, . . . , xk, las k modalidades del caracter X e y1, . . . , yj , . . . , yp,las p modalidades del caracter Y . Por lo tanto, a cada individuo de la poblacion lecorresponden un par de valores (xi, yj).

DISTRIBUCION DE FRECUENCIAS BIDIMENSIONAL

Definicion

Se llama frecuencia absoluta del par (xi, yj), y se denota por nij , al numero de individuosde la poblacion que presentan simultaneamente el valor xi de X y el valor yj de Y .

La distribucion de frecuencias absoluta bidimensional verifica∑k

i=1

∑p

j=1nij = N ya

que las modalidades de cada uno de los caracteres deben ser incompatibles y

exhaustivas, siendo N el numero total de observaciones.R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 29 / 157

Page 32: Estadística

Tema 2. Estadıstica Descriptiva Bidimensional Distribucion de frecuencias bidimensional

Definicion

Se llama frecuencia relativa del par (xi, yj), y se denota por fij , a la proporcion deindividuos de la poblacion que presentan simultaneamente el valor xi de X y el valor yjde Y ,

fij =nij

N

Se verifica que∑k

i=1

∑p

j=1fij = 1

Definicion

Se define la distribucion de frecuencias bidimensional como el conjunto de valores de lavariable bidimensional con sus respectivas frecuencias absolutas o relativas. A cada valorde la variable, que sera de la forma (xi, yj), se le hace corresponder su frecuenciaabsoluta (nij) o relativa (fij) que se representa por:

(xi, yj ;nij) o (xi, yj ; fij) i = 1, . . . , k; j = 1, . . . , p

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 30 / 157

Page 33: Estadística

Tema 2. Estadıstica Descriptiva Bidimensional Distribucion de frecuencias bidimensional

Los datos se pueden disponer en una tabla de doble entrada, de manera que en laprimera columna aparezcan las k modalidades correspondientes a la variable X y en laprimera fila las p modalidades correspondientes a la variable Y . En cada interseccion secoloca la frecuencia correspondiente al cruce de las dos modalidades.

X\Y(e′0, e

1]y1

· · ·(e′j−1, e

j ]yj

· · ·(e′p−1, e

p]yp

ni·

(e0, e1]x1

n11 · · · n1j · · · n1p n1·

......

......

......

...(ei−1, ei]

xini1 · · · nij · · · nip ni·

......

......

......

...(ek−1, ek]

xknk1 · · · nkj · · · nkp nk·

n.j n·1 · · · n

·j · · · n·p N

El primer subındice (i), representa a la fila, y el segundo subındice (j) a la columna.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 31 / 157

Page 34: Estadística

Tema 2. Estadıstica Descriptiva Bidimensional Distribucion de frecuencias bidimensional

La frecuencia absoluta ni· representa el numero de veces que se ha observado el valorxi de X independientemente del valor presentado por Y y, por tanto, se obtiene como lasuma de todas las frecuencias absolutas correspondientes a la fila i-esima, es decir,

ni· = ni1 + ni2 + . . .+ nij + . . .+ nip =

p∑

j=1

nij (i fijo)

La frecuencia absoluta n·j representa el numero de veces que se ha observado el valor

yj de Y independientemente del valor presentado por X y, por tanto, se obtiene como lasuma de todas las frecuencias absolutas correspondientes a la columna j-esima, es decir,

n·j = n1j + n2j + . . .+ nij + . . .+ nkj =

k∑

i=1

nij (j fijo)

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 32 / 157

Page 35: Estadística

Tema 2. Estadıstica Descriptiva Bidimensional Distribucion de frecuencias bidimensional

Si se divide cada casilla de la tabla anterior por el total de los elementos de lapoblacion N , se obtiene la tabla que contiene las frecuencias relativas fij ,correspondientes a los distintos pares (xi, yj).

X\Y(e′0, e

′1]

y1· · ·

(e′j−1, e

′j]

yj

· · ·(e′

p−1, e′p]

yp

fi·

(e0, e1]x1

f11 · · · f1j · · · f1p f1·

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.(ei−1, ei]

xi

fi1 · · · fij · · · fip fi·

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.(e

k−1, ek]

xk

fk1 · · · f

kj· · · f

kpfk·

f.j f·1 · · · f·j · · · f·p 1

La ultima columna esta formada por las frecuencias relativas fi·, dondefi· =

∑p

j=1fij . La ultima fila esta formada por las frecuencias relativas f

·j donde

f·j =

∑k

i=1fij y en la que la suma de todas las frecuencias relativas vale la unidad

∑p

i=1

∑q

j=1fij =

∑p

i=1fi· =

∑q

j=1f·j = 1. Cuando la variable estadıstica es de tipo

continuo, se suelen incluir ademas las marcas de clase, amplitud y densidad de frecuencia.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 33 / 157

Page 36: Estadística

Tema 2. Estadıstica Descriptiva Bidimensional Distribucion de frecuencias marginal

DISTRIBUCION DE FRECUENCIAS MARGINAL

La distribucion marginal de X, queexpresa como se distribuye la variable X

independientemente de los valorespresentados por la variable Y , se obtienetomando en la tabla de doble entrada, laprimera y ultima columnas.

X ni·

x1 n1·

......

xi ni·

......

xk nk·

Total N

La distribucion marginal de Y , queexpresa como se distribuye la variable Y

independientemente de los valorespresentados por la variable X, se obtienetomando en la tabla de doble entrada, laprimera y ultima filas.

Y n·j

y1 n·1

......

yj n·j

......

yp n·p

Total N

Las frecuencias relativas de las distribuciones marginales se obtienen dividiendo las

frecuencias absolutas entre el numero total de observaciones. Es decir, la frecuencia

relativa de xi sera fi· =ni·N

y la frecuencia relativa de yj sera f·j =

n·j

N.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 34 / 157

Page 37: Estadística

Tema 2. Estadıstica Descriptiva Bidimensional Distribucion de frecuencias marginal

Caracterısticas de las distribuciones marginales

Las distribuciones marginales son distribuciones unidimensionales, y por tanto, sepueden calcular para ellas todas las medidas descriptivas. Por ejemplo, las medias yvarianzas son:

- Media marginal de X: x =1

N

k∑

i=1

xini· =

k∑

i=1

xifi·

- Varianza marginal de X:

σ2x

=1

N

k∑

i=1

(

xi − x)2

ni· =k∑

i=1

(

xi − x)2

fi· =1

N

k∑

i=1

x2ini· − x

2

- Media marginal de Y : y =1

N

p∑

j=1

yjn·j =

p∑

j=1

yjf·j

- Varianza marginal de Y :

σ2y

=1

N

p∑

j=1

(

yj − y

)2n·j =

p∑

j=1

(

yj − y

)2f·j =

1

N

p∑

j=1

y2jn·j − y

2

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 35 / 157

Page 38: Estadística

Tema 2. Estadıstica Descriptiva Bidimensional Distribucion de frecuencias marginal

Covarianza

Se considera como una medida de la variabilidad conjunta de las variables X e Y . Suexpresion es la siguiente

σxy =1

N

k∑

i=1

p∑

j=1

(xi − x)(yj − y)nij =1

N

k∑

i=1

p∑

j=1

xiyjnij − xy

El signo de la covarianza indica el sentido en el que varıan conjuntamente las dosvariables

Si σxy > 0, entonces las variables varıan en el mismo sentido.

Si σxy < 0, entonces las variables varıan en sentidos opuestos.

Si σxy = 0, entonces no existe relacion lineal entre las variables, lo que no significaque sean independientes, pueden tener otro tipo de relacion.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 36 / 157

Page 39: Estadística

Tema 2. Estadıstica Descriptiva Bidimensional Distribucion de frecuencias condicionada

DISTRIBUCION DE FRECNCUENCIAS CONDICIONADA

Las distribuciones condicionadas son distribuciones unidimensionales obtenidas a partirde las bidimensionales, manteniendo fijo un valor o varios en una de las variables yconsiderando los valores que toma la otra con sus respectivas frecuencias.

La distribucion condicionada de X

respecto de Y = yj (X|Y = yj) se obtiene apartir de la tabla bidimensional, tomando laprimera columna de los valores de la variableX y la columna j-esima (correspondiente alvalor yj) de frecuencias absolutas.

X|Y = yj ni|j

x1 n1j

.

.

.

.

.

.xi nij

.

.

.

.

.

.xk

nkj

Total n·j

La distribucion condicionada de Y

respecto de X = xi (Y |X = xi) se obtienea partir de la tabla bidimensional, tomandola primera fila de los valores de la variable Y

y la fila i-esima (correspondiente al valor xi)de frecuencias absolutas.

Y |X = xi nj|i

y1 ni1

.

.

.

.

.

.yj nij

.

.

.

.

.

.yp nip

Total ni·

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 37 / 157

Page 40: Estadística

Tema 2. Estadıstica Descriptiva Bidimensional Distribucion de frecuencias condicionada

Las frecuencias relativas de las distribuciones condicionadas se obtienen dividiendo lasfrecuencias absolutas entre el numero total de observaciones que cumplen la condicionrequerida, que en los casos anteriores son, respectivamente, n

·j y ni·. Es decir, la

frecuencia relativa de xi|Y = yj sera fi|j =nij

n·j=

fij

f·j, y la frecuencia relativa de

yj |X = xi sera fj|i =nij

ni·=

fij

fi·

Caracterısticas de las distribuciones condicionadas

- Media condicionada de X|Y = yj : x|Y =yj=

1

n·j

k∑

i=1

xinij =

k∑

i=1

xifij

- Varianza condicionada de X|Y = yj :

σ2X|Y =yj

=1

n·j

k∑

i=1

(

xi − x|Y =yj

)2nij =

k∑

i=1

(

xi − x|Y =yj

)2fij

- Media condicionada de Y |X = xi: y|X=xi=

1

ni·

p∑

j=1

yjnij =

p∑

j=1

yjfij

- Varianza condicionada de Y |X = xi:

σ2Y |X=xi

=1

ni·

p∑

j=1

(

yj − y|X=xi

)2nij =

p∑

j=1

(

yj − y|X=xi

)2fij

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 38 / 157

Page 41: Estadística

Tema 2. Estadıstica Descriptiva Bidimensional Regresion y correlacion

Diagrama de dispersion o nube de puntos

Cuando los caracteres que forman la distribucion bidimensional son, ambos,cuantitativos sus valores son pares de numeros reales de la forma (xi, yj) y se puedenrepresentar ordenados sobre un sistema de ejes cartesianos, con lo que se obtiene unconjunto de puntos sobre el plano. A este conjunto de puntos se le denomina diagramade dispersion o nube de puntos y es la representacion grafica mas importante asociada auna distribucion bidimensional.

Hay que tener en cuenta que como el par (xi, yj) tiene una frecuencia nij , que enmuchos casos sera mayor que 1, entonces se representa el par con un punto en el que seindica la frecuencia que corresponde a ese par. En ocasiones tambien se puederepresentar utilizando distintos tamanos de puntos.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 39 / 157

Page 42: Estadística

Tema 2. Estadıstica Descriptiva Bidimensional Regresion y correlacion

Independencia. Condicion necesaria y suficiente.

La condicion necesaria y suficiente para que X e Y sean independientes es que lafrecuencia relativa conjunta sea igual al producto de las frecuencias marginales.

fij = fi·f·j ∀i = 1, . . . , k, j = 1, . . . , p

Si no se verifica esa igualdad para algun (i, j), se dice que las variables sondependientes estadısticamente. Tambien se puede comprobar la condicion anterior enterminos de las frecuencias absolutas

nij =ni·n·j

N

Se concluye diciendo que si los dos caracteres son independientes entre sı se verifica

que tanto las filas como las columnas de la tabla de doble entrada son proporcionales

entre sı.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 40 / 157

Page 43: Estadística

Tema 2. Estadıstica Descriptiva Bidimensional Regresion y correlacion

La independencia y la dependencia funcional son dos casos extremos de la relacionentre las variables, cuando esta no existe o es total. Generalmente cuando se estudianconjuntamente dos variables surgen los casos intermedios.

Cuando existe una dependencia estadıstica entre variables, el objetivo es encontrar unamedida de la relacion entre ambas. Se trata de buscar un modelo o funcion matematicaque recoja esta relacion y ademas una medida de la aproximacion de dicha funcion a losdatos reales. Por tanto, en el estudio de la dependencia estadıstica de dos variables hayque resolver dos problemas:

1 Determinar el grado de relacion o dependencia entre las variables.

2 Encontrar un modelo aproximado de la dependencia.

La correlacion se encarga de solucionar el primer problema cuantificando estadependencia mediante el calculo del coeficiente de correlacion.

La regresion estudia desde el punto de vista estadıstico la relacion entre variables

proporcionando un modelo de dicha relacion. El modelo consiste en una funcion

matematica cuya forma se aproxima a los datos observados. La funcion encontrada

permitira obtener los valores aproximados de una de las variables a partir de los valores

prefijados de las otras.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 41 / 157

Page 44: Estadística

Tema 2. Estadıstica Descriptiva Bidimensional Regresion y correlacion

Concepto de regresion

Definicion

Dadas dos variables estadısticas X e Y , se busca una funcion f que permita expresar losvalores de Y en funcion de los valores de los de X (o viceversa)

Y = f(X).

Graficamente esto equivale a encontrar una curva que aunque no pase por todos lospuntos del diagrama de dispersion este lo mas proxima posible de dichos puntos. Portanto, interesara medir el grado de ajuste entre la funcion teorica y la nube de puntos. Elprincipal objetivo de este ajuste es el de realizar predicciones.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 42 / 157

Page 45: Estadística

Tema 2. Estadıstica Descriptiva Bidimensional Regresion y correlacion

Definicion

Se llama variable dependiente (Y ), a la variable que se pretende predecir, y como sunombre indica, depende de los valores que toma otra variable.

Definicion

Se denomina variable independiente (X), a la variable que se usa para predecir losvalores de la variable dependiente.

Cuando solo se utiliza una variable independiente, la regresion se denomina simple.Cuando intervienen varias variables independientes la regresion se denomina multiple.

El criterio que se adoptara para elegir el mejor ajuste es el ”criterio de mınimoscuadrados”, mediante el cual se pretende hacer mınima la media de la diferencia alcuadrado, entre los valores observados y los valores que da la funcion ajustada, que sedenominan valores ajustados y se denotan por yi, obteniendose como

yi = f(xi)

Las diferencias entre los valores observados y los ajustados se denominan residuos, y sedenotan por eij , por lo tanto,

eij = yj − yi

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 43 / 157

Page 46: Estadística

Tema 2. Estadıstica Descriptiva Bidimensional Regresion y correlacion

En definitiva, se trata de minimizar la media de los residuos al cuadrado, por lo que lafuncion a minimizar es

Φ =

k∑

i=1

p∑

j=1

e2ijfij =

1

N

k∑

i=1

p∑

j=1

e2ijnij =

1

N

k∑

i=1

p∑

j=1

(yj − yi)2nij

Esta funcion sera mınima cuando las derivadas parciales respecto a cada parametrosean nulas. Calculando las derivadas parciales e igualandolas a cero se obtiene unsistema de ecuaciones denominado sistema de ecuaciones normales.

Dependiendo del tipo de funcion que mejor ajuste a los datos, la regresion sedenomina de distinta forma. En el caso concreto en el que la funcion a utilizar sea laecuacion de una recta, se denomina regresion lineal simple.

Se distingue entre dos rectas de regresion:

La recta de regresion de Y sobre X, se denota por Y/X, cuando la variableindependiente es X.

La recta de regresion de X sobre Y , se denota por X/Y , cuando la variableindependiente es Y .

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 44 / 157

Page 47: Estadística

Tema 2. Estadıstica Descriptiva Bidimensional Regresion y correlacion

Recta de regresion Y/X

Se considera que la funcion que mejor se ajusta a la nube de puntos es una recta, porlo tanto,

f(X) = Y = a+ bX

Se aplica el criterio de mınimos cuadrados para determinar el valor de a y de b,parametros de la funcion que son desconocidos. En este caso,

La variable Y es la variable dependiente.

La variable X es la variable independiente.

El coeficiente o parametro b representa la pendiente de la recta, con la siguienteinterpretacion:

Si b > 0, representa el incremento que se produce en Y al aumentar en unaunidad X.Si b < 0, representa la disminucion que se produce en Y al aumentar en unaunidad X.Si b = 0, Y no depende linealmente de X.

El coeficiente o parametro a representa el valor que toma Y cuando X = 0.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 45 / 157

Page 48: Estadística

Tema 2. Estadıstica Descriptiva Bidimensional Regresion y correlacion

La solucion que se obtiene de aplicar el criterio de mınimos cuadrados es:

b =σxy

σ2x

a = y − bx

Una de las aplicaciones de la recta de regresion de Y sobre X es predecir el valor que

tendra la variable Y conocido un valor de X, diferente a los utilizados para construir la

recta de regresion.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 46 / 157

Page 49: Estadística

Tema 2. Estadıstica Descriptiva Bidimensional Regresion y correlacion

Recta de regresion X/Y

Se considera que la funcion que mejor se ajusta a la nube de puntos es una recta, porlo tanto,

f(Y ) = X = a′ + b

Y

Se aplica el criterio de mınimos cuadrados para determinar el valor de a′ y de b′.

La variable X es la variable dependiente.

La variable Y es la variable independiente.

El coeficiente o parametro b′ representa la pendiente de la recta, con la siguienteinterpretacion

Si b′ > 0, representa el incremento que se produce en X al aumentar en unaunidad Y .Si b′ < 0, representa la disminucion que se produce en X al aumentar en unaunidad Y .Si b′ = 0, X no depende linealmente de Y .

El coeficiente o parametro a′ representa el valor que toma X cuando Y = 0.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 47 / 157

Page 50: Estadística

Tema 2. Estadıstica Descriptiva Bidimensional Regresion y correlacion

El estudio de la regresion lineal es simetrico al anterior, solamente hay que cambiar elpapel de las variables. El criterio de mınimos cuadrados da como resultado las siguientessoluciones

b′ =

σxy

σ2y

a′ = x− b

y

Una de las aplicaciones de la recta de regresion de X sobre Y es predecir el valor que

tendra la variable X conocido un valor de la variable Y , diferente a los utilizados para

construir la recta de regresion.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 48 / 157

Page 51: Estadística

Tema 2. Estadıstica Descriptiva Bidimensional Regresion y correlacion

Coeficiente de correlacion lineal de Pearson

Cuando los datos tienden a agruparse en torno a una lınea recta, se puede afirmar queexiste correlacion lineal entre las variables. Se distinguen dos casos:

Si la recta tiene pendiente positiva, la correlacion es directa, es decir, incrementospositivos de una variable implican aumentos en la otra.

Si la recta tiene pendiente negativa, la correlacion es inversa o indirecta, es decir, alaumentar una variable disminuye la otra.

El coeficiente de correlacion lineal de Pearson mide el grado de asociacion lineal(correlacion lineal) entre las variables. Se denota por r y se define como

r =σxy

σxσy

, −1 ≤ r ≤ 1

El signo de r coincide con el de la covarianza, ya que las desviaciones tıpicas siempre

son positivas.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 49 / 157

Page 52: Estadística

Tema 2. Estadıstica Descriptiva Bidimensional Regresion y correlacion

Interpretacion:

r = 1: Existe una relacion lineal directa perfecta, por lo que todos los puntos de lavariable estan sobre la recta de regresion.

r = −1: Existe una relacion lineal inversa perfecta, por lo que todos los puntos dela variable estan sobre la recta de regresion.

0 < r < 1⇒ La relacion lineal sera mas intensa (y directa) cuanto mas se aproximea 1, y mas debil a medida que se aproxime a 0.

−1 < r < 0⇒ La relacion lineal sera mas intensa (e inversa) cuanto mas seaproxime a -1, y mas debil a medida que se aproxime a 0.

r = 0⇒ No existe relacion lineal entre las variables, lo que no implica que seanindependientes, pueden estar relacionadas pero no linealmente. Si X e Y sonindependientes, entonces r = 0. El recıproco no es cierto.

Puede comprobarse que

r2 = b · b′

ya que

r2 =

σ2xy

σ2xσ

2y

=σxy

σx

·σxy

σy

= b · b′

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 50 / 157

Page 53: Estadística

Tema 2. Estadıstica Descriptiva Bidimensional Regresion y correlacion

Coeficiente de determinacion

Este termino mide el grado de ajuste entre la nube de puntos y la funcion ajustada.Esto lleva a usar los residuos para medir la dependencia, haciendo notar que ladependencia estara ıntimamente relacionada con la funcion que se ajuste, ya que cadauna dara lugar a unos residuos distintos.

Considerando la regresion Y/X, el objetivo es explicar una variable Y a partir de unavariable X y esto conlleva explicar la variabilidad de Y . Si X e Y estan relacionadas,parte de esta variabilidad vendra expresada en funcion de X y el resto dependera de Y odel azar, por lo que se distingue entre la variabilidad que explica la regresion (variabilidadexplicada por el modelo) y la variabilidad que no explica la regresion (tambien llamadaresidual).

Variabilidad Y= Var.explicada por el modelo + Var.no explicada por el modelo

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 51 / 157

Page 54: Estadística

Tema 2. Estadıstica Descriptiva Bidimensional Regresion y correlacion

De esta descomposicion de la variabilidad se obtiene el coeficiente de determinacion,que se denota por R2

R2 =

σ2exp

σ2y

=σ2y − σ2

res

σ2y

= 1−σ2res

σ2y

, 0 ≤ R2 ≤ 1

Este coeficiente representa la proporcion de la varianza de Y (variabilidad de lavariable) que es explicada por la regresion. De esta forma, R2 da una medida de labondad de ajuste, es decir, del grado de ajuste de la regresion a los datos.Interpretacion:

R2 = 0⇒ σ2exp = 0. El modelo no explica nada de la variable dependiente, es un

mal ajuste.

R2 = 1⇒ σ2exp = σ2

y. Existe dependencia funcional exacta, todos los puntosobservados estan sobre la funcion de regresion obtenida, es decir, el modelo explicacompletamente el comportamiento de la variable dependiente, el ajuste de los datosal modelo es perfecto.

0 < R2 < 1. Valores cercanos a 1 indican un buen ajuste de los datos al modelo.Valores cercanos a 0 indican un mal ajuste de los datos al modelo.

El objetivo de la regresion es la prediccion de valores de la variable dependiente apartir de valores conocidos de la variable independiente. Esta prediccion sera fiablesiempre y cuando se tenga un buen ajuste.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 52 / 157

Page 55: Estadística

Tema 2. Estadıstica Descriptiva Bidimensional Regresion y correlacion

Cuando el modelo que se utiliza es el lineal, se verifica que

R2 = r

2

ya que en este caso se tiene que σ2res = σ

2y(1− r

2)

El coeficiente de correlacion de Pearson se utiliza como medida de bondad de ajustede la nube de puntos a la recta de regresion. El valor obtenido permite determinar laposicion relativa de la rectas de regresion:

1) Si r2 6= 1, las rectas se cortan en un solo punto, que tiene de coordenadas (x, y).

2) Si r2 = 1, las rectas coinciden. En este caso, el ajuste sera perfecto.

3) Si r2 = 0, entonces no existe relacion lineal entre las variables.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 53 / 157

Page 56: Estadística

Tema 3. Teorıa de la Probabilidad Introduccion: Conceptos basicos

TEMA 3. TEORIA DE LA PROBABILIDAD

INTRODUCCION

El objetivo de la Estadıstica Descriptiva es hacer una descripcion sencilla de los datoscorrespondientes a la muestra obtenida. Pero el objetivo fundamental de la Estadıstica esinferir las propiedades de la poblacion a partir de las propiedades de la muestra. Paraesto es necesario un puente de union entre la poblacion y la muestra (modelos deprobabilidad).

Se dice que un experimento o prueba es una accion que se realiza con el proposito derecoger algun tipo de observacion sobre los resultados.

Definicion

Un experimento se denomina determinıstico si, al repetir el experimento en identicascondiciones, siempre presenta el mismo resultado. En estos fenomenos es posible saber elresultado final si se conocen el estado inicial y las condiciones de realizacion.

Definicion

Un experimento es aleatorio cuando su resultado es impredecible, es decir, aunque elexperimento se repita de la misma forma y bajo identicas condiciones puede dar lugar adiferentes resultados.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 54 / 157

Page 57: Estadística

Tema 3. Teorıa de la Probabilidad Introduccion: Conceptos basicos

CONCEPTOS BASICOS

Suceso elemental

Es cada uno de los posibles resultados que se obtienen al realizar el experimento, yestos se consideran indivisibles.

Espacio muestral

Se denota por Ω y se define como el conjunto formado por todos los posiblesresultados o sucesos elementales de un experimento aleatorio.

El espacio muestral puede ser:

Finito: Se sabe cuantos sucesos elementales lo componen.Infinito numerable: Esta compuesto por infinitos sucesos elementales quecorresponden con los numeros naturales.Infinito no numerable: Esta compuesto por infinitos sucesos elementales queno se corresponden con los numeros naturales.

Suceso

Es cualquier resultado del experimento. Esta compuesto por uno o mas sucesoselementales.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 55 / 157

Page 58: Estadística

Tema 3. Teorıa de la Probabilidad Introduccion: Conceptos basicos

Suceso seguro (Ω)

Es el formado por todos los resultados posibles del experimento, es decir, el propioespacio muestral Ω.

Suceso imposible (∅)

Es aquel que no contiene ningun resultado del experimento, es decir, el conjuntovacıo ∅.

Suceso diferencia

Se denota por A−B, y es otro suceso que contiene todos los sucesos elementalesde A que no son sucesos de B. Se tiene, por tanto, que A−B = A−A ∩B.

Suceso complementario de un suceso

Se denota por A, es el suceso que se realiza cuando no se verifica A.

Se dice que el suceso A implica el suceso B, y se denota A ⊆ B, si siempre que severifica A, se verifica B.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 56 / 157

Page 59: Estadística

Tema 3. Teorıa de la Probabilidad Introduccion: Conceptos basicos

Operaciones con sucesosLas operaciones con sucesos son las habituales entre conjuntos (union, interseccion,

complementario, inclusion, etc).

1 Union (A ∪B)

Si A y B son dos sucesos, el suceso union A ∪B es el conjunto de todos lossucesos elementales de A y los de B.

2 Interseccion (A ∩B)

Si A y B son dos sucesos, el suceso interseccion A ∩B es el formado por todos lossucesos elementales que pertenecen simultaneamente a A y B.

3 Diferencia (A−B)

Suceso en el que se verifica que se cumple A pero no B.

4 Complementacion (A)

Dado un suceso A, se define el complementario de dicho suceso, como el formadopor todos los sucesos elementales del espacio muestral que no estan en A.

Dos sucesos A y B se dicen incompatibles si al ocurrir uno no puede ocurrir el otro, esdecir A ∩B = ∅.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 57 / 157

Page 60: Estadística

Tema 3. Teorıa de la Probabilidad Propiedades

PROPIEDADES

Con las operaciones anteriores, puede demostrarse que se verifican las siguientespropiedades.

∅ = Ω Ω = ∅

Union Interseccion

A ∪ A = Ω A ∩ A = ∅

Idempotente A ∪ A = A A ∩ A = A

Conmutativa A ∪ B = B ∪ A A ∩ B = B ∩ A

Asociativa (A ∪ B) ∪ C = A ∪ (B ∪ C) (A ∩ B) ∩ C = A ∩ (B ∩ C)

Distributiva (A ∪ B) ∩ C = (A ∩ C) ∪ (B ∩ C) (A ∩ B) ∪ C = (A ∪ C) ∩ (B ∪ C)

Leyes de Morgan A ∪ B = A ∩ B A ∩ B = A ∪ B

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 58 / 157

Page 61: Estadística

Tema 3. Teorıa de la Probabilidad Propiedades

Algebra de sucesos

Tanto si el fenomeno o experimento aleatorio lleva asociado un espacio muestraldiscreto o continuo, en la practica se estara interesado en medir de alguna forma el gradode ocurrencia de ciertos sucesos. El objetivo por consiguiente es asignar valores a lossucesos, de modo que representen sus posibilidades de realizarse. Para poder definir oasignar estos numeros a los sucesos es preciso dotar al conjunto de todos los sucesos deuna estructura de σ-algebra.

Dado un experimento aleatorio y su espacio muestral asociado Ω, un algebra desucesos que se denota por A, es un conjunto formada por todos los sucesos de Ω, queverifica:

i) Ω ∈ A.

ii) Si A ∈ A entonces A ∈ A.

iii) Si A1, A2, ... ∈ A entonces

i=1

Ai ∈ A.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 59 / 157

Page 62: Estadística

Tema 3. Teorıa de la Probabilidad Propiedades

Definicion axiomatica de probabilidad

La definicion axiomatica de probabilidad, debida a Kolmogorov, es general y se adaptaa un conjunto amplio de situaciones. Para poder dar dicha definicion se necesita disponerde un espacio muestral Ω sobre el que este definida una σ-algebra de sucesos, es decir, seimpone una cierta estructura al conjunto de sucesos.

Definicion

Sea Ω un espacio muestral y A un σ-algebra de sucesos definida sobre Ω. Se define unaprobabilidad como una funcion P : A → R que verifica los siguientes axiomas

1 Si A ∈ A entonces P (A) ≥ 0.

2 P (Ω) = 1.

3 Si A1, A2, ... ∈ A, es cualquier sucesion infinita numerable de sucesos

incompatibles, (Ai ∩Aj = ∅, ∀i 6= j) entonces P

(

i=1

Ai

)

=

i=1

P (Ai).

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 60 / 157

Page 63: Estadística

Tema 3. Teorıa de la Probabilidad Propiedades

Consecuencias de los axiomas

1 P(∅)=0. El recıproco de la propiedad anterior no es cierto, es decir, si un sucesotiene probabilidad nula no tiene que ser el suceso vacıo.

2 El tercer axioma puede particularizarse para el caso de una coleccion de sucesosincompatibles finitos, es decir,

P

(

n⋃

i=1

Ai

)

=

n∑

i=1

P (Ai)

3 Si A ∈ A entonces P (A) = 1− P (A).

4 Si AyB ∈ A y A ⊂ B entonces P (A) ≤ P (B)

5 Si A ∈ A entonces P (A) ≤ 1

6 Si AyB ∈ A entonces P (B −A) = P (B)− P (A ∩B)

7 Si AyB ∈ A y A ⊂ B, entonces P (B −A) = P (B)− P (A)

8 Si AyB ∈ A entonces P (A ∪B) = P (A) + P (B)− P (A ∩B)

9 Si AyB ∈ A entonces P (A ∪B) ≤ P (A) + P (B)

10 Para n sucesos la desigualdad anterior se expresa como

P (A1 ∪ . . . ∪An) ≤ P (A1) + ...+ P (An)

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 61 / 157

Page 64: Estadística

Tema 3. Teorıa de la Probabilidad Probabilidad condicionada

PROBABILIDAD CONDICIONADA

Con este concepto se trata de registrar el cambio que experimenta la probabilidad deun suceso si aumenta la informacion de que se dispone sobre el resultado del experimento.

Sea B un suceso con probabilidad no nula, dado otro suceso A, se define laprobabilidad de A condicionada a B, denotada por P (A|B), a la probabilidad de queocurra A supuesto que ha ocurrido B. Esta definicion implica que la probabilidadcondicionada se puede calcular como el cociente,

P (A|B) =P (A ∩B)

P (B)

Del mismo modo, se tiene que

P (B|A) =P (A ∩B)

P (A)

De esta definicion se puede deducir que

P (A ∩B) = P (B)P (A|B) = P (A)P (B|A)

Se cumple que

P (A|B) = 1− P (A|B) P (B|A) = 1− P (B|A)

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 62 / 157

Page 65: Estadística

Tema 3. Teorıa de la Probabilidad Independencia de sucesos

INDEPENDENCIA DE SUCESOS

Dados dos sucesos A y B, se dice que son independientes si la ocurrencia de uno deellos no afecta a la ocurrencia del otro, es decir, si se verifica que

P (A|B) = P (A) o P (B|A) = P (B)

de donde se deduce que

P (A|B) =P (A ∩B)

P (B)= P (A)⇒ P (A ∩B) = P (A)P (B)

P (B|A) =P (A ∩B)

P (A)= P (B)⇒ P (A ∩B) = P (A)P (B)

En otro caso se dice que los sucesos A y B son dependientes.Una condicion necesaria y suficiente de independencia de sucesos es considerar que dos

sucesos son independientes cuando verifiquen que

P (A ∩B) = P (A)P (B) .

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 63 / 157

Page 66: Estadística

Tema 3. Teorıa de la Probabilidad Independencia de sucesos

Independencia de mas de dos sucesos

La probabilidad de la interseccion de mas de dos sucesos viene dada por la expresion

P (A1 ∩ A2 ∩ . . . ∩ An) = P (A1)P (A2|A1)P (A3|A1 ∩ A2) · . . . · P (An|A1 ∩ A2 ∩ . . . An−1)

Se dice que los sucesos A1, A2, . . . , An son independientes si para todo subconjuntoAi1 , Ai2 , . . . , Ail de A1, A2, . . . , An, se verifica:

P (Ai1 ∩Ai2 ∩ . . . ∩Ail) = P (Ai1)P (Ai2) . . . P (Ail)

El concepto de independencia es bastante importante ya que muchos resultados de la

teorıa de la probabilidad se obtienen bajo dicha hipotesis.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 64 / 157

Page 67: Estadística

Tema 3. Teorıa de la Probabilidad Teorema de la probabilidad total y teorema de Bayes

TEOREMA DE LA PROBABILIDAD TOTAL

Dados n sucesos A1, ..., An que forman una particion del espacio muestral, es decir,

La union de los n sucesos forman el espacio muestral:

n⋃

i=1

Ai = Ω

Los n sucesos son incompatibles dos a dos: Ai ∩Aj = ∅ ∀i 6= j

La probabilidad de cada uno de los n sucesos es positiva: P (Ai) > 0 ∀i

y dado un suceso cualquiera B ∈ Ω, se verifica que

P (B) =

n∑

i=1

P (Ai)P (B|Ai)

TEOREMA DE BAYES

Dados n sucesos A1, ..., An que forman una particion del espacio muestral, y dado unsuceso cualquiera B ∈ Ω, se verifica que

P (Ai|B) =P (Ai)P (B|Ai)

n∑

j=1

P (Aj)P (B|Aj)

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 65 / 157

Page 68: Estadística

Tema 3. Teorıa de la Probabilidad Teorema de la probabilidad total y teorema de Bayes

El teorema de probabilidad total y el de Bayes van a ser especialmente utiles cuandose den las siguientes circunstancias:

a) El experimento aleatorio se puede separar en dos etapas.

b) Es sencillo dar una particion de todo el espacio muestral Ω mediante sucesosA1, . . . , An correspondientes a resultados de la primera etapa.

c) Son conocidas o facilmente calculables las probabilidades P (A1), . . . , P (An).

d) Son conocidas o facilmente calculables las probabilidades P (B|A1), . . . , P (B|An),donde B es un suceso correspondiente a resultados de la segunda etapa.

Cuando se den estas circunstancias el teorema de probabilidad total sera muy util paracalcular P (B), y el teorema de Bayes sera muy conveniente para obtener P (Aj |B).

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 66 / 157

Page 69: Estadística

Tema 4. Conceptos basicos de Variables Aleatorias Introduccion

TEMA 4. CONCEPTOS BASICOS DE VARIABLES

ALEATORIAS

INTRODUCCION

A cada uno de los posibles resultados de un experimento se le atribuye una posibilidadde ocurrir que, siguiendo los axiomas de Kolmogorov, sera un numero comprendido entre0 y 1.

Asociado al concepto de probabilidad esta el concepto de variable aleatoria. Unavariable aleatoria (v.a.) representa el conjunto de valores que pueden observarse en unfenomeno aleatorio, valores que dependen del azar y sobre los cuales es posible estableceruna medida de probabilidad.

Definicion

Sea (Ω,A, P ) un espacio probabilıstico donde Ω es el espacio muestral, A la σ-algebradefinida sobre Ω y P una funcion de probabilidad. Una variable aleatoria X : Ω→ R esuna funcion que asigna a cada resultado del espacio muestral un numero real.

X: Ω −→ R

s −→ X(s)

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 67 / 157

Page 70: Estadística

Tema 4. Conceptos basicos de Variables Aleatorias Tipos de variables aleatorias

TIPOS DE VARIABLES ALEATORIAS

Las variables aleatorias se clasifican usualmente de acuerdo con el numero de valoresque pueden asumir distinguiendo entre v.a. discreta o continua:

Definicion

Una v.a. X es discreta si el conjunto de valores que puede tomar la variable es contable.Sus posibles valores constituyen un conjunto finito o infinito numerable.

Definicion

Una v.a. X es continua si el conjunto de valores que puede tomar la variable es unsubconjunto de los numeros reales, es decir, sus valores consisten en uno o masintervalos de la recta de numeros reales.

Definicion

Se llama recorrido, y se denota por R, al espacio formado por todos los posibles valoresde la variable.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 68 / 157

Page 71: Estadística

Tema 4. Conceptos basicos de Variables Aleatorias Variable aleatoria discreta

VARIABLE ALEATORIA DISCRETA

Una v.a. discreta esta perfectamente definida cuando se conocen sus valores, es decir,el recorrido, y las probabilidades asociadas a los valores.

Funcion masa de probabilidadSea una v.a. discreta X que toma un numero finito de valores x1, x2, ..., xk. Se define

la funcion masa de probabilidad de la v.a. X como una funcion que asignaprobabilidades a los valores de la variable, es decir,

f : R −→ [0, 1]xi 7−→ P [X = xi] = pi, i = 1, 2, . . . , k

verificando las siguientes propiedades:

k∑

i=1

pi = 1

pi ≥ 0, ∀i = 1, . . . , k.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 69 / 157

Page 72: Estadística

Tema 4. Conceptos basicos de Variables Aleatorias Variable aleatoria discreta

Funcion de distribucionSe define la funcion de distribucion de la v.a. X, y se denota por F (x), como la

probabilidad de que la v.a. X tome un valor menor o igual que x.

F : R −→ [0, 1]

x 7−→ F (x) = P [X ≤ x] =∑

xi≤x

pi

Propiedades

1 F (+∞) = 1 y F (−∞) = 0

2 F (x) es una funcion no decreciente, si xi < xj ⇒ F (xi) ≤ F (xj)

3 F es continua a la derecha.

4 P [xi < X ≤ xj ] = F (xj)− F (xi)

5 P [X > x] = 1− P [X ≤ x] = 1− F (x)

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 70 / 157

Page 73: Estadística

Tema 4. Conceptos basicos de Variables Aleatorias Variable aleatoria discreta

Esperanza matematicaSe considera una v.a. discreta, X, que toma los valores x1, x2, . . . , xk con

probabilidades p1, p2, . . . , pk. Se define la esperanza matematica o media de la v.a.X, y se representa por E[X], como

E[X] =

k∑

i=1

xipi

Si se considera una funcion real, g(X), de la v.a. X, entonces se define la esperanzamatematica de g(X) como

E[g(X)] =

k∑

i=1

g(xi)pi

Sean a, b y c, constantes, y X e Y variables aleatorias discretas, entonces:

1 E[c] = c

2 E[aX] = aE[X]

3 E[X + a] = E[X] + a

4 E[aX + b] = aE[X] + b

5 E[X + Y ] = E[X] + E[Y ]

6 Si g(X) y h(X) son dos funciones de la v.a. X, entonces

E[g(X) + h(X)] = E[g(X)] + E[h(X)]

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 71 / 157

Page 74: Estadística

Tema 4. Conceptos basicos de Variables Aleatorias Variable aleatoria discreta

VarianzaSe define la varianza de una v.a. X discreta y se representa por V ar[X] o σ2

X como

σ2X = V ar[X] = E[(X − E[X])2] = E[X2]− E[X]2 =

k∑

i=1

x2i pi −

(

k∑

i=1

pixi

)2

Se define la desviacion tıpica de la v.a. X, y se representa por σX , como la raızcuadrada positiva de la varianza.

Propiedades

Si a y b son constantes, V ar[aX + b] = a2V ar[X]

Para cualquier k ∈ R, E[(X − k)2] = σ2 + (E[X]− k)2

En la propiedad anterior, si se toma k = 0

V ar[X] = E[X2]− (E[X])2

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 72 / 157

Page 75: Estadística

Tema 4. Conceptos basicos de Variables Aleatorias Variable aleatoria continua

VARIABLE ALEATORIA CONTINUA

Sea una v.a. continua X, que toma valores en el intervalo [a, b] ∈ R. Se dice que f(x)es la funcion de densidad de una v.a. continua si satisface las siguientes condiciones:

1 f(x) ≥ 0, ∀x ∈ RX

2

+∞

−∞

f(x)dx = 1.

A partir de la funcion de densidad, se calcula la probabilidad de un suceso relativo auna v.a. de la siguiente forma:

P [xi < X < xj ] =

∫ xj

xi

f(x)dx

Conviene resaltar que el valor de la funcion de densidad, f(x), en un punto x, no es laprobabilidad de aparicion de ese valor x, ya que:

P [X = x] =

∫ x

x

f(t)dt = 0.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 73 / 157

Page 76: Estadística

Tema 4. Conceptos basicos de Variables Aleatorias Variable aleatoria continua

Funcion de distribucionDada una v.a. continua X, recibe el nombre de funcion de distribucion y se denota

por F (x), la funcion definida por

F (x) = P [X ≤ x] =

∫ x

−∞

f(t)dt ∀x ∈ RX ,

es decir, el area que encierra la funcion de densidad en el intervalo (−∞, x].La funcion de densidad y la funcion de distribucion de una v.a. continua estan

relacionadas mediante la siguiente expresion

f(x) =dF (x)

dx.

Propiedades

1 F (+∞) = 1 y F (−∞) = 0

2 La funcion de distribucion es una funcion no decreciente y continua a la derecha.

3 P [xi < X < xj ] = P [xi ≤ X < xj ] = P [xi < X ≤ xj ] = P [xi ≤ X ≤ xj ] =

=

∫ xj

xi

f(x)dx = F (xj)− F (xi)

4 P [X > x] = 1− F (x)

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 74 / 157

Page 77: Estadística

Tema 4. Conceptos basicos de Variables Aleatorias Variable aleatoria continua

Esperanza matematica

Sea X una v.a. continua con funcion de densidad f(x). Se define la esperanzamatematica o media de la v.a. X, y se representa por E[X] o µX como

E[X] = µX =

+∞

−∞

xf(x)dx

Si se considera una funcion real, g(X), de la v.a. X, se define la esperanzamatematica de g(X) como

E[g(X)] =

−∞

g(x)f(x)dx

PropiedadesSean a, b, constantes y X e Y variables aleatorias continuas:

1 E[aX] = aE[X]

2 E[X + a] = E[X] + a

3 E[aX + b] = aE[X] + b

4 E[X + Y ] = E[X] + E[Y ]

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 75 / 157

Page 78: Estadística

Tema 4. Conceptos basicos de Variables Aleatorias Variable aleatoria continua

VarianzaSe define la varianza de una v.a. X continua, y se representa por V ar[X] o σ2

X , como

V ar[X] = E[(X − E[X])2] =

+∞

−∞

(x− E[X])2 f(x)dx

que tambien se puede expresar de la siguiente forma

V ar[X] = E[X2]− E[X]2 =

+∞

−∞

x2f(x)dx−

(∫

+∞

−∞

xf(x)dx

)2

Se define la desviacion tıpica de la v.a. X, y se representa por σX , como la raızcuadrada positiva de la varianza.

PropiedadesSean a, b, constantes y X una v.a.:

1 V ar[aX] = a2V ar[X]

2 V ar[X + a] = V ar[X]

3 V ar[aX + b] = a2V ar[X]

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 76 / 157

Page 79: Estadística

Tema 5. Modelos de Distribuciones Discretas y Continuas Distribucion de Bernoulli

TEMA 5. MODELOS DE DISTRIBUCIONES DISCRETAS

Y CONTINUAS

DISTRIBUCION DE BERNOULLI

Se aplica este modelo a cualquier situacion en la que se tiene un experimento queproduce solo dos resultados posibles incompatibles, a los que se denominan exito yfracaso.

Se define la variable aleatoria discreta X que representa el resultado del experimento,es decir, asigna un 1 al suceso exito con probabilidad p y un 0 al suceso fracaso conprobabilidad q = 1− p.

X :

0, si ocurre el fracaso, con probabilidad q

1, si ocurre el exito, con probabilidad p

Su funcion masa de probabilidad es:

xi pi

0 1-p1 p

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 77 / 157

Page 80: Estadística

Tema 5. Modelos de Distribuciones Discretas y Continuas Distribucion de Bernoulli

Definicion

Se dice entonces que la variable aleatoria X = resultado del experimento, sigue unadistribucion Bernoulli de parametro p y se denota como X B(p).

Funcion de distribucion

F (x) = P [X ≤ x] =

0, si x < 0q, si 0 ≤ x < 11, si x ≥ 1

Caracterısticas

Esperanza

E[X] =

k∑

i=1

xipi = 0 · (1− p) + 1 · p = p

Varianza

V ar[X] = E[X2]− (E[X])2 = p− p2 = p(1− p)

donde E[X2] =

k∑

i=1

x2i pi = 02 · (1− p) + 12 · p = p

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 78 / 157

Page 81: Estadística

Tema 5. Modelos de Distribuciones Discretas y Continuas Distribucion Binomial

DISTRIBUCION BINOMIAL

Se considera un experimento que se repite n veces de forma identica e independiente.Los resultados de cada realizacion del experimento se clasifican en dos categorıas, exito yfracaso, como en el caso de la distribucion de Bernoulli.

Definicion

Se dice que la variable aleatoria discreta que cuenta el numero de exitos en n

realizaciones del experimento, tiene una distribucion Binomial de parametros n y p, y sedenota como X B(n, p).

El recorrido de esta variable aleatoria es RX = 0, 1, 2, 3, . . . , n. La funcion masa deprobabilidad viene dada por

P [X = k] =

(

n

k

)

pk(1− p)n−k ∀k = 0, . . . , n

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 79 / 157

Page 82: Estadística

Tema 5. Modelos de Distribuciones Discretas y Continuas Distribucion Binomial

Funcion de distribucion

F (x) = P [X ≤ x] =

0, x < 0[x]∑

k=0

(

n

k

)

pk (1− p)n−k

, 0 ≤ x < n

1, x ≥ n

La funcion masa de probabilidad y la funcion de distribucion estan tabuladas paradistintos valores de los parametros.

Caracterısticas

Esperanza: E[X] = np

Varianza: V ar[X] = np(1− p)

Propiedad reproductiva: Sean X1, X2, . . . , Xm un conjunto de variables aleatoriasindependientes con distribucion Binomial, Xi B(ni, p). Entonces,

m∑

i=1

Xi B

(

m∑

i=1

ni, p

)

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 80 / 157

Page 83: Estadística

Tema 5. Modelos de Distribuciones Discretas y Continuas Distribucion de Poisson

DISTRIBUCION DE POISSON

Sea X una variable aleatoria que modeliza el fenomeno aleatorio, No de veces que sepresenta un determinado hecho en un intervalo de tiempo, longitud o espacio fijado.Tambien puede modelizar el numero de ocurrencias de un suceso con poca probabilidadde ocurrir. Dicha variable se denomina de Poisson.

Definicion

Sea X una variable aleatoria discreta que toma los valores 0, 1, 2, .... Se dice que X

tiene una distribucion de Poisson de parametro λ, y se denota como X P(λ), (λ > 0)si

P [X = k] = e−λ λ

k

k!∀k = 0, 1, 2, . . .

El parametro de la distribucion (λ) indica la esperanza de la variable aleatoria es decir,

el numero medio de ocurrencias del suceso considerado en el intervalo de tiempo,

longitud o espacio fijado.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 81 / 157

Page 84: Estadística

Tema 5. Modelos de Distribuciones Discretas y Continuas Distribucion de Poisson

Funcion de distribucion

F (x) = P [X ≤ x] =

0, x < 0[x]∑

k=0

λk

k!e−λ

, x ≥ 0

donde [x] es la parte entera de x.La funcion masa de probabilidad y la funcion de distribucion estan tabuladas para

distintos valores de los parametros.

Caracterısticas

Esperanza: E[X] = λ

Varianza: V ar[X] = λ

Propiedad reproductiva: Sean X1, X2, . . . , Xm, un conjunto de variables aleatoriasindependientes con distribucion de Poisson, Xi P(λi). Entonces,

m∑

i=1

Xi P

(

m∑

i=1

λi

)

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 82 / 157

Page 85: Estadística

Tema 5. Modelos de Distribuciones Discretas y Continuas Distribucion Normal

DISTRIBUCION NORMAL

Definicion

Se dice que una variable aleatoria continua X sigue una distribucion Normal deparametros µ y σ2 (µ ∈ R y σ2 > 0), si su funcion de densidad es

f(x) =1

σ√2π

exp

[

−1

2σ2(x− µ)2

]

, −∞ < x < +∞

donde µ es la media y σ2 es la varianza. Se denota como X N (µ, σ2).

Funcion de distribucion

F (x) = P [X ≤ x] =

∫ x

−∞

1√2πσ

e−

(t−µ)2

2σ2 dt, −∞ < x < +∞

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 83 / 157

Page 86: Estadística

Tema 5. Modelos de Distribuciones Discretas y Continuas Distribucion Normal

Caracterısticas

Esperanza: E[X] = µ

Varianza: V ar[X] = σ2

Propiedad reproductiva: Sean X1, X2, . . . , Xm, un conjunto de variables aleatoriasindependientes con distribucion Normal, Xi N (µi, σ

2i ). Entonces,

m∑

i=1

Xi N

(

m∑

i=1

µi,

m∑

i=1

σ2i

)

Transformacion lineal: Si se considera una transformacion lineal de una v.a.Normal, la nueva variable tiene tambien distribucion Normal

X N (µ, σ2)Y = aX + b a, b ∈ R, a 6= 0

⇒ Y N (aµ+ b, a2σ2)

Combinacion lineal: La combinacion lineal de variables aleatorias Normales eindependientes tiene distribucion Normal:

X1, X2, ...Xn v.a.i.

Xi N (µi, σ2i )

ai ∈ R,

⇒ Y =

n∑

i=1

aiXi N

(

n∑

i=1

aiµi,

n∑

i=1

a2iσ

2i

)

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 84 / 157

Page 87: Estadística

Tema 5. Modelos de Distribuciones Discretas y Continuas Distribucion Normal

Tipificacion

La variable normal, Z, con µ = 0 y σ2 = 1, se denomina distribucion NormalTipificada o Estandar, N (0, 1), y su funcion de distribucion esta tabulada.

Para calcular probabilidades en el caso general para X N (µ, σ2), se transforma lav.a. X en la variable tipificada Z. Por tanto, utilizando la propiedad de latransformacion lineal, se pueden conocer las probabilidades correspondientes a cualquierdistribucion Normal realizando la siguiente transformacion

Z =X − µ

σ⇒

E[Z] =E[X]− µ

σ= 0

V ar[Z] =V ar[X]

σ2= 1

⇒ Z N (0, 1)

De esta forma, para calcular probabilidades de una distribucion normal previamente setipifica:

P [a ≤ X ≤ b] = P

[

a− µ

σ≤

X − µ

σ≤

b− µ

σ

]

= P

[

a− µ

σ≤ Z ≤

b− µ

σ

]

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 85 / 157

Page 88: Estadística

Tema 5. Modelos de Distribuciones Discretas y Continuas Distribucion Normal

Nota Para calcular probabilidades de una v.a. con distribucion N (0, 1) se tiene encuenta que:

1 P [X ≥ a] = 1− P [X ≤ a]

2 P [a ≤ X ≤ b] = P [X ≤ b]− P [X ≤ a]

3 P [X ≤ −a] = P [X ≥ a] = 1− P [X ≤ a]

4 P [−a ≤ X ≤ a] = P [X ≤ a]− P [X ≤ −a] = 2P [X ≤ a]− 1

5 P [|X| ≤ a] = P [−a ≤ X ≤ a] = 2P [X ≤ a]− 1

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 86 / 157

Page 89: Estadística

Tema 5. Modelos de Distribuciones Discretas y Continuas Aproximaciones entre las distribuciones

APROXIMACIONES ENTRE LAS DISTRIBUCIONES

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 87 / 157

Page 90: Estadística

Tema 5. Modelos de Distribuciones Discretas y Continuas Aproximaciones entre las distribuciones

Aproximacion de una Binomial por una Poisson

Sea X B(n, p), de forma que n ∞ y p 0. Mas concretamente, en el caso enel que n ≥ 30 y p < 0.1 o np < 5, entonces se puede aproximar esta distribucion a unadistribucion de Poisson, es decir,

X B(n, p) =⇒ X ≈ P(λ = n · p)

Aproximacion de una Binomial por una Normal

Sea X B(n, p), con el parametro n muy grande, concretamente n > 30 y ademas0.1 < p < 0.9, entonces la distribucion Binomial puede aproximarse a una distribucionNormal con µ = np y σ2 = npq, es decir,

X B(n, p) ≈ N (np, npq) =⇒ Z =X − np√npq

≈ N (0, 1)

Aproximacion de una Poisson por una Normal

Sea X P(λ) con λ ≥10, entonces la distribucion de Poisson puede aproximarse auna distribucion con µ = λ y σ2 = λ, es decir,

X P (λ) ≈ N (λ, λ) =⇒ Z =X − λ√λ

≈ N (0, 1)

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 88 / 157

Page 91: Estadística

Tema 5. Modelos de Distribuciones Discretas y Continuas Aproximaciones entre las distribuciones

Correccion por continuidad

Cuando se aproxima la distribucion Binomial o Poisson a una distribucion Normal, seesta aproximando de una distribucion discreta por una continua. Para que laaproximacion sea la mas adecuada se utiliza la correccion por continuidad, que consisteen sumar y restar 0.5 a cada valor discreto de la distribucion, es decir,

Calcular P [X = k] en una distribucion Binomial o Poisson, es equivalente a calcularP [k − 0.5 ≤ X ≤ k + 0.5] en una distribucion Normal.

Calcular P [X ≤ k] en una distribucion Binomial o Poisson, es equivalente a calcularP [X ≤ k + 0.5] en una distribucion Normal.

Calcular P [X ≥ k] en una distribucion Binomial o Poisson, es equivalente a calcularP [X ≥ k − 0.5] en una distribucion Normal.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 89 / 157

Page 92: Estadística

Tema 5. Modelos de Distribuciones Discretas y Continuas Distribuciones asociadas a la ley normal

Distribucion Chi-cuadrado de Pearson

Definicion

Sean Z1, Z2, ..., Zn variables aleatorias independientes e identicamente distribuidas segununa N (0, 1). Se considera la variable aleatoria

X = Z21 + Z

22 + ...+ Z

2n,

entonces se verifica que X tiene distribucion Chi-cuadrado con n grados de libertad y sedenota como,

X χ2n

La funcion de distribucion asociada esta tabulada para distintos valores de n. Para eluso de las tablas se considera que un punto (o valor crıtico) χ2

n;p representa el valor de laabscisa que tiene a la izquierda un area igual a p en una distribucion χ2

n, es decir

P [χ2n ≤ χ

2n;p] = p

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 90 / 157

Page 93: Estadística

Tema 5. Modelos de Distribuciones Discretas y Continuas Distribuciones asociadas a la ley normal

Distribucion t de Student

Definicion

Sean Y y Z dos variables aleatorias independientes con Y N (0, 1) y Z χ2n. Se

define la v.a. T = Y√Z/n

, que tiene distribucion t de Student con n grados de libertad.

Se denota como T tn.

La funcion de distribucion asociada esta tabulada para distintos valores de n. Para eluso de las tablas se considera que un punto (o valor crıtico) tn;p representa el valor de laabscisa que tiene a la izquierda un area o probabilidad igual a p en una distribucion tn,es decir,

P [tn ≤ tn;p] = p

En la tabla solo se encuentran valores positivos, por lo que es necesario utilizar lasrelaciones que surgen de la simetrıa de la distribucion, es decir,

tn;p = −tn;1−p

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 91 / 157

Page 94: Estadística

Tema 5. Modelos de Distribuciones Discretas y Continuas Distribuciones asociadas a la ley normal

Distribucion F de Snedecor

Definicion

Se consideran dos variables aleatorias independientes Y y Z tales que Y χ2n y

Z χ2m. Sea F una variable aleatoria definida como F =

Y/n

Z/m, entonces se dice que la

variable aleatoria F sigue una distribucion F de Snedecor con n y m grados de libertad,y se denota por Fn,m.

La funcion de distribucion asociada esta tabulada para distintos valores de n y m. Parael uso de las tablas se considera que un punto (o valor crıtico) Fn,m;p representa el valorde la abscisa que tiene a la izquierda un area igual a p en una distribucion Fn,m, es decir,

P [Fn,m ≤ Fn,m;p] = p

En la tabla de probabilidades solo se encuentran algunos valores de p. Para calcularprobabilidades en el caso de que no se encuentre el valor p se utiliza la siguiente relacionde inversion:

Fn,m;p =1

Fm,n;1−p

⇒ P [Fn,m ≤ x] = 1− P [Fm,n ≤ 1/x]

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 92 / 157

Page 95: Estadística

Tema 6. Introduccion a la Inferencia Estadıstica Conceptos generales

TEMA 6. INTRODUCCION A LA INFERENCIA

ESTADISTICA

CONCEPTOS GENERALES

En la mayorıa de las situaciones el investigador se ve obligado a efectuar un estudio dela poblacion, a traves de la informacion que se recoge en una parte de la misma, que sesupone representativa del total y que se denomina muestra. Esto se produce por elexceso de coste que supondrıa o bien por la imposibilidad de acceder a todos ellos oincluso porque el individuo se destruya al observarlo.

El objetivo que se persigue es obtener informacion de la muestra y a partir de esta

poder dar resultados para la poblacion, tratando de medir el riesgo que se asume al

atribuir propiedades de la poblacion a partir de lo que solo se conoce en una muestra.

Sera, por tanto, imprescindible que la muestra que se examina sea representativa del

total, por lo que su seleccion requerira unos determinados requisitos que garanticen dicha

representatividad.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 93 / 157

Page 96: Estadística

Tema 6. Introduccion a la Inferencia Estadıstica Conceptos generales

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 94 / 157

Page 97: Estadística

Tema 6. Introduccion a la Inferencia Estadıstica Distribuciones en el muestreo de poblaciones normales

Distribucion del estadıstico media muestral

Sea P una poblacion y X una variable aleatoria asociada a dicha poblacion cuyadistribucion es Normal de media µ y varianza σ2.

Sean X1, ..., Xn variables aleatorias independientes e identicamente distribuidas, querepresentan n selecciones de una poblacion normal. Se define el estadıstico

T =X − µ

S/√n tn−1

donde S es la raız cuadrada de la cuasivarianza muestral y se denomina cuasidesviacion

tıpica muestral.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 95 / 157

Page 98: Estadística

Tema 6. Introduccion a la Inferencia Estadıstica Distribuciones en el muestreo de poblaciones normales

Distribucion del estadıstico varianza muestral

Sean X1, ..., Xn variables aleatorias independientes e identicamente distribuidas, querepresentan n selecciones de una poblacion normal. Entonces el estadıstico

Y =

n∑

i=1

(Xi − µ)2

σ2 χ

2n

Distribucion del estadıstico cuasivarianza muestral

Sean X1, ..., Xn variables aleatorias independientes e identicamente distribuidas, querepresentan n selecciones de una poblacion normal. Entonces

n∑

i=1

(Xi −X

)2

σ2=

(n− 1)S2

σ2 χ

2n−1

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 96 / 157

Page 99: Estadística

Tema 6. Introduccion a la Inferencia Estadıstica Distribuciones en el muestreo de poblaciones normales

Distribucion del estadıstico proporcion muestral

Se considera una v.a. X=”no de exitos en n repeticiones de un experimento” condistribucion B(n, p) siendo p la proporcion de exitos en la poblacion. La proporcion deexitos en la muestra se obtiene a partir del estadıstico proporcion muestral:

p =1

n

n∑

i=1

Xi

Cuando n es grande (n > 30), la distribucion Binomial se aproxima a una distribucionNormal, por tanto,

X B(n, p) ≈ N (np, npq)

Utilizando la propiedad de transformacion lineal de la distribucion Normal se tiene que

p N(p,

pq

n

)

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 97 / 157

Page 100: Estadística

Tema 6. Introduccion a la Inferencia Estadıstica Distribuciones en el muestreo de poblaciones normales

Distribucion del estadıstico diferencia de medias muestrales de dos poblacionesnormales independientes

Sean X e Y variables aleatorias independientes tales que:

X N (µX , σ2X), Y N (µY , σ

2Y )

Se considera:

Una muestra aleatoria simple de tamano nX de X, con X la media muestral y S2X

la cuasivarianza muestral.

Una muestra aleatoria simple de tamano nY de Y , con Y la media muestral y S2Y

la cuasivarianza muestral.

En estas condiciones, se distinguen dos casos:

Caso A Varianzas poblacionales desconocidas pero supuestas iguales (σ2

X = σ2

Y)

El estadıstico T , definido como:

T =(X − Y )− (µX − µY )

SP

√1

nX

+ 1

nY

tnX+nY −2

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 98 / 157

Page 101: Estadística

Tema 6. Introduccion a la Inferencia Estadıstica Distribuciones en el muestreo de poblaciones normales

Caso B Varianzas poblacionales desconocidas con nX, nY > 30

El estadıstico Z, definido como:

Z =(X − Y )− (µX − µY )√

S2X

nX

+S2Y

nY

N (0, 1)

Distribucion del estadıstico cociente de varianzas muestrales de dos poblacionesNormales independientes

Sean las variables aleatorias X e Y independientes tales que:

X N (µX , σ2X), Y N (µY , σ

2Y )

El estadıstico definido como:

F =S2X/σ2

X

S2Y /σ2

Y

FnX−1,nY −1

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 99 / 157

Page 102: Estadística

Tema 6. Introduccion a la Inferencia Estadıstica Distribuciones en el muestreo de poblaciones normales

Distribucion del estadıstico diferencia de proporciones muestrales

Sean las variables aleatorias X e Y independientes tales que:

X B(nX , pX) Y B(nY , pY ).

Para nX y nY grandes se verifica:

X N (nXpX , nXpXqX) Y N (nY pY , nY pY qY )

con qX = 1− pX y qY = 1− pY .Se definen las proporciones muestrales como:

pX =X

nX

pY =Y

nY

Se define el estadıstico diferencia de proporciones muestrales como:

pX − pY N

(pX − pY ,

pXqX

nX

+pY qY

nY

)

y se verifica que:

Z =(pX − pY )− (pX − pY )√

pXqXnX

+ pY qYnY

N (0, 1)

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 100 / 157

Page 103: Estadística

Tema 7. Estimacion de Parametros Introduccion

TEMA 7. ESTIMACION DE PARAMETROS

INTRODUCCION

En este tema se aborda el problema de la estimacion estadıstica, es decir, se estainteresado en conocer una determinada caracterıstica y para ello se obtiene unaaproximacion de esta, o lo que es lo mismo, se obtiene una estimacion.

Hay diversas formas de aproximar una caracterıstica desconocida, segun el objetivoque se desee conseguir:

Si lo que se necesita es obtener un valor puntual de la caracterıstica considerada, seesta ante un problema de estimacion puntual.

Si el objetivo es obtener conjuntos a los que pertenezca la caracterıstica estudiadacon un determinado grado de credibilidad, se esta ante un problema de estimacionpor intervalos de confianza.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 101 / 157

Page 104: Estadística

Tema 7. Estimacion de Parametros Estimacion Puntual

ESTIMACION PUNTUAL

Estimadores puntuales de los parametros de una distribucion normal

Sea una poblacion P de la que se extrae una muestra de tamano n y X una v.a.asociada a dicha poblacion cuya distribucion es N (µ, σ2).

Estimador puntual de la media poblacional, µ:

Media muestral X =1

n

n∑

i=1

Xi

Estimadores puntuales de la varianza poblacional, σ2:

Varianza muestral σ2 =

1

n

n∑

i=1

(Xi −X)2

Cuasivarianza muestral S2 =

1

n− 1

n∑

i=1

(Xi −X)2

siendo X la media muestral antes definida.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 102 / 157

Page 105: Estadística

Tema 7. Estimacion de Parametros Estimacion Puntual

Estimador puntual de la proporcion poblacional

Sea una poblacion P de N individuos de la que se extrae una muestra de tamano n,se estudia sobre ella un caracter cualitativo.

Estimador puntual de la proporcion poblacional, p:

Proporcion muestral p =1

n

n∑

i=1

Xi

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 103 / 157

Page 106: Estadística

Tema 7. Estimacion de Parametros Estimacion por Intervalos de Confianza

ESTIMACION POR INTERVALOS DE CONFIANZA

Un intervalo de confianza esta formado por dos valores dentro de los cuales se afirmaque se encuentra el verdadero parametro con cierta confianza. Son unos lımites omargen de variabilidad que se le da al valor estimado, para poder afirmar que elverdadero valor del parametro esta dentro de estos lımites.

Sea θ el parametro de interes. El nivel de confianza, 1− α, indica la proporcion deveces que se acertarıa al afirmar que el parametro esta dentro de esos lımites, alseleccionar un conjunto amplio de muestras. El nivel α, es la probabilidad de error, sueleser fijada de antemano y se denomina nivel de significacion.

Para la construccion de intervalos de confianza, es necesario buscar una funcion de lamuestra y del parametro, T (X1, ..., Xn, θ), cuya distribucion no dependa del parametro.

Se trata, por tanto, de calcular dos valores θI y θS que verifiquen

P [θI < T (X1, ..., Xn, θ) < θS ] = 1− α,

obteniendo un intervalo para T (X1, ..., Xn, θ). Despejando θ se obtiene el intervalo

buscado.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 104 / 157

Page 107: Estadística

Tema 7. Estimacion de Parametros Estimacion por Intervalos de Confianza

Sea P una poblacion en la que se mide una variable aleatoria X con distribucionX N (µ, σ2).

Intervalo de confianza para la media, µ, de una poblacion Normal

IC(µ) =

[X − tn−1;1−α/2

S√n;X + tn−1;1−α/2

S√n

]=

[X ∓ tn−1;1−α/2

S√n

]

Intervalo de confianza para la varianza poblacional, σ2, de una poblacion Normal

IC(σ2) =

[(n− 1)S2

χ2n−1;1−α/2

;(n− 1)S2

χ2n−1;α/2

]

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 105 / 157

Page 108: Estadística

Tema 7. Estimacion de Parametros Estimacion por Intervalos de Confianza

Sean X N (µX , σ2X) e Y N (µY , σ2

Y ) dos v.a. independientes. Se extraen dosmuestras aleatorias de tamanos nX y nY , respectivamente, ambas de formaindependiente.Intervalo de confianza para la diferencia de medias poblacionales, µX − µY, de dospoblaciones normales con varianzas desconocidas supuestas iguales

IC(µX − µY ) =

[(X − Y

)∓ tnX+nY −2;1−α/2Sp

√1

nX

+1

nY

]

siendo Sp =

√(nX−1)S2

X+(nY −1)S2

Y

nX+nY −2

Intervalo de confianza para la diferencia de medias poblacionales, µX − µY, de dospoblaciones normales con varianzas desconocidas y nX, nY > 30

IC(µX − µY ) =

(X − Y)∓ z1−α/2

√S2X

nX

+S2Y

nY

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 106 / 157

Page 109: Estadística

Tema 7. Estimacion de Parametros Estimacion por Intervalos de Confianza

Intervalo de confianza para el cociente de varianzas, σ2

X/σ2

Y, de dos poblacionesnormales

IC

(σ2X

σ2Y

)=

[1

FnX−1,nY −1;1−α/2

S2X

S2Y

;1

FnX−1,nY −1;α/2

S2X

S2Y

]

Intervalo de confianza para el parametro p de una distribucion binomialSe considera una variable aleatoria X con distribucion B(n, p).

IC(p) =

[

p∓ z1−α/2 ·

√pq

n

]

Intervalo de confianza para la diferencia de proporciones de dos distribucionesbinomiales con muestras grandes

consideran X B(nx, pX) e Y B(ny, pY ). Como nX y nY grandes.

IC(pX − pY ) =

[

(pX − pY )∓ z1−α/2

√pX qX

nX

+pY qY

nY

]

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 107 / 157

Page 110: Estadística

Tema 8. Contrastes de Hipotesis Conceptos basicos

TEMA 8. CONTRASTES DE HIPOTESIS

CONCEPTOS BASICOS

El contraste de hipotesis constituye el tercer gran bloque de tecnicas dentro de laInferencia, junto con la estimacion puntual y la estimacion por intervalos de confianza.

El objetivo del contraste de hipotesis es diferente del de la estimacion: ahora nodeseamos estimar razonablemente bien el valor de un parametro desconocido, sino quetratamos de decidir si es sensato rechazar (o aceptar) la hipotesis de que el valor de eseparametro se situa en una determinada region del espacio parametrico Θ.

En un proceso de contraste de hipotesis se pueden considerar las siguientes etapas:

1 Se formula un hipotesis sobre una determinada caracterıstica de interes de lapoblacion bajo estudio (generalmente un parametro poblacional).

2 Se selecciona una muestra de la poblacion.

3 Se comprueba si los datos estan o no de acuerdo con la hipotesis que se plantea; sino es ası, se puede formular una nueva hipotesis.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 108 / 157

Page 111: Estadística

Tema 8. Contrastes de Hipotesis Definicion de contraste

DEFINICION DE CONTRASTE

Tipos de contrastes

Contrastes parametricos: Se conoce la distribucion de la v.a. bajo estudio y seestablecen hipotesis sobre los parametros de dicha distribucion.

Contrastes no parametricos: Se desconoce la distribucion de la v.a. considerada. Seestablecen hipotesis acerca de alguna propiedad de la distribucion.

La primera hipotesis que se plantea en un problema de contraste recibe el nombre dehipotesis nula: H0. La hipotesis complementaria a la hipotesis nula recibe el nombre dehipotesis alternativa: H1.

Definicion

Un contraste de hipotesis es una regla de decision que lleva a aceptar o rechazar H0. Seespecifica un conjunto C tal que si

(X1, X2, . . . , Xn) ∈ C ⇒ se rechaza H0

(X1, X2, . . . , Xn) /∈ C ⇒ se acepta H0

Al conjunto C se le denomina region crıtica o region de rechazo. La region crıtica C

se especifica mediante un estadıstico que se llama estadıstico de contraste.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 109 / 157

Page 112: Estadística

Tema 8. Contrastes de Hipotesis Definicion de contraste

Segun lo anterior, la region crıtica esta formada por todos aquellos valores que toma elestadıstico de contraste que llevan a rechazar H0 (puntos crıticos). La region deaceptacion estara entonces formada por aquellos valores que toma el estadıstico decontraste que llevan a aceptar H0.

Pasos para la realizacion de un contraste de hipotesis

1 Fijar la hipotesis nula y la alternativa, que pueden ser:

H0 : θ = θ0 H0 : θ ≥ θ0 H0 : θ ≤ θ0H0 : θ 6= θ0 H0 : θ < θ0 H0 : θ > θ0

2 Buscar el estadıstico adecuado para realizar el contraste.

3 Obtener la region crıtica.

4 Obtener el valor observado (valor experimental) del estadıstico para la muestraseleccionada.

5 Decidir entre aceptar o rechazar H0, ya sea con el criterio de la Region Crıtica.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 110 / 157

Page 113: Estadística

Tema 8. Contrastes de Hipotesis Contrastes de hipotesis parametricos

Contrastes de hipotesis sobre la media de una poblacion normal

Fijado un nivel de significacion, α, se calcula el valor del estadıstico

T =X − µ

S/√n tn−1 ⇒ texp =

X − µ0

S/√n

Contraste Region crıticaSe rechaza H0 a nivel α si

H0 : µ = µ0 texp < −tn−1;1−α/2 o texp > tn−1;1−α/2

H1 : µ 6= µ0

H0 : µ ≥ µ0 texp < −tn−1;1−α

H1 : µ < µ0

H0 : µ ≤ µ0 texp > tn−1;1−α

H1 : µ > µ0

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 111 / 157

Page 114: Estadística

Tema 8. Contrastes de Hipotesis Contrastes de hipotesis parametricos

Contrastes de hipotesis sobre la varianza de una poblacion normal

Fijado un nivel de significacion, α, se calcula el valor del estadıstico

χ2 =

(n− 1)S2

σ2 χ

2n−1 ⇒ χ

2exp =

(n− 1)S2

σ20

Contraste Region crıticaSe rechaza H0 a nivel α si

H0 : σ2 = σ20 χ2

exp < χ2n−1;α/2 o χ2

exp > χ2n−1;1−α/2

H1 : σ2 6= σ20

H0 : σ2 ≥ σ20 χ2

exp < χ2n−1;α

H1 : σ2 < σ20

H0 : σ2 ≤ σ20 χ2

exp > χ2n−1;1−α

H1 : σ2 > σ20

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 112 / 157

Page 115: Estadística

Tema 8. Contrastes de Hipotesis Contrastes de hipotesis parametricos

Contrastes de hipotesis sobre la proporcion de una poblacion binomial

Fijado un nivel de significacion, α, se calcula el valor del estadıstico

Z =p− p

p(1−p)

n

N(0, 1)⇒ zexp =p− p0

p0(1−p0)

n

Contraste Region crıticaSe rechaza H0 a nivel α si

H0 : p = p0 zexp < −z1−α/2 o zexp > z1−α/2

H1 : p 6= p0

H0 : p ≥ p0 zexp < −z1−α

H1 : p < p0

H0 : p ≤ p0 zexp > z1−α

H1 : p > p0

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 113 / 157

Page 116: Estadística

Tema 8. Contrastes de Hipotesis Contrastes de hipotesis parametricos

Contrastes de hipotesis sobre la diferencia de medias de dos poblaciones normales,con varianzas desconocidas pero iguales

Fijado un nivel de significacion, α, se calcula el valor del estadıstico

T =(X − Y )− (µx − µy)

Sp

1

nx+ 1

ny

tnx+ny−2 ⇒ texp =(X − Y )− µ0

Sp

1

nx+ 1

ny

Contraste Region crıticaSe rechaza H0 a nivel α si

H0 : µx − µy = µ0 texp < −tnx+ny−2;1−α/2 o texp > tnx+ny−2;1−α/2

H1 : µx − µy 6= µ0

H0 : µx − µy ≥ µ0 texp < −tnx+ny−2;1−α

H1 : µx − µy < µ0

H0 : µx − µy ≤ µ0 texp > tnx+ny−2;1−α

H1 : µx − µy > µ0

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 114 / 157

Page 117: Estadística

Tema 8. Contrastes de Hipotesis Contrastes de hipotesis parametricos

Contrastes de hipotesis sobre la diferencia de medias de dos poblaciones normales,con varianzas desconocidas y tamanos de muestras grandes

Fijado un nivel de significacion, α, se calcula el valor del estadıstico

T =(X − Y )− (µx − µy)

S2x

nx+

S2y

ny

N(0, 1)⇒ zexp =(X − Y )− µ0√

S2x

nx+

S2y

ny

Contraste Region crıticaSe rechaza H0 a nivel α si

H0 : µx − µy = µ0 zexp < −z1−α/2 o zexp > z1−α/2

H1 : µx − µy 6= µ0

H0 : µx − µy ≥ µ0 zexp < −z1−α

H1 : µx − µy < µ0

H0 : µx − µy ≤ µ0 zexp > z1−α

H1 : µx − µy > µ0

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 115 / 157

Page 118: Estadística

Tema 8. Contrastes de Hipotesis Contrastes de hipotesis parametricos

Contrastes de hipotesis sobre el cociente de las varianzas de dos poblacionesnormales

Fijado un nivel de significacion, α, se calcula el valor del estadıstico

F =S2x/σ

2x

S2y/σ

2y

Fnx−1;ny−1 ⇒ Fexp =S2x

S2y

Contraste Region crıticaSe rechaza H0 a nivel α si

H0 :σ2x

σ2y

= 1 Fexp < Fny−1,nx−1;1−α/2 o Fexp > Fnx−1,ny−1;1−α/2

H1 :σ2x

σ2y

6= 1

H0 :σ2x

σ2y

≥ 1 Fexp < Fny−1,nx−1;1−α

H1 :σ2x

σ2y

< 1

H0 :σ2x

σ2y

≤ 1 Fexp > Fnx−1,ny−1;1−α

H1 :σ2x

σ2y

> 1

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 116 / 157

Page 119: Estadística

Tema 8. Contrastes de Hipotesis Contrastes de hipotesis parametricos

Contrastes de hipotesis sobre la diferencia de proporciones de dos poblacionesbinomiales

Fijado un nivel de significacion, α, se calcula el valor del estadıstico

Z =(px − py)− (px − py)√

px(1−px)

nx+

py(1−py)

ny

N(0, 1)⇒ zexp =(px − py)− p0

px(1−px)

nx+

py(1−py)

ny

Contraste Region crıticaSe rechaza H0 a nivel α si

H0 : px − py = p0 zexp < −z1−α/2 o zexp > z1−α/2

H1 : px − py 6= p0

H0 : px − py ≥ p0 zexp < −z1−α

H1 : px − py < p0

H0 : px − py ≤ p0 zexp > z1−α

H1 : px − py > p0

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 117 / 157

Page 120: Estadística

Tema 8. Contrastes de Hipotesis Contrastes de hipotesis no parametricos

Contraste de la bondad de ajuste (primer caso)

Vamos a observar una muestra aleatoria (X1, . . . , Xn) de una poblacion X condistribucion desconocida y queremos ver si, a la vista de la muestra, es razonable admitirque la distribucion de X viene dada por P (un determinado modelo de probabilidad); esdecir, queremos ver si los datos se ajustan bien a P . Por tanto, tenemos:

H0: El modelo de probabilidad de X es PH1: El modelo de probabilidad de X no es P

Para contrastar H0 frente a H1 hacemos una particion (arbitraria) del espaciomuestral de la poblacion (posibles valores de X) en k clases A1, . . . , Ak. Despues, paracada Ai (i = 1, . . . , k) consideramos las siguientes frecuencias (absolutas):

Oi= frecuencia observada en Ai = numero de elementos de la muestra (x1, . . . , xn) quese han situado en la clase Ai.

ei= frecuencia esperada en la clase Ai, si la hipotesis nula es cierta = nP (Ai).

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 118 / 157

Page 121: Estadística

Tema 8. Contrastes de Hipotesis Contrastes de hipotesis no parametricos

El estadıstico que utilizaremos para llevar a cabo este contraste es:

n∑

i=1

(Oi − ei)2

ei

que tiene, aproximadamente una distribucion χ2k−1, si H0 es cierta.

Si la muestra procede de P , es de esperar que haya valores parecidos para Oi y ei y,por tanto, este estadıstico deberıa tomar valores proximos a cero; en consecuencia,rechazaremos la hipotesis nula cuando los valores de este estadıstico sean grandes y laaceptaremos cuando sean pequenos; la separacion entre valores grandes y pequenos vienedada por la eleccion de un nivel de significacion α; en definitiva, tenemos:

Rechazamos la hipotesis nula H0: El modelo de probabilidad de X es P (al nivel designificacion α) si:

k∑

i=1

(Oi − ei)2

ei> χ

2k−1;1−α

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 119 / 157

Page 122: Estadística

Tema 8. Contrastes de Hipotesis Contrastes de hipotesis no parametricos

Contraste de la bondad del ajuste (segundo caso)

El contraste de la bondad del ajuste se puede plantear tambien en una situacion algomas general:

Observamos una muestra aleatoria (X1, . . . , Xn) de una poblacion X con distribuciondesconocida y queremos ver si, a la vista de la muestra, es razonable admitir que ladistribucion de X viene dada por algun modelo de la familia Pθ : θ ∈ Θ dondeθ = (θ1, . . . , θr). Es decir, queremos ver si los datos se ajustan bien a un modelo deprobabilidad de la familia Pθ : θ ∈ Θ. Por tanto, tenemos:

H0: El modelo de probabilidad de X es algun Pθ de la familia indicada.H1: El modelo de probabilidad de X no es ningun Pθ de la familia indicada.

Para contrastar H0 frente a H1 hacemos nuevamente una particion (arbitraria) delespacio muestral de la poblacion (posibles valores de X) en clases A1, . . . , Ak, yconsideramos:

Oi= frecuencia observada en Ai.

ei= frecuencia esperada en la clase Ai, si la hipotesis nula es cierta =nPθ(Ai) ≈ nPθ(Ai).

(donde θ = (θ1, . . . , θr) son estimaciones de maxima verosimilitud).

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 120 / 157

Page 123: Estadística

Tema 8. Contrastes de Hipotesis Contrastes de hipotesis no parametricos

El estadıstico que utilizaremos es:

n∑

i=1

(Oi − ei)2

ei

que tiene, aproximadamente una distribucion χ2k−1−r, si H0 es cierta.

Razonando de manera analoga a como se hizo en el primer caso, llegamos a lasiguiente regla para efectuar el contraste:

Rechazamos la hipotesis nula H0: El modelo de probabilidad de X es algun Pθ de lafamilia indicada (al nivel de significacion α) si:

k∑

i=1

(Oi − ei)2

ei> χ

2k−1−r;1−α

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 121 / 157

Page 124: Estadística

Tema 8. Contrastes de Hipotesis Contrastes de hipotesis no parametricos

Contraste de homogeneidad de poblaciones

Supongamos que disponemos de p muestras aleatorias tomadas independientementeen p poblaciones:

(X11, . . . , X1n1)............

(Xp1, . . . , Xpnp)

n1 + . . .+ np = n

sobre una caracterıstica X comun a todas ellas.Queremos ver si, a la vista de las muestras obtenidas, es razonable admitir que todas

las poblaciones tienen una distribucion comun; es decir, queremos ver si son poblacioneshomogeneas. Por tanto, tenemos:

H0: Las p poblaciones tienen una distribucion comun.H1: Las p poblaciones no tienen una distribucion comun.

Para contrastar H0 frente a H1 hacemos una particion (arbitraria) del espaciomuestral comun a las p poblaciones en k clases A1, . . . , Ak. Despues, definimos para laclase Ai (i = 1, . . . , k) y para la muestra de la poblacion j-esima (j = 1, . . . , p:

Oij= frecuencia observada en la clase Ai con la muestra j-esima.

eij= frecuencia esperada en la clase Ai con la muestra j-esima, si todas las poblacionestienen la distribucion comun P= njP(Ai).

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 122 / 157

Page 125: Estadística

Tema 8. Contrastes de Hipotesis Contrastes de hipotesis no parametricos

El estadıstico utilizado es:p

j=1

k∑

i=1

(Oij − eij)2

eij

que tiene, aproximadamente una distribucion χ2(k−1)(p−1) cuando H0 es cierta.

De nuevo, podemos razonar diciendo que, si la hipotesis nula es cierta, las frecuenciasobservadas y esperadas seran parecidas y, por tanto, el estadıstico anterior tomaravalores pequenos (proximos a cero); en definitiva, tenemos:

Rechazamos la hipotesis nula H0: Las p poblaciones tienen una distribucion comun (alnivel de significacion α) si:

p∑

j=1

k∑

i=1

(Oij − eij)2

eij> χ

2(k−1)(p−1);1−α

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 123 / 157

Page 126: Estadística

Tema 8. Contrastes de Hipotesis Contrastes de hipotesis no parametricos

Contraste de independencia

Supongamos que queremos estudiar si dos caracterısticas X e Y de una poblacionestan relacionadas o no. Para hacer este estudio, obtenemos una muestra aleatoria de n

pares de valores de estas caracterısticas:

((X1, Y1), . . . , (Xn, Yn))

Queremos ver si, a la vista de la muestra, tiene sentido admitir que X e Y sonindependientes. Por tanto, tenemos:

H0: X e Y son independientes.H1: X e Y no son independientes.

Tomamos una particion (arbitraria) del espacio muestral (correspondiente a losposibles valores de X e Y ) en kp clases A1 ×B1, . . . , Ai ×Bj , . . . , Ak ×Bp. Estas kpclases corresponden a tomar las clases A1, . . . , Ak para la caracterıstica X, y las clasesB1, . . . , Bp para la caracterıstica Y .

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 124 / 157

Page 127: Estadística

Tema 8. Contrastes de Hipotesis Contrastes de hipotesis no parametricos

Llamamos:

Oij= frecuencia observada en la clase Ai ×Bj .

eij= frecuencia esperada en la clase Ai ×Bj , si la hipotesis nula es cierta =nP(Ai)P (Bj).

El estadıstico que utilizaremos para el contraste de independencia es:

p∑

j=1

k∑

i=1

(Oij − eij)2

eij

que tiene, aproximadamente una distribucion χ2(k−1)(p−1) cuando H0 es cierta.

Como se puede observar, el estadıstico anterior coincide con el que utilizabamos parael contraste de homogeneidad, aunque tiene un origen diferente. En definitiva, tenemos:

Rechazamos la hipotesis nula H0: X y Y son independientes (al nivel de significacion α)si:

p∑

j=1

k∑

i=1

(Oij − eij)2

eij> χ

2(k−1)(p−1);1−α

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 125 / 157

Page 128: Estadística

Tema 9. Optimizacion sin restricciones Introduccion: Conceptos previos

TEMA 9. OPTIMIZACION SIN RESTRICCIONES

INTRODUCCION: CONCEPTOS PREVIOS

Estudiaremos como obtener una solucion optima (si existe) o un extremo local para elsiguiente problema:

Max. (Min.) z = f(x1, x2, . . . , xn)s.a. x = (x1, x2, . . . , xn), x ∈ R

n

Las funciones concavas y convexas representan un papel fundamental en la Teorıa de

la Optimizacion ya que pueden garantizarnos la globalidad de los optimos locales. Por

ello vamos a iniciar este tema introduciendo el concepto de funcion concava y convexa

para, posteriormente, introducir condiciones que nos permitan reconocer si una funcion

es concava o convexa dependiendo de sus propiedades de diferenciabilidad.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 126 / 157

Page 129: Estadística

Tema 9. Optimizacion sin restricciones Introduccion: Conceptos previos

Definicion

La matriz hessiana asociada a una funcion f(x) = (x1, x2, . . . , xn) es una matrizcuadrada, Hn×n, tal que sus elementos son de la forma:

hij =∂2z

∂xixj

Definicion

Denominamos hessiano al determinante asociado a la matriz hessiana. En R2, el

hessiano es: H : R2 → R

H =

∂2z

∂x21

∂2z∂x1x2

∂2z∂x2x1

∂2z

∂x22

Definicion

El menor principal de orden i de una matriz Hn×n es el determinante de cualquier matrizi× i que se obtiene al suprimir las n− i filas y las n− i columnas correspondientes de lamatriz.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 127 / 157

Page 130: Estadística

Tema 9. Optimizacion sin restricciones Introduccion: Conceptos previos

Teorema: Sea la funcion f(x) con derivadas parciales de segundo orden continuas paracada punto de x ∈ S (conjunto convexo de soluciones factibles). Entonces f(x) esconvexa sobre S si y solo si, para cada x ∈ S, todos los menores principales, Hi, son nonegativos.

Teorema: Sea la funcion f(x) con derivadas parciales de segundo orden continuas para

cada punto de x ∈ S (conjunto convexo de soluciones factibles). Entonces f(x) es

concava sobre S si y solo si, para cada x ∈ S, los menores principales, Hi, no nulos

tienen el signo que (−1)i.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 128 / 157

Page 131: Estadística

Tema 9. Optimizacion sin restricciones Condiciones necesarias de optimo local

CONDICIONES NECESARIAS DE OPTIMO LOCAL

Supongamos que existen las primeras y las segundas derivadas parciales de f(x) y queson continuas en todos los puntos.

Una condicion necesaria para que un punto sea un extremo local para el problema nosla proporciona el teorema siguiente:

Teorema: Si x = (x1, x2, . . . , xn) es un extremo local para el problema sin restricciones,entonces

∇f(x) =∂f(x)

∂xi

= 0, ∀i

Para funciones diferenciables, la condicion ∇f(x) = 0 es una condicion necesaria para

que f tenga un optimo local en el punto x, que sin embargo no es una condicion

suficiente, es decir, pueden existir puntos que anulando el gradiente no sean optimos

locales de f .

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 129 / 157

Page 132: Estadística

Tema 9. Optimizacion sin restricciones Condiciones necesarias de optimo local

Definicion

Un punto x que satisfaga ∂f(x)

∂xi

= 0 es un punto estacionario o crıtico de la funcion f(x).

Teorema: Si Hi(x) > 0, (i = 1, 2, . . . , n), entonces un punto estacionario sera unmınimo local para el problema sin restricciones.

Teorema: Si Hi(x) 6= 0, (i = 1, 2, . . . , n), y tiene el signo (−1)i, entonces un puntoestacionario sera un maximo local para el problema sin restricciones.

Teorema: Si Hi(x) 6= 0, (i = 1, 2, . . . , n), y no se dan ninguno de los casos anteriores,

f(x) presenta un punto de inflexion o punto de silla en ese punto x.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 130 / 157

Page 133: Estadística

Tema 9. Optimizacion sin restricciones Condicion suficiente de optimo local

CONDICION SUFICIENTE DE OPTIMO LOCAL

Definicion

Se denota por Q la forma cuadratica definida como sigue:

Q(h) =

n∑

i,j=1

hihjHijf(x)

Proposicion: Sean f ∈ C2 y x un punto crıtico de f , se verifica que:

a) Si x es un mınimo local de f , Q es semidefinida positiva o definida positiva.

b) Si x es un maximo local de f , Q es semidefinida negativa o definida negativa.

Proposicion: Sean f ∈ C2 y x un punto crıtico de f , se verifica que:

a) Si Q es definida positiva, x es un mınimo local de f .

b) Si Q es definida negativa, x es un maximo local de f .

c) Si Q es indefinida, x no es ni maximo ni mınimo local de f

Los puntos crıticos de f que no son ni maximos ni mınimos locales, se denominan

puntos de silla.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 131 / 157

Page 134: Estadística

Tema 9. Optimizacion sin restricciones Condicion suficiente de optimo local

Ejemplo: Obtener el extremo de f(x) = x+ 2y + yz − x2 − y2 − z2.

La condicion necesaria para que exista extremo es: ∂f

∂k= 0, para k = x, y, z.

∂f

∂x= 1− 2x = 0,

∂f

∂y= z − 2y = 0,

∂f

∂z= 2 + y − 2z = 0

Resolviendo el sistema anterior, obtenemos, para el extremo, el punto objeto deestudio x∗ = (1/2, 2/3, 4/3).Condicion suficiente:

H =

∂2f

∂x2∂2f

∂x∂y

∂2f

∂x∂z

∂2f

∂y∂x

∂2f

∂y2∂2f

∂y∂z

∂2f

∂z∂x

∂2f

∂z∂y

∂2f

∂z2

=

−2 0 00 −2 10 1 −2

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 132 / 157

Page 135: Estadística

Tema 9. Optimizacion sin restricciones Condicion suficiente de optimo local

Estudio de los menores principales:Orden 1:

|H1×1| = −2 < 0⇒ signo (−1)1

Orden 2:

|H2×2| =

−2 00 −2

= 4 > 0⇒ signo (−1)2

Orden 3:

|H3×3| =

−2 0 00 −2 10 1 −2

= −8 + 2 = −6 < 0⇒ signo (−1)3

Por tanto, tenemos el signo de (−1)i. Ası pues, en el punto x∗, tenemos un posible

maximo. Como el valor de los menores principales no depende del punto, en ese punto

tenemos un maximo global.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 133 / 157

Page 136: Estadística

Tema 9. Optimizacion sin restricciones Condicion suficiente de optimo local

Ejemplo: Dada f(x, y) = x2 + xy + y3 − 3x− 2y + 1, por la condicion necesaria deextremo relativo, se tiene que:

2x+ y − 3 = 0x+ 3y2 − 2 = 0

a = (5/4, 1/2); b = (5/3,−1/3)

Los puntos a y b verifican la condicion necesaria de extremo. Veamos la condicionsuficiente, para lo que se obtienen, a continuacion, las derivadas parciales segundas de f

en cada uno de los puntos que cumplen la condicion necesaria de extremo,

H =

(

∂2f

∂x2∂2f

∂x∂y

∂2f

∂y∂x

∂2f

∂y2

)

=

(

2 11 6y

)

las matrices hessianas que permiten utilizar la condicion suficiente de extremo relativo enlos puntos a y b son:

H(a) =

(

2 11 3

)

; H(b) =

(

2 11 −2

)

a es un mınimo local relativo ya que H1 = 2 > 0, H2 = 5 > 0 con lo que la forma

cuadratica asociada a este punto es definida positiva y b es un punto de silla al ser la

forma cuadratica asociada indefinida.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 134 / 157

Page 137: Estadística

Tema 10. Ooptimizacion con restricciones Introduccion

TEMA 10. OPTIMIZACION CON RESTRICCIONES

INTRODUCCION

El objetivo principal de la Programacion Matematica es la resolucion de problemas deltipo:

minf(x) : x ∈ S, (1)

donde S ⊆ Rn y f : S → R, y que debe leerse como encontrar (si existe) un elemento de

S donde la funcion f alcance su mınimo valor. A cada elemento de S se le llamasolucion (o tambien solucion factible), a S se le llama region factible y a f se le llamafuncion objetivo. En tal sentido tambien afronta problemas de maximizacion, ya queestos pueden reformularse como problemas de minimizacion:

maxf(x) : x ∈ S = −min−f(x) : x ∈ S

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 135 / 157

Page 138: Estadística

Tema 10. Ooptimizacion con restricciones Introduccion

Los problemas del tipo (1) se llaman problemas de optimizacion, y plantean labusqueda de una solucion factible x∗ de manera que f(x∗) sea lo menor posible. Talbusqueda puede concluir con uno de los resultados siguientes:

problema no factible: cuando no existe ninguna solucion factible, es decir, S = ∅ yen tal caso escribiremos minf(x) : x ∈ S = +∞;

problema no acotado: cuando existan soluciones que hagan descender infinitamentea la funcion objetivo, es decir, cuando para cualquier valor real M siempre existe unx ∈ S tal que f(x) < M , y en tal caso escribiremos minf(x) : x ∈ S = −∞;

problema con optimo: cuando exista un x∗ ∈ S tal que f(x∗) ≤ f(x) para todox ∈ S. En este caso, f(x∗) = minf(x) : x ∈ S, y x∗ recibe el nombre de solucionoptima (global) siendo no necesariamente unica en S con esta propiedad. Un punto

x′

se dice que es solucion optima local cuando existe un ǫ > 0 tal que f(x′

) ≤ f(x)

para todo x ∈ S con ‖x− x′

‖ < ǫ, para alguna norma predefinida en el espacio Rn.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 136 / 157

Page 139: Estadística

Tema 10. Ooptimizacion con restricciones Introduccion

Para determinar un modelo de programacion matematica hemos de especificar tresconjuntos basicos de elementos:

Las variables principales del modelo, que son las variables para las que queremosencontrar el mejor valor posible. Cuando trabajemos en general las variablesprincipales seran x1, . . . , xn, es decir, salvo que convengamos otra cosa en unmomento dado, la letra n representara siempre el numero de variables principales deun modelo. En casos concretos, en lugar de x1, x2, x3 podremos escribir tambienx, y, z, o usar las letras que consideremos mas apropiadas por cuestiones de claridad.

Las restricciones, que son las condiciones que hemos de imponer a las variables paraque una solucion sea admisible como tal. En general, consideraremos tres tipos derestricciones: restricciones de menor o igual: g(x) ≤ b, restricciones de mayor oigual: g(x) ≥ b y restricciones de igualdad: g(x) = b, donde g : Rn → R y b ∈ R.Cuando trabajemos en general, las restricciones seran de la forma gi(x) ≤ bi (o bien≥ o bien =), para i = 1, . . . ,m, es decir, las funciones que determinan lasrestricciones se llamaran siempre gi, los terminos independientes se llamaransiempre bi y el numero de restricciones sera siempre m, salvo por la siguienteexcepcion: las restricciones xi ≥ 0 se llaman condiciones de no negatividad, y enalgunos contextos conviene tratarlas separadamente.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 137 / 157

Page 140: Estadística

Tema 10. Ooptimizacion con restricciones Introduccion

La funcion objetivo, que es la funcion f : Rn → R que queremos maximinar ominimizar. Notemos que para determinar un modelo no solo hemos de especificaruna funcion objetivo, sino tambien si hay que maximizarla o minimizarla. Cuando noqueremos especificar si buscamos el maximo o el mınimo, hablamos de optimizar lafuncion objetivo. En un problema de maximizar, los optimos de la funcion objetivoson sus maximos, mientras que en un problema de minimizar son sus mınimos.

Ejemplo

Max. x1 + x2

s.a. 3x1 + 2x2 ≤ 12

x1 + 2x2 ≤ 10

x1, x2 ≥ 0

Las variables principales son x1 y x2, tiene cuatro restricciones:

3x1 + 2x2 ≤ 12, x1 + 2x2 ≤ 10, x1 ≥ 0, x2 ≥ 0.

y la funcion objetivo es f(x1, x2) = x1 + x2.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 138 / 157

Page 141: Estadística

Tema 10. Ooptimizacion con restricciones Introduccion

Transformaciones de problemas

A veces es conveniente transformar un problema en otro equivalente en el sentido deque a partir de la solucion optima de uno puede calcularse facilmente la solucion optimadel otro.Cambio del objetivo. Un problema con objetivo Max. f(x) es equivalente al problemaque tiene las mismas restricciones pero su objetivo es Min. −f(x). Del mismo modopodemos transformar un problema de minimizar en otro de maximizar.Eliminacion de una constante en la funcion objetivo. Si la funcion objetivo es de la formaf(x)+ k y eliminamos la constante k, el problema que obtenemos tiene el mismo optimo.Cambio de una desigualdad. Una restriccion de ≤ se transforma en una de ≥multiplicando sus dos miembros por −1, y viceversa.Igualdad por desigualdades. Una restriccion de igualdad puede sustituirse por las dosrestricciones que resultan de cambiar el = por un ≤ y un ≥.Desigualdades por igualdades. Tambien es posible transformar desigualdades enigualdades introduciendo las llamadas variables de holgura. Es costumbre hacer latransformacion de tal modo que las variables de holgura sean siempre no negativas. Ası,para transformar una restriccion de ≤ en una igualdad se le suma una variable deholgura, mientras que si es de ≥ se le resta una variable de holgura.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 139 / 157

Page 142: Estadística

Tema 10. Ooptimizacion con restricciones Introduccion

Condiciones de signo. Una variable sometida a una condicion x ≤ 0 puede convertirse enuna variable no negativa mediante el cambio x = −x1, de modo que x ≤ 0 se sustituyepor x1 ≥ 0.

Una variable libre x se puede sustituir por variables no negativas mediante el cambiox = x1 − x2, x1 ≥ 0, x2 ≥ 0.

En vista de estas transformaciones, cualquier problema de programacion matematicapuede transformarse en uno de la forma

Max. f(x)s.a. g(x) ≤ b

o tambienMin. f(x)s.a. g(x) ≥ b

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 140 / 157

Page 143: Estadística

Tema 10. Ooptimizacion con restricciones Problemas de optimizacion lineales

Hechos basicos de la programacion lineal

Hay dos formas especialmente importantes de presentar un problema lineal:Forma canonica de un problema lineal. Se llama ası a la presentacion de un problema enla que todas las variables son no negativas y las restricciones son de ≤ cuando el objetivoes maximizar o de ≥ cuando el objetivo es minimizar.

Max. c1x1 + · · ·+ cnxn

s.a. a11x1 + · · ·+ a1nxn ≤ b1.................................

am1x1 + · · ·+ amnxn ≤ bmx1, . . . , xn ≥ 0

Es conveniente escribir el problema en forma matricial, para lo cual llamamosA = (aij), b = (bi), c = (cj), con lo que la expresion anterior se reduce a

Max. ctx

s.a. Ax ≤ b

x ≥ 0

La matriz A se llama matriz tecnica del problema. El vector c es el vector de

coeficientes de la funcion objetivo y b es el vector de terminos independientes.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 141 / 157

Page 144: Estadística

Tema 10. Ooptimizacion con restricciones Problemas de optimizacion lineales

Forma estandar de un problema lineal. Un problema lineal esta en forma estandar si todassus variables son no negativas y todas sus restricciones son de igualdad. Matricialmente,la expresion de un problema en forma estandar con objetivo de maximizar es

Max. ctx

s.a. Ax = b

x ≥ 0

Podemos pasar de un problema en forma canonica a un problema en forma estandar sinmas que introducir variables de holgura.

Clases de problema lineales. El esquema siguiente contiene todas las posibilidades conque nos podemos encontrar sobre existencia de optimos en un problema lineal:

Problema lineal

infactible

factible

acotado

solucion unicainfinitas soluciones

no acotado

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 142 / 157

Page 145: Estadística

Tema 10. Ooptimizacion con restricciones Resolucion grafica

RESOLUCION GRAFICA

Si el problema de optimizacion contiene dos o tres variables se puede abordar suresolucion por medio de la tecnica grafica o geometrica que se describe a continuacionpara el caso de dos variables y que se basa en el estudio de las curvas de nivel de lafuncion. Como es natural esta tecnica tiene el inconveniente de que solo es aplicable alcaso de problemas con dos o tres variables.

La resolucion geometrica de un programa matematico con dos o tres variables consiste

en determinar por medio de una representacion grafica el o los puntos del conjunto

factible situados sobre la curva de menor y de mayor nivel, que daran lugar,

respectivamente, al mınimo y al maximo globales de la funcion objetivo.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 143 / 157

Page 146: Estadística

Tema 10. Ooptimizacion con restricciones Resolucion grafica

Las fases del proceso de solucion grafica son:

1 Dibujar un sistema de coordenadas cartesianas en que las variables de decisionesten representadas por los ejes.

2 Dibujar en el sistema coordenado las restricciones del problema (incluyendo las deno negatividad). La interseccion de todas las regiones determina la region factible oespacio de soluciones. Si esta region es no vacıa, ir a la fase siguiente. En otrocaso, no existe solucion que satisfaga (simultaneamente) todas las restricciones y elproblema se dice infactible.

3 Determinar los puntos extremos (puntos que no estan situados en segmentos delınea que unen otros dos puntos del conjunto convexo) del espacio de soluciones.Evaluar la funcion objetivo en esos puntos y aquel o aquellos que maximicen (ominimicen) el objetivo, corresponden a las soluciones optimas del problema.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 144 / 157

Page 147: Estadística

Tema 10. Ooptimizacion con restricciones Resolucion grafica

El proceso para resolverlo graficamente si la funcion objetivo es lineal es el siguiente:

1 Comprobamos que la funcion objetivo es lineal.

2 Representamos el conjunto de oportunidades.

3 Calculamos el gradiente de la funcion objetivo y lo representamos graficamente.

4 Representamos la curva de nivel f = 0 de la funcion objetivo. Si la funcion objetivoes lineal sera siempre la recta perpendicular al vector gradiente.

5 Si la curva de nivel no pasara por el conjunto de oportunidades la movemosparalelamente a sı misma hasta que pase por S. Ası obtenemos otra curva de nivelvalida para alguna solucion factible.

6 Ahora recordamos que el gradiente de la funcion objetivo indica hacia dondeaumenta la funcion, mientras que la direccion contraria indica hacia dondedisminuye. Por lo tanto, si estamos maximizando desplazaremos la curva de nivelparalelamente a sı misma en la direccion del gradiente. El ultimo punto de S quetoquemos sera la solucion optima. Si el problema es de minimizar hemos dedesplazar la curva de nivel en la direccion opuesta al gradiente para llegar al mınimode f .

7 Si el optimo encontrado satura al menos dos restricciones, podemos calcular suscoordenadas resolviendo el sistema de ecuaciones formado por ellas.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 145 / 157

Page 148: Estadística

Tema 10. Ooptimizacion con restricciones Resolucion grafica

Como ejemplo consideramos una vez mas el problema

Max. x1 + x2

s.a. 3x1 + 2x2 ≤ 12

x1 + 2x2 ≤ 10

x1, x2 ≥ 0

El proceso para resolverlo graficamente es el siguiente:

Figure: Conjunto de oportunidades.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 146 / 157

Page 149: Estadística

Tema 10. Ooptimizacion con restricciones Resolucion grafica

1 Comprobamos que la funcion objetivo f(x, y) = x1 + x2 es lineal.

2 Representamos el conjunto de oportunidades.

3 Calculamos el gradiente de la funcion objetivo ∇f = (1, 1) y lo representamosgraficamente.

4 Representamos la curva de nivel f = 0 de la funcion objetivo.

5 La curva de nivel pasa por el conjunto de oportunidades.

6 El gradiente de la funcion objetivo indica hacia donde aumenta la funcion. Por lotanto, como estamos maximizando desplazaremos la curva de nivel paralelamente ası misma en la direccion del gradiente. El ultimo punto de S que toquemos sera lasolucion optima.

7 El optimo encontrado satura al menos dos restricciones, podemos calcular suscoordenadas resolviendo el sistema de ecuaciones formado por ellas.

Para determinar las coordenadas de la solucion optima que hemos encontrado basta

observar en la figura que satura las restricciones x1 + 2x2 = 10 y 3x1 + 2x2 = 12. Al

resolver el sistema de ecuaciones obtenemos que (x1, x2) = (1, 9/2) y la funcion objetivo

toma el valor z = 5.5.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 147 / 157

Page 150: Estadística

Tema 10. Ooptimizacion con restricciones Metodo sımplex

METODO SIMPLEX

El metodo sımplex es un procedimiento de resolucion de programas lineales queconsiste en obtener sucesivas soluciones factibles basicas que vayan suponiendo unamejora en el valor de la funcion objetivo hasta llegar al optimo. Simplifica enormementeel proceso, a la vez que nos permite determinar si un problema es o no acotado, y sitiene una o infinitas soluciones.

Dado un problema de programacion lineal, el metodo sımplex consiste en partir de unvertice de su conjunto de oportunidades, es decir, de una solucion factible basica, e irsaltando sucesivamente de una a otra adyacente, de modo que la funcion objetivo mejoresiempre (o, al menos, no empeore nunca). Cuando llegamos a una solucion desde la cualno podemos saltar a otra contigua mejor, el proceso termina, ya sea porque hemosencontrado el optimo, ya sea porque hemos llegado a un extremo de una arista infinita atraves de la cual la funcion objetivo mejora indefinidamente (y el problema es noacotado).

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 148 / 157

Page 151: Estadística

Tema 10. Ooptimizacion con restricciones Metodo sımplex

La tabla del sımplex

La aplicacion del algoritmo del sımplex consiste en ir encontrando en forma sucesivasoluciones factibles basicas del programa, de tal forma que en cada repeticion o iteraciondel proceso es necesario realizar un numero elevado de calculos que se simplificanconsiderablemente utilizando la tabla del sımplex que se describe a continuacion.Se considera un programa de maximo dado en la forma estandar

Max. ctx

s.a. Ax = b

x ≥ 0

con m restricciones de igualdad, n variables y tal que el rango de A es m. Se obtiene, enprimer lugar, una solucion factible basica o solucion inicial x = (h1, . . . , hm, 0, . . . , 0)t

con matrices asociadas B = (A1, . . . , Am) y N = (Am+1, . . . , An) y se disena la tabladel sımplex.

x1 . . . xs . . . xm xm+1 . . . xe . . . xn T.I.

x1 1 . . . 0 . . . 0 α1m+1 . . . α1e . . . α1n h1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

xs 0 . . . 1 . . . 0 αsm+1 . . . αse . . . αsn hs

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

xm 0 . . . 0 . . . 1 αmm+1 . . . αme . . . αmn hm

z 0 . . . 0 . . . 0 zm+1 − cm+1 . . . ze − ce . . . zn − cn z0

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 149 / 157

Page 152: Estadística

Tema 10. Ooptimizacion con restricciones Metodo sımplex

Observese que si la matriz B de partida es la identidad, los calculos se simplificanmucho ya que entonces se tiene que

(h1, . . . , hm)t = B−1

b = b,

es decir, que la ultima columna de la tabla esta formada por los terminos independientesdel sistema de restricciones. En este caso, las αij que aparecen en la tabla serıansimplemente las columnas de coeficientes de las variables no basicas que se tienen en elsistema de restricciones. Recordemos que:

Bj = α1jB1 + · · ·+ αmjBm, ∀j = m+ 1, . . . , n.

Ademas, si cB = 0, como

zj − cj = cBB−1

Bj − cj = cBBj − cj = −cj ,

los valores no nulos que aparecen en la fila objetivo de la tabla son los coeficientes de las

variables no basicas en la funcion objetivo cambiados de signo.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 150 / 157

Page 153: Estadística

Tema 10. Ooptimizacion con restricciones Metodo sımplex

A partir de la tabla anterior, teniendo en cuenta los resultados obtenidos, se aplica elsiguiente test de optimalidad.

- Si zj − cj ≥ 0 para todo j = m+ 1, . . . , n, la solucion factible basica quecorresponde a esa tabla es la solucion del programa, pudiendo darse el caso desoluciones multiples si para alguna j se tiene que zj − cj = 0.

- Si alguna diferencia zj − cj es negativa y todas las αij correspondientes a alguna delas diferencias positivas son negativas o nulas, entonces el programa no tienesolucion maxima factible.

- Si no se da ninguno de los casos anteriores, se pasa a otra tabla que proporcionaotra solucion factible basica que mejora el valor de la funcion objetivo. Para ello seselecciona un elemento de la tabla llamado pivote como se indica a continuacion.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 151 / 157

Page 154: Estadística

Tema 10. Ooptimizacion con restricciones Metodo sımplex

Se selecciona la columna que corresponda a la mayor de las diferencias anteriores deentre las negativas (columna e de la variable que entra en la nueva solucion factiblebasica) y la fila s (indica la variable que sale de la solucion) tal que

hs

αse

= min

hi

αie

: αie > 0

.

El elemento pivote es el de la fila s y la columna e. La nueva tabla se construye

dividiendo por αse los elementos de la fila pivote, con lo que el pivote pasa a valer uno, y

haciendo ceros en todos los elementos de la columna pivote (incluyendo la fila objetivo)

por aplicacion del metodo de Gauss. Por ultimo en esta nueva tabla se cambia la variable

xs por la xe y se repite el test de optimalidad. La iteracion de este proceso llevara a la

solucion del programa o a la conclusion de que el programa no tiene solucion.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 152 / 157

Page 155: Estadística

Tema 10. Ooptimizacion con restricciones Metodo sımplex

Tipos de solucionesSegun esto, las posibilidades de que el sımplex termine son:

1 Una variable no basica xj puede entrar pero ninguna puede salir. El problema es noacotado.

2 Ninguna variable puede entrar.

Esto significa que la funcion objetivo empeora (o se mantiene constante) nosmovamos hacia donde nos movamos, luego estamos en una solucion optima. A suvez, pueden darse los casos siguientes:

1 Todas las variables no basicas cumplen zj − cj 6= 0.La solucion es unica (solucion de vertice).

2 Hay alguna variable no basica xj con zj − cj = 0.Esto significa que si hicieramos entrar a esta variable pasarıamos a otrassoluciones con el mismo valor de la funcion objetivo, es decir, otras solucionesoptimas. A su vez hay dos posibilidades:

1 Alguna variable basica xi puede salir.

Estamos en una solucion de arista.2 Ninguna variable basica puede salir.

Estamos en una solucion de arista infinita.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 153 / 157

Page 156: Estadística

Tema 10. Ooptimizacion con restricciones Metodo sımplex

Ejemplo: Se considera el siguiente programa en forma canonica:

Max. z = 3x1 + 5x2

s.a. x1 + 2x2 ≤ 362x1 + x2 ≤ 36x1, x2 ≥ 0

Se introducen las variables de holgura x3 y x4, con lo que se tiene el programa en laforma estandar:

Max. z = 3x1 + 5x2 + 0x3 + 0x4

s.a. x1 + 2x2 + x3 = 362x1 + x2 + x4 = 36x1, x2, x3, x4 ≥ 0

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 154 / 157

Page 157: Estadística

Tema 10. Ooptimizacion con restricciones Metodo sımplex

Las variables basicas son x3 y x4 para las que la matriz B es la identidad. La tablainicial del sımplex es la siguiente:

x1 x2 x3 x4 T.I.

x3 1 2 1 0 36x4 2 1 0 1 36

zj − cj -3 -5 0 0 0

La solucion factible basica inicial es x1 = 0, x2 = 0, x3 = 36 y x4 = 36 con valor ceroen la funcion objetivo. Las variables basicas son x3 y x4. Como hay valores negativos enla fila objetivo y los elementos de las columnas correspondientes a estos valores sonpositivos hay que buscar otra solucion factible basica, para lo que se selecciona elelemento pivote. La columna pivote es la segunda que corresponde al mayor valornegativo de los de la fila objetivo. La fila pivote es la primera ya que

36

2= min

36

2,36

1

.

El pivote es el elemento (1, 2), la variable x2 entra como variable basica y sale la x3.

Las operaciones para obtener la nueva tabla son Fp = F1/2, F2 − Fp y z + 5Fp, en

donde se denota por F las diferentes filas.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 155 / 157

Page 158: Estadística

Tema 10. Ooptimizacion con restricciones Metodo sımplex

Se obtiene ası la siguiente tabla:

x1 x2 x3 x4 T.I.

x2 1/2 1 1/2 0 18x4 3/2 0 -1/2 1 18

zj − cj -1/2 0 5/2 0 90

La solucion factible basica que corresponde a esta tabla es x1 = 0, x2 = 18, x3 = 0 y

x4 = 18. El valor correspondiente en la funcion objetivo es 90 que mejora al anterior. Al

haber un valor negativo en la fila objetivo con la columna correspondiente a este valor

formada por numeros positivos se ha de buscar otra solucion factible basica y, por lo

tanto, otro pivote. La columna pivote es la primera que corresponde al unico valor

negativo en la fila objetivo. La fila pivote es la segunda, y el pivote es el elemento (2, 1).

La variable x1 entra como variable basica y sale la x4. Las operaciones para obtener la

nueva tabla son Fp = 2F2/3, F1 − Fp/2 y z + Fp/2.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 156 / 157

Page 159: Estadística

Tema 10. Ooptimizacion con restricciones Metodo sımplex

Se tiene ası la siguiente tabla:

x1 x2 x3 x4 T.I.

x2 0 1 2/3 -1/3 12x1 1 0 -1/3 2/3 12

zj − cj 0 0 7/3 1/3 96

La solucion factible basica correspondiente a esta tabla es x1 = 12, x2 = 12, x3 = 0 y

x4 = 0. El valor correspondiente en la funcion objetivo es 96 y esta es la solucion del

programa, ya que todos los elementos de la fila objetivo son mayores o iguales que cero.

Ademas esta solucion es unica pues no hay elementos nulos en la fila objetivo en los

lugares de las variables no basicas de la tabla.

R. Raya (Dpto. Estadıstica) Estadıstica Curso 2011/2012 157 / 157

Page 160: Estadística

PRÁCTICAS

Curso: 2011/2012 Clase: Primero - Grupo: B

Page 161: Estadística

PRÁCTICAS DE ESTADÍSTICA 1.- Se ha realizado un estudio sobre la intensidad de movimientos sísmicos registrados en una cierta región,

obteniéndose la siguiente información relativa a un determinado período de tiempo de observación:

INTENSIDAD

Nº de MOVIM. SISMICOS

Baja Media Media-alta Alta

10 6 3 1

Construir la tabla de frecuencias completa. Representa gráficamente la distribución mediante: a) Diagrama de barras. b) Diagrama de sectores. 2.- Se han estudiado los niveles de contaminación en una región durante 20 días y se han obtenido los datos: 1, 3, 5, 2, 1, 3, 1, 2, 4, 3, 3, 4, 1, 3, 4, 2, 3, 4, 1, 3.

a) Construye la tabla estadística de frecuencias asociada. b) Representa la distribución mediante:

-diagrama de barras. -diagrama de sectores.

3.- En los cursos académicos 1990-1991 y 1991-1992 los alumnos de una facultad de Ciencias estaban

clasificados por secciones de la siguiente forma:

SECCION

90-91

91-92

QUIMICAS MATEMATICAS FISICAS BIOLOGICAS GEOLOGICAS INFORMATICA E.T.S.

800 500 800 900 250 1200 370

700 850 1100 1000 400 1900 500

a) Representa las distribuciones mediante diagramas de sectores. b) Representa las distribuciones mediante diagramas de barras. c) Compara los datos de los dos cursos mediante diagramas de barras múltiples.

Page 162: Estadística

4.- Se inició la investigación para averiguar la proporción de nacimientos de ratas blancas en camadas de seis crías. Observando 111 camadas de seis crías, se obtuvieron números de ratas blancas por camada de seis crías:

xi

0 1 2 3 4 5 6

Ni

1 12 22 34 26 14 2

Representar la distribución de frecuencias por: a) Diagrama de barras. b) Diagrama de sectores.

5.- Las notas finales de 100 estudiantes fueron las siguientes: 31 11 46 58 25 48 18 41 35 59 28 35 2 37 68 70 21 6 32 15 67 47 61 47 60 43 33 48 47 43 69 49 21 44 84 64 82 26 42 51 29 59 92 56 5 52 8 1 12 74 9 15 11 22 29 14 31 46 19 49 51 71 52 32 51 44 57 60 43 65 73 62 3 17 81 39 22 40 65 30 31 16 80 20 41 36 59 60 59 38 41 40 51 43 10 18 63 41 71 44 a) Construir una tabla de frecuencias con intervalos de amplitud 10, siendo 0 el límite inferior. b) Determinar el número de estudiantes con nota superior a 50 e inferior a 80. c) Determinar la nota del estudiante número 38, en orden a la peor puntuación. d) Construir el histograma y los polígonos de frecuencias. 6.- En una clínica infantil se han estudiado, durante un mes, el número de metros que el niño anda, seguido y sin caerse, el primer día que comienza a caminar. Se obtuvo la siguiente tabla:

Nº de metros 1 2 3 4 5 6 7 8

Nº de niños 2 6 10 5 10 3 2 2

Se pide:

a) Tabla completa de frecuencias. b) Mediana, moda, cuartiles y otros estadísticos importantes. c) Los siguientes cuantiles: P5, P10, P25, P90, P95, P99, D3, D7, P82 y P43. d) Valor de la variable ( en metros) que deja por encima el 60% de la población.

Page 163: Estadística

7.-Una especie de mamíferos tiene en cada nacimiento un número variable de hijos. Se observa durante un año un total de 35 familias, anotándose el número de hijos de cada familia: Nº de hijos 0 1 2 3 4 5 6 7

Nº de familias 2 3 10 10 5 0 5 0 Calcular:

a) Tabla de frecuencias completa. b) Estadísticos más importantes. c) Intervalo que agrupa el 50% central de las observaciones. d) Intervalo que agrupa el 80% central de las observaciones. e) Número de hijos más frecuente entre las familias. f) Estudiar la forma de la variable (asimetría y curtosis).

8.- Los siguientes datos representan el peso de los recién nacidos durante un mes en una gran ciudad: 2.25 3.65 3.15 5.00 4.25 4.25 3.15 4.63 3.75 5.00 3.05 3.82 3.26 4.15 3.65 4.15 4.25 4.25 4.50 4.88 3.15 4.85 3.88 3.93 4.15 3.65 3.95 4.00 2.75 4.65 4.25 2.49 3.49 3.67 2.25 3.69 3.27 3.87 2.75 3.25 5.00 3.55 3.55 2.99 2.49 4.25 2.00 4.35 2.88 3.75 2.18 4.90 4.09 2.78 2.56 2.88 3.50 3.95 3.25 3.50 2.49 2.88 4.05 1.99 3.65 2.75 4.00 3.75 2.90 2.50 a) Construir la tabla de frecuencias con 7 clases de amplitud 0.5. b) Localizar en el histograma el intervalo modal. c) Calcular el peso más habitual de los niños. d) Estudiar la forma (asimetría y curtosis) de la distribución. e) Se sabe que el 5% de los niños nace con un peso demasiado bajo y deben permanecer en la incubadora

durante unos días. Calcular el peso máximo de estos niños. f) El 70% central de los niños tiene un peso normal. Calcular entre qué valores debe oscilar el peso de un niño

para que se considere normal. g) Calcular el peso mínimo que debe tener un niño al nacer para estar entre el 5% de los niños que más pesan. 9.-Los siguientes datos muestran el crecimiento de la población de truchas en 7 años de funcionamiento de una piscifactoría:

X Años

1 2 3 5 6 7

Y Truchas (miles)

3 7 15 100 250 650

a) Obtener los estadísticos más importantes para las dos variables. b) Dibujar la nube de puntos. c) Para predecir el número de truchas debemos elegir el modelo más apropiado. Estudiar los modelos

disponibles, efectuar predicciones para los 4 y los 10 años, y comentar la validez de los modelos.

Page 164: Estadística

10.-Dada la tabla

X

-4 -2 0 2 4

Y

0 3,4641 4 3,4641 0

a) ¿Son X e Y variables incorreladas? b) ¿Son X e Y variables independientes? 11.-La siguiente tabla muestra la edad X y la presión sanguínea Y de 10 mujeres:

Nombre A B C D E F G H I J

Edad

56 42 72 36 63 47 55 47 38 42

Presión Sanguínea

148 126 159 118 149 130 151 142 114 141

a) Obtener la recta de regresión de Y/X. Representarla gráficamente. b) Obtener el coeficiente de correlación lineal. c) Dar una predicción lineal para la presión sanguínea de una mujer de 51 años. ¿Es fiable esta estimación? d) Comparar la bondad del ajuste lineal con otros modelos.

12.-Dibujar la función de probabilidad y la función de distribución de las siguientes distribuciones de probabilidad:

a) B(10 , 0.1), B(10 , 0.5), B(10 , 0.9) b) B(60 , 0.05), B(60 , 0.1), B(60, 0.59), B(60 , 0.9) c) P(6) , P(19) , P(35) , P(100) d) Uniforme discreta de 20 puntos. e) N(0, 0.7) , N(1 , 0.7) , N(3, 0.7) e) N(0 , 0.05) , N( 0 , 1) , N( 0 , 2) , N(0 ,10) , N(0 , 25) f) χ2 (4) , χ2(10) , χ 2(38) , χ2 (100) g) t(3) , t(15) , t(25) , t(30) , t(50) ,t(100) h) F(2 , 10) , F(2,20) , F(2 ,30) , F(10 , 2) ,F(10 , 9)

Comentar las diferencias o semejanzas de forma entre las curvas de cada apartado, así como los posibles casos de aproximaciones entre distribuciones..

13.-Calcular los siguientes puntos críticos: χ 2

7, 0.95 χ 2 20, 0.15 χ

2 18, 0.025 χ

2 20, 0.9 χ

2 40, 0.5 χ

2 4, 0.5

t 20, 0.03 t 20, 0.3 t 12, 0.9 t 40, 0.5 t 40, 0.99 t3, 0.89

F15, 18; 0.1 F15, 25; 0.1 F 7, 26; 0.25 F7, 26;0.95 F13, 13; 0.99 F 10, 3; 0.9

Page 165: Estadística

14.-Calcular las siguientes probabilidades:

P ( χ2(11) > 16 ) P( χ2

(6) < 9.02 ) P( t(34) > 1.267 ) P( t(8) > -1.43 ) P( F(13, 5) > 2.5 ) P( F(5, 13) < 0.4 )

15.-Para los datos del ejercicio 8, suponiendo que éstos proceden de una distribución normal, obtener :

a) Intervalo de Confianza para la media poblacional, μ, al Nivel de Confianza del 90 %. b) Intervalo de Confianza para la media poblacional, μ, al Nivel de Confianza del 95 %. c) Intervalo de Confianza para la desviación típica poblacional, σ, al Nivel de Confianza del 90 %. d) Intervalo de Confianza para la desviación típica poblacional, σ, al Nivel de Confianza del 95 %. e) ¿Se puede aceptar la hipótesis de que la media poblacional vale 3.6, al Nivel de Confianza del 90%? f) ¿Se puede aceptar la hipótesis de que la media poblacional vale 3.39, al Nivel de Confianza del 90%? ¿Y

al Nivel de Confianza del 95%? Comenta las respuestas. g) ¿Se puede aceptar la hipótesis de que la desviación típica poblacional vale 0.8, al Nivel de Confianza del

90%? h) ¿Se puede aceptar la hipótesis de que la desviación típica poblacional vale 0.68, al Nivel de Confianza

del 90%? ¿Y al Nivel de Confianza del 95%? Comenta las respuestas. 16.- Sean los datos correspondientes al peso (en Kg.) y altura (en cm.) de 12 individuos: Peso: 75 81 56 68 79 89 62 59 83 55 72 56 Altura: 173 172 136 180 182 185 157 165 180 160 174 161

a) Obtener los Intervalos de Confianza para las medias poblacionales al N. C. 95%. b) Obtener los Intervalos de Confianza para las varianzas poblacionales al N. C. 95%. c) Obtener el Intervalo de Confianza para la diferencia de medias poblacionales al N.C. 95%. d) Obtener el Intervalo de Confianza para el cociente de las desviaciones típicas poblacionales al N. C. 95%. e) Obtener los Intervalos de Confianza anteriores al N. C. 90%, compararlos con los calculados

anteriormente, y extraer conclusiones. f) ¿Es admisible al N. C. 90% que las varianzas poblacionales son iguales? g) ¿Es admisible al N. C. 90% que las medias poblacionales son iguales?

17.- Sean los datos 0, 1, 2, 3, 4, 5, con frecuencias 229, 211, 93, 35, 7, 1.

a) ¿Se ajustan a una distribución Normal? b) ¿Se ajustan a una distribución Poisson?

18.- Las notas de una asignatura en 3 grupos A, B y C, vienen dada en la siguiente tabla: Grupo Suspenso Aprobado Notable Sobresaliente Total Fila A 10 32 12 40 94 B 14 12 10 30 66 C 8 10 6 16 40 Total 32 54 28 86 200 Estudiar la independencia entre las notas y los grupos.

Page 166: Estadística

19.-Tenemos los siguientes datos provenientes de clasificar a 13 individuos según las variables A (ser hombre o mujer) y B (jugar al fútbol o no) A: h h m h m m m h m h m h h B: s s n n s n n s n s n s s Estudiar la dependencia entre las dos variables. 20.- El peso de 34 alumnos es 80, 70, 90, 75, 55, 80, 80, 65, 100, 75, 60, 60, 75, 95, 80, 80, 90, 85, 70, 95, 75,70, 85, 80, 80, 65, 65, 50, 75, 75, 85, 85, 90, 70. Estudiar si el peso se distribuye según una Ley Normal. 21.- Se probaron tres métodos de empaquetado de fruta, A, B y C, durante un periodo de 4 meses. Se hizo un recuento del número de Kilos (en miles) que llegan estropeados. Se obtuvieron los siguientes datos: Meses A B C Total Enero 6 10 10 26 Febrero 8 12 12 32 Marzo 8 8 14 30 Abril 9 14 16 39 Total 31 44 52 127 Con un nivel de confianza del 90% ( significación del 10%), comprobar que los tres métodos de empaquetado son igualmente buenos. 22.-Un fumador, preocupado por el contenido medio de nicotina de los cigarrillos que habitualmente fuma de las marcas A, B y C, decide realizar un análisis de dichos cigarrillos. Obtuvo los siguientes datos, correspondientes a las marcas A, B y C: A 28 20 26 30 32 34 25 23 B 29 31 28 30 24 26 25 25 28 28 C 32 30 28 25 27 30 26 24 22 a) Estudiar la normalidad de las muestras. b) ¿Se puede suponer que la variabilidad del contenido de nicotina es similar para las 3 marcas? (contraste de igualdad de varianzas) d) ¿Se puede suponer que las 3 marcas tienen, en media, el mismo contenido de nicotina? (contraste

múltiple de igualdad de medias)

Page 167: Estadística

Ejercicio 1.

Introducir las 2 columnas de la tabla: Las modalidades, como variable “carácter” y las frecuencias, como

variable “numérica”.

Gráfico----Diagramas de presentación----Diagrama de barras.

Se introducen la columna de frecuencias como “conteos”, y la columna de las modalidades como

“etiquetas”.

Con doble clic se amplia la ventana.

Con Botón Secundario del Ratón (B. S. R.) aparecen las opciones de cada ventana. Por ejemplo, en Opciones

de Ventana, se ve el tipo de diagrama, la dirección, si se pone en el eje Y frecuencias o porcentajes……

También se pueden explorar las opciones gráficas.

Gráfico---Diagramas de presentación---Diagrama de sectores.

Igual que en el apartado anterior, explorando las Opciones de Ventana y Gráficas.

Generar la tabla de frecuencias completa.

Usamos los operadores, con “Generar datos”.

Si tenemos las frecuencias absolutas en la col_2, generamos el resto de las frecuencias, cada una en una

columna vacia:

En la col_3: usamos el operador RUNTOT(col_2), y obtiene una columna con las frec. Absol. Acumuladas.

En la col_4: usamos el operador col_2/ SUM(col_2), y obtiene una columna con las frec. Relativas.

En la col_5: usamos el operador RUNTOT(col_4), y obtiene una columna con las frec. Relativ. Acumuladas.

Page 168: Estadística

Ejercicio 2.

Se introducen los 20 datos en una columna.

Descripción---Datos cualitativos---Tabulación.

Se usa para agrupar una lista de datos, que queremos considerar como variable discreta.

Obtenemos el Resumen y el Diagrama de Barras, que podemos modificar con las opciones del B. S. R.

Con Opciones Tabulares, elegimos la Tabla de Frecuencias, y con el B. S. R. elegimos opciones.

Con Opciones Gráficas, elegimos el Diagrama de Sectores, que podemos modificar con las opciones

del B. S. R.

Page 169: Estadística

Ejercicio 3.

Similar al ejercicio 1, además de los 2 diagramas de barras individuales, obtenemos el

diagrama de barras múltiple, con

Gráficos---Diagramas de presentación---Diagramas de barras múltiple

Page 170: Estadística

Ejercicio 4.

Se meten los 111 datos en una sola columna, uno a uno, o bien con los operadores REP y JOIN del

siguiente modo:

REP(2;22) crea una columna con el número 2, repetido 22 veces.

JOIN( col_1;col_2) une en una sola columna las 2 columnas, en ese orden.

JOIN3(col_1;col_2 col_3) une en una sola columna las 3 columnas, en ese orden.

JOIN4(col_1;col_2 ;col_3;col_4 ) une en una sola columna las 4 columnas, en ese orden.

Así, usaremos la siguiente expresión de operadores para que nos cree directamente la columna con los

111 datos:

JOIN(JOIN3(REP( 0;1);REP(1;12);REP(2;22));JOIN4(REP(3;34);REP(4;26);REP(5;14);REP(6;2)))

A continuación, trabajamos como ya sabemos:

Descripción---Datos cualitativos---Tabulación

Obtenemos el Diagrama de Barras, que podemos modificar con B.S.R. y las Opciones de Ventana.

En Opciones Gráficas , elegimos el “Diagrama de Sectores”, y modificamos si queremos.

En Opciones Tabulares , elegimos la “Tabla de Frecuencias”.

Page 171: Estadística

Ejercicio 5.

Se introducen los 100 datos, en una columna.

Descripción---Datos Numéricos---Análisis Unidimensional

En Opciones Tabulares, seleccionamos “Tabla de frecuencias”, que agrupa la

variable como continua. Como no es la que nos piden, la modificamos:

con el B.S.R., en Opciones de Ventana, elegimos :

Nº de clases 10 Límite inferior 0 Límite superior 100

Y obtenemos la tabla que se nos pide, con intervalos del tipo ( a, b].

Para ordenar la columna, en la Hoja de Datos, se marca la columna con B.P.R., y

después con B.S.R. se elige la opción de “Ordenar Fichero” (ascendente).

Elegimos aplicar el orden sólo a la columna marcada, “Sólo Rango

Seleccionado”, y no al fichero entero.

En el ejercicio usaremos los siguientes operadores:

COMPRESS(variable; relación lógica) que nos da una columna con los

elementos de la variable que verifican esa relación lógica.

SIZE( variable) que nos da el tamaño (nº de filas) de la variable.

CELL(variable; 38) que nos da la fila (celda) nº 38 de la variable.

Concretamente, en el ejercicio, la relación lógica que piden es variable>50 &

variable<80,

que nos da los elementos de la variable comprendidos entre 50 y 80.

Los operadores se pueden incluir unos dentro de otros, de modo que

podríamos poner la expresión

SIZE(COMPRESS(variable; variable>50 & variable<80))

Page 172: Estadística

En Opciones Gráficas, se marca “Histograma” y se hacen los 4 polígonos de

frecuencias.

Page 173: Estadística

Ejercicio 6.

Se meten los 40 datos en una columna (variable): el 1, dos veces; el 2, seis veces;…..; el 8, dos veces.

Como la variable es discreta, usamos:

Descripción---Datos Cualitativos---Tabulación

En Opciones Tabulares , elegimos “ Tabla de Frecuencias”.

Descripción---Datos Numéricos---Análisis Unidimensional

En Opciones Tabulares , elegimos “Resumen Estadístico”

“Tabla de Frecuencias”

“Percentiles”

En la ventana de “Resumen Estadístico”, con B.S.R., en Opciones de Ventana, elegimos los estadísticos que

nos interesen.

En la ventana de “Percentiles”, con B.S.R., en Opciones de Ventana, elegimos el porcentaje, j, de los

percentiles que queramos calcular.

Page 174: Estadística

Ejercicio 7.

Se meten los 35 datos en una columna, como en el ejercicio 6.

Descripción---Datos Numéricos---Análisis Unidimensional

En Opciones Tabulares ; marcamos “Resumen Estadístico”

“Percentiles”

“Tabla de Frecuencias”

Y trabajamos igual que en ejercicio 6.

Ejercicio 8.

Se hace de forma similar al ejercicio 5 y al ejercicio 6.

Page 175: Estadística

Ejercicio 10.

Hacemos igual que en el ejercicio 9, y comprobamos que hay incorrelación lineal (r=0), así que buscamos

un ajuste polinómico.

Dependencia---Regresión Polinomial

Por defecto, ajusta el polinomio de grado 2. Para ajustar otros polinomios, con B.S.R., elegimos Opciones

de Análisis, y se cambia el orden del polinomio, hasta que encontremos el polinomio que ajusta los datos

perfectamente.

En Opciones Tabulares , elegimos “Predicciones”, y en dicha ventana, con B.S.R., en Opciones de

Ventana, introducimos los valores conocidos de X, para estimar Y.

Page 176: Estadística

Ejercicio 9…………………….Ejercicio 11.

Metemos cada variable en una columna.

Gráficos---Gráficos de Dispersión---Gráfico X-Y

Obtenemos la nube de puntos.

Descripción---Datos Numéricos---Análisis Multidimensional

Metemos las dos variables, Fecha y Truchas, en “Datos”.

En Opciones Tabulares , elegimos “Resumen del Procedimiento”

“Resumen Estadístico”

“Correlaciones”

“Covarianzas”

En la ventana de “Resumen Estadístico”, con B.S.R., en Opciones de Ventana, elegimos los estadísticos que necesitemos.

Comparación---Dos muestras---Comparación de dos Muestras

En Opciones Tabulares , elegimos “Resumen Estadístico”, y , con B.S.R., en Opciones de Ventana, elegimos los

estadísticos que necesitemos.

En Opciones Gráficas , elegimos los diagramas que queramos, por ejemplo, el Histograma y el Gráfico de Caja y

Bigotes.

Dependencia---Regresión Simple

En X: metemos la variable independiente (conocida), en este ejercicio, Años.

En Y: metemos la variable dependiente (a estimar), en este ejercicio, Truchas.

Salen dos ventanas: a la izquierda, la de REGRESIÓN LINEAL, y a la derecha, el GRÁFICO.

VENTANA DE REGRESIÓN LINEAL:

Con B.S.R., en Opciones de Análisis, elegimos el modelo a ajustar, normalmente usaremos los siguientes:

LINEAL:

EXPONENCIAL: =A.

MULTIPLICATIVO (POTENCIAL):

INVERSA DE X (HIPÉRBOLA):

Con B.S.R., si elegimos Opciones de Análisis, nos permite cambiar a otro modelo de regresión.

VENTANA DEL GRÁFICO:

En Opciones Tabulares , elegimos “Resumen del Procedimiento”

“Predicciones”

“Comparación de Modelos Alternativos”

En cada una de estas 3 ventanas, con B.S.R., en las Opciones de Ventana, tenemos más opciones; por ejemplo, en la

ventana de “Predicciones”, se pueden introducir hasta 5 valores de la variable independiente X, para obtener las

correspondientes estimaciones de Y.

Page 177: Estadística

Ejercicio 12………………..Ejercicio 13………………….Ejercicio 14.

Gráficos---Distribuciones de Probabilidad

Se elige la distribución de probabilidad que deseemos, y con el B.S.R., en Opciones de Análisis, se meten los

parámetros de dicha distribución.

En Opciones Tabulares , elegimos “Resumen del Análisis”

“Distribución Acumulada”

“CDF Inverso”

En la ventana de “Distribución Acumulada” obtenemos Probabilidades:

El área de la cola inferior P[ X <0]

La función de masa de probabilidad P[ X =0] si la variable es discreta (y la función de densidad, si la

variable es continua).

El área de la cola superior P[ X >0]

Con B.S.R., en Opciones de Ventana, se pueden meter hasta 5 valores de x (por defecto, x=0) para calcular

las probabilidades anteriores.

Con B.S.R., en Opciones de Análisis, se pueden meter los parámetros de hasta 5 distribuciones.

En la ventana de “CDF Inverso” obtenemos Puntos Críticos de la distribución, especificando hasta 5 áreas

de cola, p, conocidas:

Obtenemos el punto x que verifica P[ X <x]=p, con probabilidad p conocida

Con B.S.R., en Opciones de Ventana, se pueden meter hasta 5 valores de p (por defecto, p=0.01) para

calcular los correspondientes puntos críticos.

Con B.S.R., en Opciones de Análisis, se pueden meter los parámetros de hasta 5 distribuciones.

En Opciones Gráficas , elegimos “Función Densidad /Masa de Probabilidad”

“CDF (Función de Distribución)”

En la ventana de “Función Densidad /Masa de Probabilidad” obtenemos los gráficos de la función de

densidad (para distribuciones continuas) o de la Función de masa de probabilidad (para distribuciones

discretas).

En la ventana de “CDF (Función de Distribución)” obtenemos los gráficos de la Función de Distribución

(Acumulada).

En ambas ventanas de gráficos, con B.S.R., en Opciones de Ventana y Opciones de Análisis, introducimos

los parámetros de hasta 5 distribuciones para representar simultáneamente.

Page 178: Estadística

Ejercicio 15.

Tenemos los datos ya metidos en el ejercicio 8, en una variable.

Descripción---Datos Numéricos---Análisis Unidimensional

En “Datos”, introducimos nuestra variable.

En el “Resumen Estadístico”, nos fijamos en:

La asimetría tipificada: -0.390773

La curtosis tipificada: -1.20724

Estos valores entre -2 y +2 nos indican que la muestra procede de una distribución normal.

En Opciones Tabulares , elegimos “Intervalos de Confianza”

“Contraste de Hipótesis”

En la ventana de “Intervalos de Confianza” salen los Intervalos de Confianza para:

La media poblacional μ, *3.38895, 3.76362+ al Nivel de Confianza del 95%.

La desviación típica poblacional σ, *0.673645, 0.942727+ al Nivel de Confianza del 95%.

Con B.S.R., en Opciones de Ventana, se puede cambiar el Nivel de Confianza (1-α).

En la ventana de “Contraste de Hipótesis” nos quedamos con el Test T, que por defecto es:

Hipótesis Nula H0: μ=0

Hipótesis Alternativa H1: μ≠0

Nos fijamos en el valor del estadístico t= 38.084 y el p-valor=0.

Con B.S.R., en Opciones de Ventana, se puede cambiar:

El valor de α. (El Nivel de Confianza es (1-α)%).

El valor de μ en H0 , que por defecto es 0, y ponemos lo que se nos pida: 3.6, 3.39.

La Hipótesis Alternativa H1 , eligiendo “no igual”, “menor que”, o “mayor que”.

Si la Hipótesis Nula es H0: μ=3.6 Se acepta (no se rechaza) H0 al Nivel de Confianza del 90%.

Si la Hipótesis Nula es H0: μ=3.39 Se acepta H0 al Nivel de Confianza del 90%.

Si la Hipótesis Nula es H0: μ=3.39 No se rechaza H0 al Nivel de Confianza del 99%.

Se pueden hacer contrastes para la media normal, la desviación típica normal, la proporción

binomial y la tasa de Poisson:

Page 179: Estadística

Descripción---Contraste de Hipótesis

Elegimos el tipo de contraste e introducimos los datos necesarios, por ejemplo, para la media:

Hipótesis Nula___________

Media muestral__________

Desviación Típica muestral _

Tamaño de la muestra ____

Saca el Intervalo de Confianza (I. C.) para μ al Nivel de Confianza (N. C.) 95%:

[3.38895, 3.76363]

Saca el Contraste de Hipótesis

El t-estadístico sale -0.252489 y el p-valor 0.801414.

Con B.S.R., en Opciones de Análisis, se puede cambiar:

-la hipótesis alternativa : “no igual”, “menor que” y “mayor que”.

-el valor de α (Nivel de Significación).

En Introducir Texto , tenemos las Opciones del Contraste, y, por ejemplo, podemos hacer el

contraste para la Desviación Típica Normal:

Hipótesis Nula___________

Desviación Típica muestral _

Tamaño de la muestra ____

Saca el Intervalo de Confianza (I. C.) para σ al Nivel de Confianza (N. C. , 1-α ) 95%:

[0.673645, 0.942727]

Saca el Contraste de Hipótesis

El estadístico chi-cuadrado sale 66.5497 y el p-valor 0.877495.

Con B.S.R., en Opciones de Análisis, se puede cambiar:

-la hipótesis alternativa : “no igual”, “menor que” y “mayor que”.

-el valor de α (Nivel de Significación).

Page 180: Estadística

Ejercicio 16.

Se introducen en dos columnas los datos de las dos muestras: “peso” y “altura”.

Comparación---Dos muestras---Comparación de 2 muestras

Introducimos “peso” en Muestra1 y “altura” en Muestra2.

Obtenemos “Resumen del Procedimiento”

“Resumen Estadístico”

“Gráficos”

Y con Opciones Tabulares pedimos “Comparación de desviaciones típicas”

“Comparación de medias”

En la ventana de “Resumen Estadístico” nos fijamos en la asimetría tipificada y la curtosis

tipificada: valores entre -2 y +2 indican normalidad.

Notemos que en los tests siguientes de “Comparación de desviaciones típicas” y de

“Comparación de medias” se requiere que las muestras procedan de distribuciones normales.

Así, para comprobar esta asunción, en “Resumen Estadístico” se deben observar los valores de

asimetría y curtosis estandarizada. Valores de estos estadísticos fuera del rango [-2, +2]

indican salidas significativas de la normalidad, que tenderían a invalidar las pruebas siguientes.

En la ventana de “Comparación de desviaciones típicas” verificamos si las varianzas son

iguales:

Obtenemos las medidas para las variables “altura” y “peso”:

“altura” “peso” Desviaciones típicas 13.8507 11.9275

Varianzas 191.841 142.265

Grados de Libertad (n-1) 11 11

Cociente de varianzas 1.34847

I.C. para σaltura [9.81174, 23.5167] al N.C. 95%

I.C. para σpeso [8.44938, 20.2514] al N.C. 95%

I.C. para σaltura / σpeso [0.388196, 4.68419] al N.C. 95%. En este caso, como 1 pertenece al

intervalo, se puede admitir la igualdad σaltura = σpeso , . al N.C. 95%

Page 181: Estadística

Con B.S.R., en Opciones de Ventana, se puede cambiar:

El valor de α. (El Nivel de Confianza es (1-α)%).

El valor de σ en H0 , que por defecto es 1, y ponemos lo que se nos pida.

La Hipótesis Alternativa H1 , eligiendo “no igual”, “menor que”, o “mayor que”.

Interpretemos el Contraste para comparar varianzas:

Notemos que es equivalente a suponer que

El cociente de varianzas F=1.34847, con p-valor=0.628535.

Así que se puede suponer que las varianzas son iguales. Y podemos proceder a la comparación

de medias.

En la ventana “Comparación de medias” obtenemos los I.C. para μ1, μ2, μ1-μ2 al N.C. 95%:

I.C. para μaltura [ 159.95 , 177.55 ] al N.C. 95 %

I.C. para μpeso [ 62.0049 , 77.1617 ] al N.C. 95 %

I.C. para μaltura - μpeso [ 88.2237 , 110.11 ] al N.C. 95%, suponiendo las varianzas iguales.

En este caso, como 0 pertenece al intervalo, se puede admitir la igualdad μaltura = μpeso .

Con B.S.R., en Opciones de Ventana, se puede cambiar:

El valor de α. (El Nivel de Confianza es (1-α)%).

El valor de μ en H0 , que por defecto es 0, y ponemos lo que se nos pida.

La Hipótesis Alternativa H1 , eligiendo “no igual”, “menor que”, o “mayor que”.

Aquí también nos presenta el Contraste de Comparación de medias:

Suponiendo las varianzas iguales.

El estadístico t=18.7938 con p-valor=0.0

Page 182: Estadística

Para ver si los datos proceden de una distribución normal:

Descripción---Distribuciones---Ajuste de Distribuciones (Datos no-censurados)

En primer lugar hacemos el estudio para la variable “altura”, y obtenemos

“Resumen del análisis”

“Test de la bondad del ajuste”

“Test de la normalidad” (seleccionado con las Opciones Tabulares ).

“Histograma de frecuencias” (seleccionado con las Opciones Gráficas ).

En la ventana de “Resumen del análisis” se nos presentan los resultados del ajuste a

distribución normal de la variable considerada.

En la ventana de “Test de la bondad del ajuste” se comprueba si dicha distribución normal

ajusta a los datos adecuadamente.

Se muestran los resultados de tres tests para determinar si “altura” puede ser modelado

adecuadamente a una distrib. Normal. Se mira el p-valor más pequeño, y se concluye

Siendo H0 la hipótesis nula: la “altura” procede de una distribución normal.

En Introducir Texto, elegimos la variable “peso”, y hacemos el mismo estudio anterior.

Como p-valor ≥ 0.10, no se rechaza que la variable “peso” proceda de una distribución normal,

al N.C. de al menos un 90%.

En la ventana de “Test de la normalidad” miramos el p-valor más bajo de los 3 que salen, y

razonamos como siempre:

Consideramos la Hipótesis Nula : Hay normalidad en los datos.

Como el p-valor más bajo es 0.175829 ≥ 0.10, no se rechaza que la variable “altura” proceda

de una distribución normal, al N.C. de al menos un 90%.

En Introducir Texto, elegimos la variable “peso”, y hacemos el mismo estudio anterior.

Como p-valor= 0.208263 ≥ 0.10, no se rechaza que la variable “peso” proceda de una

distribución normal, al N.C. de al menos un 90%.

Page 183: Estadística

En la ventana de “Histograma de frecuencias” se puede evaluar visualmente cómo se ajusta a

los datos la distribución normal.

(Para seleccionar una distribución a ajustar, diferente a la normal, con B.S.R., se puede elegir

en Opciones de Análisis).

Page 184: Estadística

Ejercicio 17.

Se meten los 576 datos en una columna, al igual que el ejercicio 4.

Descripción---Distribuciones---Ajuste de Distribuciones (Datos no-censurados)

En Opciones Tabulares elegimos “Test para la Normalidad”

“Test de la Bondad del ajuste”

En Opciones Gráficas elegimos “Gráfico Cuantil-Cuantil”

En la ventana de “Test para la Normalidad” vemos que se ha considerado la Hipótesis Nula

H0 : La distribución procede de una distribución Normal.

Miramos el p-valor más pequeño, y concluimos

En la ventana de “Test de la Bondad del ajuste” vemos que se usan los contrastes

Chi-cuadrado y de Kolmogorov-Smirnov.

Con B.S.R., en Opciones de Análisis, se elige la distribución que se quiere ajustar a los datos.

Nos piden contrastar el ajuste a una distribución normal y a una distribución Poisson.

Por ejemplo, para el ajuste a una distribución Poisson:

H0 : La distribución procede de una distribución Poisson.

Miramos el p-valor más pequeño de los tests que aparecen, y concluimos:

O sea, no podemos rechazar, al N.C. 90% que los datos procedan de una distrib. Poisson.

En la ventana de “Gráfico Cuantil-Cuantil” se compara la distribución real de los datos con la

distribución ajustada. Se contrasta visualmente la normalidad: mientras más cerca esté el

diagrama de puntos de la diagonal, mayor normalidad.

Page 185: Estadística

Ejercicio 17.

Se meten los 639 datos en una columna, al igual que el ejercicio 4.

Descripción---Distribuciones---Ajuste de Distribuciones (Datos no-censurados)

En Opciones Tabulares elegimos “Test para la Normalidad”

“Test de la Bondad del ajuste”

En Opciones Gráficas elegimos “Gráfico Cuantil-Cuantil”

En la ventana de “Test para la Normalidad” vemos que se ha considerado la Hipótesis Nula

H0 : La distribución procede de una distribución Normal.

Miramos el p-valor más pequeño, y concluimos

En la ventana de “Test de la Bondad del ajuste” vemos que se usan los contrastes

Chi-cuadrado y de Kolmogorov-Smirnov.

Con B.S.R., en Opciones de Análisis, se elige la distribución que se quiere ajustar a los datos.

Nos piden contrastar el ajuste a una distribución normal y a una distribución Poisson.

Por ejemplo, para el ajuste a una distribución Poisson:

H0 : La distribución procede de una distribución Poisson.

Miramos el p-valor más pequeño de los tests que aparecen, y concluimos:

O sea, no podemos rechazar, al N.C. 90% que los datos procedan de una distrib. Poisson.

En la ventana de “Gráfico Cuantil-Cuantil” se compara la distribución real de los datos con la

distribución ajustada. Se contrasta visualmente la normalidad: mientras más cerca esté el

diagrama de puntos de la diagonal, mayor normalidad.

Page 186: Estadística

Ejercicio 18.

Introducimos las 5 columnas de la tabla en la Hoja de Datos,

La columna “Grupos” es tipo Carácter, y las “suspenso”, “aprobado”, “notable”,

“sobresaliente”, tipo Numérica.

Descripción---Datos cualitativos---Tablas de Contingencia

En “Columnas” introducimos las variables “suspenso”, “aprobado”, “notable”, “sobresaliente”.

En “Etiquetas” introducimos la variable “Grupos”.

En Opciones Tabulares pedimos “Resumen del Análisis”

“Tabla de Frecuencias”

“Test Chi-Cuadrado”

En Opciones Gráficas pedimos las 3.

En la ventana “Tabla de Frecuencias” se nos presenta la tabla, con recuentos o frecuencias,

porcentajes de la tabla total, por elementos individuales (celdas), por filas y por columnas.

En la ventana “Test Chi-Cuadrado” se realiza un Contraste de Hipótesis para determinar si se

rechaza o no la idea de que la fila y la columna seleccionada son independientes.

Consideramos la Hipótesis Nula : Las filas y las columnas son independientes.

En este ejemplo, como el p-valor = 0.2966, concluimos que no se rechaza la independencia, o

sea, que hay independencia, de modo que la fila observada para un caso particular, puede no

tener relación con su columna.

En definitiva, las notas son independientes del grupo en que esté el alumno.

Page 187: Estadística

Ejercicio 19.

Se introducen los datos de la tabla en dos columnas “Sexo” y “Futbol”, ambas Tipo Carácter.

Descripción---Datos cualitativos---Tabulación Cruzada

En Variable Fila: “Futbol”

En Variable Columna: “Sexo”

En Opciones Tabulares pedimos “Resumen del Procedimiento”

“Tabla de Frecuencias”

“Contraste Chi-Cuadrado”

En Opciones Gráficas pedimos las 3.

En la ventana de “Tabla de Frecuencias” se muestra una tabla bidimensional que muestra la

frecuencias de ocurrencias de valores únicos para “Futbol” y “Sexo”. Se muestran los

recuentos o frecuencias, por celda; también se muestran los porcentajes por filas y columnas.

En la ventana “Contraste Chi-Cuadrado” se realiza un Contraste de Hipótesis para

determinar si se rechaza o no la independencia de las dos poblaciones a partir de las

muestras.

Consideramos la Hipótesis Nula : La fila y la columna seleccionada son independientes.

En este ejemplo, como p-valor < 0.10, se concluye que “Futbol” y “Sexo” no son

independientes, hay alguna relación entre las dos variables.

Page 188: Estadística

Ejercicio 20.

Se meten los 34 datos en una columna “peso”.

Descripción---Distribuciones---Ajuste de Distribuciones (Datos no-censurados)

En Opciones Tabulares elegimos “Resumen del Análisis”

“Test para la Normalidad”

“Test de la Bondad del ajuste”

En Opciones Gráficas elegimos “Gráfico Cuantil-Cuantil”

“Histograma de Frecuencias”

En la ventana de “Test para la Normalidad” vemos que se ha considerado la Hipótesis Nula

H0 : La distribución “peso” procede de una distribución Normal. Este “Test para la Normalidad”

es mejor que el Chi-Cuadrado cuando el tamaño muestral es pequeño (inferior a 30).

Miramos el p-valor más pequeño de los que aparecen, 0.000342078, y concluimos

En la ventana de “Test de la Bondad del ajuste” vemos que se usan los contrastes

Chi-cuadrado y de Kolmogorov-Smirnov, para determinar si “peso” puede ser modelado

adecuadamente por una distribución Normal.

Nos piden contrastar el ajuste a una distribución normal y a una distribución Poisson.

Por ejemplo, para el ajuste a una distribución Poisson:

Con B.S.R., en Opciones de Análisis, se elige la distribución Poisson a ajustar a los datos.

H0 : La distribución procede de una distribución Poisson.

Miramos el p-valor más pequeño de los que aparecen, y concluimos:

O sea, podemos rechazar, al N.C. 99% que los datos procedan de una distrib. Poisson.

Con B.S.R., en Opciones de Análisis, se elige la distribución normal a quiere ajustar. Como el p-

valor más pequeño de los 3 es ≥ 0.10, no podemos rechazar que “peso” proceda de una

distribución normal, al nivel de confianza de al menos un 90%.

En la ventana de “Gráfico Cuantil-Cuantil” se compara la distribución real de los datos con la

distribución ajustada. Se contrasta visualmente la normalidad: mientras más cerca esté el

diagrama de puntos de la diagonal, mayor normalidad.

En la ventana de “Histograma de Frecuencias” se compara la distribución real de los datos

con la normal ajustada.

Page 189: Estadística

Ejercicio 21.

Para tomar una decisión sobre si hay diferencia entre los diferentes métodos, contrastaremos

la hipótesis nula H0: Hay homogeneidad entre los tres modelos,mediante el test chi-cuadrado.

Como los datos vienen dados en forma de tabla de contingencia, introduciremos los datos de

las tres columnas de la tabla, como tres columnas A, B y C, en la hoja de datos. También

introduciremos una columna carácter con los meses.

Descripción---Datos Cualitativos---Tablas de Contingencia

Introducimos las variables A, B y C en el campo “Columnas” y la variable Mes en el campo

“Etiquetas”.

En Opciones Tabulares elegimos: “Resumen del Análisis”

“Tabla de Frecuencias”

“Contraste Chi-cuadrado”

En Opciones Gráficas podemos elegir todas las opciones que aparecen.

En la ventana de “Tabla de Frecuencias”, se muestra una tabla con los recuentos y

porcentajes, por celda, por filas y por columnas.

En la ventana del “Contraste Chi-cuadrado”, vemos que se realiza un contraste de hipótesis

para determinar si se rechaza o no la idea de que filas y columnas son independientes.

En este ejercicio, como el p-valor=0.9749 es ≥ 0, entonces no se puede rechazar la hipótesis

H0 de que las filas y columnas son independientes, con lo que una fila puede no tener relación

con la columna. Por lo tanto, existe homogeneidad entre los tres métodos, al 90% de

confianza, y se puede asegurar que los tres métodos son igualmente buenos (al 90% de

confianza).

Page 190: Estadística

Ejercicio 22 Introducimos en tres columnas los datos de las marcas A, B y C. En este tipo de ejercicios hay que empezar contrastando la normalidad de las muestras, ya que los tests a utilizar suponen la normalidad de las observaciones. Así, empezamos por comprobar la normalidad de las tres muestras: A, B y C. Descripción---Distribuciones---Ajuste de Distribuciones (Datos no censurados) Empezamos el estudio con la muestra A, y después lo repetimos para las muestras B y C. En Opciones Tabulares , elegimos “Resumen del Análisis” “Test para la Normalidad” “Test de Bondad de Ajuste” En Opciones Gráficas , elegimos “Histograma de Frecuencias” “Gráfico Cuantil-Cuantil” El “Test para la Bondad de Ajuste” es mejor que el test de la normalidad para el caso de muestras de tamaño mayor que 30. El “Test para la Normalidad” se emplea para muestras de tamaño menor que 30, de modo que en este ejercicio, es el que usamos. En la ventana de “Test para la Normalidad” se muestran los resultados de varios tests para determinar si la variable A puede ser modelada adecuadamente por una distribución normal.

Observamos que el menor de los p-valores es 0.950176. Dado que este valor es ≥0.10, no podemos rechazar la hipótesis nula H0 de que la variable A proceda de una distribución normal con un Nivel de Confianza de al menos el 90%. Hacemos el mismo estudio para las variables B y C. Y concluimos que, para cada una de las variables A, B y C : Se acepta la normalidad de todas las muestras, al Nivel de Confianza del 90%.

Page 191: Estadística

A continuación se contrasta la igualdad de varianzas para las tres muestras: Comparación---Muestras múltiples---Comparación de Varias Muestras En el campo “Muestras” introducimos las variables A, B y C. En Opciones Tabulares , elegimos “Resumen del Procedimiento” “Resumen Estadístico” “Contraste de varianza” “Tabla ANOVA” En la ventana de “Resumen Estadístico” se muestran los estadísticos más importantes para cada una de las tres columnas de datos A, B y C. Con B.S.R., Opciones de Ventana, se pueden elegir más estadísticos. En la ventana de “Contraste de Varianza” la Hipótesis Nula H0 considerada es: las desviaciones típicas de las tres muestras son iguales.

El cuarto estadístico de la tabla comprueba la hipótesis nula de que la desviación típica dentro de cada una de las 3 columnas es la misma. Nos fijamos en los 3 p-valores. Como el menor de los p-valores es ≥ 0.05, entonces no hay diferencia estadísticamente significativa entre las desviaciones típicas al Nivel de Confianza del 95% (o sea, no se rechaza la hipótesis de que las varianzas son iguales, al Nivel de Confianza del 95%.) En la ventana de “Tabla ANOVA” realizamos el contraste múltiple de igualdad de medias, siendo la Hipótesis Nula considerada H0: las tres medias de las tres columnas son iguales.

Como en este caso el p-valor=0.9945 >=0.05, entonces se no se rechaza la hipótesis nula al 95% de confianza, o sea, no hay diferencia estadísticamente significativa entre las medias de las tres variables, al Nivel de Confianza del 95%. Por lo tanto, podemos concluir que las tres marcas tienen el mismo contenido medio de nicotina, al 95% de confianza.

Page 192: Estadística

PROBLEMAS

Curso: 2011/2012 Clase: Primero - Grupo: B

Page 193: Estadística

1. Estadıstica DescriptivaUnidimensional

1. En un estudio realizado sobre el habito de fumar entre el personal administrativo de cierta entidad,se ha entrevistado a 100 personas fumadoras de este colectivo y, con los datos obtenidos se haconfeccionado la siguiente tabla, donde la variable X mide el “numero de cigarrillos consumidosdiariamente”:

No cigarrillos No personas[1,4] 5(4,6] 8(6,10] 15(10,15] 35(15,20] 24(20,40] 11(40,80] 2

Obtener:

a) Frecuencias relativas y acumuladas.

b) Marcas de clase y amplitud de los intervalos.

2. En las 40 conferencias de una clase de psicologıa se anoto el numero de alumnos que estuvieronausentes. Los resultados fueron:

2 1 5 0 0 3 2 1 1 43 1 0 1 2 1 3 6 2 21 0 2 1 1 3 4 1 0 21 0 1 2 4 1 3 1 2 3

Construir la tabla de frecuencias asociada a estos datos.

3. Construir una tabla de frecuencias de los datos que siguen sobre el tiempo (en horas) que dedicaron80 estudiantes de una universidad a actividades en horas libres durante una semana comun deasistencia a clase:

1

Page 194: Estadística

23 24 18 14 20 24 24 26 23 2116 15 19 20 22 14 13 20 19 2729 22 38 28 34 32 23 19 21 3116 28 19 18 12 27 15 21 25 1630 17 22 29 29 18 25 20 16 1117 12 15 24 25 21 22 17 18 1521 20 23 18 17 15 16 26 23 2211 16 18 20 23 19 17 15 20 10

4. Los siguientes datos representan el numero de personas activas que hay en 50 familias:

2 1 2 2 1 2 4 2 1 12 3 2 1 1 1 3 4 2 22 2 1 2 1 1 1 2 2 23 2 3 1 2 4 2 1 4 11 3 4 3 2 2 2 1 3 3

Construir la tabla de frecuencias correspondiente.

5. Se dispone de la siguiente informacion sobre el gasto semanal en ocio de un grupo de estudiantesuniversitarios

Gasto semanal ni[0-10] 4

(10-20] 11(20-30] 16(30-40] 22(40-50] 8(50-60] 6

a) Calcular la distribucion de frecuencias de la variable.

b) ¿Que proporcion de individuos gasta semanalmente 30 o menos euros en ocio? ¿Que proporcionde individuos gasta semanalmente entre 20 y 40 euros? ¿Que proporcion de individuos gastasemanalmente mas de 32 euros en ocio?

6. Se realiza un estudio en una ciudad sobre la capacidad hotelera y se obtienen los siguientes resul-tados:

No plazas ni[0,10] 25

(10,30] 50(30,60] 55(60,100] 20

a) ¿Cual es la proporcion de hoteles que disponen de entre 10 y 60 plazas?

b) ¿Cuantos hoteles tienen treinta o menos plazas?

c) Calcular las marcas de clase de cada intervalo.

d) ¿Cual es la proporcion de hoteles que disponen de entre 15 y 50 plazas? ¿Que hipotesis hacepara este ultimo calculo?

2

Page 195: Estadística

1. Estadıstica descriptiva unidimensional

7. Una entidad bancaria dispone de 50 sucursales en el territorio nacional y ha observado el numerode empleados que hay en cada una de ellas para un estudio posterior. Las observaciones obtenidashan sido:

12 10 9 11 15 16 9 10 10 1112 13 14 15 11 11 12 16 17 1716 16 15 14 12 11 11 11 11 1212 12 15 13 14 16 15 18 19 1810 11 12 12 11 13 13 15 13 11

a) Calcular la distribucion de frecuencias de la variable, obteniendo las frecuencias absolutas,relativas y sus correspondientes acumuladas.

b) ¿Que proporcion de sucursales tienen mas de 15 empleados?

8. Un gabinete de trabajo esta realizando un estudio sobre la potencialidad de compra de los municipiosde una determinada region. Entre otros datos obtuvo la distribucion de la renta per capita pormunicipio, habiendose construido una tabla completa de la cual se ofrecen los siguientes datos:

Ii = (ei−1, ei] ni Ni fi Fi xi ai hi[120,300] 2 2( ,400] 8

, 0.12 100, 0.13 550, 44 0.22, 119 0.1

( ,1300] 0.11, 171 500

( ,2300] 188, 12 200 3800

Completar la tabla.

9. Obtener la media aritmetica, la moda, la mediana, los cuartiles, el decil primero y el octavo, y lospercentiles 11 y 81 de la variable X cuya distribucion es la siguiente:

xi 2 3 4 5 6 7ni 8 7 9 8 7 8

10. Dada la variable estadıstica X con la siguiente distribucion:

Ii = (ei−1 − ei] ni[0, 6] 2

(6, 16] 10(16, 18] 6(18, 22] 0(22, 28] 4

Obtener las siguientes medidas: recorrido, rango, intercuartılico, varianza, desviacion tıpica y elcoeficiente de variacion.

3

Page 196: Estadística

11. Dada la siguiente distribucion de frecuencias:

Ii = (ei−1, ei] ni[3, 5] 3(5, 7] 8(7, 9] 5(9, 11] 7(11, 13] 6

Hallar la media aritmetica, la moda, la mediana, los cuartiles, el decil segundo y el noveno, y lospercentiles 32 y 77.

12. Dada la siguiente distribucion de alquileres mensuales para una zona de Cadiz:

Alquiler mensual (euros) Frecuencia Relativa ( %)[120,180] 10(180,240] 15(240,360] 35(360,480] 10(480,720] 15(720,1200] 15

Se pide:

a) Calcular la mediana y los percentiles 20 y 70.

b) Calcular el alquiler medio mensual.

c) Calcular la moda.

13. Calcular la media, la mediana y la moda de los siguientes valores, agrupandolos, primero, porintervalos de amplitud igual a cinco y, despues, por intervalos de amplitud igual a diez:

49 48 43 42 49 41 42 43 43 44 44 51 53 54 51 59 58 57

56 54 51 54 53 64 62 64 63 62 61 62 68 68 67 66 69

14. De la distribucion de frecuencias absolutas del peso representada en la tabla, calcular:

Ii = (ei−1, ei] ni[10,12] 4(12,14] 7(14,16] 13(16,18] 10(18,20] 6

a) La media aritmetica y la desviacion tıpica.

b) ¿Entre que valores se encuentran los veinte pesos centrales?

4

Page 197: Estadística

1. Estadıstica descriptiva unidimensional

15. Completar la siguiente tabla de frecuencias:

Ii = (ei−1, ei] ni Ni fi Fi xi ai hi[20,50] 10 10 35( , 60] 14 0.112(60,70] 0.24 10( , ] 0.208 75( , ] 44 2.2(100, ] 125 50 0.5

Calcular la mediana y la moda de esta distribucion.

16. La tabla siguiente representa las frecuencias absolutas, las frecuencias absolutas acumuladas, y lasfrecuencias relativas, correspondientes a la distribucion de una variable estadıstica X:

xi ni Ni fi1 2 0.042 63 0.164 65 306 57 0.28

a) Completar los datos que faltan en la tabla.

b) Calcular la media, la moda y la desviacion tıpica de la distribucion.

17. La tabla siguiente indica la distribucion de coeficientes intelectuales de 120 alumnos:

[60,70] (70,80] (80,90] (90,100] (100,110] (110,120] (120,130] (130,140]2 3 25 46 35 5 3 1

a) Si se consideran no aptos los alumnos cuya puntuacion pertenece al grupo del 5 % de laspuntuaciones mas bajas, ¿que puntuacion maxima tiene un alumno no apto?.

b) ¿Que puntuacion mınima y maxima presentan los alumnos cuyas puntuaciones representan el50 % central de las notas?.

c) ¿Que porcentaje de alumnos presentan puntuaciones superiores a 124?.

d) ¿Y entre 92 y 114?.

18. Para incentivar la productividad de los empleados encargados del embalaje en una empresa dedicadaa la fabricacion de galletas se ha decidido:

- Aumentar el salario 90 euros a la cuarta parte de los empleados que mas paquetes hacen.

- Mantener el salario base a la mitad de los empleados que menos paquetes hacen.

- Aumentar 30 euros al resto de empleados.

5

Page 198: Estadística

En la ultima semana el numero de cajas para los 75 empleados de esta seccion fueron:

No de cajas No de empleados[350, 400] 18(400, 450] 15(450, 500] 23(500, 600] 10(600, 700] 9

¿Cual es el numero mınimo de cajas que debe realizar un empleado para recibir la bonificacion de90 euros?, ¿y para recibir alguna bonificacion?

19. Para acudir a su trabajo, un empleado puede atravesar el centro de la ciudad o circular por laautopista de circunvalacion. Durante un mes anoto los tiempos empleados por minutos al tomaruno u otro camino e hizo el siguiente estudio:

Por el centro: x = 11, σx = 2

Por la autopista: y = 11, σy = 6

¿En que ruta la media es mas representativa?

20. Realizando una prueba para el estudio de una enfermedad a 150 personas se obtuvo la siguientetabla segun la edad de los enfermos:

Edad ni[10, 30] 15(30, 40] 22(40, 50] 48(50, 60] 40(60, 90] 25

a) Calcular la edad mas comun de los individuos estudiados.

b) Calcular la edad mınima y maxima del 30 % central de los individuos.

c) Calcular el recorrido intercuartılico y la desviacion tıpica.

6

Page 199: Estadística

1. Estadıstica DescriptivaUnidimensional

1. Sea X: no de cigarrillos consumidos diariamente:

a) Frecuencias relativas y acumuladas. Columnas 3-5 de la siguiente tabla.

b) Marcas de clase y amplitud de los intervalos. Columnas 6-7 de la siguiente tabla.

Ii ni fi Ni Fi xi ai[1,4] 5 0.05 5 0.05 2.5 3(4,6] 8 0.08 13 0.13 5 2(6,10] 15 0.15 28 0.28 8 4(10,15] 35 0.35 63 0.63 12.5 5(15,20] 24 0.24 87 0.87 17.5 5(20,40] 11 0.11 98 0.98 30 20(40,80] 2 0.02 100 1 60 40

2. Sea X: no de alumnos que estuvieron ausentes:

Tabla de frecuencias:

xi ni fi Ni Fi0 6 0.15 6 0.151 14 0.35 20 0.502 9 0.225 29 0.7253 6 0.15 35 0.8754 3 0.075 38 0.955 1 0.025 39 0.9756 1 0.025 40 1

3. Sea X: tiempo en horas que dedican los estudiantes de una universidad a actividades en horas libres:

Tabla de frecuencias:

Ii ni fi Ni Fi xi ai[8,12] 5 0.0625 5 0.0625 10 4

(12,16] 15 0.1875 20 0.25 14 4(16,20] 23 0.2875 43 0.5375 18 4(20,24] 20 0.25 63 0.7875 22 4(24,28] 9 0.1125 72 0.9 26 4(28,32] 6 0.075 78 0.975 30 4(32,36] 1 0.0125 79 0.9875 34 4(36,40] 1 0.0125 80 1 38 4

1

Page 200: Estadística

4. Sea X: no de personas activas en un grupo de familias:

Tabla de frecuencias:

xi ni fi Ni Fi1 16 0.32 16 0.322 21 0.42 37 0.743 8 0.16 45 0.94 5 0.1 50 1

5. Sea X: gasto semanal en ocio de un grupo de estudiantes universitarios:

a) Tabla de frecuencias:

Ii ni fi Ni Fi xi ai[0,10] 4 0.0597 4 0.0597 5 10

(10,20] 11 0.1642 15 0.2239 15 10(20,30] 16 0.2388 31 0.4627 25 10(30,40] 22 0.3284 53 0.7911 35 10(40,50] 8 0.1194 61 0.9105 45 10(50,60] 6 0.0896 67 1 55 10

b) Hay un 46.27 % de individuos que gasta semanalmente 30 o menos euros en ocio. Hay un56.72 % de individuos que gasta semanalmente entre 20 y 40 euros en ocio. Hay un 47.17 % deindividuos que gasta semanalmente mas de 32 euros en ocio.

6. Sea X: capacidad hotelera: Tabla de frecuencias:

Ii ni fi Ni Fi xi ai[0,10] 25 0.1667 25 0.1667 5 10

(10,30] 50 0.3333 75 0.5 20 20(30,60] 55 0.3667 130 0.8667 45 30(60,100] 20 0.1333 150 1 80 40

a) Hay un 70 % de hoteles que disponen entre 10 y 60 plazas.

b) Hay 75 hoteles que tienen 30 o menos plazas.

c) Las marcas de clase estan en la columna 6.

d) 15200,3333 + 20

300,3667 = 0,4944

Hay un 49.44 % de hoteles que tienen entre 15 y 50 plazas. Se consideran que dentro de losintervalos las observaciones se reparten linealmente.

2

Page 201: Estadística

1. Estadıstica descriptiva unidimensional

7. Sea X: no de empleados que hay en una serie de sucursales:

a) Tabla de frecuencias:

xi ni fi Ni Fi9 2 0.04 2 0.0410 4 0.08 6 0.1211 11 0.22 17 0.3412 9 0.18 26 0.5213 5 0.1 31 0.6214 3 0.06 34 0.6815 6 0.12 40 0.816 5 0.1 45 0.917 2 0.04 47 0.9418 2 0.04 49 0.9819 1 0.02 50 1

b) Hay un 20 % de sucursales que tienen mas de 15 empleados.

8. Completar la tabla

Ii = (ei−1, ei] ni Ni fi Fi xi ai hi[120,300] 2 2 0.01 0.01 210 180 0.0111(300,400] 6 8 0.03 0.04 350 100 0.06(400,500] 16 24 0.08 0.12 450 100 0.16(500,600] 26 50 0.13 0.25 550 100 0.26(600,800] 44 94 0.22 0.47 700 200 0.22(800,1050] 25 119 0.125 0.595 925 250 0.1(1050,1300] 22 141 0.11 0.705 1175 250 0.088(1300,1800] 30 171 0.15 0.855 1550 500 0.06(1800,2300] 17 188 0.085 0.94 2050 500 0.034(2300,5300] 12 200 0.06 1 3800 3000 0.004

9. Sea X:

xi ni fi Fi2 8 0.1702 0.17023 7 0.1489 0.31914 9 0.1915 0.51065 8 0.1705 0.68116 7 0.1489 0.837 8 0.1705 1

a) x = 4,4894

b) Mo = 4

c) Me = 4

d) Q1 = 3, Q2 = 4 y Q3 = 6

e) D1 = 2 y D8 = 6

f ) P11 = 2 y P81 = 6

3

Page 202: Estadística

10. Sea X:

Ii ni fi Fi xi ai[0,6] 2 0.0909 0.0909 3 6

(6,16] 10 0.4545 0.5454 11 10(16,18] 6 0.2727 0.8181 17 2(18,22] 0 0 0.8181 20 4(22,28] 4 0.1818 1 25 6

a) Rango = 28

b) Q1 ∈ (6, 16], Q1 = 6 + 0,25−0,09090,4545 10 = 9,5006

Q3 ∈ (16, 18], Q3 = 16 + 0,75−0,54540,2727 2 = 17,5006

RIQ = 17,5006− 9,5006 = 8

c) σ2 = 39,3388, σ = 6,2721, CV = 6,272114,4545 = 0,4339

11. Sea X:

Ii ni fi Fi xi ai[3,5] 3 0.1034 0.1034 4 2(5,7] 8 0.2759 0.3793 6 2(7,9] 5 0.1724 0.5517 8 2(9,11] 7 0.2414 0.7931 10 2(11,13] 6 0.2069 1 12 2

Media: x = 8,3448

Moda: IMo = (5, 7], Mo = 5 + 8−3(8−3)+(8−5)2 = 6,25

Mediana: IMe = (7, 9], Me = 7 + 0,5−0,37930,1724 2 = 8,4002

Primer cuartil: Q1 ∈ (5, 7], Q1 = 5 + 0,25−0,10340,2759 2 = 6,0627

Tercer cuartil: Q3 ∈ (9, 11], Q3 = 9 + 0,75−0,55170,2414 2 = 10,6429

Decil segundo: D2 ∈ (5, 7], D2 = 5 + 0,2−0,10340,2759 2 = 5,7003

Decil noveno: D9 ∈ (11, 13], D9 = 11 + 0,9−0,79310,2069 2 = 12,0333

Percentil 32: P32 ∈ (5, 7], P32 = 5 + 0,32−0,10340,2759 2 = 6,5701

Percentil 77: P77 ∈ (9, 11], P77 = 9 + 0,77−0,55170,2414 2 = 10,8086

12. Sea X: alquiler mensual para una zona de Cadiz

Ii fi Fi xi ai hi xifi[120,180] 0.10 0.10 150 60 0.0017 15(180,240] 0.15 0.25 210 60 0.0025 31.5(240,360] 0.35 0.6 300 120 0.0029 105(360,480] 0.10 0.7 420 120 0.0008 42(480,720] 0.15 0.85 600 240 0.0006 90(720,1200] 0.15 1 960 480 0.0003 144

a) Mediana: IMe = (240, 360], Me = 240 + 0,5−0,250,35 120 = 325,7143 euros

4

Page 203: Estadística

1. Estadıstica descriptiva unidimensional

Percentil 20: P20 ∈ (180, 240], P20 = 180 + 0,2−0,100,15 60 = 220 euros

Percentil 70: P70 ∈ (360, 480], P70 = 480 euros

b) Alquiler medio: x = 427,5 euros

c) Moda: IMo = (240, 360], Mo = 240 + 0,0029−0,0025(0,0029−0,0025)+(0,0029−0,0008)120 = 259,2 euros

13. Considerando intervalos de amplitud igual a 5.

Ii ni xi fi Fi ai hi[40,45] 8 42.5 0.2286 0.2286 5 1.6(45,50] 3 47.5 0.0857 0.3143 5 0.6(50,55] 8 52.5 0.2286 0.5429 5 1.6(55,60] 4 57.5 0.1143 0.6572 5 0.8(60,65] 7 62.5 0.2 0.8572 5 1.4(65,70] 5 67.5 0.1429 1 5 1

a) Media x = 54,5

b) Mediana: IMe = (50, 55], Me = 50 + 0,5−0,31430,2286 5 = 54,0617

c) Moda: IMo = (40, 45], Mo = 40 + 1,6−0(1,6−0)+(1,6−0,6)5 = 43,0769

IMo = (50, 55], Mo = 50 + 1,6−0,6(1,6−0,6)+(1,6−0,8)5 = 52,7778

Considerando intervalos de amplitud igual a 10.

Ii ni xi fi Fi ai hi[40,50] 11 45 0.3143 0.3143 10 1.1(50,60] 12 55 0.3429 0.6572 10 1.2(60,70] 12 65 0.3429 1 10 1.2

a) Media x = 55,2857

b) Mediana: IMe = (50, 60], Me = 50 + 0,5−0,31430,3429 10 = 55,4167

c) Moda: IMo = (50, 60], Mo = 50 + 1,2−1,1(1,2−1,1)+(1,2−1,2)10 = 60

IMo = (60, 70], Mo = 60 + 1,2−1,2(1,2−1,2)+(1,2−0)10 = 60

14. Sea X: peso

Ii ni fi Fi ai[10,12] 4 0.1 0.1 2(12,14] 7 0.175 0.275 2(14,16] 13 0.325 0.6 2(16,18] 10 0.25 0.85 2(18,20] 6 0.15 1 2

a) Media: x = 15,35; desviacion tıpica: σ = 2,3617

b) Hay 40 observaciones, por lo que los 20 pesos centrales corresponderan con los cuartiles primeroy tercero.

Primer cuartil: Q1 ∈ (12, 14], Q1 = 12 + 0,25−0,10,175 2 = 13,7143

Tercer cuartil: Q3 ∈ (16, 18], Q3 = 16 + 0,75−0,60,25 2 = 17,2

Los veinte pesos centrales se encuentran entre los valores (13.7143, 17.2)

5

Page 204: Estadística

15. Completar la tabla:

Ii = (ei−1, ei] ni Ni fi Fi xi ai hi[20,50] 10 10 0.08 0.08 35 30 0.3333(50,60] 4 14 0.032 0.112 55 10 0.4(60,70] 16 30 0.128 0.24 65 10 1.6(70,80] 26 56 0.208 0.448 75 10 2.6(80,100] 44 100 0.352 0.8 90 20 2.2(100,150] 25 125 0.2 1 125 50 0.5

Mediana: IMe = (80, 100], Me = 80 + 0,5−0,4480,352 20 = 82,9545

Moda: IMo = (70, 80], Mo = 70 + (2,6−1,6)(2,6−1,6)+(2,6−2,2)10 = 77,1429

16. a) Completar la tabla:

xi ni Ni fi1 2 2 0.042 4 6 0.083 8 14 0.164 6 20 0.125 10 30 0.206 5 35 0.107 10 45 0.28 5 50 0.10

b) Media: x = 4,96

Desviacion tıpica: σ = 1,9795

Moda: 5 y 7, porque los dos valores tienen igual frecuencia absoluta maxima igual a 10.

17. Sea X: coeficiente intelectual

Ii ni fi Fi ai[60,70] 2 0.0167 0.0167 10(70,80] 3 0.025 0.0417 10(80,90] 25 0.2083 0.25 10(90,100] 46 0.3833 0.6333 10(100,110] 35 0.2917 0.925 10(110,120] 5 0.0417 0.9667 10(120,130] 3 0.025 0.9917 10(130,140] 1 0.0083 1 10

a) La puntuacion maxima de un alumno no apto sera el P5

P5 ∈ (80, 90], P5 = 80 + 0,05−0,0417,2083 10 = 80,3985

b) El 50 % central de las notas estara entre los cuartiles primero y tercero.

Primer cuartil: Q1 = 90

Tercer cuartil: Q3 ∈ (100, 110], Q3 = 100 + 0,75−0,63330,2917 10 = 104,0007

c) 0,025 610 + 0,0083 = 0,0233, un 2,33 %.

d) 0,3833 810 + 0,2917 + 0,0417 4

10 = 0,6150. Un 61,5 %.

6

Page 205: Estadística

1. Estadıstica descriptiva unidimensional

18. Sea X: no de cajas embaladas

Ii ni fi Fi ai[350,400] 18 0.24 0.24 50(400,450] 15 0.2 0.44 50(450,500] 23 0.3067 0.7467 50(500,600] 10 0.1333 0.88 100(600,700] 9 0.12 1 100

Los empleados que recibiran la bonificacion de 90 euros, son los que se encuentran en el tercercuartil.

Tercer cuartil: Q3 ∈ (500, 600], Q3 = 500 + 0,75−0,74670,1333 100 = 502,4756

Entonces, recibiran la bonificacion los empleados que embalen al menos 503 cajas.

Recibiran alguna bonificacion la mitad de los empleados. Por tanto, calculamos la mediana.

Mediana: IMe = (450, 500], Me = 450 + 0,5−0,440,3067 50 = 459,7815. Todo empleado que embale

mas de 459 cajas recibira una bonificacion.

19. La media sera mas representativa en la ruta que tenga menor coeficiente de variacion.

Por el centro: CVc = 211 = 0,1818

Por la autopista: CVa = 611 = 0,5455

Luego, la media es mas representativa por el centro.

20. Sea X: edad de los enfermos.

Ii = (ei−1, ei] ni fi Fi xi ai hi[10,30] 15 0.1 0.1 20 20 0.75(30,40] 22 0.1467 0.2467 35 10 2.2(40,50] 48 0.32 0.5667 45 10 4.8(50,60] 40 0.2667 0.8334 55 10 4(60,90] 25 0.1667 1 75 30 0.8333

a) Moda: IMo = (40, 50], Mo = 40 + 4,8−2,2(4,8−2,2)+(4,8−4)10 = 47,6471

b) El 30 % central de los individuos tendran unas edades que estaran comprendidas entre elpercentil 35 y 65.

Percentil 35: P35 ∈ (40, 50], P35 = 40 + 0,35−0,24670,32 10 = 43,2281

Percentil 65: P65 ∈ (50, 60], P65 = 50 + 0,65−0,56670,2667 10 = 53,1234

c) Primer cuartil: Q1 ∈ (40, 50], Q1 = 40 + 0,25−0,24670,32 10 = 40,1031

Tercer cuartil: Q3 ∈ (50, 60], Q3 = 50 + 0,75−0,56670,2667 10 = 56,8729

RIQ = 56.8729-40.1031 = 16.7698

Desviacion tıpica: σ = 15,4966

7

Page 206: Estadística

2. Estadıstica DescriptivaBidimensional

1. Los gastos telefonicos en euros, en invierno (X) y verano (Y ), de una serie de familias se indican acontinuacion.

X \ Y [100, 250] (250, 400] (400, 550][100, 250] 75 42 12(250, 400] 41 90 25(400, 550] 11 31 46

Se pide:

a) Calcular las frecuencias, las medias y varianzas marginales de los consumos en invierno yverano.

b) Calcular la distribucion condicionada del consumo en los meses de invierno cuando en el veranose consume una cantidad igual o menor de 400 euros, ası como la media y varianza de estadistribucion.

c) ¿Cual es el porcentaje de personas que gastan mas de 400 euros en invierno y en verano?

d) ¿Cual es el porcentaje de personas que gastan menos de 300 euros en invierno, si en veranohan gastado mas de 400?

2. En una clınica se pregunta a cincuenta pacientes por el numero de dıas que llevan ingresados (X)y el numero de veces que sus familiares les han visitado (Y ), obteniendose la siguiente tabla:

X \ Y 0 1 2 3 4 5 61 1 2 1 0 0 0 02 0 2 3 5 0 0 03 6 10 8 1 1 3 14 0 0 1 3 0 2 0

Se pide:

a) ¿Cual es el numero medio de dıas que los pacientes estan ingresados?

b) ¿Cual es el numero de veces que van la mayorıa de los familiares a ver a los pacientes?

c) ¿Cual es el numero medio de visitas que reciben los pacientes que estan ingresados mas de 2dıas?

d) Calcular la covarianza de estas variables.

7

Page 207: Estadística

3. Se ha medido la capacidad pulmonar (X) y el perımetro toraxico (Y ) a 20 atletas, obteniendose lossiguientes resultados:

X \ Y [1, 1.10] (1.10, 1.40] (1.40, 1.70] (1.70, 1.80][1.80, 1.85] 3 1 0 1(1.85, 1.90] 0 1 1 2

(1.90, 2] 1 0 0 3(2, 2.30] 1 0 1 5

Se pide:

a) Obtener la distribucion marginal de la variable X.

b) ¿Cuantos atletas tienen una capacidad pulmonar mayor de 2 y un perımetro toraxico mayorde 1.40?

c) ¿Cual es el capacidad media pulmonar de los atletas que tienen un perımetro toraxico inferiora 1.40?

d) Calcular la covarianza de estas variables.

4. Dada la siguiente tabla, donde X representa el peso (en kgs) e Y la altura (en cms) de un grupode ninos:

X \ Y [90, 100] (100, 120] (120, 140][10, 15] 6 3 1(15, 20] 5 10 2(20, 25] 4 1 7(25, 30] 2 2 4

Se pide:

a) ¿Cual es el peso mas frecuente?

b) Entre los ninos que miden menos de 120 cm, calcular el peso mınimo del 30 % de los ninos conmas peso.

c) Entre los ninos que pesan entre 15 y 25 kg, calcular el porcentaje que presentan una alturainferior a 117 cm.

5. Se han obtenido los siguientes datos en una determinada ciudad donde se relaciona la tension delvapor de agua (Y ), con la temperatura (X) en oC.

X \ Y [0.5, 1.5] (1.5, 2.5] (2.5, 5.5][1, 15] 4 2 0

(15, 25] 1 4 2(25, 30] 0 3 5

Se pide:

a) ¿Cual es la temperatura que con mayor frecuencia se ha alcanzado cuando la tension de vaporde agua es superior a 1.5?

b) Decidir que variable es mas homogenea, si la de la tension de vapor de agua cuando la tempe-ratura es inferior o igual a 15oC o la de la tension de vapor de agua cuando la temperatura essuperior a 15oC.

8

Page 208: Estadística

2. Estadıstica descriptiva bidimensional

c) ¿Cual es la mınima tension de vapor de agua del 40 % de las tensiones mas altas?

d) ¿Son independientes estas variables?

6. El gerente de una empresa afirma que los empleados jovenes trabajan mas horas extras que losadultos. Segun la base de datos, se tiene la siguiente informacion:

X \ Y [18,35] (35,55] (55,70][0,5] 20 3 12

(5,10] 8 4 3(10,15] 6 2 7(15,20] 14 8 8

donde X representa el numero de horas extra en un determinado mes e Y representa los grupos deedad.

a) ¿Cual es el numero total de horas extraordinarias que trabajan los jovenes de 18 a 35 anos enun mes?

b) ¿Cual es el numero total de horas extraordinarias que trabajan los adultos de 55 a 70 anos enun mes?

c) ¿Cual es el numero medio de horas extraordinarias al mes que trabajan los jovenes de 18 a 35anos?

d) ¿Cual es el numero medio de horas extraordinarias al mes que trabajan los adultos de 55 a 70anos?

e) ¿Que grupo de edad trabaja mas numero de horas extraordinarias en esta empresa?

f ) ¿Cual es el numero medio de horas extra que trabaja cualquier trabajador en esta empresa?

g) ¿Es cierta la afirmacion que hace el gerente de la empresa?

7. Se estudia el numero de anos (X) de experiencia en cierta empresa y el salario mensual (Y ) queperciben los trabajadores. Los resultados obtenidos son los siguientes:

Y \X [5,10] (10,15] (15,25] (25,35][600,1200] 21 6 5 3

(1200,1500] 17 9 8 5(1500,2000] 6 12 16 9(2000,3000] 2 8 12 18

a) Calcular el sueldo medio de los trabajadores que llevan menos de 15 anos en la empresa.

b) Calcular el sueldo mas frecuente de los trabajadores que llevan mas de 15 anos en esa empresa.

c) Calcular el sueldo maximo que perciben el 50 % de los trabajadores que menos cobran de estaempresa.

d) Calcular el sueldo mınimo que cobra el 20 % de los trabajadores que mas cobra en la empresa.

e) ¿Es mas homogenea la distribucion de los salarios de los que llevan mas de 25 anos en laempresa que la distribucion de los salarios de los que llevan menos de 10 anos?

f ) Calcular el salario medio de los trabajadores de la empresa.

9

Page 209: Estadística

8. En un estudio sobre la resistencia de un cierto tipo de componente se selecciona una muestrade componentes construidas con diferentes concentraciones de un metal y se anota el numero depruebas de resistencia necesarias hasta que se rompen, obteniendose los siguientes resultados:

X \ Y [25,55] (55,65] (65,95]5 4 2 210 1 4 015 5 2 0

donde X representa la concentracion del metal e Y el numero de pruebas antes de la ruptura.

a) ¿Que distribucion es mas homogenea con respecto a su valor medio?

b) ¿Cual es el numero medio de pruebas necesarias hasta romper las componentes? ¿Y el masfrecuente?

c) ¿Que numero mınimo de pruebas requieren el 50 % de las componentes mas resistentes antesde romperse?

d) De entre las componentes con una concentracion superior a 5, calcular el porcentaje de estasque necesitan 50 pruebas o menos para romperse.

9. Segun un estudio, la distribucion de las ventas de cierto artıculo segun el numero de minutos queaparece su publicidad en television, es la siguiente:

X \ Y [12,35] (35,60] (60,120][0,2] 2 1 4(2,5] 6 3 12(5,10] 4 2 8

donde Y representa el numero de minutos al dıa que aparece la publicidad en television y Xrepresenta el numero de artıculos vendidos en una ciudad.

a) Calcular las medias de las ventas para cada uno de los intervalos de tiempo de publicidad.

b) ¿Es independiente el numero de ventas de la publicidad en este caso?

10. Dada la siguiente distribucion bidimensional:

X \ Y 2 4 5 71 4 5 7 92 2 4 8 123 1 3 4 64 1 2 2 3

a) Calcular la covarianza y el coeficiente de correlacion entre X e Y .

b) Calcular la recta de regresion de X sobre Y y la de Y sobre X.

c) Si representaramos graficamente las dos rectas en el mismo eje. ¿Se cortarıan en algun puntolas rectas?

d) Para un valor de la variable X = 5, ¿cuanto vale Y segun la recta de regresion?

e) Para un valor de la variable Y = 6, ¿cuanto vale X segun la recta de regresion?

10

Page 210: Estadística

2. Estadıstica descriptiva bidimensional

11. Las calificaciones obtenidas por 10 alumnos en el examen parcial y final de Estadıstica son:

X - Parcial 5 8 6 9 2 3 1 2 4 7Y - Final 6 6 5 8 1 4 2 1 5 8

a) Calcular el coeficiente de correlacion lineal de Pearson e interpretarlo.

b) Calcular la recta de regresion de Y sobre X y la recta de regresion de X sobre Y .

12. En una distribucion bidimensional de frecuencias unitarias se conoce:

i) Los valores de Y : 3, 5, 10, 12.

ii) La recta de regresion de X/Y : 2x+ y − 7 = 0.

iii) El coeficiente de determinacion: R2 =0.81.

Calcular la ecuacion de la recta de regresion de Y/X.

13. Una variable estadıstica bidimensional tiene las siguientes rectas de regresion:

3x− 4y + 6 = 0 3x− y − 3 = 0

Calcular las medias de X e Y y el coeficiente de correlacion lineal.

14. Se consideran 50 establecimientos de alimentacion del mismo tipo, atendiendo a dos factores, tiempoque llevan funcionando (X, en anos) y beneficio anual (Y , en millones de euros).

Y \X [0,5] (5,10] (10,15] (15,20][0,1] 0 2 8 10(1,3] 2 4 4 3(3,4] 5 4 6 2

a) Dar una prediccion del beneficio anual para un establecimiento con 12 anos de antiguedad.

b) Calcular la varianza residual.

15. El valor promedio de las acciones en un grupo de inmobiliarias y en un grupo de bancos en los anos1980-1989 aparecen en la siguiente tabla

X = Promedio del precio de las acciones inmobiliarias

Y = Promedio del precio de las acciones de bancos

Ano 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989X 3.5 4 4.2 4.3 4 5.3 5.3 4.9 4 5.5Y 10.2 10.1 9.7 9.8 9.8 10 9.7 9.1 9.5 9.5

a) Calcular el coeficiente de correlacion lineal.

b) En el supuesto de que se tengan acciones inmobiliarias, ¿que le ocurrira al valor de las accionessi se sabe que las acciones de los bancos aumentaran su valor? ¿En que medida es fiable laanterior estimacion?

11

Page 211: Estadística

16. En 100 Ha. de tierra se han recogido datos sobre la produccion de trigo (X) y cantidad de abonoempleada (Y ) por Ha.

X \ Y [80,100] (100,120] (120,140][16,20] 20 0 0(20,24] 10 30 20(24,28] 0 5 15

a) ¿Existe alguna relacion lineal entre las variables?.

b) Dar una prediccion de la produccion por Ha. para una cantidad empleada de 110 kg. de abono.

17. Un psicologo afirma, en base a los datos obtenidos, que a medida que el nino crece menores son lasrespuestas inadecuadas que da en el transcurso de una situacion experimental:

Edad 2 3 4 4 5 5 6 7 7 9 9 10 11 11 12No resp 11 12 10 13 11 9 10 7 12 8 7 3 6 5 5

Se pide:

a) Determinar la validez de esta conclusion.

b) Alberto, de diez anos y medio, participa en el experimento, ¿cual es el numero de respuestasinadecuadas que se puede predecir para el?

18. Dadas las rectasy = 1 + 2x, x = 10 + 5y

Justificar si es posible que sean las rectas de regresion de Y/X y de X/Y , respectivamente, de unmisma distribucion bidimensional.

19. Sea la distribucion unidimensional

xi 3 5 8 9ni 5 1 2 1

que es una marginal de la bidimensional (X,Y ), de la que se conoce∑

j y2jn.j = 3240, y la ecuacion

y = 5x− 20.

a) Determinar la recta de regresion de X/Y .

b) Estudiar la bondad de ajuste lineal.

c) Obtener la varianza de la variable dependiente, ası como la descomposicion en varianza expli-cada y varianza residual.

20. Un hipermercado ha decidido ampliar el negocio. Decide estudiar de forma exhaustiva el numero decajas registradoras que va a instalar, para evitar grandes colas. Para ello, se obtuvieron los siguientesdatos procedentes de otros establecimientos similares acerca del numero de cajas registradoras (X)y del tiempo medio de espera (Y ).

X 10 12 14 12 18 20Y 59 51 42 32 26 22

Bajo el supuesto de que el tiempo de espera medio depende linealmente del numero de cajasregistradoras se pretende saber:

a) ¿Como varıa el tiempo medio de espera por cada unidad de caja adicional?

b) Si se instalaran 17 cajas registradoras, ¿cual serıa el tiempo medio de espera? ¿Es fiable dichodato?

12

Page 212: Estadística

2. Estadıstica DescriptivaBidimensional

1. Sea X: gastos telefonicos en euros en invierno e Y : gastos telefonicos en euros en verano.

a) Distribucion marginal de X.

X ni· xi[100,250] 129 175(250,400] 156 325(400,550] 88 475

Media marginal de X: x = 308,5121 euros y varianza marginal de X: σ2x = 12817,9603

Distribucion marginal de Y .

Y n·j yj[100,250] 127 175(250,400] 163 325(400,550] 83 475

Media marginal de Y : y = 307,3056 euros y varianza marginal de Y : σ2y = 12354,4696

b) Distribucion condicionada de X|Y ≤ 400.

X|Y ≤ 400 ni|j xi[100,250] 117 175(250,400] 131 325(400,550] 42 475

290

Media condicionada de X|Y ≤ 400: x = 286,2069 euros

Varianza condicionada de X|Y ≤ 400: σ2x = 10831,3020

c) 46373 = 0,1233. Un 12.33 % gastan mas de 400 euros en verano y en invierno.

d) Distribucion condicionada de X|Y > 400.

X|Y > 400 ni|j ai fi[100,250] 12 150 0.1446(250,400] 25 150 0.3012(400,550] 46 150 0.5542

83

0,1446 + 501500,3012 = 0,245, un 24.5 % gastan menos de 300 euros en invierno, si en verano

han gastado mas de 400 euros.

9

Page 213: Estadística

2. Sea X: no de dıas que los pacientes llevan ingresados e Y : no de veces que sus familiares han visitadoal paciente.

a) Para calcular el numero medio de dıas que los pacientes estan ingresados, hay que obtener lamedia marginal de la variable X.

xi ni·1 42 103 304 6

x = 1N

∑ki=1 ni·xi = 2,76 dıas

b) El numero de veces que van la mayorıa de los familiares a ver a los pacientes es la moda de lavariable marginal Y .

yj n·j0 71 142 133 94 15 56 1

Moy = 1 dıa. La modalidad que tiene mayor frecuencia absoluta.

c) El numero mediano de visitas que reciben los pacientes que estan ingresados mas de 2 dıas, loobtenemos calculando la mediana de la variable condicionada Y |X > 2.

yj nj|i fj Fj0 6 0.1667 0.16671 10 0.2778 0.44452 9 0.25 0.69453 4 0.1111 0.80564 1 0.0278 0.83345 5 0.1389 0.97236 1 0.0278 1

36

Me = 2 visitas (valor que Fj > 0,5). La mitad de los pacientes que estan ingresados mas de 2dıas reciben menos de 2 visitas y la otra mitad mas de 2 visitas.

d) Covarianza.

σxy =1

N

k∑i=1

p∑j=1

nijxiyj − xy =296

50− 2,76 ∗ 2,04 = 0,2896

.

La σxy > 0, lo que indica que las variables varıan en el mismo sentido, es decir, que a mayorno de dıas ingresados, mayor es el no de visitas que reciben.

10

Page 214: Estadística

2. Estadıstica descriptiva bidimensional

3. Sea X: capacidad pulmonar e Y : perımetro toraxico de 20 atletas.

a) Distribucion marginal de X.

X ni·[1.80, 1.85] 5(1.85, 1.90] 4

(1.90, 2] 4(2, 2.3] 7

b) 6 atletas

c) Capacidad media pulmonar de los atletas que tienen un perımetro toraxico inferior a 1.40:

X|Y ≤ 1,40 ni|j xi[1.80, 1.85] 4 1.825(1.85, 1.90] 1 1.875

(1.90, 2] 1 1.95(2, 2.3] 1 2.15

x = 1,8964

d) σxy = 59,7237520 − 1,97375 ∗ 1,505 = 0,0157

4. Sea X: peso (en kgs) e Y : altura (en cms).

a) Peso mas frecuente.

X ni· ai[10,15] 10 5(15,20] 17 5(20,25] 12 5(25,30] 8 5

Mox ∈ (15, 20], Mo = 15 + 17−10(17−10)+(17−12)5 = 17,9167 kgs

b)

X|Y < 120 ni|j fi Fi ai[10,15] 9 0.2727 0.2727 5(15,20] 15 0.4545 0.7272 5(20,25] 5 0.1515 0.8787 5(25,30] 4 0.1212 1 5

33

P70 ∈ (15, 20], P70 = 15 + 0,7−0,27270,4545 5 = 19,7008 kgs

c)

Y |15 < X < 25 nj|i fj ai[90,100] 9 0.3103 5

(100,120] 11 0.3793 5(120,140] 9 0.3103 5

29

0,3103 + 17200,3793 = 0,6327. Entre los ninos que pesan entre 15 y 25 kgs, presentan una altura

inferior a 117 cms, el 63,27 %.

11

Page 215: Estadística

5. Sea X: temperatura en oC e Y : tension de vapor.

a) Moda de X|Y > 1,5

X|Y > 1,5 ni|j aj hj[1,15] 2 14 0.1429

(15,25] 6 10 0.6(25,30] 8 5 1.6

16

IMo = (25, 30], Mo = 25 + 1,6−0,6(1,6−0,6)+(1,6−0)5 = 26,9231 oC

b) Comparar la homogeneidad entre dos distribuciones condicionadas.

Y |X < 15 nj|i yj[0.5,1.5] 4 1(1.5,2.5] 2 2(2.5,5.5] 0 4

6

Y |X ≥ 15 nj|i yj[0.5,1.5] 1 1(1.5,2.5] 7 2(2.5,5.5] 7 4

15

yx<15 = 1,3333, σy|x<15 = 0,4714, CVy|x<15 = 0,3536

yx>15 = 2,8667, σy|x>15 = 1,0873, CVy|x>15 = 0,3793

Es mas homogenea la variable tension de vapor de agua cuando la temperatura es inferior a15 oC.

c) Percentil 60 de la variable Y .

Y n·j fj Fj[0.5,1.5] 5 0.2381 0.2381(1.5,2.5] 9 0.4286 0.6667(2.5,5.5] 7 0.3333 1

21 1

P60 ∈ (1,5, 2,5], P60 = 1,5 + 0,6−0,23810,4286 1 = 2,3444

d) Comprobamos si nij =ni·n·jN

Para la primera frecuencia de la tabla 4 6= 6∗521 , luego X e Y no son estadısticamente indepen-

dientes.

6. Sea X: no de horas extras e Y : grupo de edad.

a) Jovenes de 18 a 35 anos:

X|18 < Y < 35 ni|j xi[0,5] 20 2.5

(5,10] 8 7.5(10,15] 6 12.5(15,20] 14 17.5

48

No total de horas extraordinarias que trabajan los jovenes:∑ki=1 ni|jxi = 430 horas.

12

Page 216: Estadística

2. Estadıstica descriptiva bidimensional

b) Adultos de 55 a 70 anos:

X|55 < Y < 70 ni|j xi[0,5] 12 2.5

(5,10] 3 7.5(10,15] 7 12.5(15,20] 8 17.5

30

No total de horas extraordinarias que trabajan los jovenes:∑ki=1 ni|jxi = 280 horas.

c) No medio de horas extraordinarias que trabajan los jovenes: x = 8,9583 horas.

d) No medio de horas extraordinarias que trabajan los adultos: x = 9,3333 horas.

e) Adultos de 35 a 55 anos:

X|35 < Y < 55 ni|j xi[0,5] 3 2.5

(5,10] 4 7.5(10,15] 2 12.5(15,20] 8 17.5

17

No total de horas extraordinarias que trabajan el segundo grupo de trabajadores:∑ki=1 ni|jxi =

202,5 horas. El grupo de jovenes, es el grupo que mas horas extraordinarias trabaja.

f ) No medio de horas extraordinarias que trabaja cualquier trabajador:

X ni xi[0,5] 35 2.5

(5,10] 15 7.5(10,15] 15 12.5(15,20] 30 17.5

95

x = 9,6052 horas.

g) Si se considera el total de horas que trabaja el grupo completo sı. Pero en media el grupo detrabajadores entre 30 y 55 anos son los que mas horas extraordinarias realizan.

7. Sea X: no de anos de experiencia en cierta empresa e Y : el salario mensual, que perciben un grupode trabajadores.

a) Media de Y |X < 15.

Y |X < 15 nj|i yj[600,1200] 27 900

(1200,1500] 26 1350(1500,2000] 18 1750(2000,3000] 10 2500

81

y = 1430,8642 euros.

13

Page 217: Estadística

b) Moda de Y |X > 15.

Y |X > 15 nj|i aj hj[600,1200] 8 600 0.0133

(1200,1500] 13 300 0.0433(1500,2000] 25 500 0.05(2000,3000] 30 1000 0.03

76

IMo = (1500, 2000], Mo = 1500 + 0,05−0,0433(0,05−0,0433)+(0,05−003)500 = 1625,44682 euros

c) Mediana de Y .

Y n·j fj Fj[600,1200] 35 0.2229 0.2229

(1200,1500] 39 0.2484 0.4713(1500,2000] 43 0.2739 0.7452(2000,3000] 40 0.2548 1

157

IMe = (1500, 2000], Me = 1500 + 0,5−0,47130,2739 500 = 1552,3914 euros

d) Percentil 80 de Y . P80 = (2000, 2500], P80 = 2000 + 0,8−0,74520,2548 1000 = 2215,0706 euros

e) Comparar la homogeneidad entre dos distribuciones condicionadas.

Y |X < 10 nj|i yj[600,1200] 21 900

(1200,1500] 17 1350(1500,2000] 6 1750(2000,3000] 2 2500

46

Y |X > 25 nj|i yj[600,1200] 3 900

(1200,1500] 5 1350(1500,2000] 9 1750(2000,3000] 18 2500

81

yx<10 = 1246,7391, σy|x<10 = 400,1905, CVy|x<10 = 0,321

yx>25 = 2005,7143, σy|x>25 = 555,5912, CVy|x>25 = 0,277

Es mas homogenea la distribucion de los salarios de los que llevan mas de 25 anos en la empresa.

f ) Media de Y .

y = 1652,2293 euros.

8. Sea X: concentracion del metal e Y : no de pruebas antes de la ruptura.

a) Comparar la homogeneidad entre dos distribuciones marginales.

X ni·5 810 515 7

Y n·j yj aj hj fj Fj[25,55] 10 30 30 0.3333 0.5 0.5(55,65] 8 60 10 0.8 0.4 0.9(65,95] 2 80 30 0.2 0.1 1

x = 9,75, σx = 4,3229, CVx = 0,4434

y = 47, σy = 17,9165, CVy = 0,3812

Es mas homogenea con respecto a su valor medio la variable Y , ya que tiene menor coeficientede variacion.

b) Media y moda de Y .

y = 47 pruebas.

Moy ∈ (55, 65], Moy = 55 + 0,8−0,3333(0,8−0,3333)+(0,8−0,2)10 = 59,3752 pruebas.

14

Page 218: Estadística

2. Estadıstica descriptiva bidimensional

c) Mediana de Y .

Me = 55 pruebas.

d) Porcentaje que necesitan 50 pruebas o menos para romperse.

Y |X > 5 nj|i aj fj Fj[25,55] 6 30 0.5 0.5(55,65] 6 10 0.5 1(65,95] 0 30 0 1

25300,5 = 0,4167, el 41.67 % de las que tienen una concentracion superior a 5, necesitan 50pruebas o menos para romperse.

9. Sea X: no de artıculos vendidos en una ciudad e Y : no de minutos al dıa que aparece la publicidaden television.

a) Media condicionada de X a cada intervalo de la variable Y .

X|Y ∈ (12, 35] ni|j xi[0,2] 2 1(2,5] 6 3.5(5,10] 4 7.5

X|Y ∈ (35, 60] ni|j xi[0,2] 1 1(2,5] 3 3.5(5,10] 2 7.5

X|Y ∈ (60, 120] ni|j xi[0,2] 4 1(2,5] 12 3.5(5,10] 8 7.5

x1 = 4,4167, x2 = 4,4167, x3 = 4,4167

b) Sı, porque las filas y columnas de la tabla son proporcionales.

10. Dada una distribucion bidimensional:

a) σxy = 0,0752 y r = 0,0463.

b) Recta de regresion de X sobre Y : x = 1,9224 + 0,0276y

Recta de regresion de Y sobre X: y = 5,1406 + 0,0777x

c) Sı, se cortan en el punto que tiene coordenadas (x, y) = (2,0685, 5,3014).

d) Si x=5, segun la recta de regresion y = 5,5293.

e) Si y=6, segun la recta de regresion x = 2,088.

11. Sea X: calificacion examen parcial e Y : calificacion examen final de Estadıstica.

a) r = 0,9012. Existe relacion lineal directa entre las variables.

b) Recta de regresion de Y sobre X: y = 0,6109 + 0,8488x.

Recta de regresion de X sobre Y : x = 0,298 + 0,957y.

12. Recta de regresion de Y sobre X: y = 7,095− 1,62x

13. x = 2, y = 3, r = 0,5.

14. Sea X: tiempo que lleva funcionando e Y : beneficio anual, en millones de euros.

a) Recta de regresion de Y sobre X: y = 3,3012− 0,1199x. Entonces, para x = 12, y = 1,8620

b) Varianza residual: 1.2874.

15

Page 219: Estadística

15. Sea X: promedio del precio de las acciones inmobiliarias e Y : promedio del precio de las accionesde bancos.

a) r = −0,4308

b) Al ser el coeficiente de correlacion lineal negativo, la covarianza tambien lo es. Entonces lasvariables varıan en sentidos opuestos. Por lo que si las acciones de los bancos aumentan suvalor, el valor de las acciones inmobiliarias disminuye.

R2 = 0,1856. La estimacion no es muy fiable, ya que el coeficiente de determinacion es proximoa cero.

16. Sea X: produccion de trigo e Y : cantidad de abono empleada por Ha.

a) r = 0,6877. Existe relacion lineal directa entre las variables, aunque esta relacion no es muyelevada.

b) Si y = 110 kg, ¿cuanto es x?

x = a′ + b′y, x = 10 + 0,1081y

Prediccion para y = 110. x = 21,891.

17. Sea X: Edad e Y : no de respuestas inadecuadas.

a) σxy = −7,6, lo que indica que las variables varıan en sentidos opuestos. Es decir, la conclusiones valida.

b) Si x = 10,5, y = 5,79.

18. Sı, porque r2 = 0,1.

19. Calcular:

a) Recta de regresion de X sobre Y : x = 4,55 + 0,09y

b) Bondad del ajuste: R2 = 0,448. Mal ajuste.

c) σ2x = 6, Varianza residual: 3.312, Varianza explicada: 2.688.

20. Sea X: no de cajas registradoras e Y : tiempo medio de espera.

a) Hay que calcular la pendiente de la recta de regresion, y = a+ bx. b = −2,2301. Por cada cajaadicional el tiempo medio de espera se reduce en 2.2301 min.

b) Si x = 17, y = 84,9646− 2,2301 ∗ 17 = 30,05 min. R2 = 0,742, por lo que el dato es fiable.

16

Page 220: Estadística

3. Teorıa de la Probabilidad

1. Escribir el espacio muestral del experimento que consiste en lanzar simultaneamente una moneday un dado.

2. Se lanza una moneda 3 veces. Se pide:

a) Construir el espacio muestral.

b) Expresar, en funcion de los sucesos elementales, los siguientes sucesos:

1) Los tres lanzamientos producen el mismo resultado.

2) El mismo resultado aparece dos veces exactamente.

3) Al menos dos veces sale cara.

4) Exactamente dos veces sale cara.

5) La cara aparece en el primero y en el segundo de los lanzamientos.

3. Un operario de una fabrica observa de tres en tres las piezas producidas por una maquina, anotandosi cada una de ellas es defectuosa o no.

a) Escribir el espacio muestral correspondiente a esta situacion.

b) Sea A el suceso “la primera pieza observada es defectuosa”, B el suceso “la segunda piezaobservada es defectuosa” y C el suceso “la tercera pieza observada es defectuosa”. Dar ladescomposicion en sucesos elementales de los siguientes sucesos: A, B, C, A∪B, A∪C, B∪C,A ∪B ∪ C, B ∩ C y A ∩B ∩ C.

4. Un dado se lanza dos veces. Se pide:

a) Construir el espacio muestral.

b) Sea A el suceso “en el primer lanzamiento, el numero es menor o igual que 2”. Calcular laP (A) suponiendo que el dado esta bien construido.

c) Sea B el suceso “en el segundo lanzamiento el numero es menor que 5”. Calcular P (B).

d) Calcular P (A ∪B)

5. Sea el experimento aleatorio consistente en el lanzamiento de dos monedas y un dado.

a) Escribir el espacio muestral correspondiente.

b) Expresar explıcitamente los sucesos siguientes: A: “que aparezcan dos caras y un numeroprimo”, B: “que aparezca un 3”, C: “que aparezca exactamente una cara y un numero primo”.

c) Expresar explıcitamente los sucesos: A y B suceden, sucede solamente B, sucede B o C.

13

Page 221: Estadística

6. Supongase que A y B son dos sucesos para los cuales P (A) = x, P (B) = y y P (A∩B) = z. Expresarcada una de las probabilidades siguientes en terminos de x, y y z:

a) P (A ∪B)

b) P (A ∩B)

c) P (A ∩B)

7. En una urna hay 6 bolas de color verde, 3 bolas de color rojo y 2 bolas de color amarillo. Se extraeuna bola al azar. Calcular la probabilidad de que:

a) La bola sea amarilla.

b) La bola no sea roja.

c) La bola sea verde o roja.

d) La bola no sea amarilla o sea verde.

e) La bola no sea roja y no sea amarilla.

8. En una fabrica hay dos almacenes con 100 artıculos cada uno. En el primero hay 25 artıculosdefectuosos y en el segundo hay 20. Un operario pasa un artıculo del primer almacen al segundo.Calcular la probabilidad de que otro operario, al coger un artıculo al azar del segundo almacenobtenga uno defectuoso.

9. Sea el experimento que consiste en elegir una moneda de entre dos y lanzarla. La probabilidad deobtener cara con la primera moneda es 0.4 y con la segunda es 0.7. Se pide:

a) La probabilidad de que el resultado del lanzamiento sea cruz.

b) Probabilidad de que fuese lanzada la segunda moneda si se conoce que el resultado del lanza-miento ha sido cruz.

10. Se ha observado la produccion de tres maquinas M1, M2 y M3 que producen las mismas piezas,arrojandolas sobre un recipiente receptor. En 10 horas de funcionamiento conjunto M1 produce1000 piezas, M2 300 piezas y M3 700, de las cuales M1 da 1 defectuosa, M2 da 3 y M3 da 5. Seextrae una pieza del recipiente y resulta defectuosa ¿De que maquina es mas probable que provenga?

11. Si la probabilidad de comprar un periodico es 0.3, la de un revista 0.2 y la de comprar ambos es0.08, calcular:

a) probabilidad de comprar un periodico o una revista.

b) probabilidad de comprar un periodico y no una revista.

c) probabilidad de comprar un periodico o no una revista.

d) probabilidad de no comprar un periodico y no comprar una revista.

12. Sean P (A) = 0.1, P (B) = 0.3 y P (A ∩B) = 0.05. Calcular las siguientes probabilidades:

a) P (A ∩B)

b) P (A|B)

c) P (A ∪ B)

14

Page 222: Estadística

3. Teorıa de la probabilidad

13. Contestar razonadamente a las siguientes preguntas:

a) Sean los sucesosA yB con las siguientes probabilidades: P (A) = 1/2, P (B) = 1/3 y P (A∩B) =1/4, ¿cual es la P (A|B)?

b) Si A y B son sucesos independientes, con P (A) = 1/2 y P (B) = 1/3, ¿cual es la P (A|B)?

14. Una bombilla de precaucion en un avion se enciende cada vez que la presion de lıquido en su sistemahidraulico es muy bajo. Sin embargo, el sistema electrico se puede danar, haciendo que la bombillase encienda. La probabilidad de que la bombilla se encienda cuando realmente debe hacerlo es 0.99.Sin embargo, el 2 % de las veces se enciende sin razon aparente. Si la probabilidad de que el nivel delıquido hidraulico este muy bajo es de 0.5, ¿cual es la probabilidad de que la bombilla esta encendidacuando existe una baja presion en el lıquido?

15. Durante un perıodo de emergencia nacional, en un paıs se utilizan detectores de mentiras paradescubrir riesgos de seguridad. Como los detectores de mentiras no son infalibles, se va a suponerque las probabilidades son 0.1 y 0.04 de que un detector de mentiras no podra detectar un riesgo deseguridad, o bien senalara en forma erronea a una persona como riesgo de seguridad. Si el 2 % de laspersonas que se someten al detector de mentiras son riesgos de seguridad. ¿Cual es la probabilidadde que una persona senalada como riesgo de seguridad por un detector de mentiras en realidad losea?

16. Con el fin de ejecutar un proceso, se selecciona uno de tres perifericos A, B y C. Las probabilidad deescoger cada uno de ellos son: 0.5 para A, 0.3 para B y 0.2 para C. Como resultados de la eleccion,se pueden producir perturbaciones que detienen la ejecucion del proceso. Esto ocurre el 10 % de lasveces si el periferico seleccionado fue A, el 20 % si fue B y el 15 % si fue C.

a) Hallar la probabilidad de que el proceso no se ejecute.

b) Si el proceso se ha ejecutado, ¿cual es la probabilidad de que lo haya hecho desde A o B?

17. Un raton huye de un gato y puede entrar en los callejones A, B o C. La probabilidad de que entreen el callejon A es 0.3, de que entre en el callejon B es 0.5 y en el callejon C es 0.2. Se sabe tambienque la probabilidad de que sea cazado en el callejon A es 0.4, de que lo sea en B, 0.6 y en C, 0.1.

a) Calcular la probabilidad de que el gato cace al raton.

b) Si al cabo de un rato el raton ha sido cazado, ¿cual es la probabilidad de que hubiera entradoen el callejon B?.

18. Un nino tiene 3 huchas con monedas de 1 euro, y 0.50 euros. La distribucion de las monedas en lashuchas es la siguiente:

Hucha A: 3 monedas de 0.50 y 5 de 1 euro

Hucha B: 8 monedas de 0.50 y 3 de 1 euro

Hucha C: 5 monedas de 0.50 y 4 de 1 euro

a) Se elige una hucha al azar y se saca una moneda, ¿que probabilidad tiene de ser de 1 euro?

b) Si se ha sacado una moneda de 0.50, ¿cual es la probabilidad de que proceda de la hucha A?

15

Page 223: Estadística

19. Se va a hacer una excursion a la playa con 2 autobuses, uno grande y uno pequeno. Las 2/3 partesde los excursionistas iran en el autobus grande, y el resto en el pequeno. Todos los que viajan en elautobus pequeno saben nadar y el 40 % de los que viajan en el autobus grande no saben nadar.

a) Calcular la probabilidad de que un excursionista elegido al azar sepa nadar.

b) Se elige un excursionista y se observa que sabe nadar, ¿cual es la probabilidad de que viaje enel autobus grande?

20. Se sabe que una droga de la verdad que se aplica a un sospechoso es fiable al 90 % cuando lapersona es culpable y al 99 % si la persona es inocente. Si se selecciona un individuo de un grupode sospechosos, de los cuales solo el 5 % ha cometido un delito y la prueba indica que el indivi-duo seleccionado es culpable, ¿cual es la probabilidad de que se trate en realidad de una personainocente?.

16

Page 224: Estadística

3. Teorıa de la Probabilidad

1. Ω = (1, C), (2, C), (3, C), (4, C), (5, C), (6, C), (1, X), (2, X), (3, X), (4, X), (5, X), (6, X)

2. Se lanza una moneda 3 veces. Sea C: se obtiene cara y X: se obtiene cruz

a) Ω = CCC CXX XCX XXC CCX CXC XCC XXXb) 1) CCC XXX

2) CXX XCX XXC CCX CXC XCC3) CCC CCX CXC XCC4) CCX CXC XCC5) CCC CCX

3. Sea D: la pieza es defectuosa, y N : la pieza no es defectuosa.

a) Ω = DDD DNN NDN NND DDN DND NDD NNNb) A : DDD DNN DDN DND

B : DDD NDN DDN NDDC : DDD NND DND NDDA ∪B = DDD DNN DDN DND NDN NDDA ∪ C = DDD DNN DDN DND NND NDDB ∪ C = DDD NDN DDN NDD NND DNDA ∪B ∪ C = DDD DNN NDN NND DDN DND NDDB ∩ C = DDD NDDA ∩B ∩ C = DDD

4. Se lanza un dado dos veces:

a) Ω=(1,1), (1,2), (1,3), (1,4), (1,5), (1,6), (2,1), (2,2), (2,3), (2,4), (2,5), (2,6), (3,1), (3,2), (3,3),(3,4), (3,5), (3,6), (4,1), (4,2), (4,3), (4,4), (4,5), (4,6), (5,1), (5,2), (5,3), (5,4), (5,5), (5,6),(6,1), (6,2), (6,3), (6,4), (6,5), (6,6)

b) A = (1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6), (2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6)P (A) = 12

36 = 13

c) B = (1,1), (1,2), (1,3), (1,4), (2,1), (2,2), (2,3), (2,4), (3,1), (3,2), (3,3), (3,4), (4,1), (4,2),(4,3), (4,4), (5,1), (5,2), (5,3), (5,4), (6,1), (6,2), (6,3), (6,4)P (B) = 24

36 = 23

d) P (A ∪B) = P (A) + P (B)− P (A ∩B) = 13 + 2

3 −836 = 28

36 = 79

17

Page 225: Estadística

5. Se lanzan dos monedas y un dado.

a) Ω=CC1, CX1, XC1, XX1, CC2, CX2, XC2, XX2, CC3, CX3, XC3, XX3, CC4, CX4, XC4,XX4, CC5, CX5, XC5, XX5, CC6, CX6, XC6, XX6

b) A = CC2, CC3, CC5, B= CC3, CX3, XC3, XX3, C: CX2, XC2, CX3, XC3, CX5, XC5c) A ∩B = CC3, B ∩ A ∩ C = XX3, B ∪ C = CC3, CX3, XC3, XX3, CX2, XC2, CX5, XC5

6. P (A) = x, P (B) = y y P (A ∩B) = z.

a) P (A ∪ B) = P (A ∩B) = 1− P (A ∩B) = 1− zb) P (A ∩B) = P (B)− P (A ∪B) = y − zc) P (A ∩ B) = P (A ∪B) = 1− P (A ∪B) = 1− P (A)− P (B) + P (A ∩B) = 1− x− y + z

7. Sea V : la bola es verde, R: la bola es roja y A: la bola es amarilla.

a) P (A) = 211

b) P (R) = 1− P (R) = 1− 311 = 8

11

c) P (V ∪R) = P (V ) + P (R) = 911

d) P (A ∪ V ) = P (V ∪R) = 911

e) P (R ∩A) = P (R ∪A) = 1− P (R ∪A) = 611

8. Sea D1: un artıculo del almacen 1 es defectuoso, P (D1) = 0,25 y D2: un artıculo del almacen 2 esdefectuoso.

P (D2) = P (D2|D1)P (D1) + P (D2|D1)P (D1) = 0,2005

9. Sea M1: se elige la moneda 1 y M2: se elige la moneda 2. Ademas, sea C: el resultado de lanzar lamoneda es cara.

P (C|M1) = 0,4, P (C|M2) = 0,7, P (M1) = P (M2) = 0,5

a) P (C) = 0,45

b) P (M2|C) = 0,3333

10. Sean M1, M2 y M3 los sucesos: la pieza producida se fabrica en la maquina correspondiente. SeaD: una pieza es defectuosa.

P (D|M1) = 11000 , P (M1) = 0,5

P (D|M2) = 3300 , P (M2) = 0,15

P (D|M3) = 5700 , P (M3) = 0,35

Calculamos la probabilidad de que provenga de cada una de las maquinas, y sera mas probable dela que tenga mayor probabilidad.

P (M1|D) = 0,111, P (M2|D) = 0,334, P (M3|D) = 0,554; luego es mas probable que venga de latercera maquina.

11. Sea N : el suceso comprar un periodico y R: comprar una revista. P (N) = 0,3, P (R) = 0,2,P (N ∩R) = 0,08.

a) P (N ∪R) = 0,42

b) P (N ∩R) = 0,22

18

Page 226: Estadística

3. Teorıa de la probabilidad

c) P (N ∪R) = 0,88

d) P (N ∩R) = 0,58

12. Sean P (A) = 0,1, P (B) = 0,3 y P (A ∩B) = 0,05.

a) P (A ∪B) = 0,25

b) P (A|B) = 0,0714

c) P (A ∩B) = 0,75

13. a) P (A|B) = 0,625

b) P (A|B) = 12

14. Sea E: se enciende la bombilla y S: sistema hidraulico bajo.

P (S|E) = 0,98

15. Sea R: ser riesgo de seguridad y D: el detector dice que la persona es riesgo de seguridad.

P (R|D) = 0,315

16. Sean A: el periferico seleccionado es el A, B: el periferico seleccionado es el B y C: el perifericoseleccionado es el C. D: el proceso se detiene.

P (D|A) = 0,1, P (A) = 0,5

P (D|B) = 0,2, P (B) = 0,3

P (D|C) = 0,15, P (C) = 0,2

a) P (D) = 0,14

b) P (A ∪B|D) = 0,8023

17. Sean A: el raton elige el callejon A, B: el raton elige el callejon B y C: el raton elige el callejon C.D: el raton es cazado.

P (D|A) = 0,4, P (A) = 0,3

P (D|B) = 0,6, P (B) = 0,5

P (D|C) = 0,1, P (C) = 0,2

a) P (D) = 0,44

b) P (B|D) = 0,6818

18. A: hucha A, B: hucha B y C: hucha C. D: la moneda es de 1 euro.

P (D|A) = 58 , P (A) = 1

3

P (D|B) = 211 , P (B) = 1

3

P (D|C) = 49 , P (C) = 1

3

a) P (D) = 0,447

b) P (A|D) = 0,2262

19

Page 227: Estadística

19. Sea A: el autobus grande y N : sabe nadar.

P (N |A) = 0,6, P (A) = 23 , P (N |A) = 1

a) P (N) = 0,7333

b) P (A|N) = 0,5454

20. Sea C: la persona es culpable, D: la droga dice que la persona es culpable.

P (C) = 0,05, P (D|C) = 0,9, P (D|C) = 0,99

P (C|D) = 0,1743

20

Page 228: Estadística

4. Conceptos basicos de VariablesAleatorias

1. Sea el experimento aleatorio consistente en lanzar dos dados equilibrados y observar el numero maxi-mo de los dos numeros obtenidos en ellos. Si X es la variable aleatoria asociada a ese experimento,hallar:

a) La funcion masa de probabilidad de la variable aleatoria X.

b) La funcion de distribucion de la variable aleatoria X.

c) F (2.5).

d) P [2 ≤ X ≤ 4].

e) La esperanza y la varianza.

2. Al lanzar dos dados, se considera la suma de sus resultados. Sea X la variable aleatoria asociada aeste experimento aleatorio. Hallar:

a) La funcion de probabilidad.

b) La funcion de distribucion. Representarla graficamente.

c) P [3 ≤ X ≤ 7].

d) Esperanza de la variable aleatoria.

3. La variable aleatoria X representa el tiempo en minutos que transcurre entre dos llegadas consecu-tivas a una tienda y su funcion de densidad de probabilidad esta dada por:

f(x) =

k e−x/2 x > 00 en otro caso

Determinar:

a) El valor de k.

b) La funcion de distribucion.

c) La probabilidad de que el tiempo entre dos llegadas consecutivas se encuentre entre 2 y 6minutos.

d) La probabilidad de que transcurran menos de 8 minutos entre 2 llegadas consecutivas.

e) La probabilidad de que el tiempo entre 2 llegadas consecutivas exceda los 8 minutos.

17

Page 229: Estadística

4. La variable aleatoria que representa la proporcion de accidentes automovilısticos fatales en EstadosUnidos tiene la siguiente funcion de densidad:

f(x) =

42x(1− x)5 0 < x ≤ 10 en otro caso

a) Demostrar que f es una funcion de densidad.

b) Calcular la funcion de distribucion.

c) Calcular P [X ≤ 0.25].

5. Se considera la variable aleatoria X con funcion de distribucion:

F (x) =

0 x ≤ 2(x− 2)3

82 < x < 4

1 4 ≤ x

a) Calcular la funcion de densidad.

b) Calcular P [3 ≤ X], P [1 < X < 3], P [X < 3], P [X > 4].

6. Sea X la duracion en segundos de un tipo de circuitos. X puede tomar todos los valores compren-didos entre 0 y +∞. Sea la funcion de densidad de X:

f(x) =

a

x2100 < x < 1000

0 en otro caso

a) Calcular el valor de a para que f sea una funcion de densidad..

b) Calcular la probabilidad de que un circuito dure exactamente 200 segundos.

c) Calcular P [200 < X < 300].

7. Una variable tiene como funcion de densidad:

f(x) =

(7 + x)

k−7 < x ≤ 0

(7− x)

k0 < x ≤ 7

0 en otro caso

Determinar:

a) El valor de k.

b) La funcion de distribucion.

c) P [X > 0].

8. Dada la funcion de probabilidad: P [X = i] = ki i = 1, 2, ..., 20

Calcular:

a) P [X = 4]

b) P [3 ≤ X ≤ 10]

c) Esperanza de X.

18

Page 230: Estadística

4. Conceptos basicos de variables aleatorias

9. Una variable tiene como funcion de densidad:

f(x) =

a e−3x x > 00 en otro caso

Determinar:

a) F (x)

b) P [1 < X < 2]

c) P [0.5 ≤ X ≤ 1]

d) P [3 > X]

10. Dada la funcion:

F (x) =

0 x < 0x2 0 ≤ x < 0.51− 3(x− x2) 0.5 ≤ x < 11 1 ≤ x

Se pide:

a) Calcular la funcion de densidad de la variable aleatoria asociada.

b) P [X > 0.75].

c) P [0.25 < X < 0.75].

d) Comprobar que F es una funcion de distribucion.

11. Se lanzan tres monedas al aire. Sea la variable aleatoria X = no de caras que se obtienen. Se pide:

a) Obtener la funcion masa de probabilidad de la variable X.

b) Obtener la funcion de distribucion de la variable X.

c) Calcular la media, varianza y desviacion tıpica de X.

d) Probabilidad de que salgan a lo sumo dos caras.

e) Probabilidad de que salgan al menos dos caras.

12. La variable X = numero de hijos por familia de una cierta ciudad, tiene la siguiente distribucionde probabilidad:

xi P [X = xi]0 0.471 0.32 0.13 0.064 0.045 0.026 0.01

Calcular:

a) Media o esperanza matematica. ¿Que significado tiene este numero?

b) Varianza y desviacion tıpica.

19

Page 231: Estadística

c) Suponiendo que el ayuntamiento de la ciudad paga 12 euros por hijo y que Y = 12X, ¿que re-presenta Y ?, ¿cual es su distribucion de probabilidad?

d) Media, varianza y desviacion tıpica de Y .

13. Sea X una variable aleatoria discreta que tiene como distribucion de probabilidad

P [X = x] =1

10x = 2, 3, . . . , 11

Se pide:

a) Funcion de distribucion

b) P [X > 7]

c) P [X ≤ 5]

d) P [3 < X ≤ 8]

14. Sea X una variable aleatoria, que tiene la siguiente funcion de densidad

f(x) =

x 0 ≤ x < 1k − x 1 ≤ x < 20 en el resto

Se pide:

a) Calcular el valor de la constante k.

b) Determinar la funcion de distribucion de la variable aleatoria X.

c) Calcular la media de la distribucion.

15. Sea

f(x) =

x+ 6

50−6 ≤ x ≤ 4

0 en otro caso

a) Comprobar que f(x) es la funcion de densidad de una variable aleatoria X.

b) Calcular la funcion de distribucion de X y representarla graficamente.

16. Sea una variable aleatoria X con funcion de densidad

f(x) =

cx 0 ≤ x ≤ 3c (6− x) 3 < x ≤ 60 en el resto

a) Hallar c para que f(x) sea una funcion de densidad.

b) Hallar P [X > 3] y P [1.5 ≤ X ≤ 4.5]

c) Calcular la esperanza y la mediana.

17. Sea X una variable aleatoria continua con funcion de densidad

f(x) =

k

x21 ≤ x ≤ 8

0 en el resto

a) Obtener k para que f(x) sea una funcion de densidad.

b) Calcular la funcion de distribucion

c) Calcular la esperanza y el percentil 90.

d) Hallar P [X = 7] y P [3 ≤ X ≤ 5]

20

Page 232: Estadística

4. Conceptos basicos de VariablesAleatorias

1. Los resultados del experimento son: (1, 1), (1, 2), . . . , (1, 6), . . . , (6, 1), (6, 2), . . . , (6, 6). SeaX: ”maxi-mo del resultado obtenido al lanzar dos dados”.X es una v.a. discreta, con valoresR : 1, 2, 3, 4, 5, 6.

a) Funcion masa de probabilidad.

xi pi1 1/362 1/123 5/364 7/365 1/46 11/36

b) Funcion de distribucion:

F (x) =

0 x < 11/36 1 ≤ x < 21/9 2 ≤ x < 31/4 3 ≤ x < 44/9 4 ≤ x < 525/36 5 ≤ x < 61 x ≥ 6

c) F (2,5) = 19 = 0,1111

d) P [2 ≤ x ≤ 4] = F (4)− F (1) = 512 = 0,4167

e) E[X] =∑ki=1 pixi = 161

36 = 4,4722 y V ar(X) = E[X2]− E[X]2 = 25551296 = 1,9715

21

Page 233: Estadística

2. Los resultados del experimento son: (1, 1), (1, 2), . . . , (1, 6), . . . , (6, 1), (6, 2), . . . , (6, 6). Sea X: ”su-ma de los resultados obtenidos al lanzar dos dados”. X es una v.a. discreta, con valores R :2, 3, 4, 5, 6, . . . , 12

a) Funcion masa de probabilidad.

xi pi2 1/363 1/184 1/125 1/96 5/367 1/68 5/369 1/910 1/1211 1/1812 1/36

b) Funcion de distribucion:

F (x) =

0 x < 21/36 2 ≤ x < 31/12 3 ≤ x < 41/6 4 ≤ x < 55/18 5 ≤ x < 65/12 6 ≤ x < 77/12 7 ≤ x < 813/18 8 ≤ x < 95/6 9 ≤ x < 1011/12 10 ≤ x < 1135/36 11 ≤ x < 121 x ≥ 12

c) P [3 ≤ x ≤ 7] = F (7)− F (2) = 59 = 0,5556

d) E[X] = 7

3. Sea X: tiempo en minutos que transcurre entre dos llegadas consecutivas a una tienda. X es unav.a. continua.

a) k = 1/2. El valor de k lo obtenemos de imponer las condiciones que tienen que verificar lafuncion de densidad, que sea una funcion positiva y que integre 1.

b) Funcion de distribucion:

F (x) =

0 x ≤ 01− e−x/2 x > 0

c) P [2 ≤ X ≤ 6] = F (6)− F (2) = 0,3181

d) P [X ≤ 8] = F (8) = 0,9817

e) P [X > 8] = 1− F (8) = 0,0183

22

Page 234: Estadística

4. Conceptos basicos de variables aleatorias

4. Sea X: proporcion de accidentes automovilısticos fatales en Estados Unidos. X es una v.a. continua.

a) Para demostrar que f es una funcion de densidad:

1. f(x) ≥ 0 ∀x. En este caso se cumple.

2.∫ +∞−∞ f(x)dx = 1. Tambien se verifica.

b) f(1/4) = 2,4917

c) Funcion de distribucion:

F (x) =

0 x ≤ 01− 7x(1− x)6 − (1− x)7 0 < x ≤ 11 x > 1

d) P [X ≤ 0,25] = 0,5551

5. Sea X una v.a. continua.

a) Funcion de densidad:

f(x) =dF (x)

dx=

38 (x− 2)2 2 < x < 40 en otro caso

b) P [X ≤ 3] = 1− F (3) = 78 = 0,875

P [1 < X < 3] = F (3)− F (1) = 18 = 0,125

P [X < 3] = 18 = 0,125

P [X > 4] = 1− F (4) = 0

6. Sea X: duracion en segundos de un tipo de circuitos. X es una v.a. continua.

a) a = 10009 . El valor de a se obtiene imponiendo las condiciones que verifican una funcion de

densidad.

b) P [X = 200] = 0

c) P [200 < X < 300] = 0,1852

7. Sea X una v.a. continua.

a) k = 49

b) Funcion de distribucion:

F (x) =

0 x ≤ −7x2

98 + x7 + 1

2 −7 < x ≤ 0

−x2

98 + x7 + 1

2 0 < x ≤ 71 x > 7

c) P [X > 0] = 12

23

Page 235: Estadística

8. X es una v.a. discreta, con valores entre 1 y 20. Antes de calcular las probabilidades pedidas,obtenemos el valor de k imponiendo que la suma de todas las probabilidades debe ser 1. Entonces,k = 1

210 .

a) P [X = 4] = 2105 = 0,019

b) P [3 ≤ X ≤ 10] = 26105 = 0,2476

c) E[X] = 2870210 = 13,6667

9. Sea X una v.a. continua. Antes de calcular los apartados obtenidos, calculamos el valor de laconstante. a = 3.

a) Funcion de distribucion:

F (x) =

0 x < 01− e−3x x ≥ 0

b) P [1 < X < 2] = 0,0473

c) P [X ≥ 2] = 0,0025

d) P [0,5 < X < 1] = 0,1733

e) P [X < 3] = 0,9999

10. La variable X es una v.a. continua, ya que la funcion de distribucion depende de los valores de xen cada uno de los intervalos.

a) Funcion de densidad:

f(x) =

2x 0 ≤ x < 1/23(2x− 1) 1/2 ≤ x < 10 en otro caso

b) P [X > 0,75] = 0,5625

c) P [0,25 < X < 0,75] = 0,375

d) F (−∞) = 0, F (+∞) = 1. Ademas es creciente y continua. En cada punto de corte hay que verque la funcion de distribucion toma el mismo valor por la izquierda y por la derecha, tambiense puede comprobar graficamente.

11. Sea X: ”no de caras que se obtiene al lanzar 3 monedas”. X es una v.a. discreta.

a) Funcion masa de probabilidad.

xi pi0 1/81 3/82 3/83 1/8

b) Funcion de distribucion:

F (x) =

0 x < 01/8 0 ≤ x < 11/2 1 ≤ x < 23/8 2 ≤ x < 31 x ≥ 3

24

Page 236: Estadística

4. Conceptos basicos de variables aleatorias

c) E[X] = 1,5, V ar(X) = 0,75, σX = 0,866

d) P [X ≤ 2] = 0,875

e) P [X ≥ 2] = 0,5

12. Sea X: no de hijos por familia de una cierta ciudad.

a) E[X] = 1. El no medio de hijos por familia es 1.

b) V ar(X) = 1,74, σX = 1,3191

c) Y = 12X, representa lo que el ayuntamiento paga por los hijos. Funcion de probabilidad:

xi pi0 0.4712 0.324 0.136 0.0648 0.0460 0.0272 0.01

d) E[Y ] = 12 ∗ E[X] = 12, V ar(Y ) = 122 ∗ V ar(X) = 250,56, σY = 15,829

13. a) Funcion de distribucion:

F (x) =

0 x < 21/10 2 ≤ x < 31/5 3 ≤ x < 43/10 4 ≤ x < 52/5 5 ≤ x < 61/2 6 ≤ x < 73/5 7 ≤ x < 87/10 8 ≤ x < 94/5 9 ≤ x < 109/10 10 ≤ x < 111 x ≥ 11

b) P [X > 7] = 2/5

c) P [X ≤ 5] = 2/5

d) P [3 < X ≤ 8] = 1/2

14. a) k = 2

b) Funcion de distribucion:

F (x) =

0 x < 0x2

2 0 ≤ x < 1

−x2

2 + 2x− 1 1 ≤ x < 21 x > 2

c) E[X] = 1

25

Page 237: Estadística

15. a) Se comprueba que la integral en todo el recorrido es igual a 1 y que f(x) ≥ 0, ∀x ∈ R.

b) Funcion de distribucion:

F (x) =

0 x < −6150

(x2

2 + 6x+ 18)−6 ≤ x ≤ 4

1 x > 4

16. a) c = 19

b) P [X > 3] = 0,5, y P [1,5 ≤ X ≤ 4,5] = 0,75

c) E[X] = 2, Me = 3

17. a) k = 87

b) Funcion de distribucion:

F (x) =

0 x < 187

(x−1x

)1 ≤ x ≤ 8

1 x > 8

c) E[X] = 2,377, P90 = 4,706

d) P [X = 7] = 0, P [3 ≤ X ≤ 5] = 0,152

26

Page 238: Estadística

5. Modelos de DistribucionesDiscretas y Continuas

1. Todos los dıas se seleccionan de manera aleatoria 12 unidades de un proceso de manufactura, conel proposito de verificar el porcentaje de unidades defectuosas en la produccion. Con base en lainformacion pasada se sabe que la probabilidad de obtener una pieza defectuosa es de 0.05. Lagerencia ha decidido detener la produccion cada vez que una muestra de 12 unidades tenga dos omas defectuosas.

a) ¿Cual es la probabilidad de que, cualquier dıa se detenga la produccion?

b) ¿Cual es la probabilidad de que haya exactamente 2 defectuosas?

2. Un club de automovilistas comienza una campana telefonica con el proposito de aumentar el numerode socios. Con base a la experiencia previa se sabe que una de cada 20 personas que reciben lallamada se unen al club. Si en un dıa 11 personas reciben la llamada telefonica:

a) ¿Cual es la probabilidad de que por lo menos dos de ellas se inscriban en el club?

b) ¿Cual es el numero esperado?

c) ¿Cual es la probabilidad de que mas de tres se inscriban?

d) ¿Cual es la probabilidad de que exactamente dos se inscriban?

3. Una companıa de seguros descubre que hay un 5 % de la poblacion que tiene un cierto tipo deaccidente cada ano. Si se seleccionan 8 asegurados al azar en la poblacion:

a) ¿Cual es la probabilidad de que no mas de dos de ellos tengan un accidente de este tipo en elproximo ano?

b) ¿Cual es la probabilidad de que no haya accidentes?

c) ¿Cual es la probabilidad de que no haya mas de tres accidentes?

4. Se sabe que el 30 % de los alumnos aprueban una asignatura. Si se presentan a ella 10 alumnos,calcular:

a) La probabilidad de que aprueben mas de 5.

b) La probabilidad de que aprueben mas del 40 % de los presentados.

5. La probabilidad de que un satelite, despues de colocarlo en orbita, funcione de manera adecuadaes de 0.9. Supongase que cinco de estos se ponen en orbita:

a) ¿Cual es la probabilidad de que por lo menos el 80 % funcione adecuadamente?

b) ¿Cual es la probabilidad de que ninguno funcione?

21

Page 239: Estadística

6. Se sabe que por termino medio, el numero de llamadas telefonicas a una centralita es de tres cadacinco minutos. Calcular las probabilidades de que se efectuen:

a) Seis llamadas en cinco minutos.

b) Tres en diez minutos.

c) Dos en un minuto.

7. Un promedio de 4 personas acuden a una oficina de informacion de un supermercado cada hora.Obtener la probabilidad de que:

a) Exactamente 2 personas acudan cada hora seleccionada al azar.

b) Menos de tres personas acudan durante una hora al azar.

c) Exactamente cuatro personas acudan en una hora.

8. Un cajero automatico es usado con un promedio de 6 personas por hora. Calcular las siguientesprobabilidades:

a) Exactamente 6 personas usen el cajero en una hora.

b) Menos de 5 personas utilicen el cajero durante una hora.

c) Nadie utilice el cajero durante un intervalo de 10 minutos.

d) Nadie utilice el cajero durante un intervalo de 5 minutos.

9. Supongase que en un cruce transitado ocurren un promedio de dos accidentes por semana. Deter-minar la probabilidad de que:

a) Ocurra un accidente en una semana.

b) Ocurran tres accidentes en una semana.

10. Se sabe que el peso en kg de un poblacion formada por animales esta distribuido segun una Normalde media 95 y desviacion tıpica 10. Determinar la probabilidad de que el peso de un animal estecomprendido entre 65 y 125 kg.

11. Sea una variable aleatoria con distribucion N (µ, 2):

a) Obtener µ para que se cumpla que P [X > 3] = 0.8.

b) Obtenido el valor de µ, obtener el percentil 75.

12. Sea X una variable normal de media 50 y varianza 100. Obtener el valor de k tal que P [X < k] =0.95.

13. El salario de un grupo de trabajadores en millones de euros sigue una distribucion normal de media2.5 y desviacion tıpica 0.5. Determinar:

a) Probabilidad de que el salario anual de un individuo elegido al azar sea superior a 3.

b) ¿Cual es el menor salario que cobre el 45 % de los trabajadores mejor pagado?

14. El 1 % de los artıculos elaborados por una cadena de produccion presenta anomalıas. Se envıan 400unidades a un cliente.

a) ¿Que modelo sigue la variable X = “Numero de artıculos defectuosos”?

b) Probabilidad de que no haya mas de 8 artıculos defectuosos.

22

Page 240: Estadística

5. Modelos de distribuciones discretas y continuas

c) Probabilidad de que no haya ninguno defectuoso.

d) Obtener la media y la varianza de la variable X.

15. La proporcion de parados de una poblacion es de 0.2. Se seleccionan 60 individuos de dicha pobla-cion. Obtener:

a) Probabilidad de que 20 o mas esten parados.

b) Probabilidad de que trabajen exactamente 48.

c) P [X = 6]

16. Sea X una variable aleatoria con distribucion F de Snedecor de parametros 2 y 4 e Y otra variablealeatoria F de Snedecor de parametros 10 y 12. Calcular:

a) x tal que P [X ≥ x] = 0.05 y P [X ≤ x] = 0.99.

b) x tal que P [Y ≥ x] = 0.05 y P [Y ≤ x] = 0.99.

17. Sea X una variable aleatoria con distribucion Chi-cuadrado con 8 grados de libertad e Y siga otraChi-cuadrado con 6 grados de libertad. Se pide:

a) P [X < 2]; P [X ≤ 0]; y P [1.23 ≤ Y ≤ 2.21].

b) x tal que P [X ≤ x] = 0.005 y P [X ≤ x] = 0.9.

c) x tal que P [Y ≤ x] = 0.01 y P [Y ≤ x] = 0.99.

18. Sea X una v.a. distribuida segun una t de Student con 10 grados de libertad. Calcular:

a) P [X ≤ −1.813]; P [2.764 ≤ X ≤ 4.588].

b) x tal que P [X ≥ x] = 0.05 y P [X ≤ x] = 0.95.

19. En un cierto hospital se comprobo que la aplicacion de un determinado tratamiento en enfermos decirrosis produce una cierta mejorıa en el 80 por 100 de los casos.

Si se aplica el tratamiento a ocho personas, se pide calcular:

a) Probabilidad de que mejoren cinco.

b) Probabilidad de que mejoren al menos tres.

c) Numero de personas que se espera que mejoren. ¿Que indica este numero?

20. En una ciudad se encontro que el 20 por 100 de los hogares estaban asegurados contra incendios.Con objeto de establecer una encuesta en el area, una companıa de seguros selecciona cinco hogaresal azar.

Se pide:

a) Numero de hogares que se espera esten asegurados.

b) Probabilidad de que dos hogares esten asegurados.

c) Probabilidad de que al menos tres esten asegurados.

d) Probabilidad de que ninguno este asegurado.

e) Probabilidad de que alguno este asegurado.

23

Page 241: Estadística

21. Sea X una variable aleatoria, tal que X P(λ) tal que:

P [X = 2] =P [X = 1]

5

Obtener E[X] y V ar(X).

22. El numero medio de enfermos recibidos en un hospital cada 10 minutos es 1.8.

a) Definir la variable aleatoria correspondiente al problema. Dar las expresiones de su funcionmasa de probabilidad, funcion de distribucion, esperanza y varianza.

a) Calcular la probabilidad de que en 10 minutos no lleguen enfermos al hospital y la probabilidadde que lleguen al menos 2 enfermos.

b) Calcular la probabilidad de que en 30 minutos lleguen al hospital menos de 2 enfermos.

23. Se sabe que en cada hora de funcionamiento, el no medio de roturas producidas en una fabrica es10.

a) Definir la variable aleatoria correspondiente al problema.

b) Obtener la funcion de probabilidad de la variable aleatoria.

c) Calcular la probabilidad de que se produzcan al menos 4 roturas.

d) Calcular la probabilidad de que se produzcan menos de 4 roturas en 2 horas.

24. El numero de licencias de matrimonio expedidas en cierta ciudad durante un mes puede considerarsecomo una variable aleatoria normal con media 124 y desviacion tıpica 7.5.

a) ¿Con que probabilidad se puede afirmar que se expediran entre 100 y 150 licencias de matri-monio?

b) Un mes se considera adecuado para casarse cuando se han producido mas de 140 licenciasde matrimonio. ¿Cual es la probabilidad de que un ano cualquiera tenga menos de 2 mesesadecuados para casarse?

25. Solamente el 15 % de los alumnos que se matriculan por primera vez en la universidad estudian masde 30 horas en el primer mes del curso.

a) Se eligen 5 alumnos al azar. Se define la variable aleatoria X = “Numero de alumnos queestudian mas de 30 horas en el primer mes del curso”. Se pide la expresion de la funcion masade probabilidad y de la funcion de distribucion de dicha variable aleatoria. Ademas, calcularla probabilidad de que todos los alumnos estudien mas de 30 horas.

b) Si se matriculan 50 alumnos por primera vez en la universidad, ¿cual es la probabilidad de queel 14 % de los alumnos estudien mas de 30 horas?

26. La estatura de una poblacion se distribuye normalmente con media 1.70 metros y desviacion tıpica0.1 metros.

a) Calcular la probabilidad de una persona elegida al azar mida menos de 1.72 metros.

b) Si se seleccionan al azar tres personas. Obtener razonadamente la probabilidad de que solouna de las personas seleccionadas mida mas de 1.72 metros.

24

Page 242: Estadística

5. Modelos de DistribucionesDiscretas y Continuas

1. Sea X: No de piezas defectuosas en una muestra de 12 unidades. p = 0,05, es la probabilidad deque una pieza sea defectuosa. Entonces, X B(12, 0,05).

La produccion se detiene si en una muestra de 12 piezas se encuentran dos o mas defectuosas.

a) P [X ≥ 2] = 1− P [X ≤ 1] = 1− 0,8816 = 0,1184.

b) P [X = 2] = 0,0988

2. Sea X: No de personas que se unen al club de una muestra de 11 personas. p = 1/20 = 0,05, es laprobabilidad de que una persona se una al club. Entonces, X B(11, 0,05).

a) P [X ≥ 2] = 1− P [X ≤ 1] = 1− 0,8981 = 0,1019

b) E[X] = np = 11 ∗ 0,05 = 0,55

c) P [X > 3] = 1− P [X ≤ 3] = 1− 0,9984 = 0,0016

d) P [X = 2] = 0,0867

3. Sea X: No de asegurados que tienen un accidente en una muestra de 8 personas. p = 0,05, es laprobabilidad de que una persona tenga un accidente. Entonces, X B(8, 0,05).

a) P [X ≤ 2] = 0,9942

b) P [X = 0] = 0,6634

c) P [X ≤ 3] = 0,9996

4. Sea X: No de alumnos que aprueban una asignatura de una muestra de 10 personas. p = 0,3, es laprobabilidad de que un alumno apruebe. Entonces, X B(10, 0,3).

a) P [X > 5] = 1− P [X ≤ 5] = 1− 0,9527 = 0,0473.

b) El 40 % de los presentados son 10 ∗ 0,4 = 4, P [X > 4] = 1− P [X ≤ 4] = 1− 0,8497 = 0,1503

5. Sea X: No de satelites que funcionan de manera adecuada de una muestra de 5 satelites. p = 0,9,es la probabilidad de que un satelite funcione de manera adecuada. Entonces, X B(5, 0,9).

a) El 80 % de los satelites son 5∗0,8 = 4, P [X ≥ 4] = P [Y ≤ 1] = 0,9185. Siendo Y : no de satelitesque no funcionan de manera adecuada de una muestra de 5 satelites, Y = 5−X B(5, 0,1)

b) P [X = 0] = P [Y = 5] = 0,00001, (calculo realizado con la calculadora)

27

Page 243: Estadística

6. Sea X: no de llamadas telefonicas a una centralita / 5 minutos. λ = 3, no medio de llamadas / 5minutos. Entonces, X P(3)

a) P [X = 6] = 0,0504

b) Sea Y : no llamadas / 10 minutos, Y P(6)

P [Y = 3] = 0,0892

c) Sea Z: no llamadas / 1 minuto, Z P(0,6)

P [Z = 2] = 0,0988

7. Sea X: no de personas que acuden a una oficina de informacion de un supermercado / 1 hora. λ = 4,no medio de personas / 1 hora. Entonces, X P(4)

a) P [X = 2] = 0,1465

b) P [Y < 3] = P [X ≤ 2] = 0,2381

c) P [X = 4] = 0,1954

8. Sea X: no de personas que utiliza un cajero / 1 hora. λ = 6, no medio de personas que utiliza elcajero / 1 hora. Entonces, X P(6)

a) P [X = 6] = 0,1606

b) P [X < 5] = 0,2851

c) Sea Y : no personas / 10 minutos, Y P(1)

P [Y = 0] = 0,3679

d) Sea Z: no personas / 5 minutos, Z P(0,5)

P [Z = 0] = 0,6065

9. Sea X: no de accidentes que ocurren en un cruce transitado / 1 semana. λ = 2, no medio deaccidentes / 1 semana. Entonces, X P(2)

a) P [X = 1] = 0,2707

b) P [X = 3] = 0,1804

10. Sea X: peso en kg de unos animales. X N (95, 102)

P [65 < X < 125] = P [X < 125]− P [X < 65] = P [Z < 3]− P [Z < −3] = 0,9987− 0,0013 = 0,9974

11. Sea X N (µ, 2)

a) P [X > 3] = 0,8, luego P [Z ≤ 3−µ√2

] = 0,2,→ 3−µ√2

= −0,84→ µ = 4,188

b) P75 = x ⇔ P [X ≤ x] = 0,75 → P [Z ≤ x−4,188√2

] = 0,75. Buscamos en la tabla el valor que

tiene probabilidad 0.75, entonces 0,67 = x−4,188√2

]→ x = 5,136 kgs.

12. Se busca en la tabla el valor que tiene probabilidad 0.95.

P [Z < k−5010 ] = 0,95→ k−50

10 = 1,645→ k = 66,45

13. Sea X: salario de un grupo de trabajadores (millones de euros). µ = 2,5, σ = 0,5. Entonces,X N (2,5, 0,52)

a) P [X > 3] = 1− P [X ≤ 3] = 0,1587

b) x/P [X > x] = 0,45, x = 2,565, luego el salario es de 2565000 euros.

28

Page 244: Estadística

5. Modelos de distribuciones discretas y continuas

14. Sea X: no de piezas defectuosas en una muestra de 400 unidades. p = 0,01, es la probabilidad deque una pieza sea defectuosa.

a) X B(400, 0,01).

b) P [X ≤ 8] ≈ 0,9786, usando la aproximacion de la Binomial por la Poisson.

n ≥ 30, p < 0,1 → B(400, 0,01) ≈ P(4).

c) P [X = 0] = 0,01795, usando la funcion masa de probabilidad de la binomial.

d) E[X] = 4, V ar(X) = 3,96

15. Sea X: no de parados en una poblacion de 60 individuos. p = 0,2, es la probabilidad de que unindividuo este parado. Entonces, X B(60, 0,2)

a) P [X ≥ 20] ≈ 0,0078, usando la aproximacion de la Binomial por la Normal y usando lacorreccion por continuidad.

n ≥ 30, 0,1 < p < 0,9 → B(60, 0,2) ≈ N (12, 9,6).

b) P [X = 12] = 0,1278, usando la funcion masa de probabilidad de la binomial.

c) P [X = 6] = 0,0187, usando la funcion masa de probabilidad de la binomial.

16. a) Si X es F2,4 → P [X ≥ x] = 0,05, x = 6,944, y P [X ≤ x] = 0,99, x = 18.

b) Si Y es F10,12 → P [Y ≥ y] = 0,05, y = 2,753, y P [Y ≤ y] = 0,99, y = 4,296.

17. a) P [X < 2] = 0,025, P [X ≤ 0] = 0 y P [1,23 ≤ Y ≤ 2,21] = 0,1− 0,025 = 0,075

b) Si X es χ8 → P [X ≤ x] = 0,005, x = 1,34, y P [X ≤ x] = 0,9, x = 13,4.

c) Si Y es χ6 → P [Y ≤ y] = 0,01, y = 0,872, y P [Y ≤ y] = 0,99, y = 17.

18. a) P [X ≤ −1,813] = 0,05, P [2,764 ≤ X ≤ 4,588] = 0,9995− 0,99 = 0,0095

b) Si X es t10 → P [X ≥ x] = 0,05, x = 1,813, y P [X ≤ x] = 0,95, x = 1,813.

19. Sea X: No de enfermos que mejoran de cirrosis en una muestra de 8 personas. p = 0,8, es laprobabilidad de que un enfermo mejore. Entonces, X B(8, 0,8).

a) P [X = 5] = P [Y = 3] = 0,1468, siendo Y : no de enfermos que no mejoran de cirrosis en unamuestra de 8 personas. Y B(8, 0,2)

b) P [X ≥ 3] = P [Y ≤ 5] = 0,9988

c) E[X] = 6,4. En media se espera que mejoren 6.4 pacientes.

20. ea X: No de hogares que estan asegurados de una muestra de 5 hogares. p = 0,2, es la probabilidadde que un hogar este asegurado. Entonces, X B(5, 0,2).

a) E[X] = 1.

b) P [X = 2] = 0,2048

c) P [X ≥ 3] = 0,0579

d) P [X = 0] = 0,3277

e) P [X ≥ 1] = 0,6723

21. λ = 0,4

29

Page 245: Estadística

22. a) Sea X: no de enfermos que son recibidos en un hospital / 10 minutos. λ = 1,8, no medio deenfermos que recibe el hospital / 10 minutos. X P(1,8)

Funcion masa de probabilidad: P [X = x] = e−1,8 1,8x

x!

Funcion de distribucion: F (x) =

0 x < 0∑[x]k=0 P [X = k] x ≥ 0

E[X] = 1,8, V ar(X) = 1,8

b) P [X = 0] = 0,1653, P [X ≥ 2] = 0,5372

c) Sea Y : no de enfermos /30 minutos, Y P(5,4)

P [Y < 2] = 0,0289, usando la funcion masa de probabilidad de la Poisson.

23. a) Sea X: no de roturas producidas en una fabrica / 1 hora. λ = 10, no medio de roturas / 1hora. X P(10)

b) Funcion masa de probabilidad: P [X = x] = e−10 10x

x!

c) P [X ≥ 4] = 1− P [X ≥ 3] = 0,9897

d) Sea Y : no de roturas / 2 horas, Y P(20)

P [Y < 4] ≈< 0,001, usando la aproximacion de la Poisson por una Normal.

24. Sea X: no de licencias de matrimonio expedidas en cierta ciudad durante un mes. X N (124, 7,52)

a) P [100 < X < 150] = 0,998

b) Sea Y : no de meses adecuados para casarse. n = 12, p, probabilidad de que se hayan producidomas de 140 licencias. Entonces, Y B(12, 0,0166).

P [Y < 2] = 0,9837, usando la funcion masa de probabilidad de la binomial.

25. Sea X: no de alumnos que estudian mas de 30 horas en el primer mes del curso, n = 5 alumnos, p =0,15 probabilidad de estudiar mas de 30 horas en el primer mes del curso. Entonces X B(5, 0,15).

a) Funcion masa de probabilidad: P [X = x] = (5x

)0,15x0,855−x

Funcion de distribucion: F (x) =

0 x < 0∑[x]k=0(

5k

)0,15k0,855−k 0 ≤ x < 5

1 x ≥ 5

P [X = 5] = 0,0001

b) Sea Y : no de alumnos que estudian mas de 30 horas en el primer mes del curso, n = 50 alumnos,p = 0,15 probabilidad de estudiar mas de 30 horas en el primer mes del curso. Y B(50, 0,15).El 14 % de 50 son: 7.

P [Y = 7] = 0,1574, usando la funcion masa de probabilidad de la binomial.

26. Sea X: estatura de una poblacion. X N (1,7, 0,12)

a) P [X < 1,72] = 0,5793

b) Sea Y : no de personas que miden mas de 1.72. n = 3, p = 0,4207, probabilidad de medir masde 1.72. Entonces, Y B(3, 0,4207).

P [Y = 1] = 0,4235, usando la funcion masa de probabilidad de la binomial.

30

Page 246: Estadística

7. Estimacion puntual y porintervalos de confianza

1. Los siguientes valores corresponden al nivel de renta (en millones) de 6 individuos:

1.5 2.8 1.3 2.5 3 2.2

Calcular un intervalo de confianza para la renta media a un nivel del 99 %.

2. De una poblacion Normal se selecciona una muestra cuyos valores son los siguientes:

20 22 21 20 18 19 25 21

a) Obtener estimaciones puntuales para la media y la varianza de la poblacion.

b) Obtener un intervalo de confianza del 95 % para la media de la poblacion.

c) Obtener un intervalo de confianza del 90 % para la varianza poblacional.

3. En una muestra de 10 piezas fabricadas en una cierta industria, se obtuvo una media de 4.38 cmde longitud y una desviacion tıpica de 0.06.

a) Calcular un intervalo de confianza para la media al 95 %.

b) Calcular un intervalo de confianza para la varianza poblacional al 95 %.

c) Realizar el apartado (a) sabiendo que la poblacion es Normal con desviacion tıpica 0.061.

4. Se encuesto a 300 personas seleccionadas al azar para conocer la proporcion de votantes favorables aun cierto candidato. De los 300 encuestados solo 100 se mostraron favorables al candidato. Estimara un nivel de confianza del 95 % la verdadera proporcion en la poblacion.

5. Obtener un intervalo de confianza al 90 % para la varianza de una poblacion tomando una muestrade 10 datos en la que S2 = 2.4.

6. Para investigar el coeficiente intelectual medio de una cierta poblacion estudiantil, se propuso untest a 400 estudiantes. La media y cuasidesviacion tıpica de este estudio fueron, respectivamente, 86y 10.2. A partir de estos datos, determinar intervalos de confianza para el coeficiente de inteligenciamedio a los niveles de confianza del 90, 95 y 99 %.

7. Una encuesta de 100 votantes para conocer sus opiniones respecto a dos candidatos muestra que 55apoyan al candidato A y 45 al B. Calcular un intervalo de confianza para la proporcion de votos decada candidato, al nivel de confianza del 95 %.

25

Page 247: Estadística

8. En una muestra aleatoria de 900 personas con pelo oscuro se encontro que 150 de ellas tenıanlos ojos azules. Construir un intervalo de confianza al 95 % para la proporcion de individuos queteniendo el pelo oscuro poseen los ojos azules. ¿Son compatibles estos resultados con la suposicionde que la proporcion vale 1/4?.

9. De una maquina que fabrica tornillos se toma una muestra de 16 de ellos y se calcula su cuasivarianzamuestral resultando ser 30. Encontrar un intervalo de confianza para la varianza a un nivel del 90 %.

10. El numero de piezas fabricadas por dos maquinas en 5 dıas son:

Maquina A 50 48 53 60 37Maquina B 40 51 62 55 64

Construir un intervalo de confianza para la diferencia de medias entre A y B suponiendo igualvarianza.

11. Se ensayan dos instrumentos de medida para ver cual es mas exacto. Se realizan 25 medicionesresultando:

X1 = 1.001 cm S1 = 0.001 cm

X2 = 0.995 cm S2 = 0.002 cm

Obtener un intervalo de confianza al 95 % para:

a) µ1 y µ2.

b) µ1 − µ2, supuestas varianza iguales.

c) σ21 y σ2

2 .

d) σ21/σ

22 con medias desconocidas.

12. Un estudio sobre seis parejas de gemelos de animales sobre el peso de cada uno al nacer, dio lossiguientes resultados:

Primero en nacer 7.4 6.2 3.4 4.8 5.3 5.1Segundo en nacer 6.5 5.8 3.6 4.6 5.5 4.8

Asumiendo que la diferencia entre peso es una variable Normal, construir un intervalo de confianzaal 98 % para la diferencia de pesos.

13. Se esta estudiando el nivel de lipoproteinas en sangre entre un grupo de atletas de elite y no atletas.Analizando muestras de ambas poblaciones se obtuvieron los siguientes resultados:

n X SAtletas 25 56 12.1

No atletas 61 49 10.5

Obtener un intervalo de confianza, al 90 %, para la diferencia de medias (µ1−µ2) y para el cocientede varianzas σ2

1/σ22 .

14. Se supone que la duracion, en Km recorridos, de los neumaticos tipo A y de tipo B, se distribuyenindependientemente y segun sendas distribuciones Normales. De los neumaticos de tipo A, se extraeuna muestra de tamano de 50, obteniendose que la media muestral es de 27465 Km, con unacuasidesviacion tıpica de 2500 Km. De los neumaticos de tipo B, tambien se extrae una muestra deigual tamano, obteniendose que la media muestral es de 27572 Km, con una cuasidesviacion tıpicade 3000 Km. Determinar, al nivel de confianza del 0.99, intervalos de confianza para la diferenciade medias poblacionales.

26

Page 248: Estadística

7. Estimacion de parametros

15. Una empresa de informatica va a lanzar al mercado un nuevo modelo de ordenador en dos comu-nidades autonomas. Con el fin de comparar la acogida que tendra el producto, se encargan dosinvestigaciones piloto para obtener informacion sobre la proporcion de consumidores dispuestos aadquirir el nuevo modelo. En la primera comunidad autonoma se pregunta a 30 personas y se ob-tiene que el 45 % de los encuestados estarıan dispuestos a comprar el ordenador, mientras que enla otra comunidad autonoma estarıa dispuestos un 60 % de 30 encuestados.

a) Obtener un intervalo de confianza al 95 % para la diferencia de proporciones.

b) ¿Se puede deducir a partir del resultado obtenido en el apartado anterior en que comunidadautonoma va a tener mas exito el nuevo modelo de ordenador?

16. El tiempo (en minutos) que tardaron 15 operarios para familiarizarse con el manejo de una maquinamoderna adquirida por la empresa fue:

3.4 2.8 4.4 2.5 3.3 4 4.8 2.9 5.6 5.2 3.7 3 3.6 2.8 4.8

Se supone que los tiempos se distribuyen normalmente.

a) Determinar e interpretar un intervalo del 95 % de confianza para el verdadero tiempo promedio.

b) El instructor considera que el tiempo promedio requerido por la poblacion de trabajadores querecibe instruccion sobre esta maquina es superior a 5 minutos, ¿que se puede decir de acuerdocon el intervalo hallado?

17. Se toma una muestra aleatoria de 15 hojas y se mide su largo. La media en esta muestra es de 8.6centımetros. La distribucion de los largos de las hojas es Normal y se sabe que S2 = 10. Encontrarun intervalo de confianza de nivel 95 % para el largo promedio de las hojas. ¿Se puede concluir queel largo promedio de las hojas en la planta es menor de 10 centımetros?.

18. De una poblacion con distribucion Normal se extrae una muestra aleatoria de tamano 11, de la cualse obtiene una varianza muestral de 5.

a) Decir cual serıa un estimador insesgado de la varianza poblacional y calcularlo.

b) Obtener in intervalo de confianza para el parametro varianza poblacional con un nivel deconfianza del 98 %.

27

Page 249: Estadística

7. Estimacion Puntual y porIntervalos de Confianza

1. Sea X: nivel de renta (en millones) N (µ, σ2). Hay que calcular un IC(µ) con varianza descono-cida, y un nivel de confianza del 99 %.

IC(µ) = [1,0787; 3,3546]

2. Sea X N (µ, σ2).

a) Estimador puntual de la media: X = 20,75

Estimador puntual de la varianza: S2 = 4,5

b) Intervalo de confianza para la media con varianza desconocida. 1− α = 0,95

IC(µ) = [8,97625; 22,52375]

c) Intervalo de confianza para la varianza con media desconocida. 1− α = 0,9

IC(σ2) = [2,2183; 14,5161]

3. Sea X: longitud de las piezas N (µ, σ2).

a) Intervalo de confianza para la media con varianza desconocida. 1− α = 0,95

IC(µ) = [4,33474; 4,42526]

b) Intervalo de confianza para la varianza con media desconocida. 1− α = 0,9

IC(σ2) = [0,001875; 0,0133]

c) Intervalo de confianza para la media con varianza conocida. 1− α = 0,95

IC(µ) = [4,3422; 4,4178]

4. Sea X: no de votantes favorables a un cierto candidato B(n, p).

Intervalo de confianza para la proporcion. 1− α = 0,95

IC(p) = [0,28; 0,3867]

5. Sea X N (µ, σ2).

Intervalo de confianza para la varianza con media desconocida. 1− α = 0,9

IC(σ2) = [1,2706; 6,4865]

6. Sea X: coeficiente intelectual de una cierta poblacion estudiantil N (µ, σ2).

a) Intervalo de confianza para la media con varianza desconocida. 1− α = 0,9

IC(µ) = [85,1611; 86,839]

31

Page 250: Estadística

b) Intervalo de confianza para la media con varianza desconocida. 1− α = 0,95

IC(µ) = [85,0004; 86,9996]

c) Intervalo de confianza para la media con varianza desconocida. 1− α = 0,99

IC(µ) = [84,6868; 87,3133]

7. Sean X: no de votantes favorables al candidato A B(nx, px) e Y : no de votantes favorables alcandidato B B(ny, py).

Intervalo de confianza para la proporcion. 1− α = 0,95

IC(px) = [0,4525; 0,6475]

IC(py) = [0,3525; 0,5475]

8. Sean X: no de personas que teniendo el pelo oscuro poseen los ojos azules B(n, p).

Intervalo de confianza para la proporcion. 1− α = 0,95

IC(p) = [0,1423; 0,1910]

Los resultados no son compatibles con la suposicion de que la proporcion es 0,25, ya que este valorno pertenece al intervalo.

9. Sea X N (µ, σ2).

Intervalo de confianza para la varianza con media desconocida. 1− α = 0,9

IC(σ2) = [17,9283; 61,8982]

10. Sean X: no de piezas fabricadas por la maquina A N (µx, σ2x) e Y : no de piezas fabricadas por la

maquina B N (µy, σ2y).

Intervalo de confianza para la diferencia de medias con varianzas desconocidas pero iguales. 1−α =0,95

IC(µx − µy) = [−17,956; 8,356]. Como 0 pertenece al intervalo de confianza para la diferencia demedias se puede considerar que las dos maquinas fabrican el mismo numero medio de piezas.

11. Sean X1: medicion con el instrumento 1 N (µ1, σ21) e X2: medicion con el instrumento 2

N (µ2, σ22).

a) Intervalo de confianza para la media con varianza desconocida. (1− α = 0,95)

IC(µ1) = [1,0006; 1,0014]

IC(µ2) = [0,99420,9958]

b) Intervalo de confianza para la diferencia de medias con varianzas desconocidas pero iguales.(1− α = 0,95)

IC(µ1 − µ2) = [0,0051; 0,0069]. µ1 > µ2

c) Intervalo de confianza para la varianza con media desconocida. (1− α = 0,95)

IC(σ21) = [6,09 ∗ 10−7; 1,92 ∗ 10−6]

IC(σ22) = [2,44 ∗ 10−6; 7,68 ∗ 10−6]

d) Intervalo de confianza para el cociente de varianzas con medias desconocidas. (1− α = 0,95)

IC(σ21

σ22) = [0,1102, 0,5673]. σ2

1 6= σ22

32

Page 251: Estadística

7. Estimacion puntual y por intervalos de confianza

12. Sean X: peso del primer gemelo al nacer N (µx, σ2x) e Y : peso del segundo gemelo al nacer

N (µy, σ2y).

El unico intervalo que podrıamos hacer sobre la diferencia de medias, serıa el que considera lasvarianzas desconocidas pero iguales. Ası que en primer lugar comprobamos si podemos considerarlas varianzas iguales.

Intervalo de confianza para el cociente de varianzas con medias desconocidas 1− α = 0,98

IC(σ2x

σ2y

) = [0,1596, 19,2081]. σ21 = σ2

2

Intervalo de confianza para la diferencia de medias con varianzas desconocidas pero iguales. 1−α =0,95

IC(µx − µy) = [−1,6741; 2,1408]. Como 0 pertenece al intervalo de confianza para la diferencia demedias se puede considerar que los dos gemelos tienen el mismo peso medio al nacer.

13. Sean X: nivel de lipoproteinas en sangre en los atletas N (µx, σ2x) e Y : nivel de lipoproteinas en

sangre en los no atletas N (µy, σ2y).

El unico intervalo que podrıamos hacer sobre la diferencia de medias, serıa el que considera lasvarianzas desconocidas pero iguales. Ası que en primer lugar comprobamos si podemos considerarlas varianzas iguales.

Intervalo de confianza para el cociente de varianzas con medias desconocidas 1− α = 0,9

IC(σ2x

σ2y

) = [0,7812, 2,4461]. σ21 = σ2

2

Intervalo de confianza para la diferencia de medias con varianzas desconocidas pero iguales. 1−α =0,9

IC(µx − µy) = [2,7103; 11,2897]. El 0 no pertenece al intervalo de confianza para la diferencia demedias. En este caso se puede considerar que el nivel medio de lipoproteinas en sangre en los atletases superior al del grupo que no son atletas.

14. Sean X: kms recorridos por los neumaticos de tipo A N (µx, σ2x) e Y : kms recorridos por los

neumaticos de tipo B N (µy, σ2y).

Intervalo de confianza para la diferencia de medias con varianzas desconocidas y tamanos de muestragrandes, 1− α = 0,99

IC(µx − µy) = [−1529,0902, 1315,0902].

15. Sean X: no de consumidores dispuestos a adquirir el nuevo modelo de ordenador en la comuni-dad autonoma 1 B(nx, px) e Y : no de consumidores dispuestos a adquirir el nuevo modelo deordenador en la comunidad autonoma 2 B(ny, py).

a) Intervalo de confianza para la diferencia de proporciones. 1− α = 0,95

IC(px − py) = [−0,3999; 0,0999]

b) Como el cero pertenece al intervalo para la diferencia de proporciones, se pueden considerarigual las proporciones de consumidores dispuestos a comprar el ordenador en ambas comuni-dades autonomas.

16. Sea X: tiempo (en minutos) que tardan los operarios en familiarizarse con el manejo de una maquinamoderna N (µ, σ2).

a) Intervalo de confianza para la media con varianza desconocida, y un nivel de confianza del95 %.

IC(µ) = [3,2489; 4,3244]

33

Page 252: Estadística

b) El instructor no tiene razon ya que µ < 5.

17. Sea X: largo de la hoja N (µ, σ2).

Intervalo de confianza para la media con varianza desconocida, y un nivel de confianza del 95 %.

IC(µ) = [6,8486; 10,3514]

No se puede concluir que µ < 10, ya que el intervalo no es estrictamente menor que 10.

18. Sea X N (µ, σ2).

a) Estimador insesgado de la varianza poblacional: S2 = 5,5

b) Intervalo de confianza para la varianza con media desconocida. 1− α = 0,98

IC(σ2) = [2,3404; 21,4844]

34

Page 253: Estadística

8. Contrastes de hipotesis

1. Se sabe que la resistencia en kg/cm de un cierto material se puede modelizar por una v.a. que se dis-tribuye normalmente. Un proveedor suministra la siguiente muestra sobre medidas de la resistenciadel material en estudio:

203 229 215 220 223 233 208 228 209

Contrastar la hipotesis de que esta muestra provenga de una poblacion normal con media 220 yvarianza cualquiera. Indicar cual es la region de rechazo al nivel α = 0.05.

2. Se esta estudiando la resistencia a la ruptura de la fibra textil usada en la fabricacion de materialpara la confeccion de sabanas infantiles. Se considera una muestra de 25 observaciones

96.2631 93.3221 94.5920 96.4153 97.084493.2163 94.0140 97.8883 92.5040 93.881697.1074 97.9700 94.5683 95.8561 95.038793.4485 96.6350 95.5091 95.8679 94.501195.2568 94.2303 93.8819 98.5715 94.4141

Contrastar si la verdadera resistencia a la ruptura media es µ = 97 a un nivel de significacionα = 0.01.

3. La tabla siguiente muestra el porcentaje de titanio en una aleacion de metales usada en piezas defuselaje de aviones, medido en 25 piezas seleccionadas al azar,

2.05487 0.98449 1.81373 1.98111 1.607082.6116 2.51924 1.81578 2.60873 2.243891.79174 2.98926 1.52412 2.27847 1.706112.48354 2.49768 1.40527 2.29953 1.934442.22619 1.92486 1.64612 2.21717 2.03099

Asumiendo que la poblacion es normal contrastar H0 : σ2 ≤ 0.25 frente a H1 : σ2 > 0.25 a nivelα = 0.1.

4. Una maquina produce taladros cuyo diametro es una magnitud que se distribuye normalmente.Para contrastar si el diametro medio de esos taladros es µ ≤ 12 mm frente a la hipotesis de que esmayor, se toma una muestra de tamano n = 10 que ha dado los siguientes valores:

11.9 12.1 11.8 12.4 11.9 12.4 12.2 12.4 12.3 12.0

Efectuar el contraste a nivel α = 0.01

29

Page 254: Estadística

5. Una empresa automovilıstica afirma que el consumo a los cien kilometros de ciertos vehıculos quefabrica se distribuye normalmente con media µ = 8 litros. Hay una asociacion de consumidoresinteresada en comprobar la veracidad de esa afirmacion y para ello se realizan pruebas sobre unamuestra de 35 unidades del modelo, que dan como resultado un consumo medio x = 8.3 litros, conuna desviacion tıpica de 0.56 litros. Efectuar el contraste a niveles α = 0.05 y α = 0.1.

6. El peso en gramos de unos comprimidos se distribuye normalmente. Una muestra de 30 unidadesha dado como resultado una varianza muestral s2 = 0,36. Se quiere contrastar la hipotesis nulaσ2 ≥ 0,49 frente a la alternativa σ2 < 0,49 a un nivel de significacion α = 0.1.

7. Una empresa cementera dispone de dos plantas de produccion y esta interesada en comprobar, anivel de significacion de α = 0.02, si tiene la misma resistencia media a la compresion el cemento queproducen. Se supone que las resistencias son variables aleatorias que se distribuyen normalmente yque las varianzas poblacionales, desconocidas, son iguales. Los datos de una muestra aleatoria decada planta son:

Planta 1 358 344 343 358 348 348 346 358 356 354Planta 2 352 359 357 364 354 348 361 349 348 352

8. Se quieres contrastar la hipotesis de que la longitud de las nidadas de patos en la granja A presentanla misma variabilidad que dicha longitud en los patos de la granja B, frente a que la variabilidad esmayor en los primeros. Los datos obtenidos en muestras de tamano 8 y 9 son:

Granja A 10 11 12 11 11 10 11 11Granja B 9 8 11 12 10 13 11 10 11

Realizar los contrastes a niveles de significacion α = 0.1 y α = 0.05 suponiendo que las poblacionesson normales.

9. En una fabrica, el llenado de frascos lo realizan de forma automatica dos maquinas. Interesa quela varianza del proceso de llenado sea la misma pero se sospecha que es mayor en la maquina 1. Seconsidera que los volumenes de llenado son variables aleatorias independientes con distribucionesnormales. Los datos siguientes corresponden a una muestra de cada maquina:

Maquina A xA =99.2cc sA =1.7 cc nA =25Maquina B xB =99.8cc sB =1.2 cc nB =18

Efectuar el contraste a un nivel α = 0.2.

10. Se sabe que la resistencia en kg/cm de un cierto material se puede modelizar por una v.a. que se dis-tribuye normalmente. Un proveedor suministra la siguiente muestra sobre medidas de la resistenciadel material en estudio:

203 229 215 220 223 233 208 228 209

Se desea comparar la muestra anterior con una segunda muestra proporcionada por otro proveedor:

221 207 185 203 187 190 195 204 212

para saber si se puede admitir que ambas muestras provienen de la misma poblacion.

a) Efectuar el correspondiente contraste sobre las varianzas a un nivel α = 0.1. Indicar la regionde rechazo.

30

Page 255: Estadística

8. Contrastes de hipotesis

b) Efectuar el contraste sobre las medias al mismo nivel. Indicar la region de rechazo.

11. Se analizan dos catalizadores para determinar la forma en que afectan el rendimiento medio de unproceso quımico. Especıficamente, el catalizador 1 se encuentra en uso actualmente, mientras queel catalizador 2 es aceptable. Puesto que el catalizador 2 es mas barato, deberıa adoptarse siempreque no modificase el rendimiento del proceso. Se realiza una prueba en la planta piloto y en la tablasiguiente se dan los resultados.

No Observacion Catalizador 1 Catalizador 21 91.5 89.192 94.18 90.953 92.18 90.464 95.39 93.215 91.79 97.196 89.07 97.047 94.72 91.078 89.21 92.75

Suponiendo poblaciones normales:

a) Contrastese la igualdad de varianzas a nivel α = 0.05. Indicar la region crıtica del contraste.

b) ¿Hay alguna diferencia entre los rendimientos medios a nivel α = 0.05? Indıquese la regioncrıtica del contraste.

12. Se esta realizando una investigacion sobre tabaquismo juvenil. Se ha tomado una muestra de 15alumnos de instituto y se ha encontrado que 5 de ellos fuman habitualmente. Contrastar la hipotesisde que el porcentaje de jovenes fumadores es del 40 % utilizando α=0.01.

13. Se esta realizando una investigacion sobre tabaquismo juvenil. Se desea contrastarse si fuman maslas chicas que los chicos. Se toma una muestra de 20 chicas y se encuentra que fuman 12. En unamuestra de 18 chicos fuman 8. Realizar el contraste con α=0.01.

14. Un portal e-business sabe que el 60 % de todos sus visitantes a la web estan interesados en adquirirsus productos pero son reacios al comercio electronico y no realizan finalmente la compra vıaInternet. Sin embargo, en la direccion del portal se piensa que en el ultimo ano, el porcentaje de genteque esta dispuesta a comprar por Internet ha aumentado y eso se debe reflejar en sus resultadosempresariales. Contrastar al nivel de significacion del 2 % si en el ultimo ano se ha reducido elporcentaje de gente que no esta dispuesta a comprar por Internet, si para ello se tomo una muestrade 500 visitantes para conocer su opinion y se observo que el 55 % no estaba dispuesto a realizarcompras vıa on-line.

31

Page 256: Estadística

8. Contrastes de Hipotesis

1. Sea X: resistencia en kg/cm de un cierto material ∼ N(µ, σ2)

Contraste de hipotesis: H0 : µ = 220 frente a H1 : µ 6= 220

Region de rechazo: texp ≤ −2,307 o texp ≥ 2,307texp = −0,38. Entonces, se acepta H0. La muestra proviene de una poblacion normal con media 220y varianza cualquiera.

2. Sea X: resistencia a la ruptura de la fibra textil usada en la fabricacion de material para la confeccionde sabanas infantiles ∼ N(µ, σ2)

Contraste de hipotesis: H0 : µ = 97 frente a H1 : µ 6= 97

Region de rechazo: zexp ≤ −2,575 o zexp ≥ 2,575zexp = −4,2963. Entonces, se rechaza H0. La verdadera resistencia a la ruptura media es distintode 97.

3. Sea X: porcentaje de titanio en una aleacion de metales usada en piezas de fuselaje de aviones∼ N(µ, σ2)

Contraste de hipotesis: H0 : σ2 ≤ 0,25 frente a H1 : σ2 > 0,25

Region de rechazo: χ2exp ≥ 33,2

χ2exp = 19,3836. Entonces, se acepta H0.

4. Sea X: diametro de los taladros ∼ N(µ, σ2)

Contraste de hipotesis: H0 : µ ≤ 12 frente a H1 : µ > 12

Region de rechazo: texp ≥ 2,821texp = 1,9091. Entonces, se acepta H0. El diametro medio de los taladros es 12.

5. Sea X: consumo a los cien kilometros de ciertos vehıculos ∼ N(µ, σ2)

Contraste de hipotesis: H0 : µ = 8 frente a H1 : µ 6= 8

α = 0,05

Region de rechazo: texp ≤ −2,043 o texp ≥ 2,043texp = 3,1237. Entonces, se rechaza H0.

α = 0,01

Region de rechazo: texp ≤ −1,698o texp ≥ 1,698texp = 3,1237. Entonces, se rechaza H0.

35

Page 257: Estadística

6. Sea X: peso en gramos de unos comprimidos ∼ N(µ, σ2)

Contraste de hipotesis: H0 : σ2 = 0,49 frente a H1 : σ2 6= 0,49

Region de rechazo: χ2exp ≤ 18,5 o χ2

exp ≥ 43,8χ2exp = 36. Entonces, se acepta H0.

7. Sean X: resistencia a la compresion del cemento producido en planta 1 ∼ N(µx, σ2x) e Y : resistencia

a la compresion del cemento producido en planta 2 ∼ N(µy, σ2y)

Contraste de hipotesis: H0 : µx = µy frente a H1 : µx 6= µy

Region de rechazo: texp ≤ −2,101 o texp ≥ 2,101texp = −1,179. Entonces, se acepta H0.

8. Sean X: longitud de las nidadas en la granja A ∼ N(µx, σ2x) e Y : longitud de las nidadas en la

granja B ∼ N(µy, σ2y)

Contraste de hipotesis: H0 : σ2x ≤ σ2

y frente a H1 : σ2x > σ2

y

α = 0,1

Region de rechazo: Fexp ≥ 2,62Fexp = 0,18. Entonces, se acepta H0.

α = 0,05

Region de rechazo: Fexp ≥ 3,5Fexp = 0,18. Entonces, se acepta H0.

9. Sean X: volumen de llenado de la maquina A ∼ N(µx, σ2x) e Y : volumen de llenado de la maquina

B ∼ N(µy, σ2y)

Contraste de hipotesis: H0 : σ2x ≤ σ2

y frente a H1 : σ2x > σ2

y

Region de rechazo: Fexp ≥ 1,77Fexp = 2,0069. Entonces, se rechaza H0.

10. Sean X: resistencia proveedor 1 ∼ N(µx, σ2x) e Y : resistencia proveedor 2 ∼ N(µy, σ

2y)

a) Contraste de hipotesis: H0 : σ2x = σ2

y frente a H1 : σ2x 6= σ2

y

Region de rechazo: Fexp ≥ 3,438 o Fexp ≤ 0,291Fexp = 0,753. Entonces, se acepta H0.

b) Contraste de hipotesis: H0 : µx = µy frente a H1 : µx 6= µy

Region de rechazo: texp ≤ −2,992 o texp ≥ 2,992texp = 3,405. Entonces, se rechaza H0.

11. Sean X: rendimiento catalizador 1 ∼ N(µx, σ2x) e Y : rendimiento catalizador 2 ∼ N(µy, σ

2y)

a) Contraste de hipotesis: H0 : σ2x = σ2

y frente a H1 : σ2x 6= σ2

y

Region de rechazo: Fexp ≥ 4,995 o Fexp ≤ 0,2Fexp = 0,6391. Entonces, se acepta H0.

b) Contraste de hipotesis: H0 : µx = µy frente a H1 : µx 6= µy

Region de rechazo: texp ≤ −2,145 o texp ≥ 2,145texp = −0,3536. Entonces, se acepta H0.

36

Page 258: Estadística

8. Contrastes de Hipotesis

12. Sea X: no de alumnos que fuman habitualmente ∼ B(n, p)

Contraste de hipotesis: H0 : p = 0,4 frente a H1 : p 6= 0,4

Region de rechazo: zexp ≤ −2,575 o zexp ≥ 2,575zexp = −0,5534. Entonces, se acepta H0. El porcentaje de jovenes fumadores es del 40 %.

13. Sea X: no de chicas fumadoras ∼ B(nx, px) e Y : no de chicos fumadores ∼ B(ny, py).

Contraste de hipotesis: H0 : px ≥ py frente a H1 : px < py

Region de rechazo: zexp ≤ −2,33zexp = 0,9703. Entonces, se acepta H0. El porcentaje de chicas que fuman es mayor que el porcentajede chicos que fuman.

14. Sea X: no de visitantes interesados en adquirir los productos de la web ∼ B(n, p)

Contraste de hipotesis: H0 : p ≥ 0,6 frente a H1 : p < 0,6

Region de rechazo: zexp ≤ −2,05zexp = −6,8495. Entonces, se rechaza H0.

37

Page 259: Estadística

9. Optimizacion sin restricciones

1. Estudie la concavidad o convexidad de las siguientes funciones:

a) f(x, y) = −x2 − y2 + 2x+ 2xy − yb) f(x, y) = x4 − y2

c) f(x, y, z) = x3 + 2y2 + 4z4

d) f(x, y) = (x− 2y)4

e) f(x, y) = x2 + 2xy + 2y2 − 10x− 10y

f ) f(x, y) = xe−(x+y)

2. Encuentra los extremos de los siguientes problemas:

a) Min. x2 + xy + y2 − 6x+ 2

b) Max. x2 + xy + y2 + x+ 5y

c) Max. 3x2 + 5y2 + 5z2 + 2yz + 6zx− 2xy

d) Max. 4x− 6y − x2 − 2y2

3. Sea f : R3 → R de clase C2. Si (0, 0, 0) es un punto crıtico de la funcion f y Hf =

−2 0 20 −2 02 0 0

.

¿El punto (0, 0, 0) corresponde a un mınimo local, un maximo local o un punto de silla?

4. En el punto (1, 0) la funcion f(x, y) = x3 − 2xy2 − 3x, ¿presenta un maximo local, un maximoglobal o un punto de silla?

5. Determınense los optimos de:

a) f(x, y, z) = xyz + 1x + 1

y + 1z

b) f(x, y) = x2y + y2x− 3xy

c) f(x, y) = x3 + y3

d) f(x, y) = x3 + y3 − 3xy

e) f(x, y) = 1− (x2 + y2)

33

Page 260: Estadística

9. Optimizacion sin Restricciones

1. a) No podemos determinar si la funcion es concova o convexa.

b) f no es concava ni convexa.

c) f es convexa si x > 0

d) No podemos determinar si la funcion es concova o convexa.

e) f es convexa.

f ) f no es concava ni convexa.

2. a) (4,−2) es un mınimo global.

b) El problema es no acotado.

c) El problema es no acotado.

d) (2,−3/2) es un maximo global.

3. (0, 0, 0) es un punto de silla.

4. (1, 0) es un punto de silla.

5. a) (1, 1, 1) es un mınimo local y (−1,−1,−1) es un maximo local.

b) (0, 3) y (1, 1) son mınimos locales.

c) (0, 0) es un punto crıtico, pero no podemos determinar si es mınimo, maximo o punto de silla.

d) (1, 1) es un mınimo local.

e) (0, 0) es un maximo local.

39

Page 261: Estadística

10. Optimizacion con restricciones

1. Expresa los problemas siguientes en forma estandar y canonica:

Max. x+ y Max. 2x+ 3y + z Min. x+ ys.a. −x+ y = 2 s.a. 4x+ 3y + z ≤ 20 s.a. −x+ y ≤ 2

x+ 2y ≤ 6 x+ y ≤ 202x+ y ≥ 6 x ≥ 0, y ≤ 0x ≥ 0, y ≤ 0

2. Resuelve graficamente los problemas siguientes, e indica si la solucion optima es de vertice, de aristao de arista infinita:

Max. x+ y Max. x+ 3y Min. −x− ys.a. −x+ y ≤ 2 s.a. x+ y ≤ 6 s.a. x− y ≥ 10

x+ 2y ≤ 6 −x+ 2y ≤ 8 −x+ y ≥ 12x+ y ≤ 6 x, y ≥ 0 x, y ≥ 0x, y ≥ 0

3. Las restricciones pesqueras impuestas por la CEE obligan a cierta empresa a pescar como maximo2000 toneladas de merluza y 2000 toneladas de rape; ademas, en total, las capturas de estas dosespecies no pueden pasar de las 3000 toneladas. Si el precio de la merluza es de 10 euros/kg y elprecio del rape es de 15 euros/kg, ¿que cantidades debe pescar para obtener el maximo beneficio?

4. Resuelve el problema siguiente. Indica las soluciones optimas y el valor de la funcion objetivo encada una de ellas.

Opt. x− 2y + 3zs.a. x+ 2y + z ≤ 4

2x+ y − z ≤ 2x, y, z ≥ 0

5. Resolver:

a)

Max. 3x+ 2ys.a. 2x+ y ≤ 18

2x+ 3y ≤ 423x+ y ≤ 24x, y ≥ 0

b)

Max. 3x+ 2y + zs.a. 2x− 3y + 2z ≤ 3

−x+ y + z ≤ 5x, y, z ≥ 0

35

Page 262: Estadística

c)

Max. 3x+ y + 4zs.a. 6x+ 3y + 5z ≤ 25

3x+ 4y + 5z ≤ 20x, y, z ≥ 0

d)

Max. 4x+ 5ys.a. 2x+ y ≤ 8

y ≤ 5x, y ≥ 0

e)

Max. 3x+ 2ys.a. 2x+ 3y ≤ 12

2x+ y ≤ 8x, y ≥ 0

36

Page 263: Estadística

10. Optimizacion con Restricciones

1.Problema original Forma estandar Forma canonica

Max. x+ y Max. x− y1 Max. x− y1s.a. −x+ y = 2 s.a. −x− y1 = 2 ≤ 20 s.a. −x− y1 = 2

x+ 2y ≤ 6 x− 2y1 + s = 6 x− 2y1 ≤ 62x+ y ≥ 6 2x− y1 − t = 6 −2x+ y1 ≤ −6x ≥ 0, y ≤ 0 x, y1, s, t ≥ 0 x, y1 ≥ 0

Max. 2x+ 3y + z Max. 2x− 3y1 + z1 − z2 Max. 2x− 3y1 + z1 − z2s.a. 4x+ 3y + z ≤ 20 s.a. 4x− 3y1 + z1 − z2 + s = 20 s.a. 4x− 3y1 + z1 − z2 ≤ 20

x+ y ≤ 20 x− y1 + t = 20 x− y1 ≤ 20x ≥ 0, y ≤ 0 x, y1, z1, z2, s, t ≥ 0 x, y1, z1, z2 ≥ 0

Min. x+ y Max. −x1 + x2 − y1 + y2 Min. −x1 + x2 − y1 + y2s.a. −x+ y ≤ 2 s.a. −x1 + x2 − y1 + y2 + s = 2 s.a. −x1 + x2 − y1 + y2 ≤ 2

x1, x2, y1, y2, s ≥ 0 x1, x2, y1, y2 ≥ 0

2. Primer problema: (2, 2), con valor de la funcion objetivo igual a 4. Solucion unica de vertice.

Segundo problema: (43 ,

143 ), con valor de la funcion objetivo igual a 46

3 . Solucion unica de vertice.

Tercer problema: Problema infactible.

3. 1000 toneladas de merluza y 2000 toneladas de rape, con un beneficio de 40 millones de euros.

4. Considerando el problema de maximizar la solucion es (0, 0, 4), y la funcion objetivo igual a 12. Yconsiderando el problema de minimizar la solucion es (0, 2, 0) con funcion objetivo igual a -4.

5. a) (3, 12) con funcion objetivo igual a 33.

b) Problema no acotado.

c) (5/3, 0, 3) con funcion objetivo igual a 17.

d) (3/2, 5) con funcion objetivo igual a 31.

e) (3, 2) con funcion objetivo igual a 13.

41

Page 264: Estadística

EXAMENES

Curso: 2011/2012 Clase: Primero - Grupo: B

Page 265: Estadística

Contraste de la bondad de ajuste Contraste de homogeneidad de poblaciones Contraste de independencia

Contraste 0

1

:

:

El modelo de probabilidad

de es

El modelo de probabilidad

de no es

H

X P

H

X P

Contraste 0

1

:

:

Las poblaciones tienen una

distribución común

Las poblaciones no tienen una

distribución común

H p

H p

Contraste 0

1

:

:

e son independientes

e no son independientes

H X Y

H X Y

Estadístico de

contraste ( )2 2

1

1

ki i

k

i i

O e

eχ −

=

−→∑

iO = frecuencia observada

en iA ; ( )i ie nP A=

Estadístico

de

contraste

( )22

( 1)( 1)

1 1

pkij ij

k p

i j ij

O e

eχ − −

= =

−→∑∑

ijO = frecuencia observada en iA con

la muestra j-ésima; ( )ij j ie n P A=

Estadístico

de

contraste

( )22

( 1)( 1)

1 1

pkij ij

k p

i j ij

O e

eχ − −

= =

−→∑∑

ijO = frecuencia observada en

i jA B× ; ( ) ( )ij i je nP A P B=

Región crítica ( )2 2

1;1

1

ki i

k r

i i

O e

eαχ − − −

=

−>∑

K: nº de grupos

r: nº de parámetros

estimados

Región

crítica ( )2

2

( 1)( 1);1

1 1

pkij ij

k p

i j ij

O e

eαχ − − −

= =

−>∑∑

K: nº de grupos

p: nº de poblaciones

Región

crítica ( )2

2

( 1)( 1);1

1 1

pkij ij

k p

i j ij

O e

eαχ − − −

= =

−>∑∑

K: nº de grupos de X; p: nº de

grupos de Y

Page 266: Estadística

Distribuciones muestrales:

Media Varianza Proporción

1−→−= nt

nS

XT

µ

( ) 212

2

2

22 1ˆ

−→−== n

Snn χσσ

σχ ( )1,0ˆ

N

n

pq

ppZ →−=

Diferencia de medias, varianzas iguales Diferencia de medias, tamaños muestrales grandes

( ) ( )2

11−+→

+

−−−=YX nn

YX

p

YX t

nnS

YXT

µµ

( ) ( )2

11 22

−+−+−=

YX

YYXXp

nn

SnSnS

( ) ( ) ( )1,022

N

Yn

YS

Xn

XS

YXYXZ →

+

−−−=

µµ

Cociente de varianzas Diferencia de proporciones

1,1

2

2

2

2

−−→=Yn

XnF

Y

YS

X

XS

F

σ

σ

( ) ( )( )1,0

ˆˆN

Yn

YqYp

Xn

Xq

Xp

Yp

Xp

Yp

Xp

Z →

+

−−−=

Intervalos de confianza

Intervalo de confianza para µ la media de una población Normal

+− −−−−n

StX

n

StX nn 2/1;12/1;1 , αα

Intervalo de confianza para 2σ la varianza de una población Normal

( ) ( )

−−

−−−2

2/;1

2

2

2/1;1

2 1,

1

αα χχ nn

SnSn

Intervalo de confianza para la proporción

−+

−−

−n

ppzp

n

ppzp

ˆ1ˆˆ,

ˆ1ˆˆ

2/12/1 αα

Intervalo de confianza para la diferencia de medias de dos poblaciones Normales independientes

Varianzas poblacionales desconocidas pero iguales Varianzas poblacionales desconocidas, iguales o no

con nX ≥ 30 y nY ≥ 30

+±− −−+

YX

pnnnn

StYXYX

112/1;2 α

+±− −

Y

Y

X

X

n

S

n

SzYX

22

2/1 α

Intervalo de confianza para el cociente de varianzas

de dos poblaciones Normales independientes

−−−

−−−2

2

2/1;1,12

2

2/1;1,1

,1

Y

Xnn

Y

X

nn S

SF

S

S

F XY

YX

αα

Intervalo de confianza para la diferencia de proporciones

( ) ( ) ( )

−+−±− −Y

YY

X

XX

YXn

pp

n

ppzpp

ˆ1ˆˆ1ˆˆˆ

2/1 α

Page 267: Estadística

Contrastes de hipótesis paramétricos

Contraste para la media de una

población normal

01 n

XT

nS

−−= →

contraste Región de rechazo

01

00

:

:

µµµµ

≠=

H

H

21;1exp

21;1exp

α

α

−−

−−

≥−≤

n

n

tT

tT

01

00

:

:

µµµµ

>≤

H

H α−−≥ 1;1exp ntT

01

00

:

:

µµµµ

<≥

H

H α;1exp −≤ ntT

Contraste para la varianza

( ) 222

120

1

n

n S

σχ χ −

−= →

contraste Región de rechazo

22

1

22

0

0

0

:

:

σσ

σσ

=

H

H

21;1

2exp

2

2;1

2exp

2

α

α

χχχχ

−−

≥≤

n

n

2

0

2

1

2

0

2

0

:

:

σσσσ

>

H

H αχχ −−≥ 1;1

2exp

2n

2

0

2

1

2

0

2

0

:

:

σσσσ

<

H

H αχχ ;1

2exp

2−≤ n

Contraste para la proporción

( )( )0

0 0

ˆ0; 1

1

p pZ N

p p

n

−= →

contraste Región de rechazo

01

00

:

:

ppH

ppH

≠=

21exp

2exp

α

α

−≥≤ZZ

ZZ

01

00

:

:

ppH

ppH

>≤

α−≥ 1exp ZZ

01

00

:

:

ppH

ppH

<≥

αZZ ≤exp

Contraste para la diferencia de medias

de dos poblaciones normales

Varianzas desconocidas pero iguales

Contraste para el cociente

de varianzas

Contraste para la diferencia

de proporciones

contraste Región de rechazo

01

00

:

:

µµµµµµ

≠−

=−

yx

yx

H

H

21;2exp

21;2exp

α

α

−−+

−−+

−≤

yx

yx

nn

nn

tT

tT

01

00

:

:

µµµµµµ

>−

≤−

yx

yx

H

H α−−+≥ 1;2exp yx nntT

01

00

:

:

µµµµµµ

<−

≥−

yx

yx

H

H α;2exp −+≤

yx nntT

( ) 0

2

1 1

X Yn n

pX Y

X YT

Sn n

+ −− −

=

+

( )

( )0

2 2 0; 1

X Y

X Y

X YZ N

S S

n n

µ− −=

+

contraste Región de rechazo

01

00

:

:

µµµµµµ

≠−

=−

yx

yx

H

H

21exp

21exp

α

α

ZZ

ZZ

01

00

:

:

µµµµµµ

>−

≤−

yx

yx

H

H α−≥ 1exp ZZ

01

00

:

:

µµµµµµ

<−

≥−

yx

yx

H

H αZZ ≤exp

contraste Región de rechazo

22

1

22

0

:

:

yx

yx

H

H

σσ

σσ

=

21;1,1exp

1exp

21;1,1

α

α

−−−≥

≤−−−

yx

xnyn

nn

F

FF

F

22

1

22

0

:

:

yx

yx

H

H

σσ

σσ

>

≤ α−−−≥ 1;1,1exp yx nnFF

22

1

22

0

:

:

yx

yx

H

H

σσ

σσ

<

≥ α−−−

≤1;1,1

1exp

xnynF

F

2

1 ; 12 X Y

X

Y

n n

SF F

S− −= →

contraste Región de rechazo

01

00

:

:

pppH

pppH

yx

yx

≠−

=−

21exp

2exp

α

α

−≥≤ZZ

ZZ

α−≥ 1exp ZZ

αZZ ≤exp

( ) ( )( ) ( )

( )0ˆ ˆ

0; 1ˆ ˆ1ˆ ˆ1

X Y X Y

Y YX X

X Y

p p p pZ N

p pp p

n n

− − −= →

−−+

01

00

:

:

pppH

pppH

yx

yx

<−

≥−

01

00

:

:

pppH

pppH

yx

yx

>−

≤−

Contraste para la diferencia de medias

de dos poblaciones normales

Tamaños muestrales superiores a 30

Page 268: Estadística

Tablas de probabilidad

Page 269: Estadística
Page 270: Estadística

Tablas de probabilidad

Tabla de probabilidades puntuales de la Distribucion Binomial P [X = k]k\p 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50n=20 0.9025 0.8100 0.7225 0.6400 0.5625 0.4900 0.4225 0.3600 0.3025 0.25001 0.0950 0.1800 0.2550 0.3200 0.3750 0.4200 0.4550 0.4800 0.4950 0.50002 0.0025 0.0100 0.0225 0.0400 0.0625 0.0900 0.1225 0.1600 0.2025 0.2500

n=30 0.8574 0.7290 0.6141 0.5120 0.4219 0.3430 0.2746 0.2160 0.1664 0.12501 0.1354 0.2430 0.3251 0.3840 0.4219 0.4410 0.4436 0.4320 0.4084 0.37502 0.0071 0.0270 0.0574 0.0960 0.1406 0.1890 0.2389 0.2880 0.3341 0.37503 0.0001 0.0010 0.0034 0.0080 0.0156 0.0270 0.0429 0.0640 0.0911 0.1250

n=40 0.8145 0.6561 0.5220 0.4096 0.3164 0.2401 0.1785 0.1296 0.0915 0.06251 0.1715 0.2916 0.3685 0.4096 0.4219 0.4116 0.3845 0.3456 0.2995 0.25002 0.0135 0.0486 0.0975 0.1536 0.2109 0.2646 0.3105 0.3456 0.3675 0.37503 0.0005 0.0036 0.0115 0.0256 0.0469 0.0756 0.1115 0.1536 0.2005 0.25004 0.0000 0.0001 0.0005 0.0016 0.0039 0.0081 0.0150 0.0256 0.0410 0.0625

n=50 0.7738 0.5905 0.4437 0.3277 0.2373 0.1681 0.1160 0.0778 0.0503 0.03131 0.2036 0.3280 0.3915 0.4096 0.3955 0.3602 0.3124 0.2592 0.2059 0.15632 0.0214 0.0729 0.1382 0.2048 0.2637 0.3087 0.3364 0.3456 0.3369 0.31253 0.0011 0.0081 0.0244 0.0512 0.0879 0.1323 0.1811 0.2304 0.2757 0.31254 0.0000 0.0005 0.0022 0.0064 0.0146 0.0284 0.0488 0.0768 0.1128 0.15635 0.0000 0.0000 0.0001 0.0003 0.0010 0.0024 0.0053 0.0102 0.0185 0.0313

n=60 0.7351 0.5314 0.3771 0.2621 0.1780 0.1176 0.0754 0.0467 0.0277 0.01561 0.2321 0.3543 0.3993 0.3932 0.3560 0.3025 0.2437 0.1866 0.1359 0.09382 0.0305 0.0984 0.1762 0.2458 0.2966 0.3241 0.3280 0.3110 0.2780 0.23443 0.0021 0.0146 0.0415 0.0819 0.1318 0.1852 0.2355 0.2765 0.3032 0.31254 0.0001 0.0012 0.0055 0.0154 0.0330 0.0595 0.0951 0.1382 0.1861 0.23445 0.0000 0.0001 0.0004 0.0015 0.0044 0.0102 0.0205 0.0369 0.0609 0.09386 0.0000 0.0000 0.0000 0.0001 0.0002 0.0007 0.0018 0.0041 0.0083 0.0156

n=70 0.6983 0.4783 0.3206 0.2097 0.1335 0.0824 0.0490 0.0280 0.0152 0.00781 0.2573 0.3720 0.3960 0.3670 0.3115 0.2471 0.1848 0.1306 0.0872 0.05472 0.0406 0.1240 0.2097 0.2753 0.3115 0.3177 0.2985 0.2613 0.2140 0.16413 0.0036 0.0230 0.0617 0.1147 0.1730 0.2269 0.2679 0.2903 0.2918 0.27344 0.0002 0.0026 0.0109 0.0287 0.0577 0.0972 0.1442 0.1935 0.2388 0.27345 0.0000 0.0002 0.0012 0.0043 0.0115 0.0250 0.0466 0.0774 0.1172 0.16416 0.0000 0.0000 0.0001 0.0004 0.0013 0.0036 0.0084 0.0172 0.0320 0.05477 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002 0.0006 0.0016 0.0037 0.0078

n=80 0.6634 0.4305 0.2725 0.1678 0.1001 0.0576 0.0319 0.0168 0.0084 0.00391 0.2793 0.3826 0.3847 0.3355 0.2670 0.1977 0.1373 0.0896 0.0548 0.03132 0.0515 0.1488 0.2376 0.2936 0.3115 0.2965 0.2587 0.2090 0.1569 0.10943 0.0054 0.0331 0.0839 0.1468 0.2076 0.2541 0.2786 0.2787 0.2568 0.21884 0.0004 0.0046 0.0185 0.0459 0.0865 0.1361 0.1875 0.2322 0.2627 0.27345 0.0000 0.0004 0.0026 0.0092 0.0231 0.0467 0.0808 0.1239 0.1719 0.21886 0.0000 0.0000 0.0002 0.0011 0.0038 0.0100 0.0217 0.0413 0.0703 0.10947 0.0000 0.0000 0.0000 0.0001 0.0004 0.0012 0.0033 0.0079 0.0164 0.03138 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002 0.0007 0.0017 0.0039

I

Page 271: Estadística

Tablas de probabilidad

Tabla de probabilidades puntuales de la Distribucion Binomial P [X = k] (Cont.)k\p 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50n=90 0.6302 0.3874 0.2316 0.1342 0.0751 0.0404 0.0207 0.0101 0.0046 0.00201 0.2985 0.3874 0.3679 0.3020 0.2253 0.1556 0.1004 0.0605 0.0339 0.01762 0.0629 0.1722 0.2597 0.3020 0.3003 0.2668 0.2162 0.1612 0.1110 0.07033 0.0077 0.0446 0.1069 0.1762 0.2336 0.2668 0.2716 0.2508 0.2119 0.16414 0.0006 0.0074 0.0283 0.0661 0.1168 0.1715 0.2194 0.2508 0.2600 0.24615 0.0000 0.0008 0.0050 0.0165 0.0389 0.0735 0.1181 0.1672 0.2128 0.24616 0.0000 0.0001 0.0006 0.0028 0.0087 0.0210 0.0424 0.0743 0.1160 0.16417 0.0000 0.0000 0.0000 0.0003 0.0012 0.0039 0.0098 0.0212 0.0407 0.07038 0.0000 0.0000 0.0000 0.0000 0.0001 0.0004 0.0013 0.0035 0.0083 0.01769 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0003 0.0008 0.0020

n=100 0.5987 0.3487 0.1969 0.1074 0.0563 0.0282 0.0135 0.0060 0.0025 0.00101 0.3151 0.3874 0.3474 0.2684 0.1877 0.1211 0.0725 0.0403 0.0207 0.00982 0.0746 0.1937 0.2759 0.3020 0.2816 0.2335 0.1757 0.1209 0.0763 0.04393 0.0105 0.0574 0.1298 0.2013 0.2503 0.2668 0.2522 0.2150 0.1665 0.11724 0.0010 0.0112 0.0401 0.0881 0.1460 0.2001 0.2377 0.2508 0.2384 0.20515 0.0001 0.0015 0.0085 0.0264 0.0584 0.1029 0.1536 0.2007 0.2340 0.24616 0.0000 0.0001 0.0012 0.0055 0.0162 0.0368 0.0689 0.1115 0.1596 0.20517 0.0000 0.0000 0.0001 0.0008 0.0031 0.0090 0.0212 0.0425 0.0746 0.11728 0.0000 0.0000 0.0000 0.0001 0.0004 0.0014 0.0043 0.0106 0.0229 0.04399 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0005 0.0016 0.0042 0.009810 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0003 0.0010

n=110 0.5688 0.3138 0.1673 0.0859 0.0422 0.0198 0.0088 0.0036 0.0014 0.00051 0.3293 0.3835 0.3248 0.2362 0.1549 0.0932 0.0518 0.0266 0.0125 0.00542 0.0867 0.2131 0.2866 0.2953 0.2581 0.1998 0.1395 0.0887 0.0513 0.02693 0.0137 0.0710 0.1517 0.2215 0.2581 0.2568 0.2254 0.1774 0.1259 0.08064 0.0014 0.0158 0.0536 0.1107 0.1721 0.2201 0.2428 0.2365 0.2060 0.16115 0.0001 0.0025 0.0132 0.0388 0.0803 0.1321 0.1830 0.2207 0.2360 0.22566 0.0000 0.0003 0.0023 0.0097 0.0268 0.0566 0.0985 0.1471 0.1931 0.22567 0.0000 0.0000 0.0003 0.0017 0.0064 0.0173 0.0379 0.0701 0.1128 0.16118 0.0000 0.0000 0.0000 0.0002 0.0011 0.0037 0.0102 0.0234 0.0462 0.08069 0.0000 0.0000 0.0000 0.0000 0.0001 0.0005 0.0018 0.0052 0.0126 0.026910 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002 0.0007 0.0021 0.005411 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002 0.0005

n=120 0.5404 0.2824 0.1422 0.0687 0.0317 0.0138 0.0057 0.0022 0.0008 0.00021 0.3413 0.3766 0.3012 0.2062 0.1267 0.0712 0.0368 0.0174 0.0075 0.00292 0.0988 0.2301 0.2924 0.2835 0.2323 0.1678 0.1088 0.0639 0.0339 0.01613 0.0173 0.0852 0.1720 0.2362 0.2581 0.2397 0.1954 0.1419 0.0923 0.05374 0.0021 0.0213 0.0683 0.1329 0.1936 0.2311 0.2367 0.2128 0.1700 0.12085 0.0002 0.0038 0.0193 0.0532 0.1032 0.1585 0.2039 0.2270 0.2225 0.19346 0.0000 0.0005 0.0040 0.0155 0.0401 0.0792 0.1281 0.1766 0.2124 0.22567 0.0000 0.0000 0.0006 0.0033 0.0115 0.0291 0.0591 0.1009 0.1489 0.19348 0.0000 0.0000 0.0001 0.0005 0.0024 0.0078 0.0199 0.0420 0.0762 0.12089 0.0000 0.0000 0.0000 0.0001 0.0004 0.0015 0.0048 0.0125 0.0277 0.053710 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002 0.0008 0.0025 0.0068 0.016111 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0003 0.0010 0.002912 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002

II

Page 272: Estadística

Tablas de probabilidad

Tabla de la funcion de distribucion de la Distribucion Binomial P [X ≤ k]k\p 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50n=20 0.9025 0.8100 0.7225 0.6400 0.5625 0.4900 0.4225 0.3600 0.3025 0.25001 0.9975 0.9900 0.9775 0.9600 0.9375 0.9100 0.8775 0.8400 0.7975 0.7500

n=30 0.8574 0.7290 0.6141 0.5120 0.4219 0.3430 0.2746 0.2160 0.1664 0.12501 0.9928 0.9720 0.9392 0.8960 0.8438 0.7840 0.7183 0.6480 0.5748 0.50002 0.9999 0.9990 0.9966 0.9920 0.9844 0.9730 0.9571 0.9360 0.9089 0.8750

n=40 0.8145 0.6561 0.5220 0.4096 0.3164 0.2401 0.1785 0.1296 0.0915 0.06251 0.9860 0.9477 0.8905 0.8192 0.7383 0.6517 0.5630 0.4752 0.3910 0.31252 0.9995 0.9963 0.9880 0.9728 0.9492 0.9163 0.8735 0.8208 0.7585 0.68753 1.0000 0.9999 0.9995 0.9984 0.9961 0.9919 0.9850 0.9744 0.9590 0.9375

n=50 0.7738 0.5905 0.4437 0.3277 0.2373 0.1681 0.1160 0.0778 0.0503 0.03131 0.9774 0.9185 0.8352 0.7373 0.6328 0.5282 0.4284 0.3370 0.2562 0.18752 0.9988 0.9914 0.9734 0.9421 0.8965 0.8369 0.7648 0.6826 0.5931 0.50003 1.0000 0.9995 0.9978 0.9933 0.9844 0.9692 0.9460 0.9130 0.8688 0.81254 1.0000 1.0000 0.9999 0.9997 0.9990 0.9976 0.9947 0.9898 0.9815 0.9688

n=60 0.7351 0.5314 0.3771 0.2621 0.1780 0.1176 0.0754 0.0467 0.0277 0.01561 0.9672 0.8857 0.7765 0.6554 0.5339 0.4202 0.3191 0.2333 0.1636 0.10942 0.9978 0.9841 0.9527 0.9011 0.8306 0.7443 0.6471 0.5443 0.4415 0.34383 0.9999 0.9987 0.9941 0.9830 0.9624 0.9295 0.8826 0.8208 0.7447 0.65634 1.0000 0.9999 0.9996 0.9984 0.9954 0.9891 0.9777 0.9590 0.9308 0.89065 1.0000 1.0000 1.0000 0.9999 0.9998 0.9993 0.9982 0.9959 0.9917 0.9844

n=70 0.6983 0.4783 0.3206 0.2097 0.1335 0.0824 0.0490 0.0280 0.0152 0.00781 0.9556 0.8503 0.7166 0.5767 0.4449 0.3294 0.2338 0.1586 0.1024 0.06252 0.9962 0.9743 0.9262 0.8520 0.7564 0.6471 0.5323 0.4199 0.3164 0.22663 0.9998 0.9973 0.9879 0.9667 0.9294 0.8740 0.8002 0.7102 0.6083 0.50004 1.0000 0.9998 0.9988 0.9953 0.9871 0.9712 0.9444 0.9037 0.8471 0.77345 1.0000 1.0000 0.9999 0.9996 0.9987 0.9962 0.9910 0.9812 0.9643 0.93756 1.0000 1.0000 1.0000 1.0000 0.9999 0.9998 0.9994 0.9984 0.9963 0.9922

n=80 0.6634 0.4305 0.2725 0.1678 0.1001 0.0576 0.0319 0.0168 0.0084 0.00391 0.9428 0.8131 0.6572 0.5033 0.3671 0.2553 0.1691 0.1064 0.0632 0.03522 0.9942 0.9619 0.8948 0.7969 0.6785 0.5518 0.4278 0.3154 0.2201 0.14453 0.9996 0.9950 0.9786 0.9437 0.8862 0.8059 0.7064 0.5941 0.4770 0.36334 1.0000 0.9996 0.9971 0.9896 0.9727 0.9420 0.8939 0.8263 0.7396 0.63675 1.0000 1.0000 0.9998 0.9988 0.9958 0.9887 0.9747 0.9502 0.9115 0.85556 1.0000 1.0000 1.0000 0.9999 0.9996 0.9987 0.9964 0.9915 0.9819 0.96487 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9998 0.9993 0.9983 0.9961

III

Page 273: Estadística

Tablas de probabilidad

Tabla de la funcion de distribucion de la Distribucion Binomial P [X ≤ k] (Cont.)k\p 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50n=90 0.6302 0.3874 0.2316 0.1342 0.0751 0.0404 0.0207 0.0101 0.0046 0.00201 0.9288 0.7748 0.5995 0.4362 0.3003 0.1960 0.1211 0.0705 0.0385 0.01952 0.9916 0.9470 0.8591 0.7382 0.6007 0.4628 0.3373 0.2318 0.1495 0.08983 0.9994 0.9917 0.9661 0.9144 0.8343 0.7297 0.6089 0.4826 0.3614 0.25394 1.0000 0.9991 0.9944 0.9804 0.9511 0.9012 0.8283 0.7334 0.6214 0.50005 1.0000 0.9999 0.9994 0.9969 0.9900 0.9747 0.9464 0.9006 0.8342 0.74616 1.0000 1.0000 1.0000 0.9997 0.9987 0.9957 0.9888 0.9750 0.9502 0.91027 1.0000 1.0000 1.0000 1.0000 0.9999 0.9996 0.9986 0.9962 0.9909 0.98058 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9997 0.9992 0.9980

n=100 0.5987 0.3487 0.1969 0.1074 0.0563 0.0282 0.0135 0.0060 0.0025 0.00101 0.9139 0.7361 0.5443 0.3758 0.2440 0.1493 0.0860 0.0464 0.0233 0.01072 0.9885 0.9298 0.8202 0.6778 0.5256 0.3828 0.2616 0.1673 0.0996 0.05473 0.9990 0.9872 0.9500 0.8791 0.7759 0.6496 0.5138 0.3823 0.2660 0.17194 0.9999 0.9984 0.9901 0.9672 0.9219 0.8497 0.7515 0.6331 0.5044 0.37705 1.0000 0.9999 0.9986 0.9936 0.9803 0.9527 0.9051 0.8338 0.7384 0.62306 1.0000 1.0000 0.9999 0.9991 0.9965 0.9894 0.9740 0.9452 0.8980 0.82817 1.0000 1.0000 1.0000 0.9999 0.9996 0.9984 0.9952 0.9877 0.9726 0.94538 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9995 0.9983 0.9955 0.98939 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9997 0.9990

n=110 0.5688 0.3138 0.1673 0.0859 0.0422 0.0198 0.0088 0.0036 0.0014 0.00051 0.8981 0.6974 0.4922 0.3221 0.1971 0.1130 0.0606 0.0302 0.0139 0.00592 0.9848 0.9104 0.7788 0.6174 0.4552 0.3127 0.2001 0.1189 0.0652 0.03273 0.9984 0.9815 0.9306 0.8389 0.7133 0.5696 0.4256 0.2963 0.1911 0.11334 0.9999 0.9972 0.9841 0.9496 0.8854 0.7897 0.6683 0.5328 0.3971 0.27445 1.0000 0.9997 0.9973 0.9883 0.9657 0.9218 0.8513 0.7535 0.6331 0.50006 1.0000 1.0000 0.9997 0.9980 0.9924 0.9784 0.9499 0.9006 0.8262 0.72567 1.0000 1.0000 1.0000 0.9998 0.9988 0.9957 0.9878 0.9707 0.9390 0.88678 1.0000 1.0000 1.0000 1.0000 0.9999 0.9994 0.9980 0.9941 0.9852 0.96739 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9998 0.9993 0.9978 0.994110 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9998 0.9995

n=120 0.5404 0.2824 0.1422 0.0687 0.0317 0.0138 0.0057 0.0022 0.0008 0.00021 0.8816 0.6590 0.4435 0.2749 0.1584 0.0850 0.0424 0.0196 0.0083 0.00322 0.9804 0.8891 0.7358 0.5583 0.3907 0.2528 0.1513 0.0834 0.0421 0.01933 0.9978 0.9744 0.9078 0.7946 0.6488 0.4925 0.3467 0.2253 0.1345 0.07304 0.9998 0.9957 0.9761 0.9274 0.8424 0.7237 0.5833 0.4382 0.3044 0.19385 1.0000 0.9995 0.9954 0.9806 0.9456 0.8822 0.7873 0.6652 0.5269 0.38726 1.0000 0.9999 0.9993 0.9961 0.9857 0.9614 0.9154 0.8418 0.7393 0.61287 1.0000 1.0000 0.9999 0.9994 0.9972 0.9905 0.9745 0.9427 0.8883 0.80628 1.0000 1.0000 1.0000 0.9999 0.9996 0.9983 0.9944 0.9847 0.9644 0.92709 1.0000 1.0000 1.0000 1.0000 1.0000 0.9998 0.9992 0.9972 0.9921 0.980710 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9997 0.9989 0.996811 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9998

IV

Page 274: Estadística

Tablas de probabilidad

Tabla de probabilidades puntuales de la Distribucion de Poisson P [X = k]λ\k 0 1 2 3 4 5 6 7 8 9 100.1 0.9048 0.0905 0.0045 0.0002 0.00000.2 0.8187 0.1637 0.0164 0.0011 0.0001 0.00000.3 0.7408 0.2222 0.0333 0.0033 0.0003 0.00000.4 0.6703 0.2681 0.0536 0.0072 0.0007 0.0001 0.00000.5 0.6065 0.3033 0.0758 0.0126 0.0016 0.0002 0.0000

0.6 0.5488 0.3293 0.0988 0.0198 0.0030 0.0004 0.00000.7 0.4966 0.3476 0.1217 0.0284 0.0050 0.0007 0.0001 0.00000.8 0.4493 0.3595 0.1438 0.0383 0.0077 0.0012 0.0002 0.00000.9 0.4066 0.3659 0.1647 0.0494 0.0111 0.0020 0.0003 0.0000

1.0 0.3679 0.3679 0.1839 0.0613 0.0153 0.0031 0.0005 0.0001 0.00001.2 0.3012 0.3614 0.2169 0.0867 0.0260 0.0062 0.0012 0.0002 0.00001.4 0.2466 0.3452 0.2417 0.1128 0.0395 0.0111 0.0026 0.0005 0.0001 0.00001.6 0.2019 0.3230 0.2584 0.1378 0.0551 0.0176 0.0047 0.0011 0.0002 0.00001.8 0.1653 0.2975 0.2678 0.1607 0.0723 0.0260 0.0078 0.0020 0.0005 0.0001 0.0000

2.0 0.1353 0.2707 0.2707 0.1804 0.0902 0.0361 0.0120 0.0034 0.0009 0.0002 0.00002.2 0.1108 0.2438 0.2681 0.1966 0.1082 0.0476 0.0174 0.0055 0.0015 0.0004 0.00012.4 0.0907 0.2177 0.2613 0.2090 0.1254 0.0602 0.0241 0.0083 0.0025 0.0007 0.00022.6 0.0743 0.1931 0.2510 0.2176 0.1414 0.0735 0.0319 0.0118 0.0038 0.0011 0.00032.8 0.0608 0.1703 0.2384 0.2225 0.1557 0.0872 0.0407 0.0163 0.0057 0.0018 0.0005

3.0 0.0498 0.1494 0.2240 0.2240 0.1680 0.1008 0.0504 0.0216 0.0081 0.0027 0.00083.2 0.0408 0.1304 0.2087 0.2226 0.1781 0.1140 0.0608 0.0278 0.0111 0.0040 0.00133.4 0.0334 0.1135 0.1929 0.2186 0.1858 0.1264 0.0716 0.0348 0.0148 0.0056 0.00193.6 0.0273 0.0984 0.1771 0.2125 0.1912 0.1377 0.0826 0.0425 0.0191 0.0076 0.00283.8 0.0224 0.0850 0.1615 0.2046 0.1944 0.1477 0.0936 0.0508 0.0241 0.0102 0.0039

4.0 0.0183 0.0733 0.1465 0.1954 0.1954 0.1563 0.1042 0.0595 0.0298 0.0132 0.00534.2 0.0150 0.0630 0.1323 0.1852 0.1944 0.1633 0.1143 0.0686 0.0360 0.0168 0.00714.4 0.0123 0.0540 0.1188 0.1743 0.1917 0.1687 0.1237 0.0778 0.0428 0.0209 0.00924.6 0.0101 0.0462 0.1063 0.1631 0.1875 0.1725 0.1323 0.0869 0.0500 0.0255 0.01184.8 0.0082 0.0395 0.0948 0.1517 0.1820 0.1747 0.1398 0.0959 0.0575 0.0307 0.0147

5.0 0.0067 0.0337 0.0842 0.1404 0.1755 0.1755 0.1462 0.1044 0.0653 0.0363 0.01815.5 0.0041 0.0225 0.0618 0.1133 0.1558 0.1714 0.1571 0.1234 0.0849 0.0519 0.0285

6.0 0.0025 0.0149 0.0446 0.0892 0.1339 0.1606 0.1606 0.1377 0.1033 0.0688 0.04136.5 0.0015 0.0098 0.0318 0.0688 0.1118 0.1454 0.1575 0.1462 0.1188 0.0858 0.0558

7.0 0.0009 0.0064 0.0223 0.0521 0.0912 0.1277 0.1490 0.1490 0.1304 0.1014 0.07107.5 0.0006 0.0041 0.0156 0.0389 0.0729 0.1094 0.1367 0.1465 0.1373 0.1144 0.0858

8.0 0.0003 0.0027 0.0107 0.0286 0.0573 0.0916 0.1221 0.1396 0.1396 0.1241 0.09938.5 0.0002 0.0017 0.0074 0.0208 0.0443 0.0752 0.1066 0.1294 0.1375 0.1299 0.1104

9.0 0.0001 0.0011 0.0050 0.0150 0.0337 0.0607 0.0911 0.1171 0.1318 0.1318 0.11869.5 0.0001 0.0007 0.0034 0.0107 0.0254 0.0483 0.0764 0.1037 0.1232 0.1300 0.1235

10.0 0.0000 0.0005 0.0023 0.0076 0.0189 0.0378 0.0631 0.0901 0.1126 0.1251 0.1251

V

Page 275: Estadística

Tablas de probabilidad

Tabla de probabilidades puntuales de la Distribucion de Poisson P [X = k] (Cont.)λ\k 11 12 13 14 15 16 17 18 19 20 210.10.20.30.40.5

0.60.70.80.9

1.01.21.41.61.8

2.02.2 0.00002.4 0.00002.6 0.0001 0.00002.8 0.0001 0.0000

3.0 0.0002 0.0001 0.00003.2 0.0004 0.0001 0.00003.4 0.0006 0.0002 0.00003.6 0.0009 0.0003 0.0001 0.00003.8 0.0013 0.0004 0.0001 0.0000

4.0 0.0019 0.0006 0.0002 0.0001 0.00004.2 0.0027 0.0009 0.0003 0.0001 0.00004.4 0.0037 0.0013 0.0005 0.0001 0.00004.6 0.0049 0.0019 0.0007 0.0002 0.0001 0.00004.8 0.0064 0.0026 0.0009 0.0003 0.0001 0.0000

5.0 0.0082 0.0034 0.0013 0.0005 0.0002 0.00005.5 0.0143 0.0065 0.0028 0.0011 0.0004 0.0001 0.0000

6.0 0.0225 0.0113 0.0052 0.0022 0.0009 0.0003 0.0001 0.00006.5 0.0330 0.0179 0.0089 0.0041 0.0018 0.0007 0.0003 0.0001 0.0000

7.0 0.0452 0.0263 0.0142 0.0071 0.0033 0.0014 0.0006 0.0002 0.0001 0.00007.5 0.0585 0.0366 0.0211 0.0113 0.0057 0.0026 0.0012 0.0005 0.0002 0.0001 0.0000

8.0 0.0722 0.0481 0.0296 0.0169 0.0090 0.0045 0.0021 0.0009 0.0004 0.0002 0.00018.5 0.0853 0.0604 0.0395 0.0240 0.0136 0.0072 0.0036 0.0017 0.0008 0.0003 0.0001

9.0 0.0970 0.0728 0.0504 0.0324 0.0194 0.0109 0.0058 0.0029 0.0014 0.0006 0.00039.5 0.1067 0.0844 0.0617 0.0419 0.0265 0.0157 0.0088 0.0046 0.0023 0.0011 0.000510.0 0.1137 0.0948 0.0729 0.0521 0.0347 0.0217 0.0128 0.0071 0.0037 0.0019 0.0009

VI

Page 276: Estadística

Tablas de probabilidad

Tabla de la funcion de distribucion de la Distribucion de Poisson P [X ≤ k]λ\k 0 1 2 3 4 5 6 7 8 9 100.1 0.9048 0.9953 0.9998 1.00000.2 0.8187 0.9825 0.9989 0.9999 1.00000.3 0.7408 0.9631 0.9964 0.9997 1.00000.4 0.6703 0.9384 0.9921 0.9992 0.9999 1.00000.5 0.6065 0.9098 0.9856 0.9982 0.9998 1.0000

0.6 0.5488 0.8781 0.9769 0.9966 0.9996 1.00000.7 0.4966 0.8442 0.9659 0.9942 0.9992 0.9999 1.00000.8 0.4493 0.8088 0.9526 0.9909 0.9986 0.9998 1.00000.9 0.4066 0.7725 0.9371 0.9865 0.9977 0.9997 1.0000

1.0 0.3679 0.7358 0.9197 0.9810 0.9963 0.9994 0.9999 1.00001.2 0.3012 0.6626 0.8795 0.9662 0.9923 0.9985 0.9997 1.00001.4 0.2466 0.5918 0.8335 0.9463 0.9857 0.9968 0.9994 0.9999 1.00001.6 0.2019 0.5249 0.7834 0.9212 0.9763 0.9940 0.9987 0.9997 1.00001.8 0.1653 0.4628 0.7306 0.8913 0.9636 0.9896 0.9974 0.9994 0.9999 1.0000

2.0 0.1353 0.4060 0.6767 0.8571 0.9473 0.9834 0.9955 0.9989 0.9998 1.00002.2 0.1108 0.3546 0.6227 0.8194 0.9275 0.9751 0.9925 0.9980 0.9995 0.9999 1.00002.4 0.0907 0.3084 0.5697 0.7787 0.9041 0.9643 0.9884 0.9967 0.9991 0.9998 1.00002.6 0.0743 0.2674 0.5184 0.7360 0.8774 0.9510 0.9828 0.9947 0.9985 0.9996 0.99992.8 0.0608 0.2311 0.4695 0.6919 0.8477 0.9349 0.9756 0.9919 0.9976 0.9993 0.9998

3.0 0.0498 0.1991 0.4232 0.6472 0.8153 0.9161 0.9665 0.9881 0.9962 0.9989 0.99973.2 0.0408 0.1712 0.3799 0.6025 0.7806 0.8946 0.9554 0.9832 0.9943 0.9982 0.99953.4 0.0334 0.1468 0.3397 0.5584 0.7442 0.8705 0.9421 0.9769 0.9917 0.9973 0.99923.6 0.0273 0.1257 0.3027 0.5152 0.7064 0.8441 0.9267 0.9692 0.9883 0.9960 0.99873.8 0.0224 0.1074 0.2689 0.4735 0.6678 0.8156 0.9091 0.9599 0.9840 0.9942 0.9981

4.0 0.0183 0.0916 0.2381 0.4335 0.6288 0.7851 0.8893 0.9489 0.9786 0.9919 0.99724.2 0.0150 0.0780 0.2102 0.3954 0.5898 0.7531 0.8675 0.9361 0.9721 0.9889 0.99594.4 0.0123 0.0663 0.1851 0.3594 0.5512 0.7199 0.8436 0.9214 0.9642 0.9851 0.99434.6 0.0101 0.0563 0.1626 0.3257 0.5132 0.6858 0.8180 0.9049 0.9549 0.9805 0.99224.8 0.0082 0.0477 0.1425 0.2942 0.4763 0.6510 0.7908 0.8867 0.9442 0.9749 0.9896

5.0 0.0067 0.0404 0.1247 0.2650 0.4405 0.6160 0.7622 0.8666 0.9319 0.9682 0.98635.5 0.0041 0.0266 0.0884 0.2017 0.3575 0.5289 0.6860 0.8095 0.8944 0.9462 0.9747

6.0 0.0025 0.0174 0.0620 0.1512 0.2851 0.4457 0.6063 0.7440 0.8472 0.9161 0.95746.5 0.0015 0.0113 0.0430 0.1118 0.2237 0.3690 0.5265 0.6728 0.7916 0.8774 0.9332

7.0 0.0009 0.0073 0.0296 0.0818 0.1730 0.3007 0.4497 0.5987 0.7291 0.8305 0.90157.5 0.0006 0.0047 0.0203 0.0591 0.1321 0.2414 0.3782 0.5246 0.6620 0.7764 0.8622

8.0 0.0003 0.0030 0.0138 0.0424 0.0996 0.1912 0.3134 0.4530 0.5925 0.7166 0.81598.5 0.0002 0.0019 0.0093 0.0301 0.0744 0.1496 0.2562 0.3856 0.5231 0.6530 0.7634

9.0 0.0001 0.0012 0.0062 0.0212 0.0550 0.1157 0.2068 0.3239 0.4557 0.5874 0.70609.5 0.0001 0.0008 0.0042 0.0149 0.0403 0.0885 0.1649 0.2687 0.3918 0.5218 0.6453

10.0 0.0000 0.0005 0.0028 0.0103 0.0293 0.0671 0.1301 0.2202 0.3328 0.4579 0.5830

VII

Page 277: Estadística

Tablas de probabilidad

Tabla de la funcion de distribucion de la Distribucion de Poisson P [X ≤ k] (Cont.)λ\k 11 12 13 14 15 16 17 18 19 20 210.10.20.30.40.5

0.60.70.80.9

1.01.21.41.61.8

2.02.22.42.6 1.00002.8 1.0000

3.0 0.9999 1.00003.2 0.9999 1.00003.4 0.9998 0.9999 1.00003.6 0.9996 0.9999 1.00003.8 0.9994 0.9998 1.0000

4.0 0.9991 0.9997 0.9999 1.00004.2 0.9986 0.9996 0.9999 1.00004.4 0.9980 0.9993 0.9998 0.9999 1.00004.6 0.9971 0.9990 0.9997 0.9999 1.00004.8 0.9960 0.9986 0.9995 0.9999 1.0000

5.0 0.9945 0.9980 0.9993 0.9998 0.9999 1.00005.5 0.9890 0.9955 0.9983 0.9994 0.9998 0.9999 1.0000

6.0 0.9799 0.9912 0.9964 0.9986 0.9995 0.9998 0.9999 1.00006.5 0.9661 0.9840 0.9929 0.9970 0.9988 0.9996 0.9998 0.9999 1.0000

7.0 0.9467 0.9730 0.9872 0.9943 0.9976 0.9990 0.9996 0.9999 1.00007.5 0.9208 0.9573 0.9784 0.9897 0.9954 0.9980 0.9992 0.9997 0.9999 1.0000

8.0 0.8881 0.9362 0.9658 0.9827 0.9918 0.9963 0.9984 0.9993 0.9997 0.9999 1.00008.5 0.8487 0.9091 0.9486 0.9726 0.9862 0.9934 0.9970 0.9987 0.9995 0.9998 0.9999

9.0 0.8030 0.8758 0.9261 0.9585 0.9780 0.9889 0.9947 0.9976 0.9989 0.9996 0.99989.5 0.7520 0.8364 0.8981 0.9400 0.9665 0.9823 0.9911 0.9957 0.9980 0.9991 0.9996

10.0 0.6968 0.7916 0.8645 0.9165 0.9513 0.9730 0.9857 0.9928 0.9965 0.9984 0.9993

VIII

Page 278: Estadística

Tablas de probabilidad

Tabla de la funcion de distribucion de la Distribucion N (0, 1) P [Z ≤ z]z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.090.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.53590.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.57530.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.61410.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.65170.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879

0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.72240.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.75490.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.78520.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.81330.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389

1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.86211.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.88301.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.90151.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.91771.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319

1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.94411.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.95451.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.96331.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.97061.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767

2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.98172.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.98572.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.98902.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.99162.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936

2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.99522.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.99642.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.99742.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.99812.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.99863.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990

IX

Page 279: Estadística

Tablas de probabilidad

Tabla de la funcion de distribucion de la Distribucion N (0, 1) P [Z ≤ z] (Cont.)z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

-0.0 0.5000 0.4960 0.4920 0.4880 0.4840 0.4801 0.4761 0.4721 0.4681 0.4641-0.1 0.4602 0.4562 0.4522 0.4483 0.4443 0.4404 0.4364 0.4325 0.4286 0.4247-0.2 0.4207 0.4168 0.4129 0.4090 0.4052 0.4013 0.3974 0.3936 0.3897 0.3859-0.3 0.3821 0.3783 0.3745 0.3707 0.3669 0.3632 0.3594 0.3557 0.3520 0.3483-0.4 0.3446 0.3409 0.3372 0.3336 0.3300 0.3264 0.3228 0.3192 0.3156 0.3121

-0.5 0.3085 0.3050 0.3015 0.2981 0.2946 0.2912 0.2877 0.2843 0.2810 0.2776-0.6 0.2743 0.2709 0.2676 0.2643 0.2611 0.2578 0.2546 0.2514 0.2483 0.2451-0.7 0.2420 0.2389 0.2358 0.2327 0.2297 0.2266 0.2236 0.2206 0.2177 0.2148-0.8 0.2119 0.2090 0.2061 0.2033 0.2005 0.1977 0.1949 0.1922 0.1894 0.1867-0.9 0.1841 0.1814 0.1788 0.1762 0.1736 0.1711 0.1685 0.1660 0.1635 0.1611

-1.0 0.1587 0.1562 0.1539 0.1515 0.1492 0.1469 0.1446 0.1423 0.1401 0.1379-1.1 0.1357 0.1335 0.1314 0.1292 0.1271 0.1251 0.1230 0.1210 0.1190 0.1170-1.2 0.1151 0.1131 0.1112 0.1093 0.1075 0.1056 0.1038 0.1020 0.1003 0.0985-1.3 0.0968 0.0951 0.0934 0.0917 0.0901 0.0885 0.0869 0.0853 0.0838 0.0823-1.4 0.0808 0.0793 0.0778 0.0764 0.0749 0.0735 0.0721 0.0708 0.0694 0.0681

-1.5 0.0668 0.0655 0.0643 0.0630 0.0618 0.0606 0.0594 0.0582 0.0570 0.0559-1.6 0.0548 0.0537 0.0526 0.0515 0.0505 0.0495 0.0485 0.0475 0.0465 0.0455-1.7 0.0446 0.0436 0.0427 0.0418 0.0409 0.0401 0.0392 0.0384 0.0375 0.0367-1.8 0.0359 0.0351 0.0344 0.0336 0.0329 0.0322 0.0314 0.0307 0.0300 0.0294-1.9 0.0287 0.0281 0.0274 0.0268 0.0262 0.0256 0.0250 0.0244 0.0238 0.0233

-2.0 0.0227 0.0222 0.0217 0.0212 0.0207 0.0202 0.0197 0.0192 0.0188 0.0183-2.1 0.0179 0.0174 0.0170 0.0166 0.0162 0.0158 0.0154 0.0150 0.0146 0.0143-2.2 0.0139 0.0135 0.0132 0.0129 0.0125 0.0122 0.0119 0.0116 0.0113 0.0110-2.3 0.0107 0.0104 0.0102 0.0099 0.0096 0.0093 0.0091 0.0089 0.0086 0.0084-2.4 0.0082 0.0080 0.0078 0.0075 0.0073 0.0071 0.0069 0.0067 0.0066 0.0064

-2.5 0.0062 0.0060 0.0059 0.0057 0.0055 0.0054 0.0052 0.0051 0.0049 0.0048-2.6 0.0047 0.0045 0.0044 0.0043 0.0041 0.0040 0.0039 0.0038 0.0037 0.0036-2.7 0.0035 0.0034 0.0033 0.0032 0.0031 0.0030 0.0029 0.0028 0.0027 0.0026-2.8 0.0026 0.0025 0.0024 0.0023 0.0022 0.0022 0.0021 0.0020 0.0020 0.0019-2.9 0.0019 0.0018 0.0017 0.0017 0.0016 0.0016 0.0015 0.0015 0.0014 0.0014-3.0 0.0013 0.0013 0.0012 0.0012 0.0012 0.0011 0.0011 0.0011 0.0010 0.0010

X

Page 280: Estadística

Tablas de probabilidad

Tabla de cuantiles de la Distribucion Chi-Cuadrado P [χ2g.l ≤ χ2

g.l;p] = p

g.l\p 0.005 0.010 0.025 0.050 0.100 0.250 0.500 0.750 0.900 0.950 0.975 0.990 0.9951 0.000 0.000 0.001 0.004 0.016 0.102 0.456 1.325 2.706 3.842 5.027 6.636 7.8852 0.010 0.020 0.050 0.102 0.210 0.575 1.38 2.78 4.61 6.00 7.38 9.22 10.73 0.071 0.114 0.215 0.351 0.584 1.21 2.37 4.11 6.26 7.82 9.35 11.4 12.94 0.206 0.297 0.484 0.710 1.06 1.93 3.36 5.39 7.78 9.49 11.2 13.4 15.05 0.411 0.554 0.831 1.14 1.62 2.68 4.36 6.63 9.24 11.1 12.9 15.2 16.9

6 0.675 0.872 1.23 1.64 2.21 3.46 5.35 7.85 10.7 12.7 14.5 17.0 18.87 0.989 1.23 1.69 2.17 2.84 4.26 6.35 9.04 12.1 14.2 16.1 18.7 20.68 1.34 1.65 2.18 2.74 3.49 5.08 7.35 10.3 13.4 15.6 17.7 20.3 22.49 1.74 2.09 2.71 3.33 4.17 5.90 8.35 11.5 14.8 17.0 19.2 22.0 24.110 2.16 2.56 3.25 3.95 4.87 6.74 9.35 12.6 16.1 18.4 20.6 23.5 25.8

11 2.61 3.06 3.82 4.58 5.58 7.59 10.4 13.8 17.4 19.8 22.1 25.1 27.412 3.08 3.58 4.41 5.23 6.31 8.44 11.4 14.9 18.6 21.1 23.5 26.5 28.913 3.57 4.11 5.01 5.90 7.05 9.30 12.4 16.0 19.9 22.5 24.9 28.0 30.414 4.08 4.67 5.63 6.58 7.79 10.2 13.4 17.2 21.1 23.8 26.3 29.4 31.915 4.61 5.23 6.27 7.27 8.55 11.1 14.4 18.3 22.4 25.1 27.6 30.8 33.3

16 5.15 5.82 6.91 7.97 9.32 12.0 15.4 19.4 23.6 26.4 29.0 32.2 34.717 5.70 6.41 7.57 8.68 10.1 12.8 16.4 20.5 24.8 27.7 30.3 33.6 36.118 6.27 7.02 8.24 9.40 10.9 13.7 17.4 21.7 26.1 28.9 31.6 35.0 37.419 6.85 7.64 8.91 10.2 11.7 14.6 18.4 22.8 27.3 30.2 32.9 36.3 38.820 7.44 8.27 9.60 10.9 12.5 15.5 19.4 23.9 28.5 31.5 34.2 37.7 40.2

21 8.04 8.90 10.3 11.6 13.3 16.4 20.4 25.0 29.7 32.7 35.5 39.0 41.522 8.65 9.55 11.0 12.4 14.1 17.3 21.4 26.1 30.9 34.0 36.8 40.4 42.923 9.27 10.3 11.7 13.1 14.9 18.2 22.4 27.2 32.1 35.2 38.1 41.7 44.324 9.89 10.9 12.5 13.9 15.7 19.1 23.4 28.3 33.2 36.5 39.4 43.0 45.625 10.6 11.6 13.2 14.7 16.5 20.0 24.4 29.4 34.4 37.7 40.7 44.4 47.0

26 11.2 12.3 13.9 15.4 17.3 20.9 25.4 30.5 35.6 38.9 42.0 45.7 48.427 11.9 12.9 14.6 16.2 18.2 21.8 26.4 31.6 36.8 40.2 43.2 47.0 49.728 12.0 13.6 15.4 17.0 19.0 22.7 27.4 32.7 38.0 41.4 44.5 48.3 51.029 13.2 14.3 16.1 17.8 19.8 23.6 28.4 33.8 39.1 42.6 45.8 49.6 52.430 13.8 15.0 16.8 18.5 20.6 24.5 29.4 34.8 40.3 43.8 47.0 50.9 53.7

XI

Page 281: Estadística

Tablas de probabilidad

Tabla de cuantiles de la Distribucion t de Student P [tg.l ≤ tg.l;p] = p

g.l\p 0.7500 0.9000 0.9500 0.9750 0.9900 0.9950 0.99951 1.000 3.078 6.314 12.706 31.821 63.657 636.5892 0.816 1.886 2.920 4.303 6.964 9.922 31.5983 0.764 1.638 2.354 3.183 4.541 5.841 12.9034 0.740 1.534 2.132 2.777 3.748 4.605 8.6125 0.726 1.476 2.016 2.571 3.366 4.033 6.869

6 0.717 1.440 1.944 2.447 3.143 3.708 5.9617 0.711 1.415 1.895 2.365 2.999 3.500 5.4078 0.706 1.397 1.860 2.307 2.897 3.356 5.0429 0.702 1.384 1.834 2.263 2.822 3.251 4.78310 0.699 1.373 1.813 2.229 2.764 3.170 4.588

11 0.697 1.364 1.796 2.202 2.719 3.107 4.43912 0.695 1.357 1.783 2.179 2.682 3.055 4.32113 0.693 1.351 1.771 2.161 2.651 3.013 4.22214 0.692 1.346 1.762 2.145 2.625 2.978 4.14215 0.691 1.341 1.754 2.132 2.603 2.947 4.074

16 0.690 1.337 1.746 2.120 2.584 2.922 4.01817 0.689 1.334 1.740 2.110 2.568 2.899 3.96718 0.688 1.331 1.735 2.101 2.553 2.879 3.92319 0.687 1.328 1.730 2.094 2.540 2.862 3.88520 0.686 1.326 1.725 2.086 2.529 2.846 3.851

21 0.686 1.324 1.721 2.080 2.518 2.832 3.82122 0.685 1.322 1.718 2.074 2.509 2.819 3.79423 0.685 1.320 1.714 2.069 2.500 2.808 3.76824 0.684 1.318 1.711 2.064 2.493 2.798 3.74825 0.684 1.317 1.709 2.060 2.486 2.788 3.727

26 0.684 1.315 1.706 2.056 2.479 2.779 3.70827 0.683 1.314 1.704 2.052 2.473 2.771 3.69128 0.683 1.313 1.702 2.049 2.468 2.764 3.67629 0.683 1.312 1.700 2.046 2.463 2.757 3.66130 0.682 1.311 1.698 2.043 2.458 2.751 3.648

XII

Page 282: Estadística

Tablas de probabilidad

Tabla de cuantiles de la Distribucion F de Snedecor P [Fn1,n2 ≤ Fn1,n2;p] = p

n1

n2 1 2 3 4 5 6 7 8 10 12 24 60 120 ∞ p

1 39.9 49.5 53.6 55.8 57.2 58.2 58.9 59.4 60.2 60.7 62.0 62.8 63.1 63.3 0.901 161.4 199.5 215.7 224.6 230.2 234.0 236.8 238.9 241.9 243.9 249.1 252.2 253.3 254.3 0.951 647.8 799.5 864.2 899.6 921.8 937.1 948.2 956.6 968.6 976.7 997.3 1010 1014 1018.3 0.9751 4052 4999 5404 5624 5764 5859 5928 5981 6056 6107 6234 6313 6340 6366.0 0.99

2 8.53 9.0 9.16 9.24 9.29 9.32 9.35 9.37 9.39 9.40 9.45 9.47 9.48 9.49 0.902 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.40 19.41 19.45 19.48 19.49 19.50 0.952 38.51 39.00 39.17 39.25 39.30 39.33 39.36 39.37 39.40 39.41 39.46 39.48 39.49 39.50 0.9752 98.50 99.00 99.16 99.25 99.30 99.33 99.36 99.38 99.40 99.42 99.46 99.48 99.49 99.50 0.99

3 5.54 5.46 5.39 5.34 5.30 5.28 5.26 5.25 5.23 5.21 5.18 5.15 5.15 5.13 0.903 10.13 9.552 9.277 9.117 9.013 8.941 8.887 8.845 8.785 8.745 8.638 8.572 8.549 8.526 0.953 17.44 16.04 15.44 15.10 14.88 14.73 14.62 14.54 14.42 14.34 14.12 13.99 13.95 13.90 0.9753 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.23 27.05 26.60 26.32 26.22 26.13 0.99

4 4.54 4.32 4.19 4.11 4.05 4.0 3.98 3.95 3.92 3.89 3.93 3.79 3.77 3.76 0.904 7.709 6.944 6.591 6.388 6.256 6.163 6.094 6.041 5.964 5.912 5.774 5.688 5.658 5.628 0.954 12.218 10.649 9.979 9.604 9.364 9.197 9.074 8.980 8.844 8.751 8.511 8.360 8.309 8.257 0.9754 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.55 14.37 13.93 13.65 13.56 13.46 0.99

5 4.06 3.78 3.62 3.52 3.45 3.40 3.37 3.34 3.297 3.27 3.19 3.14 3.12 3.105 0.905 6.608 5.786 5.409 5.192 5.050 4.950 4.876 4.818 4.735 4.678 4.527 4.431 4.398 4.365 0.955 10.01 8.434 7.764 7.388 7.146 6.978 6.853 6.757 6.619 6.525 6.278 6.123 6.069 6.015 0.9755 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.05 9.888 9.466 9.202 9.112 9.020 0.99

6 3.77 3.46 3.29 3.18 3.11 3.05 3.01 2.98 2.94 2.90 2.82 2.76 2.74 2.722 0.906 5.987 5.143 4.757 4.534 4.387 4.284 4.207 4.147 4.060 4.000 3.841 3.740 3.705 3.669 0.956 8.813 7.260 6.599 6.227 5.988 5.820 5.695 5.600 5.461 5.366 5.117 4.959 4.904 4.849 0.9756 13.75 10.92 9.780 9.148 8.746 8.466 8.260 8.102 7.874 7.718 7.313 7.057 6.969 6.880 0.99

7 3.59 3.26 3.07 2.96 2.88 2.83 2.78 2.75 2.70 2.67 2.575 2.51 2.49 2.470 0.907 5.591 4.737 4.347 4.120 3.972 3.866 3.787 3.726 3.637 3.575 3.410 3.304 3.267 3.230 0.957 8.073 6.542 5.890 5.523 5.285 5.119 4.995 4.899 4.761 4.666 4.415 4.254 4.199 4.142 0.9757 12.25 9.547 8.451 7.847 7.460 7.191 6.993 6.840 6.620 6.469 6.074 5.824 5.737 5.650 0.99

8 3.46 3.11 2.92 2.80 2.72 2.67 2.62 2.59 2.54 2.50 2.40 2.34 2.316 2.292 0.908 5.318 4.459 4.066 3.838 3.688 3.581 3.500 3.438 3.347 3.284 3.115 3.005 2.967 2.928 0.958 7.571 6.059 5.416 5.053 4.817 4.652 4.529 4.433 4.295 4.200 3.947 3.784 3.728 3.670 0.9758 11.26 8.649 7.591 7.006 6.632 6.371 6.178 6.029 5.814 5.667 5.279 5.032 4.946 4.859 0.99

9 3.36 3.00 2.81 2.69 2.61 2.55 2.50 2.47 2.42 2.38 2.28 2.21 2.18 2.159 0.909 5.117 4.256 3.863 3.633 3.482 3.374 3.293 3.230 3.137 3.073 2.900 2.787 2.748 2.707 0.959 7.209 5.715 5.078 4.718 4.484 4.320 4.197 4.102 3.964 3.868 3.614 3.449 3.392 3.333 0.9759 10.56 8.022 6.992 6.422 6.057 5.802 5.613 5.467 5.257 5.111 4.729 4.483 4.398 4.311 0.99

XIII

Page 283: Estadística

Tablas de probabilidad

Tabla de cuantiles de la Distribucion F de Snedecor P [Fn1,n2 ≤ Fn1,n2;p] = p (Cont.)n1

n2 1 2 3 4 5 6 7 8 10 12 24 60 120 ∞ p

10 3.28 2.92 2.73 2.60 2.52 2.46 2.41 2.38 2.32 2.28 2.18 2.107 2.081 2.055 0.9010 4.965 4.103 3.708 3.478 3.326 3.217 3.135 3.072 2.978 2.913 2.737 2.621 2.580 2.538 0.9510 6.937 5.456 4.826 4.468 4.236 4.072 3.950 3.855 3.717 3.621 3.365 3.198 3.140 3.080 0.97510 10.04 7.559 6.552 5.994 5.636 5.386 5.200 5.057 4.849 4.706 4.327 4.082 3.996 3.909 0.99

11 3.22 2.85 2.66 2.53 2.45 2.39 2.34 2.30 2.248 2.208 2.10 2.026 1.999 1.972 0.9011 4.844 3.982 3.587 3.357 3.204 3.095 3.012 2.948 2.854 2.788 2.609 2.490 2.448 2.404 0.9511 6.724 5.256 4.630 4.275 4.044 3.881 3.759 3.664 3.526 3.430 3.173 3.004 2.944 2.883 0.97511 9.646 7.206 6.217 5.668 5.316 5.069 4.886 4.744 4.539 4.397 4.021 3.776 3.690 3.602 0.99

12 3.17 2.80 2.60 2.48 2.39 2.33 2.28 2.24 2.187 2.147 2.035 1.96 1.932 1.903 0.9012 4.747 3.885 3.490 3.259 3.106 2.996 2.913 2.849 2.753 2.687 2.505 2.384 2.341 2.296 0.9512 6.554 5.096 4.474 4.121 3.891 3.728 3.607 3.512 3.374 3.277 3.019 2.848 2.787 2.725 0.97512 9.330 6.927 5.953 5.412 5.064 4.821 4.640 4.499 4.296 4.155 3.780 3.535 3.449 3.361 0.99

14 3.10 2.72 2.52 2.39 2.31 2.24 2.19 2.15 2.095 2.053 1.937 1.857 1.828 1.797 0.9014 4.600 3.739 3.344 3.112 2.958 2.848 2.764 2.699 2.602 2.534 2.349 2.223 2.178 2.131 0.9514 6.298 4.857 4.242 3.892 3.663 3.501 3.380 3.285 3.147 3.050 2.789 2.614 2.552 2.487 0.97514 8.862 6.515 5.564 5.035 4.695 4.456 4.278 4.140 3.939 3.800 3.427 3.181 3.094 3.004 0.99

16 3.05 2.67 2.46 2.33 2.24 2.18 2.13 2.09 2.028 1.985 1.77 1.59 1.53 1.47 0.9016 4.494 3.634 3.239 3.007 2.852 2.741 2.657 2.591 2.494 2.425 2.235 2.106 2.059 2.010 0.9516 6.115 4.687 4.077 3.729 3.502 3.341 3.219 3.125 2.986 2.889 2.625 2.447 2.383 2.316 0.97516 8.531 6.226 5.292 4.773 4.437 4.202 4.026 3.890 3.691 3.553 3.181 2.933 2.845 2.753 0.99

18 3.01 2.62 2.41 2.28 2.19 2.13 2.08 2.04 1.976 1.933 1.74 1.56 1.50 1.44 0.9018 4.414 3.555 3.160 2.928 2.773 2.661 2.577 2.510 2.412 2.342 2.150 2.017 1.968 1.917 0.9518 5.978 4.560 3.954 3.608 3.382 3.221 3.100 3.005 2.866 2.769 2.503 2.321 2.256 2.187 0.97518 8.285 6.013 5.092 4.579 4.248 4.015 3.841 3.705 3.508 3.371 2.999 2.749 2.660 2.566 0.9920 2.97 2.59 2.38 2.25 2.16 2.09 2.04 1.998 1.936 1.892 1.730 1.543 1.482 1.420 0.90

20 4.351 3.493 3.098 2.866 2.711 2.599 2.514 2.447 2.348 2.278 2.082 1.946 1.896 1.843 0.9520 5.871 4.461 3.859 3.515 3.289 3.128 3.007 2.913 2.774 2.676 2.408 2.223 2.156 2.085 0.97520 8.096 5.849 4.938 4.431 4.103 3.871 3.699 3.564 3.368 3.231 2.859 2.608 2.517 2.421 0.99

24 2.93 2.54 2.33 2.19 2.10 2.035 1.98 1.94 1.877 1.831 1.701 1.510 1.447 1.383 0.9024 4.260 3.403 3.009 2.776 2.621 2.508 2.423 2.355 2.255 2.183 1.984 1.842 1.790 1.733 0.9524 5.717 4.319 3.721 3.379 3.155 2.995 2.874 2.779 2.640 2.541 2.269 2.080 2.010 1.935 0.97524 7.823 5.614 4.718 4.218 3.895 3.667 3.496 3.363 3.168 3.032 2.659 2.403 2.310 2.211 0.99

30 2.88 2.49 2.27 2.14 2.05 1.98 1.93 1.88 1.819 1.772 1.672 1.475 1.409 1.341 0.9030 4.171 3.316 2.922 2.690 2.534 2.421 2.334 2.266 2.165 2.092 1.887 1.740 1.683 1.622 0.9530 5.568 4.182 3.589 3.250 3.026 2.867 2.746 2.651 2.511 2.412 2.136 1.940 1.866 1.787 0.97530 7.562 5.390 4.510 4.018 3.699 3.473 3.305 3.173 2.979 2.843 2.469 2.208 2.111 2.006 0.99

XIV

Page 284: Estadística

Tablas de probabilidad

Tabla de cuantiles de la Distribucion F de Snedecor P [Fn1,n2 ≤ Fn1,n2;p] = p (Cont.)n1

n2 1 2 3 4 5 6 7 8 10 12 24 60 120 ∞ p

40 2.83 2.44 2.23 2.09 1.996 1.93 1.87 1.83 1.762 1.714 1.640 1.437 1.367 1.295 0.9040 4.085 3.232 2.839 2.606 2.449 2.336 2.249 2.180 2.077 2.003 1.793 1.637 1.577 1.509 0.9540 5.424 4.051 3.463 3.126 2.904 2.744 2.624 2.529 2.388 2.288 2.007 1.803 1.724 1.637 0.97540 7.314 5.178 4.313 3.828 3.514 3.291 3.124 2.993 2.801 2.665 2.288 2.019 1.917 1.805 0.99

50 62.68 9.47 5.15 3.79 3.14 2.77 2.52 2.35 2.12 1.97 1.62 1.41 1.34 1.26 0.9050 4.034 3.183 2.790 2.557 2.400 2.286 2.199 2.130 2.026 1.952 1.737 1.576 1.511 1.438 0.9550 5.340 3.975 3.390 3.054 2.833 2.674 2.553 2.458 2.317 2.216 1.931 1.721 1.639 1.545 0.97550 7.171 5.057 4.199 3.720 3.408 3.186 3.020 2.890 2.698 2.563 2.183 1.909 1.803 1.683 0.99

60 2.79 2.39 2.18 2.04 1.94 1.87 1.82 1.77 1.707 1.657 1.607 1.39 1.32 1.24 0.9060 4.001 3.150 2.758 2.525 2.368 2.254 2.167 2.097 1.993 1.917 1.700 1.534 1.467 1.389 0.9560 5.286 3.925 3.343 3.008 2.786 2.627 2.507 2.412 2.270 2.169 1.882 1.667 1.581 1.482 0.97560 7.077 4.977 4.126 3.649 3.339 3.119 2.953 2.823 2.632 2.496 2.115 1.836 1.726 1.601 0.99

80 62.92 9.478 5.146 3.782 3.131 2.75 2.50 2.33 2.09 1.946 1.589 1.372 1.293 1.207 0.9080 3.960 3.111 2.719 2.486 2.329 2.214 2.126 2.056 1.951 1.875 1.654 1.482 1.411 1.325 0.9580 5.218 3.864 3.284 2.950 2.730 2.571 2.450 2.355 2.213 2.111 1.820 1.599 1.508 1.400 0.97580 6.963 4.881 4.036 3.563 3.255 3.036 2.871 2.742 2.551 2.415 2.032 1.746 1.630 1.494 0.99

100 63.00 9.481 5.144 3.778 3.126 2.746 2.497 2.320 2.086 1.937 1.578 1.357 1.276 1.184 0.90100 3.936 3.087 2.696 2.463 2.305 2.191 2.103 2.032 1.927 1.850 1.627 1.450 1.376 1.283 0.95100 5.179 3.828 3.250 2.917 2.696 2.537 2.417 2.321 2.179 2.077 1.784 1.558 1.463 1.347 0.975100 6.895 4.824 3.984 3.513 3.206 2.988 2.823 2.694 2.503 2.368 1.983 1.692 1.572 1.427 0.99

120 2.75 2.35 2.13 1.99 1.89 1.82 1.77 1.72 1.652 1.601 1.571 1.347 1.264 1.168 0.90120 3.920 3.072 2.680 2.447 2.290 2.175 2.087 2.016 1.910 1.834 1.608 1.429 1.352 1.254 0.95120 5.152 3.805 3.227 2.894 2.674 2.515 2.395 2.299 2.157 2.055 1.760 1.530 1.433 1.310 0.975120 6.851 4.787 3.949 3.480 3.174 2.956 2.792 2.663 2.472 2.336 1.950 1.656 1.533 1.381 0.99

∞ 63.32 9.491 5.133 3.760 3.105 2.722 2.470 2.292 2.055 1.903 1.532 1.291 1.192 1.036 0.90∞ 3.841 2.996 2.605 2.372 2.214 2.099 2.010 1.938 1.831 1.752 1.517 1.318 1.221 1.000 0.95∞ 5.024 3.689 3.116 2.786 2.566 2.408 2.288 2.192 2.048 1.945 1.640 1.388 1.268 1.000 0.975∞ 6.635 4.605 3.782 3.319 3.017 2.802 2.639 2.511 2.321 2.185 1.791 1.473 1.325 1.000 0.99

XV

Page 285: Estadística

Grado en Ingeniería Informática

Examen de Estadística. 17 de Junio de 2011.

Apellidos y nombre______________________________________________________

DNI _____________________________________________________ Grupo: ______

1. [2 puntos] En una empresa, el 47% de los trabajadores son mujeres y el 53%

restante son hombres. De entre los hombres, el 8% gana más de 30000 euros al año

y de entre las mujeres el 4,3% gana más de 30000 euros al año.

De esta empresa se selecciona un empleado al azar:

a) ¿Cuál es la probabilidad de que gane más de 30000 euros al año?

b) Si se selecciona un empleado y se observa que gana más de 30000 euros al

año, ¿cuál es la probabilidad de que sea mujer?

2. [2 puntos] Sea X una variable aleatoria continua con función de densidad:

( ) ( )0 3

6 3 6

0 en otro caso

cx x

f x c x x

≤ ≤= − < ≤

a) Hallar la constante c para que ( )f x sea una función de densidad.

b) Obtener la función de distribución. c) Calcular las siguientes probabilidades:

i. [ ]3P X >

ii. [ ]3P X =

iii. [ ]1,5 4,5P X≤ ≤

d) Calcular [ ]E X .

3. [2 puntos] Se quiere comparar la cantidad de CO2 emitido durante el proceso de

fabricación de un producto cuando se utilizan dos métodos diferentes. En una

experiencia de laboratorio se han obtenido dos muestras de tamaños 7 y 5. Los datos

obtenidos son:

Método 1 123 129 128 116 122 126 131

Método 2 173 182 181 175 179

a) Contrastar, con un nivel de significación del 10%, si se puede admitir que los

dos métodos dan resultados con la misma varianza.

b) Calcular un intervalo de confianza para la diferencia de medias con una

confianza del 95%. ¿Se pueden considerar iguales las medias?

4. [2 puntos] Resolver los siguientes problemas de optimización:

3

. . 2 6

3 9

, 0

Max x y

s a x y

x y

x y

++ ≤

+ ≤≥

3

. . 4

2 4

, 0

Min x y

s a x y

x y

x y

− +− ≤+ ≥

Page 286: Estadística

5. [2 puntos] Se chequea un nuevo programa que opera con parámetros, de forma que

se observa el tiempo que tarda en ejecutarse este programa según el número de

parámetros que se le ponen. Una vez obtenidos los datos, se realiza un análisis de

regresión con Statgraphics que da el siguiente resultado: Análisis de Regresión - Modelo Lineal Y = a + b*X --------------------------------------------------- -------------------------- Variable dependiente: tiempo Variable independiente: parametros --------------------------------------------------- -------------------------- Error Estadíst ico Parámetro Estimación estándar T P-Valor --------------------------------------------------- -------------------------- Ordenada -24,654 1,82036 -13,5 434 0,0000 Pendiente 5,58251 0,156181 35,7 439 0,0000 --------------------------------------------------- -------------------------- Coeficiente de Correlación = 0,963722 R-cuadrado = 92,876 porcentaje

Análisis de Regresión - Modelo Lineal Y = a + b*X --------------------------------------------------- -------------------------- Variable dependiente: parametros Variable independiente: tiempo --------------------------------------------------- -------------------------- Error Estadíst ico Parámetro Estimación estándar T P-Valor --------------------------------------------------- -------------------------- Ordenada 4,82761 0,21396 22,5 631 0,0000 Pendiente 0,166369 0,00465449 35,7 439 0,0000 --------------------------------------------------- -------------------------- Coeficiente de Correlación = 0,963722 R-cuadrado = 92,876 porcentaje

Análisis de Regresión Polinomial --------------------------------------------------- -------------------------- Variable dependiente: tiempo --------------------------------------------------- -------------------------- Error Estadístico Parámetro Estimación Estándar T P-Valor --------------------------------------------------- -------------------------- CONSTANTE -2,15311 0,82035 -2,62463 0,0101 parametros -0,475745 0,180173 -2,64049 0,0096 parametros^2 0,288795 0,00834117 34,6228 0,0000 --------------------------------------------------- -------------------------- R-cuadrado = 99,4667 porcentaje

Análisis de Regresión Polinomial --------------------------------------------------- -------------------------- Variable dependiente: parametros --------------------------------------------------- -------------------------- Error Estadístico Parámetro Estimación Estándar T P-Valor --------------------------------------------------- -------------------------- CONSTANTE 3,76853 0,137562 27,395 0,0000 tiempo 0,287005 0,00844388 33,9897 0,0000 tiempo^2 -0,00133888 0,0000892757 -14,9972 0,0000 --------------------------------------------------- -------------------------- R-cuadrado = 97,8534 porcentaje

Contesta razonadamente a las siguientes cuestiones:

a) Dados los resultados, ¿cuál de estos ajustes es el mejor?

b) Escribir la expresión del modelo seleccionado.

c) ¿Qué valor tiene la constante del modelo? ¿Qué significado tiene?

d) Hacer una predicción de cuánto será el tiempo de ejecución si el número de

parámetros es igual a 23.

Page 287: Estadística

Examen Estadística Convocatoria Septiembre Grado en Ingeniería Informática

1/09/2011

Apellidos y Nombre: _________________________________________ D.N.I.: ________________

Titulación: _____________________________

1. [3 puntos] Se ha consultado a 50 automovilistas sobre sus ingresos totales anuales y el precio de su

coche. Los datos obtenidos fueron los siguientes:

Precio

(en miles de euros)

Ingresos ( en miles de euros)

[5,15] (15,25] (25,50] (50,100]

[6, 16] 13 9 0 0

(16, 24] 0 19 0 0

(24, 50] 0 0 8 0

(50, 100] 0 0 0 1

a) ¿Cuál es el precio más frecuente de los automovilistas que tienen unos ingresos anuales entre 15

y 50 mil euros?

b) ¿Qué ingresos mínimos tienen la mitad de los automovilistas que más ingresos tienen?

c) ¿Cuál de las dos variables es más homogénea?

d) Calcula la recta de regresión que determina el precio en función de los ingresos.

e) Determina el grado de relación lineal entre las variables. Comenta el resultado.

f) ¿Cuál sería el precio para un automovilista que tuviera unos ingresos de 22 mil euros?

g) ¿Qué fiabilidad tiene el resultado obtenido en el apartado anterior?

2. [2 puntos] La producción de una factoría se realiza en cuatro máquinas M1, M2, M3, y M4. La

producción diaria para M1 es 600, para M2 500, para M3 350 y 250 para M4. Además se sabe que los

porcentajes de piezas defectuosas producidas por cada una de las máquinas es la siguiente: 4% para

M1, 3,5% para M2, 4,6% para M3 y 2% para M4.

a) Si las piezas se almacenan conjuntamente ¿cuál es la probabilidad de que al extraer una pieza, al

azar, esta sea defectuosa?

b) Se ha extraído una pieza que ha resultado ser defectuosa, ¿cuál es la probabilidad de que

proceda de M2?

3. [2 puntos] El volumen que una máquina de llenado automático deposita en latas de una bebida

gaseosa tiene una distribución normal con media 34 cl. y desviación típica 1,5 cl.

a) Si se desechan aquellas latas que tienen menos de 33 cl., ¿cuál es la probabilidad de que una lata

sea desechada?

b) Si se tienen 10 latas llenadas con esta máquina, ¿cuál es la probabilidad de que ninguna lata sea

desechada?

c) Si se tienen 500 latas llenadas con esta máquina, ¿cuál es la probabilidad de que al menos 100

latas sean desechadas?

4. [1 punto] Optimizar las siguientes funciones:

a) 4 2 2( , ) 8 4f x y x x y y= + + −

b) 3 2( , ) 3f x y x xy y= + + +

Page 288: Estadística

Examen Estadística Convocatoria Septiembre Grado en Ingeniería Informática

1/09/2011

5. [2 puntos] Se quiere comparar la resistencia al calor de dos materiales diferentes que se utilizan

para la fabricación de componentes de una fuente de alimentación. Para hacer el estudio, se

recogen muestras del tiempo de exposición a un calor extremo que soportan las piezas fabricadas

con ambos materiales. Las variables tiempo de resistencia con los distintos tipos de materiales se

suponen independientes y con distribución normal. Los datos se tratan con Statgraphics, obteniendo

los siguientes resultados:

95,0% intervalo de confianza para la media de tiempo material A: 4,85387 +/- 0,162751 [4,69112,5,01662]

95,0% intervalo de confianza para la media de tiempo material B: 4,67677 +/- 0,22222 [4,45455,4,89899]

95,0% intervalos de confianza para la diferencia de medias:

suponiendo varianzas iguales: 0,177097 +/- 0,269784 [-0,092687,0,446881]

sin suponer varianzas iguales: 0,177097 +/- 0,27029 [-0,0931932,0,447387]

contrastes t de comparación de medias

Hipótesis nula: media1 = media2

Hipótesis alt.: media1 <> media2

suponiendo varianzas iguales: t = 1,31308 P-Valor = 0,194157

contrastes t de comparación de medias

Hipótesis nula: media1 = media2

Hipótesis alt.: media1 <> media2

sin suponer varianzas iguales: t = 1,31308 P-Valor = 0,19461

Comparación de Desviaciones Típicas

-----------------------------------

tiempo material A tiempo material B

------------------------------------------------------------

Desviación Típica 0,443702 0,605829

Varianza 0,196871 0,367029

GL 30 30

Cociente de varianzas = 0,536391

95,0% Intervalos de Confianza

Desviación Típica de tiempo material A: [0,354567;0,593084]

Desviación Típica de tiempo material B: [0,484126;0,809796]

Cociente de varianzas: [0,258633;1,11244]

Contrastes F para comparar varianzas

Hipótesis nula: sigma1 = sigma2

(1) Hipótesis alt.: sigma1 <> sigma2

F = 0,536391 P-Valor = 0,0932622

Contesta razonadamente a las siguientes preguntas:

a) ¿En qué muestra hay un tiempo medio de resistencia mayor?

b) ¿En qué muestra hay una mayor variabilidad en los resultados?

c) ¿Son estas diferencias significativas, o por el contrario puede admitirse que las medias y

desviaciones son iguales? (utilizar un nivel de significación del 5%)