Apuntes de Probabilidad y Estadistica

55
UNIVERSIDAD AUTÓNOMA DE BAJA CALIFORNIA FACULTAD DE INGENIERÍA ARQUITECTURA Y DISEÑO TRONCO COMÚN INGENIERÍA APUNTES DE LA UNIDAD DE APRENDIZAJE DE PROBABILIDAD Y ESTADÍSTICA. M.I. JULIÁN ISRAEL AGUILAR DUQUE DR. JORGE LIMÓN ROMERO M.C. RICARDO VIDAL TALAMANTES DR. RUBÉN CAMPOS GAYTAN FIS. TANIA ANGÉLICA LÓPEZ CHICO ING. MANUEL OTHON FIGUEROA

description

Apuntes de probabilidad y estadistica

Transcript of Apuntes de Probabilidad y Estadistica

  • UNIVERSIDAD AUTNOMA DE BAJA

    CALIFORNIA

    FACULTAD DE INGENIERA ARQUITECTURA Y DISEO

    TRONCO COMN INGENIERA

    APUNTES DE LA UNIDAD DE APRENDIZAJE DE PROBABILIDAD

    Y ESTADSTICA.

    M.I. JULIN ISRAEL AGUILAR DUQUE

    DR. JORGE LIMN ROMERO

    M.C. RICARDO VIDAL TALAMANTES

    DR. RUBN CAMPOS GAYTAN

    FIS. TANIA ANGLICA LPEZ CHICO

    ING. MANUEL OTHON FIGUEROA

  • UNIDAD 1: ESTADSTICA DESCRIPTIVA

    1.1 CONCEPTOS Estadstica: Es una coleccin de mtodos para planear experimentos, obtener datos y despus organizar, resumir, presentar, analizar, interpretar y llegar a conclusiones basadas en los datos. Datos: Son las observaciones recolectadas (como mediciones, gneros, respuestas de encuestas). Poblacin: Es la coleccin completa de todos los elementos (puntuaciones, personas, mediciones, etc) a estudiar. Se dice que la coleccin es completa pues incluye a todos los sujetos que se estudiaran. Censo: Es la coleccin de datos de cada uno de los miembros seleccionados de una poblacin. Muestra: Es un subconjunto de miembros seleccionados de una poblacin. Variabilidad: Por variabilidad se entiende por observaciones sucesivas de un sistema o fenmeno que no producen el mismo resultado. Parmetro: Es una medicin numrica que describe alguna caracterstica de una poblacin. Estadstico: Es una medicin numrica que describe alguna caracterstica de una muestra. Datos Cuantitativos: consisten en nmeros que representan conteos o mediciones. Datos cualitativos: Se les llama tambin categricos o de atributo, se distinguen en alguna caracterstica no numrica. Datos Discretos: Resultan cuando el numero de posibles valores es un numero finito o bien un numero que puede contarse. Es decir el numero de posibles valores 0, 1, 2, 3, etc Datos Continuos (numricos): Resultan de un infinito de posibles valores que pueden asociarse a puntos de alguna escala continua, cubriendo un rango de valores sin huecos ni interrupciones.

    1.2 MEDIDAS DE TENDENCIA CENTRAL MEDIA: Es el valor promedio de todos las observaciones del conjunto de datos que puede ser una muestra o una poblacin. Por lo general, estos datos son una muestra de observaciones que se ha seleccionado de una poblacin de observaciones ms grande. Media muestral. Si se trata de datos de una muestra, la cantidad total de observaciones de esa muestra se

    denota con n. Si las n observaciones de una muestra se denotan por 1X , 2X nX ,

    entonces la media muestral es:

    n

    XXXX n

    ...21=

    n

    Xn

    i

    i1

  • Media poblacional. Si se trata de datos de una poblacin, la cantidad total de observaciones de esa poblacin se

    denota N. Si las N observaciones de una poblacin se denotan por 1X , 2X NX , entonces

    la media poblacional es:

    N

    XN

    i

    i 1

    MEDIANA: Es una medida de tendencia central que divide los datos ordenados de menor a mayor, en dos partes iguales, una mitad queda debajo de la mediana y la otra mitad queda arriba de ella. Si el nmero de observaciones es par, la mediana est a la mitad de dos valores centrales y si el nmero de observaciones es impar, la mediana es el valor central. Caso 1: Si el nmero de observaciones es impar:

    Mediana 2

    1~ nX

    Caso 2: Si el nmero de observaciones es par:

    Mediana 2

    122~

    nyn

    X

    Moda: Es el valor de los datos que se repite con mayor frecuencia. COMPARACIN ENTRE LA MEDIA Y LA MEDIANA Aunque la media y la mediana nos sitan de alguna forma en el centro, la media es sensible a la magnitud de los valores de cada uno de sus lados mientras que la mediana solo es sensible al nmero de valores de dichos lados. Ejemplo 1.1 El propietario de una pequea empresa tiene 15 empleados. 5 ganan $25.000 al ao, 7 ganan de $30.000 y 3 de $40.000. El sueldo anual del propietario es de $153.000. (a) Hallar la media y la mediana de los sueldos de las 16 personas de la empresa. (b) Hallar la media y la mediana de los sueldos si se incrementa el sueldo del propietario en $80.000.

    a) La media del salario es:

    16

    000.153$000.40$3000.30$7000.25$5 = 000,38

    16

    000,608

    La mediana del salario es: Nmero par n=16

    9,82

    12

    ,2~

    nn

    X

    El valor 8 es 30,000 y el valor 9 es 30,000

  • 000,30

    2

    000,30000,30~

    X

    Salarios Frecuencia Frecuencia Acumulada

    25.000 5 5 30.000 7 12 40.000 3 15

    153.000 1 16

    b) Nuevo Salario Medio:

    000.4316

    000.688

    16

    000.80000.608

    Nota: La Mediana seguir siendo la misma.

    1.3 MEDIDAS DE DISPERSIN

    VARIANZA: Es un valor numrico que describe la variabilidad o dispersin de los datos.

    Si 1x , 2x nx es una muestra de n observaciones, entonces la varianza muestral es:

    1

    1

    2

    2

    n

    Xx

    S

    n

    i

    i

    Si 1x , 2x Nx es una poblacin de N observaciones, entonces la varianza poblacional es:

    N

    xN

    i

    i

    1

    2

    2

    DESVIACIN ESTNDAR: Es la mediad ms usual de la variabilidad y mide qu tan esparcidos estn los datos respecto a la media. Es igual a la raz cuadrada de la varianza. Desviacin estndar muestral

    1

    1

    2

    n

    Xx

    S

    n

    i

    i

    1

    ...22

    2

    2

    1

    n

    XxXxXxS n

    Donde x1, x2,,x n son observaciones numricas de la muestra, n su tamao y es la media muestral

  • Desviacin estndar poblacional

    N

    XN

    i

    i

    1

    2

    N

    xxx N22

    2

    2

    1 ...

    Donde x1, x2,,x n son observaciones numricas de la poblacin, N el tamao y es la media poblacional RANGO: Es la diferencia entre el valor ms grande y el ms pequeo de un conjunto de datos.

    Si las observaciones de una muestra se denotan por 1x , 2x nx entonces el rango muestral es:

    r = max ii XX min

    Significado de la desviacin estndar en un grupo de datos.

    Consideremos las dos muestras con los siguientes valores numricos

    X S

    Serie A 12 10 9 9 10 10 1.22 Serie B 5 10 16 15 4 10 5.52

    Ejercicio 1. Conteste las siguientes preguntas. Por qu tienen la misma media? Por qu tienen diferente desviacin estndar?

    1.4 TABLAS DE FRECUENCIA E HISTOGRAMAS Una de las primeras cosas que normalmente se hace con una serie grande de datos, es formar algn tipo de TABLA DE FRECUENCIAS, que es una tabla de que clasifica los datos por magnitud, en base al nmero de veces que ocurre un suceso individual o el nmero de sucesos que entran en un intervalo dado. A su vez el HISTOGRAMA es la representacin grfica de la tabla de frecuencias por medio de un diagrama de barras donde la altura de cada barra indica el nmero de veces que el nmero dado aparece en la serie, o el nmero de valores que caen dentro de un intervalo. En el caso de datos discretos, la tabla de frecuencias se elabora ordenando las observaciones en una columna, mientras que en una segunda columna se indica la frecuencia o el nmero de veces que ocurri ese suceso. En una tercera columna se indican la frecuencia acumulada, que es la suma de la frecuencia relativa de la observacin y las que le anteceden. Ejemplo 1.2 Un edificio tiene 45 apartamentos con el siguiente nmero de inquilinos;

    2 1 3 5 2 2 2 1 4 2 6 2 4 3 1 2 4 3 1 4 4 2 4 4 2 2 3 1 4 2 3 1 5 2 4 1 3 2 4 4 2 5 1 3 4

  • Tabla de frecuencias

    Nmero de personas Frecuencia relativa Frecuencia acumulada

    1 8 8 2 14 22 3 7 29 4 12 41 5 3 44 6 1 45

    Total: 45

    C1

    Frec

    uenc

    ia

    654321

    14

    12

    10

    8

    6

    4

    2

    0

    Histograma para el nmero de inquilinos por departamento

    Procedimiento para construir una tabla de frecuencias

    1.- Localizar el dato menor y el dato mayor del grupo de datos. 2.- Calcular el rango.

    3.- Determinar el nmero de intervalos de clase a utilizar un nmero aproximado a .n

    4.- Determinar el ancho de clase dividiendo el rango entre el nmero de intervalos calculado en el paso 3. Nota: si el ancho de clase no es un nmero entero, aumentar el rango a un nmero

    que se pueda dividir entre el nmero de intervalos de clase .n

    5.- Determinar los intervalos de clase, indicando los lmites o fronteras de cada uno. 6.- Calcular la marca de clase o punto medio, sumando los lmites de clase de cada intervalo y dividiendo esta suma entre 2. 7.- Localizar en el grupo de datos el nmero de valores que caen dentro de cada intervalo, el cual ser su frecuencia. La suma de las frecuencias deber ser igual a n. 8.- Calcular la frecuencia acumulada, sumando para cada intervalo su frecuencia con todas las frecuencias de los intervalos que lo anteceden. La frecuencia acumulada de la ltima clase deber ser igual a n. 9.- Calcular la frecuencia relativa de cada clase, dividiendo su frecuencia entre el nmero de datos (n). La suma de las frecuencias relativas debe ser igual a 1. Ejemplo 1.3 Los siguientes son datos de la resistencia a la comprensin de 80 ejemplares de prueba de una aleacin aluminio litio.

  • Resultados (en Psi)

    105 221 183 186 121 181 180 143

    97 154 153 174 120 168 167 141

    245 228 174 199 181 158 176 110

    163 131 154 115 160 208 158 133

    207 180 190 193 194 133 156 123

    134 178 76 167 184 135 229 146

    218 157 101 171 165 172 158 169

    199 151 142 163 145 171 148 158

    160 175 149 87 160 237 150 135

    196 201 200 176 150 170 118 149

    1.- 245max X 76min X

    2.- Rango= 16976245minmax XX

    Nuevo Rango = 250-70=180

    3.- # de intervalos = n=80 = 80 9

    4.- Ancho de clase = 180/9 = 20

    5.-Intervalo de clase (Psi)

    6.-Marca de clase

    7.-Frecuencia 8.-Frecuencia Acumulada

    9.-Frecuencia Relativa

    70 X

  • Media para datos agrupados:

    X =

    n

    nn

    ffff

    XfXfXfXf

    ...

    ...

    321

    332211

    n

    i

    i

    n

    i

    ii

    f

    Xf

    1

    1

    Donde: nXXX ..., 21 son las marcas de clase

    Mediana para datos agrupados: Se calcula utilizando la distribucin de frecuencias acumuladas. Varianza muestral para una distribucin de frecuencias.

    2S

    1...

    ...

    21

    22

    22

    2

    11

    n

    nn

    fff

    XXfXXfXXf

    11

    1

    2

    n

    i

    i

    n

    i

    Ii

    f

    XXf

    Donde: nXXX ..., 21 son las marcas de clase.

    La media para datos agrupados es:

    X =

    80

    240222042001018017160221401412061003802

    X = 80

    4808802000306035201960720300160

    X = 13080 / 80= 163.5 La mediana para datos agrupados es:

    X~

    =

    2

    122

    nyn

    valores 41,40

    X~

    =

    2

    160160= 160

    Varianza muestral para una distribucin de frecuencias.

    222222 5.163160225.163140145.16312065.16310035.163802 S +

    15.16324025.16322045.163200105.16318017 2222 n

    2S = 13944.5+12096.8+11353.5+7731.5+269.5+4628.25+13322.5+12769+11704.5

    2S = 79

    05.878201111.646

    S =33.34

  • Ejemplo 1.4 Supongamos que la temperatura (en grados Fahrenheit) medidas a las 6:00 pm Durante un periodo de 35 das son las siguientes:

    72 78 86 93 106 107 98 82 81 77 87 82

    91 95 92 83 76 78 73 81 86 92 93 84

    107 99 94 86 81 77 73 76 80 88 91

    Con estos datos construir una tabla de frecuencias con su histograma correspondiente, adems de calcular su media, mediana y desviacin estndar.

    1.- 107max X 72min X

    2.-rango=107-72=35 4070110 rangoN

    3.-No. de intervalos= "8"691.535

    4.-Ancho de clase= 58

    40

    5.-Intervalo de clase 6.-Marca de clase 7.-Frecuencia 8.-Frecuencia Acumulada

    70 X

  • 1.5 GRFICA DE TALLO Y HOJA

    Es una forma adecuada de obtener una representacin visual informativa de un grupo de datos

    ,,..., 21 nXXX donde cada nmero iX tiene al menos dos dgitos. Para construir un diagrama de

    tallo y hoja, cada nmero iX se divide en dos partes: un tallo compuesto por uno o ms de los

    primeros dgitos y una hoja compuesta por los dgitos restantes. En general debern elegirse relativamente pocos tallos en comparacin con el nmero de observaciones. La mejor eleccin suele ser entre 5 y 20 tallos. Una vez que se ha elegido un conjunto de tallos, se enlistan en el margen izquierdo del diagrama. Enseguida de cada tallo se enlistan todas las hojas correspondientes a los valores de los datos observados en el orden en que se van encontrando en el conjunto de datos. En algunas ocasiones se ordenan las hojas de menor a mayor en cada tallo. A esta forma de presentacin suele llamarse representacin ordenada de tallo y hoja, la cual hace relativamente sencillo determinar caractersticas de los datos tales como los percentiles, los cuartiles y la mediana. Ejemplo 1.5 Utilizar los datos de la resistencia a la comprensin (ejemplo 1.3) para construir un diagrama de tallo y hoja.

    Tallo Hoja Frecuencia

    7 6 1

    8 7 1

    9 7 1

    10 51 2

    11 580 3

    12 103 3

    13 413535 6

    14 295836169 8

    15 471340886808 12

    16 3073050879 10

    17 8544162106 10

    18 0361410 7

    19 960934 6

    20 7108 4

    21 8 1

    22 189 3

    23 7 1

    24 5 1

  • Presentacin ordenada de Tallo y Hoja

    Tallo Hoja Frecuencia

    7 6 1

    8 7 1

    9 7 1

    10 15 2

    11 058 3

    12 013 3

    13 133455 6

    14 123566899 8

    15 001344678888 12

    16 0003357789 10

    17 0112445668 10

    18 0011346 7

    19 034699 6

    20 0178 4

    21 8 1

    22 189 3

    23 7 1

    24 5 1

    1.6 MEDIDAS DE POSICIN: CUARTILES Y PERCENTILES CUARTILES: Cuando un conjunto ordenado de datos se divide en cuatro partes iguales, el

    valor que marca cada una de estas divisiones se le conoce como cuartil o cuartil inferior, ,1q es

    un valor que tiene aproximadamente una cuarta parte (25%) de las observaciones abajo de el y

    aproximadamente 75% de las observaciones arriba. El segundo cuartil, 2q , tiene

    aproximadamente la mitad (50%) de las observaciones abajo de su valor es exactamente igual

    a la mediana. El tercer cuartil, ,3q tiene aproximadamente tres cuartas partes (75%) de las

    observaciones debajo de su valor.

    PERCENTILES: Supongamos n valores colocados en orden creciente. El Percentil k que

    llamamos kP , es el numero para el cual el k por ciento de los valores son menores de kP , y

    el (100-k) por ciento son superiores. Los Percentiles mas utilizados son el 25P , 50P Y 75P , los

    cuales se corresponden en el cuartil nmero 1 1q , el cuartil nmero 2 2q y el cuartil nmero 3 3q respectivamente. Concretamente kP se define como siguiente:

    Primero: Calcular 100

    kn y partirlo en su parte entera I y su parte decimal D, es decir:

    DIkn 100

    1IValor Cuando 0D

    2

    1 IValorValorI Cuando D 0

    kP

  • Ejemplo 1.6

    Supongamos 50 datos colocados en orden creciente. Hallar 35Pa y 30Pb . a) Dado 50n y 35k as

    I D

    0,5.0175.17100

    5035100

    dadoDkn

    Entonces 181 IPk .181835 valorP

    b) Dado 50n y 30k I D

    dadokn ,0150.15100

    1500100

    5030100

    0queD

    Entonces

    2

    1615

    2

    130

    valorvalorIvalorvalorIP

    Ejercicio encontrar: P25, P50 y P75 para:

    a) Los datos para la resistencia a la compresin (ejemplo 1.3) b) Los datos de las temperaturas (ejemplo 1.4)

    a)

    1442

    145143

    2

    21200.20

    1008025

    100 25125

    PqPkn

    5.161

    2

    163160

    2

    41400.40

    1008050

    50250

    PqP

    181

    2

    181181

    2

    61600.60

    1008075

    75375

    PqP

    b) 35,,, 755025 nPPP

    789175.8100

    352525125 valorIvalorPqp

    86185.17

    1003550

    50250 valorPqP

    932725.26

    1003575

    75375 valorPqP

  • 1.7 GRFICA DE CAJA El diagrama de tallo y hoja y el histograma proporcionan una impresin visual acerca de un conjunto de datos, mientras que el promedio y la desviacin estndar mustrales proporcionan informacin cuantitativa acerca de las caractersticas especificas de los datos. El diagrama de caja es una representacin grfica que muestra simultneamente varias caractersticas importantes de los datos, tales la localizacin o la tendencia central, la dispersin o variabilidad, el apartamiento de la simetra y la identificacin de observaciones que se localizan inusualmente lejos del grueso de los datos (a estas observaciones se les conoce como puntos atpicos). Un diagrama de caja muestra los tres cuartiles as como el mnimo y el mximo de los datos, en una caja rectangular alineada sea horizontal o verticalmente. La caja abarca el rango

    intercuartlico con el lado izquierdo (o inferior) en el primer cuartil 1q y el lado derecho (o

    superior) en el tercer cuartil 3q . Se traza una lnea por la caja en el segundo cuartil (que es

    quincuagsimo percentil o la mediana).Se extiende una lnea de ambos extremos hasta los valores ms lejanos. Estas lneas suelen llamarse bigotes. En algunos programas de

    computadora los bigotes solo se extienden a lo sumo una distancia de 135.1 qq de los extremos de la caja y las observaciones localizadas despus de estos lmites se marcan como puntos atpicos potenciales. Esta variante se conoce como el diagrama de caja modificado. Ejemplo 1.7 Construir un diagrama de caja con los datos de la siguiente tabla, los cuales son dimetros (en mm) de las perforaciones en un grupo de 12 sub-ensambles del borde principal de las alas para un avin de transporte comercial.

    Tabla de datos para los dimetros: paso 1: Ordenar los datos

    Frmula: 100

    kn

    0.3100

    12251 q

    35.120

    24.1203.120

    1 q

    0.6100

    12502 q

    60.120

    27.1205.120

    2 q

    0.9100

    12753 q

    9.120

    29.1209.120

    3 q

    Rango Intercuartlico= 55.035.1209.12013 qq

    Lmite superior (bigote)= 73.12155.05.19.1205.1 133 qqq Lmite inferior (bigote)= 53.11955.05.135.1205.1 131 qqq NOTA: No tiene valor atpico EJERCICIO: Hacer el diagrama de caja para los datos de la resistencia a la compresin.

    120.5 120.4 120.7

    120.9 120.2 121.1

    120.3 120.1 120.9

    121.3 120.5 120.8

    (1)120.1 (5)120.5 (9)120.9

    (2)120.2 (6)120.6 (10)120.9

    (3)120.3 (7)120.7 (11)121.1

    (4)120.4 (8)120.8 (12)121.3

    120.1 120.35 120.9

    121.3 120.6

  • Ejemplo 1.8 Un ingeniero de desarrollo de productos est interesado en maximizar la resistencia o la tencin de una nueva fibra sinttica que se emplear en la manufactura de tela para camisas de hombre. El ingeniero sabe por experiencia que la resistencia es influida por el porcentaje de algodn presente en la fibra. Adems l sospecha que elevar el contenido de algodn incrementar la resistencia, al menos inicialmente entre 10% y 40% para que la tela resultante tenga otras caractersticas de calidad que se desean (como capacidad para recibir un tratamiento de planchado permanente). El ingeniero decide probar muestras a cinco niveles de porcentaje de algodn: 15, 20, 25, 30 y 35%. Asimismo, decide ensayar cinco muestras a cada nivel de contenido de algodn. Los resultados se muestran en la siguiente tabla:

    Porcentaje de algodn

    Observaciones 1 2 3 4 5

    15 7 7 15 11 9

    20 12 17 12 18 18

    25 14 18 18 19 19

    30 19 25 22 19 23

    35 7 10 11 15 11

    Con esta informacin construir el diagrama de caja para cada porcentaje de algodn y decidir que porcentaje es el que debe utilizarse. Ordenar los datos para cada porcentaje

    Porcentaje de algodn

    Observaciones 1 2 3 4 5

    15 7 7 9 11 15

    20 12 12 17 18 18

    25 14 18 18 19 19

    30 19 19 22 23 25

    35 7 10 11 11 15

    Algodn al 15%

    15,7

    935.2100

    550

    min

    22

    maXX

    valorqq

    11475.3

    100575

    7225.1100

    525

    33

    11

    valorqq

    valorqq

  • Algodn al 20 %

    18,17,12 321 qqq 18,12 maxmin XX

    Algodn al 25%

    19,18,18 321 qqq 19,14 maxmin XX

    Algodn al 30%

    23,22,19 321 qqq 25,19 maxmin XX

    Algodn al 35%

    11,11,10 321 qqq 15,7 maxmin XX

    Grfica de cajas con valores de las medianas mostrados

    Grfica de cajas con valores individuales mostrados

    % de Algodn

    Re

    sis

    ten

    cia

    PS

    I

    3530252015

    25

    20

    15

    10

    5

    % de

    30

    35

    Algodn

    15

    20

    25

    11

    22

    1817

    9

    Resistencia por porcentaje de Algodn

    % de Algodn

    Re

    sis

    ten

    cia

    PS

    I

    3530252015

    25

    20

    15

    10

    5

    % de

    30

    35

    Algodn

    15

    20

    25

    11

    22

    1817

    9

    Resistencia por porcentaje de Algodn

  • UNIDAD II.- PROBABILIDAD

    2.1 CONCEPTOS BSICOS Y TEORA DE CONJUNTOS Un conjunto se puede comprender como cualquier coleccin de objetos bien definidos,

    llamados elementos o miembros del conjunto. Normalmente se utilizan las letras maysculas A, B, X, Ypara nombras los conjuntos y las minsculas a, b, x, ypara los elementos de los conjuntos. La afirmacin de que un elemento a pertenece a un conjunto S se escribe:

    Sa Si cada elemento de un conjunto A, tambin pertenece a un conjunto B, es decir si

    Aa implica que ,Ba entonces A se llama subconjunto de B, o se dice que A esta incluido

    en B y se escribe:

    BA IDENTIFICACION DE CONJUNTOS

    Hay dos maneras de identificar u conjunto particular, una forma es si es posible, es enumerar sus elementos, por ejemplo:

    9,7,5,3,1A a esta forma se le llama por extensin. La segunda forma llamada por comprensin, consiste en definir las propiedades que

    caracterizan a los elementos del conjunto, por ejemplo:

    XXB : es un nmero par entero, X >O

  • Resistencia a la compresin 1.3

    Nota: Minitab (Diagrama de tallo y de hoja)

    X =162.662 S =33.77 2S =1140.63

    5.37

    181

    5.161

    5.143

    3

    2

    1

    IQR

    q

    q

    q

    Compresion 1.3 MEDIDAS DE POSICION: CUARTILES Y PERCENTILES

    41

    1

    nQ

    412

    2

    nQ

    413

    3

    nQ

    Donde: an el nmero de observaciones, si el resultado no es un nmero entero, se utiliza la interpolacin.

    Ejemplo: 10n

    75.24

    110 As 1Q est entre 2X Y 3X

    Entonces: 2321 75.0 XXXQ

    25.84

    11033

    Q

    Entonces: 8983 25.0 XXXQ Temperatura 1.4

    Nota: Minitab (tallo y hoja)

    4286.86X 607.9S 31.922 S 78q

    93,86~

    32 qqX 15IQR

    Media: Mediana:

    93.86X

    5.87182

    135

    Varianza: 92.31 Desviacin estndar: 9.607

    TAREAS

    Tarea 1: A continuacin las lecturas de la concentracin en un proceso qumicos tomados cada 2 horas:

    17.0 16.7 17.1 17.5 17.6

    16.6 17.4 17.4 18.1 17.5

    16.3 17.2 17.4 17.5 16.5

    16.1 17.4 17.5 17.4 17.8

    17.1 17.4 17.4 17.4 17.3

    16.9 17.0 17.6 17.1 17.3

  • 16.8 17.3 17.4 17.6 17.1

    17.4 17.2 17.3 17.7 17.4

    17.1 17.4 17.0 17.4 16.9

    17.0 16.8 17.8 17.8 17.3

    Con esta informacin construir su tabla de frecuencias, su histograma adems de calcular su media, mediana y desviacin estndar.

  • UNIDAD II.- PROBABILIDAD

    2.1 CONCEPTOS BSICOS Y TEORA DE CONJUNTOS

    Un conjunto se puede comprender como cualquier coleccin de objetos bien definidos, llamados elementos o miembros del conjunto. Normalmente se utilizan las letras maysculas A, B, X, Ypara nombrar los conjuntos, y las minsculas a, b, x, ypara los elementos de los conjuntos. La afirmacin de que un elemento a pertenece a un conjunto S se escribe: Sa

    Si cada elemento de un conjunto A, tambin pertenece a un conjunto B, es decir si Aa implica que ,Ba

    entonces A se llama subconjunto de B, o se dice que A esta incluido en B y se escribe: BA

    Dos conjuntos son iguales o equivalentes si ambos tienen los mismos elementos, es decir si cada elemento de un conjunto est contenido dentro del otro: La negacin de que: se escribe respectivamente. La afirmacin no excluye la posibilidad de que

    Identificacin de conjuntos. Hay dos maneras de identificar un conjunto particular, una forma, s es posible, es enumerar sus elementos, por ejemplo:

    9,7,5,3,1A a esta forma se le llama por extensin. Donde A es el conjunto que contiene a 1, 3,5 , 7 y 9. La segunda forma llamada por comprensin, consiste en definir las propiedades que caracterizan a los elementos del conjunto, por ejemplo:

    XXB : Es un nmero par entero, X >0 Se lee B es el conjunto de x, tal que x es un nmero par entero y x>0 Es decir, los dos puntos se lee tal que y la coma se lee y. Ejemplo 2.1 Consideremos los conjuntos A={1,3,5,7,9}, B={1,2,3,4,5}, C={3,5} Entonces: , por otra parte ya que pero . Adems ya que pero . Conjunto Universal y Conjunto Vacio. Cualquier conjunto utilizado en la aplicacin de la teora de conjuntos se supone que est incluido en uno mayor llamado Conjunto universal o Universo. Comnmente este conjunto se representa con U. El conjunto sin elementos se llama el Conjunto Vacio, y se representa por . El conjunto vacio es tambin un subconjunto del cualquier otro conjunto. Luego para cualquier conjunto A. Un Conjunto Disjunto es aquel que no tiene elementos en comn con otro.

  • El Diagrama de Venn es una representacin grfica de los conjuntos, los cuales se representan por reas cerradas en el plano. El conjunto universal U se representa por los puntos de un rectngulo, y los otros conjuntos se representan por los punto se representan por circunferencias dentro del rectngulo. Si A B, entonces la circunferencia que representa a A, estar dentro de la circunferencia que representa a B.

    Figura 1. (El conjunto A est incluido en el conjunto B) Si A y B son disjuntos, entonces la circunferencia de A estar separada de la de B.

    Figura 2. (Los conjuntos A y B son disjuntos) Por otra parte, s A y B son dos conjuntos arbitrarios, es posible que algunos elementos estn dentro de A pero no de B, que algunos elementos estn en B pero no en A, que algunos estn en ambos, y que algunos no estn ni en A ni en B. Figura 3. Conjuntos arbitrarios

    Operaciones con conjuntos. Unin e interseccin. La unin de dos conjuntos A y B, que se representa por AB, es el conjunto de todos los elementos que pertenecen a A o B; es decir:

    { } Aqu o se usa con el significado de y/o. La operacin AB se representa con el rea sombreada como sigue:

    U

    B

    A

    U

    B

    A

    U

    B

    A

    U

    B

    A

  • Figura 4. AB (La unin del conjunto A y B est sombreada) La interseccin de dos conjuntos A y B, que se representa por AB, es el conjunto de todos los elementos que pertenecen a ambos A y B; es decir:

    { } La operacin AB se representa con el rea sombreada como sigue:

    Figura 5. AB (La interseccin de A y B est sombreada) Es necesario recordar que los conjuntos A y B son disjuntos si no tienen elementos en comn, o usando la notacin

    AB= Ejemplo 2.2: Sea A={1,2,3,4}, B={4,5,6}, C={1,3,5,7}, entonces: AB={1,2,3,4,5,6} AC={1,2,3,4,5,7} BC={1,3,4,5,6,7} AB={4} AC={1,3} BC={5} Complementariedad, diferencia y diferencia simtrica. Todos los conjuntos bajo consideracin, en un momento dado, son subconjuntos del conjunto universal U. El complementario absoluto o simplemente complementario de un conjunto A, representado por A, es el conjunto de elementos de U que no pertenecen a A, es decir: A={x: x U, x A} Figura 6. A est sombreado. El complementario relativo de un conjunto B con respecto a uno A o simplemente la diferencia de A y B, que se representa por AB, es el conjunto de elementos que pertenecen a A pero no a B, es decir:

    AB={x: x A, x B} El conjunto AB se lee lo que est en A pero no en B

    U

    B A

    U =A A

    A

    U

    B

  • Figura 7. A (La diferencia de A y B est rayada) La diferencia simtrica de los conjuntos A y B representada por AB consiste en aquellos elementos que pertenecen a A o a B, pero no a ambos, es decir:

    AB= (AB)(AB) o equivalente AB = (AB)(BA)

    Figura 8. A (La diferencia simtrica est rayada) Ejercicio 2.1: Sea U=P={1,2,3,} el conjunto Universo, y sea A={1,2,3,4}, B={3,4,5,6,7}, C={6,7,8,9} y D={2,4,6,8} El conjunto de enteros pares positivos Encontrar: A, B, C, D, AB, BA, BC, CB, CE, AB, BC Algebra de Conjuntos. Los conjuntos bajo las operaciones de unin, interseccin y complementariedad cumplen varias propiedades que se indican en la siguiente tabla

    Propiedades del Algebra de conjuntos.

    AA=A Propiedad Idempotente AA=A (AB) C=A(BC) Prop. Asociativa (AB) C (BC) AB=BA Prop. Conmutativa A A(BC)=(AB) (AC) Prop. Distributiva A(BC)=(AB)(AC) A =A

    Elemento Universal e infinito A A

    AU=U A (A)=A Propiedad Involutiva

    AA=U Propiedad de Complementariedad

    AA U= =U (AB)=AB Propiedad de complementariedad (AB)=AB Principio de Inclusin-Exclusin. La notacin n(S) o |S|, se usa para indicar el nmero de elementos en un conjunto S. As n(D)=7 si D={lunes, martes, mircoles, jueves, viernes, sbado, domingo}, es decir D, es el conjunto de los das de la semana. Tambin n( )=0, ya que el conjunto vaco no tiene elementos. Ahora supongamos que A y B son conjuntos disjuntos finitos.

    Entonces AB es finito y n(AB)=n(A)+n(B)

    Ejemplo 2.3: se tiene A={1,2,3,4} y B={8,9,10} entonces, n(A)=4 y n(B)=3 AB={1,2,3,4,8,9,10} n(AB)=7 n(AB)=n(A)+n(B)=4+3=7 n(AB)=n(A)+n(B)

    Hay tambin una frmula para n(AB) incluso cuando no son disjuntos, llamada el principio de inclusin-exclusin

    A

    U

    B

  • n(AB)=n(A) + n(B) n(AB) Ejemplo 2.4: Se tiene A={1,2,3,4,5} y B={4,5,6,7,8} n(A)=5 n(B)=5 AB={4,5} n(AB)=2 AB={1,2,3,4,5,6,7,8} n(AB)=8 n(A) + n(B) n(AB)= 5 + 5 2 = 8 n(AB)=n(A) + n(B) n(AB)

    Ejemplo 2.5: Supongamos que el conjunto A es conformado por 30 alumnos de una clase de matemticas y el conjunto B de una clase de ingls con 35 alumnos, y supongamos que en ambos conjuntos coinciden 20 nombres. Hallar el nmero de alumnos que:

    a) Estn en el conjunto A o en B. b) Solo estn en A. c) Solo estn en B. d) En solo uno de los conjuntos.

    Figura 9. n(AB) para elementos no disjuntos.

    a) n(AB) = n(A) + n(B) n(AB) = 30 + 35 20 = 45 b) n(AB)= n(A) n(AB) = 30 20 = 10 c) n(BA)= n(B) n(AB) = 35 20 = 15 d) n(AB)= n(AB) + n(BA) = 10 + 15 = 25

    Multiplicacin de Conjuntos Sean A y B dos conjuntos, el conjunto producto de A y B que se representa AxB (y se lee A por B), consiste en todos los pares ordenados (a,b) donde a A y b B; es decir: AxB={ (a,b) : a A, b B} Ejemplo 2.6: sea A={1,2,3} y B={a,b} AxB={ (1,a), (1,b), (2,a), (2,b), (3,a), (3,b) } Se aplica el siguiente teorema: Supongamos que A y B son finitos. Entonces AxB es finito y

    n(AxB) = n(A) x n(B) con el ejemplo anterior tenemos que:

    n(A)= 3 y n(B)=2 entonces: n(AxB) = n(A) n(B) = 3 x 2 = 6 Conjunto Potencia. Para un conjunto dado S, podemos considerar la clase de todos los subconjuntos de S. Esta clase se llama el Conjunto Potencia de S, y se representar por P(S). Si S es finito P(S) tambin lo ser. De hecho el nmero de elementos de P(S) es 2 elevado a la potencia de S, es decir:

    U B

    10 A

    15 20

  • n[P(S)] = 2n(S)

    Ejemplo 2.7: Supongamos S={1,2,3}, entonces: P(S)= [ , {1}, {2}, {3}, {1,2}, {1,3}, {2,3}, S}], es decir 8 subconjuntos, que es lo mismo que hacer 23 = 8 Principio de la regla de la suma. Supongamos que un suceso E puede ocurrir de m maneras y un segundo suceso F puede ocurrir de n maneras, y supongamos que ambos sucesos no pueden ocurrir simultneamente. Entonces E o F pueden ocurrir de m+n maneras.

    n(AB)= n(A) + n(B) Principio de la regla del producto. Supongamos que un suceso E puede ocurrir de m maneras y que independientemente de este suceso existe otro F que puede ocurrir de n maneras. Entonces las combinaciones de E y F pueden ocurrir de mn maneras

    n(AxB) = n(A) n(B) Ejemplo 2.8: Supongamos que una universidad tiene 3 cursos diferentes de historia, 4 diferentes de literatura y dos diferentes de ciencias, entonces:

    a) Hay n = 3 + 4 + 2 = 9 posibilidades de escoger uno de los cursos. b) Hay n = (3) (4) (2) = 24 posibilidades de escoger un curso de cada uno.

    Notacin Factorial. El producto de los nmeros enteros positivos de1 a n, que se representa como n! se conoce como el factorial de n.

    n!= 123 (n-2) (n-1) n

    Ejemplo 2.9: 2! = 1x2 = 2 5! = 1x2x3x4x5 = 120 1! = 1 0! = 1 Coeficientes binomiales.

    El smbolo ( ) que se lee n sobre r, donde n y r son nmeros enteros positivos y r n, se define como sigue:

    (

    )

    ( )

    Ejemplo 2.10: Encontrar ( ) y (

    )

    (

    )

    ( )

    ( )( )

    (

    )

    ( )

    ( )( )

    Permutaciones. El nmero de permutaciones de n objetos tomados de r en r se representa por:

  • P(n,r) o nPr y se calcula de la siguiente manera:

    P(n,r) =

    ( )

    Y en el caso especial de que r=n P(n,n) = n! Ejemplo 2.9: Hallar el nmero de permutaciones que se pueden dar con las letras a, b y c tomados de 2 en 2, dicho de otra forma, hallar el nmero de palabras de 2 letras usando solamente las tres letras dadas sin repetirlas.

    P(3,2) =

    los cuales son: ab, ba, ac, ca, bc, cb

    Ahora si deseamos tomar del mismo ejemplo de tres en tres, es decir las palabras que se forman con las tres letras sera: P(3,3)=?

    P(3,3) =

    o lo que es igual P(3,3) = 3! =6 los cuales son: abc, cba, acb, cab, bca, bac

    Ejemplo 2.10: Hallar el nmero de permutaciones de seis objetos A, B, C, D, E, F tomados de 3 en 3, dicho de otra forma, hallar el nmero de palabras de 3 letras usando solamente las seis letras dadas sin repetirlas.

    P(6,3) =

    Permutaciones con repeticiones. Cuando en un conjunto se encuentran algunos elementos repetidos, el nmero de permutaciones que se pueden formar con los elementos de dicho conjunto se puede encontrar con la formula siguiente:

    ( )

    Ejemplo 2.11: Supongamos que queremos formar todas las posibles palabras de cinco letras usando la palabra BABBY. El total de letras es n=5 y como hay tres letras B entonces n1=3

    ( )

    palabras diferentes de 5 letras.

    Ejemplo 2.12: Hallar todas las posibles palabras de siete letras que se puedan formar usando la palabra BENZENE. El total de letras es n=7, hay tres letras E entonces n1=3 y dos letras n, es decir n2=3

    ( )

    Palabras diferentes.

    Muestreo con reemplazamiento. El elemento escogido de un conjunto S, se vuelve a poner en el conjunto S antes de escoger otro elemento. Como hay n diferentes posibilidades de elegir un elemento (ya que se permiten repeticiones), el principio del producto nos dice que hay:

    n*n*n**n = nr diferentes muestras con reemplazamiento de tamao r. Muestreo sin reemplazamiento. En este tipo de muestreo, el elemento no se vuelve a introducir en el conjunto S antes de escoger el siguiente elemento. No hay por tanto repeticiones en la muestra.

  • ( )

    ( )

    Combinaciones. Supongamos que tenemos una coleccin de n objetos. Una combinacin de estos n objetos tomados de r en r es cualquier seleccin r de los objetos, donde el orden no importa. En otras palabras una combinacin r de un conjunto de n objetos es cualquier subconjunto de r elementos, por ejemplo los grupos de las letras a,b,c,d tomadas de tres en tres son: abc, abd, acd, bcd, etc., observemos que los siguientes grupos de letras son iguales: abc, acb, bac, cab, cba, bca, lo que muestra que para cada combinacin de r objetos existen r! permutaciones. El nmero de combinaciones de n objetos tomados de r en r se representa por: ( )

    ( ) ( ) ( ) ( )

    ( )

    ( )

    Como se observa, para encontrar las combinaciones posibles se utiliza la frmula del coeficiente binomial ( )

    Ejemplo 2.13: Hallar el nmero de combinaciones de 4 objetos a,b,c,d tomados de 3 en 3.

    ( )

    ( )

    ( )

    Combinaciones diferentes.

    Ejemplo 2.14: Hallar el nmero de comits de 3 personas que se pueden formar con un grupo de 8.

    ( )

    ( )

    ( )

    Comits diferentes.

    Ejercicio 2.XXX: Un granjero compra 3 vacas, 2 cerdos y 4 gallinas a un hombre que tiene 6 vacas, 5 cerdos y 8 gallinas. Cuntas elecciones puede hacer el granjero?

    Vacas) ( )

    ( )

    ( )

    Formas diferentes de escoger 3 vacas de 6.

    Cerdos) ( )

    ( )

    ( )

    Formas diferentes de escoger 2 cerdos de 5.

    Gallinas) ( )

    ( )

    ( )

    Formas diferentes de escoger 3 vacas de 6.

    Por la regla del producto se tienen: (20)*(10)*(70)=14000 formas diferentes de escoger las 3 vacas, 2 cerdos y 4 gallinas. Diagrama de rbol. Es un esquema utilizado para enumerar todas las operaciones posibles de secuencia de experimentos o sucesos donde cada suceso puede ocurrir de un nmero finito de maneras. Ejemplo 2.15: Hallar el conjunto producto de AxBxC donde: A={1,2}. B={a,b,c} y C={3,4}

  • Experimento aleatorio. Es aquel que puede producir resultados diferentes, aun cuando se repita siempre de la misma manera. Espacio muestral. Es el conjunto de todos los resultados posibles de un experimento aleatorio. El espacio muestral se denota por S. Un resultado particular, es decir, un elemento de S se llama punto muestral. A su vez, un suceso A es un conjunto de resultados o en otras palabras un subconjunto del espacio muestral S. Dos suceso A y B se llaman mutuamente excluyentes si son incompatibles; es decir si A Es decir, A y B son excluyentes si no pueden ocurrir simultneamente. Tres o ms sucesos son mutuamente excluyentes si cada dos de ellos son mutuamente excluyentes. Ejemplo 2.16: En el evento de tirar un dado y observar el nmero que sale tenemos que S= {1,2,3,4,5,6}, sea A el suceso de que salga un nmero par, B que salga impar y C que salga un nmero primo, entonces: A={2,4,6} B={1,3,5} C={2,3.5} Por lo tanto: AC={1,2,3,4,5,6} BC={3,5} C={1,4,6} Observar que A y B son mutuamente excluyentes, es decir, AB= Ejemplo 2.17: Tirar una moneda tres veces y observar la secuencia de guilas (a) y sellos (s) que aparecen. S={aaa, aas, asa, saa, ass, ssa, sas,sss} Encontrar el suceso M de que dos o ms guilas aparezcan consecutivamente y el suceso N de que todas las tiradas sean iguales. Adems encontrar la unin e interseccin de estos dos eventos.

    Inicio

    1

    a 3

    4

    b 3

    4

    c 3

    4

    2

    a 3

    4

    b 3

    4

    c 3

    4

    (1,a,3)

    (1,a,4)

    (1,b,3)

    (1,b,4)

    (1,c,3)

    (1,c,4)

    (2,a,3)

    (2,a,4)

    (2,b,3)

    (2,b,4)

    (2,c,3)

    (2,c,4)

  • M= {aaa, aas, saa}, N= {aaa, sss}, AB= {aaa, aas, saa, sss}, AB= {aaa} Axiomas de probabilidad. Cuando se da una funcin de probabilidad P, entonces P(A) es la probabilidad del suceso A, si satisface los siguientes axiomas: Para cualquier suceso A, P(A) 0 Para el suceso seguro S, P(S) = 1

    Para dos sucesos incompatibles A y B cualquiera, se cumple: P(AB)=P(A) + P(B) Teoremas de probabilidad. 1.- La probabilidad del suceso imposible, o en otras palabras del conjunto vacio es nula, es decir, P( )=0 2.- Para cualquier suceso A se cumple que 0P(A)1 3.- Si A B entonces P(A) P(B) 4.- Para dos sucesos cualquiera A y B se verifica que P(AB)= P(A) P(AB) 5.- Para dos sucesos cualquiera A y B P(AB) = P(A) + P(B) P(AB) Espacios finitos equiprobables. Supongamos que S es un espacio muestral finito con n elementos y supongamos que las caractersticas fsicas del experimento sugieren que a varios resultados se les asignen probabilidades iguales. Entonces S se convierte en un espacio probabilstico llamado espacio finito equiprobable, si a cada punto P, se le asigna la probabilidad 1/n y si a cada suceso A que contiene r puntos se le asigna la probabilidad r/n. Lo anterior se observa enseguida. P(A)

  • UNIDAD III: VARIABLES ALEATORIAS DISCRETAS Y DISTRIBUCIONES DE PROBABILIDAD

    3.1 Variables Aleatorias Discretas. Sea S el espacio muestral de un experimento, frecuentemente deseamos asignar un nmero especfico a cada resultado del experimento, por ejemplo: la suma de los nmeros de una tirada de un par de dados, el nmero de ases que se obtienen al sacar 5 cartas de una baraja con 52 cartas, o el tiempo en horas que tarda una bombilla en fundirse. A tales asignaciones de valores numricos se les llama variable aleatoria. Variable aleatoria de un espacio muestral S, es entonces la regla que asigna un valor numrico a cada resultado de S, o en otras palabras, una funcin de S en el conjunto R de nmeros reales. Rx(Rango de la variable aleatoria) se utiliza para indicar el conjunto de nmeros asignados por una variable aleatoria X, es decir el espacio de valores. Variable aleatoria discreta: son las variables aleatorias que se pueden contar, es decir su rango es finito. Ejemplo: nmero de caras que se pueden obtener al tirar 3 monedas {0,1,2,3} Variable aleatoria continua: Son las variables aleatorias donde el espacio de valores es una sucesin de nmeros, como un intervalo o uniones de intervalos, y que algunas veces requiere clculos. Ejemplo: se escoge un punto al azar en un circulo de radio r. sea X la distancia del punto desde el centro del circulo, entonces su espacio de valores es un intervalo cerrado cuyos extremos son 0 y r, es decir Rx=[0,r]

    3.2 Distribuciones de Probabilidad y Funciones de Masa de Probabilidad.

    Distribucin de probabilidad. La distribucin de probabilidad de una variable aleatoria X es una descripcin de las probabilidades asociadas con los valores posibles de X. Para una variable aleatoria discreta, es comn especificar la distribucin con una lista de los valores posibles junto con la probabilidad de cada uno. En algunos casos resulta conveniente expresar la probabilidad en trminos de formula. Supongamos una variable aleatoria X que asigna slo un nmero finito de valores a un espacio muestral S; digamos: Rx={ , , , } Entonces X nos lleva a una funcin que asigna probabilidades a los puntos de Rx por:

    ( )= P(X= )

  • ( ) ( ) ( ) ( )

    A esta funcin se le llama distribucin de probabilidad o distribucin de la variable aleatoria con las siguientes propiedades:

    ( )0 y =1 Ejemplo: En un proceso de fabricacin de semiconductores se prueban dos tarjetas electrnicas de un lote; cada tarjeta se clasifica como pasa o falla. Suponga que la probabilidad de que una tarjeta pase la prueba es de 0.8 y que las tarjetas son independientes. Con esta informacin construir una tabla con el espacio muestral del experimento con las respectivas probabilidades asociadas a cada evento. P(pasa)=0.8 P(falla)=0.2 Resultado Probabilidad X (pasa, pasa) 0.64 2 (falla, pasa) 0.16 1 (pasa, falla) 0.16 1 (falla, falla) 0.04 0

    Donde Xes una variable aleatoria que indica el nmero de tarjetas que pasan. Ejemplo: Existe la posibilidad de que un bit transmitido a travs de un canal de

    transmisin digital se reciba con error. Sea Xigual al nmero de bits con error en los cuatro siguientes bits transmitidos. Encuentre la distribucin de probabilidad para este ejercicio, si la probabilidad de error es 0.1

    Rx ={0,1, 2, 3,4} n(s)=2x2x2x2 = 16 S={ ssss, sssc, sscs, scss, csss, sscc, sccs, ccss, scsc, cscs, cssc, sccc, cccs, cscc, ccsc, ccc} s= bit sin error. c= bit con error. P(X=0) = (0.9)(0.9)(0.9)(0.9) = (0.9)4 = 0.6561 P(X=1) = [(0.9)(0.9) )(0.9) )(0.1)] 4 = (0.9)3 (0.1) 4 = 0.2916 P(X=2) = [(0.9)(0.9) )(0.1) )(0.1)] 6 = (0.9)2 (0.1)2 6 = 0.0486 P(X=3) = [(0.9)(0.1) )(0.1) )(0.1)] 4 = (0.9) (0.1)3 4 = 0.0036 P(X=4) = (0.1)(0.1) )(0.1) )(0.1) = (0.1)4 = 0.0001

  • 3.3 Funciones de Distribucin Acumulada La funcin de distribucin acumulada de una variable aleatoria discreta X, denotada como

    Ejemplo: Supngase que la produccin de un da de 850 partes contiene 50 piezas defectuosas. Se seleccionan del lote 2 piezas al azar y sin remplazo. Sea la variable aleatoria X igual al nmero de piezas de la muestra que no cumplen, Cul es la funcin de distribucin acumulada de X? 1: Encontrar la funcin de masa de probabilidad P(x=0) = (800/850)(799/849) = 0.886 P(x=1) = (800/850)(50/849) = 0.111 P(x=2) = (50/850)(49/849) = 0.003 Entonces:

    (0)= P(X0)=0.886 (1)= P(X1)=0.886+0.111=0.997 (2)= P(X2)=0.886+0.0111+0.003 =1

    3.4 Media y Varianza de una Variable Aleatoria Discreta As como resulta conveniente resumir una muestra de datos con la media y la varianza, la distribucin de probabilidad de X se resume con su media y varianza. La media o valor esperado de la variable aleatoria discreta X, denotada como E(X) es:

    La varianza de X denotada como 2 V(X) es

    Ejemplo: Para el caso en el que se plantea la posibilidad de que in bit transmitido a travs

    de un canal de transmisin digital se reciba con error, encontrar su y 2. P(X=0) = 0.6561 P(X=1) = 0.2916 P(X=2) = 0.0486 P(X=3) = 0.0036 P(X=4) = 0.0001

    =0(0.6561)+1(0.2916)+2(0.04869+3(0.0036)+4(0.0001)=0.4

  • 2= X - ( - )2 0 -0.4 0.16 0.6561 0.104976

    1 0.6 0.36 0.2941 0.104976

    2 1.6 2.56 0.0486 0.124416

    3 2.6 6.76 0.0036 0.024336

    4 3.6 12.96 0.0001 0.001296

    0.36

    3.5: Distribucin Binomial

    coeficiente binomial

    El smbolo (que se lee n sobre r) donde n y r son nmeros enteros positivos y rn,

    se define como sigue:

    = es decir un coeficiente binomial representa una combinacin. Ejemplo:

    = = 10

    En un experimento donde solo hay dos resultados posibles, por ejemplo, uno que se llame xito E y otro que se llame fracaso F, y donde a su vez la repeticin n veces del experimento produzca resultados independientes (el resultado de un experimento no depende de otros anteriores) se conocen como experimentos o pruebas de Bernoulli. Sea p la probabilidad de que salga xito en un experimento de Bernoulli, entonces q=p-1 es la probabilidad de que salga un fracaso. Un experimento binomial se compone de un nmero fijo de experimentos de Bernoulli, donde B(n,p) denota un experimento binomial con n pruebas y una probabilidad p de que salga xito. Teorema: La probabilidad de que salgan exactamente x xitos de un experimento binomial B(n,p) viene dada por:

    P( )=P( xitos)=

    La probabilidad de que salga uno o ms xitos es 1-qn.

    Donde:

    Es el coeficiente binomial (una combinacin de n elementos)

  • A su vez la probabilidad de obtener al menos xitos, es decir, x o ms xitos est dada por:

    P( )+P( +1)P( +2)++P(n) Ejemplo: Se tira una moneda 6 veces y decimos que cara es un xito. ste es un experimento binomial con n=6 y p=q=1/2 a) La probabilidad de que salgan exactamente dos caras ( =2) es:

    P(2)=

    b) La probabilidad de que al menos salgan cuatro caras(es decir, =4, 5 6) es:

    c) La probabilidad de que no salga cara (es decir, que todos sean fracasos) es:

    q6 = (

    As que la probabilidad de que salgan una o ms caras es:

    1-qn=1- = 0.98

    Distribucin Binomial.

    Consideremos el experimento binomial B(n,p) que se compone de n experimentos repetidos e independientes con dos resultados, xito o fracaso, p es la probabilidad de que salga xito y q=1-p es la probabilidad del fracaso. El nmero X de x xitos es una variable aleatoria con la siguiente distribucin:

    0 1 2 n P( ) qn ( ) qn-1p ( ) qn-2p2 p

    n

    Media, varianza y desviacin estndar de una distribucin binomial B(n,p)

    Media nmeros esperados de xito: =np Varianza: 2=npq

    Desviacin estndar: =

  • Ejemplo: Las posibilidades de que un bit transmitido a travs de un canal de transmisin digital se reciba con error es de 0.1, suponga que los ensayos de transmisin son independientes. Sea x el nmero de bits con error en los siguientes cuatro bits transmitidos, determine la probabilidad de encontrar 2 bits con error de cuatro transmitidos, es decir P(X=2).

    P(X=x) = (nmero de resultados que producen X errores)(probabilidad de bit con error)x(1-probabilidad de bit con error)n-x

    P(X=2) = 6 [(0.1)2(0.9)2] = 0.0486

    Resultados X Cantidad de resultados

    P(X=x) Resumen

    ssss 0 1 P(X=0) = (0.1)0 (0.9)4 = 0.0486 La probabilidad de 0 bit con error de 4 bits

    transmitidos es P(X=0)=0.0486

    sssc 1 4 P(X=1) = (0.1)1 (0.9)3 =

    0.2916

    La probabilidad de 1 bits con error de 4 bits transmitidos es

    P(X=1)=0.2916

    sscs 1

    scss 1

    csss 1

    sscc 2 6 P(X=2) = (0.1)2 (0.9)2 =

    0.0486

    La probabilidad de 2 bits con error de 4 bits transmitidos es

    P(X=2)=0.0486

    sccs 2

    ccss 2

    scsc 2

    cscs 2

    cssc 2

    sccc 3 4 P(X=3) = (0.1)3 (0.9)1 =

    0.0036

    La probabilidad de 3 bits con error de 4 bits transmitidos es

    P(X=3)=0.0036

    cccs 3

    cscc 3

    ccsc 3

    cccc 4 1 P(X=4) = (0.1)4 (0.9)0 =

    0.0001

    La probabilidad de 4 bits con error de 4 bits transmitidos es

    P(X=4)=0.0001

  • M.I. Diego Alfredo Tlapa Mendoza 1

    UNIDAD IV TEORIA DE ESTIMACIN.

    INTERVALOS DE CONFIANZA

    La Estimacin Puntual, consiste en encontrar estadsticos y sus propiedades para hacer la

    mejor aproximacin numrica de un parmetro. Hemos visto que los estadsticos mustrales ms

    comunes como la media , la varianza S2 slo dan un valor numrico posible del parmetro correspondiente y 2 respectivamente, es decir y S2 son estimadores puntuales de y 2. Sin embargo, en la vida real, en el proceso de toma de decisiones, es deseable contar un rango de posibles valores que pueden tomar estos parmetros, es decir un intervalo.

    Dada la informacin de una muestra aleatoria, La Estimacin por Intervalos de parmetros, consiste en encontrar estadsticos que representen los lmites inferior y superior de los posibles valores que stos pueden tomar con un nivel de probabilidad establecido antes de sacar la muestra. Para lograr calcular dichos lmites, es necesario conocer la distribucin de probabilidad de los estimadores o funciones de stos y as establecer el nivel de probabilidad, la cual es convertida en el mbito de confianza en el momento que los estadsticos que representan los lmites son reemplazados con los valores muestrales.

    INTERVALO DE CONFIANZA PARA , CUANDO ES CONOCIDA.

    Considere una variable aleatoria X, con una muestra aleatoria de tamao n, el valor de (media

    muestral) se puede usar para estimar (que puede ser desconocido) por ejemplo con un nivel de confianza de 95% de la siguiente manera:

    O su equivalente:

    Donde el margen de error o simplemente error E, es la diferencia entre la media poblacional y la media muestral, es decir: E =

    A se le llama intervalo de confianza aleatorio de con un nivel de confianza del 95 %. En la siguiente figura se muestra que algunos intervalos [ ] contendr a . Sin embargo habr algunos intervalos que no contendrn a la verdadera , entonces, es conveniente especificar con una cierta confianza, cual intervalo si contiene a ; este nivel de confianza (gamma) puede ser por ejemplo una probabilidad de 0.95, por lo tanto a la diferencia a uno (0.05) se le conoce como nivel de error o (alfa), es decir 1- = 1-=, por ejemplo 1-0.05 =0.95 1-0.95=0.05 respectivamente.

    No contiene a

  • M.I. Diego Alfredo Tlapa Mendoza 2

    Ejemplo 1. Supongamos que X, es una variable aleatoria normal con media , cuyo valor desconocemos y desviacin estndar =2. De una muestra aleatoria con remplazamiento de 25 valores de X, obtenemos una media muestral =10. Determinar el margen de error E para un intervalo de confianza del 95% para y hallar el correspondiente intervalo de confianza. Partimos por definir la siguiente ecuacin, para el intervalo de confianza aleatorio con un nivel de confianza del 95%.

    En este caso utilizamos la formula de transformacin Z, pero como estamos trabajando con medias, dividiremos , es decir:

    o bien

    donde: E =

    Ahora, el denominador para el problema sera = 2/5= 0.4

    Estandarizando se obtiene:

    (

    ) o bien (

    )

    Dado que estamos permitiendo un 5 % de error en la probabilidad, es conveniente especificar lo siguiente

    |

    Cuando buscamos el 95 % de confianza, implica un 5 % de error, el cual se reparte 2.5 % a la derecha e izquierda, de tal forma que el error queda a los extremos de la distribucin. En estos casos buscamos en la tabla de distribucin normal estndar acumulada el valor z correspondiente a una probabilidad de 0.975 y encontramos que z es 1.96, Es decir 1.96 es el valor crtico de z correspondiente a una probabilidad del 0.95, ya repartiendo un 2.5% a cada extremo.

    Ahora bien, sustituimos en la formula

    donde

    por lo tanto (1.96)*(0.4)= 0.784

    =0.95

    2.5 % error 2.5 % error

    97.5% o 0.975 es la probabilidad acumulada error

  • M.I. Diego Alfredo Tlapa Mendoza 3

    Con esto se tiene un confianza del 95 % de que la media de X es algn valor del intervalo 9.216 hasta 10.784; lo que significa que la media de toma los posibles valores . En otras palabras el 95 % de los intervalos [ ] contendr a .

    Ejemplo 2. Construir un intervalo de confianza para el ejemplo 1, con un nivel de confianza del 99%.

    Por lo tanto =0.01, la cual se debe repartir en ambos lados de la distribucin /2=0.005, entonces buscamos el valor de z, donde la probabilidad acumulada es de 0.99+0.005=0.995 y encontramos que z es 2.58, entonces caculamos E:

    donde

    por lo tanto (2.58)*(0.4)= 1.032

    =0.99 Es decir, se tiene un confianza del 99 % de que la media de X es algn valor del intervalo 8.968 hasta 11.032; lo que significa que la media de toma los posibles valores . En otras palabras el 99 % de los intervalos [ ] contendr a .

    TAMAO DE LA MUESTRA.

    Para determinar el tamao de la muestra que se necesita para obtener el margen de error deseado para un nivel de confianza dado se realiza lo siguiente:

    De la formula

    o bien

    es decir

    despejamos =

    Para el

    calculo del tamao de la muestra. Ejemplo 3. Supongamos que X es una variable aleatoria normal con media y =2 y que queremos obtener un intervalo de confianza del 95% para con un margen de error no mayor de 0.05, de qu tamao debe ser la muestra para conseguirlo?

    entonces

    En general, a mayor tamao de muestra, menor es el margen de error para un nivel de confianza dado. Por otra parte, un valor n grande, en ocasiones es poco prctico o antieconmico, entonces se puede obtener un margen de error menor o igual por ejemplo de 0.05, disminuyendo el nivel de confianza.

    Supongamos del ejemplo anterior que solamente se pueden obtener 36 muestras y queremos un margen de error menor o igual a 0.05 entonces resolvemos:

    obtenemos

    para el ejemplo

    Buscamos en la tabla de distribucin normal estndar acumulada el valor de z=1.5

  • M.I. Diego Alfredo Tlapa Mendoza 4

    P(-1.5Z1.5)=0.8664 Es decir con un tamao de muestra n=36 y un margen de error de E=0.05, se manejara un nivel de confianza =0.8664, es decir =0.1336 (nivel de error de 13.36%)

    |

    Ejercicio 1. Se quiere hacer una estimacin por intervalo del contenido neto promedio en gramos de bolsas de azcar llenadas por una mquina automtica. Se toma una muestra aleatoria de 50 bolsas resultando un peso promedio de =112 gramos, la desviacin estndar se sabe que es igual a 25 gramos.

    a) Hallar el intervalo de confianza del 85% para la media del contenido neto de las bolsas de azcar.

    b) Cul debe ser el tamao de la muestra para obtener un intervalo de confianza del 85% para el contenido neto promedio con un margen de error igual a 2.5%?

    c) Supongamos que el tamao de la muestra no puede ser mayor que 100, Cul es el margen de error ms pequeo posible?

    -z=-1.5

    Nivel de confianza de 86.638%

    z=-1.5

  • M.I. Diego Alfredo Tlapa Mendoza 5

    INTERVALO DE CONFIANZA PARA LAS PROPORCIONES. En ciertos fenmenos se halla una poblacin que se divide en dos grupos. Los miembros de uno de esos grupos se llamarn exitosos, donde p=a la proporcin desconocida de xitos en una poblacin. Para estos fenmenos, el intervalo de confianza para p tendr la siguiente forma:

    [ ]

    Donde es la proporcin de xitos obtenidos en una muestra aleatoria y E es el margen de error.

    tiene como media y desviacion estandar

    Y se aproxima a una distribucin normal cuando n30.

    o bien

    por lo que el error es

    Ejemplo 4. En una muestra aleatoria de 900 votantes, el 55% prefiere al candidato demcrata de presidente. Hallar el intervalo de confianza aproximado para la proporcin de todos los votantes que prefieren al candidato demcrata con un nivel de confianza de a) 90% y b)99%.

    a) =90% y

    Buscamos en la tabla de distribucin normal estndar acumulada el valor prximo de z=0.95 que corresponde a 1.65

    |

    Entonces

    =

    sustituyendo

    El correspondiente intervalo de confianza del 90% es: [0.55-0.0274, 0.55+0.0274] = 0.90 [0.523p 0.577]=0.90 [0.523, 0.577]

    -z=-1.65

    0.95 de probabilidad acumulada

    z=1.65

    0.95 de probabilidad acumulada

  • M.I. Diego Alfredo Tlapa Mendoza 6

    b) =99% y

    Buscamos en la tabla de distribucin normal estndar acumulada el valor critico de Z a un nivel de confianza =0.99, es z= 2.58

    |

    Entonces

    El correspondiente intervalo de confianza del 99% es: [0.55-0.043, 0.55+0.043] = 0.99 [0.507p 0.593]=0.99 [0.507, 0.593]

    Ejemplo 5. Suponga que una encuesta establece que [0.52,0.57] es el intervalo de confianza del 98% para la proporcin de votantes de prefieren al candidato A.

    a) Qu porcentaje de la muestra prefieren al candidato A? b) Cul es el margen de error?

    a) =0.98 =?

    =

    el 54.5% por ciento de los votantes prefieren al candidato A.

    b) E=? E= 0.57-0.54.5= 0.025 E=0.545-0.52=0.25

    -z=-2.58

    0.995 de probabilidad acumulada

    z=2.58

    0.995 de probabilidad acumulada

  • M.I. Diego Alfredo Tlapa Mendoza 7

    INTERVALOS DE CONFIANZA PARA CUANDO ES DESCONOCIDA. Cuando la desviacin estndar de la variable aleatoria X es desconocida, se usan los valores de la desviacin estndar muestral.

    Supongamos que la variable aleatoria X se distribuye normalmente y tiene como media . Sea la media muestral correspondiente a muestras aleatorias de tamao n, y sea S la correspondiente desviacin estndar muestral, entonces se utiliza la variable aleatoria t en lugar de Z:

    Con esta variable aleatoria podemos establecer un intervalo de confianza para cuando no se conoce, tomando su lugar S, y en el caso de Z entra t. El margen de error se calcula de la siguiente manera:

    Ejemplo 6. La media de una muestra aleatoria de 10 calificaciones de un examen es 75 (con escala de 0 a 100), y la desviacin estndar muestral S=8.4; aceptando que el conjunto de todas las calificaciones estn distribuidos aproximadamente como normal, hallar un intervalo de confianza del 95% para la calificacin media. Para buscar el valor crtico de t, debemos calcular los grados de libertad () mediante n-1 y el nivel de error , el cual normalmente se divide entre 2 (/2) para repartir el error en los dos extremos de la distribucin. Entonces: n=10 grados de libertad = n-1 = 10-1=9 t , n-1 = t 0.025, 9 Buscamos en la tabla de la distribucin t y encontramos que el valor critico de t es 2.262 con un =0.025 y =9

    Calculamos el error E= t *

    es decir 2.262 *

    = 6.009

    Calculamos el intervalo de confianza del 95%.

    P[75-(2.262 *

    ) 75+(2.262 *

    )]=0.95

    P[75-6.009 75+6.009)]=0.95 P[68.9981.009]=0.95 Es decir, con un 95% de confianza, se esperara que el promedio real de las calificaciones estn entre 69 y 81.

  • M.I. Diego Alfredo Tlapa Mendoza 8

    Ejemplo 7. Se realiz un muestreo de 8 trozos de una misma tela para determinar su resistencia a la tensin (Libras/pulg2). Los resultados fueron los siguientes: 24.4, 18.9, 12.8, 20.5, 19.1, 15.2, 21.7 y 14.6 Si se supone que la poblacin de la que provienen estas resistencias a la tensin es aproximadamente normal, Cul ser el intervalo de confianza del 98% para la media ? Para buscar el valor crtico de t, debemos calcular los grados de libertad () mediante n-1 y el nivel de error =0.02, el cual se divide entre 2 (/2) para repartir el error en los dos extremos de la distribucin. = 0.02/2= 0.01 Entonces: se calcula la media y la desviacin estndar muestral

    =18.4 S=3.93 y como n=8 grados de libertad = n-1 = 8-1=7 Buscamos en la tabla de la distribucin t t , n-1 = t 0.01, 7 y encontramos que el valor critico de t es 2.998 con un =0.01 y =7

    Calculamos el error E= t *

    es decir 2.998 *

    = 4.165

    Calculamos el intervalo de confianza del 98%.

    P[18.4 - (2.998 *

    ) 18.4+(2.998 *

    )]=0.98

    P[18.4 4.165 18.4 + 4.165]=0.98 P[14.23522.565]=0.98 Ejercicio 2. Se realiza un muestreo de 41 sacos de alimento balanceado para ganado, lo que arroja una media muestral de 75.82 kg y una varianza muestral de 16.16 kg2. Hallar un intervalo de confianza del 99% para la media poblacional y para la desviacin estndar poblacional.

  • M.I. Diego Alfredo Tlapa Mendoza 9

    Ejercicio 3. Se analiz una marca particular de margarina diettica para determinar el nivel de cido graso polinsaturado (en porcentaje). Un amuestra de 6 paquetes dio como resultado los siguientes datos: 16.8, 17.2, 17.4, 16.9, 16.5, 17.1 Encuentre un intervalo de confianza del 99% para la media poblacional y para la desviacin estndar poblacional.

  • M.I. Diego Alfredo Tlapa Mendoza 10

    INTERVALO DE CONFIANZA SOBRE LA VARIANZA En estos casos el intervalo de confianza sobre la varianza poblacional se determina de la siguiente manera:

    P(

    )

    En donde 2 es la distribucin chi cuadrada y 2 =

    Ejemplo 8. Se mide la resistencia a la tensin de una fibra sinttica dado que esta es una caracterstica de calidad importante para el fabricante. Despus de analizar 16 ejemplares de prueba de la fibra se obtienen los siguientes resultados:

    =49.86 psi y S2=2.76 (psi)2 Utilizar esta informacin para encontrar un intervalo de confianza del 95% para 2. Entonces =0.95 y =0.05 /2=0.025 y = n-1 = 16-1=15 Procedemos a buscar el valor crtico de Chi cuadrada

    , es decir

    = 27.49 (0.025 en renglones y 15 en columnas)

    Adems buscamos en la misma tabla es decir

    =6.27

    (0.975 en renglones y 15 en columnas) Sustituimos en la formula

    P(

    )

    P Es decir, se espera que con un 95% de confianza, la varianza se encuentre entre 1.506 y 6.603. En otras palabras, el 95% de las veces, se espera que la varianza se encuentre entre 1.506 y 6.603 (psi)2 Ejemplo 9. Se efectu una prueba de impacto en 20 muestras de tubera PVC, para verificar si se cumple la norma ASTM, la cual especifica que este material debe resistir ms de 1.0 lb/pulgada2. El promedio y la desviacin estndar muestral obtenidos es de

    =1.25 y S=0.25, es decir S2=0.0625 Encontrar un intervalo de confianza del 99% para 2.

    Entonces =0.99 y =0.01 /2=0.005 y = n-1 = 20-1=19 Procedemos a buscar el valor crtico de Chi cuadrada

    , es decir

    = 38.58

  • M.I. Diego Alfredo Tlapa Mendoza 11

    Adems buscamos en la misma tabla es decir

    =6.84

    Sustituimos en la formula

    P(

    )

    P Es decir, se espera que con un 99% de confianza, la varianza se encuentre entre 0.0308 y 0.1736. En otras palabras, el 99% de las veces, se espera que la varianza se encuentre entre 0.0308 y 0.1736 lb/pulgada2. Ejercicio 4. Una mquina produce varillas metlicas usadas en el sistema de suspensin de un automvil. Se selecciona una muestra aleatoria de 15 varillas y se mide el dimetro en cm. dando como resultado:

    =8.234 y S=0.0253 Encontrar un intervalo de confianza del 95% para 2 del dimetro de las varillas elaboradas por sta mquina.

  • M.I. Diego Alfredo Tlapa Mendoza 12

    INTERVALO DE CONFIANZA PARA LAS DIFERENCIAS DE MEDIAS CON VARIANZAS CONOCIDAS.

    En ciertas ocasiones se requiere determinar si la media poblacional de un grupo de datos es estadsticamente igual a otro grupo, esto es que debido a la variacin aleatoria, la de un grupo 1, sea aproximadamente igual a la de un grupo 2, o en su caso determinar que estadsticamente no son iguales. En estas situaciones se necesita determinar un intervalo de confianza para esta diferencia entre medias de 2 grupos, esto se logra con la siguiente frmula:

    P(

    )

    Ejemplo 10. Un grupo de ingenieros realiza pruebas con dos aleaciones de aluminio para determinar cul es la ms resistente a la tensin en largueros de aluminio usados en la fabricacin del ala de un avin de transporte comercial. A su vez se desea utilizar la ms econmica, pero dando prioridad a la ms resistente. Se realizaron pruebas de resistencia a las dos aleaciones diferentes y se conocen las desviaciones estndar por experiencias pasadas con el proceso de fabricacin de largueros y el procedimiento de prueba. Los datos con los que se cuenta son los siguientes:

    Aleacin de aluminio

    Tamao de muestra

    Media muestral de la resistencia

    (lb/pulgadas2)

    Desviacin estndar

    (lb/pulgadas2)

    Precio por libra

    en dlls.

    Tipo 1 1=1.0 $5.0 Tipo 2 2=1.5 $6.5

    Si denotan las verdaderas medias de la resistencia a la tensin para los dos tipos de aleaciones,

    encontrar un intervalo de confianza del 90% para la diferencia de la resistencia media o promedio

    . Es decir se necesita probar si la diferencia que existe entre la media de la aleacin tipo 1 y la del tipo 2, es tan grande que se puedan considerar diferentes, y con ello determinar cual tiene la mayor resistencia.

    Se sustituye en la formula

    P(

    )

    P [ ]

    P [ ]

    Es decir, el intervalo que se espera de la diferencias entre la de ambas aleaciones, es de 12.215

    hasta 13.984. dicho en otra forma, siendo la aleacin 1 la que tiene una mayor resistencia, se espera que sta tenga una diferencia mayor de 12.215 y hasta 13.984 lb/pulgadas2 con respecto a la tipo 2, por lo tanto El grupo de ingenieros deberan optar por utilizar el larguero de aluminio con la aleacin tipo 1, ya que se espera que sea ms resistente que la tipo 2 y adems es la ms econmica.

  • M.I. Diego Alfredo Tlapa Mendoza 13

    Nota: Observe que este intervalo no incluye al cero, por lo que se puede decir que las medias son diferentes. De hecho puede afirmarse que se tiene una confianza del 90% de que la resistencia a la tensin de la aleacin tipo 1, excede a la de tipo 2 entre 12.22 y 13.98 lb/pulgadas2

    Ejercicio 5. Se usan dos mquinas para llenar botellas de plstico con un volumen neto de llenado de 16.0 onzas. Puede suponerse que el volumen neto de llenado es normal, con una desviacin estndar de 2=0.020 y 2=0.025 onzas. Uno de los miembros del personal de ingeniera sospecha que ambas mquinas hacen el llenado con el mismo volumen neto medio, sea este volumen 16 onzas o no. Se toma una muestra aleatoria de 10 botellas de la produccin de cada mquina, cuyos resultados se muestran enseguida: Mquina 1: 16.03, 16.04, 16.05, 16.05, 16.02, 16.01, 15.96, 15.98, 16.02 y 15.99 Mquina 2: 16.02, 15.97, 15.96, 16.01, 15.99, 16.03, 16.04, 16.02, 16.01 y 16.00 Encuentre un intervalo de confianza del 95% para la diferencia de las medias. Proponga una interpretacin prctica para este intervalo.

  • M.I. Diego Alfredo Tlapa Mendoza 14

    INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS CON VARIANZAS DESCONOCIDAS.

    Siguiendo con la diferencia de medias, en ciertas ocasiones se requiere determinar si la media poblacional de un grupo de datos es estadsticamente no diferente a otro grupo, esto es que debido a la

    variacin aleatoria, la de un grupo 1, sea aproximadamente igual a la de un grupo 2, o en su caso determinar que estadsticamente no son iguales. Sin embargo en muchas ocasiones no se conoce la verdadera varianza y sta se debe estimar. En estas situaciones se necesita determinar un intervalo de confianza para esta diferencia entre medias de 2 grupos utilizando la variable aleatoria t en lugar de z, esto se logra con la siguiente frmula:

    P

    (

    [( )

    ]

    [( )

    ]

    )

    Donde:

    Ejemplo 11. En un artculo de la revista Hazardous Waste and Hazardous Material, se reportaron los resultados obtenidos de un anlisis del peso del calcio en el cemento estndar y del cemento dopado con plomo. Los niveles reducidos de calcio indicaran que el mecanismo de hidratacin del cemento se bloquea y permitira que el agua atacara varios lugares en la estructura del cemento. 10 muestras de

    cemento estndar tuvieron un peso promedio porcentual de calcio de con una desviacin estndar de S1=5.0 y 15 muestras del cemento dopado con plomo tuvieron un peso promedio porcentual

    de calcio de = 87.0, con una desviacin estndar muestral de S2=4.0. suponer que el peso porcentual del calcio sigue una distribucin normal. Encontrar un intervalo de confianza del 95% para la diferencia de

    medias para los dos tipos de cemento.

    Sp=4.42

    =

    =0.408

    Buscamos el valor crtico de t cuando:

    es decir

    encontrando t=2.069

    Sustituimos en la formula:

    P( [ ]

    [ ] )

    P

  • M.I. Diego Alfredo Tlapa Mendoza 15

    Nota: Observe que este intervalo SI incluye al cero, por lo que se puede decir que estadsticamente las medias no son diferentes. De hecho puede afirmarse que se tiene una confianza del 95% de que la concentracin de calcio en el cemento estndar comparndolo con el cemento dopado con plomo, no son diferentes. Lo anterior se puede ver de la siguiente manera:

    El cemento estndar tiene en promedio ms concentracin de calcio y el que contiene plomo = 87.0, al parecer el estndar es la mejor opcin, sin embargo, recuerde que estamos tratando con medias muestrales, y nos interesa conocer el intervalo esperado que tendrn las medias poblacionales verdaderas y como el intervalo encontrado incluye al cero, esto significa que va a ver ocasiones en que la diferencia en concentracin de calcio entre los dos cementos va a ser cero (no son diferentes). Inclusive al haber nmeros negativos, hay la posibilidad que en muestras futuras, el cemento con plomo tenga mayor concentracin de calcio. Por lo tanto estadsticamente no son diferentes.

  • M.I. Diego Alfredo Tlapa Mendoza 16

    UNIDAD V PRUEBA DE HIPOTESIS Se ha visto anteriormente como estimar un parmetro a partir de datos muestrales. Sin embargo, en muchos problemas de ingeniera es necesario decidir si se acepta o se rechaza un enunciado acerca de algn Parmetro. A dicho enunciado se le llama Hiptesis, y al procedimiento para tomar decisiones acerca de la hiptesis se le llama Prueba de Hiptesis. Tpicamente la prueba de hiptesis es considerada en la etapa de anlisis de datos de un experimento comparativo, en el cul a un ingeniero le interesa comparar, por ejemplo, la media de una poblacin con un valor dado. Hiptesis estadstica es un enunciado acerca de los parmetros de una o ms poblaciones. Una prueba de hiptesis Es un mtodo estadstico para determinar cundo aceptar una estimacin, es decir una suposicin sobre una poblacin en base a un anlisis de una muestra estudiada.

    Tipos de Hiptesis. Hiptesis Nula (Ho) Es una hiptesis que parte de que no hay cambio o diferencia respecto a ciertas aseveraciones. Por ejemplo la media de estatura de un grupo

    Ho: Hiptesis Alternativa (Ha) Es una hiptesis para probar ciertas aseveraciones de diferencia mediante muestras. Por ejemplo

    H1:

    En este caso puede ser mayor o menor y se le denomina hiptesis alternativa de dos colas.

    H1: Ho:

    En este caso puede ser solamente mayor (o lo contrario menor) y se le denomina hiptesis alternativa

    de una cola. Es importante recordar que las hiptesis son siempre enunciados acerca de la poblacin, no sobre la muestra. Ejemplo. Suponga que se tiene inters en la rapidez de combustin del propulsor slido utilizado para impulsar los sistemas de expulsin de la tripulacin de un avin. Entonces la rapidez de combustin es una variable aleatoria que puede describirse con una distribucin de probabilidad. Suponga que el inters se enfoca en la media de la rapidez de combustin. Especficamente quiere decirse si la media de la rapidez de combustin es 50 cm/s o no. Esto se expresa de la siguiente manera.

    Hiptesis nula Hiptesis alterna

    En pruebas de hiptesis, comnmente es la hiptesis nula la que se desea probar, el rechazo de la hiptesis nula lleva siempre a aceptar la hiptesis alternativa.

    Probar la hiptesis nula, implica tomar una muestra aleatoria, calcular un estadstico ( , S, S2), que en estos casos se conoce como estadstico de prueba y que sirve para tomar una decisin acerca de

  • M.I. Diego Alfredo Tlapa Mendoza 17

    Suponga que se prueba una muestra de n=10 observaciones y se obtiene de la rapidez de la combustin. La media muestral es una estimacin de la verdadera media poblacional , entre ms cerca del valor hipottico , ms evidencia de que la verdadera es en realidad , es decir se apoyara la hiptesis nula Por otra parte una media muestral que se aleje de , es evidencia de que la verdadera media poblacional es diferente de , es decir es evidencia a favor de la hiptesis alternativa .

    Suponga de nuevo que si , no se rechaza la hiptesis nula , y cuando se rechazar la hiptesis nula. Esto se ve en la sig. Figura. En esta ejemplificacin los valores menores de 48.5 y mayores de 51.5 representan la regin crtica de la prueba. En el otro sentido, los valores que van desde 48.5 hasta 51.5 forman una regin en la que hiptesis nula no puede rechazarse, a esta regin se le llama regin de aceptacin. A los lmites entre las regiones crticas y la regin de aceptacin se les llama valores crticos. En este ejemplo 48.5 y 51.5 seran los valores crticos. Este tipo de prueba conlleva dos posibles conclusiones incorrectas. Suponga que la verdadera media

    poblacional es , sin embargo, en base a las observaciones de la muestra se obtiene que cae fuera de la regin de aceptacin, es decir cae en la regin crtica. En tal caso se rechazara la hiptesis nula (Ho) en favor de la hiptesis alternativa (H1), cuando de hecho (Ho) en realidad es verdadero. A este tipo de conclusin incorrecta se llama Error tipo 1(Rechazo de la hiptesis nula cuan sta es verdadera).

    Suponga ahora, que la verdadera media poblacional es diferente a 50 cm/s, es decir , y que la media que se obtiene de la muestra, , cae en la regin de aceptacin. En este caso no se rechazara (Ho) cuando es falsa. A este tipo de conclusin incorrecta se le llama Error Tipo II, y se define como la aceptacin de la hiptesis nula cuando sta es falsa. Por tanto, cuando se prueba cualquier hiptesis estadstica, cuatro situaciones diferentes determinan si la decisin final es correcta o incorrecta y se muestran en la siguiente tabla.

    Se rechaza

    Se rechaza

    No se rechaza

    48.5 51.5

    Regin crtica Regin crtica Regin de aceptacin

  • M.I. Diego Alfredo Tlapa Mendoza 18

    La probabilidad de incurrir en un error tipo I se denota por , es decir:

    A la probabilidad del error tipo I, tambin se le llama nivel de significancia. Continuando con el ejemplo del al propulsin, suponga que la desviacin estndar es . La probabilidad de incurrir en un error tipo I (Es decir, el nivel de significancia de la prueba), es igual a la suma de las reas sombreadas a continuacin.

    |

    Entonces para encontrar procedemos de la siguiente manera

    Como estamos trabajando con media muestral, procedemos a estandarizar los valores crticos de 48.5 y 51.5 encontrando lo siguiente:

    es decir

    es decir

    Por lo tanto

    |

    Esto significa que 5.76% de todas las muestras aleatorias llevaran al rechazo de la hiptesis nula

    , cuando la verdadera media de la rapidez de combustin es en realidad 50 cm/s.

    -z=?

    /2=? ?

    z=?

    -z=-1.89

    /2=0.02938

    z=1.89

    48.5 51.5

  • M.I. Diego Alfredo Tlapa Mendoza 19

    Cmo le podramos hacer para reducir el error tipo I?, observe que si se ampla la regin de aceptacin, por ejemplo, si los valores crticos fueran 48 y 52, sera ms pequeo como se observa a continuacin.

    es decir

    es decir

    Por lo tanto

    Tambin podra reducirse si se incrementa el tamao de la muestra, por ejemplo n=16. Determine este nuevo valor de Al evaluar un procedimiento de prueba de hiptesis, tambin es importante examinar la probabilidad de

    un error tipo II, el cual se denota por , es decir:

    Para calcular , es necesario tener una hiptesis alternativa especfica, por ejemplo para el caso del propulsor, supongamos que es importante rechazar la hiptesis nula siempre que la rapidez de combustin media sea mayor por ejemplo de 52 cm/s. Continuando con los valores crticos de 48.5 y 51.5, se incurrir en un error tipo II si la media muestral est entre 48.5 y 51.5, e inclusive menor a 48.5 cuando

    Los valores de Z correspondientes a 48.5 y 51.5 cuando son:

    es decir

    Por lo tanto

    Es decir, si se est probando , contra , y el verdadero valor de la media fuera , la probabilidad de que no pueda rechazarse la hiptesis nula falsa es 0.2643, por simetra, si el verdadero valor de la media es , el valor de , tambin ser 0.2643.

    48.5 51.5

    Error tipo II, si la media verdadera fuera

    = 52 y fuera menor que 51.5

  • M.I. Diego Alfredo Tlapa Mendoza 20

    Procedimiento para prueba de hiptesis

    1. Por el contexto del problema, identificar el parmetro de inters 2. Establecer la hiptesis nula H0 3. Especificar la hiptesis alternativa H1

    4. Elegir un nivel de significacin 5. Establecer un estadstico de prueba apropiado 6. Establecer la regin de rechazo del estadstico 7. Decidir si deber rechazarse o no H0 y contextualizar la decisin.

    Ejemplo. Los sistemas de expulsin de una tripulacin de un avin son impulsados por una carga propulsora solida. La rapidez de combustin de esta carga es una caracterstica importante; las especificaciones requieren que la rapidez de combustin media debe ser de 50 cm/segundo. Se sabe que la desviacin estndar de la rapidez de combustin es =2cm/seg. El analista decide especificar una probabilidad del error tipo I o nivel de significancia de =0.05, Se selecciona una muestra aleatoria de n=25 y se obtiene un promedio muestral de 51.3 cm/seg., A qu conclusin deber llegarse?

    1. El parmetro de inters es , la media de la rapidez de combustin. 2. 3. 4.

    5. El estadstico de prueba es

    tambin conocido como zeta calculada

    6. Se rechaza si o si Esto por que como al repartirse a las dos colas, entonces el valor de Z para la probabilidad de 0.025 es -Z0.025= -1.96 del lado izquierdo y Z0.025= 1.96 del lado derecho. Nota: al valor crtico tambin se le llama zeta de tabla

    7. Se realiza el clculo del estadstico de prueba (zeta calculada)

    |

    8. Conclusin puesto que se rechaza en el nivel de significancia 0.05, expresado con mayor detalle, se concluye que la media de la rapidez de combustin difiere de 50 cm/s, con base en una muestra de 25 mediciones. De hecho, hay evidencias fuertes de que la rapidez de combustin media excede 50 cm/s.

    -z=-1.96

    z=1.96

    Valor crtico o Zeta de tabla

    Z0=3.25

    Estadstico de prueba o zeta calculado

    El estadstico de prueba cae en la regin crtica

  • M.I. Diego Alfredo Tlapa Mendoza 21

    Ejercicio. La resistencia a la tensin media de una fibra sinttica es una caracterstica importante de la calidad para un fabricante quien desea probar la hiptesis de que la resistencia media es de 50 psi utilizando un =0.05. Por experiencia pasada, el fabricante est dispuesto a asumir que la resistencia a la tensin tiene una distribucin normal. Se selecciona una muestra aleatoria de 16 ejemplares de prueba de la fibra y se determinan sus resistencias a la tensin. Realizar la prueba de hiptesis a la tensin pertinente con l