MANUAL ESTADIStica parte 1.pdf

46
3.3.2 Gráficas Circulares Este tipo de gráfica se usa cuando se quiere tener una idea de la contribución de cada valor de la variable al total. Aunque es usada más para variables cualitativas, también podría usarse para variables cuantitativas discretas siempre que la variable no asuma muchos valores distintos. Para obtener gráficas circulares se usa la opción Pie Chart del menú Graph.  Las ventanas de diálogo de Pie Chart que se muestran en la Figura 3.14 son para la variable IDENTIFICACION DE VARIABLES, POBLACION, MUESTRA, TIPO DE VARIABLE: En la tienda PQR dedicada a la venta de computadoras se desea hacer un estudio acerca del número de unidades vendidas 23 20 24 36 21 34 22 18 17 17 29 30 26 37 28 15 21 32 40 35 20 32 16 31 33 19 30 32 18 42 a) Identificar : población, muestra, unidad estadística, variable y tipo de variable. Población : Cinco años = 60 meses. Muestra : 30 meses. Unidad Estadística : un mes. Variable : Número de computadoras vendidas. Tipo de Variable : Cuantitativa - Discreta. durante los últimos cinco años, con tal motivo se tomó la información correspondiente a cierto número de meses de dicho periodo. MANUAL DE ESTADISTICA INFERENCIAL

Transcript of MANUAL ESTADIStica parte 1.pdf

  • 3.3.2GrficasCirculares

    Estetipodegrficaseusacuandosequieretenerunaideadelacontribucindecadavalordelavariableal total. Aunqueesusadamsparavariablescualitativas, tambinpodra usarse para variables cuantitativas discretas siempre que la variable no asumamuchosvaloresdistintos.

    ParaobtenergrficascircularesseusalaopcinPieChartdelmen Graph. LasventanasdedilogodePieChartquesemuestranenlaFigura3.14sonparalavariable

    IDENTIFICACION DE VARIABLES, POBLACION, MUESTRA, TIPO DE VARIABLE:

    En la tienda PQR dedicada a la venta de computadoras se desea hacer un estudio acerca del nmero de unidades vendidas

    23 20 24 36 21 34 22 18 17 1729 30 26 37 28 15 21 32 40 3520 32 16 31 33 19 30 32 18 42

    a) Identificar : poblacin, muestra, unidad estadstica, variable y tipo de variable.Poblacin : Cinco aos = 60 meses.

    Muestra : 30 meses.

    Unidad Estadstica : un mes.

    Variable : Nmero de computadoras vendidas.

    Tipo de Variable : Cuantitativa - Discreta.

    durante los ltimos cinco aos, con tal motivo se tom la informacin correspondiente a cierto nmero de meses de dicho periodo.

    MANUAL DE ESTADISTICA INFERENCIAL

  • programadelEjemplo3.1Lagrficapermitirvercomosedistribuyenlosestudiantesdelaclasesegnelprogramaacadmico.

    EnChartRawDatasecolocalavariabledelaquesequierehacerelpiechart.LaventanitadeChartvaluesfromtableseusasloenelcasoqueenunacolumnaestnlascategorasdelavariableyenlaotralafrecuenciaconqueserepitecadacategora.EnlaFigura3.15sepresentalagrficadecrculoparalavariableprograma.

    Existenformasdemodificarlagrficadecrculoparaenfatizarciertasideas.Porejemplo,sepuederesaltarunoovariospedazos(slices)medianteelusodeExplodeslice.Estaopcinselograseleccionandoelpedazo(s)quesequiere(n)explotar.Luego,seoprimeelbotnizquierdodelratnyseseleccionaEditPie.LaventanadedilogoqueseobtienesemuestraenlaFigura3.16.Enestaventana,sepuedetambinmodificarelcolordelpedazo.SiseseleccionalagrficacompletaantesdeiraEditPie,haylaposibilidaddecombinarpedazosquecontribuyanconunporcentajemuybajoaltotalodecolocarelnombreasociadaacadacategoraenlagrfica.EnlaFigura3.16b,semuestralagrficadelavariableprogramamodificadasegnsehadescritoanteriormente.

    Figura3.18.Ventanasdedilogoparaobtenergrficascirculares

    Figura3.19.Grficacircularparamostrarladistribucindeestudiantesporprograma

  • (a) (b)Figura3.20.Ventanadedilogoparamodificarlagrficadelafigura3.19.

    Ejemplo3.3.LasiguientetablamuestraelnmeroderestaurantsamericanosdecomidasrpidasenPuertoRicoajuliode1997(NuevoDa,31deAgostode1997).

    Nombre NmeroBurgerKing 113McDonalds 97TacoMaker 63KentuckyFriedChicken 58PizzaHut 51Churchs 46Dominos 30Wendys 24TacoBell 22Ponderosa 21LittleCeasers 20Otros 45

    Hacer un PieChart que muestre qu parte del mercado representa cada franquicia.Enfatizarlafranquiciaquetienelamayorpartedelmercadoylaquetienelamenorparte.

    EnestecasoseeligeChartvaluesfromtable,yenelespaciodeCategoricalvariablesecolocael nombredelascolumnasquecontieneel nombredelosrestaurantes yenelrectnguloalladodeSummaryVariablessecolocalacolumnaquecontieneelnmerode restaurantes de cada tipo. Eligiendo Labels, puede indicar el ttulo que tendr lagrficaylasetiquetasdelospedazos.Aloprimirok,seobtienelasiguientegrfica:

  • Figura3.21.Grficacircularparalosdatosdelejemplo3.3

    3.4Grficadetalloyhojas(StemandLeaf)

    Lagrficadetalloyhojas esunagrficausadaparadatoscuantitativos. Es lagrfica ms bsica de un conjunto de tcnicas conocido con el nombre de AnlisisExploratoriodeDatos(EDA)introducidaporJohnTukeyamediadosdelosaos70.Laideaesconsiderarlosprimerosdgitosdeldatocomounaramadeltallo(stem)yelltimodgitocomounahoja(leaf)dedicharama.Lasramassonordenadasenformacreciente.

    Ejemplo 3.4. Los siguientes datos representan pesos de una muestra de 15 varonesadultos.165178185169152180175189195200183191197208179HacersugrficadeStemandLeaf.

    Solucin:Enestecasolasramaslaformanlosprimerosdosdgitosdelosdatos,ylashojasserndadasporlosltimosdgitosdelosdatos.Luegoelstemandleafserdelasiguientemanera:

    152165917598180935195172008

    Interpretacin:ElusodelstemandleafesexactamenteigualaldelHistograma,lanica diferencia est en que del stemandleaf se pueden recuperar los datosmuestrales,perodeunhistogramanosepuedehacer.Enesteejemploel stemandleafesasimtricoalaizquierda,notienemuchavariabilidadnioutliers.

  • Launidaddelahojadeunstemandleafrepresentalaposicindeldgitodelahojaenlaescaladecimal.Enelejemploanterioreldgitodelashojasestenlasunidadesluegolaunidaddelahojaser1.0.Silosdatosfuerandepromediosacadmicos:3.17,3.23,2.98entonces,launidaddelahojaser.01.

    Pararecuperarlosdatosdelamuestrasejuntanlasramasylashojasdelstemandleafysemultiplicaporlaunidaddelahoja.

    HayvariasmanerasdeobtenerunstemandleafenMINITAB.Laprimeraeselegirla opcin stemandleaf del men Graph, la segundaes elegir la opcin CharacterGraph del men Graph y luego stemandleaf del listado que aparece. Finalmente,tambin sepuedeelegir la opcin EDA del men Stat y luego StemandLeaf delsubmendeEDA.

    La ventanadedilogoparaobtenerelstemandleafdelosdatosdepromedioacadmicogpadelejemplo3.1escomosigue:

    Figura3.22.Ventanadedilogoparaobtenerelstemandleafdelavariablegpa

    LaopcinByvariable seusacuandosequierecompararstemandleafdedosomsgruposyaquiseescribelavariablequeclasificaengrupos.SiseeligelaopcinTrimoutliersenlaventanadedilogodelstemandleafsepuededetectar los "outliers". La opcin Increment permite ajustar el nmerode ramas delstem.Enla ventana session aparecer elstemandleafdelavariable gpa quesemuestraacontinuacin.

    Launidaddelahoja0.1indicalaposicindeunahojaenlaescaladecimal.Osea3|6significa3.6.

    Enelejemploanteriorsehanhechousode5subramasparacadaramaprincipal.Sepuedenusar25subramasporcadaramaprincipal.Siseusadossubramas,entonceslaprimerasubramacontienelashojasdel0al4ylasegundalashojasdel5al9.Enelcaso

  • de5subramas,entonceslaprimeracontienelashojas0y1,lasegundalashojas2y3yassucesivamentehastalaquintaquecontienelashojas8y9.

    StemandLeafDisplay:gpa

    StemandleafofgpaN=28LeafUnit=0.10

    1214223352572779288(7)30001111123233934556366666138

    Figura3.23:VentanadesesinparaunagrficadecaracteresdetalloyhojaparalavariableGPA

    Frecuentemente,losprogramasestadsticoscomoMINITAB, redondeanlosdatosantesdehacerelstemandleaf.Porejemplosilamuestracontienelosdatos,93135178245267342307,stospuedenserredondeadosa90130170240340300yluegoelstemandleaftendralasramas0,1,2y3conunidaddehojaiguala10.

    Ejemplo3.5 ElimpuestoporcajetilladecigarrillosenPuertoRicoesde83centavos.Lossiquientesdatosmuestranlosimpuestosenlos50estadosdelos EstadosUnidos(NuevoDia,4deSept.de1997)

    Estadotax Estado taxVirg0.025 DakS 0.330Kent0.030 Flor 0.339CarN0.050 Nebr 0.340CarS0.070 Neva 0.350Georg0.120 Iowa 0.360Wyom0.120 Mary 0.360Tenn0.130 Cali 0.370Indi0.155 Maine 0.370Alab0.165 Oreg 0.380Misso0.170 NewJ 0.400WestV0.170 Texas 0.410Missi0.180 Wisco 0.440Mont0.180 Illin 0.440Colo0.200 DakN 0.440Lousi0.200 Verm 0.440NMexi0.210 Minn 0.480Oklah0.230 Conn 0.500Delaw0.240 NewY 0.560Kans0.240 Ariz 0.580Ohio0.240 Hawa 0.600

  • NHans0.250 RhodI 0.610Utah0.265 WasDC 0.650Idaho0.280 Michi 0.750Alask0.290 Massa 0.760 Penn0.310 Washi 0.825Arka0.315

    Hacerunstemandleafdelosdatos.

    Solucin:UsaremoslaopcinTrimdeStemandLeafparadetectaroutliers.

    StemandLeafDisplay:tax

    StemandleafoftaxN=51LeafUnit=0.010

    202340577122313156778820200134442425689(5)311334223566778164014444104895085686601465373756

    HI82

    Interpretacin: El stemandleaf indica muchavariabilidad y asimetrahacia la derecha.Adems,elestadodeWashingtonrepresentaunoutliersuperior.Launidad delahojaes.01,osea37representa0.37. Sehanusadodossubramasporcada ramaprincipal

  • UNIF Administracin de Negocios Internacionales Estadstica

    GRFICOS ESTADSTICOS

    Un grfico o diagrama es un dibujo complementario a una tabla o cuadro, que permite observar las tendencias de un fenmeno en estudio y facilita el anlisis estadstico de las variables all relacionadas.

    Un grfico, al igual que un cuadro o una tabla, debe constar de:

    Ttulo adecuado: El cual debe ser claro y conciso, que responda a las preguntas: qu relaciona, cundo y dnde se hicieron las observaciones?

    El cuerpo: o grfico en s, cuya eleccin debe considerar el o los tipos variables a relacionar y el diseo artstico del grfico.

    Notas de pie de grfico: Donde se otorgan los crditos a las fuentes respectivas.

    TIPOS DE GRFICOS:

    1.- Diagrama Circular: (Pie, Torta, Pastel)

    Se usa para representar variables cualitativas en porcentajes o cifras absolutas.

    EJEMPLO 1: cuando se tienen todos los datos por extensin. Se realiz una encuesta en hogares del distrito de Pueblo Libre, seleccionados al

    azar, acerca de la credibilidad de los noticieros, los resultados obtenidos fueron: 1: Peridico 2: Televisin 3: Radio

    1 2 3 2 3 3 1 3 2 3 2 3 2 3 2 1 3 2 3 2 3 2 3 1 3 2 2 3 1 3 2 3 1 3 2 3 2 3 3 1

    Digitar los datos en la columna C1.

    Ingresar como:

    Convertir en:

    Graph Pie Chart

  • UNIF Administracin de Negocios Internacionales Estadstica

    Clic en Labels

    Clic en Slice Labels

    Clic en OK

    Clic en Pie Options

    Si se elige la opcin Default las porciones del Pie aparecern en orden alfabtico. Si por el contrario, se elige la opcin Increasing volume las porciones aparecern de menor a mayor, y con la opcin Decreasing volumen las porciones se mostrarn de mayor a menor. ngulo de inicio: 90. El primer corte se realiza en 90 y luego las porciones se muestran en sentido horario.

  • UNIF Administracin de Negocios Internacionales Estadstica Al hacer clic en OK y luego en OK, aparecer el grfico:

    Peridico

    Radio

    Televisn

    Category

    Telev isn14; 35,0%

    Radio19; 47,5%

    Peridico7; 17,5%

    Grfico N 1Hogares de Pueblo Libre clasificados segn credibilidad de los noticieros

    Fuente: datos ficticios

    En este grfico se puede cambiar el color de fondo as como tambin el color de las porciones del Pie Chart. Para cambiar el color del fondo: 1. Doble clic en el fondo gris.

    2. Elegir la opcin Custom. Clic en la flecha de Background y elegir el color deseado.

    3. El color del fondo ha cambiado.

    Peridico

    Radio

    Telev isn

    Category

    Telev isn14; 35,0%

    Radio19; 47,5%

    Peridico7; 17,5%

    Grfico N 1Hogares de Pueblo Libre clasificados segn credibilidad de los noticieros

    Fuente: datos ficticios

    4. Clic en la porcin roja y luego clic en la

    misma porcin. Luego doble clic en dicha porcin y elegir el tipo de relleno y el color de fondo.

  • UNIF Administracin de Negocios Internacionales Estadstica

    5. Clic en Explode

    Esta opcin permite extraer dicha porcin.

    6. Al hacer clic en OK.

    Peridico

    Radio

    Telev isn

    Category

    Televisn14; 35,0%

    Radio19; 47,5%

    Peridico7; 17,5%

    Grfico N 1Hogares de Pueblo Libre clasificados segn credibilidad de los noticieros

    Fuente: datos ficticios 7. Repetir el paso 4. para las porciones

    verde y azul.

    8. Finalmente el grfico es:

    Haciendo doble clic en el texto, se puede cambiar el color, el tamao y la fuente.

    Observa que en la esquina superior izquierda del grfico aparece una cruz verde. Ahora, en la columna C1 agrega el dato peridico y luego observa que la cruz verde ha cambiado a un botn amarillo; esto indica que ha habido un cambio en los datos.

  • UNIF Administracin de Negocios Internacionales Estadstica Antes de ingresar el dato adicional:

    Despus de ingresar el dato adicional:

    Para actualizar el grfico, se procede as: click sobre el fondo blanco. Editor Update Update Graph Now

    Entonces, aparece nuevamente la cruz verde; esto significa que el grfico ha sido actualizado con el nuevo dato.

    EJEMPLO 2: cuando se tienen los datos en una Tabla.

    Grado de Instruccin

    Porcentaje

    Primaria 7.69 Secundaria 30.77 Superior 61.54

    Digitar los datos de la tabla en la hoja de trabajo.

    Graph Pie Chart

    A continuacin se realizan todos los pasos del Ejemplo 1.

  • Ejemplos del Suplemento 1 con Minitab

    Prueba t

    La prueba t se puede realizar utilizando Minitab con la secuencia Stat>Basic

    Statistics>1-sample t

    HERRAMIENTAS PARA ANLISIS - ESTADSTICA INFERENCIAL

  • Ocho pasos para el desarrollo de una investigacin O11

    Ejemplos del Suplemento 1 con Minitab

    Con el ejemplo presentado, llene la informacin en la seccin de Summarized Data

    Seleccione la hiptesis que quiere verificar.

    En el botn que dice Options aparece la informacin del intervalo de confianza a

    seleccionar (el default es 95%) y el tipo de hiptesis que quiere realizar (el default es

    not equal)

  • Ocho pasos para el desarrollo de una investigacin O12

    Ejemplos del Suplemento 1 con Minitab

    En el Session Window va a tener un resultado como el siguiente:

    One-Sample T Test of mu = 28000 vs not = 28000

    N Mean StDev SE Mean 95% CI T P

    15 30000 6000 1549 (26677, 33323) 1.29 0.218

    Donde la t estadstica es 1.29 y el P-value o la probabilidad es de 0.218

  • Ocho pasos para el desarrollo de una investigacin O13

    Ejemplos del Suplemento 1 con Minitab

    Prueba Z

    La prueba t se puede realizar utilizando Minitab con la secuencia Stat>Basic

    Statistics>1-sample Z

    Pruebas de hiptesis de una poblacinReferirse a los materiales sobre Pruebas de hiptesis para la teora de estas pruebasMinitabPruebaHiptesis.doc InterConfPruHipo1P.xls Pruebas Hipotesis 2 pob1.xlsLas pruebas de hiptesis permiten probar una afirmacin o rechazarla en relacina parmetros de la poblacin que pueden ser la media, varianza y proporcin connivel de confianza que normalmente es del 95% (con 5% de probabilidad de error).Para las pruebas se toman muestras de las poblaciones y en base a la informacinque proporcionen se infiere sobre el comportamiento del parmetro en la poblacin.

    Caso 1. Prueba de una media poblacional cuando se conoce la varianza de la poblacin (en base a datos histricos) La empresa ROSATEL piensa que el promedio de sus ventas son de s/.28 000 al mes. Selecciona n=35 meses y encuentra

    una media X=30,000, Desviacin estndar s=6800. A un error del 5% Utilizando la prueba Z qu se puede concluir?

    Prueba Z

  • Ejemplos del Suplemento 1 con Minitab

    Con el ejemplo presentado, llene la informacin en la seccin de Summarized Data

    Seleccione la hiptesis que quiere verificar.

    En el botn que dice Options aparece la informacin del intervalo de confianza a

    seleccionar (el default es 95%) y el tipo de hiptesis que quiere realizar (el default es

    not equal)

  • Ocho pasos para el desarrollo de una investigacin O15

    Ejemplos del Suplemento 1 con Minitab

    En el Session Window va a tener un resultado como este:

    One-Sample Z Test of mu = 28000 vs not = 28000

    The assumed standard deviation = 6800

    N Mean SE Mean 95% CI Z P

    35 30000 1149 (27747, 32253) 1.74 0.082

    Donde la Z estadstica es 1.74 y el valor P es de 0.082

  • Contrastes de hiptesis de 1 poblacin

    Proyecto e-Math 1 Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

    CONTRASTES DE HIPTESIS DE 1 POBLACIN

    ESQUEMA DE CONTENIDOS ________________________

    Definicin

    Ejemplo de clculo

    Distribucin Normal

    Caso prctico con

    Minitab

    P - VALOR Ejemplo de

    clculo

    Distribucin t-student

    Explicacin grfica

    CH- 1

    POBLACIN

  • Contrastes de hiptesis de 1 poblacin

    Proyecto e-Math 3 Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

    CONCEPTOS FUNDAMENTALES___________________________________

    Concepto de contraste de hiptesis

    Podemos definir un contraste de hiptesis como un procedimiento que se basa en lo observado en las muestras y en la teora de la probabilidad para determinar si la hiptesis es un enunciado razonable.

    Contraste de hiptesis de una poblacin

    Un contraste de hiptesis es un proceso estadstico que permite elegir una hiptesis de trabajo de entre dos posibles y antagnicas. El contraste comienza con la formulacin de dos hiptesis sobre el valor de algn parmetro poblacional, siendo ambas incompatibles (si una es cierta, la otra necesariamente ha de ser falsa). Supondremos cierta una de ellas, a la cual llamaremos hiptesis nula H0, y trataremos de determinar hasta qu grado las observaciones registradas son coherentes con H0. Slo en caso de que haya fuertes indicios de incompatibilidad entre el supuesto de que H0 sea cierta y los datos obtenidos empricamente, descartaremos H0 como hiptesis de trabajo y en su lugar tomaremos como cierta la hiptesis alternativa H1 . Dos ejemplos de contrastes de hiptesis seran:

    5,2:

    )( 5,2: )(

    0:

    0: )(

    1

    0

    1

    0

    >=

    =

    HH

    iiHH

    i

    Contraste Bilateral () Contraste Unilateral (>)

    En el siguiente esquema se representan las cuatro combinaciones posibles (en funcin de la decisin que tomemos y de la certeza o no de la hiptesis nula) de todo contraste de hiptesis:

    Hiptesis Nula H0

    Decisin tomada

    Verdadera Falsa

    No descartar H0

    Decisin correcta de tipo A Probabilidad 1-

    Error de tipo II Probabilidad

    Descartar H0

    Error de tipo I Probabilidad

    Decisin correcta de tipo B Probabilidad 1-

    Tendremos una decisin correcta de tipo A cuando hayamos optado por no descartar la hiptesis nula y resulte que sta es cierta. Por su parte, una decisin correcta de tipo B ocurrir cuando hayamos decidido descartar la hiptesis nula y resulte que sta era falsa. Hablaremos de error de tipo I cuando hayamos descartado la hiptesis nula siendo sta cierta (error que se considera como muy grave). Finalmente, acontecer un error de tipo II cuando hayamos optado por no descartar la hiptesis nula y resulte que sta es falsa. Dado que descartaremos o no la hiptesis nula a partir de muestras obtenidas (es decir, no dispondremos de informacin completa sobre la poblacin), no ser posible garantizar que la decisin tomada sea la correcta.

  • Contrastes de hiptesis de 1 poblacin

    Proyecto e-Math 4 Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

    Lo que s podremos hacer es controlar la probabilidad de cometer un error. Ahora bien, cul de ellos? En un contraste de hiptesis lo interesante es rechazar la hiptesis nula. Por lo tanto el riesgo que estoy dispuesto a asumir de equivocarme al rechazar la H0, error de tipo I, es el que queremos controlar. Fijmonos que a error de tipo I ms pequeo ms seguridad al rechazar la hiptesis nula. Ahora bien, al empequeecer el error de tipo I estamos javascript:sendmail()aumentando el error de tipo II, puesto que cuanta ms probabilidad de aceptar H0 ms posibilidades de que aceptemos casos donde se cumpla H1 (error de tipo II). Usualmente el error de tipo I se fija en 0,01, 0,05 0,10. Fijado el error de tipo I para empequeecer el error de tipo II debemos aumentar el tamao de muestra. Ahora bien, aumentar el nmero de muestra no siempre es posible ya sea por falta de presupuesto o tiempo, por inviabilidad, Llamaremos potencia del contraste a la probabilidad de rechazar la hiptesis nula siendo sta falsa. Fijmonos que, a mayor potencia, mejor contraste, puesto que podremos aceptar la hiptesis alternativa con poca probabilidad de que sea falsa. Denotaremos por el nivel de significacin o probabilidad de cometer un error de tipo I, y por la probabilidad de cometer un error de tipo II. Con lo cual, la potencia es de 1 - . Como ya hemos indicado usualmente se fija en 0,01, 0,05 o 0,10. Notamos otra vez que , , y el tamao muestral n estn interrelacionados, de forma que si hacemos disminuir cualquiera de ellos alguno de los dos restantes habr de aumentar. As, p.e., si queremos tomar un menor deberemos aceptar que aumente o bien incrementar el tamao de la muestra n . Finalmente, llamaremos estadstico de contraste a una v.a. calculada a partir de las observaciones muestrales, la cual se usa conjuntamente con un criterio de decisin (establecido a priori) para determinar si hemos de descartar o no la hiptesis nula.

    Concepto de p-valor.

    Definimos el p-valor como la probabilidad de que, suponiendo cierta H0, el estadstico de contraste tome un valor al menos tan extremo como el que se obtiene a partir de las observaciones muestrales, i.e., el p-valor es el rea de la cola de la distribucin (o colas si el test es bilateral) definida a partir del estadstico de contraste:

    1. El p-valor slo puede calcularse una vez tomada la muestra, obtenindose niveles crticos

    distintos para cada muestra.

    2. El p-valor puede interpretarse como un nivel mnimo de significacin en el sentido de que niveles de significacin , iguales o superiores al p - valor llevarn a rechazar la hiptesis nula.

    Por tanto, cuanto menor sea el p - valor mayor es el grado de incompatibilidad de la muestra con H0, lo que lleva a rechazar H0.

    3. El clculo del p-valor no proporciona de modo sistemtico una decisin entre H0 y H1.

    Esta forma de abordar los tests, nos permite una visin ms amplia, por cuanto nos da informacin de para qu niveles de significacin puede rechazarse la hiptesis nula, y para cuales no se puede.

    Para lo que sigue, tendremos en cuenta la siguiente propiedad:

    Supuesto: X se distribuye segn una normal.

  • Contrastes de hiptesis de 1 poblacin

    Proyecto e-Math 6 Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

    Ejemplo utilizando la tabla de la normal.

    Un banco quiere analizar si las comisiones que cobra a sus clientes por operaciones en el mercado burstil difieren significativamente de las que cobra la competencia, cuya media es de 12 euros mensuales con una desviacin estndar de 4,3 euros. Este banco toma una muestra de 64 operaciones burstiles y observa que la comisin promedio es de 13,6 euros. Contrastar, al nivel de significacin del 5%, que este banco no difiere significativamente en el cobro de las comisiones por operaciones en la Bolsa con respecto a la competencia. Sea X = Comisiones que se cobran por operaciones en el mercado burstil Tenemos: )3,4,(X Queremos contrastar:

    12:12:

    :1

    0

    =

    HH

    Es decir, queremos contrastar si es 12 euros como la competencia o si por el contrario es distinto de esta cantidad.

    Calculamos el estadstico de contraste,

    98,25375,0

    6,1

    643,4

    126,1300* =====n

    XXZ H

    X

    H

    Como es un contraste de dos extremos, ahora tenemos que calcular el p-valor correspondiente a z*=2,98, es decir el rea que hay por debajo de z=-2,98 ms el rea que hay por encima de z= 2,98, i.e., el rea en las dos colas.

    Si observamos la tabla de la distribucin normal estndar, podemos comprobar que el rea que hay a la izquierda de z=-2,98 es 0,0014 y el rea que hay a la derecha de 2,98 es tambin 1-0,9986=0,0014 por lo que el p-valor= 2*0,0014=0,0028

    Como el p-valor es menor que el nivel de significacin, rechazaremos la hiptesis nula a un nivel de significacin del 5%.

    Por lo tanto existe evidencia estadstica de que la comisin promedio que cobra este banco difiere significativamente de la competencia.

  • Contrastes de hiptesis de 1 poblacin

    Proyecto e-Math 7 Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

    Uso del p-valor en los contrastes sobre con desconocida

    Dada una poblacin X (que sigue una distribucin cualquiera), con media y desviacin estndar desconocidas, se trata de contrastar alguno de los tres tests siguientes:

    :

    :

    01

    00

    =

    HH

    o bien :

    :

    01

    00

    =

    HH

    Estadstico de contraste: )1(* = nStudenttn

    sxt

    Criterio de decisin: Descartaremos H0 si p-valor (normalmente = 0,05).

    Ejemplo utilizando la tabla de la t-student

    La directora del departamento de personal de una importante corporacin est reclutando un gran nmero de empleados para un puesto en el extranjero. Durante el proceso de seleccin, la administracin le pregunta cmo van las cosas, y ella responde que cree que la puntuacin promedio en la prueba de aptitudes ser de aproximadamente 90 puntos. Cuando la administracin revisa 19 de los resultados de la prueba compilados, encuentra que la puntuacin media es 83,24 y la desviacin estndar de esta puntuacin es 11. Si la administracin desea probar la hiptesis 90:0 =H vs 90: aH al nivel de significacin del 10%, Cul es el valor del estadstico de contraste y su p-valor?

    90:0 =H 90: aH

    Suponemos que la poblacin de resultados de todos los candidatos sigue una distribucin normal . );( NX y entonces la distribucin muestral de cada media muestral de cada muestra de cada poblacin seguir tambin una normal :

    n

    SNX ;

    Como no se conocen las desviaciones estndar de las dos poblaciones, tendremos que utilizar la distribucin de la t-student como distribucin del estadstico de contraste .

    )1(00 == nstudenttn

    XXt H

    X

    H

    Si calculamos el estadstico t de contraste nos queda:

  • Contrastes de hiptesis de 1 poblacin

    Proyecto e-Math 8 Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

    6747,2

    1911

    9025,83

    00 ====n

    XXt H

    X

    H

    Como los grados de libertad son 18, entonces como tenemos un contraste de dos colas, es decir en la hiptesis alternativa aparece el distinto, es decir 90:0 =H 90:1 H ; entonces el p-valor de t = -2,6747 ser la probabilidad de estar por encima de 2,6747 ms la probabilidad de estar por debajo de t =-2,6747. Cuando no aparece en la tabla de la t-student el valor exacto del estadstico del cual se quiere calcular su p-valor, se toma como referencia el valor ms cercano, en este caso t=-2,5524. Por tanto el p-valor = P(t>2,5524)+P(tH 90:1 =

    ppHppH

    Supuesto 1: La distribucin de X es aproximadamente normal. Recordemos que si n 20 , n*p 5 , y n*(1-p) 5 , entonces ( ))1(, pnpnpNX .

    Supuesto 2: Las n observaciones que constituyen la muestra han sido seleccionadas de forma aleatoria e independiente de una poblacin que no ha cambiado durante el muestreo.

    Estadstico de contraste: )1,0()1(

    * N

    npp

    ppz =

    Criterio de decisin: Descartaremos H0 si p-valor (normalmente = 0,05).

  • Contrastes de hiptesis de 1 poblacin

    Proyecto e-Math 9 Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

    Ejemplo utilizando la tabla de la normal

    Un portal e-business sabe que el 60% de todos sus visitantes a la web estn interesados en adquirir sus productos pero son reacios al comercio electrnico y no realizan finalmente la compra va Internet. Sin embargo, en la direccin del portal se piensa que en el ltimo ao, el porcentaje de gente que est dispuesta a comprar por Internet ha aumentado y eso se debe reflejar en sus resultados empresariales. Contrastar al nivel de significacin del 2% si en el ltimo ao se ha reducido el porcentaje de gente que no est dispuesta a comprar por Internet, si para ello se tom una muestra de 500 visitantes para conocer su opinin y se observ que el 55% no estaba dispuesto a realizar compras va on-line.

    6,0:6,0:

    :

    0

    p y z= 2,27, tendramos que tener en cuenta el reas que hay por encima de z=-2,27,, es decir 1-rea por debajo de z=2,27, es decir 0116,09884,01)27,2(1 ==

  • Contrastes de hiptesis de 1 poblacin

    Proyecto e-Math 10 Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

    2. Si el contraste hubiese sido bilateral, es decir en la alternativa hubiese aparecido 6,0p y z = 2,27 el p-valor sera igual a la suma del rea por encima de z=2,27 ms el rea por debajo de z = -2,27, es decir 0,0116 dos veces, p-valor = 2*0,0116=0,0232.

    Como el p-valor=0,0232 es mayor que el nivel de significacin que es 0,02(2%), entonces no rechazaremos la hiptesis nula a un nivel de significacin del 2%.

    En conclusin existe evidencia estadstica que el porcentaje de visitantes que son reacios a

    comprar va on-line es del 60%.

    0

    0,0

    0,1

    0,2

    0,3

    0,4

    Valores de la v.a. Z

    Func

    in

    de d

    ensi

    dad

    (f.d.

    p.)

    P-valor cuando el contraste es bilateral

    /z*/ = 2,27-/z*/= - 2,27

    p-valor: suma de ambasreas = 0,0232

    0,0116 0,0116

  • Contrastes de hiptesis de 1 poblacin

    Proyecto e-Math 11 Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

    CASOS PRCTICOS CON SOFTWARE___________________________________

    1. Una multinacional desea analizar el sueldo neto por ao de sus empleados en las empresas

    situadas en Espaa. Para ello se tom una muestra de 40 directivos y se obtuvo el salario bruto anual de cada uno. En los ltimos aos se haba estimado que el salario medio anual de los trabajadores en Espaa era de 18.000 euros, con una desviacin estndar de 2.600 euros.

    Salarios brutos medios anuales en miles de euros.

    18,2630

    13,2104

    17,8783

    15,2542

    20,7617

    15,1401

    19,.8144

    16,9471

    20,3956

    18,8842

    20,6542

    16,648

    22,4938

    23,5305

    14,9760

    22,3734

    18,4742

    18,9199

    18,2433

    19,1553

    18,2460

    20,2367

    20,3570

    18,2373

    18,5457

    14,7056

    16,8871

    16,1106

    17,2399

    16,5339

    17,5765

    14,6103

    19,2611

    16,6708

    21,1429

    18,8906

    17,5592

    20,8730

    16,6488

    12,8947

    a) El jefe de personal considera que el sueldo medio anual debe ser menor que 18.000 euros y quiere contrastar, con un nivel de significacin del 0.05, la hiptesis oficial de que el tiempo medio es de 18.000 euros frente a la hiptesis de que dicha media es menor.

    El contraste de hiptesis que estableceremos ser H0: =18 vs. H1: Basic Statistics > 1-Sample Z:

  • Contrastes de hiptesis de 1 poblacin

    Proyecto e-Math 12 Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

    Z-Test Test of mu = 18.000 vs mu < 18.000 The assumed sigma = 2.60 Variable N Mean StDev SE Mean Z P C1 40 18.129 2.474 0.411 0.31 0.62

    Dado que el p-valor obtenido 0.62 > 0.05, no descartaremos la hiptesis nula, esto significa que parece razonable considerar que el salario medio bruto anual sea de es de 18.000 euros.

    b) Igualmente, realiza el mismo contraste que en el apartado a), pero suponiendo sta vez que no conoces la desviacin estndar.

    Anlogamente, seleccionamos Stat > Basic Statistics > 1-Sample t, obteniendo los siguientes resultados:

    T-Test of the Mean

    Test of mu = 18.000 vs mu < 18.000 Variable N Mean StDev SE Mean T P C1 40 18.129 2.474 0.391 0.33 0.63

    Por tanto, observamos que el p-valor 0.63 > 0.05, lo cual nos indica que no rechazaremos la hiptesis nula, es decir, asumiremos como posible la opcin de que el salario bruto medio anual sea 18.000 euros, ya que no tenemos indicios suficientes para rechazar esta posibilidad.

  • Contrastes de hiptesis de 1 poblacin

    Proyecto e-Math 13 Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

    2. El Dpto. de Marketing de una empresa europea quiere analizar la eficacia de su fuerza de ventas. Para ello tom una muestra de 150 comerciales repartidos por sus varias delegaciones en Europa y se obtuvo en euros lo que cada comercial ha facturado en los ltimos seis meses. Se ha comprobado que, hasta ahora, que el volumen facturado por la fuerza de ventas hasta ahora segua una distribucin aproximadamente normal de media 165.000 y desviacin tpica de 45.000 .

    a) Realizar un contraste de hiptesis bilateral sobre la media de la poblacin para un nivel de significacin =0,05.

    Tomamos como hiptesis nula H0: = 165000, siendo la hiptesis alternativa H1: 165000

    Copiamos los datos en una hoja de Minitab y seleccionamos Stat > Basic Statistics > 1-Sample Z :

  • Contrastes de hiptesis de 1 poblacin

    Proyecto e-Math 14 Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

    Z-Test Test of mu = 165000 vs mu not = 165000 The assumed sigma = 45000 Variable N Mean StDev SE Mean Z P Precio 150 153775 41611 3674 -3.06 0.0023

    Observar que el p-valor obtenido es de 0,0023 < 0,05. Esto indica que deberamos rechazar la hiptesis nula. Por tanto, concluiremos que hay indicios suficientes para pensar que la facturacin obtenida por la fuerza de ventas ha variado.

    b) Realizar un contraste similar al anterior suponiendo que esta vez no conocemos la desviacin estndar .

    En este caso, tenemos que utilizar la distribucin t-Student, en lugar de la normal debido a que la desviacin estndar es desconocida.

    Seleccionamos Stat > Basic Statistics > 1-Sample t:

  • Contrastes de hiptesis de 1 poblacin

    Proyecto e-Math 15 Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

    T-Test of the Mean Test of mu = 165000 vs mu not = 165000 Variable N Mean StDev SE Mean T P Precio 150 153775 41611 3398 -3.30 0.0012

    Observar que el p-valor obtenido 0,0012 sigue siendo inferior a 0,05, lo que nos lleva nuevamente a rechazar la hiptesis nula. Por ello, podemos concluir que efectivamente la facturacin obtenida por la fuerza de ventas ha variado.

    3. Supongamos que trabajamos para un candidato a la alcalda de nuestra ciudad y nos encontramos en plena campaa electoral. Nuestro candidato estima que tiene el apoyo del 55% de los votantes. Sin embargo, acaban de llegar a nuestra oficina los datos de una encuesta reciente en la que slo 86 de 200 potenciales votantes (seleccionados de forma aleatoria) optan por nuestra opcin. Nos interesa contrastar, a un nivel de significacin del 0,05, las hiptesis H0 : p = 0,55 vs. H1 : p < 0,55 .

    Observar que se verifican los supuestos. En particular, el supuesto de normalidad se

    verifica dado que n = 200 > 20, np = 200*0,55 > 5, y n(1-p) = 200*0,45 > 5.

    Realicemos el contraste:

    Seleccionamos: Stat > Basic Statistics > 1 Proportion :

    Entramos en el men Options y rellenamos los campos como se muestra en la imagen siguiente:

  • Contrastes de hiptesis de 1 poblacin

    Proyecto e-Math 16 Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

    Test and Confidence Interval for One Proportion Test of p = 0,55 vs p < 0,55 Sample X N Sample p 95,0 % CI Z-Value P-Value 1 86 200 0,430000 (0,361387; 0,498613) -3,41 0,000

    A raz del resultado obtenido ( p-valor = 0,000 < 0,05 ), concluimos que deberemos descartar la hiptesis nula, i.e., los datos obtenidos en la ltima encuesta sobre intencin de voto sugieren que el porcentaje de votantes que apoyan nuestra candidatura es inferior al 55%.

    De hecho, a partir de las observaciones, podemos afirmar con un nivel de confianza del 95% que el porcentaje de votos favorables se sita entre un 36% y un 50%.

  • Contrastes de hiptesis de 1 poblacin

    Proyecto e-Math 18 Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

    TABLA DE LA t-STUDENT_____________________________________________

    DF 0,400 0,250 0,150 0,100 0,050 0,025 0,010 0,0051 0,3249 1,0000 1,9626 3,0777 6,3137 12,7062 31,8210 63,65592 0,2887 0,8165 1,3862 1,8856 2,9200 4,3027 6,9645 9,92503 0,2767 0,7649 1,2498 1,6377 2,3534 3,1824 4,5407 5,84084 0,2707 0,7407 1,1896 1,5332 2,1318 2,7765 3,7469 4,60415 0,2672 0,7267 1,1558 1,4759 2,0150 2,5706 3,3649 4,03216 0,2648 0,7176 1,1342 1,4398 1,9432 2,4469 3,1427 3,70747 0,2632 0,7111 1,1192 1,4149 1,8946 2,3646 2,9979 3,49958 0,2619 0,7064 1,1081 1,3968 1,8595 2,3060 2,8965 3,35549 0,2610 0,7027 1,0997 1,3830 1,8331 2,2622 2,8214 3,2498

    10 0,2602 0,6998 1,0931 1,3722 1,8125 2,2281 2,7638 3,169311 0,2596 0,6974 1,0877 1,3634 1,7959 2,2010 2,7181 3,105812 0,2590 0,6955 1,0832 1,3562 1,7823 2,1788 2,6810 3,054513 0,2586 0,6938 1,0795 1,3502 1,7709 2,1604 2,6503 3,012314 0,2582 0,6924 1,0763 1,3450 1,7613 2,1448 2,6245 2,976815 0,2579 0,6912 1,0735 1,3406 1,7531 2,1315 2,6025 2,946716 0,2576 0,6901 1,0711 1,3368 1,7459 2,1199 2,5835 2,920817 0,2573 0,6892 1,0690 1,3334 1,7396 2,1098 2,5669 2,898218 0,2571 0,6884 1,0672 1,3304 1,7341 2,1009 2,5524 2,878419 0,2569 0,6876 1,0655 1,3277 1,7291 2,0930 2,5395 2,860920 0,2567 0,6870 1,0640 1,3253 1,7247 2,0860 2,5280 2,845321 0,2566 0,6864 1,0627 1,3232 1,7207 2,0796 2,5176 2,831422 0,2564 0,6858 1,0614 1,3212 1,7171 2,0739 2,5083 2,818823 0,2563 0,6853 1,0603 1,3195 1,7139 2,0687 2,4999 2,807324 0,2562 0,6848 1,0593 1,3178 1,7109 2,0639 2,4922 2,797025 0,2561 0,6844 1,0584 1,3163 1,7081 2,0595 2,4851 2,787426 0,2560 0,6840 1,0575 1,3150 1,7056 2,0555 2,4786 2,778727 0,2559 0,6837 1,0567 1,3137 1,7033 2,0518 2,4727 2,770728 0,2558 0,6834 1,0560 1,3125 1,7011 2,0484 2,4671 2,763329 0,2557 0,6830 1,0553 1,3114 1,6991 2,0452 2,4620 2,756430 0,2556 0,6828 1,0547 1,3104 1,6973 2,0423 2,4573 2,7500

    35 0,2553 0,6816 1,0520 1,3062 1,6896 2,0301 2,4377 2,723840 0,2550 0,6807 1,0500 1,3031 1,6839 2,0211 2,4233 2,704545 0,2549 0,6800 1,0485 1,3007 1,6794 2,0141 2,4121 2,689650 0,2547 0,6794 1,0473 1,2987 1,6759 2,0086 2,4033 2,677860 0,2545 0,6786 1,0455 1,2958 1,6706 2,0003 2,3901 2,660370 0,2543 0,6780 1,0442 1,2938 1,6669 1,9944 2,3808 2,647980 0,2542 0,6776 1,0432 1,2922 1,6641 1,9901 2,3739 2,638790 0,2541 0,6772 1,0424 1,2910 1,6620 1,9867 2,3685 2,6316

    100 0,2540 0,6770 1,0418 1,2901 1,6602 1,9840 2,3642 2,6259120 0,2539 0,6765 1,0409 1,2886 1,6576 1,9799 2,3578 2,6174150 0,2538 0,6761 1,0400 1,2872 1,6551 1,9759 2,3515 2,6090200 0,2537 0,6757 1,0391 1,2858 1,6525 1,9719 2,3451 2,6006300 0,2536 0,6753 1,0382 1,2844 1,6499 1,9679 2,3388 2,5923

    1E+09 0,2533 0,6745 1,0364 1,2816 1,6449 1,9600 2,3263 2,5758

    VALORES DE P

    Esta tabla nos da los valores de a tales que P[ t(df) a ] = p donde t(df) sigue una distribucin t-Student con df grados de libertad

    a

  • Modelos de probabilidad

    Proyecto e-Math 1 Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

    MODELOS DE PROBABILIDAD

    MAPA CONCEPTUAL ________________________

    MODELOS DE PROBABILIDAD

    VARIABLES ALEATORIAS

    V.A.DISCRETAS

    V.A. CONTINUAS

    DISTRIBUCIN DE PROBABILIDAD

    MEDIA, VARIANZA Y DESV. ESTNDAR DE

    UNA DISTR. PROB

    LA DISTRIBUCIN BINOMIAL

    CASOS PRCTICOS CON MINITAB

    LA DISTRIBUCIN DE POISON

    LA DISTRIBUCIN NORMAL

  • Modelos de probabilidad

    Proyecto e-Math 3 Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

    CONCEPTOS FUNDAMENTALES ______________________________

    Definicin de variable aleatoria (v.a.): Corresponde al valor resultante de un determinado experimento. Por ejemplo, si contamos el nmero de empleados ausentes en un determinado turno de trabajo, el resultado podra ser 0, 1, 2, ...., este nmero de ausencias es la variable aleatoria.

    Distinguiremos entre variables aleatorias discretas y continuas. Diremos que una variable aleatoria es discreta cuando slo puede tomar un nmero contable de valores. Estos valores no necesariamente han de ser enteros, pero s han de tener valores claramente definidos. Seran v.a. discretas, p.e., X1 = n de hermanos de cada uno de nuestros amigos, o X2 = nota, con una cifra decimal, obtenida en un examen por cada alumno de un aula. Por el contrario, una v.a. continua es aquella que puede tomar cualquier valor dentro de un intervalo real. Seran v.a. continuas, p.e., X3 = altura, en cm., de los jugadores de un equipo de baloncesto (1.9, 1.92, 1.923,...), o X4 = distancia entre dos ciudades.

    Definicin de distribucin de probabilidad: Es aquella que permite calcular todos los resultados probables de ocurrir de un experimento determinado, as como la probabilidad de ocurrencias de estos resultados. [2] Las caractersticas ms importantes a tener en cuenta en una distribucin de probabilidad son:

    - La probabilidad de un resultado especfico est entre cero y uno. - La suma de las probabilidades de todos los resultados mutuamente

    excluyentes es 1.

    Definicin de funcin de distribucin de probabilidad: La funcin de probabilidad de

    una variable aleatoria es la probabilidad acumulada hasta un valor determinado de la variable. Dada una variable aleatoria X, diremos que F(a) es la funcin de distribucin tal que:

    F(a) = P(Xa)

    La funcin de distribucin de probabilidad cumple 0 F(x) 1. En el caso de las variables discretas la funcin de probabilidad se asocia con la funcin de probabilidad, funcin que da la probabilidad de cada posible valor que toma la variable. En el caso de las continuas como estas pueden tomar infinitos valores en un intervalo su funcin de probabilidad viene definida como la probabilidad a intervalos de valores. De hecho, la probabilidad de que la variable tome un determinado valor es nula. Las variables aleatorias continuas se caracterizan por una funcin denominada funcin de densidad.

    Definicin de funcin de probabilidad para una variable aleatoria discreta: Dada

    una variable aleatoria discreta X, diremos que f(xi) es la funcin de probabilidad que asocia a cada valor xi de la variable su probabilidad, i.e., f(xi) = P(X=xi).

  • Modelos de probabilidad

    Proyecto e-Math 4 Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

    De este modo: F(a) = P(Xa) es igual a la suma de todos los P(X=xi) tales que xi son menores que a.

    Definicin de funcin de densidad para una variable aleatoria continua: Dada

    una variable aleatoria continua X la funcin de densidad f(x) asociada a una variable aleatoria continua X caracteriza la funcin de distribucin de probabilidad de X donde:

    ==a

    dxxfaXPaF )()()(

    La media, la varianza y la desviacin estndar.

    Como sabemos, la media nos da informacin acerca de la tendencia central de los datos y la varianza describe la dispersin de stos. A la media de la distribucin la denotaremos por , y a la desviacin estndar por . La media es el valor promedio ponderado en el que los valores posibles de la variable aleatoria se ponderan segn las probabilidades correspondientes de ocurrencia, tambin se denomina valor esperado E(X). Para una variable aleatoria discreta: [ ]== )()( xxPXE donde P(x) es la probabilidad de valores posibles de la variable aleatoria x. Es decir, se multiplica cada valor de x por la probabilidad de que ocurra, y luego se suman estos productos. Para una variable aleatoria continua:

    [ ] +

    == dxxfxXE )(

    La varianza describir la dispersin de la distribucin. Para una variable aleatoria discreta:

    [ ] = )()( 22 xPx Para una variable aleatoria continua:

    +

    = dxxfx )(22 bviamente, la desviacin estndar la calcularemos al extraer la raz cuadrada de la varianza.

    La distribucin Binomial. Consideremos una variable aleatoria X que da el nmero de xitos que aparecen al repetir n veces de forma independiente un experimento en idnticas condiciones. En esta situacin diremos que X sigue una distribucin Binomial. Ejemplos: X= nmero de huevos defectuosos en un paquete de 12. Y= nmero de 2 al tirar 10 veces un dado. Las caractersticas principales de este modelo de distribucin son:

    1. Repetir n pruebas independientes unas de otras.

  • Modelos de probabilidad

    Proyecto e-Math 5 Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

    2. Para cada una de las pruebas slo pueden darse dos resultados: xito o fracaso

    3. La probabilidad de xito en cada prueba es de p.

    En tales condiciones, diremos que la v.a. X = n de xitos en las n pruebas sigue una distribucin Binomial de parmetros n y p, y lo escribiremos como X B(n,p) . Observamos que la v.a. X slo puede tomar los valores 0, 1, 2, 3, , n siendo por tanto una v.a. discreta. As pues, las funciones de probabilidad y de distribucin de una distribucin binomial son las siguientes:

    xnx ppxn

    xXPxf

    === )1()()( para x=0,1,2,3.n

    donde )!(!

    !xnx

    nxn

    =

    y

    =

    ===n

    iiXPxXPxF

    0)()()(

    De la misma manera, la media y la desviacin estndar de una distribucin binomial son:

    pn*= , )1(** ppn = La distribucin de Bernoulli es un caso particular de la binomial cuando n=1 . Veamos unos ejemplos que muestran cmo aplicar la distribucin Binomial:

    Ejemplos:

    1. Una empresa industrial que fabrica componentes mecnicos para aviones dispone de

    dos distribuidores por Europa, uno situado en Francia y otro en Alemania. Ambos tienen el 20% de posibilidades de cerrar un pedido con un consorcio industrial de farbicacin de aviones. Si el distribuidor francs contacta con 5 consorcios:

    a) Cul es la probabilidad de que el distribuidor francs consiga a lo sumo 2 acuerdos

    de distribucin?

    Sea X=Nmero de acuerdos de distribucin del distribuidor francs a 5 consorcios p = probabilidad de xito = P(cerrar un acuerdo) = 0,2 n = nmero de clientes = 5 X sigue una distribucin Binomial, X B(5 , 0,2)

    Nuestro objetivo es calcular P(X < = 2).

    P(X

  • Modelos de probabilidad

    Proyecto e-Math 6 Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

    Por su parte,

    32768.0)2.01(2.0)!05(!0

    !5)0( 50 ===XP

    4096,0)2.01(2.0)!15(!1

    !5)1( 41 ===XP

    2048.0)2.01(2.0)!25(!2

    !5)2( 32 ===XP

    Por lo tanto la probabilidad de que el distribuidor francs cierre a lo sumo dos acuerdos es igual a 0,94208

    b) Cul sera el nmero medio esperado de acuerdos que conseguira cerrar el

    distribuidor francs?

    Para calcular cual ser el nmero medio esperado de acuerdos de distribucin ms probable que cierre el distribuidor calculamos la media de una distribucin binomial que nos da el nmero medio de xitos, en este caso sera, n*p= 5*0,2=1. Por lo tanto el nmero medio esperado de acuerdos logrados por el distribuidor francs ser de 1.

    2. El presidente de una compaa planea contactar con otras 18 compaas en busca de nuevos socios para su negocio. Sus analistas han estimado que la probabilidad de que una firma contactada al azar acepte incorporarse como socio es de 0,6. Cul es la probabilidad de que acabe reclutando 5 o ms socios de entre las 18 compaas contactadas? Cul es el nmero medio esperado de socios que se incorporarn al proyecto?

    Sabemos que X B(18, 0.6). Nos piden hallar P(X>=5). P(X>=5) = 1-P(X=5) = 0.9987128, as pues la probabilidad de que se incorporen al proyecto ms de cinco socios es de 0,9987.

  • Modelos de probabilidad

    Proyecto e-Math 7 Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

    Para calcular cual ser el nmero de socios medio esperado que se incorpore al proyecto calculamos la media de una distribucin Binomial que nos da el nmero medio de xitos, en este caso sera, n*p= 18*0,6=10,8 que redondeando sera 11. Por tanto, el nmero medio esperado de socios que se incorporen al proyecto ser de 11.

    Ejemplos con Minitab:

    1. Supongamos que X es una variable aleatoria (v.a.) que sigue una distribucin binomial de parmetros n = 4 y p = 0,85.

    Veamos cmo podemos calcular la funcin de probabilidad de esta v.a.:

    En primer lugar, en la columna C1 colocaremos los posibles valores que esta v.a. puede tomar, i.e., 0, 1, 2, 3 y 4. Seleccionamos Calc > Probability Distributions > Binomial y completamos los campos como se indica en la imagen inferior:

    Probability Density Function Binomial with n = 4 and p = 0,850000 x P( X = x) 0,00 0,0005 1,00 0,0115 2,00 0,0975 3,00 0,3685 4,00 0,5220

    Anlogamente, el siguiente ejemplo nos muestra cmo calcular la funcin de distribucin:

    2. Supongamos que X sigue una distribucin Binomial de n=20 y cuya probabilidad de

    xito es 0.3333, es decir X B(20 , 0,3333).

  • Modelos de probabilidad

    Proyecto e-Math 8 Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

    Queremos calcular la probabilidad de que X tome un valor menor o igual a 11, i.e., P(X Probability Distributions > Binomial y completamos los campos como se indica en la imagen inferior:

    El resultado es el siguiente:

    Cumulative Distribution Function Binomial with n = 20 and p = 0,333300 x P( X Binomial y completamos los campos como se indica en la imagen inferior:

  • Modelos de probabilidad

    Proyecto e-Math 9 Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

    El output que obtenemos nos dice que c = 3 es el valor que deja a su izquierda el 91,3% de la distribucin de X .

    Inverse Cumulative Distribution Function Binomial with n = 5 and p = 0,400000 x P( X Binomial.

    El resultado es el siguiente:

    Probability Density Function Binomial with n = 10 and p = 0.250000 x P( X = x) 0.00 0.0563

    Por tanto, P(X=0) = 0.056, es decir, la probabilidad de que hoy no se retrase ninguno de los 10 vuelos es muy baja, aprox. 0.056

    Ahora, para calcular la probabilidad de que no se retrasen ms de dos vuelos, es decir, P(X Probability Distributions > Binomial, y activaremos la opcin de Cumulative Probability, obteniendo el siguiente resultado:

  • Modelos de probabilidad

    Proyecto e-Math 10 Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

    Cumulative Distribution Function Binomial with n = 10 and p = 0.250000 x P( X

  • Modelos de probabilidad

    Proyecto e-Math 12 Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

    La probabilidad de que una variable aleatoria (v.a.) X tome un valor determinado entre dos

    nmeros reales a y b coincide con el rea encerrada por la funcin

    2)(

    2

    21

    =x

    exf

    (funcin de densidad de probabilidad) entre los puntos a y b, es decir :

    P(aXb) = ba dxxf )(

    Como hemos comentado anteriormente, observar que:

    - La distribucin normal es simtrica respecto de su media . - El rea total encerrada por f(x) vale 1, i.e.: + =+

  • Modelos de probabilidad

    13

    expresin anterior, es posible encontrar el rea de probabilidad bajo cualquier curva normal haciendo referencia a la distribucin normal estndar en las tablas correspondientes. As pues, para averiguar el rea encerrada bajo la curva utilizaremos la tabla que encontraremos al final de este apartado. Dicha tabla nos proporciona la probabilidad de que la v.a. normal estndar Z tome un valor situado a la izquierda de un nmero c, i.e.: P(Z> 30, por el Teorema Central del Lmite tendremos que la distribucin de las medias muestrales X se podr aproximar por una normal con media 406,15 y desviacin estndar 5,50. Hemos de hallar )400( Probability Distributions > Normal :

  • Modelos de probabilidad

    Proyecto e-Math 16 Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

    Cumulative Distribution Function Normal with mean = 406,150 and standard deviation = 5,55000 x P( X

  • Modelos de probabilidad

    Normal with mean = 406,150 and standard deviation = 5,55000 x P( X Probability Distributions > Normal , pero ahora elegiremos la opcin Inverse Cumulative Probability , con lo que obtendremos :

    Inverse Cumulative Distribution Function Normal with mean = 406,150 and standard deviation = 5,55000 P( X