Estadistica para Administracion y Economia _Anderson Sweeney_10 Edicion

1091
ESTADÍSTICA PARA ADMINISTRACIÓN Y ECONOMÍA ANDERSON SWEENEY WILLIAMS 10 a . edición

Transcript of Estadistica para Administracion y Economia _Anderson Sweeney_10 Edicion

  1. 1. ESTADSTICA PARA ADMINISTRACIN Y ECONOMA ANDERSON SWEENEY WILLIAMS ESTADSTICA PARAADMINISTRACIN YECONOMA 10a. edicin La nueva edicin de esta obra, un verdadero best-seller, tanto en Estados Unidos como en Amrica Latina, contina presentando una gran cantidad de ejercicios con datos reales actualizados. Las secciones de problemas se dividen en tres partes a fin de reforzar lo aprendido: mtodos, aplicaciones y autoevaluaciones. Adems contiene secciones y advertencias sobre los errores estadsticos ms comunes en los que se puede incurrir. Caractersticas A lo largo de todo el texto se plantean situaciones de negocios y econmicas reales. Se muestra el uso de la computadora; especialmente se enfatiza el trabajo con Excel y con MINITAB en sus versiones ms recientes. Presenta una mayor cobertura en mtodos tabulares y grficos de la estadstica descriptiva. Integra el uso de Excel para el muestreo aleatorio. Incorpora el uso de apoyos en lnea integrados a lo largo del texto. Un nuevo apndice F cubre el uso de software para calcular el valor de p y muestra claramente el uso de MINITAB y Excel para calcular los valores de p asociados a pruebas estadsticas z, t y F. Emplea software estadstico para el uso de tablas de distribucin normal acumulada, lo que hace ms sencillo para el alumno el clculo de los valores de p en las pruebas de hiptesis. Integra casos al final de cada captulo. ste es sin duda el mejor libro de Estadstica para Administracin y Economa en espaol. ANDERSON SWEENEY WILLIAMS 10a. edicin C M Y CM MY CY CMY K Anderson ok.pdf 6/3/08 11:26:04
  2. 2. 00Ander(i-xxviii).qxd 2/29/08 10:41 AM Page iv
  3. 3. David R. Anderson University of Cincinnati Dennis J. Sweeney University of Cincinnati Thomas A. Williams Rochester Institute of Technology Traduccin: Ma. del Carmen Hano Roa Diplom Mathematekirin Ludwig-Maximiliams Universitt Mnchen, Alemania Revisin tcnica: Dra. Teresa Lpez lvarez Consultora independiente Estadstica para administracin y economa Estadstica para administracin y economa Australia Brasil Corea Espaa Estados Unidos Japn Mxico Reino Unido Singapur 10a. edicin 00Ander(i-xxviii).qxd 2/29/08 10:41 AM Page i
  4. 4. Estadstica para administracin y economa, 10a. edicin Anderson, David R., Dennis J. Sweeney y Thomas A.Williams Presidente de Cengage Learning Latinoamrica: Javier Arellano Gutirrez Director General Mxico y Centroamrica: Hctor Enrique Galindo Iturribarra Director Editorial Latinoamrica: Jos Toms Prez Bonilla Editor: Sergio R. Cervantes Gonzlez Director de produccin: Ral D. Zendejas Espejel Editor de produccin: Timoteo Eliosa Garca Ilustrador: Michael Stratton/cmiller design Diseo de portada: Paul Neff Imagen de portada: Brand X Images/Getty Images Composicin tipogrfica: Jos Jaime Gutirrez Aceves D.R. 2008 por Cengage Learning Editores, S.A. de C.V., una Compaa de Cengage Learning, Inc. Corporativo Santa Fe Av. Santa Fe, nm. 505, piso 12 Col. Cruz Manca, Santa Fe C.P. 05349, Mxico, D.F. Cengage Learning es una marca registrada usada bajo permiso. DERECHOS RESERVADOS. Ninguna parte de este trabajo amparado por la Ley Federal del Derecho de Autor, podr ser reproducida, transmitida, almacenada o utilizada en cualquier forma o por cualquier medio, ya sea grfico, electrnico o mecnico, incluyendo, pero sin limitarse a lo siguiente: fotocopiado, reproduccin, escaneo, digitalizacin, grabacin en audio, distribucin en Internet, distribucin en redes de informacin o almacenamiento y recopilacin en sistemas de informacin a excepcin de lo permitido en el Captulo III, Artculo 27 de la Ley Federal del Derecho de Autor, sin el consentimiento por escrito de la Editorial. Traducido del libro Statistics for Business and Economics, 10th ed. Publicado en ingls por Thomson/Southwestern 2008 ISBN: 0-324-36068-1 Datos para catalogacin bibliogrfica: Anderson, David R., Dennis J. Sweeney y Thomas A.Williams Estadstica para administracin y economa, 10a.ed. ISBN-13: 978-607-481-319-7 ISBN-10: 607-481-319-1 Visite nuestro sitio en: http://latinoamerica.cengage.com 00Ander(i-xxviii).qxd 2/29/08 10:41 AM Page ii
  5. 5. Dedicado a Marcia, Cherri y Robbie 00Ander(i-xxviii).qxd 2/29/08 10:41 AM Page iii
  6. 6. 00Ander(i-xxviii).qxd 2/29/08 10:41 AM Page iv
  7. 7. v Contenido breve Prefacio xxiii Acerca del autor xxvii Captulo 1 Datos y estadsticas 1 Captulo 2 Estadstica descriptiva: presentaciones tabulares y grficas 26 Captulo 3 Estadstica descriptiva: medidas numricas 81 Captulo 4 Introduccin a la probabilidad 141 Captulo 5 Distribuciones de probabilidad discreta 186 Captulo 6 Distribuciones de probabilidad continua 225 Captulo 7 Muestreo y distribuciones muestrales 257 Captulo 8 Estimacin por intervalo 299 Captulo 9 Prueba de hiptesis 338 Captulo 10 Inferencia estadstica acerca de medias y de proporciones con dos poblaciones 393 Captulo 11 Inferencias acerca de varianzas poblacionales 434 Captulo 12 Pruebas de bondad de ajuste e independencia 457 Captulo 13 Diseo de experimentos y anlisis de varianza 490 Captulo 14 Regresin lineal simple 543 Captulo 15 Regresin mltiple 624 Captulo 16 Anlisis de regresin: construccin de modelos 693 Captulo 17 Nmeros ndice 744 Captulo 18 Pronstico 765 Captulo 19 Mtodos no paramtricos 812 Captulo 20 Mtodos estadsticos para el control de calidad 846 Captulo 21 Anlisis de decisin 879 Captulo 22 Encuestas muestrales Apndice A Referencias y bibliografa 916 Apndice B Tablas 918 Apndice C Notacin para la suma 946 Apndice D Soluciones para los autoexmenes y respuestas a los ejercicios con nmeros pares 948 Apndice E Uso de las funciones de Excel 995 Apndice F Clculo de los valores-p usando Minitab o Excel 1000 ndice 1004 00Ander(i-xxviii).qxd 2/29/08 10:41 AM Page v
  8. 8. 00Ander(i-xxviii).qxd 2/29/08 10:41 AM Page vi
  9. 9. Prefacio xxiii Acerca de los autores xxvii Captulo 1 Datos y estadsticas 1 La estadstica en la prctica: BusinessWeek 2 1.1 Aplicaciones en los negocios y en la economa 3 Contadura 3 Finanzas 4 Marketing 4 Produccin 4 Economa 4 1.2 Datos 5 Elementos, variables y observaciones 6 Escalas de medicin 6 Datos cualitativos y cuantitativos 7 Datos de seccin transversal y de series de tiempo 7 1.3 Fuentes de datos 10 Fuentes existentes 10 Estudios estadsticos 11 Errores en la adquisicin de datos 12 1.4 Estadstica descriptiva 13 1.5 Inferencia estadstica 15 1.6 Las computadoras y el anlisis estadstico 17 Resumen 17 Glosario 18 Ejercicios complementarios 19 Captulo 2 Estadstica descriptiva: presentaciones tabulares y grficas 26 La estadstica en la prctica: La empresa Colgate-Palmolive 27 2.1 Resumen de datos cualitativos 28 Distribucin de frecuencia 28 Distribuciones de frecuencia relativa y de frecuencia porcentual 29 Grficas de barra y grficas de pastel 29 2.2 Resumen de datos cuantitativos 34 Distribucin de frecuencia 34 Contenido vii 00Ander(i-xxviii).qxd 2/29/08 10:41 AM Page vii
  10. 10. viii Contenido Distribuciones de frecuencia relativa y de frecuencia porcentual 35 Grficas de puntos 36 Histograma 36 Distribuciones acumuladas 37 Ojiva 39 2.3 Anlisis exploratorio de datos: el diagrama de tallo y hojas 43 2.4 Tabulaciones cruzadas y diagramas de dispersin 48 Tabulacin cruzada 48 Paradoja de Simpson 51 Diagrama de dispersin y lnea de tendencia 52 Resumen 57 Glosario 59 Frmulas clave 60 Ejercicios complementarios 60 Caso problema 1: Las tiendas Pelican 66 Caso problema 2: Industria cinematogrfica 67 Apndice 2.1 Uso de Minitab para presentaciones grficas y tabulares 68 Apndice 2.2 Uso de Excel para presentaciones grficas y tabulares 70 Captulo 3 Estadstica descriptiva: medidas numricas 81 La estadstica en la prctica: Small Fry Design 82 3.1 Medidas de localizacin 83 Media 83 Mediana 84 Moda 85 Percentiles 86 Cuartiles 87 3.2 Medidas de variabilidad 91 Rango 92 Rango intercuartlico 92 Varianza 93 Desviacin estndar 95 Coeficiente de variacin 95 3.3 Medidas de la forma de la distribucin, de la posicin relativa y de la deteccin de observaciones atpicas 98 Forma de la distribucin 98 Puntos z 99 Teorema de Chebyshev 100 Regla emprica 101 Deteccin de observaciones atpicas 102 3.4 Anlisis exploratorio de datos 105 Resumen de cinco nmeros 105 Diagrama de caja 106 00Ander(i-xxviii).qxd 2/29/08 10:41 AM Page viii
  11. 11. Contenido ix 3.5 Medidas de la asociacin entre dos variables 110 Covarianza 110 Interpretacin de la covarianza 112 Coeficiente de correlacin 114 Interpretacin del coeficiente de correlacin 115 3.6 La media ponderada y el empleo de datos agrupados 119 Media ponderada 119 Datos agrupados 120 Resumen 124 Glosario 125 Frmulas clave 126 Ejercicios complementarios 128 Caso problema 1: Las tiendas Pelican 132 Caso problema 2: Industria cinematogrfica 133 Caso problema 3: Las escuelas de negocios de Asia-Pacfico 133 Apndice 3.1 Estadstica descriptiva usando Minitab 135 Apndice 3.2 Estadsticos descriptivos usando Excel 137 Captulo 4 Introduccin a la probabilidad 141 La estadstica en la prctica: La empresa Rohm and Hass 142 4.1 Experimentos, reglas de conteo y asignacin de probabilidades 143 Reglas de conteo, combinaciones y permutaciones 144 Asignacin de probabilidades 148 Probabilidades para el proyecto KP&L 150 4.2 Eventos y sus probabilidades 153 4.3 Algunas relaciones bsicas de probabilidad 157 Complemento de un evento 157 Ley de la adicin 158 4.4 Probabilidad condicional 163 Eventos independientes 167 Ley de la multiplicacin 167 4.5 Teorema de Bayes 171 Mtodo tabular 175 Resumen 177 Glosario 177 Frmulas clave 178 Ejercicios complementarios 179 Caso problema: Los jueces del condado de Hamilton 183 00Ander(i-xxviii).qxd 2/29/08 10:41 AM Page ix
  12. 12. x Contenido Captulo 5 Distribuciones de probabilidad discreta 186 La estadstica en la prctica: Citibank 187 5.1 Variables aleatorias 187 Variables aleatorias discretas 188 Variables aleatorias continuas 189 5.2 Distribuciones de probabilidad discreta 190 5.3 Valor esperado y varianzas 196 Valor esperado 196 Varianza 196 5.4 Distribucin de probabilidad binomial 200 Un experimento binomial 201 El problema de la tienda de ropa Martin Clothing Store 202 Uso de las tablas de probabilidades binomiales 206 Valor esperado y varianza en la distribucin binomial 207 5.5 Distribucin de probabilidad de Poisson 210 Un ejemplo considerando intervalos de tiempo 211 Un ejemplo considerando intervalos de longitud o de distancia 213 5.6 Distribucin de probabilidad hipergeomtrica 214 Resumen 217 Glosario 218 Frmulas clave 219 Ejercicios complementarios 220 Apndice 5.1 Distribuciones de probabilidad con Minitab 222 Apndice 5.2 Distribuciones de probabilidad discreta con Excel 223 Captulo 6 Distribuciones de probabilidad continua 225 La estadstica en la prctica: Procter & Gamble 226 6.1 Distribucin de probabilidad uniforme 227 reas como medida de probabilidad 228 6.2 Distribucin de probabilidad normal 231 Curva normal 231 Distribucin de probabilidad normal estndar 233 Clculo de probabilidades en cualquier distribucin de probabilidad normal 238 El problema de la empresa Grear Tire 239 6.3 Aproximacin normal de las probabilidades binomiales 243 6.4 Distribucin de probabilidad exponencial 246 Clculo de probabilidades en la distribucin exponencial 247 Relacin entre la distribucin de Poisson y la exponencial 248 Resumen 250 Glosario 250 Frmulas clave 251 Ejercicios complementarios 251 00Ander(i-xxviii).qxd 2/29/08 10:41 AM Page x
  13. 13. Contenido xi Caso problema: Specialty Toys 254 Apndice 6.1 Distribuciones de probabilidad continua con Minitab 255 Apndice 6.2 Distribuciones de probabilidad continua con Excel 256 Captulo 7 Muestreo y distribuciones muestrales 257 La estadstica en la prctica: MeadWestvaco Corporation 258 7.1 El problema de muestreo de Electronics Associates 259 7.2 Muestreo aleatorio simple 260 Muestreo de una poblacin finita 260 Muestreo de una poblacin infinita 261 7.3 Estimacin puntual 264 7.4 Introduccin a las distribuciones muestrales 267 7.5 Distribucin muestral de x _ 270 Valor esperado de x _ 270 Desviacin estndar de x _ 271 Forma de la distribucin muestral de x _ 272 Distribucin muestral de x _ en el problema EAI 274 Valor prctico de la distribucin muestral de x _ 274 Relacin entre el tamao de la muestra y la distribucin muestral de x _ 276 7.6 Distribucin muestral de p _ 280 Valor esperado de p _ 280 Desviacin estndar de p _ 281 Forma de la distribucin muestral de p _ 281 Valor prctico de la distribucin muestral de p _ 282 7.7 Propiedades de los estimadores puntuales 285 Insesgadez 286 Eficiencia 287 Consistencia 287 7.8 Otros mtodos de muestreo 288 Muestreo aleatorio estratificado 288 Muestreo por conglomerados 289 Muestreo sistemtico 289 Muestreo de conveniencia 290 Muestreo subjetivo 290 Resumen 291 Glosario 291 Frmulas clave 292 Ejercicios complementarios 292 Apndice 7.1 Valor esperado y desviacin estndar de x _ 295 Apndice 7.2 Muestreo aleatorio con Minitab 296 Apndice 7.3 Muestreo aleatorio con Excel 297 00Ander(i-xxviii).qxd 2/29/08 10:41 AM Page xi
  14. 14. Captulo 8 Estimacin por intervalo 299 La estadstica en la prctica: Food Lion 300 8.1 Media poblacional: conocida 301 Margen de error y estimacin por intervalo 301 Recomendacin prctica 305 8.2 Media poblacional: desconocida 307 Margen de error en estimacin por intervalo 308 Recomendacin prctica 311 Uso de una muestra pequea 311 Resumen de los procedimientos de estimacin por intervalo 313 8.3 Determinacin del tamao de la muestra 316 8.4 Proporcin poblacional 319 Determinacin del tamao de la muestra 321 Resumen 324 Glosario 325 Frmulas clave 326 Ejercicios complementarios 326 Caso problema 1: La revista Young Professional 329 Caso problema 2: Gulf Real Estate Properties 330 Caso problema 3: Metropolitan Research, Inc. 332 Apndice 8.1 Estimacin por intervalo con Minitab 332 Apndice 8.2 Estimacin por intervalo usando Excel 334 Captulo 9 Prueba de hiptesis 338 La estadstica en la prctica: John Morrell & Company 339 9.1 Elaboracin de las hiptesis nula y alternativa 340 Prueba de una hiptesis de investigacin 340 Prueba de la validez de una afirmacin 340 Prueba en situaciones de toma de decisin 341 Resumen de las formas para las hiptesis nula y alternativa 341 9.2 Errores tipo I y II 342 9.3 Media poblacional: conocida 345 Prueba de una cola 345 Prueba de dos colas 351 Resumen y recomendaciones prcticas 354 Relacin entre estimacin por intervalo y prueba de hiptesis 355 9.4 Media poblacional: desconocida 359 Prueba de una cola 360 Prueba de dos colas 361 Resumen y recomendacin prctica 362 xii Contenido 00Ander(i-xxviii).qxd 2/29/08 10:41 AM Page xii
  15. 15. 9.5 Proporcin poblacional 365 Resumen 368 9.6 Prueba de hiptesis y toma de decisiones 370 9.7 Clculo de la probabilidad de los errores tipo II 371 9.8 Determinacin del tamao de la muestra en una prueba de hiptesis para la media poblacional 376 Resumen 380 Glosario 381 Frmulas clave 381 Ejercicios complementarios 382 Caso problema 1: Quality Associates, Inc. 385 Caso problema 2: Estudio sobre el desempleo 386 Apndice 9.1 Pruebas de hiptesis con Minitab 386 Apndice 9.2 Prueba de hiptesis con Excel 388 Captulo 10 Inferencia estadstica acerca de medias y de proporciones con dos poblaciones 393 La estadstica en la prctica: Food and Drug Administration de Estados Unidos 394 10.1 Inferencias acerca de la diferencia entre dos medias poblacionales: 1 y 2 conocidas 395 Estimacin por intervalo de 1 2 395 Prueba de hiptesis acerca de 1 2 397 Recomendacin prctica 399 10.2 Inferencias acerca de la diferencia entre dos medias poblacionales: 1 y 2 desconocidas 402 Estimacin por intervalo para 1 2 402 Pruebas de hiptesis acerca de 1 2 403 Recomendacin prctica 406 10.3 Inferencias acerca de la diferencia entre dos medias poblacionales: muestras pareadas 410 10.4 Inferencias acerca de la diferencia entre dos proporciones poblacionales 416 Estimacin por intervalo para p1 p2 416 Prueba de hiptesis acerca de p1 p2 418 Resumen 423 Glosario 423 Frmulas clave 424 Ejercicios complementarios 425 Caso problema: Par, Inc. 428 Apndice 10.1 Inferencias acerca de dos poblaciones usando Minitab 429 Apndice 10.2 Inferencias acerca de dos poblaciones usando Excel 431 Contenido xiii 00Ander(i-xxviii).qxd 2/29/08 10:41 AM Page xiii
  16. 16. Captulo 11 Inferencias acerca de varianzas poblacionales 434 La estadstica en la prctica: La General Accounting Office de Estados Unidos 435 11.1 Inferencias acerca de una varianza poblacional 436 Estimacin por intervalos 436 Pruebas de hiptesis 440 11.2 Inferencias acerca de dos varianzas poblacionales 445 Resumen 452 Frmulas clave 452 Ejercicios complementarios 453 Caso problema: Programa de capacitacin para la Fuerza Area 454 Apndice 11.1 Varianzas poblacionales con Minitab 455 Apndice 11.2 Varianzas poblacionales con Excel 456 Captulo 12 Pruebas de bondad de ajuste e independencia 457 La estadstica en la prctica: United Way 458 12.1 Prueba de bondad de ajuste: una poblacin multinomial 459 12.2 Prueba de independencia 464 12.3 Prueba de bondad de ajuste: distribuciones de Poisson y normal 472 Distribucin de Poisson 472 Distribucin normal 476 Resumen 481 Glosario 481 Frmulas clave 481 Ejercicios complementarios 482 Caso problema: Una agenda bipartidista para el cambio 485 Apndice 12.1 Pruebas de bondad de ajuste e independencia mediante Minitab 486 Apndice 12.2 Pruebas de bondad de ajuste e independencia mediante Excel 487 Captulo 13 Diseo de experimentos y anlisis de varianza 490 La estadstica en la prctica: Burke Marketing Services, Inc. 491 13.1 Introduccin al diseo de experimentos y al anlisis de varianza 492 Obtencin de datos 493 Suposiciones para el anlisis de varianza 494 Anlisis de varianza: una visin conceptual general 494 13.2 Anlisis de varianza y el diseo completamente aleatorizado 497 Estimacin de la varianza poblacional entre tratamientos 498 Estimacin de la varianza poblacional dentro de los tratamientos 499 Comparacin de las estimaciones de las varianzas: la prueba F 500 Tabla de ANOVA 502 Resultados de computadora para el anlisis de varianza 503 Prueba para la igualdad de k medias poblacionales: un estudio observacional 504 xiv Contenido 00Ander(i-xxviii).qxd 2/29/08 10:41 AM Page xiv
  17. 17. 13.3 Procedimiento de comparacin mltiple 508 LSD de Fisher 508 Tasas de error tipo I 511 13.4 Diseo de bloques aleatorizado 514 Prueba de estrs para los controladores del trfico areo 515 Procedimiento ANOVA 516 Clculos y conclusiones 517 13.5 Experimentos factoriales 521 Procedimiento ANOVA 523 Clculos y conclusiones 523 Resumen 529 Glosario 529 Frmulas clave 530 Ejercicios complementarios 532 Caso problema 1: Centro Mdico Wentworth 536 Caso problema 2: Compensacin para profesionales de ventas 537 Apndice 13.1 Anlisis de varianza con Minitab 538 Apndice 13.2 Anlisis de varianza con Excel 539 Captulo 14 Regresin lineal simple 543 La estadstica en la prctica: Alliance Data Systems 544 14.1 Modelo de regresin lineal simple 545 Modelo de regresin y ecuacin de regresin 545 Ecuacin de regresin estimada 546 14.2 Mtodo de mnimos cuadrados 548 14.3 Coeficiente de determinacin 559 Coeficiente de correlacin 562 14.4 Suposiciones del modelo 566 14.5 Prueba de significancia 568 Estimacin de 2 568 Prueba t 569 Intervalo de confianza para 1 570 Prueba F 571 Algunas advertencias acerca de la interpretacin de las pruebas de significancia 573 14.6 Uso de la ecuacin de regresin estimada para estimaciones y predicciones 577 Estimacin puntual 577 Estimacin por intervalo 577 Intervalo de confianza para el valor medio de y 578 Intervalo de prediccin para un solo valor de y 579 14.7 Solucin por computadoras 583 14.8 Anlisis residual: confirmacin de las suposiciones del modelo 588 Grfica de residuales contra x 589 Contenido xv 00Ander(i-xxviii).qxd 2/29/08 10:41 AM Page xv
  18. 18. Grfica de residuales contra y 590 Residuales estandarizados 590 Grfica de probabilidad normal 593 14.9 Anlisis de residuales: observaciones atpicas y observaciones influyentes 597 Deteccin de observaciones atpicas 597 Deteccin de observaciones influyentes 599 Resumen 604 Glosario 605 Frmulas clave 606 Ejercicios complementarios 608 Caso problema 1: Medicin del riesgo en el mercado burstil 614 Caso problema 2: Departamento de Transporte de Estados Unidos 615 Caso problema 3: Donaciones de los ex alumnos 616 Caso problema 4: Valor de los equipos de bisbol de la liga mayor 616 Apndice 14.1 Deduccin de la frmula de mnimos cuadrados empleando el clculo 618 Apndice 14.2 Una prueba de significancia usando correlacin 619 Apndice 14.3 Anlisis de regresin con Minitab 620 Apndice 14.4 Anlisis de regresin con Excel 621 Captulo 15 Regresin mltiple 624 La estadstica en la prctica: International Paper 625 15.1 Modelo de regresin mltiple 626 Modelo de regresin y ecuacin de regresin 626 Ecuacin de regresin mltiple estimada 626 15.2 Mtodo de mnimos cuadrados 627 Un ejemplo: Butler Trucking Company 628 Nota sobre la interpretacin de los coeficientes 630 15.3 Coeficiente de determinacin mltiple 636 15.4 Suposiciones del modelo 639 15.5 Prueba de significancia 640 Prueba F 640 Prueba t 643 Multicolinealidad 644 15.6 Uso de la ecuacin de regresin estimada para estimaciones y predicciones 647 15.7 Variables cualitativas independientes 649 Un ejemplo: Johnson Filtration, Inc. 649 Interpretacin de los parmetros 651 Variables cualitativas ms complejas 653 15.8 Anlisis residual 658 Deteccin de observaciones atpicas 659 Residuales estudentizados eliminados y observaciones atpicas 660 xvi Contenido 00Ander(i-xxviii).qxd 2/29/08 10:41 AM Page xvi
  19. 19. Observaciones influyentes 661 Uso de la medida de la distancia de Cook para identificar observaciones influyentes 661 15.9 Regresin logstica 665 Ecuacin de regresin logstica 666 Estimacin de la ecuacin de regresin logstica 667 Prueba de significancia 669 Uso en la administracin 669 Interpretacin de la ecuacin de regresin logstica 670 Transformacin logit 672 Resumen 676 Glosario 677 Frmulas clave 678 Ejercicios complementarios 680 Caso problema 1: Consumer Research, Inc. 685 Caso problema 2: Prediccin de la puntuacin en un examen 686 Caso problema 3: Aportaciones de los alumnos 687 Caso problema 4: Prediccin del porcentaje de triunfos de la NFL 689 Apndice 15.1 Regresin mltiple con Minitab 690 Apndice 15.2 Regresin mltiple con Excel 690 Apndice 15.3 Regresin logstica con Minitab 691 Captulo 16 Anlisis de regresin: construccin de modelos 693 La estadstica en la prctica: La empresa Monsanto 694 16.1 El modelo lineal general 695 Modelado de relaciones curvilneas 695 Interaccin 699 Transformaciones a la variable dependiente 701 Modelos no lineales que son intrnsecamente lineales 705 16.2 Determinacin de cundo agregar o quitar variables 710 Caso general 712 Uso del valor-p 713 16.3 Anlisis de un problema mayor 717 16.4 Procedimientos de eleccin de variables 720 Regresin por pasos 721 Seleccin hacia adelante 722 Eliminacin hacia atrs 723 Regresin de los mejores subconjuntos 723 Eleccin final 724 16.5 Mtodo de regresin mltiple para el diseo de experimentos 727 16.6 Autocorrelacin y la prueba de Durbin-Watson 731 Resumen 736 Glosario 736 Frmulas clave 736 Contenido xvii 00Ander(i-xxviii).qxd 2/29/08 10:41 AM Page xvii
  20. 20. Ejercicios complementarios 737 Caso problema 1: Anlisis de las estadsticas de la PGA Tour 740 Caso problema 2: Rendimiento de combustible en los automviles 741 Caso problema 3: Prediccin de las tasas de alumnos que llegan a titularse en las universidades 741 Apndice 16.1: Procedimientos de seleccin de variables con Minitab 742 Captulo 17 Nmeros ndice 744 La estadstica en la prctica: Departamento del Trabajo de Estados Unidos, Departamento de Estadstica Laboral 745 17.1 Precios relativos 746 17.2 ndices de precios agregados 746 17.3 Clculo de un ndice de precios agregados a partir de precios relativos 750 17.4 Algunos ndices de precios importantes 752 ndice de precios al consumidor 752 ndice de precios al productor 752 Promedios Dow Jones 753 17.5 Deflactar una serie mediante ndices de precios 754 17.6 ndices de precios: otras consideraciones 758 Seleccin de los artculos 758 Seleccin de un periodo base 758 Variaciones en la calidad 758 17.7 ndices de cantidad 759 Resumen 761 Glosario 761 Frmulas clave 761 Ejercicios complementarios 762 Captulo 18 Pronstico 765 La estadstica en la prctica: Occupational Health Clinic de Nevada 766 18.1 Componentes de una serie de tiempo 767 Componente de tendencia 767 Componente cclico 769 Componente estacional 770 Componente irregular 770 18.2 Mtodos de suavizamiento 770 Promedios mviles 770 Promedios mviles ponderados 772 Suavizamiento exponencial 774 18.3 Proyeccin de tendencia 780 xviii Contenido 00Ander(i-xxviii).qxd 2/29/08 10:41 AM Page xviii
  21. 21. 18.4 Componentes de tendencia y estacionales 786 Modelo multiplicativo 786 Clculo de los ndices estacionales 787 Desestacionalizacin de una serie de tiempo 791 Uso de una serie de tiempo desestacionalizada para la identificacin de tendencias 791 Ajustes estacionales 794 Modelos basados en datos mensuales 794 Componente cclico 794 18.5 Anlisis de regresin 796 18.6 Mtodos cualitativos 798 Mtodo de Delphi 798 Opinin de un experto 799 Escenarios futuros 799 Mtodos intuitivos 799 Resumen 799 Glosario 800 Frmulas clave 801 Ejercicios complementarios 801 Caso problema 1: Pronstico para las ventas de alimentos y bebidas 806 Caso problema 2: Pronstico de prdidas de ventas 807 Apndice 18.1 Pronsticos con Minitab 808 Apndice 18.2 Pronsticos con Excel 810 Captulo 19 Mtodos no paramtricos 812 La estadstica en la prctica: West Shell Realtors 813 19.1 Prueba de los signos 815 Caso de muestras pequeas 815 Caso de muestras grandes 817 Prueba de hiptesis acerca de la mediana 818 19.2 Prueba de los rangos con signo de Wilcoxon 820 19.3 Prueba de Mann-Whitney-Wilcoxon 825 Caso de muestras pequeas 825 Caso de muestras grandes 827 19.4 Prueba de Kruskal-Wallis 833 19.5 Correlacin de rangos 837 Prueba de significancia de la correlacin por rangos 839 Resumen 841 Glosario 842 Frmulas clave 842 Ejercicios complementarios 843 Contenido xix 00Ander(i-xxviii).qxd 2/29/08 10:41 AM Page xix
  22. 22. Captulo 20 Mtodos estadsticos para el control de calidad 846 La estadstica en la prctica: Dow Chemical Company 847 20.1 Filosofas y marco de referencia 848 Malcolm Baldrige National Quality Award 848 ISO 9000 849 Seis Sigma 849 20.2 Control estadstico de procesos 851 Cartas de control 852 Cartas x _ : media y desviaciones estndar del proceso conocidas 853 Cartas x _ : media y desviaciones estndar del proceso desconocidas 855 Cartas R 857 Cartas p 859 Cartas np 862 Interpretacin de las cartas de control 862 20.3 Muestreo de aceptacin 865 KALI, Inc., un ejemplo de muestreo de aceptacin 866 Clculo de la probabilidad de aceptar un lote 867 Seleccin de un plan de muestreo de aceptacin 870 Planes de muestreo mltiple 871 Resumen 874 Glosario 874 Frmulas clave 875 Ejercicios complementarios 876 Apndice 20.1 Cartas de control con Minitab 878 Captulo 21 Anlisis de decisin 879 La estadstica en la prctica: Ohio Edison Company 880 21.1 Formulacin del problema 881 Tablas de recompensa 882 rboles de decisin 882 21.2 Toma de decisiones con probabilidades 883 Mtodo del valor esperado 883 Valor esperado de la informacin perfecta 885 21.3 Anlisis de decisin con informacin muestral 891 rbol de decisin 892 Estrategia de decisin 893 Valor esperado de la informacin muestral 896 21.4 Clculo de las probabilidades de rama mediante el teorema de Bayes 902 Resumen 906 Glosario 907 Frmulas clave 908 Caso problema: Estrategia de defensa en un juicio 908 Apndice 21.1 Solucin del problema PDC con TreePlan 909 xx Contenido 00Ander(i-xxviii).qxd 2/29/08 10:41 AM Page xx
  23. 23. Captulo 22 Encuestas muestrales 915 La estadstica en la prctica: Duke Energy 916 22.1 Terminologa empleada en las encuestas muestrales 916 22.2 Tipos de encuestas y mtodos de muestreo 917 22.3 Errores en una encuesta 919 Errores no muestrales 919 Error muestral 919 22.4 Muestreo aleatorio simple 920 Media poblacional 920 Total poblacional 921 Proporcin poblacional 922 Determinacin del tamao de la muestra 923 22.5 Muestreo aleatorio simple estratificado 926 Media poblacional 926 Total poblacin 928 Proporcin poblacional 929 Determinacin del tamao de la muestra 930 22.6 Muestreo por conglomerados 935 Media poblacional 937 Total poblacional 938 Proporcin poblacional 939 Determinacin del tamao de la muestra 940 22.7 Muestreo sistemtico 943 Resumen 943 Glosario 944 Frmulas clave 944 Ejercicios complementarios 948 Apndice A Referencias y bibliografa 952 Apndice B Tablas 954 Apndice C Notacin para la suma 982 Apndice D Soluciones para los autoexmenes y repuestas a los ejercicios con nmeros pares 984 Apndice E Uso de las funciones de Excel 1033 Apndice F Clculo de los valores-p usando Minitab o Excel 1038 ndice 1042 Contenido xxi 00Ander(i-xxviii).qxd 2/29/08 10:41 AM Page xxi
  24. 24. 00Ander(i-xxviii).qxd 2/29/08 10:41 AM Page xxii
  25. 25. El propsito de Estadstica para administracin y economa es proporcionar, en especial a los estudiantes de las reas de la administracin y de la economa, una introduccin conceptual al campo de la estadstica y de sus aplicaciones. El texto est orientado a las aplicaciones y ha sido escrito pensando en las necesidades de quienes no son matemticos; los conocimientos matem- ticos requeridos son los conocimientos del lgebra. Las aplicaciones del anlisis de datos y de la metodologa estadstica son parte integral de la presentacin y organizacin del material de este libro. El estudio y el desarrollo de cada tcnica se presentan mediante una aplicacin, en donde los resultados estadsticos permiten entender las decisiones y la solucin del problema presentado. Aunque el libro est orientado hacia las aplicaciones, hemos tenido cuidado de presentar un desarrollo metodolgico slido y de emplear la notacin convencional al tpico que se estudia. De esta manera, los estudiantes encontrarn que este libro les proporciona una buena preparacin para el estudio de material estadstico ms avanzado. En el apndice A se proporciona una biblio- grafa que servir como gua para un estudio ms profundo. El libro introduce al estudiante a los paquetes de software Minitab de Microsoft y a Excel ha- ciendo nfasis en el papel que tiene el software en la aplicacin del anlisis estadstico. Minitab se presenta como uno de los principales paquetes de software para estadstica, tanto en la enseanza, como en la prctica. Excel no es un paquete de software para estadstica, pero su amplia disponibi- lidad y uso lo hacen relevante para que los estudiantes conozcan las posibilidades de Excel para la estadstica. El empleo de Excel y Minitab se presenta en los apndices, permitiendo as al profesor la suficiente flexibilidad para dar tanta importancia al uso de la computadora como l lo desee. Cambios en la 10a. edicin Agradecemos la acogida y la respuesta positiva a las ediciones anteriores de Estadstica para ad- ministracin y economa. Por tanto, al hacer modificaciones en esta nueva edicin, hemos con- servado el mismo estilo de presentacin y la sencillez de esas ediciones. Los cambios ms importantes hechos en esta nueva edicin se presentan a continuacin. Cambios al contenido En seguida se resumen algunos de los cambios que hemos hecho al contenido en esta edicin. Valores-p En la edicin anterior insistimos en el uso de los valores-p en las pruebas de hiptesis. En esta edicin hacemos lo mismo, no obstante, hemos hecho ms sencilla la in- troduccin a los valores-p simplificando la definicin conceptual. Ahora dice: Un valor-p es una probabilidad que mide la evidencia contra la hiptesis nula que proporciona la muestra. Entre menor es el valor-p, mayor es la evidencia contra H0. Despus de esta de- finicin conceptual, se presentan las definiciones operacionales que explican cmo calcu- lar el valor-p en pruebas de la cola izquierda (cola inferior), de la cola derecha (cola superior) y de dos colas. Con la experiencia hemos aprendido que el separar la definicin conceptual de las definiciones operacionales ayuda al estudiante a entender con ms faci- lidad el nuevo material. Procedimientos de Minitab y de Excel para calcular el valor-p. Algo nuevo en esta edicin es un apndice en el que se demuestra cmo se usan Minitab y Excel para calcu- lar valores-p relacionados con los estadsticos de prueba z, t, 2 y F. A los estudiantes que emplean una calculadora manual para calcular los estadsticos de prueba se les ensea c- xxiii Prefacio 00Ander(i-xxviii).qxd 2/29/08 10:41 AM Page xxiii
  26. 26. mo usar las tablas estadsticas para dar un intervalo de valores-p. En el apndice F se les explica la forma de calcular con exactitud el valor-p usando Minitab o Excel. Este apn- dice es de utilidad al estudiar las pruebas de hiptesis en los captulos 9 a 16. Tabla de la distribucin normal estndar acumulada. A muchos de nuestros usuarios puede sorprenderles que en esta nueva edicin usemos tablas de distribucin normal estn- dar acumulada. Hemos hecho este cambio porque creemos que la tendencia es que cada vez ms estudiantes y profesionistas hagan uso del software para computadoras. Antes, todo mundo empleaba las tablas porque era la nica fuente de informacin acerca de la distribu- cin normal. Sin embargo, hoy muchos estudiantes estn dispuestos a aprender a usar el software para estadstica. Los estudiantes encontrarn que casi todos los paquetes de soft- ware usan la distribucin normal estndar acumulada. Por tanto, es cada vez ms importan- te que en un libro de introduccin a la estadstica se usen las tablas de probabilidad normal que el estudiante encontrar cuando trabaje con el software para estadstica. No es deseable usar un tipo de tablas para la distribucin normal estndar en el libro y otro tipo diferente cuando se usen los paquetes de software. Aquellas personas que usen por primera vez la ta- bla de distribucin normal acumulada encontrarn que, en general, estas tablas facilitan los clculos de la distribucin normal. En particular, una tabla de probabilidad normal acumu- lada facilita el clculo de los valores-p en las pruebas de hiptesis. Diseo de experimentos y anlisis de varianza. El captulo 13 se ha reducido y ahora comienza con una introduccin a los conceptos del diseo de experimentos. Se tratan tambin el diseo completamente aleatorizado, el diseo de bloque aleatorizado y los ex- perimentos factoriales. El anlisis de varianza se presenta como la tcnica fundamental para el anlisis de estos diseos. Tambin mostramos que el procedimiento de anlisis de varianza puede emplearse en estudios observacionales. Otras modificaciones al contenido. Las siguientes adiciones se encontrarn en la nueva edicin: En el captulo 1 se presentan ejemplos nuevos de datos de series de tiempo. En el captulo 2 el apndice sobre Excel ahora proporciona instrucciones ms comple- tas acerca de cmo elaborar una distribucin de frecuencia y un histograma con datos cuantitativos. Revisamos los lineamientos acerca del tamao de la muestra necesario para el uso de de la distribucin t, lo que es consistente con el uso de la distribucin t en los captu- los 8, 9 y 10. El captulo 17 ha sido actualizado con nmeros ndices de uso corriente. Ahora en el manual de soluciones se encuentran los pasos para la solucin de los ejer- cicios usando la distribucin normal acumulada y ms detalles en las explicaciones de cmo calcular los valores-p en las pruebas de hiptesis. Ejemplos y ejercicios nuevos a partir de datos reales Hemos agregado 200 ejemplos y ejercicios nuevos con base en datos reales y en fuentes de refe- rencias recientes sobre informacin estadstica. Con datos obtenidos de fuentes empleadas tam- bin por Wall Street Journal, USA Today, Fortune, Barrons y otras, hemos empleado estudios actuales para elaborar explicaciones y crear ejercicios que demuestren los diversos usos de la es- tadstica en la administracin y la economa. Pensamos que el uso de datos reales generar ms inters en los estudiantes por este material y les permitir aprender ms acerca de la metodolo- ga estadstica y de sus aplicaciones. Esta 10a. edicin contiene 350 ejemplos y ejercicios basa- dos en datos reales. Casos problema nuevos En esta edicin hemos agregado seis casos problema nuevos, con lo que la cantidad de casos pro- blema en este libro se eleva a 31. Los casos problema nuevos aparecen en los captulos sobre es- xxiv Prefacio 00Ander(i-xxviii).qxd 2/29/08 10:41 AM Page xxiv
  27. 27. tadstica descriptiva, estimacin por intervalo y regresin. Estos casos problema proporcionan a los estudiantes la oportunidad de analizar conjuntos de datos un poco mayores y de elaborar re- portes administrativos basados en los resultados del anlisis. Caractersticas y pedagoga Los autores Anderson, Sweeney y Williams han conservado en esta edicin muchas de las carac- tersticas de las ediciones previas. Las ms importantes para los estudiantes se anotan a continua- cin. La estadstica en la prctica Cada captulo empieza con un artculo sobre la estadstica en la prctica que describe una apli- cacin de la metodologa estadstica que se estudiar en el captulo. En esta edicin los artculos sobre estadstica en la prctica de Duke Energy, Rohm and Hass Company y la Food and Drug Administration de Estados Unidos son nuevos. Ejercicios sobre los mtodos y ejercicios de aplicacin Los ejercicios al final de cada seccin se dividen en dos partes, mtodos y aplicaciones. Los ejer- cicios sobre los mtodos requieren del estudiante el uso de las frmulas para hacer los clculos necesarios. Los ejercicios de aplicacin demandan que el estudiante use el material del captulo en una situacin de la vida real. De esta manera, los estudiantes dan atencin, primero, a los clcu- los y despus a las sutilezas de la aplicacin e interpretacin de la estadstica. Ejercicios de autoexamen Algunos ejercicios son ejercicios de autoexamen. Las soluciones completas de estos ejercicios se proporcionan en el apndice D, al final del libro. Los estudiantes pueden hacer estos ejercicios de autoexamen y verificar de inmediato la solucin para evaluar su comprensin de los concep- tos presentados en el captulo. Anotaciones al margen, notas y comentarios Anotaciones al margen que resaltan puntos clave y proporcionan una explicacin adicional para el estudiante son caractersticas esenciales de este libro. Estas anotaciones, que aparecen al mar- gen, tienen el propsito de enfatizar y mejorar la comprensin de los trminos y conceptos que se presentan en el texto. Al final de cada seccin, presentamos notas y comentarios que tienen por objeto aclarar an ms la metodologa estadstica y su aplicacin. Las notas y los comentarios contienen adverten- cias sobre la metodologa o limitaciones de sta, recomendaciones para su aplicacin, breves des- cripciones de otras consideraciones tcnicas y otros asuntos. Archivos de datos que vienen con el texto En el disco compacto que viene con el libro se encuentran ms de 200 archivos de datos. Estos archivos vienen tanto en formato para Minitab como para Excel. En el texto se usan logotipos para indicar conjuntos de datos disponibles en el disco compacto. Tambin hay conjuntos de da- tos para los casos problema, as como conjuntos de datos para ejercicios ms grandes. Prefacio xxv 00Ander(i-xxviii).qxd 2/29/08 10:41 AM Page xxv
  28. 28. Material de apoyo para el profesor Este libro cuenta con una serie de recursos para el profesor, los cuales estn disponibles en ingls y slo se proporcionan a los docentes que lo adopten como texto en sus cursos. Para direcciones de correo electrnico: Cengage Learning Mxico y Centroamrica [email protected] Cengage Learning Caribe [email protected] Cengage Learning Cono Sur [email protected] Paraninfo [email protected] Colombia [email protected] Adems encontrar ms apoyos en el sitio web de este libro: http://latinoamerica.cengage.com/anderson Las direcciones de los sitios web referidas a lo largo del texto no son administradas por Cengage Learning Latinoamrica, por lo que sta no es responsable de los cambios para mantenerse al tanto de cualquier actualizacin. Agradecimientos Un agradecimiento especial a nuestros colegas de las empresas y de la industria que nos propor- cionaron el material para Estadstica para administracin y economa. A cada uno le damos un reconocimiento individual en la lnea de crditos que aparece en cada uno de los artculos. Por ltimo agradecemos a nuestros editores, Charles McCormick, Jr. y Alice Denny, a nuestro admi- nistrador de proyecto, Amy Hackett, a nuestro director de mercadotecnia, Larry Qualls, y a to- dos los colaboradores de Thomson South-Western por su asesora y apoyo editorial durante la elaboracin de este libro. David R. Anderson Dennis J. Sweeney Thomas A. Williams xxvi Prefacio 00Ander(i-xxviii).qxd 2/29/08 10:41 AM Page xxvi
  29. 29. David R. Anderson. Profesor de anlisis cuantitativo en el College of Business Administration de la Universidad de Cincinnati. Naci en Grand Forks, Dakota del Norte, y obtuvo los grados acadmicos B.S., M.S. y Ph.D. en la Purdue University. El profesor Anderson ha sido director del Department of Quantitative Analysis and Operations y decano asociado de la College of Business Administration. Adems, fue coordinador del primer Executive Program de la escuela. En la Universidad de Cincinnati, el profesor Anderson ha dado cursos introductorios de es- tadstica para estudiantes de administracin, as como cursos a nivel de posgrado sobre anlisis de regresin, anlisis multivariado y ciencia de la administracin. Tambin ha impartido cursos de estadstica en el Departamento del Trabajo en Washington, D. C. Ha sido honrado con nomina- ciones y premios de excelencia en la enseanza y en la atencin a organizaciones estudiantiles. El profesor Anderson es coautor de diez libros en las reas de estadstica, ciencias de la ad- ministracin, programacin lineal y produccin y administracin de operaciones. Es asesor acti- vo en los temas de muestreo y de mtodos estadsticos. Dennis J. Sweeney. Dennis J. Sweeney es profesor de anlisis cuantitativo y fundador del Cen- ter for Productivity Improvement en la Universidad de Cincinnati. Naci en Des Moines, Iowa, y obtuvo el grado B.S.B.A. en la Drake University y los grados M.B.A. y D.B.A. en la Univer- sidad de Indiana. De 1978 a 1979, el profesor Sweeney trabaj en el grupo de ciencia de la ad- ministracin de Procter & Gamble; de 1981 a 1982, fue profesor invitado en la Duke University. Ha sido director del Department of Quantitative Analysis y decano asociado de la College of Bu- siness Administration en la Universidad de Cincinnati. El profesor Sweeney ha publicado ms de 30 artculos y monografas en las reas de ciencia de la administracin y estadstica. Sus investigaciones han sido patrocinadas por The National Science Fundation, IBM, Procter & Gamble, Federated Department Stores, Kroger y Cincinnati Gas & Electric, las cuales han sido publicadas en Management Science, Operation Research, Mathematical Programming, Decision Sciences y en otras revistas. El profesor Sweeney es coautor de diez libros en las reas de estadstica, ciencias de la ad- ministracin, programacin lineal y produccin y administracin de operaciones. Thomas A. Williams. Thomas A. Williams es profesor de ciencia de la administracin en el College of Business at Rochester Institute of Technology. Naci en Elmira, Nueva York y obtu- vo el grado B.S. en la Clarkson University. Realiz su tesis profesional en el Rensselaer Poly- technic Institute, donde obtuvo los grados M.S. y Ph.D. Antes de integrarse a la College of Business de RIT, el profesor Williams fue miembro de la facultad en el College of Business Administration de la Universidad de Cincinnati, en donde ela- bor el programa para Sistemas de la Informacin, del que fue coordinador. En RIT fue el pri- mer director del Decision Sciences Departament. Imparte cursos de ciencia de la administracin y de estadstica, as como cursos de anlisis de regresin y de decisin. El profesor Williams es coautor de siete libros en las reas de estadstica, ciencias de la ad- ministracin, produccin y administracin de operaciones y matemticas. Ha sido asesor de ml- tiples empresas Fortune 500 y ha trabajado en proyectos que van desde el uso del anlisis de datos a la elaboracin de modelos de regresin a gran escala. Acerca de los autores xxvii 00Ander(i-xxviii).qxd 2/29/08 10:41 AM Page xxvii
  30. 30. 00Ander(i-xxviii).qxd 2/29/08 10:41 AM Page xxviii
  31. 31. Datos y estadsticas CAPTULO 1 CONTENIDO LA ESTADSTICA EN LA PRCTICA: BUSINESSWEEK 1.1 APLICACIONES EN LOS NEGOCIOS Y EN LA ECONOMA Contadura Finanzas Marketing Produccin Economa 1.2 DATOS Elementos, variables y observaciones Escalas de medicin Datos cualitativos y cuantitativos Datos de seccin transversal y de series de tiempo 1.3 FUENTES DE DATOS Fuentes existentes Estudios estadsticos Errores en la adquisicin de datos 1.4 ESTADSTICA DESCRIPTIVA 1.5 INFERENCIA ESTADSTICA 1.6 LAS COMPUTADORAS Y EL ANLISIS ESTADSTICO 01Ander(001-025).qxd 1/17/08 10:26 AM Page 1
  32. 32. Con frecuencia aparece en los peridicos y revistas el siguiente tipo de informacin: La asociacin de agentes inmobiliarios inform que la mediana del precio de venta de una casa en Estados Unidos es de $215 000 (The Wall Street Journal, 16 de enero de 2006). Durante el Super Bowl de 2006 el costo promedio de un spot publicitario de 30 segundos en televisin fue de $2.5 millones (USA Today, 27 de enero de 2007). 2 Captulo 1 Datos y estadsticas LA ESTADSTICA en LA PRCTICA BUSINESSWEEK* NUEVA YORK, NUEVA YORK Con una circulacin mundial de ms de 1 milln de ejem- plares, BusinessWeek es la revista ms leda en el mundo. Ms de 200 reporteros y editores especializados en 26 ofi- cinas alrededor del mundo producen diversos artculos de inters para la comunidad interesada en los negocios y la economa. Junto a los artculos principales y los tpicos de actualidad, la revista presenta diversas secciones regulares sobre negocios internacionales, anlisis econmicos, pro- cesamiento de la informacin y ciencia y tecnologa. La in- formacin en las secciones regulares ayuda a los lectores a mantenerse al da de los avances y novedades y a evaluar el impacto de stos en los negocios y en las condiciones econmicas. La mayor parte de los nmeros de BusinessWeek con- tienen un artculo de fondo sobre algn tema de inters actual. Por ejemplo, el nmero del 6 de diciembre de 2004 contena un reportaje especial sobre los precios de los artculos hechos en China; el nmero del 3 de enero de 2005 proporcionaba informacin acerca de dnde invertir en 2005 y el nmero del 4 de abril de 2005 proporcionaba una panormica de BusinessWeek 50, un grupo diverso de empresas de alto desempeo. Adems, la revista semanal BusinessWeek Investor proporciona artculos sobre el esta- do de la economa, que comprenden ndices de produccin, precios de las acciones de fondos mutualistas y tasas de in- ters. BusinessWeek tambin usa mtodos e informacin es- tadsticos en la administracin de su propio negocio. Por ejemplo, una encuesta anual hecha a sus suscriptores le permiti tener datos demogrficos sobre sus hbitos de lec- tura, compras probables, estilo de vida, etc. Los directivos de BusinessWeek usan resmenes estadsticos obtenidos a partir de las encuestas para dar un mejor servicio a sus sus- criptores y anunciantes. Mediante una encuesta reciente entre los suscriptores estadounidenses se supo que 90% de los suscriptores de BusinessWeek tienen una computadora personal en casa y que 64% de ellos realizan en el trabajo compras por computadora. Estas estadsticas indican a los directivos de BusinessWeek que los avances en compu- tacin sern de inters para sus suscriptores. Los resultados de la encuesta tambin le son proporcionados a sus anun- ciantes potenciales. Los elevados porcentajes de personas que tienen una computadora en casa y que realizan com- pras por computadora en el trabajo podra ser un incentivo para que los fabricantes de computadoras se anunciaran en BusinessWeek. Este captulo muestra los tipos de datos con que se cuenta en un anlisis estadstico y describe cmo se obtie- nen los datos. Presenta la estadstica descriptiva y la infe- rencia estadstica como medios para convertir los datos en informacin estadstica que tienen un significado y que es fcil de interpretar. BusinessWeek usa datos y resmenes estadsticos en muchos de sus artculos. Terri Millar/E-Visual Communications, Inc. *Los autores agradecen a Charlene Trentham, Director de investigacin de BusinessWeek por proporcionar este artculo para La estadstica en la prctica. 01Ander(001-025).qxd 1/17/08 10:26 AM Page 2
  33. 33. En una encuesta de Jupiter Media se encontr que 31% de los hombres adultos ven ms de 10 horas de televisin a la semana. Entre las mujeres slo 26% (The Wall Street Jour- nal, 26 de enero de 2004). General Motors, uno de los lderes automotrices en descuentos en efectivo da, en prome- dio, $4300 de incentivo en efectivo por vehculo (USA Today, 27 de enero de 2006). Ms de 40% de los directivos de Marriott Internacional ascienden por escalafn (Fortu- ne, 20 de enero de 2003). Los Yankees de Nueva York tienen la nmina ms alta dentro de la liga mayor de bis- bol. En el ao 2005 la nmina del equipo fue de $208 306 817, siendo la mediana por ju- gador de $5 833 334 (USA Today, febrero 2006). El promedio industrial Dow Jones cerr en 11 577 (Barrons, 6 de mayo de 2006). A los datos numricos de las frases anteriores se les llama estadsticas. En este sentido el tr- mino estadstica se refiere a datos numricos, tales como promedios, medianas, porcentajes y n- meros ndices que ayudan a entender una gran variedad de negocios y situaciones econmicas. Sin embargo, como se ver, el campo de la estadstica es mucho ms que datos numricos. En un sentido amplio, la estadstica se define como el arte y la ciencia de reunir datos, analizarlos, presentarlos e interpretarlos. Especialmente en los negocios y en la economa, la informacin ob- tenida al reunir datos, analizarlos, presentarlos e interpretarlos proporciona a directivos, adminis- tradores y personas que deben tomar decisiones una mejor comprensin del negocio o entorno econmico, permitindoles as tomar mejores decisiones con base en mejor informacin. En es- te libro se hace hincapi en el uso de la estadstica para la toma de decisiones en los negocios y en la economa. El captulo 1 empieza con algunos ejemplos de aplicaciones de la estadstica en los negocios y en la economa. En la seccin 1.2 se define el trmino datos y se introduce el concepto de con- junto de datos. En esta seccin se introducen tambin trminos clave como variables y observa- ciones, se muestra la diferencia entre datos cualitativos y cuantitativos y se ilustra el uso de datos transversales y de serie de tiempo. En la seccin 1.3 se ensea a obtener datos de fuentes ya exis- tentes o mediante encuestas y estudios experimentales diseados para obtener datos nuevos. Se resalta tambin el papel tan importante que tiene ahora Internet en la obtencin de datos. En las secciones 1.4 y 1.5 se describe el uso de los datos en la estadstica descriptiva y para hacer infe- rencias estadsticas. 1.1 Aplicaciones en los negocios y en la economa En el entorno mundial actual de los negocios y de la economa, todo mundo tiene acceso a enor- mes cantidades de informacin estadstica. Los directivos y los encargados de tomar decisiones que tienen xito entienden la informacin y saben usarla de manera eficiente. En esta seccin se proporcionan ejemplos que ilustran algunos de los usos de la estadstica en los negocios y en la economa. Contadura Las empresas de contadores pblicos al realizar auditoras para sus clientes emplean procedi- mientos de muestreo estadstico. Por ejemplo, suponga que una empresa de contadores desea de- terminar si las cantidades en cuentas por cobrar que aparecen en la hoja de balance del cliente representan la verdadera cantidad en cuentas por cobrar. Por lo general, el gran nmero de cuen- tas por cobrar hace que su revisin tome demasiado tiempo y sea muy costosa. Lo que se hace en estos casos es que el personal encargado de la auditora selecciona un subconjunto de las cuen- tas al que se le llama muestra. Despus de revisar la exactitud de las cuentas tomadas en la mues- tra (muestreadas) los auditores concluyen si la cantidad en cuentas por cobrar que aparece en la hoja de balance del cliente es aceptable. 1.1 Aplicaciones en los negocios y en la economa 3 01Ander(001-025).qxd 1/17/08 10:26 AM Page 3
  34. 34. Finanzas Los analistas financieros emplean una diversidad de informacin estadstica como gua para sus recomendaciones de inversin. En el caso de acciones, el analista revisa diferentes datos finan- cieros como la relacin precio/ganancia y el rendimiento de los dividendos. Al comparar la in- formacin sobre una determinada accin con la informacin sobre el promedio en el mercado de acciones, el analista empieza a obtener conclusiones para saber si una determinada accin est sobre o subvaluada. Por ejemplo, Barrons (12 de septiembre de 2005) informa que la relacin promedio precio/ganancia de 30 acciones del promedio industrial Dow Jones fue 16.5. La re- lacin precio/ganancia de JPMorgan es 11.8. En este caso la informacin estadstica sobre las relaciones precio/ganancia indican un menor precio en comparacin con la ganancia para JPMor- gan que el promedio en las acciones Dow Jones. Por tanto el analista financiero concluye que JP- Morgan est subvaluada. sta y otras informaciones acerca de JPMorgan ayudarn al analista a comprar, vender o a recomendar mantener las acciones. Marketing Escneres electrnicos en las cajas de los comercios minoristas recogen datos para diversas apli- caciones en la investigacin de mercado. Por ejemplo, proveedores de datos como ACNielsen e Information Research Inc. compran estos datos a las tiendas de abarrotes, los procesan y luego venden los resmenes estadsticos a los fabricantes; quienes gastan cientos de miles de dlares por producto para obtener este tipo de datos. Los fabricantes tambin compran datos y resme- nes estadsticos sobre actividades promocionales como precios o displays promocionales. Los administradores de marca revisan estas estadsticas y las propias de las actividades promociona- les para analizar la relacin entre una actividad promocional y las ventas. Estos anlisis suelen resultar tiles para establecer futuras estrategias de marketing para diversos productos. Produccin La importancia que se le da actualmente a la calidad hace del control de calidad una aplicacin importante de la estadstica a la produccin. Para vigilar el resultado de los procesos de produc- cin se usan diversas grficas de control estadstico de calidad. En particular, para vigilar los re- sultados promedio se emplea una grfica x-barra. Suponga, por ejemplo, que una mquina llena botellas con 12 onzas de algn refresco. Peridicamente un empleado del rea de produccin to- ma una muestra de botellas y mide el contenido promedio de refresco. Este promedio o valor x- barra se marca como un punto en una grfica x-barra. Si este punto queda arriba del lmite de control superior de la grfica, hay un exceso en el llenado, y si queda debajo del lmite de con- trol inferior de la grfica hay falta de llenado. Se dice que el proceso est bajo control y pue- de continuar, siempre que los valores x-barra se encuentren entre los lmites de control inferior y superior. Con una interpretacin adecuada, una grfica de x-barra ayuda a determinar si es nece- sario hacer algn ajuste o correccin a un proceso de produccin. Economa Los economistas suelen hacer pronsticos acerca del futuro de la economa o sobre algunos aspectos de la misma. Usan una variedad de informacin estadstica para hacer sus pronsticos. Por ejemplo, para pronosticar las tasas de inflacin, emplean informacin estadstica sobre indi- cadores como el ndice de precios al consumidor, la tasa de desempleo y la utilizacin de la ca- pacidad de produccin. Estos indicadores estadsticos se utilizan en modelos computarizados de pronsticos que predicen las tasas de inflacin. 4 Captulo 1 Datos y estadsticas 01Ander(001-025).qxd 1/17/08 10:26 AM Page 4
  35. 35. Aplicaciones de la estadstica como las descritas en esta seccin integran este libro. Dichos ejemplos proporcionan una visin general de la diversidad de las aplicaciones estadsticas. Co- mo complemento de estos ejemplos, profesionales en los campos de los negocios y de la econo- ma proporcionan los artculos de La estadstica en la prctica que se encuentran al principio de cada captulo, en los que se presenta el material que se estudiar en el captulo. Las aplicaciones en La estadstica en la prctica muestran su importancia en diversas situaciones de los negocios y la economa. 1.2 Datos Datos son hechos/informaciones y cifras que se recogen, analizan y resumen para su presenta- cin e interpretacin. A todos los datos reunidos para un determinado estudio se les llama con- junto de datos para el estudio. La tabla 1.1 muestra un conjunto de datos que contiene informacin sobre 25 empresas que forman parte del S&P 500. El S&P 500 consta de 500 em- presas elegidas por Standard & Poors. Estas empresas representan 76% de la capitalizacin de mercado de todas las acciones de Estados Unidos. Las acciones de S&P 500 son estrechamente observadas por los inversionistas y por los analistas de Wall Street. 1.2 Datos 5 Ganancia Denominacin Precio por por Bolsa abreviada Posicin en accin accin Empresa de valores Ticker BusinessWeek ($) ($) Abbott Laboratories N ABT 90 46 2.02 Altria Group N MO 148 66 4.57 Apollo Group NQ APOL 174 74 0.90 Bank of New York N BK 305 30 1.85 Bristol-Myers Squibb N BMY 346 26 1.21 Cincinnati Financial NQ CINF 161 45 2.73 Comcast NQ CMCSA 296 32 0.43 Deere N DE 36 71 5.77 eBay NQ EBAY 19 43 0.57 Federated Dept. Stores N FD 353 56 3.86 Hasbro N HAS 373 21 0.96 IBM N IBM 216 93 4.94 International Paper N IP 370 37 0.98 Knight-Ridder N KRI 397 66 4.13 Manor Care N HCR 285 34 1.90 Medtronic N MDT 53 52 1.79 National Semiconductor N NSM 155 20 1.03 Novellus Systems NQ NVLS 386 30 1.06 Pitney Bowes N PBI 339 46 2.05 Pulte Homes N PHM 12 78 7.67 SBC Communications N SBC 371 24 1.52 St. Paul Travelers N STA 264 38 1.53 Teradyne N TER 412 15 0.84 UnitedHealth Group N UNH 5 91 3.94 Wells Fargo N WFC 159 59 4.09 Fuente: Business Week (4 de abril de 2005). TABLA 1.1 CONJUNTO DE DATOS DE 25 EMPRESAS S&P 500 archivo en CD BWS&P 01Ander(001-025).qxd 1/17/08 10:26 AM Page 5
  36. 36. Elementos, variables y observaciones Elementos son las entidades de las que se obtienen los datos. En el conjunto de datos de la tabla 1.1, cada accin de una empresa es un elemento; los nombres de los elementos aparecen en la primera columna. Como se tienen 25 acciones, el conjunto de datos contiene 25 elementos. Una variable es una caracterstica de los elementos que es de inters. El conjunto de datos de la tabla 1.1 contiene las cinco variables siguientes: Bolsa de valores (mercado burstil): Dnde se comercializa (cotiza) la accin: N (Bolsa de Nueva York) y NQ (Mercado Nacional Nasdaq). Ticker (denominacin abreviada): Abreviacin usada para identificar la accin en la lis- ta de la bolsa Posicin en BusinessWeek: Nmero del 1 al 500 que indica la fortaleza de la empresa. Precio por accin ($): El precio de cierre (28 de febrero de 2005). Ganancia por accin ($): Las ganancias por accin en los ltimos 12 meses. Los valores encontrados para cada variable en cada uno de los elementos constituyen los datos. Al conjunto de mediciones obtenidas para un determinado elemento se le llama observa- cin. Volviendo a la tabla 1.1, el conjunto de mediciones para la primera observacin (Abbott Laboratories) es N, ABT, 90, 46 y 2.02. El conjunto de mediciones para la segunda observacin (Altria Group) es N, MO, 148, 66 y 4.57, etc. Un conjunto de datos que tiene 25 elementos con- tiene 25 observaciones. Escalas de medicin La recoleccin de datos requiere alguna de las escalas de medicin siguientes: nominal, ordinal, de intervalo o de razn. La escala de medicin determina la cantidad de informacin contenida en el dato e indica la manera ms apropiada de resumir y de analizar estadsticamente los datos. Cuando el dato de una variable es una etiqueta o un nombre que identifica un atributo de un elemento, se considera que la escala de medicin es una escala nominal. Por ejemplo, en rela- cin con la tabla 1.1 la escala de medicin para la variable bolsa de valores (mercado burstil) es nominal porque N y NQ son etiquetas que se usan para indicar dnde cotiza la accin de la empresa. Cuando la escala de medicin es nominal, se usa un cdigo o una etiqueta no numri- ca. Por ejemplo, para facilitar la recoleccin de los datos y para guardarlos en una base de datos en una computadora puede emplearse un cdigo numrico en el que 1 denote la Bolsa de Nueva York y 2 el Mercado Nacional Nasdaq. En este caso los nmeros 1 y 2 son las etiquetas emplea- das para identificar dnde cotizan las acciones. La escala de medicin es nominal aun cuando los datos aparezcan como valores numricos. Una escala de medicin para una variable es ordinal si los datos muestran las propiedades de los datos nominales y adems tiene sentido el orden o jerarqua de los datos. Por ejemplo, una empresa automovilstica (Eastside Automotive) enva a sus clientes cuestionarios para obtener informacin sobre su servicio de reparacin. Cada cliente evala el servicio de reparacin como excelente, bueno o malo. Como los datos obtenidos son las etiquetas excelente, bueno o malo, tienen las propiedades de los datos nominales, pero adems pueden ser ordenados o jerarquiza- dos en relacin con la calidad del servicio. Un dato excelente indica el mejor servicio, seguido por bueno y, por ltimo, malo. Por lo que la escala de medicin es ordinal. Observe que los da- tos ordinales tambin son registrados mediante un cdigo numrico. Por ejemplo, en la tabla 1.1 la posicin de los datos en BusinessWeek es un dato ordinal. Da una jerarqua del 1 al 500 de acuerdo con la evaluacin de BusinessWeek sobre la fortaleza de la empresa. Una escala de medicin para una variable es una escala de intervalo si los datos tienen las caractersticas de los datos ordinales y el intervalo entre valores se expresa en trminos de una unidad de medicin fija. Los datos de intervalo siempre son numricos. Las calificaciones en una prueba de aptitudes escolares son un ejemplo de datos de intervalo. Por ejemplo, las ca- 6 Captulo 1 Datos y estadsticas 01Ander(001-025).qxd 1/17/08 10:26 AM Page 6
  37. 37. lificaciones obtenidas por tres alumnos en la prueba de matemticas con 620, 550 y 470, pueden ser ordenadas en orden de mejor a peor. Adems las diferencias entre las calificaciones tienen significado. Por ejemplo, el estudiante 1 obtuvo 620 550 70 puntos ms que el estudiante 2 mientras que el estudiante 2 obtuvo 550 470 80 puntos ms que el estudiante tres. Una variable tiene una escala de razn si los datos tienen todas las propiedades de los datos de intervalo y la proporcin entre dos valores tiene significado. Variables como distancia, altura, peso y tiempo usan la escala de razn en la medicin. Esta escala requiere que se tenga el valor cero para indicar que en este punto no existe la variable. Por ejemplo, considere el costo de un automvil. El valor cero para el costo indica que el automvil no cuesta, que es gratis. Adems, si se compara el costo de un automvil de $30 000, con el costo de otro automvil, $15 000, la propiedad de razn muestra que $30 000/$15 000 2: el primer automvil cuesta el doble del costo del segundo. Datos cualitativos y cuantitativos Los datos tambin son clasificados en cualitativos y cuantitativos. Los datos cualitativos com- prenden etiquetas o nombres que se usan para identificar un atributo de cada elemento. Los datos cualitativos emplean la escala nominal o la ordinal y pueden ser numricos o no. Los datos cuan- titativos requieren valores numricos que indiquen cunto o cuntos. Los datos cuantitativos se obtienen usando las escalas de medicin de intervalo o de razn. Una variable cualitativa es una variable con datos cualitativos. El anlisis estadstico ade- cuado para una determinada variable depende de si la variable es cualitativa o cuantitativa. Si la variable es cualitativa, el anlisis estadstico es bastante limitado. Tales datos se resumen contan- do el nmero de observaciones o calculando la proporcin de observaciones en cada categora cualitativa. Sin embargo, aun cuando para los datos cualitativos se use un cdigo numrico, las operaciones aritmticas de adicin, sustraccin, multiplicacin o divisin no tienen sentido. En la seccin 2.1 se ven las formas de resumir datos cualitativos. Por otro lado, las operaciones aritmticas s tienen sentido en las variables cuantitativas. Por ejemplo, cuando se tienen variables cuantitativas, los datos se pueden sumar y luego dividir en- tre el nmero de observaciones para calcular el valor promedio. Este promedio suele ser til y fcil de interpretar. En general hay ms alternativas para el anlisis estadstico cuando se tienen datos cuantitativos. La seccin 2.2 y el captulo 3 proporcionan condiciones para resumir datos cuantitativos. Datos de seccin transversal y de series de tiempo Para los propsitos del anlisis estadstico la distincin entre datos transversales y datos de se- ries de tiempo es importante. Datos de seccin transversal son los obtenidos en el mismo o aproximadamente el mismo momento (punto en el tiempo). Los datos de la tabla 1.1 son datos transversales porque describen las cinco variables de las 25 empresas del 25 S&P en un mismo momento. Los datos de series de tiempo son datos obtenidos a lo largo de varios periodos. Por ejemplo, la figura 1.1 presenta una grfica de los precios promedio por galn de gasolina normal en las ciudades de Estados Unidos. En la grfica se observa que los precios son bastantes esta- bles entre $1.80 y $2.00 desde mayo de 2004 hasta febrero de 2005. Despus el precio de la ga- solina se vuelve voltil. Se eleva en forma notable culminando en un agudo pico en septiembre de 2005. En las publicaciones sobre negocios y economa se encuentran con frecuencia grficas de se- ries de tiempo. Estas grficas ayudan a los analistas a entender lo que ocurri en el pasado, a identificar cualquier tendencia en el transcurso del tiempo y a proyectar niveles futuros para la series de tiempo. Las grficas de datos de series de tiempo toman formas diversas como se mues- tra en la figura 1.2. Con un poco de estudio, estas grficas suelen ser fciles de entender y de in- terpretar. 1.2 Datos 7 A los datos cualitativos se les suele llamar datos categricos. El mtodo estadstico adecuado para resumir los datos depende de si los datos son cualitativos o cuantitativos. 01Ander(001-025).qxd 1/17/08 10:26 AM Page 7
  38. 38. Por ejemplo, la grfica (A) de la figura 1.2, muestra las tasas de inters en Stafford Loans pa- ra los estudiantes entre el ao 2000 y el 2006. Despus del ao 2000 las tasas de inters dismi- nuyen y llegan al nivel ms bajo, 3.2%, en el ao 2004. Pero, despus de este ao se observa un marcado aumento en estas tasas de inters, y llegan a 6.8% en el ao 2006. El Departamento de Educacin de Estados Unidos estima que ms de 50% de los estudiantes terminan sus estudios con una deuda; esta creciente tasa de inters es una gran carga financiera para muchos estudian- tes recin egresados. En la grfica (B) se observa un inquietante aumento en el adeudo promedio por hogar en tar- jetas de crdito durante un periodo de 10 aos, de 1995 a 2005. Advierta cmo en la series de tiempo se nota un aumento anual casi constante en el adeudo promedio por hogar en tarjetas de crdito que va de $4500 en 1995 a $9500 en 2005. En 2005 un adeudo promedio de 10 000 no parece lejano. La mayor parte de las empresas de tarjetas de crdito ofrecen tasas de inters iniciales relativamente bajas. Sin embargo, despus de este periodo inicial, tasas de inters anua- les del 18%, 20% y ms son frecuentes. Estas tasas dificultan a los hogares pagar los adeudos de las tarjetas de crdito. En la grfica (C) se observan las tasas de ocupacin en los hoteles de Florida del sur duran- te un ao. Observe que la forma de esta grfica es diferente a (A) y (B); en esta grfica el tiem- po en meses se encuentra en el eje vertical y no en el horizontal. Las tasas de ocupacin ms altas, 95% y 98%, se encuentran en los meses de febrero y marzo que es cuando el clima en Flo- rida del sur es atractivo para los turistas. En efecto, de enero a abril es la estacin de mayor ocu- pacin en los hoteles de Florida del sur. Por otro lado, las tasas de ocupacin ms bajas se observan de agosto a octubre, siendo la menor ocupacin en septiembre. Las temperaturas dema- siado elevadas y la estacin de huracanes son las principales razones de la cada de la ocupacin en este periodo. 8 Captulo 1 Datos y estadsticas $2.00 $2.20 $2.40 $2.60 $2.80 $3.00 $1.80 $1.60 Preciopromedioporgaln Mes Promedio mensual Feb Mar Abr MayMay Jun Jul AgoSept Oct Nov Dic Ene 2004 Jun Jul AgoSept Oct Nov Dic 2005 FIGURA 1.1 PRECIO PROMEDIO POR GALN DE GASOLINA NORMAL EN LAS CIUDADES DE ESTADOS UNIDOS Fuente: U.S. Energy Information Administration, enero de 2006. 01Ander(001-025).qxd 1/17/08 10:26 AM Page 8
  39. 39. 1.2 Datos 9 FIGURA 1.2 DIVERSAS GRFICAS DE DATOS DE SERIES DE TIEMPO (A) Tasas de inters en los Stafford Loans para estudiantes Ao Tasadeinters 0% 2% 4% 6% 5% 3% 1% 8% 7% 9% 2006200520042003200220012000 Ao Montodeladeuda $2 000 $4 000 $6 000 $8 000 $10 000 200520001995 (B) Adeudo promedio en tarjetas de crdito por hogar Mes Porcentaje de ocupacin 20 10080 100% de ocupacin 6040 Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic (C) Tasas de ocupacin en hoteles de Florida del sur 01Ander(001-025).qxd 1/17/08 10:26 AM Page 9
  40. 40. Las series de tiempo y los pronsticos con series de tiempo se vern en el captulo 16 cuan- do se estudien los mtodos de pronstico. Fuera del captulo 16, los mtodos estadsticos que se presentan en este libro son para datos de seccin transversal y no para series de tiempo 10 Captulo 1 Datos y estadsticas 1.3 Fuentes de datos Los datos se obtienen de fuentes ya existentes o por medio de encuestas y estudios experimenta- les realizados con objeto de recolectar nuevos datos. Fuentes existentes En algunos casos los datos que se necesitan para una determinada aplicacin ya existen. Las em- presas cuentan con diversas bases de datos sobre sus empleados, clientes y operaciones de nego- cios. Datos sobre los salarios de los empleados, sus edades y los aos de experiencia suelen obtenerse de los registros internos del personal. Otros registros internos contienen datos sobre ventas, gastos de publicidad, costos de distribucin, inventario y cantidades de produccin. La mayor parte de las empresas cuentan tambin con datos detallados de sus clientes. En la tabla 1.2 se muestran algunos de los datos obtenibles de los registros internos de las empresas. De las organizaciones que se especializan en la recoleccin y almacenamiento de datos se obtienen cantidades importantes de datos econmicos y de negocios. Las empresas disponen de estas fuentes externas de datos si los compran o mediante acuerdos de arrendamiento con opcin de compra. Tres empresas que proporcionan amplios servicios de bases de datos a clientes son Dun & Bradstreet, Bloomberg y Dow Jones & Company. ACNielsen e Information Resources, Inc. han hecho un exitoso negocio recolectando y procesando datos que venden a publicistas y a fabricantes de productos. NOTAS Y COMENTARIOS 1. Una observacin es el conjunto de mediciones obtenidas para cada elemento de un conjunto de datos. Por tanto, el nmero de observaciones es siempre igual al nmero de elementos. El nme- ro de mediciones de cada elemento es igual al n- mero de variables. Entonces, el nmero total de datos se determina multiplicando el nmero de observaciones por el nmero de variables. 2. Los datos cuantitativos son discretos o conti- nuos. Datos cuantitativos que miden cuntos (por ejemplo, el nmero de llamadas recibidas en 5 minutos) son discretos. Datos cuantitati- vos que miden cunto (por ejemplo, peso o tiempo) son continuos porque entre los posibles valores de los datos no hay separacin. Fuente Algunos de los datos disponibles Registros sobre Nombre, direccin, nmero de seguridad social, salario, das los empleados de vacaciones, das de enfermedad y bonos Registros de produccin Parte o nmero de producto, cantidad producida, costo de mano de obra y costo de materiales Registros de inventario Parte o nmero de producto, cantidad de unidades disponibles, nivel de reaprovisionamiento, cantidad econmica a ordenar y programa de descuento Registros de ventas Nmero del producto, volumen de ventas, volumen de ventas por regin y volumen de ventas por tipo de cliente Registros de crditos Nombre del cliente, direccin, nmero de telfono, crdito lmite y cuentas por cobrar Perfil de clientes Edad, gnero, nivel de ingresos, nmero de miembros en la familia, direccin y preferencias TABLA 1.2 EJEMPLOS DE DATOS DISPONIBLES DE LOS REGISTROS DE EMPRESAS INTERNACIONALES 01Ander(001-025).qxd 1/17/08 10:26 AM Page 10
  41. 41. Tambin se obtienen datos de diversas asociaciones industriales y de organizaciones de in- ters especial. La asociacin Travel Industry Association of America cuenta con informacin re- lacionada con los viajes como nmero de turistas y gastos en viajes por estado. Estos datos interesan a empresas e individuos de la industria turstica. El Graduate Management Admission Council cuenta con datos sobre calificaciones en exmenes, caractersticas de los estudiantes y programas de educacin para administradores/directivos. La mayor parte de los datos de estas fuentes estn a disposicin de los usuarios calificados a un costo moderado. La importancia de Internet como fuente de datos y de informacin estadstica sigue crecien- do. Casi todas las empresas cuentan con una pgina Web que proporciona informacin general acerca de la empresa as como datos sobre ventas, cantidad de empleados, cantidad de produc- tos, precios de los productos y especificaciones de los productos. Adems, muchas empresas se especializan ahora en proporcionar informacin a travs de Internet. Con lo que uno puede tener acceso a cotizaciones de acciones, precios de comidas en restaurantes, datos de salarios y a una variedad casi infinita de informacin. Las dependencias de los gobiernos son otra fuente importante de datos. Por ejemplo, el De- partamento del Trabajo de Estados Unidos cuenta con una cantidad considerable de datos sobre tasas de empleo, tasas de salarios, magnitud de la fuerza laboral y pertenencia a sindicatos. En la tabla 1.3 se presentan algunas de las dependencias de gobierno junto con los datos que propor- cionan. La mayor parte de las dependencias de los gobiernos que recolectan y procesan datos tambin los ponen a disposicin a travs de una pgina en la Web. Por ejemplo, la Oficina de Censos de Estados Unidos tiene una abundancia de datos en el sitio www.census.gov. En la fi- gura 1.3 se muestra la pgina Web de la Oficina de Censos de Estados Unidos. Estudios estadsticos Algunas veces, los datos necesarios para una aplicacin particular no se pueden obtener de las fuentes existentes. En tales casos los datos suelen conseguirse realizando un estudio estadstico. Dichos estudios se clasifican como experimentales u observacionales. En los estudios experimentales se identifica primero la variable de inters. Despus se ubica otra u otras variables que son controladas para lograr datos de cmo sta influye sobre la varia- ble de inters. Por ejemplo, a una empresa farmacutica le interesa realizar un experimento para saber la forma en que un medicamento afecta la presin sangunea. La variable que interesa en el estudio es la presin sangunea. Otra variable es la dosis del nuevo medicamento que se espe- ra tenga un efecto causal sobre la presin sangunea. Para obtener estos datos acerca del nuevo medicamento, los investigadores eligen una muestra de individuos. La dosis del medicamento se controla dando diferentes dosis a distintos grupos de individuos. Antes y despus se mide la pre- 1.3 Fuentes de datos 11 Dependencia gubernamental Algunos de los datos disponibles Oficina de Censos Datos poblacionales, nmero de hogares e ingresos de los www.census.gov hogares Junta de la Reserva Federal Datos sobre dinero en circulacin, crditos a plazos, tasas de www.federalreserve.gov cambio y tasas de inters Oficina de Administracin y Presupuesto Datos sobre ingresos, gastos y deudas del gobierno federal www.whitehouse.gov/omb Departamento de Comercio Datos sobre las actividades comerciales, valor de los www.doc.gov embarques por industria, nivel de ganancia por industria e industrias en crecimiento y en decremento Oficina de Estadstica Laboral Gasto de los consumidores, salarios por hora, tasa de desempleo y estadsticas www.bls.gov internacionales TABLA 1.3 EJEMPLO DE LOS DATOS DISPONIBLES DE ALGUNAS DEPENDENCIAS GUBERNAMENTALES El mayor estudio estadstico experimental jams realizado se cree que es el experimento del Servicio de Salud Pblica para la vacuna Salk contra la polio. Se eligieron casi 2 millones de nios de 1o., 2o. y 3er. grados en Estados Unidos. 01Ander(001-025).qxd 1/17/08 10:26 AM Page 11
  42. 42. sin sangunea en cada grupo. El anlisis estadstico de los datos experimentales ayuda a deter- minar el efecto del nuevo medicamento sobre la presin sangunea. En los estudios estadsticos no experimentales y observacionales, no se controlan las va- riables de inters. El tipo ms usual de estudio observacional es quiz una encuesta. Por ejem- plo, en una encuesta mediante entrevistas personales, primero se identifican las preguntas de la investigacin. Despus se presenta un cuestionario a los individuos de la muestra. Algunos res- taurantes emplean estudios observacionales para obtener datos acerca de la opinin de sus clien- tes respecto a la calidad de los alimentos, del servicio, de la atmsfera, etc. En la figura 1.4 se presenta un cuestionario empleado por el restaurante Lobster Pot de Florida. Observe que en el cuestionario se pide a los clientes evaluar cinco variables: calidad de los alimentos, amabilidad en el servicio, prontitud en el servicio, limpieza y gestin. Las categoras para las respuestas de excelente, bueno, satisfactorio e insatisfactorio proporcionan datos ordinales que permiten a los directivos de Lobster Pot evaluar la calidad de operacin del restaurante. Los directivos que deseen emplear datos y anlisis estadstico como ayuda en la toma de deci- siones deben estar conscientes del tiempo y costo que requiere la obtencin de los datos. Cuando es necesario obtener los datos en poco tiempo, es deseable el uso de fuentes de datos ya existentes. Si no es posible obtener con facilidad datos importantes de fuentes ya existentes, debe tomarse en cuen- ta el tiempo y el costo necesarios para obtener los datos. En todos los casos, las personas encargadas de tomar las decisiones deben considerar la contribucin del anlisis estadstico en el proceso de la toma de decisiones. El costo de la adquisicin de datos y del subsiguiente anlisis no deben exceder a los ahorros generados por el uso de esta informacin para tomar una decisin mejor. Errores en la adquisicin de datos Los directivos siempre deben estar conscientes de la posibilidad de errores en los datos de los es- tudios estadsticos. Usar datos errneos es peor que no usar ningn dato. Un error en la adquisi- cin de datos se tiene siempre que el valor del dato obtenido no es igual al verdadero valor o al valor real que se hubiera obtenido con un procedimiento correcto. Estos errores ocurren de va- 12 Captulo 1 Datos y estadsticas Los estudios sobre fumadores y no fumadores son estudios observacionales porque los investigadores no determinan o controlan quin fuma y quin no. FIGURA 1.3 PGINA DE INICIO DEL SITIO WEB DE LA OFICINA DE CENSOS DE ESTADOS UNIDOS New on the Site Facts for Features HURRICANE SEASON Scheduled Downtime People & Households 2000 Population Clocks Business & Industry Geography Newsroom Special Topics Data Tools American FactFinder Jobs@Census Catalog Publications Are You in a Survey? About the Bureau Regional Offices Doing Business with Us U.S. Dept of Commerce Related Sites Your Gateway to Census 2000 SEARCH: FAQs Census.gov Summary File 3 (SF 3) Estimates State Family Income Economic Census Government More More More E-Stats Foreign Trade Export Codes Local Employment Dynamics Economic Indicators NAICS Poverty Health Insurance International Genealogy More American Community Survey Projections Housing Income Census 2000 EEO Tabulations Summary File 4 (SF 4) Survey of Business Owners Maps TIGER Gazetteer Releases Facts For Features Minority Links Broadcast and Photo Services Hurricane Data Census Calendar Training For Teachers Statistical Abstract FedStats FirstGov U.S. 298,911,967 Latest Economic Indicators Population Finder Find An Area Profile with QuickFacts Econonic Indicators My town, county, or zip My state select a state select an indicator Select a state to begin Select an indicator World 6,520,483,541 11:09 GMT (EST+5) Jun 06, 2006 Manufacturers Shipments, Inventories, and Construction Spending Orders 2004 Annual Capital Expenditures Survey FOIA Data Protection & Privacy Policy Information Quality Accessibility Census United States NEW - select a state D a t a F i n d e r sGO GO U.S. Census Bureau Subjects A to Z FAQs Privacy Policy Help 01Ander(001-025).qxd 1/17/08 10:26 AM Page 12
  43. 43. rias maneras. Por ejemplo, un entrevistador puede cometer un error de escritura, como una trans- posicin al escribir la edad de una persona y en lugar de 24 aos escribir 42 aos, o en una en- trevista, el entrevistado puede malinterpretar una pregunta y dar una respuesta incorrecta. Los analistas de datos con experiencia tienen sumo cuidado tanto al recolectar los datos como al registrarlos para garantizar que no se cometan errores. Para comprobar la consistencia interna de los datos se emplean procedimientos especiales. Tales procedimientos indican al ana- lista, por ejemplo, que debe revisar la consistencia de los datos cuando un entrevistado aparece con 22 aos de edad pero informa tener 20 aos de experiencia en el trabajo. El analista de datos tambin debe revisar datos que tengan valores inusualmente grande o pequeos, llamados obser- vaciones atpicas, que son candidatos a posibles errores en los datos. En el captulo 3 se mues- tran algunos de los mtodos estadsticos tiles para identificar observaciones atpicas. Los errores suelen presentarse durante la adquisicin de datos. Emplear a ciegas cualquier dato que se tenga o valerse de datos que fueron adquiridos con poco cuidado da como resultado informacin desorientadora y malas decisiones. As, tomar medidas para adquirir datos precisos ayuda a garantizar informacin confiable y valiosa para la toma de decisiones. 1.4 Estadstica descriptiva La mayor parte de la informacin estadstica en peridicos, revistas, informes de empresas y otras publicaciones consta de datos que se resumen y presentan en una forma fcil de leer y de entender. A estos resmenes de datos, que pueden ser tabulares, grficos o numricos se les co- noce como estadstica descriptiva. 1.4 Estadstica descriptiva 13 FIGURA 1.4 CUESTIONARIO PARA CONOCER LA OPININ DE LOS CLIENTES EMPLEADO EN EL RESTAURANTE THE LOBSTER POT DE REDINGTON SHORES, FLORIDA Nos alegramos de su visita al restaurante Lobster Pot y queremos estar seguros de que volver. De manera que si tiene unos minutos le agradeceramos mucho que nos llenara esta tarjeta. Sus comentarios y sugerencias son extremadamente importantes para nosotros. Gracias. Nombre de la persona que lo atendi Excelente Bueno Satisfactorio Insatisfactorio Calidad de los alimentos Amabilidad en el servicio Prontitud en el servicio Limpieza Gestin Comentarios Qu lo motiv a visitarnos? Favor de depositarlo en el buzn de sugerencias que se encuentra a la entrada. 01Ander(001-025).qxd 1/17/08 10:26 AM Page 13
  44. 44. Vuelva al conjunto de datos de la tabla 1.1 que presenta 25 de las empresas de S&P 500. Los mtodos de la estadstica descriptiva pueden emplearse para resumir la informacin en este con- junto de datos. Por ejemplo, en la tabla 1.4 se presenta un resumen tabular de los datos de la va- riable bolsa de valores. Un resumen grfico de los mismos datos, al que se le llama grfica de barras aparece en la figura 1.5. Estos tipos de resmenes, tabular y grfico, permiten que los da- tos sean ms fciles de interpretar. Al revisar la tabla 1.4 y la figura 1.5 es fcil entender que la mayor parte de las acciones del conjunto de datos cotizan en la bolsa de Nueva York. Si emplea porcentajes: 80% cotizan en la bolsa de Nueva York y 20% en el Nasdaq. En la figura 1.6 se presenta un resumen grfico, llamado histograma, de los datos de la va- riable cuantitativa precio por accin. El histograma facilita ver que los precios por accin van de $0 a $100, con una mayor concentracin entre $20 y $60. Adems de las presentaciones tabular y grfica para resumir datos se emplea tambin la es- tadstica descriptiva numrica. El estadstico descriptivo ms comn para resumir datos es el pro- medio o media. Mediante los datos de la variable ganancia por accin de las acciones S&P de la tabla 1.1, el promedio se calcula sumando las ganancias por accin de las 25 acciones y dividien- 14 Captulo 1 Datos y estadsticas Frecuencia Bolsa de valores Frecuencia porcentual Bolsa de Nueva York 20 80 Mercado Nacional Nasdaq 5 20 Totales 25 100 TABLA 1.4 FRECUENCIAS Y FRECUENCIAS PORCENTUALES DE LA VARIABLE BOLSA DE VALORES 80 60 50 70 40 30 20 10 0 Frecuenciaporcentual Bolsa de valores NYSE Nasdaq FIGURA 1.5 GRFICA DE BARRAS DE LA VARIABLE BOLSA DE VALORES 01Ander(001-025).qxd 1/17/08 10:26 AM Page 14
  45. 45. do entre 25. Al hacer esto se obtiene como ganancia promedio por accin $2.49. Este promedio da una tendencia central, o posicin central, de los datos de la variable. En numerosos campos sigue creciendo el inters por los mtodos estadsticos que son apli- cables para elaborar y presentar estadsticas descriptivas. En los captulos 2 y 3 se dedica la aten- cin a los mtodos tabulares, grficos y numricos de la estadstica descriptiva. 1.5 Inferencia estadstica En muchas situaciones se requiere informacin acerca de grupos grandes de elementos (indivi- duos, empresas, votantes, hogares, productos, clientes, etc.). Pero, debido al tiempo, costo y a otras consideraciones, slo es posible recolectar los datos de una pequea parte de este grupo. Al grupo grande de elementos en un determinado estudio se le llama poblacin y al grupo peque- o muestra. En trminos formales se emplean las definiciones siguientes. 1.5 Inferencia estadstica 15 5 4 3 2 1 0 Frecuencia Precio por accin 0 20 40 60 80 100 6 7 8 9 FIGURA 1.6 HISTOGRAMA DE LOS PRECIOS POR ACCIN DE 25 ACCIONES S&P MUESTRA La muestra es un subconjunto de la poblacin. POBLACIN La poblacin es el conjunto de todos los elementos de inters en un estudio determinado. 01Ander(001-025).qxd 1/17/08 10:26 AM Page 15
  46. 46. Al proceso de realizar un estudio para recolectar datos de toda una poblacin se le llama censo. Al proceso de efectuar un estudio para recolectar datos de una muestra se le llama encues- ta muestral. Una de las principales contribuciones de la estadstica es emplear datos de una muestra para hacer estimaciones y probar hiptesis acerca de las caractersticas de una poblacin mediante un proceso al que se le conoce como inferencia estadstica. Como un ejemplo de inferencia estadstica, considere un estudio realizado por Norris Elec- tronics. Norris fabrica focos de alta intensidad que se emplean en diversos productos electr- nicos. Con objeto de incrementar la vida til de estos focos, el grupo de diseo del producto elabor un filamento nuevo. En este caso, la poblacin est definida por todos los focos que se produzcan con el filamento nuevo. Para evaluar las ventajas del filamento, se fabricaron 200 fo- cos. Los datos recolectados de esta muestra dan el nmero de horas que dur cada foco hasta que se quemara el filamento. Vase la tabla 1.5. Suponga que Norris desea usar estos datos muestrales para hacer una inferencia acerca del nmero de horas promedio de vida til de todos los focos que se producen con el filamento nue- vo. Al sumar los 200 valores de la tabla 1.5 y dividir la suma entre 200 se obtiene el promedio del tiempo de vida de los focos: 76 horas. Este resultado muestral sirve para estimar que el tiem- po de vida promedio de los focos de la poblacin es 76 horas. En la figura 1.7 se proporciona un resumen grfico del proceso de inferencia estadstica empleado por Norris Electronics. Siempre que un estadstico usa una muestra para estimar una caracterstica poblacional que interesa, suele proporcionar informacin acerca de la calidad o precisin de la estimacin. En el ejemplo de Norris, el estadstico puede informar que la estimacin puntual del tiempo de vida promedio de la poblacin de los nuevos focos es 76 horas con un margen de error de 4 horas. Entonces, el intervalo de estimacin del tiempo de vida promedio de los focos fabricados con el nuevo filamento es de 72 a 80 horas. El estadstico tambin puede informar qu tan confiado es- t de que el intervalo de 72 a 80 horas contenga el promedio poblacional. 16 Captulo 1 Datos y estadsticas El gobierno de Estados Unidos realiza un censo cada 10 aos. Las empresas de investigacin de mercado realizan estudios muestrales cada da. 107 73 68 97 76 79 94 59 98 57 54 65 71 70 84 88 62 61 79 98 66 62 79 86 68 74 61 82 65 98 62 116 65 88 64 79 78 79 77 86 74 85 73 80 68 78 89 72 58 69 92 78 88 77 103 88 63 68 88 81 75 90 62 89 71 71 74 70 74 70 65 81 75 62 94 71 85 84 83 63 81 62 79 83 93 61 65 62 92 65