Esta Di Stica
-
Upload
waguerrero -
Category
Documents
-
view
20 -
download
0
Transcript of Esta Di Stica
-
GUA DIDCTICA Y MDULO
GABRIEL JAIME POSADA HERNNDEZ
MARA VICTORIA BUITRAGO CARDONA
FUNDACIN UNIVERSITARIA LUIS AMIG
FACULTAD DE CIENCIAS ADMINISTRATIVAS, ECONMICAS Y CONTABLES
Colombia, 2008
-
COMIT DIRECTIVO
Fray Marino Martnez PrezRector
Hernn Ospina AtehortaVicerrector Administrativo y Financiero Director de Planeacin
Jos Jaime Daz OsorioVicerrector Acadmico
Francisco Javier Acosta GmezSecretario General
ESTADSTICA Gabriel Jaime Posada Hernndez Mara Victoria Buitrago Cardona
Decana Facultad de Ciencias Administrativas, Econmicas y Contables:Mara Victoria Agudelo Vargas
Correccin de estilo:Lorenza Correa Restrepo
Diseo:Colectivo Docente Facultad de Ciencias Administrativas, Econmicas y Contables
Impresin:Departamento de Publicaciones FUNLAM
www.funlam.edu.co
TODOS LOS DERECHOS RESERVADOSMedelln Colombia2008
Estadstica 2
-
CONTENIDO
Pg
GUA DIDCTICA
PRESENTACIN 13
1. FICHA TCNICA 15
2. INTENCIONALIDADES FORMATIVAS 16
3. OBJETIVOS 17
3.1. OBJETIVOS ESENCIALES 17
3.2. OBJETIVOS COMPLEMENTARIOS 17
4. UNIDADES TEMTICAS 19
5. METODOLOGA GENERAL 20
6. EVALUACIN INTEGRAL 21
II ESTADSTICA DESCRIPTIVA
INTRODUCCIN 23
JUSTIFICACIN 25
UNIDAD 1. INTRODUCCIN Y OBTENCIN DE DATOS
ESTADSTICOS 27
1.1. ESTADSTICA 27
1.1.1. Historia 27
1.1.2. Definicin 31
1.1.3. Divisin 32Estadstica 3
-
1.2. CONCEPTOS GENERALES 32
1.2.1. Unidad de investigacin 32
1.2.2. Poblacin 33
1.2.3. Muestra 34
1.2.4. Parmetros y estadgrafos 34
1.2.5. Variables 35
1.2.6. Escalas de medicin 38
1.3. MUESTREO 42
1.3.1. Mtodos de muestreo probabilstico 43
1.3.2. Mtodos de muestreo no probabilstico 47
1.3.3. Evaluacin del valor de una encuesta 49
1.3.4. Errores en las encuestas 50
1.3.5. Aspectos ticos del muestreo 52
UNIDAD 2. ORDENACIN DE DATOS ESTADSTICOS
2.1. TABULACIN DE DATOS 55
2.1.1. Rango o recorrido 55
2.1.2. Amplitud del rango 59
2.1.3. Nmero de clases 59
2.1.4. Amplitud del intervalo de clase 60
2.1.5. Lmites de las clases 61
2.1.6. Tabulacin 62
2.1.7. Marca de clase o punto medio 62
2.2. FRECUENCIAS 63
2.2.1. Frecuencia absoluta 63
2.2.2. Frecuencia relativa 64Estadstica 4
-
2.2.3. Frecuencia absoluta acumulada 66
2.2.4. Frecuencia relativa acumulada 67
2.2.5. Nmeros ndices 69
2.3. GRFICAS O DIAGRAMAS 70
2.3.1. Histogramas 70
2.3.2. Polgono de frecuencias 72
2.3.3. Ojivas o polgonos de frecuencias acumuladas 74
2.3.4. Diagramas de barras 75
2.3.5. Diagramas circulares 76
2.3.6. Diagrama de tallo y hojas 77
2.3.7. Diagrama de Pareto 80
2.4. TABULACIN DE DATOS BINARIOS O CRUZADOS 82
UNIDAD 3. MTODOS NUMRICOS
3.1. MEDIDAS DE TENDENCIA CENTRAL O DE PRECISIN 88
3.1.1. Media aritmtica 88
3.1.2. Mediana 91
3.1.3. Moda 96
3.1.4. Cuantiles 100
3.2. MEDIDAS DE VARIABILIDAD 107
3.2.1. Rango 108
3.2.2. Rango intercuartil 109
3.2.3. Varianza 109
3.2.4. Desviacin estndar 114
3.2.5. Coeficiente de variacin 115
Estadstica 5
-
3.3. MEDIDAS DE LOCALIZACIN 117
3.3.1. Valor z 118
3.3.2. Teorema de Chebyshev 119
3.3.3. Sesgo o forma 122
3.3.4. Diagrama de caja o bigotes 124
3.3.5. Curtosis 128
UNIDAD 4. REGRESIN LINEAL Y CORRELACIN
4.1. REGRESIN LINEAL SIMPLE 132
4.1.1. Diagrama de dispersin 132
4.1.2. Ajuste de una recta por el mtodo de mnimos cuadrados 135
4.2. CORRELACIN 141
4.2.1. Coeficiente de correlacin 141
4.2.2. Coeficiente de determinacin 144
III TEORA DE PROBABILIDADES
UNIDAD 1. DEFINICIONES1.1 INTRODUCCIN 148
1.2 QU ES LA PROBABILIDAD 149
1.3 CONCEPTOS BSICOS DE PROBABILIDAD 150
1.3.1 Fenmeno experimento aleatorio 150
1.3.2 Fenmeno o experimento determinstico 150
1.3.3 Prueba 150
1.3.4 Espacio muestral 150
1.3.5 Elemento o punto muestral 152
1.3.6 Evento 152
1.3.7 Interseccin de dos eventos a y b 152Estadstica 6
-
1.3.8 Unin de dos eventos a y b 153
1.3.9. Complemento de un evento a 154
UNIDAD 2. TCNICAS DE CONTEO2.1 TCNICAS DE CONTEO 157
Regla 2.1.1. Principio de la multiplicacin 157
Regla 2.1.2. Principio de permutacin 161
Regla 2.1.3 Variaciones o permutaciones 162
Regla 2.1.4 Combinaciones 164
Regla 2.1.5 Particiones 166
2.2 EJERCICIOS RESUELTOS 167
UNIDAD 3. SUCESOS PROBABILSTICOS Y REGLAS DE
PROBABILIDAD
3.1 SUCESOS PROBABILSTICOS 1723.1.1 Sucesos independientes 172
3.1.2 Sucesos dependientes 172
3.1.3 Sucesos compatibles o mutuamente no excluyentes 172
3.1.4 Sucesos incompatibles o mutuamente excluyentes 172
3.2 DEFINICIN DE PROBABILIDAD 173
3.2.1. Modelo de probabilidad emprico o frecuencialista. 173
3.2.2. Modelo subjetivo 174
3.2.3 Modelo clsico 174
3.3. REGLAS PRINCIPALES DE LA PROBABILIDAD 175
Estadstica 7
-
3.4. AXIOMAS DE PROBABILIDAD 180
3.4.1 Teorema 1: regla de la unin o suma 180
3.4.2 Teorema 2: regla del complemento 180
3.4.3 Teorema 3: probabilidad condicional 181
3.4.4 Teorema 4: regla de la multiplicacin o interseccin 182
UNIDAD 4. VARIABLES ALEATORIAS Y DISTRIBUCIONES
DE PROBABILIDAD4.1 INTRODUCCIN 191
4.2DISTRIBUCIN O FUNCIN DE PROBABILIDAD 191
4.3 ALGUNAS DISTRIBUCIONES DISCRETAS DE PROBABILIDAD 194
4.3.1 Distribucin binomial 194
4.3.1.1 Caractersticas 195
4.3.1.2 Funcin de probabilidad de la v.a. binomial 196
4.3.1.3 Tablas de probabilidad acumulada de la binomial 200
4.3.1.4 Parmetros de la distribucin binomial 205
4.3.2 Distribucin hipergeomtrica 206
4.3.2.1 Funcin de probabilidad de la v.a. hipergeomtrica 207
4.3.2.2 Parmetros de la distribucin hipergeomtrica 212
4.3.3 Distribucin de Poisson 212
4.3.3.1 Funcin de probabilidad de la v.a. Poisson 213
4.3.3.2 Tablas de probabilidad acumulada de la Poisson 213
4.3.3.3 Parmetros de la distribucin Poisson 220
Estadstica 8
-
4.4 DISTRIBUCIN CONTINUA DE PROBABILIDAD:
DISTRIBUCIN NORMAL 220
4.4.1 La funcin de densidad de la distribucin normal 221
4.4.2 Representacin grfica de esta funcin de densidad 221
4.4.3 Distribucin normal estndar 222
4.4.4 Pasos para buscar en la tabla 222
IV ESTADSTICA INFERENCIAL
UNIDAD 1. ESTIMACIN
1.1 INTRODUCCIN 233
1.2 NIVEL DE CONFIABILIDAD DE LOS RESULTADOS 236
1.3 PRINCIPALES PARMETROS, ESTADSTICOS
Y SUS SMBOLOS 236
1.4 ESTIMACIN PUNTUAL 237
1.4.1 Estimacin puntual para variable cuantitativa 237
1.4.2 Estimacin puntual para variable cualitativa 238
1.5 TAMAO DE LA MUESTRA PARA ESTIMAR MEDIAS Y
PROPORCIONES. 238
1.5.1 Determinacin estadstica del tamao de la muestra 240
1.5.1.1 Poblaciones infinitas 240
1.5.1.1.1 Proporcin conocida 240
1.5.1.1.2 Proporcin desconocida 240
Estadstica 9
-
1.5.1.2 Poblaciones finitas
242
UNIDAD 2. INTERVALOS DE CONFIANZA2.1 INTRODUCCIN 244
2.1.1 Intervalos de confianza para el promedio poblacional 244
2.1.1.1 Parmetros y/o estadsticos para utilizar las frmulas
de intervalos de confianza 2452.1.2 Intervalo de confianzas para la proporcin poblacional p 253 2.1.2.1 Parmetros para utilizar las frmulas de intervalos de confianza 253
UNIDAD 3. PRUEBA DE HIPTESIS3.1 INTRODUCCIN 257
3.2DEFINICIN DE PRUEBA DE HIPTESIS 257
3.3PASOS PARA LA PRUEBA DE HIPTESIS PARA
EL PROMEDIO Y LA PROPORCIN P. 258
4. ESTUDIO DE CASO 272
5. ACTIVIDADES DE RECONOCIMIENTO 276
6. RESPUESTA A PREGUNTAS FRECUENTES 277
7. ACTIVIDADES DE PROFUNDIZACIN 281
ANEXOS TABLAS DE PROBABILIDAD ACUMULADAAnexo A Tabla acumulada de la distribucin binomial 297
Anexo B Tabla acumulada de la distribucin Poisson 302
Anexo C Tabla acumulada de la distribucin normal 305Estadstica 10
-
Anexo D Tabla de la distribucin t-student 307
GLOSARIO 308
BIBLIOGRAFA 317
Estadstica 11
-
Estadstica 12
-
PRESENTACIN
Apreciado estudiante, bienvenido a la Asignatura Estadstica Descriptiva e
Inferencial.
Este mdulo ha sido escrito teniendo presente al estudiante que ingresa en
la metodologa a distancia, la cual se constituye en uno de los nuevos retos y
alternativas para la formacin de profesionales capaces de intervenir
problemticas sociales contemporneas, desde la aplicacin de la ciencia y
la tecnologa con criterios ticos y de calidad.
La educacin a distancia responde a la necesidad de ofrecer un proceso de
formacin que supere obstculos representados en grandes distancias
geogrficas y escasez de tiempo de personas deseosas de tener las
oportunidades de desarrollo humano que brinda la educacin superior.
Dicha metodologa exige a cada estudiante un esfuerzo investigativo,
creativo e innovador soportado por la voluntad del compromiso que demanda
nuestra sociedad.
Por esto, para el alcance de los objetivos en este proceso formativo, ms que
construir un texto, se ha tratado de presentar un instrumento de
comunicacin acadmica y dinmica entre la institucin y el estudiante, en el
que se diferencian dos partes fundamentales: la gua de estudio y trabajo, y
el mdulo de aprendizaje.
Estadstica 13
-
La gua considera las orientaciones sobre el desarrollo del curso en cuanto
define los elementos necesarios para la interlocucin entre estudiantes y
docente, describiendo en la metodologa las actividades a realizar para cada
encuentro, bibliografa complementaria, proceso de evaluacin y
compromisos adquiridos por el estudiante. El mdulo desarrolla el contenido
conceptual bsico que permite al estudiante la comprensin de los
problemas potenciales en el campo administrativo.
Seguros de que en dicho material se encuentran los referentes necesarios
para el desarrollo de un proceso acadmico con calidad, le deseamos xitos
en este nuevo ciclo de su formacin profesional.
Estadstica 14
-
1. FICHA TCNICA
CURSO ESTADSTICA DESCRIPTIVA
AUTORES GABRIEL JAIME POSADA HERNNDEZ
MARA VICTORIA BUITRAGO CARDONA
INSTITUCIN FUNDACIN UNIVERSITARIA LUIS AMIG
UNIDAD ACADMICA FACULTAD DE CIENCIAS ADMINISTRATIVAS,
ECONMICAS Y CONTABLES
PROGRAMAS ADMINISTRACIN DE EMPRESAS
CONTADURA PBLICA
NEGOCIOS INTERNACIONALES
PALABRAS CLAVE ESTADSTICA, CONTEO, DATOS, MUESTRA,
POBLACIN, PROBABILIDAD
REA DE CONOCIMIENTO BSICA
CRDITOS 3 (TRES)
CIUDAD MEDELLN
FECHA JULIO DE 2007
ACTUALIZACIN
ADICIN DE TEMAS
APROBADA POR
2. INTENCIONALIDADES FORMATIVAS
Estadstica 15
-
El mundo global y nuestra sociedad exigen al profesional moderno el
desarrollo de competencias y habilidades que permitan la solucin oportuna
y adecuada a los diferentes problemas que se presentan en las
organizaciones.
La Fundacin Universitaria Luis Amig, consciente de ello, ha generado
constantemente espacios que propician la formacin integral de sus
estudiantes, partiendo del reconocimiento del ser humano como persona y,
sobre l, la tcnica y el saber especfico que exige la academia.
Por tal razn, el egresado de la Fundacin Universitaria Luis Amig es un
profesional ntegro, tico y comprometido con la sociedad en la bsqueda de
alternativas viables para el mejoramiento funcional de las organizaciones y la
calidad de vida de sus integrantes.
3. OBJETIVOS
Estadstica 16
-
3.1. OBJETIVOS ESENCIALES
Manejar adecuadamente los conceptos relacionados con estadstica.
Aplicar los conceptos y procedimientos matemticos para describir el
comportamiento de una variable en un conjunto de datos.
Analizar los mtodos numricos de un conjunto de datos.
Generar modelos de regresin lineal simple, y realizar anlisis pertinentes
para la toma de decisiones.
Aplicar el concepto de teora de probabilidad para tomar decisiones bajo
incertidumbre.
Manejar las distribuciones discretas y continuas de probabilidad para
resolver problemas reales, teniendo en cuenta los parmetros
poblacionales y el tipo de situacin a resolver.
Realizar inferencias partiendo de parmetros muestrales, por medio de
los intervalos de confianza y prueba de hiptesis.
3.2. OBJETIVOS COMPLEMENTARIOS
Diferenciar conceptualmente la poblacin y la muestra.
Reconocer los tipos de variables y escalas de medicin aplicados a un
conjunto de datos.
Estadstica 17
-
Calcular e interpretar las medidas de tendencia central, variabilidad y
localizacin de un conjunto de datos.
Calcular los parmetros de la ecuacin de regresin lineal simple.
Calificar el modelo de regresin lineal simple por medio de los
coeficientes de correlacin y determinacin.
Reconocer un espacio muestral y su tcnica de conteo acorde al
problema.
Reconocer las diferentes reglas de probabilidad y su aplicabilidad.
Aplicar y calcular por frmula o tabla de probabilidad, las distribuciones
binomial, Poisson, hipergeomtrica y normal.
Reconocer la informacin que se tiene para poder sacar una muestra
aleatoria, con un alto grado de confiabilidad
Diferenciar una variable aleatoria discreta y una variable aleatoria
continua.
Diferenciar un parmetro poblacional y un parmetro muestral.
Aplicar de acuerdo con los estadsticos, un parmetro muestral por medio
del intervalo de confianza o prueba de hiptesis a un nivel de
confiabilidad.
Estadstica 18
-
4. UNIDADES TEMTICAS
II ESTADSTICA DESCRIPTIVA UNIDAD 1. INTRODUCCIN Y OBTENCIN DE DATOS
ESTADSTICOS
UNIDAD 2. ORDENACIN DE DATOS ESTADSTICOS
UNIDAD 3. MTODOS NUMRICOS
UNIDAD 4. REGRESIN LINEAL Y CORRELACIN
III TEORA DE PROBABILIDADES
UNIDAD 1 DEFINICIONES
UNIDAD 2 TCNICAS DE CONTEO
UNIDAD 3 SUCESOS PROBABILSTICOS Y REGLAS DE
PROBABILIDAD
UNIDAD 4 VARIABLES ALEATORIAS Y DISTRIBUCIONES DE
PROBABILIDAD
IV ESTADSTICA INFERENCIAL
UNIDAD 1 ESTIMACIN
UNIDAD 2 INTERVALOS DE CONFIANZA
UNIDAD 3 PRUEBA DE HIPTESIS
Estadstica 19
-
5. METODOLOGA GENERAL
El curso Estadstica, bajo la modalidad a distancia, es realizado por medio
de encuentros presenciales, utilizando como mediaciones la plataforma
Dicom y el mdulo.
En los encuentros presenciales se compartirn los temas propuestos, se
realizarn ejemplos aplicados a la administracin y se asignarn actividades
para las siguientes asesoras.
Al iniciar el curso, cada estudiante selecciona una organizacin (puede ser
pblica, privada o del sector de la economa solidaria) o un grupo poblacional
de inters (estudiantes, familias, habitantes de un barrio, etc.). Seleccionar
una muestra de elementos (de un tamao acordado) y generar una base de
datos que contemple las variables cualitativas, cuantitativas discretas y
cuantitativas continuas.
En los elementos de la muestra seleccionada, se aplicarn paulatinamente
los conceptos vistos en el desarrollo del curso. En cada encuentro
presencial se compartirn los avances sobre la secuencia del anlisis
estadstico de los elementos de la organizacin.
A travs de la plataforma virtual Dicom, cada estudiante compartir sus
inquietudes y apreciaciones en el portafolio personal de desempeo. Estas
inquietudes sern resueltas por este medio o socializadas en la siguiente
asesora.
Estadstica 20
-
6. EVALUACIN INTEGRAL
La evaluacin del curso Estadstica se realizar de forma cualitativa, por
medio del portafolio personal de desempeo (acorde con el artculo 80 del
Reglamento Estudiantil). Se establecer un proceso dinmico y continuo que
contenga seguimiento, trabajo aplicado y evaluacin final.
El seguimiento se realizar a travs de evaluaciones cortas sobre temticas
ya compartidas, designando un espacio para hacerlas, previo acuerdo con
los estudiantes.
El trabajo de aplicacin a la organizacin o poblacin de inters tendr un
seguimiento durante todo el curso, el cual ser tenido en cuenta para la
evaluacin final del mismo; adems de la presentacin, anlisis de variables
y conclusiones.
Al finalizar el curso, se realizar la evaluacin final o Prueba Acumulativa de
Conocimiento Integral (PACI), la cual pretende evaluar, de forma global,
todos los temas tratados en el curso.
Estadstica 21
-
Estadstica 22
-
INTRODUCCIN
La estadstica o los mtodos estadsticos, como se denomina a veces, est
jugando un papel de gran importancia en casi todas las facetas del
comportamiento humano. Ocupada inicialmente en asuntos del Estado, y de
ah su nombre, la influencia de la Estadstica se ha extendido ahora a la
administracin, la economa, los negocios, la comunicacin, la agricultura, la
medicina, la fsica, las ciencias polticas, la psicologa, la sociologa y muchos
otros campos de la ciencia y la ingeniera.
El propsito de este mdulo es presentar desde el manejo de la informacin,
su representacin tabular y medidas, hasta el manejo de las probabilidades,
y llegar a conclusiones poblacionales por medio de la inferencia estadstica
en la cual son de gran utilidad, para la manipulacin de la informacin,
respuestas bajo incertidumbre y respuestas poblacionales. Se ha diseado
para ser usado como complemento del proceso formativo, acompaado de la
plataforma Dicom y los encuentros presenciales. Adems, puede ser
considerado como texto de consulta para aquellas personas que estn
interesadas en aplicar la Estadstica en el anlisis de problemas
investigativos.
Los temas han sido compilados de diferentes autores: Anderson, Sweeney y
Williams; Berenson, Levine y Krehbiel; Walpole y Myers; Spiegel, entre otros.
Cada unidad comienza con enunciados claros de las definiciones pertinentes
y ejemplos aplicados a la vida real. La nica base matemtica requerida
Estadstica 23
-
para la comprensin de los temas es la aritmtica. En la primera unidad se
presenta la conceptualizacin de la estadstica y la forma como se obtiene
una base de datos. La segunda unidad se refiere a la ordenacin de datos
estadsticos, segn el tipo de variable en la cual se ubican, para luego
representar en la tercera unidad las medidas de tendencia central, de
dispersin y de localizacin del conjunto de datos. La cuarta unidad
establece la relacin entre variables por medio de la regresin lineal y la
correlacin. La quinta unidad se refiere a un espacio muestral, las tcnicas
de conteo y las reglas de probabilidad. La sexta unidad se refiere a la
diferencia entre variables aleatorias discretas y continuas y sus distribuciones
de probabilidad. La sptima unidad se refiere a resultados poblacionales, por
medio de los intervalos de confianza y prueba de hiptesis, basndose en
resultados muestrales.
Al final, se presenta un estudio de caso, el cual pretende mayor cercana de
la Estadstica a la administracin; adems de algunas preguntas frecuentes,
con su respectiva respuesta, que se presentan al estudiar la Estadstica.
Estadstica 24
-
JUSTIFICACIN
El desarrollo cientfico del siglo XXI exige una formacin profesional ntegra,
que rena conocimientos, experiencia y expectativas, que permita la
utilizacin adecuada de los recursos y herramientas del mundo actual.
En la actualidad, las reas administrativas, contables y econmicas requieren
de un profesional con conocimientos bsicos de clculo, de tal forma que lo
lleven a incursionar en el campo investigativo y en la toma de decisiones,
para generar nuevos conocimientos a partir de la integracin de los
conceptos propios y de las diferentes reas de estudio, que lo hagan ms
competente en los retos del mundo moderno.
Estadstica 25
-
Estadstica 26
-
1. INTRODUCCIN Y OBTENCIN DE DATOS ESTADSTICOS
1.1. ESTADSTICA
1.1.1. Historia
Los comienzos de la estadstica pueden ser hallados en el antiguo Egipto,
cuyos faraones lograron recopilar, hacia el ao 3050 antes de Cristo, prolijos
datos relativos a la poblacin y la riqueza del pas. De acuerdo con el
historiador griego Herdoto, dicho registro de riqueza y poblacin se hizo con
el objetivo de preparar la construccin de las pirmides. En el mismo Egipto,
Ramss II hizo un censo de las tierras con el objeto de verificar un nuevo
reparto.
En el antiguo Israel, la Biblia da referencias, en el libro de los Nmeros, de
los datos estadsticos obtenidos en dos recuentos de la poblacin hebrea. El
rey David, por otra parte, orden a Joab, general del ejrcito, hacer un censo
de Israel con la finalidad de conocer el nmero de la poblacin.
Tambin los chinos efectuaron censos hace ms de cuarenta siglos. Los
griegos efectuaron censos peridicamente con fines tributarios, sociales
(divisin de tierras) y militares (clculo de recursos y hombres disponibles).
La investigacin histrica revela que se realizaron 69 censos para calcular
los impuestos, determinar los derechos de voto y ponderar la potencia
guerrera.
Pero fueron los romanos, maestros de la organizacin poltica, quienes mejor
supieron emplear los recursos de la estadstica. Cada cinco aos realizaban
un censo de la poblacin, y sus funcionarios pblicos tenan la obligacin de Estadstica 27
-
anotar nacimientos, defunciones y matrimonios, sin olvidar los recuentos
peridicos del ganado y de las riquezas contenidas en las tierras
conquistadas. Para el nacimiento de Cristo, suceda uno de estos
empadronamientos de la poblacin bajo la autoridad del imperio.
Durante los mil aos siguientes a la cada del imperio romano se realizaron
muy pocas operaciones estadsticas, con la notable excepcin de las
relaciones de tierras pertenecientes a la Iglesia, compiladas por Pipino el
Breve en el 758, y por Carlomagno en el 762 DC. Durante el siglo IX se
realizaron en Francia algunos censos parciales de siervos. En Inglaterra,
Guillermo el Conquistador recopil el Domesday Book o Libro del gran
catastro para el ao 1086, un documento de la propiedad, extensin y valor
de las tierras de Inglaterra. Esa obra fue el primer compendio estadstico de
Inglaterra.
Durante los siglos XV, XVI, y XVII, hombres como Leonardo de Vinci, Nicols
Coprnico, Galileo, Neper, William Harvey, Sir Francis Bacon y Ren
Descartes, hicieron grandes operaciones al mtodo cientfico, de tal forma
que cuando se crearon los Estados nacionales y surgi como fuerza el
comercio internacional exista ya un mtodo capaz de aplicarse a los datos
econmicos.
Para el ao 1532 empezaron a registrarse en Inglaterra las defunciones
debido al temor que Enrique VII tena por la peste. Ms o menos por la
misma poca, en Francia la ley exigi a los clrigos registrar los bautismos,
fallecimientos y matrimonios. Durante un brote de peste que apareci a fines
de la dcada de 1500, el gobierno ingls comenz a publicar estadsticas
semanales de los decesos. Esa costumbre continu muchos aos, y en 1632
estos Bills of Mortality (Cuentas de mortalidad) contenan los nacimientos y
fallecimientos por sexo. Estadstica 28
-
En 1662, el capitn John Graunt us documentos que abarcaban treinta aos
y efectu predicciones sobre el nmero de personas que moriran de varias
enfermedades y sobre las proporciones de nacimientos de varones y mujeres
que cabra esperar. El trabajo de Graunt, condensado en su obra Natural and
political observations... Made upon the bills of mortality (Observaciones
polticas y naturales... hechas a partir de las cuentas de mortalidad), fue un
esfuerzo innovador en el anlisis estadstico. Por el ao 1540, el alemn
Sebastin Muster realiz una compilacin estadstica de los recursos
nacionales, comprensiva de datos sobre organizacin poltica, instrucciones
sociales, comercio y podero militar.
Durante el siglo XVII aport indicaciones ms concretas de mtodos de
observacin y anlisis cuantitativo y ampli los campos de la inferencia y la
teora estadstica. Los eruditos del siglo XVII demostraron especial inters
por la estadstica demogrfica como resultado de la especulacin sobre si la
poblacin aumentaba, decreca o permaneca esttica.
En los tiempos modernos, tales mtodos fueron resucitados por algunos
reyes que necesitaban conocer las riquezas monetarias y el potencial
humano de sus respectivos pases. El primer empleo de los datos
estadsticos para fines ajenos a la poltica tuvo lugar en 1691 y estuvo a
cargo de Gaspar Neumann, un profesor alemn que viva en Breslau. Este
investigador se propuso destruir la antigua creencia popular de que en los
aos terminados en siete mora ms gente que en los restantes, y para
lograrlo hurg pacientemente en los archivos parroquiales de la ciudad.
Despus de revisar miles de partidas de defuncin pudo demostrar que en
tales aos no fallecan ms personas que en los dems. Los procedimientos Estadstica 29
-
de Neumann fueron conocidos por el astrnomo ingls Halley, descubridor
del cometa que lleva su nombre, quien los aplic al estudio de la vida
humana. Sus clculos sirvieron de base para las tablas de mortalidad que
hoy utilizan todas las compaas de seguros.
Durante el siglo XVII y principios del XVIII, matemticos como Bernoulli,
Francis Maseres, Lagrange y Laplace desarrollaron la teora de
probabilidades. No obstante, durante cierto tiempo, la teora de las
probabilidades limit su aplicacin a los juegos de azar y hasta el siglo XVIII
no comenz a aplicarse a los grandes problemas cientficos. Godofredo
Achenwall, profesor de la Universidad de Gotinga, acu en 1760 la palabra
estadstica, que extrajo del trmino italiano statista (estadista). Crea, y con
sobrada razn, que los datos de la nueva ciencia seran el aliado ms eficaz
del gobernante consciente. La raz remota de la palabra se halla, por otra
parte, en el trmino latino status, que significa estado o situacin. Esta
etimologa aumenta el valor intrnseco de la palabra, por cuanto la estadstica
revela el sentido cuantitativo de las ms variadas situaciones.
Jacques Qutelect es quien aplica las estadsticas a las ciencias sociales.
Este interpret la teora de la probabilidad para su uso en las ciencias
sociales y resolver la aplicacin del principio de promedios y de la
variabilidad a los fenmenos sociales. Qutelect fue el primero en realizar la
aplicacin prctica de todo el mtodo estadstico, entonces conocido, a las
diversas ramas de la ciencia. Entre tanto, en el perodo del 1800 al 1820 se
desarrollaron dos conceptos matemticos fundamentales para la teora
estadstica: la teora de los errores de observacin, aportada por Laplace y
Gauss; y la teora de los mnimos cuadrados desarrollada por Laplace,
Gauss y Legendre.
Estadstica 30
-
A finales del siglo XIX, Sir Francis Gaston ide el mtodo conocido por
Correlacin, que tena por objeto medir la influencia relativa de los factores
sobre las variables. De aqu parti el desarrollo del coeficiente de correlacin
creado por Karl Pearson y otros cultivadores de la ciencia biomtrica como J.
Pease Norton, R. H. Hooker y G. Udny Yule, que efectuaron amplios estudios
sobre la medida de las relaciones.
Los progresos ms recientes en el campo de la Estadstica se refieren al
ulterior desarrollo del clculo de probabilidades; particularmente en la rama
denominada indeterminismo o relatividad, se ha demostrado que el
determinismo fue reconocido en la Fsica como resultado de las
investigaciones atmicas y que este principio se juzga aplicable tanto a las
ciencias sociales como a las fsicas.
1.1.2. Definicin
La Estadstica es la ciencia cuyo objetivo es reunir una informacin
cuantitativa concerniente a individuos, grupos, series de hechos, etc., y
deducir de ello, gracias al anlisis de estos datos, significados precisos o
previsiones para el futuro.
La estadstica, en general, es la ciencia que trata de la recopilacin,
organizacin presentacin, anlisis e interpretacin de datos numricos con
el fin de realizar una toma de decisin ms efectiva.
Los estudiantes confunden comnmente los dems trminos asociados con
las estadsticas, una confusin que es conveniente aclarar debido a que esta
palabra tiene tres significados: la palabra estadstica, en primer trmino, se
usa para referirse a la informacin estadstica; tambin se utiliza para
Estadstica 31
-
referirse al conjunto de tcnicas y mtodos que se utilizan para analizar la
informacin estadstica; y el trmino estadstico, en singular y en masculino,
se refiere a una medida derivada de una muestra.
1.1.3. Divisin
La Estadstica, para su mejor estudio, se ha dividido en dos grandes ramas:
la Estadstica Descriptiva y la Inferencial.
Estadstica Descriptiva: consiste sobre todo en la presentacin de datos en
forma de tablas y grficas. Esta comprende cualquier actividad relacionada
con los datos y est diseada para resumir o describir los mismos sin
factores pertinentes adicionales, esto es, sin intentar inferir nada que vaya
ms all de los datos como tales.
Estadstica Inferencial: se deriva de muestras, de observaciones hechas
slo acerca de una parte de un conjunto numeroso de elementos y esto
implica que su anlisis requiere de generalizaciones que van ms all de los
datos. Como consecuencia, la caracterstica ms importante del reciente
crecimiento de la estadstica ha sido un cambio en el nfasis de los mtodos,
los cuales son utilizados para hacer generalizaciones. La Estadstica
Inferencial investiga o analiza una poblacin partiendo de una muestra
tomada.
1.2. CONCEPTOS GENERALES
1.2.1. Unidad de investigacin
Estadstica 32
-
La unidad de investigacin es el elemento a quien va dirigida la investigacin,
el cual puede ser una persona, una familia, una vivienda, un estudiante, una
universidad, un empleado, una organizacin, etc. La unidad debe ser
adecuada al tipo de investigacin y debe poseer caractersticas claras y
entendibles que permitan mediciones y comparaciones.
1.2.2. Poblacin
Se entiende por poblacin o universo un conjunto grande de elementos o
unidades de investigacin, de los cuales se estudia una o varias
caractersticas comunes. Por ejemplo, los estudiantes de una universidad,
las universidades de una ciudad, los artculos producidos en una fbrica, las
empresas de un pas, los lanzamientos de una moneda, etc.
Segn el tamao, la poblacin puede clasificarse en finita e infinita.
Se considera una poblacin finita cuando tiene un nmero determinado de
elementos, es decir, se conoce el tamao de la poblacin. Por ejemplo, los
habitantes de un pas, los estudiantes de una universidad, los empleados de
una empresa, los asociados a una cooperativa, etc., mientras que la
poblacin infinita tiene un nmero indeterminado de elementos, por ejemplo,
los cuerpos que caen, los lanzamientos de un dado, etc.
Esta clasificacin slo existe en la teora, porque en la prctica existen
poblaciones con un nmero enormemente grande de elementos, las cuales
son clasificadas como poblaciones infinitas.
Cuando la poblacin est compuesta por un nmero relativamente alto de
elementos, por razones de costo, tiempo y recursos tcnicos que acarreara Estadstica 33
-
la observacin exhaustiva de cada uno de los elementos de la poblacin, es
necesario recurrir a la seleccin de una muestra representativa de la
poblacin.
1.2.3. Muestra
La muestra es un conjunto de unidades pertenecientes a la poblacin,
seleccionadas adecuadamente; es decir, es una parte de la poblacin o
universo. Por ejemplo, de los 150 empleados de una empresa que
constituyen el universo o poblacin en estudio, al azar se pueden seleccionar
30 empleados, que constituyen la muestra.
Al emplear una muestra se busca lograr que al observar una porcin
reducida de unidades, se puedan sacar conclusiones semejantes a las que
se obtendran si se estudiara el total de la poblacin o universo.
Lo ideal es que el nmero de elementos o unidades de observacin que
constituyen la muestra sea igual al de la poblacin, para evitar los errores al
utilizar muestras no representativas. Sin embargo, por la limitacin de
recursos, es preciso acudir al muestreo y asumir los posibles errores que
puedan generarse. Cuando el tamao de la muestra es igual al de la
poblacin, el trabajo realizado se denomina censo.
1.2.4. Parmetros y estadgrafos
Los parmetros son medidas que describen numricamente una
caracterstica de la poblacin, tales como: la media aritmtica, la varianza, el
coeficiente de variacin, etc. Una poblacin puede tener varias
caractersticas y, por lo tanto, varios parmetros.Estadstica 34
-
Los estadgrafos o estadsticas son medidas que describen numricamente
una caracterstica de la muestra; as como los parmetros lo hacen en una
poblacin, igual los estadgrafos lo hacen para la muestra, tales como: la
media aritmtica, la varianza, el coeficiente de variacin, etc.
1.2.5. Variables
Una variable es cualquier caracterstica o propiedad de una poblacin o de
una muestra, susceptible de asumir distintos valores o modalidades. Por
ejemplo: la altura de cada uno de los estudiantes de un curso puede tomar
distintos valores: sta puede ser 1.65 m o 1.72 m, o cualquier otro valor, as
la altura es una variable. Esto no significa que la altura de un estudiante
puede variar, sino que la altura puede variar de un estudiante a otro.
El color tambin es una variable. Si se toma, por ejemplo, el color de las
camisetas de los estudiantes, esta cualidad puede variar de una camiseta a
otra, ya que puede haber camisetas blancas, negras, rojas, azules, etc.
Estos colores son, en este caso, los distintos atributos o modalidades que
puede asumir la variable en mencin.
Las caractersticas de los objetos pueden ser o no ser susceptibles de
medida; en el primer caso (la altura de los estudiantes) se tiene una
caracterstica cuantitativa, y en el segundo (el color de la camiseta) una
caracterstica cualitativa. Por esta razn, las variables se clasifican en
cualitativas y cuantitativas.
Estadstica 35
-
Variables cualitativas
Las variables cualitativas son las que no permiten construir una serie
numrica definida; los atributos o caractersticas que toman son distintas
modalidades observadas cualitativamente. Son variables cualitativas el
color, la profesin, el estado civil, etc.
Para designar variables cualitativas, generalmente se utilizan las primeras
letras del alfabeto en maysculas (A, B, C,...) y para designar el atributo se
toman las letras minsculas acompaadas por subndices. Por ejemplo, la
variable profesin en una empresa puede ser representada por la letra A y
sus posibles caractersticas: administrador, economista, contador, ingeniero,
por a1, a2 , a3 ,a4, respectivamente, en este caso,
a1 = administrador
a2 = economista
a3 = contador
a4 = ingeniero
Variables cuantitativas
Las variables cuantitativas son aquellas que permiten una escala numrica
de medicin, toman distintos valores observados cuantitativamente mediante
una medida y una escala de medidas. Son variables cuantitativas la altura,
el peso, el nmero de hijos de una familia, el salario, el nmero de artculos
producidos en una semana.
Para designar las variables cuantitativas se utilizan las ltimas letras del
alfabeto en maysculas (... X, Y, Z). Por ejemplo, la variable altura de cinco Estadstica 36
-
estudiantes se representa por X y las alturas 1.65 m, 1.67 m, 1.68 m, 1.70 m
y 1.72 m, se representan por x1, x2 , x3 , x4 y x5 , respectivamente. En este
caso,
x1 = 1.65 m
x2 = 1.67 m
x3 = 1.68 m
x4 = 1.70 m
x5 = 1.72 m
Las variables cuantitativas pueden clasificarse en cuantitativas continuas y
cuantitativas discretas.
Una variable es cuantitativa continua si entre dos valores consecutivos
puede tomar infinito nmero de valores; es decir, entre uno y otro valor de la
variable existen infinitas posibilidades intermedias; son variables continuas el
peso, la temperatura, el tiempo, el salario, etc.
Por ejemplo, el peso es una variable cuantitativa continua porque entre los
valores de 65 Kg y 66 Kg existen infinitos valores, stos pueden ser 65.9 Kg,
65.99 Kg, 65.999 Kg, etc.
Una variable es cuantitativa discreta si entre dos valores consecutivos no
puede asumir otro valor; en este caso la variable no toma valores decimales.
Por ejemplo, el nmero de empleados de una empresa, el nmero de
artculos producidos, el nmero de empresas de la competencia, etc. En
estos casos se habla de un cierto valor como 10, 11, 12 o cualquier otro
nmero entero, porque es absurdo decir, por ejemplo, que una empresa tiene
11.8 empleados.Estadstica 37
-
1.2.6. Escalas de medicin
Una escala es un sistema para asignar valores numricos a ciertas
caractersticas o rasgos mensurables. Existen varios mtodos para ordenar
datos; en la mayora de los casos, las tcnicas de medicin se pueden
reducir a cuatro tipos de escalas: nominal, ordinal, de intervalos y de razn.
Escala nominal
La escala nominal se aplica a la variable cualitativa, la cual presenta
diferentes categoras o modalidades, cada una de las cuales recibe un
nombre; de ah la denominacin de esta escala. A las variables con tales
caractersticas tambin se les denomina atributos. Las categoras pueden
estar preconstruidas y ser de aceptacin general, o puede definirlas el
investigador de acuerdo con sus intereses, pero en cualquier caso deben ser
exhaustivas y mutuamente excluyentes, esto es, que exista una y slo una
categora para cada uno de los elementos de la poblacin.
Ejemplos:
Color = {blanco, rojo, azul, verde, violeta, otro}
Tipo de artculo = {normal, imperfecto}
Cargo = {gerente, coordinador, auxiliar}
Las nicas estadsticas bsicas que se pueden obtener a partir de estas
variables son la frecuencia y la moda y, por tanto, los mtodos estadsticos
disponibles son aquellos que se basan en las mismas. En el caso de una
sola variable, se pueden obtener tablas de frecuencias y diagramas de Estadstica 38
-
barras o de sectores; si se tienen dos variables se puede realizar un anlisis
de correspondencia o construir tablas de contingencia.
Escala ordinal
Cada uno de los niveles de esta escala tiene un rango, lo que permite
establecer comparaciones de orden entre los mismos (mayor que, menor
que). No obstante, no es adecuado, en general, suponer que la distancia
entre un nivel y sus niveles adyacentes superior e inferior es la misma.
Ejemplos:
Estado sanitario = {sano, ligeramente afectado, enfermo, muy enfermo,
muerto}
Estrato socioeconmico = {1, 2, 3, 4, 5, 6}
Produccin = {alta, media, baja}
Las variables medidas en esta escala contienen ms informacin que
aquellas medidas en escala nominal; por tanto, se podran aplicar los mismos
mtodos y anlisis, prescindiendo de la informacin de orden.
Adicionalmente, se pueden calcular la mediana y la desviacin media.
Aunque es posible reemplazar cada una de los niveles por un nmero
(etiqueta), ste no aporta informacin adicional y las relaciones que se
pueden establecer siguen siendo las mismas. As, se podra hacer
corresponder los nmeros del 1 al 5 con cada uno de los niveles de estado
fitosanitario, pero lo nico que se podra decir en cuanto a la sanidad es que
1 > 2 > 3 > 4 > 5. En general, ser inadecuada la utilizacin de estos
Estadstica 39
-
nmeros para efectuar operaciones o deducciones matemticas de otro tipo,
como la obtencin del estado fitosanitario promedio, por ejemplo.
Escala de intervalo
Es una escala que contiene ms informacin que las anteriores, pues
adems de que existe un orden entre los diferentes niveles, la distancia entre
cualquier par de niveles adyacentes es la misma, lo que implica el uso de
una distancia unitaria de referencia. Esta caracterstica permite establecer
relaciones entre cualquier par de intervalos en la escala; as, es posible
afirmar que la distancia que hay entre 5 y 6 es la misma que hay entre 10 y
11.
Esta escala hace uso de un punto cero que se asigna arbitrariamente en
cada sistema y que no implica ausencia de la caracterstica medida. Este
hecho hace imposible establecer comparaciones de razn. As, para una
caracterstica medida en esta escala, sera incorrecto afirmar que 5 es la
mitad de 10.
Un ejemplo tpico es la escala en que se mide la temperatura; para su
medicin se pueden utilizar diferentes sistemas: el Celsius, el Fahrenheit1 u
otro. Dentro de cualquiera de estos sistemas es posible afirmar que la
distancia entre dos divisiones cualesquiera es la misma, sin importar el lugar
de la escala. No obstante, en la siguiente tabla se observa cmo una
relacin entre dos temperaturas cambia dependiendo del sistema, la cual
explica por qu no puede afirmarse que 5 sea la mitad de 10.
Celsius Fahrenheit1 (temperatura) F = (9/5) * (temperatura) C + 32
Estadstica 40
-
5 C 41 F10 C 50 F
Ntese que cualquier escala ordinal que se construya cuidando que la
distancia entre niveles sea la misma constituir, en realidad, una escala de
intervalos.
Cuando las variables estn medidas en esta escala, se pueden calcular
todos los estadsticos, y es posible usar cualesquiera de los mtodos
estadsticos clsicos, siempre que se cumplan los supuestos especficos de
los mismos.
Escala de razones
Es la escala de medicin que tiene ms informacin. Posee un punto cero
verdadero que indica ausencia de la caracterstica, lo que permite realizar
comparaciones no slo de intervalo, sino tambin de razones, sin importar el
sistema utilizado.
As, por ejemplo, un objeto que mida 5,08 cm tendr el doble de longitud con
relacin a un objeto que mida 2,54 cm, cualquiera que sea el sistema en que
se registre la longitud, tal como se muestra en la siguiente tabla2.
Centmetros Pulgadas2,54 15,08 2
Como ejemplo de variables medidas en escala de razones, estn los conteos
de cualquier caracterstica, pesos y longitudes, ente otras.
2 1 pulgada = 2,54 centmetrosEstadstica 41
-
Cuando se tiene una variable medida en escala de razones, se pueden
calcular todos los estadsticos y es posible utilizar cualesquiera de los
mtodos estadsticos clsicos, siempre que se cumplan los supuestos
especficos de los mismos.
Las escalas de medicin que contienen poca informacin se denominan
dbiles, y los mtodos estadsticos que se pueden aplicar sobre las mismas
son, por lo general, ms restringidos. Las escalas de medicin con mayor
informacin se denominan escalas fuertes y pueden analizarse mediante los
mtodos diseados especficamente para su anlisis o mediante
cualesquiera de los mtodos diseados para trabajar sobre variables
medidas en una escala ms dbil, simplemente prescindiendo de la
informacin adicional.
Una clasificacin ms amplia llama variables cualitativas a aquellas medidas
en escala nominal, y cuantitativas a las medidas en escala de razones o de
intervalo. Las variables medidas en escala ordinal forman un puente entre
ambas.
1.3. MUESTREO
Los mtodos estadsticos proponen diferentes tipos de muestreo, aunque en
general pueden dividirse en dos grandes grupos: mtodos de muestreo
probabilsticos y mtodos de muestreo no probabilsticos.
1.3.1. Mtodos de muestreo probabilsticos
Estadstica 42
-
Los mtodos de muestreo probabilstico son aquellos que se basan en el
principio de equiprobabilidad. Es decir, aquellos en los que todos los
individuos tienen la misma probabilidad de ser elegidos para formar parte de
una muestra y, consiguientemente, todas las posibles muestras de tamao n
tienen la misma probabilidad de ser elegidas. Slo estos mtodos de
muestreo probabilstico aseguran la representatividad de la muestra extrada
y son, por tanto, los ms recomendables. Dentro de los mtodos de
muestreo probabilstico se encuentran los siguientes tipos:
Muestreo aleatorio simple
El procedimiento empleado es el siguiente: 1) se asigna un nmero a cada
individuo de la poblacin, y 2) a travs de algn medio mecnico (bolas
dentro de una bolsa, tablas de nmeros aleatorios, nmeros aleatorios
generados con una calculadora u ordenador, etc.) se eligen tantos sujetos
como sea necesario para completar el tamao de muestra requerido.
Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad
prctica cuando la poblacin que se est manejando es muy grande.
Muestreo aleatorio sistemtico
Este procedimiento exige, como el anterior, numerar todos los elementos de
la poblacin, pero en lugar de extraer n nmeros aleatorios slo se extrae
uno. Se parte de ese nmero aleatorio i, que es un nmero elegido al azar, y
los elementos que integran la muestra son los que ocupan los lugares i, i+k,
i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k, siendo k el
resultado de dividir el tamao de la poblacin entre el tamao de la muestra:
Estadstica 43
-
k=N/n. El nmero i que se emplea como punto de partida ser un nmero al
azar entre 1 y k.
El riesgo se este tipo de muestreo est en los casos en que se dan
periodicidades en la poblacin ya que al elegir a los miembros de la muestra
con una periodicidad constante (k) se puede introducir una homogeneidad
que no se da en la poblacin. Supngase que se est seleccionando una
muestra sobre listas de 10 individuos en los que los 5 primeros son varones y
los 5 ltimos mujeres; si se emplea un muestreo aleatorio sistemtico con
k=10 siempre sern seleccionados o slo hombres o slo mujeres; no podra
haber una representacin de los dos sexos.
Muestreo aleatorio estratificado
Trata de obviar las dificultades que presentan los anteriores, ya que
simplifica los procesos y suele reducir el error muestral para un tamao dado
de la muestra. Consiste en considerar categoras tpicas diferentes entre s
(estratos) que poseen gran homogeneidad respecto a alguna caracterstica
(se puede estratificar, por ejemplo, segn la profesin, el municipio de
residencia, el sexo, el estado civil, etc.). Lo que se pretende con este tipo de
muestreo es asegurarse de que todos los estratos de inters estarn
representados adecuadamente en la muestra. Cada estrato funciona
independientemente, pudiendo aplicarse dentro de ellos el muestreo
aleatorio simple o el estratificado para elegir los elementos concretos que
formarn parte de la muestra. En ocasiones, las dificultades que plantea son
demasiado grandes, pues exige un conocimiento detallado de la poblacin
(tamao geogrfico, sexos, edades...).
Estadstica 44
-
La distribucin de la muestra en funcin de los diferentes estratos se
denomina afijacin, y puede ser de diferentes tipos:
Afijacin simple: a cada estrato le corresponde igual nmero de elementos
muestrales.
Afijacin proporcional: la distribucin se hace de acuerdo con el peso
(tamao) de la poblacin en cada estrato.
Afijacin ptima: se tiene en cuenta la previsible dispersin de los
resultados, de modo que se consideran la proporcin y la desviacin tpica.
Tiene poca aplicacin ya que no se suele conocer la desviacin.
Por ejemplo, se est interesado en estudiar el grado de aceptacin que la
implantacin de la reforma educativa ha tenido entre los padres de un
municipio. A tal efecto se seleccion una muestra de 600 padres de familia.
Se conoce por los datos del Ministerio de Educacin que de los 10.000 nios
escolarizados en la bsica, 7.000 acuden a colegios pblicos y 3.000 a
colegios privados. Como el inters es que en la muestra estn representados
todos los tipos de colegio, se realiza un muestreo estratificado empleando
como variable de estratificacin el tipo de colegio.
Si se emplea una afijacin simple seran 300 nios de cada tipo de centro,
pero en este caso parece ms razonable utilizar una afijacin proporcional
pues hay bastante diferencia en el tamao de los estratos. Por consiguiente,
se calcula la proporcin para cada uno de los estratos respecto de la
poblacin, para poder reflejarlo en la muestra.
Estadstica 45
-
Colegios pblicos: 7.000/10.000 = 0.70
Colegios privados: 3.000/10.000 = 0.30
Para conocer el tamao de cada estrato en la muestra se multiplica la
proporcin por el tamao muestral.
Colegios pblicos: 0.70x600 = 420 padres de familia
Colegios privados: 0.30x600 = 180 padres de familia
Muestreo aleatorio por conglomerados
Los mtodos presentados hasta ahora estn pensados para seleccionar
directamente los elementos de la poblacin, es decir, que las unidades
muestrales son los elementos de la poblacin. En el muestreo por
conglomerados la unidad muestral es un grupo de elementos de la poblacin
que forman una unidad, a la que se denomina conglomerado. Las unidades
hospitalarias, los departamentos universitarios, una caja de determinado
producto, etc. son conglomerados naturales. En otras ocasiones, se pueden
utilizar conglomerados no naturales como, por ejemplo, las urnas electorales.
Cuando los conglomerados son reas geogrficas suele hablarse de
"muestreo por reas".
El muestreo por conglomerados consiste en seleccionar aleatoriamente un
cierto nmero de conglomerados (el necesario para alcanzar el tamao
muestral establecido) y en investigar despus todos los elementos
pertenecientes a los conglomerados elegidos.
Por ejemplo, en una investigacin se trata de conocer el grado de
satisfaccin laboral de los empleados de una cadena de almacenes; se toma Estadstica 46
-
una muestra de 700 empleados. Ante la dificultad de acceder individualmente
a estos empleados, se decide hacer una muestra por conglomerados.
Sabiendo que el nmero de empleados por almacn es aproximadamente de
35, los pasos a seguir seran:
Recoger un listado de todos los almacenes.
Asignar un nmero a cada uno de ellos.
Elegir por muestreo aleatorio simple o sistemtico los 20 almacenes
(700/35 = 20) que proporcionarn los 700 empleados que se
necesitan.
Finalmente, ante lo compleja que puede llegar a ser la situacin real de
muestreo es muy comn emplear lo que se denomina muestreo polietpico.
Este tipo de muestreo se caracteriza por operar en sucesivas etapas,
empleando en cada una de ellas el mtodo de muestreo probabilstico ms
adecuado.
1.3.2. Mtodos de muestreo no probabilsticos
A veces, para estudios exploratorios, el muestreo probabilstico resulta
excesivamente costoso y se acude a mtodos no probabilsticos, aun siendo
conscientes de que no sirven para realizar generalizaciones, pues no se
tiene certeza de que la muestra extrada sea representativa, ya que no todos
los sujetos de la poblacin tienen la misma probabilidad de ser elegidos. En
general, se selecciona a los sujetos siguiendo determinados criterios
procurando que la muestra sea representativa.
Estadstica 47
-
Muestreo por cuotas
Tambin denominado en ocasiones "accidental". Se asienta generalmente
sobre la base de un buen conocimiento de los estratos de la poblacin y/o de
los individuos ms "representativos" o "adecuados" para los fines de la
investigacin. Mantiene, por tanto, semejanzas con el muestreo aleatorio
estratificado, pero no tiene el carcter de aleatoriedad de aqul.
En este tipo de muestreo se fijan unas "cuotas" que consisten en un nmero
de individuos que renen determinadas condiciones, por ejemplo: 20
individuos de 25 a 40 aos, de sexo femenino y residentes en una misma
ciudad. Una vez determinada la cuota, se eligen los primeros que se
encuentre que cumplan esas caractersticas. Este mtodo se utiliza mucho
en las encuestas de opinin.
Por ejemplo, una universidad desea estudiar la incidencia de las drogas en la
adolescencia. Lo que debera hacer sera: conocer por los informes del
Estado cules son los centros educativos ms afectados por el problema,
fijar un nmero de sujetos a entrevistar, proporcional a cada uno de los
estratos (cuotas) y, finalmente, dejar en manos de los responsables del
trabajo de campo a qu sujetos concretos se deber entrevistar.
Muestreo opintico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras "representativas" mediante la inclusin en la muestra de grupos
supuestamente tpicos. Es muy frecuente su utilizacin en sondeos
preelectorales de zonas que en anteriores votaciones han marcado
tendencias de voto. Estadstica 48
-
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacin. El caso ms frecuente de
este procedimiento es el utilizar como muestra los individuos a los que se
tiene fcil acceso (los profesores de universidad emplean con mucha
frecuencia a sus propios alumnos). Un caso particular es el de los
voluntarios.
Bola de nieve
Se localiza a algunos individuos, los cuales conducen a otros, y stos a
otros, y as hasta conseguir una muestra suficiente. Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones "marginales",
delincuentes, sectas, determinados tipos de enfermos, egresados de una
institucin, etc.
1.3.3. Evaluacin del valor de una encuesta
Cotidianamente se oye o se lee sobre resultados de encuestas en los
diferentes medios de comunicacin. Es evidente que los avances
tecnolgicos en las comunicaciones han provocado la proliferacin de
investigaciones por medio de encuestas; sin embargo, no todas son
aceptables, significativas o importantes.
Para evitar encuestas carentes de objetividad o credibilidad, debe evaluarse
con sentido crtico todo lo que se lee y escucha, adems de examinarse el
valor de la encuesta, evaluando los siguientes aspectos:Estadstica 49
-
Propsito de la encuesta: por qu y para quin se realiza. Un resultado
de opinin o una encuesta realizada para satisfacer la curiosidad
pertenece a la esfera de la diversin. Su resultado es un fin en s mismo,
no un medio para lograr un fin. Debe existir escepticismo ante tales
encuestas porque el resultado no tiene una aplicacin posterior.
Determinar si la encuesta est basada en una muestra probabilstica o no
probabilstica: el nico medio disponible para hacer inferencias
estadsticas correctas a partir de una muestra es el uso de un muestreo
probabilstico. Las encuestas que emplean mtodos de muestreo no
probabilstico estn sujetas a errores significativos, quiz no
intencionales, que pueden generar resultados sin sentido.
1.3.4. Errores en las encuestas
Aun cuando en las encuestas se utilizan mtodos de muestreo probabilstico,
estn sujetas a errores potenciales, los cuales se describen a continuacin:
Error de cobertura o sesgo en la seleccin
La clave para una seleccin apropiada en la muestra es un marco de
poblacin adecuado o una lista actualizada de todos los elementos que
participarn en el muestreo. El error de cobertura ocurre si se excluyen
ciertos elementos de la lista de poblacin, de manera que no tienen
oportunidad de ser seleccionados en la muestra. El error de cobertura
conduce a un sesgo de seleccin. Si el listado es inadecuado porque no se
incluyeron algunos elementos de la poblacin, cualquier muestra
Estadstica 50
-
probabilstica aleatoria proporcionar una estimacin de las caractersticas
del marco, no de la poblacin real.
Error o sesgo de no respuesta
No todas las personas estn dispuestas a contestar una encuesta. El error
de no respuesta surge del fracaso al recopilar datos de todos los sujetos de
la muestra y el resultado es un sesgo de no respuesta. Como en general no
se puede suponer que las personas que no responden son semejantes a
aquellas que s responden, es importante realizar un seguimiento a las no
respuestas despus de un periodo determinado. Deben hacerse varios
intentos, ya sea por correo o por telfono, para convencerlos de que
diligencien la encuesta. Con base en estos resultados, las estimaciones
obtenidas con las respuestas iniciales se combinan con las estimaciones
obtenidas con el seguimiento, de manera que las inferencias hechas a partir
de la encuesta sean vlidas.
Error de muestreo
El error de muestreo se presenta cuando se encuesta una muestra y no la
poblacin, es decir, cuando no se aplica un censo. Aun cuando no se puede
evitar este error, s se puede controlar; una forma importante de controlarlo
es seleccionar un mtodo o un diseo adecuado de muestreo. El error de
muestreo muestra la heterogeneidad o las diferencias aleatorias de una
muestra a otra, segn la probabilidad de que elementos especficos sean
seleccionados en unas muestras determinadas.
Error de medicin
Estadstica 51
-
Se refiere a la falta de precisin en las respuestas registradas, debido a fallas
en la redaccin del enunciado de las preguntas, la influencia del
entrevistador en la persona que responde, o por el esfuerzo que realiza la
persona que responde.
1.3.5. Aspectos ticos del muestreo
En la actualidad se existe una tendencia a la proliferacin de investigaciones
que se apoyan en encuestas; no todas son buenas, significativas o
importantes, y no todas son ticas. Debe intentarse distinguir entre un
diseo de encuesta deficiente y un diseo carente de tica.
Las consideraciones ticas surgen con relacin a cuatro tipos de errores
potenciales que pueden ocurrir cuando se disean encuestas que utilizan
muestras probabilsticas aleatorias: error de cobertura o sesgo de seleccin,
error o sesgo de no respuesta, error de muestreo y error de medicin. El
error de cobertura o sesgo de seleccin se convierte en un problema tico,
slo si se excluyen a propsito grupos especficos de individuos del marco de
poblacin, para obtener resultados sesgados, que indican una posicin ms
favorable para los intereses del investigador.
De igual manera, el error o sesgo de no respuesta se convierte en un
problema tico, slo si es menos probable que grupos o individuos
especficos respondan a una encuesta, y si el investigador la disea a
propsito con el fin de excluir grupos o elementos.
El error de muestreo se convierte en un problema tico, slo cuando los
resultados se presentan, a propsito, sin referencia al tamao de muestra o
Estadstica 52
-
al margen de error, de modo que el investigador puede promover un punto
de vista que de otra manera sera insignificante.
El error de medicin se convierte en un problema tico en cualquiera de las
siguientes situaciones:
Un investigador puede elegir preguntas orientadas que guan las
respuestas hacia una direccin especfica.
Un investigador, mediante actitudes y tono de voz, puede crear un efecto
deliberado de halo o puede guiar las respuestas en cierta direccin.
Alguien que responde, pero no est de acuerdo con la encuesta, puede
proporcionar informacin falsa a propsito.
Estadstica 53
-
2. ORDENACIN DE DATOS ESTADSTICOSEstadstica 54
-
En los datos obtenidos en encuestas, experimentos o mediante cualquier
instrumento de medida, por ser numerosos, se dificulta su interpretacin, a
menos que se ordenen y clasifiquen en forma conveniente. Por lo tanto, se
deben agrupar los datos y presentarlos en forma de tablas.
2.1. TABULACIN DE DATOS
La tabulacin de datos consiste en tomar los distintos valores o atributos que
toma la variable y colocarlos en columna, de acuerdo con algn criterio de
ordenacin, y al frente se coloca el nmero de veces que aparece el valor o
atributo, o sea, la frecuencia.
Para la tabulacin de datos correspondientes a variables cualitativas se
puede hacer de acuerdo con el orden cronolgico, con el orden alfabtico o
en forma convencional.
Por ejemplo, una Cooperativa de Trabajo Asociado Epsilon desea conocer el
nivel de escolaridad de sus asociados y encuentra la siguiente informacin: 5
profesionales, 15 tcnicos, 20 bachilleres y 10 con bsica primaria.
Ordenando los niveles de escolaridad en forma convencional se obtiene la
tabla 1.
Estadstica 55
-
Tabla 1. Nivel de escolaridad de los asociados de la Cooperativa de
Trabajo Asociado Epsilon
NIVEL DE ESCOLARIDAD TABULACIN FRECUENCIAProfesional 5Tcnico 15Bachiller
20
Bsica primaria 10Fuente: Datos hipotticos
Para la clasificacin de datos correspondientes a variables cuantitativas se
utilizan escalas numricas y se pueden colocar de forma creciente o
decreciente.
Por ejemplo, se seleccionan diez asociados de la Cooperativa de Trabajo
Asociado Epsilon y se les consulta por el nmero de hijos que poseen en el
momento, obteniendo los siguientes datos: 2, 3, 1, 1, 0, 2, 4, 3, 2, 2.
Ordenando en forma creciente se obtiene la tabla 2.
Tabla 2. Nmero de hijos de los asociados de la Cooperativa de Trabajo
Asociado Epsilon
NMERO DE HIJOS TABULACIN FRECUENCIA0 11 22 43 24 1
Fuente: Datos hipotticos
En la tabla 2 se ha ordenado en forma creciente el nmero de hijos de los
asociados, pero cuando los datos son numerosos o el recorrido de la variable
es largo, este procedimiento no es prctico y, por lo tanto, se deben formar
Estadstica 56
-
grupos o intervalos de clase, mediante el siguiente procedimiento: rango o
recorrido, amplitud del rango, nmero de clases, amplitud del intervalo de
clase, lmites de cada clase y tabulacin.
2.1.1. Rango o recorrido (R)
El rango o recorrido (R) de una variable es el campo de variacin numrica
de dicha variable, es decir, el intervalo entre el menor valor y el mayor valor
que toma la variable. Se representa como:
Donde, R: rango o recorrido.
Li: lmite inferior (menor valor de la variable).
Ls: lmite superior (mayor valor de la variable).
Por ejemplo, un grupo de expertos en auditaje analiza el tiempo que tarda
(en minutos) en realizar la auditora de un proceso similar en diferentes
empresas. Los datos se presentan en la siguiente tabla:
Tabla 3. Tiempo que tarda (en minutos) un grupo de expertos en auditar
un procesoEstadstica 57
R = [ Li , Ls ]
-
Auditor Tiempo
(min)
Auditor Tiempo
(min)
Auditor Tiempo
(min)
Auditor Tiempo
(min)
Auditor Tiempo
(min)Aud. 1 70 Aud. 11 47 Aud. 21 57 Aud. 31 52 Aud.41 51Aud. 2 71 Aud. 12 68 Aud. 22 55 Aud. 32 63 Aud.42 50Aud. 3 62 Aud. 13 60 Aud. 23 55 Aud. 33 65 Aud.43 60Aud. 4 63 Aud. 14 54 Aud. 24 57 Aud. 34 50 Aud.44 56Aud. 5 67 Aud. 15 63 Aud. 25 59 Aud. 35 53 Aud.45 67Aud. 6 65 Aud. 16 60 Aud. 26 74 Aud. 36 59 Aud.46 59Aud. 7 74 Aud. 17 69 Aud. 27 56 Aud. 37 45 Aud.47 68Aud. 8 62 Aud. 18 54 Aud. 28 59 Aud. 38 72 Aud.48 61Aud. 9 65 Aud. 19 73 Aud. 29 71 Aud. 39 64 Aud.49 51Aud. 10 56 Aud. 20 55 Aud. 30 50 Aud. 40 69 Aud.50 64Fuente: Datos hipotticos
En la tabla 3 el valor mayor es 74 minutos y, el menor, 45 minutos, por lo
tanto:
Li = 45 minutos, Ls = 74 minutos y R = [45, 74]
Lmites reales: como los tiempos se registran con aproximacin a 1 minuto,
el lmite inferior, 45 minutos, incluye el valor 44.6 minutos; por lo tanto, el
valor real del lmite inferior es 44.5 minutos; y el lmite superior, 74 minutos,
incluye el valor 74.5 minutos; luego, el lmite real superior es 74.5 minutos, y
el recorrido real en este caso es:
R = [44.5, 74.5]
2.1.2. Amplitud del rango (AR)
La amplitud del rango de una variable se determina hallando la diferencia
entre el lmite superior real y el lmite inferior real.
Estadstica 58
AR = Ls - Li
-
Para el ejemplo de la tabla 3 la amplitud del rango es:
AR = 74.5 minutos 44.5 minutos = 30 minutos
2.1.3. Nmero de clases (m)
El nmero de clases puede obtenerse de forma convencional, teniendo en
cuenta que no debe ser menor a 5 ni mayor de 20 clases. Sin embargo,
puede obtenerse por medio de la frmula de Sturges, la cual es:
Donde n es el nmero total de datos.
Para el ejemplo de la tabla 3 el nmero de intervalos es:
m = 1 + 3.3 x log (50)
m = 1 + 3.3 x 1.69
m = 1 + 5.6
m = 6.6
En este caso se pueden tomar 6 7 intervalos.
2.1.4. Amplitud del intervalo de clase (C)
El valor del intervalo de clase no es necesario que sea igual para todos los
intervalos; sin embargo, para fines de simplificacin y funcionalidad es Estadstica 59
m = 1 + 3.3 x log
-
conveniente que todas las clases tengan la misma amplitud. Para obtenerla,
se divide la amplitud del rango entre el nmero m de clases que se considere
ms adecuado, teniendo en cuenta que C debe ser un nmero exacto. En
consecuencia,
Para el ejemplo de la tabla 3 la amplitud del intervalo podra ser:
Si m = 6, entonces C = 30/6, C = 5 minutos
Si m = 7, entonces C = 30/7, C = 4.285714286... minutos
Entre estos dos valores, el ms recomendable es C = 5, ya que es exacto.
Por lo tanto, se deben construir 6 intervalos con una amplitud de 5 minutos.
Esto es m = 6 y C = 5.
Cuando la amplitud del intervalo (AR) no es divisible por un nmero entero,
sta se puede incrementar hasta hacerla divisible; este incremento debe ser
distribuido proporcionalmente, sumando la mitad al lmite superior y restando
la otra mitad al lmite inferior.
2.1.5. Lmites de las clases
Cada clase tiene un lmite inferior il y un lmite superior sl ; el lmite inferior
de la clase ms baja o clase uno es igual al lmite inferior del rango L i, y el
lmite superior de esta clase es igual al lmite inferior, ms la amplitud del
intervalo (C). El lmite inferior de la clase dos es igual al lmite superior de la
Estadstica 60
C = AR / m
-
clase uno, y el lmite superior de esta clase es igual al lmite inferior, ms la
amplitud del intervalo (C). Y as sucesivamente, hasta cubrir el nmero de
clases definidas.
Para el ejemplo de la tabla 3, los lmites de clases seran:
Tabla 4. Lmites de clases para el tiempo que tarda (en minutos) un
grupo de expertos en auditar un proceso
N DE CLASE LMITES DE CLASE
il - sl
INTERVALOS DE CLASE
il - sl1 44.5 - 44.5 + 5 = 49.5 44.5 - 49.52 49.5 - 49.5 + 5 = 54.5 49.5 - 54.53 54.5 - 54.5 + 5 = 59.5 54.5 - 59.54 59.5 - 59.5 + 5 = 64.5 59.5 - 64.55 64.5 - 64.5 + 5 = 69.5 64.5 - 69.56 69.5 - 69.5 + 5 = 74.5 69.5 - 74.5
Fuente: Datos hipotticos
2.1.6. Tabulacin
Una vez establecidos los intervalos de clase, se procede al conteo como en
el caso para datos no agrupados, como se ilustra en la tabla 5.
Tabla 5. Tabulacin para el tiempo que tarda (en minutos) un grupo de
expertos en auditar un proceso
N DE CLASE TIEMPO (minutos) TABULACIN FRECUENCIAS
Estadstica 61
-
1 44.5 - 49.5 22 49.5 - 54.5 93 54.5 - 59.5
12
4 59.5 - 64.5
11
5 64.5 - 69.5 96 69.5 - 74.5 7
Fuente: Datos hipotticos
2.1.7. Marca de clase o punto medio
Cada clase tiene un punto medio o marca de clase .
ix que representa a cada
intervalo. La marca de clase se calcula como la semisuma entre los lmites
inferior y superior de cada intervalo, as:
Tabla 6. Marca de clase para el tiempo que tarda (en minutos) un grupo
de expertos en auditar un proceso
N DE
CLASE
INTERVALO
(Tiempo en minutos)
MARCA DE
CLASE1 44.5 - 49.5 472 49.5 - 54.5 523 54.5 - 59.5 574 59.5 - 64.5 625 64.5 - 69.5 676 69.5 - 74.5 72
Estadstica 62
2
.is
ill
x+
=
-
Fuente: Datos hipotticos
Obsrvese que al pasar de una marca de clase a la siguiente, sta se
incrementa en las mismas unidades de la amplitud del intervalo C; por esta
razn es que C siempre debe ser un nmero exacto.
2.2. FRECUENCIAS
2.1.1. Frecuencia absoluta (fi)
Se llama frecuencia absoluta (fi) al nmero de veces que aparece el valor xi
de una variable X en un colectivo. As, si en un grupo de 30 empleados hay 6
que tienen una edad de 25 aos, se dice que la edad 25 aos tiene una
frecuencia de 6.
Las frecuencias absolutas para el grupo de expertos de la auditora de un
proceso se presentan en la tabla 7.
Tabla 7. Frecuencias absolutas para el tiempo que tarda (en minutos) un
grupo de expertos en auditar un proceso
N DE CLASE INTERVALO
(Tiempo en minutos)
FRECUENCIA
ABSOLUTA (fI)1 44.5 - 49.5 22 49.5 - 54.5 93 54.5 - 59.5 124 59.5 - 64.5 115 64.5 - 69.5 96 69.5 - 74.5 7
TOTAL 50Fuente: Datos hipotticos
Estadstica 63
-
Obsrvese que la suma de las frecuencias absolutas debe ser igual al
nmero total de datos.
2.2.2. Frecuencia relativa (hi)
Se llama frecuencia relativa (hi) al cociente de dividir la frecuencia absoluta
entre el nmero total de elementos del colectivo. Tambin se puede
representar en porcentaje.
Donde n es el total de elementos.
As, si en un grupo de 30 empleados hay 6 que tienen una edad de 25 aos,
entonces la frecuencia relativa ser:
%20100*306
==ih
Aqu la edad 25 aos tiene una frecuencia relativa de 20%; es decir, el 20%
de los empleados tiene edad de 25 aos.
Las frecuencias relativas para el grupo de expertos de la auditora de un
proceso se presenta en la 8.
Tabla 8. Frecuencias relativas para el tiempo que tarda (en minutos) un
grupo de expertos en auditar un proceso
Estadstica 64
100*nfh ii =
-
N DE CLASE INTERVALO
(Tiempo en minutos)
FRECUENCIA
RELATIVA (hI)1 44.5 - 49.5 (2/50)*100 = 4%2 49.5 - 54.5 (9/50)*100 = 18%3 54.5 - 59.5 (12/50)*100 = 24%4 59.5 - 64.5 (11/50)*100 = 22%5 64.5 - 69.5 (9/50)*100 = 18%6 69.5 - 74.5 (7/50)*100 = 14%
TOTAL 100%Fuente: Datos hipotticos
Obsrvese que la suma de las frecuencias relativas es igual al 100%.
La frecuencia relativa se aplica a las variables cualitativa, cuantitativa
discreta y continua.
2.2.3. Frecuencia absoluta acumulada (FI)
Se llama frecuencia absoluta acumulada (FI) de un valor xi de una variable X
a la suma de las frecuencias absolutas hasta la correspondiente frecuencia fI
del valor xi .
Tabla 9. Frecuencias absolutas acumuladas para el tiempo que tarda
(en minutos) un grupo de expertos en auditar un proceso
INTERVALO
(Tiempo en
minutos)
FRECUENCIA
ABSOLUTA (fi)
FRECUENCIA ABSOLUTA
ACUMULADA (Fi)
Estadstica 65
=
=
i
kki fF
1
-
44.5 - 49.5 2 249.5 - 54.5 9 2 + 9 = 1154.5 - 59.5 12 2 + 9 + 12 = 2359.5 - 64.5 11 2 + 9 + 12 + 11 = 3464.5 - 69.5 9 2 + 9 + 12 + 11 + 9 = 4369.5 - 74.5 7 2 + 9 + 12 + 11 + 9 + 7 = 50
Fuente: Datos hipotticos
2.2.4. Frecuencia relativa acumulada (Hi)
Se llama frecuencia relativa acumulada (HI) de un valor xi de una variable X a
la suma de las frecuencias relativas hasta la correspondiente frecuencia hI
del valor xi .
Tabla 10. Frecuencias relativas acumuladas para el tiempo que tarda (en
minutos) un grupo de expertos en auditar un proceso
INTERVALO
(Tiempo en
minutos)
FRECUENCIA
RELATIVA (hi)
FRECUENCIA RELATIVA
ACUMULADA (Hi)
44.5 - 49.5 4% 4% 49.5 - 54.5 18% 4% + 18% = 22%54.5 - 59.5 24% 4% + 18% + 24% = 46%
Estadstica 66
=
=
i
kki hH
1
-
59.5 - 64.5 22% 4% + 18% + 24% + 22% = 68%64.5 - 69.5 18% 4% + 18% + 24% + 22% + 18% = 86%69.5 - 74.5 14% 4% + 18% + 24% + 22% + 18% + 14% = 100%
Fuente: Datos hipotticos
Una vez construidos los intervalos y las frecuencias, se ilustra en una tabla el
consolidado para facilitar la interpretacin y el anlisis de la variable (ver
tabla 11).
Tabla 11. Intervalos y frecuencias para el tiempo que tarda (en minutos)
un grupo de expertos en auditar un proceso
N DE
CLASE
TIEMPO EN
MINUTOS.
ix fi hi Fi Hi
1 44.5 - 49.5 47 2 4% 2 4%2 49.5 - 54.5 52 9 18% 11 22%3 54.5 - 59.5 57 12 24% 23 46%4 59.5 - 64.5 62 11 22% 34 68%5 64.5 - 69.5 67 9 18% 43 86%6 69.5 - 74.5 72 7 14% 50 100%
Fuente: Datos hipotticos
Para analizar los resultados obtenidos en la tabla anterior, se deben tener en
cuenta los siguientes aspectos:
Las frecuencias absolutas y relativas se interpretan a partir de los
intervalos.
Por ejemplo: 2 expertos tardan entre 44.5 y 49.5 minutos en realizar la
auditora del proceso o el 4% de los expertos tardan entre 44.5 y 49.5
minutos en realizar la auditora del proceso; 9 expertos tardan entre 49.5
y 54.5 minutos en realizar la auditora del proceso o el 18% de los
Estadstica 67
-
expertos tardan entre 49.5 y 54.5 minutos en realizar la auditora del
proceso, as sucesivamente.
Las frecuencias absolutas acumuladas y relativas acumuladas se
interpretan con la marca de clase del intervalo.
Por ejemplo: 2 expertos tardan menos de 47 minutos en realizar la
auditora del proceso o 4% de los expertos tardan menos de 47 minutos
en realizar la auditora del proceso, 11 expertos tardan menos de 52
minutos en realizar la auditora del proceso o 22% de los expertos tardan
menos de 52 minutos en realizar la auditora del proceso, as
sucesivamente.
NOTA: las frecuencias acumuladas no se aplican a la variable cualitativa.
2.2.5. Nmeros ndice
Un nmero ndice es una medida estadstica diseada para resaltar cambios
en una variable o un grupo de variables relacionadas con respecto al tiempo,
situacin geogrfica, ingresos, o cualquier otra caracterstica.
El nmero ndice es el cociente que resulta al dividir una determinada
frecuencia de una serie por otra frecuencia de la misma serie, la cual se toma
como base o punto de referencia; puede expresarse en porcentaje o en
miles.
Ejemplo: los precios de un artculo A durante los aos 2001 a 2005 fueron
$40.000, $48.000, $56.000, $70.000, $84.000, respectivamente. Al tomar
Estadstica 68
-
como base el ao 2001, que corresponde al 100%, se obtienen los ndices
para cada ao.
Tabla 12. ndices de precios del artculo a, de los aos 2001 a 2005
AO PRECIO ($) NDICE2001 40.000 (40.000/40.000)*100 = 100%2002 48.000 (48.000/40.000)*100 = 120%2003 56.000 (56.000/40.000)*100 = 140%2004 70.000 (70.000/40.000)*100 = 175%2005 84.000 (84.000/40.000)*100 = 210%
Fuente: Datos hipotticos
Esto indica que el precio del artculo A se increment 20% en el ao 2002
con respecto al ao 2001; 40% en el ao 2003 con respecto al ao 2001;
75% en el ao 2004 con respecto al ao 2001; y 110% en el ao 2005 con
respecto al ao 2001.
2.3. GRFICAS O DIAGRAMAS
Las grficas permiten describir brevemente las caractersticas de un
colectivo. Existen varios tipos de grficas que pueden utilizarse para
representar el comportamiento de una variable, tales como histogramas,
polgonos de frecuencia, ojivas, diagramas circulares y barras.
2.3.1. Histogramas
Estadstica 69
-
Un histograma de frecuencias consiste en una serie de rectngulos que se
construyen sobre un plano cartesiano. Este tipo de grfica se aplica a la
variable cuantitativa continua.
Sobre el plano cartesiano, en el eje horizontalm, se ubican los intervalos de
cada clase, y en el eje vertical las frecuencias. Luego, para cada intervalo se
dibuja un rectngulo cuya base es la amplitud del intervalo de cada clase, y
la altura es la frecuencia de cada clase.
Si sobre el eje vertical se ubican las frecuencias absolutas, se obtiene el
histograma de frecuencias absolutas, y si se ubican las frecuencias relativas,
se obtiene el histograma de frecuencias relativas, como se ilustra en las
grficas 1 y 2 para un grupo de expertos que auditan un proceso.
Grfica 1. Histograma de frecuencias absolutas para un grupo de
expertos que auditan un proceso
Estadstica 70
-
Grfica 2. Histograma de frecuencias relativas para un grupo de
expertos que auditan un proceso
2.3.2. Polgono de frecuencias
El polgono de frecuencias se construye de forma similar al histograma; la
diferencia radica en la forma y estructura de la grfica, la cual se obtiene
ubicando las marcas de clase sobre el eje horizontal; y sobre el eje vertical,
las frecuencias, segn el tipo de polgono; si se ubican las frecuencias
absolutas, se denomina polgono de frecuencias absolutas; y si se ubican las
frecuencias relativas, se denomina polgono de frecuencias relativas, como
se ilustra en las grficas 3 y 4 para un grupo de expertos que auditan un
proceso.
Estadstica 71
-
Grfica 3. Polgono de frecuencias absolutas para un grupo de
expertos que auditan un proceso
Grfica 4. Polgono de frecuencias relativas para un grupo de expertos
que auditan un proceso
Estadstica 72
-
Se acostumbra prolongar el polgono hasta las marcas de clase inferior y
superior inmediatas, que corresponderan a las clases de frecuencia cero.
Los polgonos de frecuencia pueden tomar muchas formas, sin embargo, en
la mayora de los casos toman una forma acampanada que se identifica con
la curva normal.
2.3.3. Ojivas o polgonos de frecuencias acumuladas
La construccin de estos polgonos es similar a los polgonos de frecuencias
absolutas y relativas; la diferencia radica en que aqu se toman las
frecuencias acumuladas, como se puede observar en las grficas 5 y 6,
donde se presentan los polgonos de frecuencias absolutas y relativas
acumuladas para el grupo de expertos que auditan un proceso.
Grfica 5. Polgono de frecuencias absolutas acumuladas para un grupo
de expertos que auditan un proceso
Estadstica 73
-
Grfica 6. Polgono de frecuencias relativas acumuladas para un grupo
de expertos que auditan un proceso
2.3.4. Diagramas de barras
Los diagramas de barras son muy utilizados por la facilidad y sencillez que
ofrecen para presentar caractersticas de una poblacin, especialmente de
variables cualitativas o cuantitativas discretas.
Los diagramas de barras consisten en rectngulos de anchura arbitraria en la
cual se ubican los valores de la variable, y de longitud proporcional al nmero
de observaciones o frecuencias. Las barras se pueden construir de forma
horizontal o vertical, como se muestra en la grfica 7, correspondiente a los
datos del cuadro 2.
Estadstica 74
-
Grfica 7. Nmero de hijos de los asociados de la Cooperativa de
Trabajo Asociado Epsilon
2.3.5. Diagramas circulares
Estas grficas consisten en un crculo dividido en partes proporcionales a los
porcentajes de cada una de las caractersticas o valores de la variable. Se
utilizan principalmente en la representacin de variables cualitativas.
Para su construccin, se dividen los 360 de la circunferencia
proporcionalmente a los porcentajes o a las frecuencias absolutas de cada
caracterstica.
En la grfica 8 se ilustra el nivel de escolaridad de los asociados de la
Cooperativa de Trabajo Asociado Epsiln. En ella, 360 corresponde al
Estadstica 75
-
100% de los asociados; con nivel profesional corresponde 36; nivel tcnico
corresponde 108; nivel de bachillerato, 144; y con bsica primaria, 72.
Grfica 8. Nivel de escolaridad de los asociados de la Cooperativa de
Trabajo Asociado Epsilon
2.3.6. Diagrama de tallo y hojas
El diagrama de tallo y hoja es una herramienta valiosa y verstil para
organizar un conjunto de datos y entender la distribucin y agrupacin de los
valores dentro del intervalo de observaciones en el conjunto. Un diagrama
de tallo y hoja separa los datos en dgitos gua, o tallos, y dgitos que le
siguen, u hojas. Para construir el diagrama, primero se ordenan los dgitos
principales de cada dato a la izquierda de una lnea vertical. A la derecha de
sta se registra el ltimo dgito para cada dato conforme al orden de
aparicin de las observaciones. El ltimo dgito de cada dato se coloca en la
fila que corresponde a su primer dgito.
Para ilustrar el uso del diagrama de tallo y hojas se consideran los siguientes
datos de la tabla 13. La informacin es resultado de un examen de aptitudes Estadstica 76
-
de 150 preguntas, aplicado a 50 personas durante un proceso de seleccin
de personal en Manufacturas Alfa.
Tabla 13. Nmero de preguntas contestadas en forma correcta en una
prueba de aptitud
112 84 108 76 115 102 124 119 7 11573 68 76 118 94 80 83 95 95 85126 100 141 132 97 98 92 104 134 10782 72 119 96 86 106 81 69 128 10092 92 98 91 127 106 106 113 81 75Fuente: Datos hipotticos
Inicialmente, se deben ubicar los datos en tallo y hojas, as:
6 9 8
7 2 3 6 3 6 5
8 6 2 3 1 1 0 4 5
9 7 2 2 6 2 1 5 8 8 5 4
10 7 4 8 0 2 6 6 0 6
11 2 8 5 9 3 5 9
12 6 8 7 4
13 2 4
14 1
Posteriormente, se ordena cada lnea en forma ascendente, y una vez
ordenado, queda el diagrama de tallo y hojas como sigue:
Estadstica 77
-
6 8 9
7 2 3 3 5 6 6
8 0 1 1 2 3 4 5 6
9 1 2 2 2 4 5 5 6 7 8 8
10 0 0 2 4 6 6 6 7 8
11 2 3 5 5 8 9