DOSSIER DE ESTADÍSTICA

download DOSSIER DE ESTADÍSTICA

of 73

Transcript of DOSSIER DE ESTADÍSTICA

ESTADSTICA GENERAL ================================================================ PRIMERA UNIDAD: INTRODUCCIN Y CONCEPTOS BSICOS OBJETIVOS: Conocer la importancia de la Estadstica y su campo de aplicacin. Analizar los conceptos bsicos de la estadstica. Definir el trmino Estadstica DESARROLLO Lema: UNA IMAGEN DICE MS QUE MIL PALABRAS 1. INTRODUCCIN: Poco despus de que se cerraron las urnas el da de las elecciones, un comentarista de televisin inform al teleauditorio, que se pronostic, por anlisis matemtico, que uno de los candidatos obtendra una victoria aplastante. Lo que es ms, el pronstico se llev a cabo despus de tabular solamente el 2% de los votos. 2. La oficina de metereologa nos informa que hay un 30% de probabilidades de que llueva el da de hoy. 3. El gobierno informa que el ingreso medio de una familia de cuatro miembros en el casco urbano de Nueva Guinea es superior en un 5% al del ao pasado. 4. El 75% de los adolescentes cree justificado el divorcio si los padres disputan con frecuencia, si interviene la violencia fsica, o si uno o ambos padres cometen infidelidad. 5. Siete de cada diez estudiantes de secundaria han fumado mariguana. 6. El 60% de los estudiantes estudia slo para aprobar, no para aprender. El 55% admite haberse copiado en los exmenes. 7. Ms de 8 de cada 10 estudiantes cuya madre trabaja se sienten contentos y orgullosos de ella. 8. Un profesor explica a su clase que la calificacin promedio de mitad del semestre fue 70. Estas son algunas de las formas como se emplea la estadstica. Qu es la estadstica? La estadstica es el lenguaje universal de las ciencias. La estadstica es ms que solamente un juego de herramientas. Como usuarios potenciales de la Estadstica, necesitamos dominar el arte de emplear las herramientas correctamente. La utilizacin cuidadosa de los 1 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ mtodos estadsticos permite (1) describir con precisin los hallazgos de la investigacin cientfica, (2) tomar decisiones, y (3) efectuar estimaciones. La estadstica maneja informacin, utilizando ciertas medidas numricas para resumirla e interpretarla. La palabra estadstica tiene significados diferentes para gente de preparacin e intereses diversos. Para algunos es una bolsa de trucos cuyo conocimiento permite a un iniciado engaar a un lego. Para otros es una forma de recopilar presentar grandes cantidades de informacin numrica. Para otro de personas es una forma de tomar decisiones en condiciones de incertidumbre. Cada uno de estos puntos de vista es correcto desde la perspectiva adecuada. El campo de la Estadstica puede dividirse aproximadamente en dos reas: Estadstica Descriptiva y Estadstica Inferencial. La Estadstica Descriptiva es en lo que piensa la mayor parte de la gente cuando escucha la palabra Estadstica; incluye la recopilacin, presentacin y descripcin de datos. El trmino Estadstica Inferencial se refiere a la tcnica de interpretar los valores resultantes de las tcnicas descriptivas, y a su utilizacin posterior para tomar decisiones. La Estadstica es algo ms que slo nmeros: es lo que se hace a, o con, esos nmeros. Se utilizar la siguiente definicin: Estadstica Es la ciencia de la recopilacin, clasificacin, presentacin e interpretacin de datos. Antes de comenzar a estudiarla con detalle, se vern algunos ejemplos sobre cmo y cundo aplicar la estadstica. Ejemplo 1. La universidad BICU recinto Ciudad Rama, tiene en sus planes, la ampliacin de sus instalaciones fsicas. A fin de elaborar un plan de accin efectivo, el consejo de administracin decide preguntar lo siguiente: cuntos estudiantes universitarios se har necesario atender durante los prximos 10 aos? Esta pregunta puede descomponerse inmediatamente en otras: cuntos estudiantes universitarios habr en el pas?, Cuntos desearn asistir a la universidad BICU? Para contestar estas preguntas el Consejo necesitar datos que le indiquen qu proporcin de futuros egresados del bachillerato desearn asistir a la BICU. As el consejo necesitar proyectar o predecir de algn modo el nmero de egresados de bachillerato que habr en los prximos 10 aos. Considrese la pregunta sobre la proporcin de egresados de bachillerato que desearn asistir a la universidad BICU. La mejor forma de contestar esta pregunta es averiguar la proporcin de los que han asistido en el pasado. Esta mejor respuesta supone que existe una relacin entre el pasado y el futuro. Sin 2 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ embargo, esto no siempre se cumple. Eventos como guerras o depresiones econmicas modificarn el desarrollo natural de dicha relacin. Como puede verse, muchos problemas deben resolverse cuando se desean respuestas exactas. Un problema obvio es cmo obtener datos histricos. Es necesario considerar cada estudiante que haya egresado del bachillerato en los ltimos aos? Deben considerarse todas las escuelas dentro de un radio de 800 kilmetros? Las respuestas a estas preguntas son negativas; sera imposible contestarlas cabalmente. Por esta razn slo se obtendr, informacin acerca de una parte de esta poblacin, es decir, se obtendr una muestra de la poblacin. Tambin existen otras consideraciones: qu tan exactos son los resultados?, Cul es la probabilidad de que haya una mayor proporcin de estudiantes que deseen asistir a la universidad BICU? No se ha comenzado a plantear exhaustivamente las preguntas que pueden ser relevantes. Ejemplo 2. Todos quieren a Ricardo Bromas! Bueno, eso es lo que afirma el propio Ricardo, y es por ello que ha decidido a postularse como Diputado por la villa La Tigra (cuya poblacin votantes es de 8000). Sin embargo, el jefe de su campaa electoral no est seguro de entender exactamente lo que cree Ricardo Bromas. Cree ste que la totalidad de los habitantes aptos para votar simpatizan con l o que la mayora (al menos el 51%) lo acepta?. O bien, qu agrada al menos a la mitad de los habitantes en edad de votar?. Ricardo puede creer todas o algunas de estas afirmaciones, y lo que l crea puede significar una gran diferencia en la campaa electoral. (Por ejemplo, supngase que un cierto porcentaje a quienes simpatiza son nios y no pueden votar.) Si se le contratara a usted como experto independiente en sondeos de opinin, qu hara para corroborar la exactitud de la afirmacin de Ricardo Bromas? Ejemplo 3. Qu tan grande de estatura son los conductores de automviles deportivos?. Esta es la pregunta formulada por los propietarios del Cup Deportivo Especial (CDE), el automvil deportivo ms fino del mundo, de acuerdo con una opinin. El fabricante desea disear y construir un nuevo modelo que sea realmente cmodo para el conductor. Su modelo actual est diseado para admitir personas cuya estatura est entre 1.57 y 1.73 metros. Al fabricante le preocupa un rumor que dice que su automvil es incmodo para una gran proporcin de aficionados a los autos deportivos. (Segn el rumor, el Cup Deportivo Especial est construido para personas de corta estatura y de cuello corto.) Qu hara usted para responder a tan original pregunta? Qu consideraciones especiales plantara en el proceso de obtencin de informacin muestral?

3 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Cada uno de estos ejemplos formula preguntas que deben hacer pensar acerca de la situacin y al mismo tiempo dar una idea acerca de la utilidad de la estadstica. Sobre la base de lo planteado anteriormente resumimos que la estadstica comprende: La rama descriptiva, La teora de la probabilidad y el muestreo. Las tres ramas de la estadstica utilizan el mtodo cientfico, que consiste en cinco pasos bsicos: 1. Definir cuidadosamente el problema. Asegurarse de que est claro el objeto de estudio o anlisis. 2. Formular un plan para recopilar los datos necesarios. 3. Reunir los datos. 4. Analizar e interpretar los mismos. 5. Anotar las conclusiones y otros descubrimientos, de manera que sean fcilmente comprendidos por los que utilizarn los resultados al tomar decisiones. POR QU ESTUDIAR ESTADSTICA? Sera conveniente hacerse la pregunta: por qu debo molestarme en aprender estadsticas? Evidentemente, esto requerir un esfuerzo de su parte y quiz se pregunte qu beneficio le traer. En la actualidad es comn que los estudiantes crean que los cursos deben tener cierta utilidad. Usted ser el que juzgar al final. Pero por ahora, se debe considerar lo siguiente: 1. Los mtodos estadsticos se utilizan ampliamente, tanto en el gobierno como en la empresa privada, de manera que es posible que en el futuro usted obtenga un empleo o sea ascendido, debido a sus conocimientos de estadstica. 2. En muchas circunstancias, los gerentes requieren saber estadsticas para tomar decisiones acertadas y evitar ser abrumados por la presentacin de datos estadsticos. 3. En cursos subsecuentes se utilizar el anlisis estadstico.

4 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ 4. En la mayora de las revistas para profesionales y otro tipo de literatura se hacen continuas referencias a estudios estadsticos. 5. Las noticias proporcionadas por los medios de comunicacin masiva permiten la interpretacin estadstica, y lo mismo con las experiencias cotidianas. Ejemplo 1.2: Al requerir el nivel nutricional de una poblacin humana delimitada, informacin relevante a recabar de personas podra ser: peso, altura, sexo y edad, los parmetros prefijados agruparan las personas de acuerdo a los distintos grados desde desnutricin hasta obesidad.

CONCEPTOS BSICOS Para estudiar Estadstica se necesita estar en condiciones de hablar su lenguaje. A continuacin se definen algunos trminos bsicos que se emplean en el presente documento. Estas definiciones son de naturaleza descriptiva y no necesariamente son matemticamente formales. Poblacin Conjunto o cmulo de individuos u objetos cuyas propiedades se han de analizar. La poblacin es el conjunto completo de individuos u objetos que interesan a quien selecciona muestra. El concepto de poblacin es la idea fundamental en estadstica. La poblacin de inters debe definirse cuidadosamente, y se considera definida por completo slo cuando se especifica una lista de sus miembros. El conjunto de todos los estudiantes que han asistido a la universidad BICU es un ejemplo de poblacin bien definida. Generalmente se entiende poblacin un conjunto de personas. Sin embargo, en Estadstica una poblacin puede ser un conjunto de animales u objetos. Por ejemplo, el conjunto de todos los rboles de la especie casia magna en Ciudad Rama, es asimismo una poblacin. Muestra: Un subconjunto de una poblacin. Una muestra se compone de los individuos, objetos, medidas u observaciones seleccionados de la poblacin. 5 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Variable (o bien, variable de respuesta) Caracterstica de inters acerca de cada elemento de una poblacin o muestra. Son variables la edad de un estudiante al ingresar a la universidad, el color de su cabello, su estatura, peso, etc. Dato: Valor de la variable asociado a un elemento de una poblacin o muestra. Por ejemplo, Lucinio Arrliga ingres a la universidad a los 28 aos, su cabello es negro, mide 1.64 metros, y pesa 60 kilogramos. Cada una de estas cuatro mediciones es un valor individual o dato para cada una de las variables de respuesta de las medidas de Lucinio. Datos: Conjunto de valores de la variable repuesta medidos a partir de cada uno de los elementos de una poblacin o muestra. El conjunto de las 25 estaturas medidas a igual nmero de estudiantes es un ejemplo de un conjunto de datos. Experimento: Actividad realizada segn un plan definido cuyos resultados producen un conjunto de datos. Parmetro: Caracterstica numrica de una poblacin. La edad promedio al momento de la admisin de todos los estudiantes que hayan asistido a la BICU, o los que tenan ms de 21 aos al ser admitidos, son ejemplos de dos parmetros poblacionales. Un parmetro es un valor que describe a toda una poblacin. Una prctica comn en Estadstica es el uso de letras griegas para simbolizar los parmetros. Tales smbolos se asignarn conforme se estudie cada parmetro. Estadstica: Caracterstica numrica de una muestra. Un ejemplo de estadstica muestral es la estatura promedio calculada a partir de un conjunto de 25 medidas de estatura. Una estadstica es un valor que describe a una muestra. La mayora de las estadsticas muestrales se calculan con ayuda de frmulas y se representan con smbolos literales tomados del alfabeto latino (por ejemplo, x, r, s.) 6 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Ejemplo 4. Un estudiante de estadstica desea tener una idea aproximada acerca del valor (en unidades monetarias) del automvil tpico que poseen los profesores de su universidad. Para este caso, a continuacin se aplica cada uno de los ocho trminos bsicos que se acaban de definir. 1. La poblacin es el conjunto de todos los vehculos de los profesores de la universidad. 2. Una muestra es una porcin o parte de una poblacin. Por ejemplo, el nmero de automviles cuyos propietarios son los profesores del departamento de matemticas, es una muestra. 3. La variable es el valor real de cada automvil. 4. Un dato es el valor de un vehculo en particular. Por ejemplo, el coche del profesor Eugenio Mairena est valuado en 2000 dlares. 5. Los datos son el conjunto de valores que corresponden a la muestra obtenida (30 mil, 40 mil, ...). 6. El mtodo utilizado para seleccionar los automviles que componen la muestra, as como el que sirve para determinar el valor de cada uno, recibe el nombre de experimento. Se llevara a cabo preguntando directamente a cada profesor del departamento de matemticas, o bien de alguna otra manera. 7. El parmetro acerca del cual se busca informacin es el valor promedio en la poblacin. La Estadstica que se encontrar es el valor promedio de la muestra. 1.2.2 Tipos de Datos y Escalas de Medicin.

La informacin extrada de cada individuo se clasifica de acuerdo a su naturaleza, y

Tipo de Datos Cualitativos Cuantitativos Nominal Ordinal Discreta Continua

segn sta, cada conjunto de datos extrados se denomina Cualitativo (Categrico) o Cuantitativo (Numrico).

Datos Cualitativos son aquellos que pueden agruparse en categoras distintas; describen los atributos o cualidades de los individuos u objetos, si no dependen de 7 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ un ordenamiento primario su escala de medicin es Nominal, en otro caso, Ordinal. Datos cualitativos binarios (dos nicas opciones complementarias) se denotan como Dicotmicos. Datos Cuantitativos son aquellos que resultan de un proceso que cuantifica o mide, pueden ser de un proceso de conteo (discretos a escala entera) o estar asociados a una unidad de medida (continuos, a escala de intervalo o de razn: pueden tomar valores reales o fraccionarios). Si a un objeto se le asocia unidad de medida con subdivisiones: libra, onza, litro, gramo, metro, minuto,... la medicin es cuantitativa continua.

Ejemplos 1.4: En una empresa pueden obtenerse datos sobre distintos procesos. En Produccin: cada producto o artculo que elabora, presentacin de cada uno, su unidad de medida, niveles de produccin y niveles de demanda de cada producto para cada poca del ao. En Administracin las Bases de Datos (BD) conteniendo los registros de trabajadores en las distintas categoras laborales, BD de proveedores y BD de clientes; cada una con informacin relevante de cada persona (natural o jurdica). Datos especficos en sus distintos tipos podran ser: Presentacin del producto (bolsa, botella, caja, quintal,...) de tipo Nominal. Cantidad o volumen de producto (litro, libra, gramo,) es cuantitativa continua. Tipo de trabajador (temporal, permanente) de tipo Nominal. Sexo (masculino, femenino) de tipo Nominal dicotmico. Categora laboral (Gerencia, Ventas, Seguridad, Conserjera) a nivel Ordinal. Nivel Acadmico (Universitaria, Tcnica, Secundaria, Primaria, Alfabetizado) a nivel ordinal. Edad y Aos de Antigedad se consideran cuantitativa discretas.

Ejemplos 1.5: La poblacin de vacas para el ao 2000 de la regin centroamericana, es una poblacin muy general, para realizar estudios sobre las mismas debera delimitarse aquella por: Raza, Edad, Pas, etc., luego extraemos una muestra por regin y finca y extraemos de cada vaca la informacin pertinente, las mediciones sobre las mismas y sus atributos conforman las unidades estadsticas. La poblacin econmicamente activa (PEA) de un pas en el ao 2008, es un grupo humano delimitado, en principio, por edad, luego se la puede delimitar por: sexo, estado civil, situacin laboral, escolaridad (mxima alcanzada), nmero de hijos, etc., extraeramos una muestra segn nuestro objetivo primordial y medimos las unidades estadsticas fijadas a cada persona incluida en la muestra.

8 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Ejercicios 1.1 Supngase que ha obtenido la siguiente informacin entre los estudiantes que salan de la biblioteca de URACCAN durante la primera semana de clases: Cantidad de dinero que utiliza para adquirir libros. Nmero de textos que se adquieren. Tiempo empleado para comprar en la librera. Especialidad acadmica. Hombre o mujer. Posesin de computadora personal. Nmero de asignaturas que cursa en le semestre actual. Si adquiri o no alguna prenda de vestir recientemente. Forma de pago Clasifique cada variable como categrica o numrica. Si es numrica, determine si es discreta o continua.1.

Suponga que la siguiente informacin se obtuvo de la solicitud de un prstamo hipotecario que Diana Isabel Carranza entreg a Fondos Cooperativos de Nueva Guinea: Lugar de residencia: Zona Nmero cinco Nueva Guinea. Tipo de vivienda: unifamiliar. Fecha de nacimiento: 15 de junio de 1982 Pagos mensuales. 1427.00 crdobas Ocupacin: administradora Empresa donde labora: La exquisita Antigedad en el empleo: 5 aos Nmero de empleos en los ltimos 5 aos: 1 Ingreso familiar anual: 66,000.00 crdobas Otros ingresos: 16,000.00 crdobas Estado civil: casada Nmero de hijos: 1 Prstamo hipotecario solicitado: 120,000.00 crdobas Plazo para el pago del prstamo: 30 aos Otros prstamos; automvil Importe de otros prstamos: 8,000.00 crdobas

a. b. c. d. e. f. g. h. i. j. k. l. m. n. o. p.

Clasifique cada una de las respuestas por tipos de datos2.

Suponga que el director de investigacin de mercado de una gran cadena de tiendas departamentales desea realizar una encuesta en el rea metropolitana para determinar el tiempo mensual que invierten en adquirir ropa las mujeres que trabajan.

a. Describa la poblacin y la muestra de inters, e indique el tipo de datos que el director est interesado en recolectar. 9 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ b. Desarrolle un primer borrador del cuestionario requerido en el inciso (a): Escriba una serie de preguntas categricas y numricas que sean apropiadas para la encuesta. 8. Elabore un resumen fundamentando la diferencia entre estadstica descriptiva e Inferencial EJERCICIO NMERO DOS 1. Un fabricante de medicamentos desea conocer la proporcin de personas cuya hipertensin (alta presin sangunea) puede ser controlada con un nuevo producto fabricado por la compaa. Al realizar un estudio en 5000 individuos hipertensos se encontr que 80% de ellos pudo controlar su hipertensin utilizando el nuevo medicamento. Suponiendo que esas 5000 personas son representativas del grupo de pacientes de hipertensin, conteste las siguientes preguntas. a. b. c. d. e. Cul es la poblacin? Cul es la muestra? Identifique el parmetro de inters. Identifique la estadstica e indique cul es su valor. Se conoce el valor del parmetro?

2. Siguiendo las instrucciones expuestas a continuacin, lleve a cabo con una baraja cinco veces el experimento primer as. En cada una de las cinco realizaciones del experimento observe los valores de tres variables. Variable 1: El color del primer as que aparece. Variable 2: La mayor distancia medida a lo largo del montn o pila de cartas que se han visto. Variable 3: La cantidad de cartas que se toman de la baraja hasta obtener el primer as. Para realizar el experimento del primer as se baraja un mazo de 52 naipes que contenga 4 ases. Se selecciona una carta a la vez y se apilan hasta que aparezca el primer as. Despus de haberlo obtenido se registra su color. Luego se mide y se registra la mayor distancia a lo largo de la pila de cartas. Se cuenta y se anota el nmero de cartas apiladas incluyendo al primer as. Se repite el experimento cuatro veces. ENSAYO X = COLOR DEL D = DISTANCIA A Y = CUENTA DE PRIMER AS LO LARGO DE LA LAS CARTAS, PILA DE CARTAS INCLUYENDO AL PRIMER AS X1 = D1 = Y1 = 10 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

1

ESTADSTICA GENERAL ================================================================ 2 3 4 5 D2 = Y2 = D3 = Y3 = D4 = Y4 = D5 = Y5 = 5 5 Di = Yi = i=1 i=1 2.1 Cada una de las tres variables en el experimento del primer as produce un tipo de dato diferente. Qu tipo es en cada variable? 3. Un tcnico de control de calidad selecciona partes de una lnea de ensamblaje y anota para cada una de ellas la siguiente informacin: a. Si est defectuosa. b. El nmero de identificacin de la persona que arm la pieza. c. El peso de la pieza. Clasifique las respuestas para cada parte como atributo, dato de variable discreta, o dato de variable continua. 4. Se quiere saber el costo de la educacin. Uno de los gastos que hace un estudiante es la compra de sus libros de texto. Sea x el costo de todos los libros comprados este semestre por cada estudiante de BICU. Descrbase cuidadosamente: a. La poblacin. b. La variable. 5. Un departamento de servicios escolares desea valuar el costo promedio de los libros por estudiante y por semestre (Vase el ejercicio 4). a. Describa el parmetro poblacional. b. El departamento identific a 50 estudiantes admitidos y les pidi que tomaran nota de sus gastos en libros de texto y que informaran la cantidad total. Las 50 cantidades resultantes forman una muestra. Describa la estadstica muestral que interesa al departamento de servicios escolares. c. Describa como utilizara los 50 datos de la muestra para calcular el valor de la estadstica muestral descrita en (b). 6. Identifique cada uno de los siguientes casos como ejemplo de variable: (1) de atributo, (2) discreta, o (3) continua. a. La resistencia a la ruptura de un determinado tipo de cuerda. b. El color del cabello de los nios que estn viendo por televisin una pelcula. 11 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004 X2 = X3 = X4 = X5 =

ESTADSTICA GENERAL ================================================================ c. El nmero de seales de trnsito en poblados con menos de 500 habitantes. d. Si una llave de lavabo est defectuosa o no. e. El nmero de preguntas contestadas correctamente en un examen. f. El tiempo que se necesita para contestar una llamada telefnica en una oficina de bienes races. 7. Identifique cada uno de los siguientes casos como ejemplos de variable: (1) de atributo, (2) discreta, o (3) continua. a. El resultado de la encuesta hecha a un grupo de votantes posibles acerca del candidato de su preferencia. b. El tiempo necesario para que una herida cicatrice cuando se utiliza un nuevo medicamento. c. El nmero de llamadas telefnicas recibidas en un conmutador cada 10 minutos. d. La distancia a la que puede llegar un baln de ftbol al ser pateado por las jvenes de segundo ao de contabilidad. e. El nmero de pginas escritas por cada trabajo en una impresora de computadora. f. La clase de rbol utilizado como smbolo navideo. 8. Suponga que un nio de doce aos quiere saber la diferencia entre muestra y poblacin. a. Qu informacin dara como respuesta? b. Qu razones se le daran sobre el por qu se debe tomar una muestra en vez de estudiar a cada miembro de la poblacin? MEDIBILIDAD Y VARIABILIDAD Siempre se espera que ocurra variabilidad en un conjunto de datos experimentales. Si aparece muy poca o ninguna variacin, se conjeturara que el instrumento de medicin no es suficientemente preciso. Por ejemplo, tmese una caja con 24 barras de chocolate y anote el peso de cada una. Se observa que cada barra pesa 30 gramos, redondeando a enteros. Significa esto que 12 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ las barras tienen un peso idntico?. Realmente no. Si se pesan en una balanza analtica que mide miligramos, los pesos presentarn variabilidad. No importa de que variable de respuesta se trate, siempre existir VARIABILIDAD en la respuesta numrica si el instrumento de medicin es suficientemente preciso. Uno de los principales objetivos en el anlisis estadstico es la medicin de la variabilidad. Por ejemplo, en estudios de control de calidad eso es absolutamente esencial. El control o la reduccin de la variabilidad en un proceso de fabricacin es una rea de actividad bien definida (por ejemplo, el llamado control estadstico del proceso). EJERCICIOS 1. Supngase que se miden los pesos (en kilogramos) de los individuos que integran cada uno de los siguientes grupos: a) Grupo 1: nios varones de un ao de edad. b) Grupo 2: Hombres adultos de ms de 20 aos. En cul grupo habra mayor variabilidad?

2. Supngase que hay que decidir cul de dos mquinas debe comprarse, considerndose la longitud de corte para cierta pieza. Si ambas mquinas producen partes que tienen la misma longitud en promedio. Qu otra consideracin relativa las longitudes sera importante? Por qu?

MTODOS DE RECOLECCIN DE DATOS Es importante destacar que los mtodos de recoleccin de datos, se puede definir como: al medio a travs del cual el investigador se relaciona con los participantes para obtener la informacin necesaria que le permita lograr los objetivos de la investigacin. De modo que para recolectar la informacin hay que tener presente: 13 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ 1.Seleccionar un instrumento de medicin el cual debe ser valido y confiable para poder aceptar los resultados 2. Aplicar dicho instrumento de medicin 3. Organizar las mediciones obtenidas, para poder analizarlos Dentro de los mtodos para la recoleccin de datos estn: Observacin: Es el registro visual de lo ocurre es una situacional real, clasificando y consignando los acontecimientos pertinentes de acuerdo con algn esquema previsto y segn el problema que se estudia Al igual con los otros mtodos, previamente a la ejecucin de la observacin el investigador debe definir los objetivos que persigue, determinar su unidad de observacin, las condiciones en que asumir la observacin y las conductas que debern registrarse. Cuando se decide utilizarla hay que tomar en cuenta ciertas consideraciones. Como mtodo de recoleccin de datos, debe ser planificado cuidadosamente para que rena los requisitos de validez y confiabilidad. Se le debe conducir de manera hbil y sistemtica y tener destreza en el registro de datos, diferenciando los aspectos significativos de la situacin y los que no tienen importancia. Tambin se requiere habilidad para establecer las condiciones de manera tal que los hechos observables se realicen en la forma ms natural posible y sin influencia del investigador u otros factores. Cuando se decide usar este mtodo es requisito fundamental la preparacin cuidadosa de los observadores, asegurndose as la confiabilidad de los datos que se registren y recolecten. Posibles errores con el uso del mtodo de observacin. Sobre el uso del mtodo de observacin, Quinteros comenta que, "las condiciones de una investigacin puede ser seriamente objetables si el diseo de la misma no se ha tomado en cuenta los posibles errores de observacin" Estos errores estn relacionados con:

Los Observadores El instrumento utilizado para la observacin El fenmeno observado

Respecto a los errores relacionados con el observador, estos se asocian al hecho de la participacin de otras personas, adems del investigador, en el proceso de la observacin de los hechos o fenmenos en estudio. Esta situacin puede conducir a una falta de consistencia de los resultados, ya que los observadores pueden diferir en la cuantificacin y registro que se haga de los aspectos observados. El problema se suscita por la falta de una definicin operacional y precisa de la manera en que ser medida y observada la variable y el registro de tales observaciones, siendo necesario tomar precauciones para asegurar no solo que la 14 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ observacin sea correcta, sino tambin que el registro de los hechos rena esas condiciones. Conviene que haya instrucciones escritas y verbales que orienten al observador sobre como se llevara a cabo todo el proceso y que haya demostracin y practica de las observaciones que se realicen. Tambin se considera que segn el papel que ajusta el observador se puede incurrir en mayores o menores errores; este papel puede ser el de observador no participante o participante. La observacin participante implica que el investigador o el responsable de recolectar los datos se involucre directamente con la actividad objeto de la observacin, lo que puede variar desde una integracin total del grupo o ser parte de ste durante un periodo. Algunos errores que suelen cometerse estn relacionados con las emociones del observador, ya que al involucrarse en la situacin pierde la objetividad en la observacin y en el registro, anlisis e interpretacin de los hechos o fenmenos. La observacin no participante ocurre cuando el investigador no tiene ningn tipo de relaciones con los sujetos que sern observados ni forma parte de la situacin en que se dan los fenmenos en estudio. En esta modalidad, al no involucrarse el investigador, los datos recogidos pueden ser ms objetivos, aunque, por otro lado, al no integrarse al grupo puede afectar el comportamiento de los sujetos en estudio y los datos que se observan podran no ser tan reales y veraces. Los errores referentes al instrumento de observacin se relacionan con los desaciertos en que se incurre en su elaboracin y lo que se desea medir. Esto se evita con una definicin operacional y libre de ambigedades e imprecisiones de las variables en estudio, especificando en el instrumento los criterios o indicadores de la medicin de tales variables. La especificidad de ese instrumento esta relacionada con el problema, objetivos y forma en que se va a hacer la observacin. Una de esas formas es la denominada observacin simple, no regulada o no controlada, en la que solo se tienen unos lineamientos generales para la observacin sobre los aspectos del fenmeno que le investigador tienen inters en conocer. La otra forma es la sistemtica, regulada o controlada, en la que se dispone de un instrumento estandarizado o estructurado para medir las variables en estudio de una manera uniforme. El primero se usa mas en estudios exploratorios y el segundo esta dirigido a quienes desean probar hiptesis en que se debe especificarse claramente qu se observara, cmo se observara y cmo se har el registro de datos. Los errores relacionados con el objeto que se observa se dan cuando los aspectos que deben ser conocidos de las unidades o fenmenos de observacin no se presentan en igualdad de condiciones para todos ellos, ya sea porque varen las circunstancias en que se observa el fenmeno o a la propia variabilidad del sujeto en estudio. A manera de ejemplo, se puede citar que si existe inters en evaluar el desempeo de un agente de salud en las zonas rurales de las regiones sanitarias, puede ser que la situacin donde labore una gente sea diferente en una u otra regin, ya sea por carencia o disposicin de equipos y materiales u otros 15 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ factores. La variacin de circunstancias de las regiones sanitarias puede conducir a errores de medicin, de anlisis o interpretacin de los hechos observados. La variabilidad en el sujeto se dara ante la situacin de que unos agentes de salud tengan mayor experiencia que otros o que hayan egresado recientemente de un programa educativo; estos ltimos probablemente tendrn menos destreza en el desempeo de su labor. Por lo tanto, es necesario buscar mecanismos para que las unidades en estudio estn en igualdad de condiciones durante esa medicin y que se definan las caractersticas del fenmeno que se pretende observar, procurando que en la muestra esos elementos renan caractersticas similares. En general, el mtodo de observacin es sumamente til en todo tipo de investigacin: descriptiva, analtica y experimental. En el rea de investigacin educacional, social y psicolgica, es un mtodo de mucha utilidad, en particular cuando se desea conocer aspectos del comportamiento: relaciones maestroalumno, el desempeo de los agentes de salud, relacin del uso de ciertas tecnologas educativas y grado de aprendizaje cognoscitivo y prctico del personal de salud. La encuesta: Este mtodo consiste en obtener informacin de los sujetos de estudio, proporcionada por ellos mismos, sobre opiniones, actitudes o sugerencias. Hay dos maneras de obtener informacin con este mtodo: la entrevista y el cuestionario. La entrevista Es la comunicacin establecida entre el investigador y el sujeto de estudiado a fin de obtener respuestas verbales a las interrogantes planteadas sobre el problema propuesto. Se estima que este mtodo es ms eficaz que el cuestionario, ya que permite obtener una informacin mas completa. A travs de ella el investigador puede explicar el propsito del estudio y especificar claramente la informacin que necesita, si hay una interpretacin errnea de la pregunta permite aclararla, asegurando una mejor respuesta. Best afirma "es tambin posible buscar la misma informacin por distintos caminos en diversos estadios de la entrevista", obtenindose as una comprobacin de la veracidad de las respuestas. Como tcnica de recoleccin de datos la entrevista tiene muchas ventajas; es aplicable a toda persona, siendo muy til con los analfabetas, los nios o con aquellos que tienen limitacin fsica u orgnica que les dificulte proporcionar una respuesta escrita. Tambin se presta para usarla en aquellas investigaciones sobre aspectos psicolgicos o de otra ndole sonde se desee profundizar en el tema, segn la respuesta original del consultado, ya que permite explorar o indagar en la medida que el investigador estime pertinente. Hay dos tipos de entrevista: la estructurada y la no estructurada, la primera se caracteriza por estar rgidamente estandarizada, replantean idnticas preguntas y 16 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ en el mismo orden a cada uno de los participantes, quienes deben escoger la respuesta en 2, 3 o ms alternativas que se les ofrecen. Inclusive los comentarios introductorios y finales se formulan de la misma manera en todas las situaciones. Para orientar mejor la entrevista se elabora un formulario que contenga todas las preguntas. Sin embrago, al utilizar este tipo de entrevista el investigador tiene limitada libertad de formular preguntas independientes generadas por la interaccin personal. Algunas ventajas que presenta este tipo de entrevista son: La informacin es ms fcil de procesar, simplificando el anlisis comparativo El entrevistador no necesita ser entrenado arduamente en la tcnica Hay uniformidad en el tipo de informacin obtenida

Pero tambin tiene desventajas, tales como: Es difcil obtener informacin confidencial Se limita la posibilidad de profundizar en un tema que emerja durante la entrevista

La entrevista no estructurada es ms flexible y abierta, aunque los objetivos de la investigacin rigen a las preguntas, su contenido, orden profundidad y formulacin se encuentra por entero en manos del entrevistador. Si bien el investigador, sobre las bases del problema, los objetivos y las variables, elabora las preguntas antes de realizar la entrevista, modifica el orden, la forma de encauzar las preguntas o su formulacin para adaptarlas a las diversas situaciones y caractersticas particulares de los sujetos de estudio. Este tipo de entrevista es muy til en los estudios descriptivos y en las fases de exploracin para el diseo del instrumento de recoleccin de datos. Las ventajas de este mtodo son: Es adaptable y susceptible de aplicarse a toda clase de sujetos en situaciones diversas Permite profundizar en los temas de inters Orienta a posibles hiptesis y variables cuando se exploran reas nuevas.

Entre las desventajas se cita: Se requiere mas tiempo Es mas costosa por la inversin de tiempo con los entrevistadores Se dificulta la tabulacin de datos Se requiere de mucha habilidad tcnica para obtener la informacin y mayor conocimiento del tema

Aun con esas desventajas y dada la utilidad de la entrevista, en sus dos formas, todo investigador debe familiarizarse con su uso, ya que es probable que la aplique en cualquier tipo de investigacin. 17 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Cuestionario Es el mtodo que utiliza un instrumento o formulario impreso, destinado a obtener repuestas sobre el problema en estudio y que el investido o consultado llena por si mismo. El cuestionario puede aplicarse a grupos o individuos estando presente el investigador o el responsable del recoger la informacin, o puede enviarse por correo a los destinatarios seleccionados en la muestra. Debido a su administracin se puede presentar problema relacionados con la cantidad y calidad de datos que pretende obtener para el estudio. Algunos problemas asociados con el envo de los cuestionarios podran ser: que no fuese devuelto; los consultados pueden evadir la respuesta a alguna pregunta o no darle la importancia necesaria a las respuestas proporcionadas. Por ello y otros factores ms, el instrumento que se use para la recoleccin de datos debe ser objeto de una cuidadosa elaboracin. Algunas ventajas del cuestionario son: su costo relativamente bajo, su capacidad para proporcionar informacin sobre un mayor nmero de personas en un periodo bastante breve y la facilidad de obtener, cuantificar, analizar e interpretar los datos. Dentro de las limitaciones de este mtodo figuran las siguientes: es poso flexible, la informacin no puede variar ni profundizarse, si el cuestionario es enviado por correo se corre el riesgo de que no llegue al destinatario o no se obtenga respuesta de los encuestados; adems, resulta difcil obtener una tasa alta de complecin del cuestionario. Debido a esa posible prdida de informacin se recomienda cuando se use este mtodo una muestra ms grande de sujetos de estudio. En general, en el proceso de recoleccin de datos para una investigacin, estos mtodos e instrumentos y fuentes suelen combinarse; cada una con sus ventajas y desventajas, sus caractersticas propias y la informacin que se requiera, dan flexibilidad para que el investigador determine su uso apropiado segn el estudio a realizar. Consideraciones generales para la elaboracin del formulario Si el investigador decide utilizar la observacin regulada, la entrevista o el cuestionario u otra fuente de informacin secundaria como mtodo de recoleccin de datos, debe elaborar un instrumento para obtener la informacin se requiere, siendo el formulario el que se emplea ms frecuentemente. Elaborar el formulario de recoleccin de datos para medir las variables en estudio o para verificar una hiptesis no es tarea fcil. Para disear correctamente un formulario es necesario tomar en consideracin algunos criterios relacionados con su organizacin, las preguntas a plantear segn los objetivos propuestos en la investigacin y las caractersticas fsicas de los formularios. 18 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Organizacin del formulario. Todo formulario debe contener elementos bsicos tales como:

Titulo Instrucciones Identificacin del encuestado y del formulario Servicio o reas especificas Observaciones Identificacin del encuestador

Todo formulario debe tener un nombre o tirulo indicando a que se refiere o que es lo que contiene; en algunos casos debe tenerse precaucin con el titulo que se le d, ya que a veces este prejuicio al encuestado, lo que puede influir en sus respuestas y en los resultados que se desea obtener. Las instrucciones se refieren a las orientaciones que se brindan al consultado sobre como se debe llenar el formulario. Estas deben ser lo suficientemente amplias acerca del tipo y profundidad de la informacin que se desea recoger, as como el lugar y manera en que deben anotarse las respuestas, lo anterior es ms importante cuando se utiliza el cuestionario a distancia o si no est presente el investigador en el momento en que el encuestado contesta el formulario. Cuando participan otras personas en el proceso de recoleccin de datos tambin es necesario elaborar estas instrucciones para que se orienten dnde y cmo anotar las respuestas de los entrevistados; en algunos casos amerita tener un manual de instrucciones por separado o al final del formulario. Cuando se usa el cuestionario auto administrado, adems de las instrucciones es recomendable anexar al formulario una nota o circular dirigida al encuestado, en donde se informe sobre el propsito del estudio, la institucin que patrocina la investigacin y toda otra informacin que despierte por aportar datos exactos y confiables. La identificacin del formulario y del encuestado es otro elemento clave que debe considerarse en su diseo. El formulario debe contener informacin escrita para su identificacin, como: numero, fecha y lugar en que fue o ser llenado; igualmente necesaria es la identificacin de la persona o unidad de estudio, su nmero o clave correspondiente, direccin u otro dato general que facilite su ubicacin. Es frecuente que se presente el interrogante acerca si debe o no aparecer el nombre de la persona encuestada en el instrumento, se estima que ello debe estar sujeto al criterio del investigador o si se necesita esa informacin para los objetivos de su estudio. Al respecto, algunos autores opinan que en los cuestionarios auto administrado el anonimato generalmente contribuye a obtener datos ms veraces y por consiguiente confiables. Otro de los componentes ms importantes del formulario lo constituye su cuerpo central, donde se incluyen las preguntas o "tem" referentes a las variables que medir segn el problema y objetivos del estudio. Este generalmente se organiza en reas o secciones, dependiendo de los aspectos que sean incluidos; en la ubicacin de las reas debe seguirse un orden lgico, agrupando todas las preguntas que se refieren a un mismo tema y continuando secuencialmente con 19 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ las otras reas, por ejemplo, puede iniciarse con el rea referente a datos generales del encuestado o fenmeno que se investigara y continuar con aquellas especificas a las variables en estudio. Tambin es recomendable incluir al final del formulario una seccin para observaciones, donde se registre informacin particular relacionada con el encuestado, con las respuestas al instrumento u otro dato que sirva de referencia para la tabulacin, anlisis e interpretacin de datos. Finalmente, los formularios deben contener como dato de identificacin del investigador el nombre de la persona que recoger la informacin, adems debe registrarse la fecha y lugar donde se aplique el formulario. Preguntas del formulario. Uno de los aspectos relevantes a considerar en el diseo del formulario es el de las preguntas o "tem" del mismo; estas determinan en ltima instancia el alcance y logro de los objetivos de investigacin, y a travs de ellas se medirn las variables en estudio, obteniendo la informacin pertinente. As mismo, debe considerarse, entre otras: tipo de preguntas, su redaccin, nmero y orden. Referente al tipo de preguntas se consideran dos: dicotmicas y las de respuestas mltiples. Las primeras son las que tienen dos alternativas; un ejemplo de estas puede ser aquella cuya respuesta es s_____ o no_____. La de respuestas mltiples son las preguntas con varias alternativas, donde el encuestado debe recoger mltiples alternativas, ya que con una pregunta se obtiene mayor informacin que con las dicotmicas. Lo anteriormente expuesto se aclara con el siguiente ejemplo: Dicotmica Posee casa propia si_________ no________ La casa donde vive es alquilada si_________ no________ La casa donde vive la est pagando si_________ no________ Respuesta Mltiple La casa donde vive: Es propia ______ La esta pagando ______ Es alquilada ______ A las preguntas dicotmicas y de seleccin mltiples se les llama cerradas o estructuradas, ya que al lado de ellas se anotan varias respuestas posibles entre las que el sujeto de estudio o entrevistado deber optar. En la elaboracin de este tipo de preguntas debe tenerse presente que las alternativas de respuesta deben ser mutuamente excluyentes. Este tipo de preguntas tienen la ventaja de requerir menos tiempo y menos destreza del entrevistador, as como facilitar la tabulacin de la informacin obtenida. 20 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Tambin existen las preguntas abiertas, donde no se le da al encuestado las posibles respuestas, permitindole responder libremente sobre la base de marco de referencia; as, el encuestador se limita a registrar las respuestas segn fue brindada. Se les llama tambin preguntas no estructuradas, y tienen la desventaja de dificultar la tabulacin de los datos por la diversidad de respuestas que se obtienen. Entre los formularios es frecuente observar el uso de ambos tipos de preguntas; sin embargo, se estima que con las preguntas cerradas es necesario tener un conocimiento amplio sobre el tema y las posibles respuestas; cuando se carece de este conocimiento es recomendable formular preguntas abiertas. Respecto a la redaccin de la preguntas, se considera que es uno de los aspectos que deben tratarse muy cuidadosamente, para ello se proporcionan algunas recomendaciones: Las preguntas deben redactarse lo ms claramente posible, sin dejar dudas acerca del grado de precisin que se espera de las respuestas. A manera de ejemplo, si se indaga sobre el sueldo de una persona debe aclararse si se desea conocer el "nominal" o el "efectivo", "sueldo semanal", "quincenal" o "mensual". El lenguaje usado debe ser simple y comprensible por los encuestados, no se deben usar tecnicismos o palabras desconocidas por ellos, as como tener precaucin con el uso de palabras que tienen significado diferentes para cada persona como "mucho", "poco", "frecuentemente". Las preguntas deben ser especficas, conteniendo una sola idea y evitando las interrogantes dobles o mltiples. Por ejemplo: "Planea usted estudiar este ao y trabajar el prximo?", si la respuesta es "no", cabe preguntarse a que aspecto de la interrogante esta respondiendo la persona negativamente. Las peguntas deben formularse de una manera neutral o imparcial, evitando las interrogantes negativas o positivas que induzcan o favorezcan una respuesta.

Ejemplos de preguntas incorrectas son las siguientes: Se opone usted a que el personal se capacite a travs del mtodo de educacin a distancia? Favorece usted que el personal se capacite a travs del mtodo de educacin a distancia?

Probablemente estara mejor redactado de la siguiente manera: Cul es su opinin sobre la aplicacin del mtodo de educacin a distancia para capacita el personal?

Es de observarse que no induce ni negativa ni positivamente la respuesta; es neutral e imparcial. Esta pregunta convendra que se dejara abierta

21 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Las preguntas no deben sugerir que una respuesta es ms deseable que otras. Hay interrogantes que plantean directa e indirectamente las respuestas probables que desea el encuestador. Ejemplo: "esta de acuerdo con el trabajo actual, no es cierto?". Aunque el consultado este inconforme se le induce a decir que si est de acuerdo con el mismo. Las preguntas requieren plantearse de tal manera que se obtenga la informacin amplia y completa para los fines del estudio. Si se desea conocer las revistas o referencias que reciben o leen los distintos agentes de salud para su capacitacin y formacin general, probablemente no bastar saber el nombre de las revistas sino tambin la frecuencia y que secciones o reas lee de esas revistas.

Existe otra serie de consideraciones, aunque se estima que se han planteado algunas de las relevantes. Otro aspecto referente a las preguntas es el orden de ubicacin segn las secciones a reas del formulario. Conviene ubicar primero las preguntas simples y neutrales y posteriormente las mas difciles y las de ndole personal; las iniciales deben ser fciles de contestar y no despertar reacciones negativas en el encuestado, ya que pueden afectar las respuestas y la disposicin a responder el resto del formulario. El orden psicolgico debe tenerse muy en cuenta, ubicando en el centro o al final de las secciones o del formulario las preguntas personales sobre datos que usualmente no son brindados por las personas, tales como ingreso econmico y vida sexual. En relacin con nmero de preguntas que deben incluirse en el formulario, no se tiene una cantidad determinada, aunque cabe tener presente que este debe mostrar una extensin y mbito ilimitado, lo cual estar supeditado al tipo de problema y la medicin de las variables en estudio. Tambin depende de los recursos disponibles, la calidad de la informacin requerida y las caractersticas del encuestado. Caractersticas fsicas del formulario. El aspecto externo de un formulario puede influir favorablemente en las respuestas de un entrevistado, as como facilitar el manejo de estas para la tabulacin de los datos. Es recomendable que sea de un tamao que facilite su uso, no debiendo ser mayor de 22 cm. x 33 cm.; el tipo de letra y el tamao deber ser legible y contener espacios apropiados que faciliten la lectura y respuesta de las preguntas. Si los datos recolectados han de ser procesados mecnicamente, el formulario debe estar diseado de tal forma que facilite las diferentes etapas del proceso. Sobre las caractersticas del formulario cabe mencionar el uso del papel de diferentes colores, lo cual es recomendable cuando se tiene una muestra muy grande, y esta ser clasificada por estratos u otra variable en particular, ya que facilita la identificacin de los formatos y manipulacin de los mismos. La calidad del papel tambin debe tomarse en cuenta en el diseo del formulario; se estima que si los instrumentos sern manejados continuamente en el 22 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ procesamiento, tabulacin y anlisis de datos, o si se van a conservar formularios durante un periodo prolongado, es necesario considerar el uso de papel de buena calidad que asegure su durabilidad y resistencia. Requisitos de un instrumento de medicin Al elaborar los instrumentos de recoleccin de datos es necesario analizar en que forma dicho instrumento de medicin cumple con la funcin para la cual ha sido diseado. Este anlisis debe realizarse antes de iniciar la recoleccin de datos, lo que permitir introducir las modificaciones necesarias antes de su aplicacin. Las caractersticas de cada instrumento de medicin pueden ser mltiples; sin embargo, hay dos que pos su relevancia son fundamentales, ya que si los instrumentos no llenan estos requisitos, los datos recolectados tendrn limitaciones importantes. Estas cualidades son: confiabilidad y validez. El termino confiabilidad se refiere a la capacidad del instrumento para arrojar datos o mediciones que corresponden a la realidad que se pretende conocer, o sea, la exactitud de la medicin, as como a la consistencia o estabilidad de la medicin en diferentes momentos. Se dice que un instrumento es confiable si se obtienen medidas o datos que representen el valor real de la variable que se esta midiendo y si estos datos o medidas son iguales al ser aplicados a los mismos sujetos u objetos en dos ocasiones diferentes, o al ser aplicados por diferentes personas. Por ejemplo, se dice que una prueba es confiable si, al administrar a una persona en condiciones similares en dos ocasiones se obtienen resultados semejantes, o si el mejor estudiante en la primera aplicacin de la prueba tambin obtiene la nota mas alta en la segunda. Al elaborar instrumentos es necesario tener en cuenta las recomendaciones para aumentar la confiabilidad; algunas de stas se mencionan a continuacin: 1. Aplicar las reglas generales de elaboracin de instrumentos, de tal forma que se eliminen los errores de medicin (preguntas ambiguas). 2. Aumentar el nmero de preguntas sobre determinado tema. 3. Elaborar instrucciones claras que orienten el llenado o utilizacin de los instrumentos. 4. Aplicar los instrumentos o realizar las mediciones en condiciones similares. La validez es otra caracterstica importante que deben poseer los instrumentos de medicin, entendida como el grado en que un instrumento logra medir lo que se pretende medir. O sea: cuando una prueba para evaluacin del aprendizaje mide el grado en que han sido alcanzados los objetivos educacionales establecidos previamente, esta prueba ser valida.

23 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Esta caracterstica se considera fundamentalmente para un instrumento, pues es requisito para lograr la confiabilidad. La situacin opuesta no es necesariamente cierta, es decir, un instrumento puede ser confiable sin ser valido. De modo que, si se desea determinar el grado de conocimiento de un grupo de estudiantes sobre epidemiologa bsica y la prueba contiene una gran cantidad de preguntas sobre el enfoque de riegos (que no es tratado en epidemiologa bsica), la prueba se considera confiable porque seria constante en resultados bajos, pero no valida por cuanto no mide lo que se desea. Hay muchas formas de determinar y aumentar la validez de un instrumento; si embargo, a los efectos prcticos se considere que lo mas importante es construir los instrumentos una vez que las variables han sido claramente especificadas y definidas, para que sean stas las que aborden en el instrumento y no otras; tambin se puede recurrir a la ayuda de personas expertas en el tema que se esta investigando para que revisen el instrumento, a fin de determinar si cumple con la finalidad establecida. Pasos que deben seguirse en la elaboracin de instrumentos. Una vez que han sido elegido el tipo de instrumento que se utilizar en la recoleccin de datos, lo cual se hace de acuerdo con una serie de consideraciones, puede pasarse a la elaboracin del instrumento propiamente dicha, lo que puede facilitarse siguiendo una series de pasos que se explican a continuacin: Paso 1. decidir cul ser la unidad a la se aplicar el instrumento Paso 2. considerar las caractersticas importantes de la unidad de observacin o sujeto con relacin al instrumento Paso 3. determinar la informacin que se recoger Paso 4. Determinar la estructura del instrumento: o o o o

reas o secciones Formato general Paso 5. Disear el instrumento: Elaboracin de preguntas o tem Anlisis de preguntas o tem segn alcance y estructura Paso 6. Probar el instrumento Paso 7. Revisar y reproducir el instrumento

Explicacin de los pasos en la elaboracin de instrumentos: Paso 1: Una ver determinado el tipo de instrumento que ser utilizado, es necesario decidir a quienes se aplicara para la obtencin de datos, ya que no siempre se aplica a la unidad de estudios. Por ejemplo, un instrumento puede estar diseado para recabar informacin sobre los hbitos nutricionales del nio; sin embargo, quien dar la informacin ser la madre.

24 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Paso 2: Antes de iniciar la aplicacin del instrumento es indispensable precisar las caractersticas del grupo de individuos al cual ser aplicado. Esto se hace con el fin de tomar en consideracin en el instrumento aspectos condicionantes de la fuente de informacin, tales como nivel cultural, accesibilidad y otros. Paso 3: Para determinar la informacin que se obtendr es necesario establecer los aspectos de las variables que se desea incluir en el instrumento. Paso 4: Es importante considerar el formato general del instrumento, aso como decidir las reas o secciones que deben tener, tales como instrucciones, datos generales y datos especficos, segn las variables que se estn estudiando. Paso 5: En esta etapa se procede a la construccin del cuerpo del instrumento segn el formato decidido, o sea, a la elaboracin de las preguntas o incisos, si es un instrumento de observacin. A continuacin debe analizarse cada una de la partes en relacin con los objetivos y las variables, considerando si cada pregunta abarca la informacin que se espera obtener.

Tomando en cuenta que este es el paso que asegura la calidad del instrumento y la validez del estudio, es necesario destacar, por su importancia que amerita toda la atencin del investigador. Paso 6: Antes de aplicar el instrumento debe hacerse una prueba de campo a fin de determinar su calidad y los ajustes que amerite. La calidad del instrumento se determina en funcin de: o o o o o

Claridad de las preguntas o tem y del lenguaje Cantidad de preguntas e tem Formato y cuerpo Ordenamiento y secuencia de las preguntas Claridad de las instrucciones

La prueba de campo sirve, adems, para determinar otros aspectos, como:

Costo y duracin de la aplicacin del instrumento Necesidad de preparacin del personal a cargo de la recoleccin de datos

La prueba de campo debe ser aplicada a un grupo de sujetos que tengan caractersticas similares a las de la poblacin que ser estudiada, pero no es conveniente que sujetos que han participado en la prueba sean incluidos en la etapa de recoleccin definitiva de informacin. Paso 7: La revisin final se hace con posterioridad a la prueba de campo; hecha esta, procede la impresin o reproduccin del instrumento.

Aspectos Importantes sobre: Las Entrevistas y los Cuestionarios. 25 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Los conceptos que interesan al investigador deben traducirse en fenmenos observables y registrables. De aqu que la definicin de la variables de investigacin y la seleccin o desarrollo de mtodos adecuados para recabar datos, constituye una de las tareas ms excitantes del proceso de investigacin, ya que si el experimentador no cuenta con mtodos de alta calidad para recolectar datos, deber siempre cuestionar la precisin y pertinencia de sus conclusiones. As como sucede en el caso del diseo de la investigacin y el muestreo, el investigador debe con frecuencia elegir a partir de un conjunto de alternativas para decidir de qu modo habr de recabar la informacin. Los mtodos de recoleccin de datos difieren en varios aspectos importantes: Estructura. Los datos de una investigacin suelen recabarse de acuerdo con un plan estructurado que indica el tipo de informacin que debe reunirse y la forma exacta en la que habr de recolectarse. Sin embargo, a veces resulta adecuado establecer un mnimo de estructura y ofrecer al sujeto la oportunidad de revelar informacin pertinente de manera natural, como sucede en el caso de los estudios de campo. Posibilidad de cuantificar. Los datos que se sometan a anlisis estadsticos deben recabarse de tal forma que sea posible cuantificarlo. Por otra parte, valga considerar que los datos que habrn de cuantificarse a menudo se recaben de manera narrativa. Los enfoques de recoleccin estructurada de datos, por lo general, aportan los que pueden cuantificarse con mayor facilidad, si bien, suele ser igualmente posible intil cuantificar informacin no estructurada. Intervencin del investigador. Los mtodos de recoleccin de datos difieren conforme el grado en que los sujetos se percaten de su propia categora de sujetos ya que es posible que al estar plenamente conscientes de la funcin que desempean en el estudio no exhiban comportamiento y respuestas "normales". No obstante, en la recoleccin discreta pueden surgir problemas ticos. Objetividad. Algunos de los enfoques para la recoleccin precisan mayor nmero de juicios subjetivos que otros. Pese a que el cientfico generalmente se esfuerza por obtener mtodos que sean lo mas objetivos posible, en algunas investigaciones (particularmente las que se fundamentan en observaciones fenomenolgicas) el criterio subjetivo del investigador constituye un valioso componente de la recoleccin de datos. A veces la naturaleza del planteamiento de la investigacin dicta en qu parte de estos cuatro puntos se ubicara el mtodo de recoleccin de datos. Por ejemplo, las preguntas requeridas para un estudio de campo, por lo general, no satisfacen completamente las cuatro condiciones anteriores, en tanto que los planteamientos formulados en encuestas se acatan en su mayor parte a ellas. Sin embargo, el investigador suele contar con considerable flexibilidad para seleccionar o disear un plan adecuado de recoleccin de datos.

26 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ SEGUNDA UNIDAD: ORGANIZACIN Y REPRESENTACIN DE DATOS OBJETIVOS: Despus de estudiar est unidad se estar en condiciones de: Explicar la diferencia entre dato e informacin. Analizar la necesidad de organizar y resumir datos. Utilizar e interpretar la notacin de suma con sigma. Identificar, comparar y contrastar mtodos numricos para resumir datos. Elaborar una distribucin de frecuencia para cada tipo de datos.

Lema: La sabidura se nos da gota a gota mezclada con sangre, sudor y lgrimas. REPRESENTACIN GRFICA DE LOS DATOS GRFICAS Y REPRESENTACIONES TALLO HOJA Una vez recopilados los datos muestrales, uno debe familiarizarse con ellos. Una de las formas ms tiles para lograr este objetivo es la utilizacin de una tcnica exploratoria inicial que es el resultado de una representacin grfica de los datos. Dicha representacin revela en forma visual los patrones de comportamiento de la variable estudiada. Existen varios tipos de grficas para describir datos. El mtodo que se utilice estar determinado por el tipo de datos y lo que se quiere encontrar. Nota: desde el principio hay que percatarse de que no hay una respuesta correcta nica cuando se construye una representacin grfica. La experiencia del analista y las circunstancias que rodean el problema jugarn un papel primordial en la construccin del diagrama. GRFICAS CIRCULARES Y DE BARRAS A menudo se utilizan las grficas llamadas circulares y de barras para representar datos cualitativos o atributos. Seguramente se conocen ya varios ejemplos de este tipo de diagramas. En la siguiente tabla se enlista el nmero de casos de cada tipo de operacin quirrgica realizada el ao pasado en un cierto Hospital General. Representar los mismos datos en un grfica circular, donde cada tipo de operacin se represente proporcional y porcentualmente. Tabla nmero 1: Operaciones realizadas en el Hospital General. 27 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Tipo de operacin Torcica Huesos y articulaciones Ojos, odos, nariz y garganta. General Abdominal Urolgica Proctolgica Neurociruga TOTAL GENERAL REPRESENTACIONES TALLO HOJA La tcnica para compendiar datos numricos conocida como representacin tallo hoja en ingls (stem and leaf) ha ganado popularidad recientemente. Estas representaciones son idneas para aplicarse en el uso de la computadora. Dicha tcnica es una combinacin de dos procedimientos: uno grfico y otro de ordenacin. (ordenar datos es formar una lista de ellos en un orden dado de acuerdo con su valor numrico.) Los valores de los datos se utilizan para efectuar tal ordenacin. El tallo se forma con el (los) primer (os) dgito (s) del dato, mientras que la hoja se forma con los dems dgitos siguientes. Por ejemplo, el valor numrico 458 se dividira en 45 8 como se muestra a continuacin. Dgitos Iniciales Utilizados en la ordenacin Dgitos Sucesivos 45 8 Mostrados en la representacin. Casos 20 45 58 98 115 74 65 23 498

Ejemplo: Construir una representacin tallo hoja para el siguiente conjunto de 20 calificaciones. 82 62 74 68 88 72 66 92 58 86 74 76 78 52 84 76 96 82 76 78

En una inspeccin rpida se observa que hay valores en los grupos de 50, 60, 70, 80 y 90. El primer dgito de cada valor debe utilizarse como tallo, y el segundo como hoja. La representacin tallo hoja que resulta es: 20 calificaciones de examen 5 8 2 6 6 2 8 7 4 4 8 6 2 6 6 8 8 2 8 4 6 2 9 6 2

28 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================

Grficas estadsticas 1 INTRODUCCIN Grficas estadsticas, representaciones grficas de los resultados que se muestran en una tabla estadstica. Pueden ser de formas muy diversas, pero con cada tipo de grfica se cumple un propsito. Por ejemplo, en los medios de comunicacin, libros de divulgacin y revistas especializadas se encuentran multitud de grficas estadsticas en las que, con notable expresividad, se ponen de manifiesto los rasgos de la distribucin que se pretende destacar. Los diagramas de barras, los diagramas de sectores, los histogramas y los polgonos de frecuencias son algunas de ellas. 2 DIAGRAMA DE BARRAS En este tipo de grfica, sobre los valores de las variables se levantan barras estrechas de longitudes proporcionales a las frecuencias correspondientes. Se utilizan para representar variables cuantitativas discretas. El diagrama de barras siguiente representa la distribucin del nmero de hijos de 43 familias:

3 HISTOGRAMA Y POLGONO DE FRECUENCIAS Los histogramas se utilizan para representar tablas de frecuencias con datos agrupados en intervalos. Si los intervalos son todos iguales, cada uno de ellos es la base de un rectngulo cuya altura es proporcional a la frecuencia correspondiente. El histograma que se muestra a continuacin es el 29 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ correspondiente a la tabla de frecuencias con intervalos adjunta (1.200 calificaciones distribuidas en 10 intervalos):

Si se unen los puntos medios de la base superior de los rectngulos se obtiene el polgono de frecuencias. 4 HISTOGRAMA Y POLGONO DE FRECUENCIAS ACUMULADAS Si se representan las frecuencias acumuladas de una tabla de datos agrupados se obtiene el histograma de frecuencias acumuladas o su correspondiente polgono. He aqu los que se obtienen de la tabla de 1.200 calificaciones:

5 DIAGRAMA DE SECTORES

30 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ En un diagrama de este tipo, los 360 de un crculo se reparten proporcionalmente a las frecuencias de los distintos valores de la variable. Resultan muy adecuados cuando hay pocos valores, o bien cuando el carcter que se estudia es cualitativo. El diagrama de sectores siguiente refleja el resultado de una encuesta (realizada a 300 personas) sobre los tipos de pelcula preferidos por el pblico en general:

Microsoft Encarta 2009. 1993--2008 Microsoft Corporation. Reservados todos los derechos. EJERCICIOS 1. En un curso donde se utilizaron computadoras se distribuy un cuestionario a 200 estudiantes. Una de las cuestiones era Me gusta utilizar las computadoras. Las apreciaciones a esta interrogante fueron: Respuestas Nmero Totalmente de acuerdo 50 De acuerdo 75 Apenas de acuerdo 25 Apenas en desacuerdo 15 En desacuerdo 15 Totalmente en desacuerdo 20 Trace una grfica de barras que represente las respuestas. 2. Una compaa de gas y electricidad utiliza varias fuentes para generar energa. En el cuadro siguiente se presentan las fuentes y los porcentajes de energa obtenidos de cada una el ao pasado y los diez aos atrs. Fuente de energa Carbn Nuclear Gas Otro (Incluye en Hace 10 aos 16.8 % 26.9 % 55.9 % 0.4 % El ao Pasado 62.6 % 34.1 % 2.9 % 0.4 % 31 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

el

ESTADSTICA GENERAL ================================================================ petrleo) TOTAL 100.0 % 100.0 %

Elabore una grfica de barras horizontales para estos datos. Site los porcentajes en el eje horizontal y las fuentes de energa en el eje vertical. 3. La distribucin del nmero de acciones en poder de los accionistas de una compaa de gas y alumbrado es la siguiente: Nmero de acciones que poseen 1 99 100 249 250 999 1000 o ms Proporcin del total 0.43 0.41 0.14 0.02 1.00

Construya una grfica circular que muestre la distribucin del nmero de acciones que tienen por los accionistas. 4. En la siguiente representacin tallo hoja se indica el nmero de das que pasa un paciente bajo tratamiento, de acuerdo con una muestra aleatoria seleccionada de los registros de una clnica. 1 2 3 4 5 5 0 4 1 0 1 2 4 3 5 5 0

3

0

4

a. Cuntos pacientes estn representados? b. Cul fue el perodo de tratamiento ms corto? c. Cul fue el perodo de tratamiento ms largo? d. Cul fue el perodo de tratamiento ms frecuente? 5. Construya una representacin tallo hoja para los datos siguientes: 13.7 14.0 13.7 10.5 15.6 12.4 11.3 11.2 11.7 12.8 11.2 11.4 13.9 15.1

32 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ 6. Se utiliz un contador Geiger electrnico para contar el nmero de emisiones radiactivas en un perodo de 10 segundos. El experimento fue repetido 22 veces, obtenindose las cuentas siguientes: 8 22 23 21 18 37 22 19 22 22 15 22 21 12 23 27 25 16 18 26 24 32

Construya una representacin tallo hoja de estos datos. 7. En el primer da de clases del semestre pasado se pregunt a 50 estudiantes de administracin y contabilidad acerca del tiempo requerido para desplazarse de su casa a la URACCAN. Los datos resultantes fueron los siguientes: 20 35 25 15 5 20 25 30 20 20 30 15 15 20 20 25 25 20 20 10 20 25 45 20 5 25 40 25 25 20 30 25 35 20 30 15 30 25 20 10 10 5 10 15 25 40 25 10 20 15

Construya una representacin tallo hoja de estos datos. DISTRIBUCIN DE FRECUENCIAS Una simple lista de un conjunto de datos grande no le dice gran cosa a un lector. Algunas veces se desea condensar los datos en una forma ms manejable. Esto puede lograrse con la ayuda de una distribucin de frecuencias. DISTRIBUCIONES DE FRECUENCIAS Utilcese el siguiente conjunto de datos para mostrar el concepto de distribucin de frecuencias. 3 4 4 2 4 3 2 1 2 3 2 0 2 2 2 33 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ 2 1 3 3 1

Una distribucin de frecuencias representa este conjunto de datos si cada valor se denota por x junto con sus frecuencias respectivas. Por ejemplo, el valor 3 ocurre tres veces en la muestra; por lo tanto, la frecuencia para x = 1 es 3. La frecuencia f es el nmero de veces que ocurre el valor de x en la muestra. Esta es una distribucin de frecuencias no agrupada. No agrupada significa que los valores de x no se combinan para formar grupos, sino que cada x es un grupo en s. La representacin tallo hoja siguiente, muestra grficamente una distribucin de frecuencias agrupadas. A cada tallo corresponde una clase. X 0 1 2 3 4 F 1 3 8 5 3

El procedimiento tallo hoja se puede utilizar para construir una distribucin de frecuencias; sin embargo, la representacin del tallo no es compatible con todos los anchos de clase. Por ejemplo, es complicada la utilizacin de anchos de clase iguales a 3, 4, o 7. Por lo tanto, en ocasiones ser ventajoso tener otro procedimiento para construir una distribucin de frecuencias agrupadas. Utilicemos una muestra de 50 calificaciones obtenidas en un examen final de estadstica para ilustrar este mtodo de agrupacin (o clasificacin). Las 50 calificaciones ordenadas de manera ascendente se muestran en la tabla siguiente : 27 43 43 44 47 49 50 54 58 65 68 71 71 71 73 73 74 75 76 77 1. 2. 79 80 81 82 82 84 84 86 88 88 91 91 93 94 94 94 96 97 103 106 107 108 108 116 120 120 122 123 127 128

Cada clase debe tener la misma amplitud. Las clases deben establecerse de manera que no se traslapen (que sean ajenas) y por tanto, cada dato debe permanecer exclusivamente a una clase. 34

============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================

Otros tres pasos adicionales tiles (aunque no necesarios) son: 3. 4. 5. Es deseable que en los ejercicios propuestos se consideren entre 5 y 12 clases. Con frecuencia es conveniente que el ancho de clase sea un nmero impar. Para garantizar precisin, utilcese un procedimiento aritmtico que asegure un patrn numrico reconocible fcilmente. (Esto se mostrar en el ejemplo siguiente.)

Procedimiento: 1. Identifique los puntajes mximo y mnimo ( H = 128, L = 27) y obtenga la amplitud. Amplitud = H L = 128 27 = 101 2. Seleccione un nmero de clases ( m = 10 ) y un ancho de clase ( c = 11 ) de manera que el producto ( mc = 110 ) sea un poco mayor que la amplitud o intervalo total ( amplitud = 101 ) 3. Elija un valor inicial. Este valor inicial debe ser un poco ms pequeo que el puntaje mnimo L. Supngase que inicia en 22; contando en mltiplos de 11 (ancho de la clase) a partir de este nmero inicial, obtenemos 22, 33, 44, 55, ... , 132. Estos ltimos valores se llaman lmites inferiores de clase. (Como son mltiplos de once, su regla de formacin es fcilmente reconocible.) El lmite inferior de clase es el valor ms pequeo que puede asignarse en cada clase. Lmites superiores de clase son los valores de mayor magnitud que pueden asignarse a cada clase. En el presente ejemplo las clases son:

22 32 33 43 44 54 55 65 66 76

77 87 88 98 99 109 110 120 121 131

35 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Notas 1. 2. El ancho de clase es la diferencia entre un lmite inferior de clase y el lmite inferior de la siguiente clase. (No es la diferencia entre los lmites superior e inferior de la misma clase.) Las fronteras de clase son nmeros que no estn presentes en los datos muestrales, sino que se localizan en medio del lmite superior de una clase y del lmite inferior de la clase siguiente. En el ejemplo anterior, las fronteras de clase son 21.5, 32.5, 43.5, 54.5, ... , 120.5, y 131.5 La diferencia entre las fronteras inferior y superior de una clase se denomina tambin ancho de la clase. Una tabla estndar es til cuando se clasifican datos.

3.

Presentacin de una distribucin de frecuencias en una tabla estndar. Nmero de clase 1 2 3 4 5 6 7 8 9 10 Lmites de clase 22 - 32 33 - 43 44 - 54 55 - 65 66 - 76 77 - 87 88 - 98 99 - 109 110 - 120 121 - 131 Cuenta datos 1 2 5 2 9 9 10 5 3 4 de los Frecuencia (f) 1 2 5 2 9 9 10 5 3 4 50

Una establecidas las clases es necesario registrar los datos (tabla anterior). Si han sido ordenados este registro es innecesario; en caso contrario, se deben registrar cuidadosamente. La frecuencia f de cada clase es el nmero de datos que pertenecen a dicha clase. La suma de las frecuencias debe ser exactamente igual al nmero n de datos (n = f ) Esta suma constituye una buena forma de verificacin. En la tabla siguiente hay una columna para la marca de clase, x. La marca de clase (llamada algunas veces punto medio de clase) es el valor numrico situado exactamente en la parte central de cada clase.

Nmero de clase

Lmites de clase

f

Marca de clase (x) 36

============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ 1 2 3 4 5 6 7 8 9 10 22 - 32 33 - 43 44 - 54 55 - 65 66 - 76 77 - 87 88 - 98 99 - 109 110 - 120 121 - 131 1 2 5 2 9 9 10 5 3 4 50 27 38 49 60 71 82 93 104 115 126

En la tabla anterior las marcas de clase son: X1 = 22 + 32 = 27, 2 X2 = 33 + 43 2 = 38, etc.

37 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Notas: 1. 2. La moda es el valor del dato que ocurre con la mayor frecuencia. La clase modal es la clase con la frecuencia mayor. EJERCICIOS 1. Los cambios porcentuales mensuales en el ndice de precios al consumidor despus del 10 de enero del presente ao (2001) y en los doce primeros das fueron: 1.0 a. 2. 21 19 21 20 18 19 20 19 20 21 a. 3. 0.6 0.4 0.7 0.7 1.2 0.8 1.2 0.4 0.5 0.4

0.7

Elabore una distribucin de frecuencias de esos valores.

Las edades de 50 bailarinas que se presentaron a un concurso de seleccin para comedia musical fueron: 22 21 21 19 19 19 22 21 21 18 18 21 19 21 22 20 20 19 22 21 23 22 20 19 24 19 20 19 19 20 19 21 19 21 24 20 20 19 19 17

Construya una distribucin de frecuencias no agrupadas de estas edades.

Una prueba de aptitud en ciencias de la computacin fue aplicada a 50 estudiantes; obtenindose la siguiente distribucin de frecuencias de sus calificaciones o puntaje. Frecuencia 4 8 8 20 6 3 1

Puntaje en la prueba 0-3 4-7 8 - 11 12 - 15 16 - 19 20 - 23 24 - 27 a. b. c.

Obtenga todas las fronteras de clase asociadas a esta distribucin de frecuencias. Calcule todas las marcas de clase asociadas a esta distribucin. Cul es el ancho de la clase?

38 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================

TERCERA UNIDAD: NDICES ESTADSTICOS Lema: El amor hacia los dems comienza con el amor a aprender OBJETIVOS: 1. 2. Determinar las diferentes medidas de tendencia central de datos de una muestra: media, mediana y moda. Calcular las diversas medidas de dispersin de datos muestrales: amplitud de variacin, desviacin estndar, variancia y desviacin absoluta media. Calcular las medidas de resumen para la tendencia central y la dispersin para datos agrupados. DESARROLLO MEDIDAS DE TENDENCIA CENTRAL: Media, Mediana y Moda. Las medidas de tendencia central son valores numricos que tienden a localizar, en algn sentido, la parte central de un conjunto de datos. A menudo el trmino promedio se asocia a estas mediciones. Cada una de las diferentes medidas de tendencia central puede recibir el nombre de promedio. MEDIA: Para encontrar la media X (lase x con raya), el promedio con el que probablemente est ms familiarizado, se suman todos los valores de la variable x (simbolizada por x) y se dividen entre n, el nmero de esos valores. Se expresa con la frmula: Media muestral = X = x n

3.

Ilustracin: un conjunto de datos consiste en los cinco valores 6, 3, 8, 5 y 3. Obtener la media. Solucin: al utilizar la frmula anterior resulta:

X= 6+3+8+5+3 5 La media de la muestra es 5.

=

25

=5

39 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Tambin puede calcularse la media mediante el uso directo de la distribucin de frecuencias, obteniendo los productos o extensiones xf multiplicando cada valor de x por la frecuencia f correspondiente, resultando as el total. Esta cantidad es la suma de los datos. Por lo tanto puede encontrarse la media de una distribucin de frecuencias dividiendo la suma de los datos, xf entre el tamao de la muestra, f de esta manera la frmula de la media puede escribirse de la forma siguiente: X = xf f En el ejemplo anterior resultara: x 3 5 6 8 X 3 5 6 8 Total X= F 2 1 1 1 f 2 1 1 1 5 6 5 6 8 25 xf

25 5

=5

MEDIANA: La mediana x es el valor ocupado por la posicin central cuando los datos se ordenan de acuerdo con su magnitud. Ejemplo: 3 5 6 8

x=5 Nota: observe que el 5 est en la tercera posicin, o sea la central, de los cinco nmeros. Por lo tanto, la mediana es 5. La posicin de la mediana se determina por la frmula: Posicin de la mediana = d(x) = n+1 2 40 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ donde 1 es la posicin del dato con el valor ms pequeo, y n es la posicin del dato con el valor ms grande. As, la posicin de la mediana se obtiene sumando las posiciones de los datos mayor y menor y dividiendo posteriormente entre 2. La mediana ser exactamente el valor central del conjunto de datos cuando n sea un nmero impar. Sin embargo, la posicin de la mediana ser siempre la mitad de algn nmero cuando n es par. OTROS PROMEDIOS La moda es el valor de x que ocurre con mayor frecuencia. En el conjunto de datos 3, 3, 5, 6, 8, la moda es 3. La moda en la muestra 6, 7, 8, 9, 9, 10, es igual a 9. Si sucede que dos o ms valores tienen la misma frecuencia ms alta, se dice que no existe la moda. Por ejemplo, en la muestra 3, 3, 4, 5, 5, 7, tanto 3 como 5 aparecen igual nmero de veces. No hay un valor nico que aparezca con mayor frecuencia. Por tanto, esta muestra carece de moda. Otra medida de tendencia central es el centro de amplitud (en ingls midrange). Un conjunto de datos siempre tiene un extremo inferior L y otro superior H. El punto medio o centro de amplitud es un nmero situado entre ellos, exactamente en la parte central. Se le encuentra promediando los extremos inferior y superior: Punto medio de la amplitud = L + H 2 Para la muestra 6, 7, 8, 9, 9, 10 se tiene que L = 6 y H = 10 Por lo tanto, el centro de la amplitud es: 6 + 10 2 =8

Las cuatro medidas de tendencia central vistas hasta aqu representan cuatro mtodos para describir el centro de un conjunto de datos. Estudio de un Caso. EL TRMINO PROMEDIO TIENE DIFERENTES SIGNIFICADOS En trminos de conveniencia, pocas cosas pueden instrumento matemtico llamado promedio. igualar a ese maravilloso

41 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Qu til es! Mediante un promedio, se puede tomar un puado de cifras sobre cualquier tema Temperatura, ingresos, velocidades, poblaciones, aos luz, anchos de cabello, cualquier cosa que pueda ser medida y calcular una cifra que representar al conjunto por completo. Sin embargo debe recordarse una cosa. Existen varias clases de mediciones conocidas comnmente como promedios. Y cada uno presenta un panorama diferente sobre las cifras que representa. Como ejemplo, tomemos los ingresos anuales (dlares) de diez familias: $ 45000 $ 39000 $ 37500 $ 36750 $ 32250 $ 31500 $ 31500 $ 31500 $ 31500 $ 22500

Cul es el ingreso tpico en este grupo? Promediar podra proporcionar la respuesta, as que calculemos el ingreso tpico por los tipos promedios ms simples y de uso ms frecuente. La media (aritmtica). Cuando alguien se refiere a un promedio sin especificar el tipo, muy probablemente se refiere a la media aritmtica. Es la forma de promedio ms comn, y se obtiene sumando los elementos de una serie de nmeros y dividiendo entre el nmero de elementos. En el ejemplo, la suma de los diez ingresos dividida entre 10 es $ 33,900. La mediana. Como se puede haber observado, seis familias ganan menos que la media, mientras que cuatro ganan ms. Podra representarse este grupo con el ingreso de la familia que est situado exactamente en la parte central de todos los ingresos. Para esto se necesita determinar la mediana. Sera fcil si hubiera 11 familias en el grupo. Al ordenar los ingresos de menor a mayor ( o de mayor a menor), la familia con el sexto ingreso de la ordenacin tendra la mediana de los ingresos. Sin embargo con diez familias no se tiene una familia de enmedio. Por tal razn se suman los dos ingresos centrales (31500 y 32250) y se dividen entre 2. La mediana es igual a $ 31875, menor que la media. El centro de amplitud. Es claro que la mediana es el elemento central en la serie de nmeros. Otro nmero que puede ser utilizado para representar al grupo es el punto central de la amplitud, calculado como la cifra que est a la mitad entre el ingreso ms alto y el ms bajo: para calcular esta cifra se suman los ingresos mayor y menor ($ 45000 y $ 22500), se divide entre 2 y resulta la cantidad $ 33750, que est a la mitad de los extremos. 42 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ La moda. Hasta ahora se han obtenido tres clases de promedios y ninguna familia tiene un ingreso igual a alguno de los valores hallados. Ahora se quiere representar al grupo estableciendo el ingreso que ocurre con mayor frecuencia. Esa clase de representatividad recibe el nombre de moda. En este ejemplo el ingreso modal es $ 31500. Se han obtenido cuatro promedios diferentes, cada uno es vlido, correcto e informativo a su manera. Pero que distintos son! Media aritmtica Mediana Centro de amplitud Moda Notas: 1. Cuando se vea o se escuche algo sobre un promedio, debe averiguarse de qu clase se trata. Entonces se sabr que clase de aspecto se considera. Obsrvese las cifras que se promedian de manera pueda juzgarse si el promedio es el apropiado. Cada que alguien diga promedio no debe suponerse que se implica una cuantificacin matemtica. A menudo se habla de la persona promedio sin que ello se refiera a una media, mediana o moda. Todo lo que se quiere significar es la idea de gente que en muchos aspectos se asemeja bastante al resto. EJERCICIOS DIVERTIDOS PARA GENTE DIEVERTIDA 1. 2. 3. 4. Considere la muestra 2, 4, 7, 8, 9. Determine lo siguiente: la media, la mediana, la moda y el punto medio de la amplitud. Considere la muestra 6, 8, 7, 5, 3, 7. Calcule lo siguiente: la media, la mediana, la moda y el punto medio de la amplitud. Considere la muestra 7, 6, 10, 7, 5, 9, 3, 7, 5, 13. Obtenga lo siguiente: la media, la mediana, la moda y el punto medio de la amplitud. A 15 estudiantes contabilidad de URACCAN seleccionados aleatoriamente, se les pidi que dijeran el nmero de horas que haban dormido la noche anterior. Los datos resultantes fueron 5, 6, 6, 8, 7, 7, 9, 43 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004 $ 33900 $ 31875 $ 33750 $ 31500

2.

3.

ESTADSTICA GENERAL ================================================================ 5, 4, 8, 11, 6, 7, 8,7. Obtenga lo siguiente: la media, la mediana, la m