ESTADISTICA 1 TEORIA Y PRACTICA MANOLO ...

32
ESTADISTICA I Lic. MARTINEZ SANCHEZ, EDGAR LA ESTADÍSTICA COMO CIENCIA La Estadística es la ciencia que se encarga de recoger, organizar e interpretar los datos. Es la ciencia de los datos. En la vida diaria somos bombardeados continuamente por datos estadísticos: encuestas electorales, economía, deportes, datos meteorológicos, calidad de los productos, audiencias de TV. Necesitamos una formación básica en Estadística para evaluar toda esta información. Pero la utilidad de la Estadística va mucho más allá de estos ejemplos. La Estadística es fundamental para muchas ramas de la ciencia desde la medicina a la economía. Pero sobre todo, y en lo que a nosotros importa, es esencial para interpretar los datos que se obtienen de la investigación científica. Es necesario leer e interpretar datos, producirlos, extraer conclusiones, en resumen saber el significado de los datos. Es por lo tanto una herramienta de trabajo profesional. El objetivo fundamental de la estadística es obtener conclusiones de la investigación empírica usando modelos matemáticos. A partir de los datos reales se construye un modelo que se confronta con estos datos por medio de la Estadística. Esta proporciona los métodos de evaluación de las discrepancias entre ambos. Por eso es necesaria para toda ciencia que requiere análisis de datos y diseño de experimentos. PARA QUÉ SIRVE LA ESTADÍSTICA Ya hemos visto que la Estadística se encuentra ligada a nuestras actividades cotidianas. Sirve tanto para pronosticar el resultado de unas elecciones, como para determinar el número de ballenas que viven en nuestros océanos, para descubrir leyes fundamentales de la Física o para estudiar cómo ganar a la ruleta. La Estadística resuelve multitud de problemas que se plantean en ciencia: Análisis de muestras. Se elige una muestra de una población para hacer inferencias respecto a esa población a partir de lo observado en la muestra (sondeos de opinión, control de calidad, etc.). Descripción de datos. Procedimientos para resumir la información contenida en un conjunto (amplio) de datos. Contraste de hipótesis. Metodología estadística para diseñar experimentos que garanticen que las conclusiones que se extraigan sean válidas. Sirve

Transcript of ESTADISTICA 1 TEORIA Y PRACTICA MANOLO ...

ESTADISTICA ILic. MARTINEZ SANCHEZ, EDGAR

LA ESTADSTICA COMO CIENCIA

La Estadstica es la ciencia que se encarga de recoger, organizar e interpretar los datos. Es la ciencia de los datos. En la vida diaria somos bombardeados continuamente por datos estadsticos: encuestas electorales, economa, deportes, datos meteorolgicos, calidad de los productos, audiencias de TV. Necesitamos una formacin bsica en Estadstica para evaluar toda esta informacin. Pero la utilidad de la Estadstica va mucho ms all de estos ejemplos. La Estadstica es fundamental para muchas ramas de la ciencia desde la medicina a la economa. Pero sobre todo, y en lo que a nosotros importa, es esencial para interpretar los datos que se obtienen de la investigacin cientfica. Es necesario leer e interpretar datos, producirlos, extraer conclusiones, en resumen saber el significado de los datos. Es por lo tanto una herramienta de trabajo profesional. El objetivo fundamental de la estadstica es obtener conclusiones de la investigacin emprica usando modelos matemticos. A partir de los datos reales se construye un modelo que se confronta con estos datos por medio de la Estadstica. Esta proporciona los mtodos de evaluacin de las discrepancias entre ambos. Por eso es necesaria para toda ciencia que requiere anlisis de datos y diseo de experimentos.

PARA QU SIRVE LA ESTADSTICAYa hemos visto que la Estadstica se encuentra ligada a nuestras actividades cotidianas. Sirve tanto para pronosticar el resultado de unas elecciones, como para determinar el nmero de ballenas que viven en nuestros ocanos, para descubrir leyes fundamentales de la Fsica o para estudiar cmo ganar a la ruleta. La Estadstica resuelve multitud de problemas que se plantean en ciencia: Anlisis de muestras. Se elige una muestra de una poblacin para hacer inferencias respecto a esa poblacin a partir de lo observado en la muestra (sondeos de opinin, control de calidad, etc.). Descripcin de datos. Procedimientos para resumir la informacin contenida en un conjunto (amplio) de datos. Contraste de hiptesis. Metodologa estadstica para disear experimentos que garanticen que las conclusiones que se extraigan sean vlidas. Sirve para comparar las predicciones resultantes de las hiptesis con los datos observados (medicina eficaz, diferencias entre poblaciones, etc.). Medicin de relaciones entre variables estadsticas (contenido de gas hidrogeno neutro en galaxias y la tasa de formacin de estrellas, etc.) Prediccin. Prever la evolucin de una variable estudiando su historia y/o relacin con otras variables.EL MTODO CIENTFICOCitando a Martin Gardner: La ciencia es una bsqueda de conocimientos fidedignos acerca del mundo: como se estructura y cmo funciona el universo (incluyendo los seres vivos). La informacin que maneja la ciencia es amplia, al ser amplio su mbito. Pero se suele reunir en tres apartados: los hechos, las leyes y las teoras. No es una particin estanca, aunque podemos entender aqu nos referimos con algn ejemplo. Los hechos se refieren a casos especficos y/o nicos. Por ejemplo la Tierra tiene una luna (satlite natural). La primera ley de Kepler (ya que estamos con planetas) es un buen ejemplo de ley: los planetas describen orbitas elpticas en torno al Sol, que ocupa uno de los focos de la elipse. Como se ve, frente al hecho, concreto y nico, la ley se refiere a muchos casos, como lo son los planetas que orbitan en torno al Sol. La generalizacin de la ley de Kepler permite aplicarla a cualquier par de cuerpos ligados por la gravedad. Una teora es una abstraccin, con entidades inobservables, que explica hechos y leyes. Por ejemplo la teora newtoniana de la gravitacin. En ella se habla de fuerzas (o de campos gravitatorios) que no son entes observables, pero esta teora explica hechos y leyes. Sucede que el conocimiento cientfico no es completamente seguro en ninguna de las precedentes categoras. Podra existir otra luna en torno a la Tierra. O, como sabemos, la teora newtoniana de la gravitacin no es completa, porque no da cuenta de algunos fenmenos. De ah vino su evolucin a nuevas teoras de la gravitacin. No hay as un conocimiento completamente seguro: los enunciados absolutamente ciertos solo existen en el mbito de las matemticas o la lgica. Pero la ciencia usa una correspondencia con estas dos disciplinas. La matemtica y la lgica aplicadas a las ciencias facilitan poder establecer hechos, leyes y teoras con coherencia interna y con un alto grado de certeza. Y la Estadstica proporciona una herramienta para poder evaluar esta certeza, o proporcionar pautas para realizar inferencias a partir de lo que se conoce.Lo que distingue a una teora cientfica es que esta, a diferencia de la que no lo es, puede ser refutada: puede existir un conjunto de circunstancias que si son observadas demuestran que la teora est equivocada. A continuacin se ofrece una visin simplificada del mtodo cientfico. Hacemos observaciones en la naturaleza y a travs de un proceso creativo generamos una hiptesis de cmo funciona cierto aspecto de la naturaleza (modelos). Basndonos en esa hiptesis diseamos un experimento que consiste en que un conjunto de observaciones deben tener lugar, bajo ciertas condiciones, si la hiptesis es cierta. En el caso de que estas observaciones no ocurran nos enfrentamos a varias posibilidades: nuestras hiptesis necesitan ser revisadas, el experimento se llev a cabo de forma incorrecta, o nos hemos equivocado en el anlisis de los resultados del experimento.Hace algunos cientos de aos se estableci un mtodo para encontrar respuestas a los interrogantes que nos planteamos al contemplar la naturaleza. Este mtodo, conocido como mtodo cientfico, se basa en tres pilares fundamentales: Observacin, razonamiento y experimentacin. El mtodo cientfico no es una simple receta, sino que es un proceso exigente que requiere, entre otros ingredientes, juicio crtico. De forma resumida, el mtodo cientfico incorpora las siguientes facetas: Observacin: aplicacin atenta de los sentidos a un objeto o a un fenmeno, para estudiarlos tal como se presentan en realidad. Descripcin: las mediciones deben ser fiables, es decir, deben poder repetirse. Las observaciones nicas e irrepetibles no permiten predecir futuros resultados. En este sentido la Cosmologa se enfrenta, a priori, a un grave problema. El Universo es nico y no podemos volver a repetirlo modificando las condiciones iniciales. Prediccin: las predicciones de cualquier fenmeno deben ser vlidas tanto para observaciones pasadas, como presentes y futuras. Control: capacidad de modificar las condiciones del experimento para estudiar el impacto de los diferentes parmetros participantes. Esto se opone a la aceptacin pasiva de datos, que puede conducir a un importante sesgo (bias) emprico. Falsabilidad o eliminacin de alternativas plausibles: Este es un proceso gradual que requiere la repeticin de los experimentos (preferiblemente por investigadores independientes, quienes deben ser capaces de replicar los resultados iniciales con la intencin de corroborarlos). Todas las hiptesis y teoras deben estar sujetas a la posibilidad de ser refutadas. En este sentido, a medida que un rea de conocimiento crece y las hiptesis o teoras sobre la que se sustenta van realizando predicciones comprobables, aumenta la confianza en dichas hiptesis o teoras (uno de los defensores fundamentales del criterio de falsabilidad es Karl Popper (19021994); ver, por ejemplo, La lgica de la investigacin cientfica en Popper 1935).Explicacin causal: los siguientes requisitos son normalmente exigibles para admitir una explicacin como cientfica: Identificacin de las causas. Las causas identificadas deben correlacionarse con los observables. Las causas deben preceder temporalmente a los efectos medidos.EL PROCESO EXPERIMENTALLa experimentacin est lejos de estar carente de dificultades. Algunas tcnicas experimentales exigen un aprendizaje largo y, en muchas ocasiones, el volumen de datos a manejar puede ser tan grande que sea necesario un trabajo de anlisis intenso. La paciencia y la perseverancia son grandes aliadas en este sentido. Las razones para realizar un experimento son diversas y de alcance muy variable. Preguntas tpicas son, por ejemplo: Como de aplicable es una teora particular? Es posible mejorar una tcnica de medida? A qu temperatura debe fundir una nueva aleacin? Qu ocurre con las propiedades magnticas de un material al someterlo a temperaturas de trabajo muy bajas? Se ven alteradas las propiedades de un semiconductor debido al bombardeo por radiacin nuclear? De una forma esquemtica, el proceso experimental suele desarrollarse siguiendo el siguiente esquema: 1. Definir la pregunta o problema a resolver. Cuanto ms claro y definido sea el objetivo del experimento, mucho ms fcil ser a realizar su planificacin y ejecucin.2. Obtener informacin y recursos. Una vez definido el objetivo del experimento, es necesario elaborar un plan de trabajo para poder alcanzarlo. Hay que identificar que equipos son necesarios, que cantidades hay que medir, y de qu manera se va a realizar el experimento. 3. Formular hiptesis, acerca de los resultados de nuestro experimento. Hacerlo antes de su ejecucin evita el sesgo personal de identificar los resultados que ya se conocen como objetivos iniciales (no debemos engaarnos a nosotros mismos). 4. Realizar el experimento y obtener las medidas. Esta tarea se subdivide en varios pasos: Preparacin: el equipo debe ser puesto a punto para su utilizacin. Si el experimento requiere la utilizacin de aparatos con los que no estamos familiarizados, es necesario leer atentamente los manuales de utilizacin, e incluso consultar a experimentadores con experiencia previa en su manejo. Todo ello evita perder tiempo y cometer errores de bulto, a la vez que preserva la integridad del equipo (y la nuestra!). Experimentacin preliminar: suele ser muy aconsejable realizar una pequea experimentacin de prueba antes de iniciar la toma definitiva de medidas. Esto facilita el uso correcto del equipo instrumental, permitiendo identificar los aspectos ms difciles o en los que resulta ms fcil cometer errores. Toma de datos: el trabajo cuidadoso y detallado son fundamentales en todo proceso experimental. Ejecutar dicha labor siguiendo un plan de trabajo bien definido resulta bsico. No hay nada ms frustrante que descubrir, tras largas horas de medidas, que hemos olvidado anotar algn parmetro esencial o sus unidades. En este sentido resulta imprescindible tener presentes varias cuestiones Cules son las unidades asociadas a cada medida? Cul es la incertidumbre asociada? Que variabilidad presentan las medidas? Cmo puedo tener una idea del orden de magnitud de una medida antes de realizarla y saber as que los resultados que se van obteniendo son razonables? Qu informacin debe ser incluida en la tabla de datos? Comprobacin de la respetabilidad: siempre que sea posible, todo experimento o debera repetirse varias veces para comprobar que los resultados obtenidos son repetibles y representativos. Y aunque, obviamente, la repeticin de un experimento no proporciona exactamente los mismos nmeros, discrepancias muy grandes deben alertarnos acerca de la existencia de efectos sistemticos que pueden estar distorsionando el experimento.

5. Analizar los datos: una vez obtenidas las medidas es necesario su tratamiento estadstico para poder obtener magnitudes (e incertidumbres asociadas) representativas del objeto de nuestro estudio. 6. Interpretar los datos y extraer conclusiones que sirvan como punto de partida para nuevas hiptesis. El xito de esta interpretacin depender a, bsicamente, de la calidad de las medidas y de su anlisis. Las herramientas estadsticas que se describen en este libro nos permitirn tomar decisiones de manera objetiva. 7. Publicar los resultados. Los resultados de cualquier proceso experimental deben ser comunicados de manera clara y concisa. Esto incluye desde un sencillo informe de laboratorio, como el que se exigir en los diversos laboratorios en los que se trabajar durante la licenciatura de Fsicas, hasta la publicacin de un artculo cientfico en una revista reconocida.

FUNDAMENTOS DE ESTADSTICA DESCRIPTIVA

La aplicacin del tratamiento estadstico tiene dos fases fundamentales: 1. Organizacin y anlisis inicial de los datos recogidos. 2. Extraccin de conclusiones vlidas y toma de decisiones razonables a partir de ellos. Los objetivos de la Estadstica Descriptiva son los que se abordan en la primera de estas fases. Es decir, su misin es ordenar, describir y sintetizar la informacin recogida. En este proceso ser necesario establecer medidas cuantitativas que reduzcan a un nmero manejable de parmetros el conjunto (en general grande) de datos obtenidos. La realizacin de graficas (visualizacin de los datos en diagramas) tambin forma parte de la Estadstica Descriptiva dado que proporciona una manera visual directa de organizar la informacin. La finalidad de la Estadstica Descriptiva no es, entonces, extraer conclusiones generales sobre el fenmeno que ha producido los datos bajo estudio, sino solamente su descripcin (de ah el nombre).

DEFINICIONES ELEMENTALES

ESTADSTICA:

Es una ciencia que se ocupa de la recoleccin, organizacin, presentacin y del anlisis de datos. La Estadstica descriptiva se ocupa de describir lo que ocurre en una muestra de datos, mientras que la Estadstica inferencial se ocupa de, a partir de los resultados obtenidos de una muestra relativamente pequea, hacer inferencias o generalizaciones con un margen de error.POBLACIN:

Es un conjunto cuyos elementos tienen caractersticas que se pueden observar o medir. Es el conjunto formado por los sujetos que van a ser materia de estudio, los cuales pueden ser personas, animales, objetos, instituciones, etc.

Se denomina poblacin al conjunto completo de elementos, con alguna caracterstica comn, que es el objeto de nuestro estudio. Esta definicin incluye, por ejemplo, a todos los sucesos en que podra concretarse un fenmeno o experimento cualesquiera. Una poblacin puede ser finita o infinita.

Ejemplo Los habitantes de un pas, los planetas del Sistema Solar, las estrellas en la Va Lctea, son elementos de una poblacin finita. Sin embargo, el nmero de posibles medidas que se puedan hacer de la velocidad de la luz, o de tiradas de un dado, forman poblaciones infinitas.

MUESTRA:

Es una parte de la poblacin que se selecciona para hacer un estudio. Lo ideal es que se elija de modo que sea representativa para que aporte informacin confiable sobre la poblacin en su conjunto, sin necesidad de estudiar a todos los individuos de esta.

Ejemplo Si se quiere estudiar las propiedades de las estrellas en nuestra Galaxia, no tendremos la oportunidad de observarlas todas; tendremos que conformarnos con una muestra representativa. Obviamente, elegir de forma representativa los elementos de una muestra es algo muy importante. De hecho existe un grave problema, conocido como efecto de seleccin, que puede condicionar el resultado de un estudio si uno no realiza una seleccin correcta de los elementos que forman parte de una muestra.

Al nmero de elementos de la muestra se le llama tamao de la muestra. Es fcil adelantar que para que los resultados de nuestro estudio estadstico sean fiables es necesario que la muestra tenga un tamao mnimo. El caso particular de una muestra que incluye a todos los elementos de la poblacin es conocido como censo.

VARIABLES ESTADSTICAS:

Una variable estadstica es una propiedad o caracterstica de los elementos que componen una determinada poblacin. Dicha caracterstica debe ser factible de medirse u observarse. As, por ejemplo, en la poblacin formada por los alumnos de una determinada clase, se pueden estudiar variables como la estatura, el nmero de hermanos, el nmero de cursos que llevan en un semestre acadmico, el sexo, etctera. Al observarse o medirse una variable en un determinado sujeto de la poblacin, se obtiene un dato estadstico.

TIPOS DE VARIABLES

Una forma de clasificar las variables es la siguiente:

1. VARIABLES CUANTITATIVAS

Son aquellas que se pueden medir de manera que produzcan datos numricos. Los datos son numricos cuando se pueden realizar operaciones aritmticas con los valores de dichos datos y estas operaciones tienen significado.Son ejemplos de variables cuantitativas la edad, los ingresos mensuales, el costo de un producto, la nota final en el curso de Matemticas, etctera.Las variables cuantitativas se clasifican a su vez en: cuantitativas continuas y cuantitativas discretas.

1.1. VARIABLES CUANTITATIVAS CONTINUAS

Son aquellas cuyos valores posibles constituyen un intervalo. Ejemplos: la temperatura, la velocidad de un auto, la capacidad de un recipiente, el peso, etctera.

1.2. VARIABLES CUANTITATIVAS DISCRETAS

Son aquellas cuyos valores posibles se pueden enumerar.Ejemplos: el nmero de hijos de una familia, que pueden ser 0, 1, 2, etctera, pero no un valor intermedio; el nmero de crditos que puede llevar un alumno de la universidad, que pueden ser 0; 1; 1,5; 2; 2,5; etctera, pero no un valor intermedio, por ejemplo, 2,66 crditos

.2. VARIABLES CUALITATIVAS

Son aquellas que solo se pueden medir en datos que expresan distintas cualidades, las cuales no pueden traducirse numricamente. Los diferentes valores que toma una variable cualitativa se denominan cualidades o atributos; la medicin consiste en clasificar a cada sujeto de la poblacin en dichos atributos. Son ejemplos de variables cualitativas: el gnero, el lugar de residencia, el nivel socioeconmico, etctera.Las variables cualitativas pueden a su vez tener un nivel de medicin nominal u ordinal.

2.1. VARIABLES CUALITATIVAS ORDINALES

Cuando los valores que toma la variable se pueden ordenar siguiendo alguna escala establecida, de manera que dicho orden expresa un grado de posesin de la caracterstica medida en la variable.Ejemplos:El nivel de dominio de un idioma hablado que puede clasificarse en elemental, medio, avanzado, excelente; el grado de instruccin de una persona que puede clasificarse en: inicial, primaria, secundaria, superior; etctera.

2.2. VARIABLES CUALITATIVAS NOMINALES

Son aquellas en las que no se puede establecer un orden para los atributos. nicamente clasifican en categoras a los sujetos de la poblacin. Ejemplos: el color de cabello en las personas. El gnero, el curso preferido, etctera.

SITUACIN 1

Para cada una de las siguientes variables, seale si se trata de una variable cualitativa nominal, cualitativa ordinal, cuantitativa discreta o cuantitativa contina.a) Religin profesadab) Marca de gaseosa favoritac) Estaturad) Nivel de aceptacin del gobierno actual (de 0 a 5, de menor a mayor aceptacin)e) Nivel socioeconmicof) Restaurante favoritog) Gasto diario (en soles) por concepto de alimentacinh) Numero de hermanos

PROBLEMA DOMICILIARIO N 1 Lic. MARTINEZ SANCHEZX, EDGAR

1. Para cada una de las siguientes variables, seale si se trata de una variable cualitativa nominal, cualitativa ordinal, cuantitativa discreta o cuantitativa contina.

a) Sueldo de un empleadob) Marca de chocolate favoritoc) Estado civil de una personad) Grado de instruccin de una personae) Religin practicada por una personaf) Grado de acuerdo o desacuerdo con la poltica de gobiernog) Edad de una personah) Preferencia polticai) Cantidad de acciones vendidas diariamente en la Bolsa de Valores

2. Para cada una de las siguientes variables, indique si se trata de una variable cualitativa o cuantitativa, y si es del tipo ordinal, nominal, discreta o continua.

Seale una posible poblacin de estudio para cada caso.a) Distrito de residenciab) Tiempo que emplea en desplazarse de su casa a su centro de estudiosc) Emisora radial favoritad) Nmero de veces al mes que come en un restaurante de comida rpidae) Cantidad de telfonos celulares que ha tenido hasta hoyf) Rendimiento en el curso de Matemticas (muy bueno, bueno, regular, malo).

3. En el siguiente grfico, se muestran los resultados de una encuesta realizada a un grupo de habitantes del distrito de San Miguel.

a) Determine la variable estadstica involucrada y seale de que tipo es.

b) Determine cul fue la muestra y seale una posible poblacin sobre la cual se hizo el estudio.

4. En la siguiente tabla, se muestra informacin acerca del nmero de vehculos de transporte pblico que toman en un da un grupo de estudiantes de la Universidad del Futuro para desplazarse de su casa a la universidad.Nmero de vehculos detransporte pblico quetoma al da

Nmero deEstudiantes

0 vehculos1 vehculos2 vehculos3 vehculos4 vehculos34671614568

TOTAL375

a) Determine la variable estadstica involucrada y seale de que tipo es.b) Determine cul fue la muestra y seale una posible poblacin sobre la cual se hizo el estudio.TABLAS DE DISTRIBUCIN DE FRECUENCIAS PARA UNA VARIABLEAhora que hemos visto con que tipos de variables podemos encontrarnos, debemos estudiar de qu manera podemos tabular los datos con los que trabajaremos con el fin de organizar la informacin de manera sistemtica y significativa. En gran medida, el tipo de tabla y las caractersticas particulares de estas dependern de nuestra pericia como usuarios de la Estadstica para tabular los datos y distribuirlos de tal modo que el resultado sea til y comprensible.

Situacin 1Mara Fernanda entrevisto a un grupo de 50 personas acerca del tipo de programa de televisin que prefiere ver. Ella utilizo los siguientes cdigos para registrar su informacin:A: Aventura C: Comedia D: DeporteE: Ecologa H: Historia M: MsicaN: Noticias S: Suspenso T: TelenovelasLos datos que Mara Fernanda registr son los siguientes:N C A N D T E D T TA H D H T M N S D HE S M A C C C D D EM T E D E S S H N AA C S M A A M S C NRepresente los datos en una tabla de frecuencias.Situacin 2A 20 alumnas se les pregunto cul de los siguientes colores preferan usar en el verano: azul, rojo o blanco. Los datos que se obtuvieron se presentan a continuacin en dos tablas diferentes.Tabla 1Rojo Blanco Blanco Azul Blanco

AzulAzul Azul Azul Rojo

BlancoBlanco Blanco Blanco Azul

Azul Rojo Azul Azul blanco

Situacin 3Los siguientes datos se refieren al nivel socioeconmico (A: alto, M: medio y B: bajo) de 40 familias de un distrito de Lima.B A A M B A A B M BB M B B B M M B M BM M B B M M M M B AA B M A A B B A B MRepresente dichos datos

TABLAS DE DISTRIBUCIN DE FRECUENCIAS DE UNA VARIABLELas distribuciones de frecuencias son cuadros numricos en los que se representa una variable estadstica. Una distribucin de frecuencias en su forma completa tiene la siguiente estructura:

Clases(ci)

Frecuenciasabsolutas(fi)

Frecuenciasacumuladas(Fi)

Frecuenciasrelativas(hi = fi/n)

Frecuenciasrelativas acumuladas(Hi)

Los elementos mnimos indispensables en una distribucin de frecuencias son las clases y las frecuencias absolutas. La primera columna, las clases, corresponde a los valores de los atributos, de los nmeros o de los intervalos de valores en los que se clasifican los datos. En el caso de las variables cualitativas, las clases son categoras. Si la variable es cualitativa ordinal, las categoras deben estar ordenadas en forma creciente o decreciente segn el grado de posesin de la caracterstica que expresan. En el caso de las variables cuantitativas discretas, las clases son los valores numricos distintos que se presentan en los datos. Cuando la variable cuantitativa es continua se emplean intervalos o clases de la forma [a; b[; esto es una convencin. Se emplean algunas reglas empricas para la determinacin del nmero k de intervalos cuando se tienen n datos. Por ejemplo, se puede elegir k como el menor entero tal que 2k > n o emplear la regla de Sturges para que el valor de k sea el menor valor entero mayor o igual que 1 + 3,33 log (n). Cuando se trata de una variable discreta que toma muchos valores, estos tambin se suelen agrupar en intervalos. La frecuencia absoluta de una clase (fi) es el nmero de datos observados en dicha clase. La suma de todas las frecuencias absolutas debe ser igual al nmero de datos registrados. As, se verificara que f1 + f2 + ...+ f k =n (nmero total de datos). La frecuencia relativa de una clase (hi) es igual al cociente entre la frecuencia absoluta y el nmero total de datos; es decir, hi = fi /n. As, se verificara que h1 + h2 +... + hk = 1. La frecuencia acumulada (Fi) de una clase se obtiene sumando la frecuencia absoluta de dicha clase con las frecuencias absolutas de todas las clases anteriores. La frecuencia relativa acumulada de una clase (Hi) se obtiene sumando la frecuencia relativa de dicha clase con las frecuencias relativas de todas las clases anteriores. Es preferible trabajar con intervalos o clases con la misma amplitud. Nosotros utilizaremos, segn el tipo de datos, las siguientes tablas:TABLA DE DISTRIBUCIN DE FRECUENCIAS PARA DATOS SIN AGRUPARValores dela variable(xi)Frecuenciasabsolutas(fi)

Frecuenciasacumuladas(Fi)

Frecuenciasrelativas(hi = fi/n)

Frecuenciasrelativas acumuladas(Hi)

Nmero total de datos (n)1

Dnde: xi es uno de los valores que toma la variable en estudio.

TABLA DE DISTRIBUCIN DE FRECUENCIAS PARA DATOS AGRUPADOSIntervalos[xi - xi+1 [Marca declase(xi )Frecuenciasabsolutas(fi)

Frecuenciasacumuladas(Fi)

Frecuenciasrelativas(hi = fi/n)

Frecuenciasrelativas acumuladas(Hi)

[x1 - x2 [

Nmero total de datos (n)1

Situacin 1Se lanzaron 2 dados 80 veces y se anot la suma de los valores obtenidos en la cara superior de ambos dados, obtenindose los siguientes resultados:

Suma obtenida al lanzar los dos dados

Nmero de veces que esto ocurri

24

38

44

510

62

718

812

94

108

114

126

a) Construya la tabla de distribucin de frecuencias asociada a estos datos.b) .Cuantas veces la suma obtenida fue 6?c) .Cuantas veces la suma obtenida fue menor o igual a 9?d) .Cuantas veces la suma obtenida fue mayor que 5?e) .Que porcentaje de las observaciones fue 12?f) .Que porcentaje de las observaciones fue menor o igual a 10?g) .Que porcentaje de las observaciones fue mayor que 6?Valores dela variable(xi)Frecuenciasabsolutas(fi)

Frecuenciasacumuladas(Fi)

Frecuenciasrelativas(hi = fi/n)

Frecuenciasrelativas acumuladas(Hi)

Porcentual(hi %)

Porcentual acumulada(Hi %)

Nmero total de datos (n)1

Situacin 2A continuacin se presenta la cantidad de kilmetros recorridos en una carrera de autos por 45 participantes:63 9036 49 56 64 59 35 7843 53 70 57 62 43 68 62 2664 72 52 51 6260 71 61 5559 6067 57 67 61 67 51 8153 6476 44 73 56 62 63 60a) Construya la tabla de distribucin de frecuencias asociada a estos datos con 8 intervalos de igual amplitud.b) .Cuantos de estos datos son mayores o iguales que 50 y menores que 58?c) .Cuantos de estos datos son menores que 74?d) .Cuantos de estos datos son mayores o iguales que 74?e) .Que porcentaje de las observaciones es mayor o igual que 42, pero menor que 58?f) .Que porcentaje de las observaciones es menor que 82?g) .Que porcentaje de las observaciones es mayor o igual que 82?

Intervalos[xi; xi+1 [Marca declase(xi)Frecuenciasabsolutas(fi)

Frecuenciasacumuladas(Fi)

Frecuenciasrelativas(hi = fi/n)

Frecuenciasrelativas acumuladas(Hi)

Porcentual(hi %)

Porcentual acumulada(Hi %)

Nmero total de datos (n)1

PRACTICA DOMICILIARIA N 2

1. Los siguientes datos muestran los puntajes de un test psicolgico aplicado a 40 nios de un centro de educacin inicial.

31 17 27 20 28 10 34 25 4 2415 39 18 30 41 26 12 46 18 2336 19 29 37 33 27 27 24 26 3125 28 33 28 22 33 31 29 35 21a) Seale cual fue la variable estudiada y clasifquela adecuadamente.b) .Se podran representar los datos empleando una tabla como la tabla 2 de la situacin 5? .Seria ventajoso?c) Recordando que [a; b[ denota los nmeros mayores o iguales que a pero menores que b, clasifique los datos en los intervalos de valores indicados y complete el cuadro.

Intervalos de puntajes Cantidad de nios

[4 - 11[ 2

[11 - 18[

[18 - 25[

[25 - 32[

[32 - 39[

[39 - 46]

Total

d) Construya la tabla de distribucin de frecuencias asociada a los datos utilizando los intervalos dados en la parte c).e) .Cuantos nios han obtenido un puntaje menor que 25?f) .Cuantos nios han obtenido un puntaje mayor o igual que 11, pero menor que 18?g) .Que porcentaje de nios ha obtenido un puntaje menor que 32?h) .Que porcentaje de nios ha obtenido un puntaje mayor o igual a 32?

2. Considere los siguientes puntajes obtenidos por 40 alumnos en una prueba (sobre 100 puntos) aplicada en una escuela privada:Tabla 182 47 75 64 57 82 63 9376 68 84 54 88 77 79 8094 94 80 94 66 81 67 9275 73 66 87 76 45 40 5657 74 50 78 71 84 59 76Tabla 2 Lic. MARTINEZ SANCHEZ, EDGAR

Intervalos de puntajesNmero de estudiantes

[40 - 49[

[49 - 58[

[58 - 67[

[67 - 76[

[76 - 85[

[85 - 94]

a) Determine la variable estadstica involucrada y seale de que tipo es.b) Determine cul fue la muestra y seale una posible poblacin sobre la cual se hizo el estudio.c) .Conviene presentar la informacin detallada como en la tabla 1 o resumida como en la tabla 2? .Porque?d) Construya la tabla de distribucin de frecuencias, considerando 6 intervalos de igual amplitud.Empleando la tabla construida en d), responda a las siguientes preguntas:e) .Cuantos alumnos han obtenido un puntaje menor que 76?f) .Cuantos nios han obtenido un puntaje mayor o igual que 49, pero menor que 58?g) .Que porcentaje de nios ha obtenido un puntaje menor que 85?h) .Que porcentaje de nios ha obtenido un puntaje mayor o igual que 85

3. El grafico que se muestra a continuacin representa las estaturas (en centmetros) de los nios que cursan estudios en la primaria de un colegio. Los nmeros en el eje horizontal corresponden a los extremos de las bases de los rectngulos mostrados.

a) Construya una tabla de distribucin de frecuencias sealando los intervalos considerados, sus respectivas marcas de clase y calculando frecuencias absolutas y relativas.b) .Que porcentaje de los nios mide 142 cm o ms?

4. si las marcas de clase en una distribucin de frecuencias de pesos estudiantes son 128, 137, 146, 155,164, 173 y182 libras.Hallara. El tamao de intervalo de claseb. Los limites reales de clasec. Los lmites de clase, suponiendo los pesos medidos con aproximacin de unidad de libra.

5. la menor de 150 medidas efectuadas es 5,18 pulgadas y la mayor 7,44 pulgadas. Determinar un sistema adecuado de:a. intervalos de claseb. limites reales de clasec. marcas de clase que puedan utilizarse para formar una distribucin de frecuencias de estas medidas.

6. En la siguiente tabla los pesos de 40 estudiantes de la UNI y se registran con aproximacin de una libra. Construir una distribucin de frecuencias

138164150132144

146158140147136

168126138176163

146173142147135

161145135142150

157144165135128

125148119153156

149152154140145

7. la tabla muestra una distribucin de frecuencias de la duracin de 400 tubos de radio comprobados en la CIA M y B. Con referencia a esta tabla determinar.

Duracin(horas)Numero detubos

300 39914

400 49946

500 59958

600 69976

700 79968

800 89962

900 99948

1000 109922

1100 - 11996

TOTAL400

a. Lmite superior de la quinta clase.b. Lmite inferior de la octava clase.c. Marca de clase de la sptima clase.d. Limites reales de la ltima clase.e. Tamao del intervalo de clase.f. Frecuencia de la cuarta clase.g. Frecuencia relativa de la sexta clase.h. Porcentaje de tubos cuya duracin no sobrepasa las 600 horasi. Porcentaje de tubos cuya duracin es mayor o igual a 900 horas.j. Porcentaje de tubos cuya duracin es al menos de 500 horas pero menor de 1000 horas.k. Estimar el porcentaje de tubos a menos de 560 horas.l. Estimar el porcentaje de tubos 970 o ms horas.m. Estimar el porcentaje de tubos entre 620 horas y 890 horas

8. la tabla muestra la distribucin porcentual de una renta total de varones de 14 o ms aos en estados unidos en 1956. Utilizando esta tabla, contestar las siguientes preguntas.

Renta (dlares)Porcentaje de individuos

Menos de $ 100017,2

1000 1999 11,7

2000 2999 12,1

3000 3999 14,8

4000 4999 15,9

5000 5999 11,9

6000 6999 12,7

10000 y mas 3,6

a. Cul es el tamao o anchura del segundo intervalo de clase? y del sptimo?b. Cuntos intervalos de clase abiertos hay?c. Cmo sera el primer intervalo de clase si su tamao fuese igual al del segundo intervalo de clase?d. Cuntos intervalos de clase diferentes hay?e. Cul es la marca de clase del segundo intervalo de clase? y el sptimo intervalo de clase?f. Cules son los lmites reales del cuarto intervalo de clase?g. Qu porcentaje de varones ganaron $ 4000 o ms? y menos de $ 3000?h. Qu porcentaje de varones ganaron al menos $ 3000 pero no ms de $ 5000i. Qu porcentaje gano entre $ 3300 y $ 6300? Qu supuestos hay que hacer en este clculo?j. Por qu la suma de porcentajes no totaliza el 100%?

ESTADISTICA I Lic. MARTINEZ SANCHEZ, EDGAR

REPRESENTACIN GRFICA: CIRCULAR, DE BARRAS Y DE PUNTOS

Como hemos sealado ya antes, el principal mrito de las representaciones graficas es presentarnos de manera simplificada y de un golpe de vista gran cantidad de informacin que, de otra manera, seria difcil de manejar e interpretar. Esto tiene particular relevancia cuando necesitamos exponer frente a un pblico los resultados de una investigacin que hemos realizado, una anlisis de la situacin de nuestra empresa en el mercado, la evolucin histrica del precio de algn bien insumo, etctera.Situacin 1Los siguientes datos muestran el nmero de discos compactos que tienen 40 estudiantes del curso de Matemticas:

Nmero de discos compactos

23561732321219

141312192011101376

813164671937

1015172012189711

Elabore un grfico adecuado para representar la situacin mostrada.

Situacin 2A un grupo de alumnos del primer ciclo de Psicologa se les pregunto cul era su curso preferido hasta el momento. La informacin se muestra en la siguiente tabla:

Curso preferidoNmero de alumnos

Matemtica20

Redaccin15

Historia10

Otros5

total50

Representar diagrama circular

GRFICOS ESTADSTICOSLa finalidad primordial de un grfico es presentar cierta informacin estadstica de manera visual, pero tambin de manera veraz. Para ello los grficos deben tener ttulos, rtulos, unidades y todo elemento que permita una correcta interpretacin de la informacin.Dentro de los grficos ms usados para representar distribuciones de frecuencias, se encuentran el grafico de barras (o columnas), el grafico de sectores circulares y el diagrama de puntos.

GRFICOS DE BARRASEn un grfico de barras se representa cada clase a travs de una barra vertical(u horizontal) cuya altura (o largo) es proporcional a la frecuencia absoluta de dicha clase. Los grficos de barras sirven para representar tanto variables cualitativas como cuantitativas. En el caso de variables cualitativas o de variables cuantitativas discretas, las barras deben tener una separacin entre ellas. En el caso de variables cuantitativas continuas, las barras van juntas para transmitir la idea de continuidad entre los intervalos. Los grficos de barras juntas reciben el nombre de histogramas.

Situacin 1

A continuacin, se muestra informacin sobre el nivel socioeconmico (bajo, medio y alto) de un grupo de 40 nios de un colegio de Lima.

Nivel socioeconmicoCantidad de nios

Bajo17

Medio14

Alto9

Total40

a) Seale cual es la variable de estudio y de qu tipo es.b) Represente grficamente la informacin mostrada en la tabla.

Situacin 2El cuadro mostrado presenta informacin sobre el sueldo semanal (en nuevos soles) de 200 profesores que trabajan en grupos de estudio. Sueldo semanal (En nuevos soles) Cantidad de profesores[150 - 180[ 20[180 - 210[ 40[210 - 240[ 50[240 - 270[ 70[270 - 300] 20 Total 200

GRFICO CIRCULAR O DE SECTORES CIRCULARESEn una grfica circular, cada clase se representa mediante un sector circular.Dado que la circunferencia completa corresponde a un Angulo central de 360o, la medida en grados del ngulo central correspondiente a una clase con frecuencia relativa hk es hk(360o). Esto es, los ngulos centrales se relacionan con los porcentajes en la medida que 360o equivale a 100%.El grafico circular se emplea para representar variables cualitativas.Situacin 3Construya un grfico circular con la informacin presentada sobre el nivel socioeconmico de los 40 nios de un colegio de Lima.Nivel socioeconmico Cantidad de niosBajo 17Medio 14Alto 9Total 40

GRFICO DE PUNTOS (O DE DISPERSIN UNIDIMENSIONAL)Un grfico de puntos consiste en un diagrama con las siguientes caractersticas: Un eje horizontal donde se ubican las clases consideradas para la variable representada. Cada dato contenido en una clase se grafica mediante un punto que se coloca encima de la correspondiente clase representada en el eje horizontal. Los puntos se disponen verticalmente de manera que a cada clase representada en el eje horizontal le corresponden tantos puntos como lo indica la frecuencia absoluta de dicha clase.Los grficos de puntos sirven para mostrar los agrupamientos en un conjunto de datos.Si se toma como ejemplo la siguiente tabla de distribucin de frecuencias:Clases xi Frecuencia absoluta (fi 10 2 114 13 6 15 5 16 3Total 20PROBLEMAS DE APLICACIN

BNRNB

BNBBB

NBNBN

NRNRN

1. En una encuesta de opinin acerca de las preferencias de bebidas gaseosas por su color negro (N), blanco (B), rojo(R), una muestra de 20 consumidores marco las siguientes respuestas.

Describa la variable estadistica y obtenga la distribucion de frecuencias luego presente los datos agrupados en las graficas de barra y circular.

2. Ante la pregunta del numero de hijos por familia, una muestra de 20 hogares marco las siguientes respuestas.22122

31232

14330

23314

BNRNB

BNBBB

NBNBN

NRNRN

Describe la variable de la encuesta y obtenga la distribucion de frecuencias de los datos. Luego grafique la distribucion.

3. Las notas del examen parcial de matematica I se organizaron en una distribucion de frecuencia, cuyos resultados incompletos se dan en la tabla siguiente.

ClasesxifihiFiHi

[ - [0,15

[6 - [0,45

[ - [0,70

[ - [13,5

[ - [0,10

TOTAL

a. Grafique la distribuccion de frecuencias y describa su forma.b. Grafique la ojiva de porcentajes.c. es verdad que mas del 49% de las notas se ubican en el intervalo [8-14]d. Calcule el intervalo de notas donde se ubica el quinto superior de los alumnos.

4. La siguiente tabla muestra la superficie (en millones de millas cuadradas) de los oceanos.

OceanoPacificoAtlanticoIndicoantarticoartico

superficie70412874

Identofique las variables y represente los datos mediante los graficos diferentes

TRABAJO DOMICILIARIO Lic. MARTINEZ SANCHEZ, EDGAR1. En el siguiente grfico, se muestra informacin sobre las defunciones por raza en un determinado pas en el 2006.

a) Determine cul es la variable estudiada y de qu tipo es.b) Construya la tabla de distribucin de frecuencias correspondiente al grafico mostrado.c) Sera adecuado ubicar en el grafico las columnas sin separacin entre ellas? Explique.

2. El siguiente grafico muestra informacin sobre personas atendidas en las unidades de emergencia de un hospital.

a) De qu tipo son las variables representadas en el grafico?b) Pueden representarse las dos variables a la vez en una tabla de distribucin de frecuencias de una variable?c) Elabore grficos para cada una de las variables identificadas.

3. a) En la siguiente tabla, se muestra informacin sobre el grado de preferencia que tiene un grupo de 50 personas respecto a la comida vegetariana.

Seale cul es la variable involucrada y de qu tipo es. Construya una tabla de distribucin de frecuencias. Elabore un grfico adecuado para representar la informacin mostrada.

b) En la siguiente tabla, se muestra informacin sobre el costo del men que consumen 28 empleados que laboran en Miraflores.

Seale cules son las variables involucradas y de qu tipo son. Construya una tabla de distribucin de frecuencias. Elabore un grfico adecuado para representar la informacin mostrada.

4. Cuatrocientos entrevistados, entre trabajadores de prensa, estudiantes de comunicacin y personas no relacionadas con el periodismo, respondieron a la pregunta qu medios prefiere para informarse mejor? Los resultados se muestran en el siguiente grfico:

Fuente: Postolski, Glenn y Daniel Rodrguez. Encuesta de credibilidad periodstica.

Determine cul es la variable representada en el grfico y de qu tipo es. Cmo se explica que los porcentajes no sumen 100%? Se podra emplear un diagrama de sectores circulares para representar la informacin mostrada?

5. La tabla y la grfica muestran el nivel de instruccin y el uso de mtodos anticonceptivos en un grupo de mujeres que fueron atendidas en el Hospital 4 de Mayo durante el 2007.

a) Seale cuales son las variables representadas en la tabla e indique de que tipo son.b) .A que parte de la informacin presentada en la tabla se refiere el grafico circular mostrado? Complete el grafico con los nombres adecuados para cada regin.c) Construya un grfico de columnas que ilustre simultneamente sobre el uso (y no uso) de mtodos anticonceptivos y sobre el grado de instruccin de las mujeres que participaron en el estudio.

ESTADISTICA I Lic. MARTINEZ SANCHEZ, EDGAR

MEDIDAS DE TENDENCIA CENTRALHablar de medidas de tendencia central significa, para decirlo con pocas palabras, encontrar valores que sean representativos de una muestra. Por ejemplo, cual es en un saln de clases la nota que ms alumnos obtuvieron, si el profesor desea saber en lneas generales como fue el rendimiento de un grupo de alumnos en una prctica calificada. Tambin podramos preguntarnos cul fue el promedio de las notas del saln, con el fin de comparar dicho resultado con el de las otras secciones del mismo curso. La manera de realizar los clculos para hallar los valores exactos depender, si tomamos en cuenta los tipos de variables estudiados, de si estamos estudiando variables continuas o variables discretas.

MODA Y MEDIANASituacin 1

William es un estudiante norteamericano que visita el Per por intercambio estudiantil. Es aficionado al futbol y quiere hacerse hincha del equipo peruano de mayor aceptacin. Para ello William realizo una encuesta entre algunos amigos peruanos en la que les pregunto por el equipo de futbol de su preferencia. Los resultados se muestran a continuacin:

Equipo de ftbol favoritoCantidad de hinchas

Sporting Cristal5

Cienciano4

Universitario de Deportes8

Alianza Lima6

a) Cul es la variable de estudio y de qu tipo es?b) Cuantas personas fueron encuestadas?c) Si William elige el equipo del que se har hincha basndose en esta informacin, qu equipo tendra que elegir?d) Que nombre podra llevar en Estadstica la respuesta seleccionada en c?

LA MODA (MO)La moda de un conjunto de datos es el puntaje o categora que ocurre con la mayor frecuencia, o equivalentemente la que se repite ms veces.Se adoptaran las siguientes convenciones: Si hay dos valores o categoras que se repiten igual nmero de veces y dicha cantidad de veces es la ms Alta, diremos que hay dos modas y que la distribucin de datos es bimodal. Si ninguna categora o valor se repite ms veces que los otros; o si hay ms de dos que se repiten ms veces, admitiremos que no hay moda.

As, por ejemplo, si se tienen los siguientes datos acerca de la escala de pago de 20 alumnos de Estudios Generales Letras:3 ; 1 ; 2 ; 1 ; 5 ; 5 ; 4 ; 3 ; 4 ; 52 ; 4 ; 3 ; 3 ; 2 ; 5 ; 3 ; 2 ; 4 ; 5

Se observa que la escala 3 y la escala 5 ocurren cinco veces cada una y esa es la mayor cantidad de veces que se repite uno de los datos. Es decir, dicho conjunto de datos tiene dos modas: escala 3 y escala 5.

Situacin 2Camila es una delegada estudiantil que recibe el encargo de analizar conjuntos de notas de un determinado curso. Una de las tareas que debe hacer es encontrar, para cada conjunto de notas, el valor Me que divide el conjunto en dos conjuntos con la misma cantidad de elementos.

a) Un conjunto A de notas es el siguiente: 08, 10, 14, 15, 15, 17, 19. Qu valor de Me obtendr Camila?

b) Otro conjunto B de notas es el siguiente: 18, 14, 16, 15, 12, 13. Puede obtener Camila el valor de Me como lo hizo en el caso anterior? Qu debera hacer?

c) Un tercer conjunto C de notas se presenta en la siguiente tabla de distribucin de frecuencias:

NotasCantidad de alumnos

82

103

147

155

164

172

191

TOTAL24

Qu columna adicional le sugerira completar a Camila para hallar un valor para Me? Cul podra ser ese valor?d) Se puede calcular Me para los datos de la situacin 14? Justifique la respuesta.La situacin ha servido para introducir otra medida de tendencia central llamada mediana.

CALCULO DE LA MODA DE DATOS AGRUPADOS POR INTERVALOSPara calcular la moda de n datos organizados por intervalos se siguen los siguientes pasos.

Dnde:= es el lmite inferior del intervalo modalC= es la amplitud del intervalo modal

LA MEDIANA (ME)

La mediana es un valor que deja por debajo de l la misma cantidad de datos que hay por encima de l.La mediana de un conjunto de datos de una variable cuantitativa (ordenados previamente de manera creciente o decreciente) ser: El dato que ocupa la posicin central, si el nmero de datos es impar. El promedio de los dos datos centrales, si el nmero de datos es par.Es importante notar que si el nmero de datos n es impar, entonces el dato centralOcupa la posicin . En cambio, si n es par hay dos trminos centrales que ocupan los lugares Para el caso de variables cualitativas ordinales tambin se podra definir la mediana luego de ordenar previamente los datos. Pero en lo que sigue solo se calculara la mediana de variables cuantitativas.

Situacin 1

a) Halle la mediana de las siguientes notas obtenidas por un estudiante a lo largo de un curso de Matemticas: 08; 14; 10; 18; 10; 15; 16.

b) Halle la mediana de las siguientes notas: 120; 100; 200; 250; 150; 200.

Situacin 2

A continuacin, se muestra informacin sobre el nmero de hijos por familia en una muestra de 50 familias de cierto asentamiento humano:

Nmero de hijos 0 1 2 3 4 5Cantidad de familias 7 8 10 11 9 5

Halle la mediana de los datos mostrados en la tabla.MEDIANA PARA DATOS AGRUPADOS

Si los valores de una variable se agrupan en una distribucin de frecuencias por intervalos, la mediana se determina aproximadamente por interpolacin de manera que la mitad de la inferior (50%) de los datos agrupados sean menores o iguales que la mediana.

Donde. = Limite real inferior de la clase mediana(es decir, la clase que contiene a la mediana)N= nmero total de datos = suma de frecuencias de todas las clases por debajo de la clase medianaC = tamao del intervalo de la clase medianaF= tamao del intervalo de la clase de la mediana

TRABAJO DOMICILIARIO Lic. MARTINEZ SANCHEZ, EDGAR

1. El ingeniero responsable de la construccin de un edificio debe planear el espacio destinado a estacionamientos para un nuevo complejo habitacional que tendr 80 departamentos. Se pide que la propuesta se base en el dato estadstico una medida de tendencia central del nmero de vehculos por departamento es 0,9.Puede ser 0,9 la mediana de la variable estadstica nmero de vehculos? Puede ser la moda? Por qu?2. A continuacin, se muestran los resultados obtenidos en una encuesta realizada a un grupo de aficionados al futbol con la finalidad de determinar la popularidad de los equipos que intervienen en el torneo de primera divisin.

Si se sabe que 200 aficionados respondieron que eran hinchas de otros equipos, responda a las siguientes preguntas:a) Cuantos aficionados fueron encuestados?b) Cuantos aficionados respondieron que eran hinchas del equipo B?c) Construya una distribucin de frecuencias para la informacin presentada.d) Es posible determinar la moda y la mediana de los datos? De ser posible, determine dichos valores e interprete su significado.

3. Sobre las carreras que estn estudiando un grupo de amigos de la promocin 2005 del colegio Albert Newton se sabe lo siguiente: 45 estudian Ingeniera industrial, 60 Ingeniera informtica, 70 Derecho, 15 Psicologa, 19 Economa, 27 Medicina, 18 Publicidad, 15 Arquitectura y 12 Educacin. Teniendo en cuenta la informacin dada, realice las siguientes actividades:a) Determine la variable estadstica involucrada y seale de que tipo es.b) Construya una tabla de distribucin de frecuencias para la informacin dada.c) Construya un grfico estadstico adecuado para representar la informacin dada.

4. Los siguientes datos muestran el total de horas semanales que invierten 50alumnos en conectarse a internet:37 38 17 35 16 14 44 23 36 1440 16 41 43 30 36 27 16 42 3220 36 14 24 21 31 33 30 35 4025 38 24 44 26 37 25 29 40 4235 39 39 34 34 36 38 40 32 35a) Determine la variable estadstica involucrada y seale de que tipo es.b) Utilizando seis intervalos de la misma amplitud, elabore una tabla de distribucin de frecuencias para datos agrupados que represente la informacin dada.c) Construya un grfico estadstico adecuado para representar la informacin dada.

MEDIA ARITMTICASituacin 1Jocelyn registra las notas de sus 7 primeras actividades en el curso de Matemticas:14; 10; 13; 18; 12; 15; 15a) Calcule la media aritmtica de las notas de las actividades de Jocelyn.b) Si Jocelyn desea que el promedio aritmtico de sus 8 primeras notas de actividades en el curso de Matemticas sea 14, qu nota deber obtener en la prxima actividad?La situacin 18 ha servido para recordar el concepto de media aritmtica.

MEDIA ARITMTICA DE UN CONJUNTO DE DATOSLa media aritmtica de un conjunto de datos de una variable cuantitativa es el nmero que resulta de sumar todos los datos y dividir dicha suma entre el nmero de datos.As, si se tienen los datos: x1; x2; x3; ... ; xn y se denota la media aritmtica de estos datos por ,

Entonces:

Esta frmula se suele expresar mediante la notacin sigma para sumas, as:

La media aritmtica (a diferencia de la moda y la mediana) involucra a todos los datos y, por lo tanto, es ms sensible a cambiar cuando se modifican los datos. Es la medida de tendencia central que posee las mejores propiedades para trabajar situaciones en la estadstica inferencial.

CMO SE HALLA LA MEDIA ARITMTICA PARA DATOS SIN AGRUPAR?Si se tienen n datos en una distribucin de frecuencias simple que consta de k clases.Dado que cada uno de los datos se repite tantas veces como lo indica su frecuencia absoluta y la suma de dichas frecuencias absolutas coincide con el nmero de datos, entonces si se tienen los datos agrupados en k clases, la formula ser:Por ejemplo, a partir de los siguientes datos, construya una distribucin de frecuencias y aproveche dicha distribucin para calcular la media aritmtica del nmero de hijos por familia.

Nmero de hijos 0 1 2 3 4 5Cantidad de familias 7 8 10 11 9 5

Se construye una tercera columna en el cuadro donde se colocan los productos de cada valor i x por su frecuencia absoluta.f1

f1

..

....

....

....

Por ejemplo, a partir de los siguientes datos, construya una distribucin de frecuencias y aproveche dicha distribucin para calcular la media aritmtica del nmero de hijos por familia.

CMO SE HALLA LA MEDIA ARITMTICA PARA DATOS AGRUPADOS?Cuando los datos con los que se cuenta han sido dados en intervalos, se requiere elegir un representante de cada intervalo para realizar el clculo de la media aritmtica. Adoptaremos como representante a la marca de clase de cada clase o intervalo.As, se empleara la siguiente formula:

Es importante sealar que el resultado que se obtenga ser un valor aproximado a la media aritmtica que se obtendra si se consideraran los n datos originales, es decir, si se consideraran los datos sin agrupar.

Situacin 2Calcule el ingreso promedio semanal de 200 profesores de academias de preparacin a partir de los datos mostrados en la siguiente tabla:

Ingresos semanales (en soles) Cantidad de p profesores[150 - 180[70[180 - 210[ 40[210 - 240[50[240 - 270[ 70[270 - 300[ 20 Total 200

TRABAJO DOMICILIARIO Lic. MARTINEZ SANCHEZ, EDGAR

1. Un grupo de 20 alumnos obtuvo las siguientes calificaciones en un examen cuyo puntaje mximo era 10 puntos.0 0 1 2 4 5 5 6 6 67 8 8 8 8 9 9 9 10 10Calcule la media aritmtica, la mediana y la moda.2. Al tabular las notas de un examen se obtuvieron los siguientes resultados:Nota 0708091011121314151617Frecuencia11111 6 8161820 2Calcule la media, la mediana y la moda de dichas notas.

3. El Colegio Mdico de un determinado pas tomo una muestra de 200 mdicos para averiguar sus honorarios por consulta. A continuacin se muestra la informacin parcial obtenida:

ClasesxifihiFiHi

[150 - 180[

60

110

0,25

- 300]

TOTAL

a) Complete la distribucin de frecuencias.b) Construya un grfico de barras para representar esta informacin.c) Calcule la media aritmtica de los datos.

4. De las edades en anos de cuatro personas, se sabe que x = 24, Me = 23 y Mo = 22. Determine las edades de las cuatro personas.

5. Una enfermera registro la temperatura media de un paciente durante 10 das consecutivos, y obtuvo los siguientes valores:

37,8 38,0 37,1 38,2 38,0 38,3 37,5 37,5 37,3 37,2a) Cul es la variable observada y de qu tipo es?b) Cul es la media, mediana y moda de la temperatura?

6. En la unidad de emergencias de un hospital se registr el motivo de atencin de los pacientes atendidos durante una semana, y se obtuvieron los siguientes resultados:

Motivo de la atencin Cantidad de pacientesCadas35Heridas provocadas por arma blanca30Atropellos 45Clicos estomacales 55Picaduras de insectos 10Intoxicaciones 25 Total 200

a) Cul es la variable observada y de qu tipo es?b) Con que grafico se representaran mejor estos datos? Dibuje usted dicho grfico.c) De las tres medidas de tendencia central media, mediana y moda, Cules tienen sentido para estos datos?

7. Un instituto especialista en realizar estadsticas realizo un estudio sobre la inversin anual, en miles de dlares, de las empresas peruanas. A continuacin, se muestra la inversin correspondiente a 40 empresas.31 17 27 20,4 28 10,2 34 25,4 4 24,515 39 18 30,5 41,5 26 12 46 18 2336 19,2 29 37 33 27 27 24 26,2 3125,4 28 33,4 28 22 23 31 29 35 21,2a) Halle la mediana, moda y media de los datos mostrados.b) Elabore una tabla de distribucin de frecuencias con 6 intervalos de igualc) Qu porcentaje de empresarios invierte menos de 18 000 dlares anuales?d) Qu porcentaje de empresarios invierte por lo menos 32 000 dlares anuales?e) Construya un grfico estadstico adecuado para representar la informacin dada.

8. Los siguientes datos muestran el total de horas a la semana que invierten 45 alumnos en interaccin con videojuegos35 38 34 41 26 37 25 29 4035 39 39 34 34 36 38 40 3237 47 17 35 16 44 46 23 3640 43 41 43 30 36 27 16 4620 36 12 24 21 31 33 33 35a) Halle la media aritmtica, la mediana y la moda de estos datos.b) Elabore una distribucin de frecuencias con 7 intervalos de la misma longitud para estos datos; incluya las frecuencias relativas porcentuales y las marcas de clase.c) Construya un grfico estadstico adecuado para representar dicha situacin.

9. A continuacin, se muestra informacin relacionada con el estado civil de los pobladores de la provincia Lima.

10. Analice el valor de verdad de las siguientes afirmaciones. Justifique sus respuestas.a) Si 6 alumnas tienen la misma nota en un examen, entonces la media, la mediana y la moda de estas 6 notas son iguales.b) La mediana de 6 datos que son nmeros naturales es siempre un nmero natural.c) Es posible realizar operaciones algebraicas con variables cualitativas.d) Si cada uno de los valores x1, x2, x3, x4, x5, y x6 de una variable estadstica es disminuido en una constante c, entonces la nueva media aritmtica es igual a la media aritmtica de los datos originales, incrementada en la constante c.e) Si a cada valor x1, x2, x3, x4, x5, y x6 de una variable estadstica se le multiplica por una constante c, entonces la nueva media aritmtica corresponder a la media aritmtica de los datos originales, multiplicada por c.