Estadistica modulo i

16
MODULO I: HISTORIA, NOCION DE ESTADISTICA Y SU UTILIZACION PARA LA INVESTIGACION UN POCO DE HISTORIA El uso de herramientas cuantitativas para el tratamiento de datos, tiene origen en épocas remotas. Se tiene información de hace más 3000 años antes de Cristo, donde las antiguas civilizaciones, como la Egipcia, aplicaron continuamente censos que ayudaban a la organización del estado y la construcción de las pirámides. El antiguo testamento nos sugiere que Moisés ordenó un “Censo” a la población Israelita para identificar los miembros de las familias. En la antigua Grecia y el Imperio Romano, era común la aplicación de censos para la planificación de impuestos y la prestación del servicio militar. La palabra estadística deriva del latín moderno statisticum collegium (“consejo de estado”), del latín antiguo status (“posición”, “forma de gobierno”), de la palabra italiana moderna statista (“estadista”, “político”) y del italiano antiguo stato (“estado”). En 1749, el alemán, Gottfried Achenwall (1719-1792) usa el término Statistik en su libro titulado “Staatswissenschaft der vornehmen Europäischen Reiche und Republiken”, quien originalmente designó la palabra estadística para el análisis de los datos de un gobierno, definiéndola como la “Ciencia del Estado”. A Gottfried Achenwall se le conoce como el “Padre de la Estadística”. La primera persona que introdujo el término estadística en Inglaterra fue Sir John Sinclair (1754-1835) con su trabajo “Statistical Account of Scotland” (1791-,1799) trabajo compilado en 21 volúmenes. El autor explica en su libro, que la palabra estadística la adoptó gracias al estudio de investigaciones realizadas en Alemania, como una palabra novedosa que llamaría la atención de los ingleses; a diferencia, de que en Alemania la estadística se usa como instrumento para medir la fortaleza de un estado, mientras que Sinclair, la emplearía como generadora de información interna para encontrar falencias y proponer mejoras en el país. A este trabajo le siguieron dos publicaciones: la segunda edición elaborada entre 1834 y 1845; la tercera edición comienza después de la segunda guerra mundial comprendiendo los periodos entre 1951 y 1992.1 El registro de nacimientos y defunciones comenzó en Inglaterra a principios del siglo XVI, y en 1662 apareció el primer estudio estadístico notable de población, titulado Observations on the London Bills of Mortality (Comentarios sobre las partidas de defunción en Londres). Un estudio similar sobre la tasa de mortalidad en la ciudad de Breslau, en Alemania, realizado en 1691, fue utilizado por el astrónomo inglés Edmund Halley como base para la primera tabla de mortalidad

Transcript of Estadistica modulo i

Page 1: Estadistica modulo i

MODULO I: HISTORIA, NOCION DE ESTADISTICA Y SU UTILIZACION PARA LA INVESTIGACION

UN POCO DE HISTORIA El uso de herramientas cuantitativas para el tratamiento de datos, tiene origen en épocas remotas. Se tiene información de hace más 3000 años antes de Cristo, donde las antiguas civilizaciones, como la Egipcia, aplicaron continuamente censos que ayudaban a la organización del estado y la construcción de las pirámides. El antiguo testamento nos sugiere que Moisés ordenó un “Censo” a la población Israelita para identificar los miembros de las familias. En la antigua Grecia y el Imperio Romano, era común la aplicación de censos para la planificación de impuestos y la prestación del servicio militar. La palabra estadística deriva del latín moderno statisticum collegium (“consejo de estado”), del latín antiguo status (“posición”, “forma de gobierno”), de la palabra italiana moderna statista (“estadista”, “político”) y del italiano antiguo stato (“estado”). En 1749, el alemán, Gottfried Achenwall (1719-1792) usa el término Statistik en su libro titulado “Staatswissenschaft der vornehmen Europäischen Reiche und Republiken”, quien originalmente designó la palabra estadística para el análisis de los datos de un gobierno, definiéndola como la “Ciencia del Estado”. A Gottfried Achenwall se le conoce como el “Padre de la Estadística”. La primera persona que introdujo el término estadística en Inglaterra fue Sir John Sinclair (1754-1835) con su trabajo “Statistical Account of Scotland” (1791-,1799) trabajo compilado en 21 volúmenes. El autor explica en su libro, que la palabra estadística la adoptó gracias al estudio de investigaciones realizadas en Alemania, como una palabra novedosa que llamaría la atención de los ingleses; a diferencia, de que en Alemania la estadística se usa como instrumento para medir la fortaleza de un estado, mientras que Sinclair, la emplearía como generadora de información interna para encontrar falencias y proponer mejoras en el país. A este trabajo le siguieron dos publicaciones: la segunda edición elaborada entre 1834 y 1845; la tercera edición comienza después de la segunda guerra mundial comprendiendo los periodos entre 1951 y 1992.1

El registro de nacimientos y defunciones comenzó en Inglaterra a principios del siglo XVI, y en 1662 apareció el primer estudio estadístico notable de población, titulado Observations on the London Bills of Mortality (Comentarios sobre las partidas de defunción en Londres). Un estudio similar sobre la tasa de mortalidad en la ciudad de Breslau, en Alemania, realizado en 1691, fue utilizado por el astrónomo inglés Edmund Halley como base para la primera tabla de mortalidad

Page 2: Estadistica modulo i

A comienzos del siglo XIX, la palabra estadística adopta un significado más generalizado hacia la recolección y clasificación de cualquier tipo de datos cuantitativos. William Playfair (1759-1823) expone su idea de que los gráficos permiten una comunicación más eficiente que las tablas de frecuencia. Es considerado como el inventor de los gráficos lineales, de barras y de sectores. Playfair publicó el libro titulado “The Commercial and Political Atlas” (1786) el cual contiene 43 gráficos de series de tiempo y por primera vez, es usado un gráfico de barras. En 1801 utiliza el primer gráfico de sectores en su obra “Playfair’s Statistical Breviary”.

También en este siglo, con la generalización del método científico para estudiar todos los

fenómenos de las ciencias naturales y sociales, los investigadores aceptaron la necesidad de reducir la información a valores numéricos para evitar la ambigüedad de las descripciones verbales.

Sir Francis Galton (1822-1911) creó el concepto estadístico de regresión y correlación, y fue el primero en aplicar métodos estadísticos para estudiar las diferencias humanas basadas en el uso de cuestionarios y entrevistas para recolectar los datos. Herman Hollerith (1860-1929) fue un estadístico estadounidense quien desarrollo la primera máquina tabuladora basada en tarjetas perforadas y mecanismos eléctrico-mecánicos para el tratamiento rápido de millones de datos. Su máquina fue usada en el censo de 1890 en estados unidos que redujo la tabulación de los datos de 7 años (censo de 1880) a 2.5 años. En nuestros días, la estadística se ha convertido en un método efectivo para describir con exactitud los valores de datos económicos, políticos, sociales, psicológicos, biológicos y físicos, y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadístico no consiste ya sólo en reunir y tabular los datos, sino sobre todo en el proceso de interpretación de esa información. El desarrollo de la teoría de la probabilidad ha aumentado el alcance de las aplicaciones de la estadística. Muchos conjuntos de datos se pueden aproximar, con gran exactitud, utilizando determinadas distribuciones probabilísticas; los resultados de éstas se pueden utilizar para analizar datos estadísticos. La probabilidad es útil para comprobar la fiabilidad de las inferencias estadísticas y para predecir el tipo y la cantidad de datos necesarios en un determinado estudio estadístico.

DEFINICION DE ESTADISTICA Como vimos en el apartado anterior, la estadística a variado su significado a través del tiempo,

pasando de ser una herramienta usada solo para la administración de los gobiernos, a una ciencia con un sin fin de aplicaciones en diferentes disciplinas

La estadística admite varias definiciones entre las que podemos citar

"El estudio, recuento y comparación de cifras para observar o analizar los procesos de cualquier conjunto de hechos".

“El estudio de los métodos y procedimientos para recoger, clasificar, resumir y analizar datos y para hacer inferencias científicas partiendo de tales datos".

Una ciencia básica cuyo objetivo principal es el procesamiento y análisis de grandes volúmenes de datos, resumiéndolos en tablas, gráficos e indicadores estadísticos, que permiten la fácil compresión de las características concernientes al fenómeno estudiado.

Un área de la matemática aplicada orientada a la recolección e interpretación de datos cuantitativos y al uso de la teoría de la probabilidad para calcular los parámetros de una población.

Page 3: Estadistica modulo i

UTILIDAD DE LA ESTADISTICA Quizá uno se puede preguntar por que razón es importante la estadística. Hay varios motivos por

los cuales se debe conocer y manejar la estadística:

COMO HERRAMIENTA DE TRABAJO: La estadística es de una utilidad inmediata y practica.

Ayuda a que el trabajo diario y repetitivo se efectúe con más rapidez y eficacia. Ayuda a los profesores en la determinación de calificaciones y en la realización de test. Ayuda a interpretar sus datos y observaciones. En las ciencias del comportamiento, la estadística se ha convertido en una parte

imprescindible del trabajo. En todos estos campos, la eficacia y la facilidad de operación exige un conocimiento de

los métodos estadísticos básicos EN LA SOLUCION DE PROBLEMAS:

La investigación se lleva a menudo según una escala limitada, no para comprobar la

teoría, sino para revisar alguna información vital para la solución de un problema practico. Es frecuente que surjan preguntas como estas.

¿Cuáles son los alumnos que más rápido corren? ¿El método de entrenamiento aplicado a este grupo, es mejor o peor que el que

emplee para con otro? ¿Existe alguna relación entre las variables obtenidas con un grupo y otro?

Evidentemente, las respuestas se obtienen aplicando los métodos estadísticos a los datos observados

EN LA INVESTIGACION TEORICA:

Las ciencias del comportamiento han alcanzado, hoy en día un alto grado de elaboración,

se han hecho más cuantitativas. El desarrollo de teorías es útil para organizar la información disponible. Las teorías predicen lo que se espera observar en circunstancias determinadas. Los medios con que se comprueban las teorías de las ciencias de la educación, psicología, sociología y economía son en gran parte estadísticos.

COMPRESION Y UTILIZACION DE LA INVESTIGACION:

Un profesional competente, además de su especialidad, tiene que estar al corriente de

los avances técnicos. Debe comprender los informes de la investigación aplicada y teórica. En las ciencias del comportamiento, esto exige que conozca el significado de ciertos términos estadísticos, y cuando se puede emplear un método particular. Desgraciadamente, no toda investigación es una buena investigación y el peso de la evaluación cae, finalmente en el lector. Las estadísticas pueden ser mal empleadas o mal interpretadas, pero para aquellos que la entiende, les dicen la verdad o no le dicen nada

SATISFACCION PERSONAL:

Muchos estudiantes creen o piensan que el hecho de recoger y analizar datos es tarea

poco grata. Pero con los datos obtenidos encontramos que solucionamos un problema o nos demás cuenta que el método aplicado al entrenamiento de un deportista fue acertado; estaremos en presencia de un logro personal, con solo haber utilizado a la estadística como herramienta para obtener la información que queríamos saber

Page 4: Estadistica modulo i

CLASIFICACION DE LA ESTADISTICA

La estadística se puede dividir en 2 categorías, la "estadística inferencial o inductiva" y la

"estadística descriptiva o deductiva"

Inferencial o inductiva tiene por objeto establecer previsiones o conclusiones sobre una población basándose en los resultados obtenidos de una muestra

Descriptiva o deductiva, tiene por objeto recoger, recopilar, y calcular de valores estadísticos que representan al conjunto de datos. Pueden representarse dentro de su organización en tablas y gráficos. La estadística descriptiva sirve como método para organizar datos y poner de manifiesto sus características esenciales con el propósito de llegar a conclusiones.

DEFINICIONES DE TERMINOS ESTADISTICOS:

Población: es el conjunto de elementos, individuos o entes, sujetos a estudio y de los cuales se desea obtener un resultado.

Las personas o cosas que forman parte de la población se denominan elementos. En sentido

estadístico un elemento puede ser algo con existencia real, como un automóvil o una casa, o algo más abstracto como la temperatura, un voto, o un intervalo de tiempo. A su vez, cada elemento de la población tiene una serie de características que pueden ser objeto del estudio estadístico. Así por ejemplo si consideramos como elemento a una persona, podemos distinguir en ella los siguientes caracteres: Sexo, Edad, Nivel de estudios, Profesión, Peso, Altura, Color de pelo, Etc.

A partir de este concepto, se desprende que de cada elemento de la población podremos estudiar

uno o más aspectos, cualidades o caracteres. La población puede ser según su tamaño de dos tipos:

Población finita: Cuando el número de elementos que la forman es finito, por ejemplo el número de alumnos de una escuela o la cantidad de jugadores de un club de básquet de distintas categorías.

Población infinita: Cuando el número de elementos que la forman es infinito, o tan grande

que pudiesen considerarse infinitos... Como por ejemplo si se realizase un estudio sobre los productos que hay en el mercado. Hay tantos y de tantas calidades que esta población podría considerarse infinita.

Ahora bien, normalmente en un estudio estadístico, no se puede trabajar con todos los elementos

de la población sino que se realiza sobre un subconjunto de la misma. Este subconjunto se llama muestra

Muestra: Es un subconjunto de una población. Una muestra es representativa cuando los elementos son seleccionados de tal forma que pongan de manifiesto las características de una población. Su característica más importante es la representatividad. La selección de los elementos que conforman una muestra pueden ser realizados de forma probabilística o aleatoria (al azar), o no

Page 5: Estadistica modulo i

Las poblaciones son grupos definidos arbitrariamente y engloban a las muestras. Ejemplo: Si se censan escuelas, cada escuela es un individuo y el conjunto de escuelas en la población Si se recopilan datos de cualquier test en una escuela, cada división o curso es un

instrumento y la escuela toda es la población Las muestras son partes de la población. Una de las aplicaciones más importantes de la

estadística es hacer inferencia acerca de grupos muy grandes basándose en la información obtenida de pequeños grupos. En otras palabras, se trata de conocer la población a partir de los datos de una o más muestras.

Distinguimos dos tipos fundamentales de muestreo:

Muestreo probabilístico (aleatorio): En este tipo de muestreo, todos los individuos de la población pueden formar parte de la muestra, tienen probabilidad positiva de formar parte de la muestra. Por lo tanto es el tipo de muestreo que deberemos utilizar en nuestras investigaciones, por ser el riguroso y científico.

Muestreo no probabilístico (no aleatorio): En este tipo de muestreo, puede haber clara

influencia de la persona o personas que seleccionan la muestra o simplemente se realiza atendiendo a razones de comodidad. Salvo en situaciones muy concretas en la que los errores cometidos no son grandes, debido a la homogeneidad de la población, en general no es un tipo de muestreo riguroso y científico, dado que no todos los elementos de la población pueden formar parte de la muestra. Por ejemplo, si hacemos una encuesta telefónica por la mañana, las personas que no tienen teléfono o que están trabajando, no podrán formar parte de la muestra.

Métodos de muestreo probabilísticas Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de

equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de tamaño n tienen la misma probabilidad de ser elegidas. Sólo estos métodos de muestreo probabilísticos nos aseguran la representatividad de la muestra extraída y son, por tanto, los más recomendables. Dentro de los métodos de muestreo probabilísticos encontramos los siguientes tipos:

Muestreo aleatorio simple: Todos los individuos tienen la misma probabilidad de ser

seleccionados. La selección de la muestra puede realizarse a través de cualquier mecanismo probabilístico en el que todos los elementos tengan las mismas opciones de salir. El procedimiento empleado es el siguiente:

1º. Se asigna un número a cada individuo de la población 2º. A través de algún medio mecánico (bolitas dentro de una bolsa, tablas de números

aleatorios, números aleatorios generados con una calculadora o computadora, etc.) se eligen tantos sujetos como sea necesario para completar el tamaño de muestra requerido.

Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la

población que estamos manejando es muy grande.

Page 6: Estadistica modulo i

En este ejemplo se seleccionaron al azar 7 individuos de una población de 20

Muestreo aleatorio sistemático: Este procedimiento exige, como el anterior, numerar todos los elementos de la población, pero en lugar de extraer n números aleatorios sólo se extrae uno. Se parte de ese número aleatorio i , que es un número elegido al azar, y los elementos que integran la muestra son los que ocupan los lugares 2 3 1i ; ( i k ); ( i k ),( i k ) : i ( n )k . Es decir se toman los individuos de k en k , siendo k el resultado de dividir el tamaño de la población entre

el tamaño de la muestra Nkn

. El número i que empleamos como punto de partida será un

número al azar entre 1 yk . 6060 15 4 215

N n k i

El riesgo se este tipo de muestreo está en los casos en que se dan periodicidades en la población ya que al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una homogeneidad que no se da en la población. Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros son varones y los 5 últimos mujeres, si empleamos un muestreo aleatorio sistemático con k=10 siempre seleccionaríamos o sólo hombres o sólo mujeres, no podría haber una representación de los dos sexos.

Ejemplo: Tenemos 60 alumnos y queremos tomar 15 de ellos en una muestra. 60 425

k .

Aleatoriamente utilizamos el número 2i . Entonces comenzando del 2° alumno, vamos extrayendo de a 4 aleatoriamente.

Page 7: Estadistica modulo i

Muestreo aleatorio estratificado: Trata de obviar las dificultades que presentan los

anteriores ya que simplifican los procesos y suelen reducir el error muestral para un tamaño dado de la muestra. Consiste en considerar categorías típicas diferentes entre sí (estratos) que poseen gran homogeneidad respecto a alguna característica (se puede estratificar, por ejemplo, según la profesión, el municipio de residencia, el sexo, el estado civil, etc.). Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de interés estarán representados adecuadamente en la muestra. Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarán parte de la muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues exige un conocimiento detallado de la población. (tamaño geográfico, sexos, edades,...). Se divide la población en clases o estratos y se escoge, aleatoriamente, un número de individuos de cada estrato proporcional al número de componentes de cada estrato.

Ejemplo: En una escuela primaria hay 600 alumnos entre el segundo y tercer ciclo. Queremos

tomar una muestra de 20 alumnos. Sabemos que hay 200 alumnos en cuarto grado, 150 en quinto, 150 en sexto y 100 en séptimo. Procedemos entonces de esta manera

11

20 20 200 6 6 7 4 600 200 600

x *x . alumnos de to grado

22

20 20 150 5 5 600 150 600

x *x alumnos de to grado

33

20 20 150 5 6 600 150 600

x *x alumnos de to grado

44

20 20 100 3 3 3 4 600 100 600

x *x . alumnos de to grado

Una vez que tengo la cantidad, puedo aplicar cualquiera de las dos técnicas anteriormente

descriptas para seleccionar la cantidad de alumnos determinados Es frecuente que cuando se realiza un estudio que interese estudiar una serie de subpoblaciones

(estratos) en la población, siendo importante que en la muestra haya representación de todos y cada uno de los estratos considerados. El muestreo aleatorio simple no nos garantiza que tal cosa ocurra. Para evitar esto, se saca una muestra de cada uno de los estratos.

Hay dos conceptos básicos: Estratificación: El criterio a seguir en la formación de los estratos será formarlos de tal

manera que haya la máxima homogeneidad en relación a la variable a estudio dentro de cada estrato y la máxima heterogeneidad entre los estratos.

Afijación: Reparto del tamaño de la muestra en los diferentes estratos o subpoblaciones.

Existen varios criterios de afijación entre las que se destaca:

Afijación igual: Todos los estratos tienen el mismo número de elementos en la muestra.

Afijación proporcional: Cada estrato tiene un número de elementos en la muestra

proporcional a su tamaño.

Page 8: Estadistica modulo i

Afijación Óptima: Se tiene en cuenta la previsible dispersión de los resultados, de modo que se considera la proporción y la desviación típica. Tiene poca aplicación ya que no se suele conocer la desviación.

Ejemplo: Supongamos que estamos interesados en estudiar el grado de aceptación que la

implantación de la reforma educativa ha tenido entre los padres de una determinada provincia. A tal efecto seleccionamos una muestra de 600 sujetos. Conocemos por los datos del ministerio que de los 10000 niños escolarizados en las edades que nos interesan, 6000 acuden a colegios públicos, 3000 a colegios privados y 1000 a colegios privados de gestión pública. Como estamos interesados que en nuestra muestra estén representados todos los tipos de colegio, realizamos un muestreo estratificado empleando como variable de estratificación el tipo de escuela.

Si empleamos una afijación simple elegiríamos 200 niños de cada tipo de centro, pero ¿esta bien

la proporción? ¿Están todos los colegios representados de la misma manera? En este caso parece más razonable utilizar una afijación proporcional pues hay bastante

diferencia en el tamaño de los estratos. Por consiguiente, calculamos que proporción supone cada uno de los estratos respecto de la población para poder reflejarlo en la muestra.

Colegios públicos:6000 0 60

10000. Colegios privados

3000 0 3010000

.

Colegios privados de gestión pública 1000 01010000

.

Para conocer el tamaño de cada estrato en la muestra no tenemos más que multiplicar esa proporción por el tamaño muestral.

Colegios públicos: 0 60 600 360. * padres Colegios privados: 0 30 600 180. * padres Colegios privados de gestión pública: 0 10 600 60. * padres Muestreo aleatorio por conglomerados: Los métodos presentados hasta ahora están pensados

para seleccionar directamente los elementos de la población, es decir, que las unidades muéstrales son los elementos de la población. En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la población que forman una unidad, a la que llamamos conglomerado. El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de conglomerados (el necesario para alcanzar el tamaño muestral establecido) y en investigar después todos los elementos pertenecientes a los conglomerados elegidos.

Ejemplo: En una investigación en la que se trata de conocer el grado de satisfacción laboral de los profesores de los institutos de formación docente, necesitamos una muestra de 700 sujetos. Ante la dificultad de acceder individualmente a estos sujetos se decide hacer una muestra por conglomerados. Sabiendo que el número de profesores por instituto es aproximadamente de 35, los pasos a seguir serían los siguientes:

1. Recoger un listado de todos los institutos de formación docente. 2. Asignar un número a cada uno de ellos. 3. Elegir por muestreo aleatorio simple o sistemático los 20 institutos (700/35=20) que

nos proporcionarán los 700 profesores que necesitamos.

Page 9: Estadistica modulo i

TIPOS CARACTERÍSTICAS VENTAJAS INCONVENIENTES

Ale

ator

io s

impl

e

Se selecciona una muestra de tamaño n de una población de N unidades, cada elemento tiene una probabilidad de inclusión igual y conocida de n/N.

Sencillo y de fácil comprensión.

Cálculo rápido de medias y varianzas.

Se basa en la teoría estadística, y por tanto existen paquetes Informáticos para analizar los datos

Requiere que se posea de antemano un listado completo de toda la población.

Cuando se trabaja con muestras pequeñas es posible que no represente a la Población adecuadamente.

Sis

tem

átic

o

Conseguir un listado de los N elementos de la población

Determinar tamaño muestral n.

Definir un intervalo k= N/n.

Elegir un número aleatorio, r, entre 1 y k (r= arranque aleatorio).

Seleccionar los elementos de la lista.

Fácil de aplicar. No siempre es necesario

tener un listado de toda la población.

Cuando la población está ordenada siguiendo una tendencia conocida, asegura una cobertura de unidades de todos los tipos

Si la constante de muestreo está asociada con el fenómeno de interés, las estimaciones obtenidas a partir de la muestra pueden contener sesgo de selección

Estr

atif

icad

o .

En ciertas ocasiones resultará conveniente estratificar la muestra según ciertas variables de interés.

Por eso debemos conocer la composición estratificada de la población objetivo a hacer un muestreo.

Una vez calculado el tamaño muestral apropiado, este se reparte de manera proporcional entre los distintos estratos definidos en la población usando una simple regla de tres.

Tiende a asegurar que la muestra represente adecuadamente a la población en función de unas variables seleccionadas.

Se obtienen estimaciones más precisa

Su objetivo es conseguir una muestra lo más semejante posible a la población en lo que a las variables estratificadotas se refiere.

Se ha de conocer la distribución en la población de las variables utilizadas para la estratificación.

Cong

lom

erad

os

Se realizan varias fases de muestreo sucesivas La necesidad de listados de las unidades de una etapa se limita a aquellas unidades de muestreo seleccionadas en la etapa anterior.

Es muy eficiente cuando la población es muy grande y dispersa.

No es preciso tener un listado de toda la población, sólo de las unidades primarias de muestreo.

El error estándar es mayor que en el muestreo aleatorio simple o estratificado. El cálculo del error estándar es complejo

Comparación entre distintos Tipos de Muestreo Probabilística

Page 10: Estadistica modulo i

OTRAS DEFINICIONES ESTADISTICAS

Tamaño muestral: Es el número de elementos u observaciones que se recolecciona de la muestra.

Dato: Cada uno de los individuos, cosas, entes abstractos que integran una población o universo determinado. Dicho de otra forma, cada valor observado de la variable.

Estadístico: Cualquier característica medible calculada sobre una muestra o población. Variable: es cada una de las características o cualidades que poseen los individuos de

una población

Las variables se pueden dividir en variable cual itativa y variable cuantitativa La variable cualitativa es aquellas que no aparecen en forma numérica, sino como categorías o

atributos (sexo, profesión, color de ojos) Podemos distinguir dos tipos:

Variable cualitativa nominal: Solo permite la clasificación, no se puede establecer ningún tipo de orden. Ejemplos Nacionalidad: Argentino, Uruguayo, Español Sexo: Femenino, Masculino Estadio Civil: Casado, Divorciado, Separado, Soltero

Variable cualitativa ordinal: Hay una clasificación con cierto orden natural. Hay diferencia de grado o nivel, presentan modalidades no numéricas en la s que existen un orden. Por ejemplo: Puesto conseguido en una prueba: 1° 2° 3° Medalla obtenida. Oro, Plata, Bronce

La variable cuantitativa es la que se expresa mediante un número, por tanto se pueden

realizar operaciones aritméticas con ella. Podemos distinguir dos tipos:

Variable cuantitativa discreta: Es aquella que toma valores aislados, es decir no admite valores intermedios entre dos valores específicos. Ejemplos El número de hermanos: 2, 1, 0, 1, 3 La cantidad de pelotas encestadas por partido en un torneo de básquet: 30, 35,

38, 32 La cantidad de abdominales realizado durante un minuto, por un grupo de alumnos:

42, 43, 45, 51 Variable cuantitativa continua: Es aquella que puede tomar valores comprendidos

entre dos números. Por ejemplo: La estatura de los alumnos: 1.73, 1.82, 1.77, 1.69, 1.75. (En la práctica medimos la

altura con dos decimales, pero también se podría dar con tres decimales. Los metros recorridos en 40 segundos por un grupo de atletas. 230, 245, 287,

241 Potencia de miembros inferiores expresados en KGM/SEG de un grupo de

jugadores de voleibol 46.3 48.2 52.9 55.1 58.4

Page 11: Estadistica modulo i

QUE SE PUEDE HACER CON LA ESTADISTICA

Todos los docentes recogen a diario gran número de datos deferentes. Muchos de ellos proceden de instrumentos de medición validos. El conocimiento de la estadística es imprescindible en la interpretación y análisis de dichos datos. ¿Qué se puede hacer con esos datos?

Se pueden calcular las medias aritméticas o promedios. La media proporciona una ubicación del comportamiento característico del grupo

Se pueden calcular la dispersión de datos _(Desvíos) en torno a un dato central

Se pueden preparar gráficas, tablas o figuras para describir claramente la naturaleza del

grupo o de los grupos

Es posible determinar relación de una variable con otra. Estos estadígrafos se llaman coeficientes de correlación y su utilidad es enorme. Por ejemplo para hallar las relaciones entre los resultados de un test de velocidad y los tiempos empleados en una carrera de 100 metros.

A partir de las mediciones en una muestra de individuos, se pueden obtener deducciones

acerca de la población de la que procede dicha muestra

Se puede determinar la fiabilidad de los instrumentos de medición o la validez de las mediciones.

Se pueden comparar los comportamientos o actuaciones de dos grupos. Supongamos que un

una escuela se esta ensayando un nuevo sistema de entrenamiento. Se eligen dos grupos; a uno se le enseña durante un determinado tiempo con el sistema tradicional o utilizado anteriormente y al otro con el nuevo. Se toman luego los resultados y se extraen conclusiones, etc., etc.,

EL METODO ESTADISTICO

El proceso de aplicación de la estadística implica una serie de pasos

1. Selección y determinación de la población o muestra Se debe además seleccionar las características contenidas que se desean estudiar. En el

caso de que se desee tomar una muestra, es necesario determinar el tamaño de la misma y el tipo de muestreo a realizar (probabilístico o no probabilístico).

2. Recuento, relevamiento y compilación de datos

La etapa inicial consiste en la recolección de datos, generalmente muy numerosos, referidos a la situación que se investiga. Estos datos brindan información sobre las características de los individuos pertenecientes a la población objeto de estudio. La obtención de los datos puede ser realizada mediante la observación directa de los elementos, la aplicación de encuestas y entrevistas, y la realización de experimentos.

3. Tabulacion y agrupamiento de datos

Los datos recogidos son convenientemente ordenados, clasificados y tabulados; es decir dispuestos en tablas que facilitan la lectura.

Page 12: Estadistica modulo i

4. Medición de datos En esta etapa comienza la elaboración matemática y medición de los datos. El análisis se

complementa con la obtención de indicadores estadísticos como las medidas: de tendencia central, dispersión, posición y forma. Se observa que los datos tienden a centrarse en torno a ciertos valores llamados parámetros o medida de posición (Promedio, Mediana, Modo, Etc.,)

5. Elaboración de gráficos

A partir de la medición de datos se establecen gráficos al respecto que permiten una interpretación simple y rápida de los hechos y por otra parte pueden conducir a la elección de los métodos mas adecuados para el análisis de datos.

6. Inferencia estadística. Predicción

Después de la medición de datos la Teoría de la Probabilidad acude en ayuda de la Estadística. Se deducen las llamadas leyes de inferencia que permiten predecir el comportamiento futuro de la población investigada

7. Elaboración de conclusiones.

Se construye el informe final.

Desarrollo de los pasos

PASO 1 Selección y determinación de la población o muestra

Trataremos de definir los conceptos básicos necesarios para calcular una muestra representativa sobre el total de una población, considerando como tal al conjunto de individuos de los que se quiere obtener una información. Por ejemplo, si deseamos conocer la opinión general de un total de alumnos, podríamos preguntarles a todos y sacar la media aritmética u otros parámetros, pero para aquellos casos en los que este número de alumnos es muy elevado, la estadística nos permite tomar sólo una muestra de forma aleatoria. De este modo, preguntando únicamente a los alumnos resultantes de la muestra, los porcentajes medios que obtendremos de sus respuestas serán los mismos que si preguntásemos al total de la población. El error que se comete debido al hecho de que se obtienen conclusiones del total de una población a partir del análisis de sólo una parte de ella, se denomina error de muestreo.

Obtener una muestra adecuada significa lograr una versión simplificada de la población, que reproduzca de algún modo sus rasgos básicos.

Cálculo del tamaño muestral.

Cada estudio tiene un tamaño muestral idóneo, que permite comprobar lo que se pretende con la seguridad y precisión fijadas por el investigador. Esta seguridad y precisión dependerán del rango de posibles respuestas (necesitaremos una muestra más pequeña si las opciones son si o no, que si por el contrario la opción es elegir entre 1 y 10). Así mismo, también influirá si el estudio se realiza sobre una población finita o infinita. Las formulas son las siguientes

Población Finita

2

2 21

Z * N * p* qne * N Z * p* q

Población infinita 2

2Z * p* qn

e

Page 13: Estadistica modulo i

A continuación se explica cada uno de los parámetros indicados en la formula n Tamaño de la muestra N Tamaño de la población si se conoce (Población finita) Z Valor correspondiente a la distribución de Gauss. Para el 95% de confianza, Z=1.96, para el

99% de confianza 2.57. (Estos valores provienen de las tablas de la distribución normal Z)Se explicara luego cuando se desarrolle curvaturas y desvío estándar)

p Probabilidad de éxito o proporción esperada. Esta idea se puede obtener revisando la literatura, por estudio pilotos previos. Asumamos que puede ser próxima al 5%. En caso de no tener dicha información utilizaremos el valor p = 0.5 (50%).

q Probabilidad de fracaso 1 p e Precisión (error máximo admisible en términos de proporción) Ejemplo 1: ¿A cuántos estudiantes tendríamos que censar para conocer la preferencia de una

ropa deportiva de mercado, si se conoce que el número de estudiantes que pueden estar interesados en usar esa ropa es de 1.500?

Proporción esperada = asumamos que puede ser próxima al 5%; si no tuviese ninguna idea de dicha proporción utilizaríamos el valor p = 0.5 (50%) que maximiza el tamaño muestral.

1500N 1 96Z . 0 05p . . 1 0 05 0 95q . . 3 0 03e % .

2

2 21 96 1500 0 05 0 95 178 71 179

0 03 1500 1 1 96 0 05 0 95

. * * . * .n .. * . * . * .

Se requeriría encuestar a no menos de 179 estudiantes para poder tener una seguridad del 95% Ejemplo 2 ¿Cómo hubiera cambiando el ejemplo anterior, si se desconoce la proporción esperada? Si se desconoce la proporción esperada, se tendría que utilizar el criterio conservador (p = q =

0.5), lo cual maximiza el tamaño de muestra de la siguiente manera:

2

2 21 96 1500 0 5 0 5 623 7 624

0 03 1500 1 1 96 0 5 0 5

. * * . * .n .. * . * . * .

Se requeriría encuestar a no menos de 624 estudiantes Ejemplo 3 ¿A cuántos estudiantes tendríamos que censar para conocer la preferencia de una ropa

deportiva de mercado, si se desconoce la población total y no tenemos idea de la proporción esperada?

1 96Z . 0 5p . . 1 0 5 0 5q . . 3 0 03e % . 2

21 96 0 5 0 5 1067

0 03

. * . * .n.

Page 14: Estadistica modulo i

COMO TRABAJAR CON DATOS ORDENADOS Y AGRUPADOS En la estadística se utilizan varias medidas que van dando el comportamiento del grupo. Cuando

uno procesa los datos puede ser que trabaje con estos ORDENADOS o bien se los AGRUPA. Esto depende de la cantidad de datos que manejemos. Un consejo es de trabajar con datos agrupados a partir de una cantidad considerable de datos (por ejemplo más de cincuenta datos), ya que facilita el procesamiento de los mismos.

Las Tablas con datos ordenados se caracterizan por manejar un conjunto pequeño de posibles

resultados de una variable dentro de la muestra o población. Por lo general, su uso tiende al manejo de datos cualitativos o variables cuantitativas discretas.

Ejemplo: Tabla de datos ordenados

Determinamos un test de lanzamiento al aro de básquet frente a este y sobre el borde de la línea de triple y anotamos la cantidad de encestadas sobre diez lanzamiento posibles. Luego establecemos una escala conceptual sobre la siguiente cantidad de emboques. 0-1-2 MALO. 3-4 REGULAR, 5-6 BUENO, 7-8 MUY BUENO y 9-10 EXCELENTE: Los resultados de 10 jugadores fueron los siguientes

Jugador Aciertos Clasificación

A 7 Bueno B 6 Bueno C 8 Muy bueno D 6 Bueno E 10 Excelente F 4 Regular G 6 Bueno H 6 Bueno I 1 Malo J 7 Muy bueno k 8 Muy bueno L 5 Regular

En presencia de estos puntajes, confeccionamos una nueva tabla Como podemos observar, el numero de resultados que puede alcanzar la variable Clasificación son

pocos (solo cinco posibilidades), por lo cual identificaremos la tabla de frecuencia resultante como una tabla de datos ordenados

La estadística considera otros tipos de frecuencias auxiliares La forma más simple de agrupar datos consiste en indicar el número de veces que figura cada

valor de la variable estudiada. Ese numero de veces que la variable toma un determinado valor se llama frecuencia.

Clasificación Frecuencia Malo 1

Regular 2 Bueno 5

Muy bueno 3 Excelente 1

Page 15: Estadistica modulo i

¿Cómo construir una tabla de frecuencias?

El número de intervalos, k, a utilizar no está determinado de forma fija y por tanto tomaremos

un k que nos permita trabajar cómodamente y ver bien la estructura de los datos; Como referencia nosotros tomaremos una de los siguientes valores aproximados:

Donde n es la cantidad de datos que tengo registrados Por ejemplo si el número de observaciones que tenemos es , un buen criterio es agrupar

las observaciones intervalos. Sin embargo si tenemos , será más razonable elegir intervalos,

que 1º. Determinamos el Rango, que es igual a R dato max dato min

2º. Determinamos la amplitud de intervalo (limites entre el menor valor y mayor valor que va a

tener cada intervalo) Rik

3º. Con estos datos construimos la tabla correspondiente Ejemplo: Tenemos 46 (cuarenta y seis) datos correspondiente a una prueba de salto en largo 317 324 329 331 337 338 340 344 344 345 345 347 350 351 352 352 352 354 354 355 358 359 360 360 361 361 361 361 365 365 366 367 368 368 371 373 375 379 380 382 382 387 391 394 398 406

Como n no es muy grande elegimos , tomamos 7 intervalos

406 317 89R

89 12 71 137

i , Se recomienda que la amplitud sea impar.

Una vez calculado los valores procedemos a confeccionar la tabla

X f fa PM 317- 329 3 3 323 330-342 4 7 336 343-355 13 20 349 356-368 14 34 362 369-381 5 39 375 382-394 5 44 388 395-407 2 46 403

Page 16: Estadistica modulo i

Si sumamos sucesivamente cada frecuencia nos encontramos con la frecuencia acumulada, cuyo

numero final nos da como resultado la totalidad de alumnos que participaron de la muestra al que llamaremos con la letra n . El agrupamiento de datos se hace a través de intervalos de clase o simplemente intervalos