Estadistica Unidad 1

15
1 UNIVERSIDAD NACIONAL DE CUYO FACULTAD DE FILOSOFÍA Y LETRAS-CARRERA GEOGRAFÍA MATEMÁTICA Y ESTADÍSTICA-CICLO 2015 Documento bibliográfico elaborado por la cátedra para los contenidos de la unidad I Cont. M. del C. Carrió de Scaccia Especialista en Docencia Universitaria La Estadística como uno de los instrumentos del método científico La geografía es una ciencia antigua, cuya continuidad se aseguró en el XIX en relación con su papel en la enseñanza, a la vez que se configuraba como una disciplina científica. Como tal disciplina se puede identificar a partir de dos dimensiones características: como una estructura social, con la existencia de una comunidad científica estructurada; y como una empresa intelectual definida por el estudio de dos problemas clave, a saber: la diferenciación del espacio en la superficie terrestre y el estudio de la interacción de fenómenos físicos y humanos, de las relaciones hombre-naturaleza. 1 Como toda disciplina científica, la Geografía obtiene el conocimiento mediante un procedimiento denominado método científico. La palabra método, deriva del griego methodos; que significa camino o sendero que se ha de seguir para alcanzar un fin propuesto. En el caso de la ciencia la finalidad del método es la producción del conocimiento. El método sería, entonces, un modo de proceder estructurado para lograr conocimiento científico; en otras palabras es el conjunto de procedimientos que, valiéndose de los instrumentos o técnicas necesarias, aborda y soluciona un problema o un conjunto de problemas de conocimiento. Uno de estos instrumentos es la Estadística, considerada como la tecnología del método científico ya que se utiliza en cualquier campo de la ciencia porque proporciona herramientas metodológicas generales que permiten: El resumen de los datos y extracción de información relevante de los mismos La búsqueda y evaluación de los modelos y pautas que ofrecen los datos, pero que se encuentran ocultos por la inherente variabilidad aleatoria de los mismos. El diseño eficiente de experimentos y encuestas La comunicación entre científicos, ya que siempre será más fácil comprender la referencia a un procedimiento estándar, sin necesidad de mayor detalle. Las nociones de Estadística, si bien son esenciales para facilitar la comprensión de la llamada “nueva geografía”, no son la “piedra filosofal”, ni resuelven todos los problemas geográficos, pero bien administrados, son herramientas que suscitan nuevos problemas y ayudan a resolver los tradicionales de una manera precisa y rigurosa. 1 Capel, Horacio. Scripta Nova. Revista Electrónica de Geografía y Ciencias Sociales. Universidad de Barcelona. [ISSN 1138-9788] Nº 19, 15 de abril de 1998.

description

Estadística unidad 1

Transcript of Estadistica Unidad 1

Page 1: Estadistica Unidad 1

1

UNIVERSIDAD NACIONAL DE CUYO FACULTAD DE FILOSOFÍA Y LETRAS-CARRERA GEOGRAFÍA MATEMÁTICA Y ESTADÍSTICA-CICLO 2015

Documento bibliográfico elaborado por la cátedra para los contenidos de la unidad I Cont. M. del C. Carrió de Scaccia

Especialista en Docencia Universitaria

La Estadística como uno de los instrumentos del método científico La geografía es una ciencia antigua, cuya continuidad se aseguró en el XIX en relación con su papel en la enseñanza, a la vez que se configuraba como una disciplina científica. Como tal disciplina se puede identificar a partir de dos dimensiones características: como una estructura social, con la existencia de una comunidad científica estructurada; y como una empresa intelectual definida por el estudio de dos problemas clave, a saber: la diferenciación del espacio en la superficie terrestre y el estudio de la interacción de fenómenos físicos y humanos, de las relaciones hombre-naturaleza.1 Como toda disciplina científica, la Geografía obtiene el conocimiento mediante un procedimiento denominado método científico. La palabra método, deriva del griego methodos; que significa camino o sendero que se ha de seguir para alcanzar un fin propuesto. En el caso de la ciencia la finalidad del método es la producción del conocimiento. El método sería, entonces, un modo de proceder estructurado para lograr conocimiento científico; en otras palabras es el conjunto de procedimientos que, valiéndose de los instrumentos o técnicas necesarias, aborda y soluciona un problema o un conjunto de problemas de conocimiento. Uno de estos instrumentos es la Estadística, considerada como la tecnología del método científico ya que se utiliza en cualquier campo de la ciencia porque proporciona herramientas metodológicas generales que permiten:

El resumen de los datos y extracción de información relevante de los mismos La búsqueda y evaluación de los modelos y pautas que ofrecen los datos, pero

que se encuentran ocultos por la inherente variabilidad aleatoria de los mismos. El diseño eficiente de experimentos y encuestas La comunicación entre científicos, ya que siempre será más fácil comprender la

referencia a un procedimiento estándar, sin necesidad de mayor detalle. Las nociones de Estadística, si bien son esenciales para facilitar la comprensión de la llamada “nueva geografía”, no son la “piedra filosofal”, ni resuelven todos los problemas geográficos, pero bien administrados, son herramientas que suscitan nuevos problemas y ayudan a resolver los tradicionales de una manera precisa y rigurosa. 1 Capel, Horacio. Scripta Nova. Revista Electrónica de Geografía y Ciencias Sociales. Universidad de Barcelona. [ISSN 1138-9788] Nº 19, 15 de abril de 1998.

Page 2: Estadistica Unidad 1

2

¿Qué es Estadística? • la influencia de la Estadística invade la vida actual tan ampliamente que casi todos

nosotros hemos escuchado la palabra estadística, estamos expuestos a estadísticas y usamos estadísticas. La palabra estadística se refiere en el uso común a los datos numéricos o cuantitativos - o sea “los datos estadísticos”-. Las estadísticas vitales, por ej., son datos numéricos sobre nacimientos, decesos, matrimonios, divorcios y enfermedades contagiosas. Las estadísticas geográficas, son datos sobre poblaciones humanas, que indican por ej., el crecimiento demográfico en un periodo de tiempo analizado; o son datos sobre la superficie territorial de una provincia y el número de habitantes por km2 ; etc. Resumiendo, en un sentido cotidiano :

• la Estadística a menudo se refiere a la información sobre cualquier actividad

expresada en números Pero Estadística tiene también un sentido amplio más especializado: • la Estadística es un instrumento de la metodología científica relacionada con:

◊ la recolección, clasificación, descripción, interpretación de los datos obtenidos en la realización de observaciones y experimentos (función DESCRIPTIVA)

◊ inferencia o inducción de propiedades de una población sobre la base de los resulados obtenidos en una muestra (función INFERENCIAL)

Al definirla como un instrumento de la metodología científica, podemos descubrir la gran divergencia de campos y problemas a los que se aplica el pensamiento estadístico; a pesar de ello, la Estadística siempre se ocupa de la “regularidad” estadística que existe en situaciones en las que hay variabilidad e incertidumbre.

La Estadística como componente cultural

En el artículo “Los retos de la cultura Estadística”, su autora Carmen Bataneros cita a Holmes (2002), el cual afirma que la enseñanza de la estadística y la probabilidad fue ya introducida en 1961 en el currículo de Inglaterra en forma opcional para los estudiantes de 16 a 19 años que querían especializarse en matemáticas, con el fin de mostrar las aplicaciones de las matemáticas a una amplia variedad de materias. Holmes y su equipo, con el proyecto School Council Project (Holmes, 1980) mostraron que era posible iniciar la enseñanza ya desde la escuela primaria, justificándola por las razones siguientes:

• La Estadística es una parte de la educación general deseable para los futuros ciudadanos adultos, quienes precisan adquirir la capacidad de lectura e interpretación de tablas y gráficos estadísticos que con frecuencia aparecen en los medios informativos.

• Es útil para la vida posterior, ya que en muchas profesiones se precisan unos conocimientos básicos del tema.

• Su estudio ayuda al desarrollo personal, fomentando un razonamiento crítico, basado en la valoración de la evidencia objetiva.

Page 3: Estadistica Unidad 1

3

• Ayuda a comprender los restantes temas del currículo, tanto de la educación obligatoria como posterior, donde con frecuencia aparecen gráficos, resúmenes o conceptos estadísticos.

El objetivo principal, sigue expresando el artículo mencionado, no es convertir a los futuros ciudadanos en “estadísticos aficionados”, puesto que la aplicación razonable y eficiente de la estadística para la resolución de problemas requiere un amplio conocimiento de esta materia y es competencia de los estadísticos profesionales. Tampoco se trata de capacitarlos en el cálculo y la representación gráfica, puesto que los ordenadores hoy día resuelven este problema. Lo que se pretende es proporcionar una cultura estadística,

“que se refiere a dos componentes interrelacionados: a) capacidad para interpretar y evaluar críticamente la información estadística, los argumentos apoyados en datos o los fenómenos estocásticos que las personas pueden encontrar en diversos contextos, incluyendo los medios de comunicación, pero no limitándose a ellos, y b) capacidad para discutir o comunicar sus opiniones respecto a tales informaciones estadísticas cuando sea relevante” (Gal, 2002, pp. 2-3).

El término, que ha ido surgiendo de forma espontánea entre los estadísticos y educadores estadísticos en los últimos años, quiere resaltar el hecho de que la estadística se considera hoy día como parte de la herencia cultural necesaria para el ciudadano educado. Como señala Ottaviani (1998):

“a nivel internacional la UNESCO implementa políticas de desarrollo económico y cultural para todas las naciones, que incluyen no sólo la alfabetización básica, sino la numérica. Por ello los estadísticos sienten la necesidad de difusión de la estadística, no sólo como una técnica para tratar los datos cuantitativos, sino como una cultura, en términos de capacidad de comprender la abstracción lógica que hace posible el estudio cuantitativo de los fenómenos colectivos” (p. 1).

EL LENGUAJE ESTADÍSTICO Al describir las funciones de la Estadística han aparecido algunos términos que pueden o no resultar familiares, por lo que es importante aprender el significado de los mismos para comprender el Lenguaje estadístico. El análisis estadístico, como un proceso de fabricación, comienza con materias primas, que incluye datos numéricos o categóricos; los productos terminados son toda información útil que podamos refinar partiendo de los datos brutos. ¿De dónde provienen “los datos”? de la población o universo: ◊ que se define como la totalidad o conjunto completo de individuos, objetos o

medidas que tienen alguna característica común observable. Así por ej., todos los niños nacidos en un determinado año pueden constituir una población. Sin embargo, una población también puede ser un conjunto teórico de observaciones potenciales en vez de un conjunto completo. Por ej., podemos ampliar la población anterior para incluir todos los niños, independientemente de que han nacido o estén por nacer.

Page 4: Estadistica Unidad 1

4

◊ el estudio de una población se llama una enumeración completa o censo. En la práctica a menudo es costoso, lento o físicamente imposible efectuar un censo y es necesario recurrir al estudio, denominado Muestreo, que se basa en una parte de la población, conocido como “muestra” . ◊ Muestra: es un subconjunto de la población o universo. ◊ Muestra aleatoria: es un subconjunto de la población o universo seleccionado en forma tal que cada miembro de la población tenga igual oportunidad de ser elegido. Si trabajamos con la población completa, y estamos interesados en conocer alguna de sus características, podemos definir parámetro como cualquier característica medible de una población. Por ej., la proporción real de analfabetos de la Provincia de Mendoza en 1995. Una población puede que tenga muchas características y, por consiguiente, también muchos parámetros; la naturaleza del problema nos indicará cuál es el parámetro de interés en cada situación. Simbólicamente los parámetros se representan con las letras del alfabeto griego; como por ej.: la media parámetro se simboliza con la letra griega “ μ “ y la desviación estándar parámetro con la letra griega “σ” Si trabajamos con una parte de la población, es decir, con una muestra y sobre la base de la información obtenida al manipular los datos de la misma queremos ESTIMAR el correspondiente parámetro poblacional; el número resultante de los cálculos realizados con los datos muestrales se llama estadígrafo. Por ej., si para estimar la proporción de empresas que contaminan los ríos de la Provincia de Mendoza en 2007, empleamos una muestra de las empresas para conocer esta característica, el valor obtenido es un estadígrafo. Debe tenerse en cuenta que para cada estadígrafo que describe algún aspecto de una muestra existe un parámetro correspondiente que describe el mismo aspecto de una población. El estadígrafo y el parámetro tienen la misma función pero distinto objeto de aplicación (uno sobre los datos de muestra y el otro sobre los datos de población). Simbólicamente se emplean las letras de nuestro alfabeto para representar estadígrafos

muestrales, por ej.: media muestral −

x y desviación estándar muestral s. Para completar los conceptos que forman parte de este lenguaje común, es necesario volver sobre el concepto de “dato”. Dato es una construcción compleja cuya estrucutra general posee los siguientes componentes: • unidad de análisis o sujeto de información: como su nombre lo indica es la unidad

básica de la cual obtenemos información; pueden ser los individuos entrevistados o pueden ser grupos de diferente tamaño, o cualquier tipo de instituciones o agregados sociales (familias, partidos políticos, asociaciones voluntarias, comunidades, etc.) El conjunto de unidades de análisis de una investigación constituye lo que se conoce como “el universo” o “la población” del estudio.

Page 5: Estadistica Unidad 1

5

• variable: las variables son aquellos atributos, relaciones o contextos que vamos a seleccionar como relevantes para describir nuestras unidades de análisis. En otras palabras: cualquier característica o propiedad que varía de una unidad de análisis a otra. Así, por ej., el peso y el coeficiente intelectual son variables, ya que toman valores diferentes al observar distintos individuos. Una variable es diferente de una constante cuyo valor no cambia, por ej., el número “pi”.

En un sentido estricto se puede decir que toda variable es un criterio de clasificación

que se emplea para clasificar unidades de análisis. • ahora ¿qué es una clasificación? de una manera vaga podríamos decir que es

una forma de describir toda una gama de situaciones2. Basta que pronunciemos alguna apreciación sobre algo para que resulte allí una clasificación. por ej., cuando un niño dice. “mi manzana es más grande que la tuya” ha producido una clasificación que, desde el punto de vista lógico, no es diferente a la descripción que puede hacer un arquitecto cuando afirma que “esta ambiente es más grande que este otro” o “esta ciudad es más grande que ésta”.

Las variables son “descriptores” que emplea el científico, mediante los cuales resume y organiza una vasta gama de experiencias. Una porción decisiva del trabajo científico transcurre, entonces en la producción y refinamiento de estos descriptores. ¿Cuáles son las dimensiones que están resumidas en una variable? ¿De qué manera tenerlas en cuenta en el momento de su observación o medición? Estas son cuestiones claves en el momento de la investigación científica. Todas las variables resumen información y, en principio, son analizables en dimensiones (=sub-variables). Incluso aquellas variables que parecen más simples, lo parecen porque ya se ha operado sobre ellas alguna reducción a una de sus dimensiones. Por ej. la variable sexo suele ser considerada simple, pero si se la examina en detalle se comprobará que estamos implicando de manera inconsciente la dimensión “sexo según registro civil”. En efecto, no resultará difícil admitir que la sexualidad es infinitamente más complejo que el Masculino/Femenino que reconoce la ley de registro de las personas. • valor: los valores son la variedad de estados posibles que ofrecen las variables.Si la

variable fuese un atributo como “sexo”, los valores de esa variable serían, según el Registro Civil: Masculino o Femenino. La palabra “valor” no debe ser confundida con “valor numérico”. Las variables pueden o no tener valores numéricos. Tal es el caso de la variable edad, en cuyo caso los valores, si se trata de “edad de alumnos que ingresan a la universidad” pueden ser 17 años, 18, 19....N. Pero también podría no se numérico, como el caso de la variable “nivel de instrucción alcanzado por los padres de los ingresantes a la universidad”, cuyos valores serían: analfabeto, primaria completa, primaria incompleta....etc.

Si las variables son los criterios de clasificación, los valores son, por su parte, las clases respectivas de cada clasificación. En consecuencia, los valores deben ser excluyentes entre sí (si un sujeto tiene instrucción primaria completa, no podrá tener a la vez la 2 M. Minsky “La sociedad de la mente (La inteligencia humana a la luz de la inteligencia artificial) Ediciones Ga Argentina, 1986.

Page 6: Estadistica Unidad 1

6

instrucción primaria incompleta): y además, debe haber tantos valores cuantas alternativas nos ofrezca el descriptor, es decir, el conjunto de valores debe ser exhaustivo. Muchas veces se agrega la categoría abierta “otra situación” porque no es posible saber exactamente las alternativas que se presentarán. IDENTIFICACIÓN DE LAS FUENTES DE DATOS. Identificar las fuentes de datos apropiadas es un aspecto importante del análisis estadístico; las mismas se clasifican en primarias y secundarias. En el primer caso es quien recolecta los datos el que los usa para el análisis; y en el segundo los datos han sido compilados por alguna organización o individuo que los publica para ser luego utilizados por otras personas u organizaciones. Fuentes primarias: la forma de organizar los datos provenientes de la observación de la realidad es la construcción de la denominada Matriz de datos. Este término se refiere a una ordenación cuadrangular que a través de filas y columnas permite visualizar rápidamente la estructura de todo dato científico. Siguiendo a Galtung “matriz es el instrumento que permite visualizar la complejidad estructural del dato científico”. “Es un modo de ordenar los datos de manera que sea particularmente visible la forma tripartita”. Como ya hemos desarrollado esta estructura consta de: UNIDAD DE ANÁLISIS, VARIABLE Y VALOR. Los valores no sólo son números, sino que pueden ser cualidades o categorías, dando lugar a los denominados NIVELES O ESCALAS DE MEDICIÓN. Para tratar el mismo partiremos de una situación concreta: los alumnos que cursan la cátedra de Matemática y Estadística en el presente ciclo lectivo, son mi población de interés, cada uno es una unidad de análisis o sujeto de información y dada la naturaleza de mi estudio voy a observar las siguientes variables, utilizando la observación por encuesta con cuestionario:

• SEXO • NIVEL DE INSTRUCCIÓN DE SUS PADRES • COEFICIENTE INTELECTUAL • EDAD

MATRIZ DE DATOS Unidad de análisis

SEXO

NIVEL

INSTRUCCCIÓN

Coeficiente Intelectual

EDAD

Madre Padre alumno nro. 1 alumno nro. 2 alumno nro. 3 ...................... alumno “ ” ...................... alumno “n”

Page 7: Estadistica Unidad 1

7

La intersección entre filas y columnas, llamadas “celdas”, nos permite visualizar el valor de la variable que le corresponde a la unidad de análisis observada. La matriz de datos es por lo tanto la representación tabular que permite identificar los tres elementos de la estructura tripartita del dato. ( es importante aclarar que Samaja se refiere a un cuarto elemento de todo dato científico el indicador, definiéndolo como una combinación de procedimiento y dimensión, mediante la cual se logran los elementos de juicio necesarios para pronunciar la sentencia que ubica a cada unidad de análisis en la clase que le corresponde en la clasificación). • En la columna correspondiente a la variable SEXO aparecerán frente a cada unidad

de análisis algunas de las siguientes categorías: femenino-masculino; • en la columna correspondiente a la variable NIVEL DE INSTRUCCIÓN

ALCANZADO POR LOS PADRES podrían aparecer las siguientes categorías: analfabeto, primario completa/incompleta, secundario completa/incompleta, terciario completa/ incompleta, universitario completa/incompleto;

• en la columna correspondiente a la variable COEFICIENTE INTELECTUAL aparecerán valores que corresponden a las mediciones obtenidas por la aplicación de una razón que relaciona la edad cronológica con la edad mental, siendo esta última medible por la aplicación de Test sicológicos;

• en la última columna que corresponde a la variable EDAD aparecerán valores numéricos que variarán desde la menor edad observada hasta la mayor edad observada.

En los ejemplos de variables señalados anteriormente observamos que el concepto de medición que se utiliza en las Ciencias sociales, es más amplio que el utilizado en las Ciencias físicas, en las que “medir una cantidad es compararla con otra de igual naturaleza con objeto de averiguar cuántas veces la primera contiene a la segunda”. STEVEN propone una definición más aceptable científicamente: “medir es asignar números a objetos de acuerdo a ciertas reglas”. Regla es una guía, un método, una orden que indica qué hacer. Una regla matemática es una función f→es una regla para asignar objetos de un conjunto a los objetos de otro conjunto.

f = {(x, y); x = cualquier objeto, y y = un valor numérico} que se lee: “la función, f, o la regla de correspondencia, es igual al conjunto de pares ordenados (x,y), de tal manera que x es un objeto, y cada y correspondiente es un valor numérico. Se trata de una regla de general que es aplicable a cualquier proceso de medición.

El primer y más elemental paso en un proceso de medición consiste en definir los objetos del universo de información o de interés para el investigador. Por ej., los alumnos universitarios son una población de interés, concretamente aquellos que en el presente ciclo lectivo cursan la cátedra de “Matemática y Estadística” serán el universo a analizar. Por lo tanto, cada uno es una unidad de análisis o sujeto de información al que se observará una o varias propiedades de interés. Todas las mediciones requieren que el universo se particione en por lo menos dos subconjuntos. La forma más elemental de medición será la de clasificar o categorizar todos los objetos poseedores de alguna característica. Si consideramos la propiedad “sexo según registro civil”, el universo se particionará en mujeres y varones, que son dos subconjuntos o particiones

Page 8: Estadistica Unidad 1

8

de U. En teoría de conjunto la partición es una operación que subdivide al conjunto U en subconjuntos mutuamente excluyentes y colectivamente exhaustivos, estas dos características son requisitos indispensables de cualquier procedimiento de medición.

� La propiedad que hace referencia a que las categorías deben ser mutuamente exclusivas o excluyentes, significa que debe ser posible clasificar cada caso individual tan sólo en una categoría del sistema clasificatorio.

� La propiedad de ser colectivamente exhaustivo, quiere decir que el sistema clasificatorio debe tener suficientes categorías en las que puedan clasificarse cada uno de los casos considerados. La categoría “otros” se suele utilizar con frecuencia para crear un sistema clasificatorio que sea lógicamente completo o inclusivo. En el diseño de cuestionarios, el listado de las posibles respuestas a cada pregunta suele incluir también las categorías “no sabe” y “no contesta” con el mismo fin.

También resulta conveniente que el procedimiento de medición sea lo más preciso posible, es decir, que haga el mayor número posible de distinciones. Científicamente hay que admitir que no solo existe uno sino diversos niveles de medidas y que por tanto diversos niveles de observación, según que en la toma de datos nos limitemos a: -distinguir y clasificar seres reales -ordenemos sus características de mayor a menor -obtengamos dimensiones mediante comparación con alguna unidad de medida la diferencia entre estos modos de medir no está en la ESENCIA de la medida sino en el NIVEL DE PRECISIÓN LOGRADO. Los distintos niveles de medida, que suponen según la definición de STEVEN citada, distintas reglas de asignar números a cosas, dan lugar a distintos tipos de escalas. ESCALA es una disposición conjunta de cosas diferentes, pero comunes según algún aspecto. Según esta definición las escalas son el resultado de la distinción y esta a su vez es el resultado de la medida, tomada en el sentido amplio. Pueden distinguirse CUATRO tipos de escalas o niveles de medición, cada uno de los cuales requiere un determinado conjunto de instrumentos estadísticos. 1. NIVEL DE MEDICIÓN NOMINAL O MEDIDAS NOMINALES: se realiza una medida nominal cuando la propiedad estudiada en los objetos o acontecimientos (unidad de análisis) sólo puede agruparse en categorías lógicamente exhaustivas y mutuamente exclusivas, de tal modo que puedan establecerse claramente equivalencias o diferencias. A cada una de las categorías se les asignan atributos diferentes, que pueden ser tanto nombres como números. Ahora bien, si asignamos números, por ej., 1-2-3 y 4 sólo se pueden interpretar como que son diferentes entre sí, esto es, que 1≠2≠3≠4 sin que se pueda afirmar que uno es superior a otro y, por tanto, sin que se puedan ordenar. Con las medidas nominales se consigue realizar la operación más simple y básica de toda ciencia, que es la clasificación. Por medio de la clasificación, los elementos se

Page 9: Estadistica Unidad 1

9

dividen en categorías, y se decide cuáles son más parecidas y cuáles son más diferentes. El objetivo es siempre el de obtener categorías que permitan una clasificación clara de los elementos y que sean homogéneas con relación a otras variables lo que significa que nos brinden la mejor información en el momento de estudiar la relación entre variables. La clasificación o medida nominal es el nivel más bajo de medición. Todos los demás niveles de medición, cualquiera sea su precisión, comprenden básicamente la clasificación como operación mínima. Algunos autores se refieren a este nivel de medición con el término escala nominal. En las ciencias sociales, muchas variables aparecen medidas a nivel nominal: estado civil, sexo, tipo de religiosidad, nacionalidad, etc. Desde un punto de vista formal las escalas nominales poseen las siguientes propiedades: 1. entre los objetos clasificados existe la relación de equivalencia o no equivalencia. Así

una persona u objeto particular tiene la característica que define la clase (=) o no la tiene (≠)

2. se pueden asignar valores numéricos para representar las diferentes clases en una escala nominal, pero estos números no tienen propiedades cuantitativas, no pueden realizarse con ellos operaciones matemáticas (suma, resta, multiplicación y división) y sirven únicamente para identificar las clases

A veces, sin embargo, se hace preciso, por necesidades del modelo estadístico que utilizamos, cuantificar las variables. En tal caso, se pueden crear variables ficticias o por medio de algún procedimiento arbitrario, tal como hacer corresponder una o más categorías con el número 1 y el resto de las categorías con el número 0. 2.NIVEL DE MEDICIÓN ORDINAL O MEDIDAS ORDINALES: al pasar al nivel inmediatamente superior de medición se tiene una medida ordinal cuando, además de incluir las propiedades de la medida nominal, se incluye la propiedad de que las categorías pueden ser ordenadas en el sentido de menor que o mayor que. Así, las clases en las medidas ordinales no sólo son diferentes entre sí (característica que define a las medidas nominales) sino que mantienen alguna clase de relación entre fenómenos estudiados se ordenan en términos de “mayor que”, “más preferido”, “menos difícil”, etc. más específicamente: 1. las relaciones se expresan en término del álgebra de las desigualdades: a es menor

que b (a < b) o a es mayor que b (a > b) 2. los numerales empleados en conexión con las escalas ordinales no son cuantitativos.

Ellos indican solamente la posición en una serie ordenada y no cuánta diferencia existe entre posiciones sucesivas en la escala. Dicho de otro modo, el nivel de medición ordinal no ofrece ningún tipo de información sobre la magnitud de las diferencias entre las categorías. Si éstas vienen dadas en términos de alto, medio y bajo, y decidimos asignar a tales categorías los numerales 1, 2 y 3. Ello no quiere decir que existe una diferencia de una unidad entre cada par de categorías, sino simplemente que 1<2<3.Por esta razón no se pueden, en general, realizar las operaciones aritméticas de la suma, resta, multiplicación y división con los valores de las variables medidas al nivel ordinal. En este sentido resulta indiferente que asignemos unos números u otros a las categorías de una escala ordinal, con tal que se mantenga la relación “mayor que” y “menor que”.

Page 10: Estadistica Unidad 1

10

3. NIVEL DE MEDICIÓN INTERVALAR O MEDIDAS DE INTERVALO: en un sentido restringido, el concepto de medición habría que aplicarlo solo a las medidas de intervalo, las cuales incluyen no sólo las propiedades lógicas de las escalas nominales y ordinales, sino, además, sus categorías se definen en términos de una unidad de medición estándar. En otras palabras, se realiza una medida de intervalo cuando pueden asignarse al objeto o acontecimientos estudiados números que, además de poseer las características de la medida ordinal permiten la interpretación de la diferencia entre dos medidas. Lo que caracteriza a una escala de intervalo es la existencia de una unidad de medición común y constante, que permite asignar un número real a todos los pares de objetos del conjunto ordenado. En una escala de intervalo, el punto cero (no representa la ausencia del atributo que se mide) y la unidad de medición son arbitrarios, y el cociente de cualquiera de los intervalos es independiente de los mismos. El nivel de intervalo de medición, del latín interval lum (que significa espacio entre paredes) describe variables que tienen intervalos iguales entre ellas (como tenían las paredes construidas por los soldados romanos). Las variables de intervalo nos permiten determinar la diferencia entre puntos a lo largo de algún tipo de continuo.

Por ej., la diferencia entre 30 y 40 grados es la misma que la diferencia entre 70 y 80 grados: 10 grados. Así mismo, si usted escribió correctamente 20 palabras en una prueba de ortografía y alguien escribió correctamente 10 palabras, podemos decir con exactitud que usted escribió correctamente 10 palabras más que la otra persona.

A diferencia de la escala ordinal, en la intervalar podemos conocer la diferencia entre puntos a lo largo de un continuo. Es decir que los intervalos se suman y se restan. Una escala de intervalos se expresa de la siguiente manera:

a b c d e 1 2 3 4 5

Una escala de intervalos se expresa de la siguiente manera:

[a,c] = 3-1 = 2 [c,d] = 4-3 = 1 [a,c]+[c,d] = (3-1) + (4-3) = 2 + 1 = 3

Aunque una escala en el nivel de intervalo es más precisa y comunica más información que una escala en el nivel nominal u ordinal, debemos tener cuidado al interpretar los valores reales a lo largo de una escala. Treinta grados podrían ser 10 más que 20, y –5 podría estar a la misma distancia de +5, pero esos 10 podrían implicar una gran diferencia. Los 10 grados entre 30 y 20 podrían hacer el agua un poco más fría, pero en los 10 grados entre –5 y +5 el agua se congela. Asimismo, el hecho de que usted escribió correctamente 10 palabras más que un compañero no significa que usted tiene una ortografía dos veces mejor (2 por 10), ya que no tenemos idea de la dificultad de las palabras ni de si esas 20 palabras muestrean el universo entero de todas las palabras de la prueba de ortografía. Lo que es más importante, si usted no escribe correctamente ninguna palabra, ¿significa eso que usted no sabe escribir? Claro que no, lo que sí significa es que en esta prueba a usted no le fue muy bien.

Page 11: Estadistica Unidad 1

11

Las escalas de temperatura más conocidas, la centígrada o Celsiua y la Fahrenheit, son ej. de medidas y escalas de intervalo. Ambas escalas difieren tanto en sus respectivos puntos cero como en sus unidades de medición. Con todo, ambas escalas contienen el mismo tipo de información. Así, el punto de congelación del agua se produce a los 0 grados centígrados y a los 32 grados Fahrenheit, mientras que la ebullición tiene lugar a los 100 grados centígrados y a los 212 grado Fahrenheit.

Otro ejemplo típico de las escalas intervalares es: La medición de rendimientos individuales por medio de test suele expresarse en puntajes. Los puntajes pueden darse en función del tiempo requerido para cumplir con una tarea o de la cantidad del trabajo hecho en un tiempo determinado, los puntajes varían de acuerdo con el rendimiento y los cambios en el puntaje corren paralelos a los del rendimiento. Cuando los puntajes de los tests se miden con unidades iguales constituyen una escala de intervalo. Los tests sicológicos estándar suelen ser escalas de intervalo porque consisten en unidades iguales; pero no poseen un auténtico cero que señale la falta total de capacidad. Puntajes de test en escalas pueden sumarse o restarse como si fueran centímetros. Pero no podemos decir que un puntaje de 40 equivale al doble de uno de 20, porque ninguno parte de un cero absoluto. Aunque no es tema que competa exclusivamente al estadístico conviene advertir de los errores y sesgos que se pueden introducir al emplear métodos estadísticos que requieren medidas y escalas de intervalo con datos que no sobrepasan los niveles nominales y ordinales de medición. No es que exista una imposibilidad de emplear modelos basados en supuestos de medición de intervalo, con datos ordinales y nominales. Lo que ocurre es que los resultados no pueden interpretarse de una manera rigurosa, sino de una forma limitada y aproximada. 4. NIVEL DE MEDICIÓN COCIENTE, PROPORCIÓN O RAZÓN; O MEDIDAS DE COCIENTE, PROPORCIÓN O RAZÓN: cuando una medición tiene todas las características de una medida intervalar y además, se le puede asignar un punto de origen verdadero de valor 0, se tiene entonces una escala con cero absoluto o escala de cociente o de proporción o de razón (en inglés, ratio scale) La masa o el peso se miden mediante una escala de cociente o de proporción, ya que la escala de peso, en gramos, contiene un punto cero verdadero, siendo el cociente de dos pesos independientes de la unidad de medida (sean kilogramos o libras, por ej.) La escala de tiempos en segundos, también es una escala de razón. Así, pues, el tiempo de reacción a un cierto estímulo será una medida de razón. Las medidas de razón son isomórficas con la estructura aritmética. Por tanto, todas las operaciones aritméticas se pueden realizar con los números asignados en una escala de razón. Según el nivel de medición que les sea aplicado, se pueden clasificar las variables, tal como hemos visto anteriormente, en nominales, ordinales, de intervalo y de razón. Para cada tipo de variable existen unos procedimientos estadísticos apropiados para hacer el mejor uso de la de la información que contiene los valores de las variables. Si se utiliza un procedimiento estadístico apropiado para niveles bajos de medición con puntuaciones definidas a un nivel de medición más alto, no se cometería un error

Page 12: Estadistica Unidad 1

12

técnico, sino simplemente se produciría una pérdida de información, dado que las propiedades de los niveles de medición son acumulativas. Así, se puede utilizar un procedimiento estadístico apropiado para escalas ordinales con variables de intervalo. Pero el contrario no es cierto, ya que sí se produce un error al emplear procedimientos estadísticos diseñados para niveles altos de medición, con variables de niveles más bajos. En este caso estaríamos actuando como si los valores de la variable contuvieran más información de la que realmente tienen. El tema del empleo de los diferentes procedimientos estadísticos según el nivel de medición de las variables ha sido objeto de amplia discusión en las Ciencias sociales. La ventaja de los procedimientos estadísticos apropiados para cada nivel de medición elevados es que permiten una descripción más concisa de los datos. 5. TIPOS DE VARIABLES: otra diferencia entre las variables además del nivel de medición, hace referencia a si las variables vienen definidas según una escala de medición continua o discreta. Una variable continua es aquella que puede asumir, en principio, cualquier valor numérico (es decir, cualquier número real) dentro una amplitud específica. En otras palabras, una variable continua es aquella en la que las unidades pueden dividirse en infinitos valores fraccionados, esto es, valores en cualquier punto de una escala ininterrumpida. Es interesante observar que mientras que el peso, la longitud, la altura, el tiempo y la temperatura son variables continuas, sus mediciones son discretas, porque el instrumento de medición siempre tiene algún límite de precisión. Para cálculos y análisis estadísticos a menudo hallamos conveniente considerar tales variables como continuas, y esto es razonable porque las graduaciones de un instrumento de medición preciso son muy pequeñas, casi infinitamente pequeñas. Por el contrario, una variable discreta, viene definida de tal modo que sólo puede alcanzar un determinado conjunto de valores, solo puede adoptar valores enteros o fraccionarios especificados. En otras palabras, la escala de medición está interrumpida por espacios en la escala numérica que, en un principio, no contienen casos medidos de ningún tipo. Gráficamente, se pueden visualizar las diferencias entre una variable continua, por ej., la edad y una variable discreta, por ej., el tamaño de la familia como sigue: ___________________________ variable continua 15 16 17 18 19 20 21 edad en años variable discreta ____ ____ ____ ____ ____ tamaño de la flia. 1 2 3 4 5 Para una variable continua, y dado dos valores, siempre se puede encontrar un tercer valor que esté incluido entre los dos primeros. Para una variable discreta, y dentro de un determinado espacio, existe tan sólo un número concreto de posibles categorías. Así una variable como el tamaño de la familia, no puede tomar más que valores discretos, como 1,2,3, etc., pero no tiene sentido hablar de una familia de tamaño 2,5.

Page 13: Estadistica Unidad 1

13

Finalmente, conviene destacar una tercera forma en la que pueden diferenciarse las variables entre sí, y es en el uso que se hace de ellas en la investigación. La clasificación más simple diferencia entre variables independientes y variables dependientes. Frecuentemente, el investigador trata de explicar las variaciones que se producen en un determinado fenómeno en función de determinados factores o elementos casuales. Así, puede preguntarse por los factores que determinan el éxito o fracaso de los estudiantes universitarios. Pues, bien la variable que atrae primordialmente la atención del investigador, y cuya variación trata de explicar, se llama variable dependiente, porque se supone que los valores que toma la variable dependen de los valores que presentan otras variables. Estas variables que se supone influyen los valores que toma la variable dependiente son las variables independientes o variables explicatorias, ya que permiten conocer por qué varía la variable dependiente de la forma que lo hace en una determinada población. Al elaborar la relación entre dos variables, en Ciencias sociales, se suele introducir otra variable, que se denomina variable interviniente, porque se supone que tiene un efecto determinado sobre la variable dependiente que puede ser controlado o modificado por la variable independiente. Si pensamos en términos de causa-efecto, la relación entre los tres tipos de variables puede expresarse por medio de unas flechas que señalan el camino desde la variable independiente a la dependiente, pasando por la variable interviniente, como sigue:

variable independiente→variable interviniente→variable dependiente El papel que representa una variable en una investigación y en un marco teórico determinado puede alterarse cuando cambiamos de investigación o de marco teórico. El papel crucial que juega el PROCESO DE MEDICIÓN en las Ciencias sociales es cada vez más evidente, en la medida que la rápida evolución de los procedimientos estadísticos y las enormes facilidades de cálculo que permite el uso generalizado de los ordenadores van derribando obstáculos para alcanzar una eficaz y pronta investigación cuantitativa de los fenómenos sociales. En estos momentos, uno de los mayores desafíos que se presentan a los investigadores sociales, es el de desarrollar y encontrar procedimientos apropiados de medición de las variables que son su objeto de estudio, que permitan su inclusión en los cada vez más complejos modelos estadísticos que se diseñan, con el fin de encontrar explicaciones realmente causales de fenómenos sociales, objetivo último de toda explicación científica. FUENTES SECUNDARIAS. LECTURA Y FORMACIÓN DE TABLAS

Las tablas plantean dos problemas prácticos principales: 1. su construcción 2. su examen, lectura e interpretación

1. Construcción de las tablas: en general un cuadro completo puede incluir siete partes principales

Page 14: Estadistica Unidad 1

14

1.1 Título es una descripción del contenido del cuadro o tabla. Deberá ser compacto y completo. Deberá indicar a)¿Qué son los datos incluidos en el cuerpo de la tabla? b)¿Dónde está el área representada por los datos? c)¿Cómo están los datos clasificados? d)¿Cuándo ocurrieron los datos? 1.2 Encabezados es el título de la parte superior de la o las columnas. Las tablas más simples pueden tener dos columnas y dos encabezados: una para los conceptos y otro para los datos, sin embargo; muchos cuadros tienen más de dos encabezados y algunas veces encabezados principales y subencabezados. 1.3 Conceptos o columna matriz son las descripciones en hileras de los cuadros y son colocados al lado izquierdo del mismo. Cada concepto puede ser subdividido si es necesario. 1.4 Cuerpo el cuerpo es el contenido de los datos estadísticos. Los datos presentados en el cuerpo son arreglados de acuerdo con las clasificaciones de lso encabezados y conceptos. 1.5 Nota de encabezado suelen escribirse por debajo del título y por encima del encabezado o por debajo de éste, se utilizan para explicar aquellos puntos que no han sido explicados ni en el título, los encabezados o en los conceptos. Por ej., la unidad de los datos. 1.6 Nota de pie son usualmente colocadas abajo de los conceptos; para aclarar aquellos puntos que necesitan una información adicional. 1.7 Fuente es la escrita abajo de la nota de pie. Deberá indicarse la procedencia de los datos. Esto permitirá al lector comprobar o evaluar los datos u obtener información adicional si es necesario.

Es importante destacar una norma que no siempre se cumple, referida a la disposición de las variables en una tabla o cuadro. La misma indica que se deben colocar las frecuencias referentes a cada categoría o dimensión de las variables independientes verticalmente o en columnas, y los de cada categoría o dimensión de la variable dependiente horizontalmente o en fila. Esto exige, que las cabeceras de las filas sean las dimensiones en que se divide la variable dependiente y, por el contrario las cabeceras de las columnas sean dimensiones de la variable independiente. 2.Examen, lectura o interpretación de tablas: proponemos a continuación un conjunto de reglas generales a seguir: a. leer el título cuidadosamente b. leer atentamente las notas o cualquiera otras explicaciones a la cabeza de la tabla c. fijarse en la fuente o el origen de donde se ha tomado la tabla d. fijarse en las notas a pie de página si existen e. observar las unidades (o magnitudes) utilizadas en la tabla, especialmente si se está trabajando con valores absolutos o relativos f. observar la variabilidad que existe entre los datos de la tabla g. mirar cómo están relacionados o asociados los porcentajes en cada uno de los criterios principales de clasificación

Page 15: Estadistica Unidad 1

15

h. examinar la consistencia de los resultados y la interacción entre ellos i. prestar atención a las anormalidades o irregularidades que pueden observarse en los resultados de las tablas. Finalmente, si las cifras de la tabla son porcentajes, se debe tener en cuenta la regla indicada por Zeisel, según la cual se deben efectuar las comparaciones en la dirección opuesta a la que se han calculado los porcentajes, es decir, si los tantos por ciento se han hallado en dirección vertical interesa, antes que comparar unos con otros en esta dirección, comparar horizontalmente los tantos por ciento que figuran en las distintas columnas en nivel similar, o en las mismas líneas. Ejemplo En la siguiente tabla identificar las partes principales e interpretar la información consignada:

CANTIDAD Y SUPERFICIE DE VIÑEDOS EN PRODUCCIÓN Actualización Registro de Viñedos - Agosto 2001

Distribución por provincias

Provincias y Departamentos

CANTIDAD DE VIÑEDOS

SUPERFICIE (hectáreas)

TOTAL DEL PAÍS BUENOS AIRES 1 2,0000

CATAMARCA 1.114 2.326,4413

CORDOBA 174 309,2089

LA PAMPA 3 7,9600

LA RIOJA 1.300 7.550,7605

MENDOZA 16.014 141.080,8296

NEUQUEN 17 179,4526

RIO NEGRO 364 2.544,0212

SALTA 242 1.794,3176

SAN JUAN 5.943 45.285,1380

SAN LUIS 2 11,8000

S DEL ESTERO 1 8,8000

TUCUMAN 5 12,2660

TOTAL 25.180 201.112,9957 FUENTE: Instituto Nacional de Vitivinicultura