CONCEPTOS BASICOS infor.docx

22
CONCEPTOS BASICOS 1-Variable Una variable es una propiedad que puede fluctuar y cuya variación es susceptible de adoptar diferentes valores, los cuales pueden medirse u observarse. Las variables adquieren valor para la investigación cuando se relacionan con otras variables, es decir, si forman parte de una hipótesis o de una teoría. En este caso se las denomina constructos o construcciones hipotéticas. Existen diferentes tipos de variables: Variables cualitativas- Son el tipo de variables que como su nombre lo indica expresan distintas cualidades, características o modalidad. Cada modalidad que se presenta se denomina atributo o categoría, y la medición consiste en una clasificación de dichos atributos. Las variables cualitativas puede ser dicotómicas cuando sólo pueden tomar dos valores posibles, como sí y no, hombre y mujer o ser politómicas cuando pueden adquirir tres o más valores. Dentro de ellas podemos distinguir: Variable cualitativa ordinal o variable cuasi cuantitativa: La variable puede tomar distintos valores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme, por ejemplo: leve, moderado, fuerte. 1

Transcript of CONCEPTOS BASICOS infor.docx

CONCEPTOS BASICOS

1-Variable

Unavariablees una propiedad que puede fluctuar y cuya variacin es susceptible de adoptar diferentes valores, los cuales pueden medirse u observarse. Lasvariables adquieren valor para la investigacin cuando se relacionan con otras variables, es decir, si forman parte de unahiptesiso de unateora. En este caso se las denomina constructosoconstrucciones hipotticas.

Existen diferentes tipos de variables:

Variables cualitativas- Son el tipo de variables que como su nombre lo indica expresan distintas cualidades, caractersticas o modalidad. Cada modalidad que se presenta se denomina atributo o categora, y la medicin consiste en una clasificacin de dichos atributos. Las variables cualitativas puede serdicotmicascuando slo pueden tomar dos valores posibles, comos y no,hombre y mujero serpolitmicascuando pueden adquirir tres o ms valores. Dentro de ellas podemos distinguir:

Variable cualitativa ordinalovariable cuasi cuantitativa: La variable puede tomar distintos valores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme, por ejemplo:leve, moderado, fuerte.

Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un criterio de orden, como por ejemplo los colores.

Variables cuantitativa- Son las variables que toman comoargumento,cantidades numricas, sonvariables matemticas. Las variables cuantitativas adems pueden ser:

Variable discreta: Es la variable lo que presenta separaciones o interrupciones en la escala de valores que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los distintos valores especficos que la variable pueda asumir. Ejemplo: El nmero de hijos (1, 2, 3, 4, 5).

Variable continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo especificado de valores. Por ejemplo la masa (2,3kg, 2,4kg, 2,5kg,...) o la altura (1,64m, 1,65m, 1,66m,...), o el salario. Solamente se est limitado por la precisin del aparato medidor, en teora permiten que exista un valor entre dos variables.

Segn la influencia que asignemos a unas variables sobre otras, podrn ser:

Variables independientes- Una variable independiente es aquella cuyo valor no depende de otra variable. La variable independiente se representa en el eje de abscisas. Son las que el investigador escoge para establecer agrupaciones en el estudio, clasificando intrnsecamente a los casos del mismo. Un tipo especial son las

variables de control, que modifican al resto de las variables independientes y que de no tenerse en cuenta adecuadamente pueden alterar los resultados por medio de unsesgo. Es aquella caracterstica o propiedad que se supone ser la causa del fenmeno estudiado. En investigacin experimental se llama as a lavariableque el investigador manipula.

Variables dependientes- Una variable dependiente es aquella cuyos valores dependen de los que tomen otra variable. La variable dependiente en una funcin se suele representar por y. La variable dependiente se representa en el eje ordenadas. Son las variables de respuesta que se observan en el estudio y que podran estar influidas por los valores de las variables independientes.

Hayman (1974: 69) la define como propiedad o caracterstica que se trata de cambiar mediante la manipulacin de la variable independiente. La variable dependiente es el factor que es observado y medido para determinar el efecto de la variable independiente.

Variables intervinientes- Son aquellas caractersticas o propiedades que, de una manera u otra, afectan el resultado que se espera y estn vinculadas con las variables independientes y dependientes. Y es muy similar a la variable moderadora aunque no son iguales solo son muy similares a la forma de relacionarlas.

Variables moderadora- Segn Tuckman: Representan un tipo especial de variable independiente, que es secundaria, y se selecciona con la finalidad de determinar si afecta la relacin entre la variable independiente primaria y las variables dependientes.

2-Constante

En las matemticas, una constante es unacantidad que tiene un valor fijoen un determinado clculo, proceso o ecuacin. Esto quiere decir que la constante es un valor permanente que no puede modificarse dentro de un cierto contexto. Lo habitual es que se relacione con unavariable(cuyos valores s pueden ser modificados).

Unaconstante fsicaes el valor invariable de una magnitud fsica a lo largo deltiempo. Un ejemplo de ello, mencionado muy a menudo incluso en mbitos no cientficos, es la velocidad de la luz en el vaco (299.792.458 m/s).

Cuando existe, al menos enteora, una velocidad constante, pueden estimarse tiempos de desplazamiento. Si un automvil se desplaza a una velocidad constante de 100 kilmetros por hora, tarda cuatro horas en recorrer un trayecto de 400 kilmetros. Como la velocidad constante no existe en la prctica, es habitual que este tipo de estimaciones se realice con la velocidad media o velocidad promedio.

En el mbito de laprogramacininformtica, una constante es aquel valor que no puede ser modificado durante la ejecucin de unprograma. Corresponde, por lo tanto, a una longitud fija en un rea reservada en la memoria de lacomputadora.

Sus aplicaciones, as como sus mtodos de implementacin, son diversas; por lo general, se utilizan para determinar valores tales comovelocidades mnimas y mximas,mrgenesde error,dimensiones fijasde elementos que deben ser dibujados muchas veces a lo largo de la ejecucin ynmeros de estadosde las diversas mquinas que suelen componer un programa. Este ltimo punto resulta esencial, dado que la mquina de estados representa un modelo de organizacin muy eficiente.

Tomemos como ejemplo una aplicacin muy sencilla, que presenta al usuario un formulario con los campos nombre y contrasea para realizar la comprobacin de los datos una vez ingresados y que solo se cerrar una vez que el resultado sea positivo. Bsicamente, se puede decir que dicho programa pasar por los siguientes estados desde su arranque hasta su fin:

0:realizar la carga de los recursos necesarios para su representacin grfica, tales como imgenes para los botones y fuentes para el texto;1:crear el formulario, estableciendo losvaloresde todos sus componentes (cuadros de ingreso de texto, etiquetas, botones, mensajes emergentes) y lo mostrar en pantalla;2:permanecer a la espera de que el usuario ingrese su informacin y confirme dicha accin;3:proceder a verificar los datos y dar uno de dos posibles resultados: correcto, caso en el cual se cerrar; incorrecto, lo cual dar lugar a un estado en el que mostrar un mensaje para pedir al usuario que repita el procedimiento;4:mientras se muestre la notificacin dedatos incorrectos, el programa aguardar una accin por parte del usuario para volver al estado1, probablemente cambiando la creacin del formulario (dado que ya existe) por una simplelimpiezade sus campos de ingreso.

Si bien la estructura real de unaaplicacines ms compleja, el ejemplo dado sirve para demostrar la eficiencia y el grado de control que permite la disposicin de los estados en unamquina. En el cdigo, que puede ser diferente para cada programador, cada estado se representa con una constante, que recibe un nombre (tal comoES_CARGA,ES_ESPERA) y generalmente se asocia a un valor numrico.

3-Escalas de medicin

Se entender por medicin al proceso de asignar el valor a una variable de un elemento en observacin. Este proceso utiliza diversas escalas: nominal, ordinal, de intervalo y de razn.

Las variables de las escalas nominal y ordinal se denominan tambin categricas, por otra parte las variables de escala de intervalo o de razn se denominan variables numricas. Con los valores de las variables categricas no tiene sentido o no se puede efectuar operaciones aritmticas. Con las variables numricas s.

Laescala nominalslo permite asignar un nombre al elemento medido.Esto la convierte en la menos informativa de las escalas de medicin.

Los siguientes son ejemplos de variables con este tipo de escala:

Nacionalidad.

Uso de anteojos.

Nmero de camiseta en un equipo de ftbol.

Nmero de Cdula Nacional de Identidad.

A pesar de que algunos valores son formalmente numricos, slo estn siendo usados para identificar a los individuos medidos.

Laescala ordinal, adems de las propiedades de la escala nominal, permite establecer un orden entre los elementos medidos.

Ejemplos de variables con escala ordinal:

Preferencia a productos de consumo.

Etapa de desarrollo de un ser vivo.

Clasificacin de pelculas por una comisin especializada.

Madurez de una fruta al momento de comprarla.

Laescala de intervalo, adems de todas las propiedades de la escala ordinal, hace que tenga sentido calcular diferencias entre las mediciones.

Los siguientes son ejemplos de variables con esta escala:

Temperatura de una persona.

Ubicacin en una carretera respecto de un punto de referencia (Kilmetro 85 Ruta 5).

Sobrepeso respecto de un patrn de comparacin.

Nivel de aceite en el motor de un automvil medido con una vara graduada.

Finalmente, laescala de raznpermite, adems de lo de las otras escalas, comparar mediciones mediante un cuociente.

Algunos ejemplos de variables con la escala de razn son los siguientes:

Altura de personas.

Cantidad de litros de agua consumido por una persona en un da.

Velocidad de un auto en la carretera.

Nmero de goles marcados por un jugador de bsquetbol en un partido.

La escala de intervalo tiene un cero que se establece por convencin y puede tener variaciones. Es arbitrario. Por otra parte, la escala de razn tiene un cero real, fijo, no sujeto a variaciones; es propio de la medicin hecha.

4-Medidas de tendencia central: Media, Mediana, Moda

Supngase que un determinado alumno obtiene 35 puntos en una prueba de matemtica. Este puntaje, por s mismo tiene muy poco significado a menos que podamos conocer el total de puntos que obtiene una persona promedio al participar en esa prueba, saber cul es la calificacin menor y mayor que se obtiene, y cun variadas son esas calificaciones. En otras palabras, para que una calificacin tenga significado hay que contar con elementos de referencia generalmente relacionados con ciertos criterios estadsticos.

Lasmedidas de tendencia central (media, mediana y moda)sirven como puntos de referencia para interpretar las calificaciones que se obtienen en una prueba.

Volviendo a nuestro ejemplo, digamos que la calificacin promedio en la prueba que hizo el alumno fue de 20 puntos. Con este dato podemos decir que la calificacin del alumno se ubica notablemente sobre el promedio. Pero si la calificacin promedio fue de 65 puntos, entonces la conclusin sera muy diferente, debido a que se ubicara muy por debajo del promedio de la clase.

En resumen, el propsito de las medidas de tendencia central es:

Mostrar en qu lugar se ubica la persona promedio o tpica del grupo.

Sirve como un mtodo para comparar o interpretar cualquier puntaje en relacin con el puntaje central o tpico.

Sirve como un mtodo para comparar el puntaje obtenido por una misma persona en dos diferentes ocasiones.

Sirve como un mtodo para comparar los resultados medios obtenidos por dos o ms grupos.

Las medidas de tendencia central ms comunes son:

Lamedia aritmtica: comnmente conocida comomedia o promedio. Se representa por medio de una letraMo por unaXcon una lnea en la parte superior.

Lamediana: la cual es el puntaje que se ubica en el centro de una distribucin. Se representa comoMd.

Lamoda: que es el puntaje que se presenta con mayor frecuencia en una distribucin. Se representaMo.

5-Medidas de Posicin

Sonindicadoresusados para sealar que porcentaje de datos dentro de una distribucin de frecuencias superan estas expresiones, cuyo valor representa el valor del dato que se encuentra en el centro de la distribucin de frecuencia, por lo que tambin se les llama " Medidas de Tendencia Central ".

Pero estas medidas de posicin de una distribucin de frecuencias han de cumplir determinadas condiciones para que lean verdaderamente representativas de la variable a la que resumen. Todasntesisde una distribucin se considerara como operativa si intervienen en su determinacin todos y cada uno de los valores de la distribucin, siendo nica para cada distribucin de frecuencias y siendo siempre calculable y de fcil obtencin.

5.1-Percentil

El percentil es unamedida estadstica muy utilizada. Es unamedida de posicin no centralque nos dice cmo est posicionadoun valor respecto al total de una muestra.

Elconcepto es sencillo. Si tenemos una muestra con muchos valores y la dividimos en 100 partes, cada una de ellas es un percentil. Y cada valor de la muestra estar en alguna deesas cajitas percentiles. El percentil est referenciado de 0 a 100. El Percentil 0 es el menor valor de la muestra y el Percentil 100 el mayor valor. Tcnicamente Pies el percentil i-simo, donde la i toma valores del 1 al 100. El i% de los valores de muestra son menores que ese Pi y el (100-i)% restante son mayores.

5.2-Rango Percentil

Consideremos el siguiente ejemplo: Un psiclogo hace el seguimiento de un estudiante de Bachillerato que ha obtenido un 5 en los exmenes de Matemticas (M) e Historia (H). Las puntuaciones obtenidas por los estudiantes de los dos grupos son:

El estudiante ha quedado muy bien en Matemticas, y mal en Historia en relacin a los resultados obtenidos por el resto del grupo, pero la puntuacin directa (el 5) es la misma en ambos exmenes. En conclusin, las puntuaciones directas NO miden de manera adecuada de la posicin de los datos en relacin al grupo. Por tanto, es preciso considerar un procedimiento que s lo haga.

Si en lugar de operar con las puntuaciones directas obtenemos el porcentaje de puntuaciones con valores inferiores vemos que el estudiante ha obtenido una puntuacin en Matemtica que deja por bajo el 80% de las puntuaciones de Matemticas, y en Historia el 10% de Historia. De esta forma s podemos comparar el rendimiento del estudiante en los dos exmenes, y se denominaRango Percentil de una puntuacin x el porcentaje de datos con valores inferiores a x.

Frmula de clculo:

fa: Frecuencia acumulada hasta el lmite inferior del intervalo donde se encuentra la puntuacin x.

f: Frecuencia de la puntuacin x.

Ejemplo

Obtencin del Rango Percentil de la puntuacin 6:

Se dir que el Rango Percentil de 6 es igual a 40, lo que significa que el 40% de las puntuaciones presenta valores inferiores a 6.

(Nota: Se asume que las cuatro puntuaciones con valor 6 se distribuyen de manera uniforme a lo largo del intervalo 5.5-6.5).

6-Medidas de Variabilidad :Rango, Varianza, y Desviacin Estndar"

Las medidas de Variabilidad tambin llamadas Medidas de Dispersin, indican ciertos aspectos del conjunto de datos que no nos lo dicen las medidas de tendencia central, por lo tanto una descripcin ms detallada de la naturaleza de un conjunto de datos se obtiene cuando se utilizan tanto las medidas de tendencia central como las de Variabilidad o Dispersin.

La Media se involucra para ubicar el centro de un conjunto de datos, no obstante con frecuencia resulta igualmente importante describir la manera en que los datos estn dispersos, a casa lado del centro.

Una Variacin grande indica poca homogeneidad.

Existen carias medidas de variabilidad, las que nosotros abordaremos son las siguientes:

Rango

Varianza

Desviacin Estndar

Nota: dichas medidas solo tienen sentido para variables cuantitativas medidas en escalas de intervalo o de razn

6.1-Rango se calcula hallando la diferencia (resta) entre los valores mximos y mnimo, donde obtenemos:

R=valor mximo-valor mnimo

6.2-Desviacin Estndar es la medida de variabilidad ms adecuada por sus propiedades algebraicas, se le conoce tambin como desviacin tpica. Para comprender mejor el termino desviacin: se utiliza para valorar la diferencia entre un dato y el valor de la media del conjunto de datos, no interesa su signo si no su valor absoluto.

La desviacin Estndar: es una medida de la variacin de los valores con respecto a la medida. Es una especie de desviacin promedio con respecto a la media. su frmula es:

S= (x-X)2/n

Dnde:

X= media

x=valores de los datos

n= nmero de datos

= sumatoria

Nota:

El valor de la desviacin estndar "s" es positivo. Resulta ser cero cuando todos los valores de los datos son el mismo nmero.

El valor de la desviacin estndar se puede incrementar de manera importante cuando se incluye uno o ms datos distantes, es decir, datos que se encuentran muy lejos de los dems.

Las unidades "s" son las mismas de los datos originales.

6.2.2-Procedimiento para calcular la desviacin estndar:

1) Calcular el valor de la Media

2) Restar la media de cada valor individual para tener una lista de desviaciones de la forma (x-X)

3) elevar al cuadrado cada de las diferencias obtenidas en el paso anterior. Recuerda que al elevar al cuadrado un nmero negativo ste se vuelve positivo. (x-X)2

4) Sumar todos los resultados obtenidos en el paso anterior el cual es: (x-X)2

5)Dividir el total del paso 4 entre el nmero de datos n

6) Calcular la raz cuadrada del resultado anterior

6.3-Varianza

Es una medida de variabilidad que se obtiene elevando al cuadrado la desviacin estndar se simboliza: (s)2

As que una vez obtenida la desviacin estndar sol hay que elevar al cuadrado su valor y con ello obtenemos el valor de la varianza.

Para Datos Agrupados se emplean las mismas formulas nadamas qe ahora "x" ya no es valor del dato, sino que ahora es la Marca de Clase del intervalo.

Relacin entre la desviacin estndar y el rango para obtener una estimacin de la desviacin estndar cuando se conoce el rango de los datos existe una frmula:

s rango / 4

Nota: se usa el simbolo de aproximacin en lugar del igual, puesto que dicha frmula permite slo una idea preliminar del valor "s" cabe aclarar que esta frmula no es siempre vlida para todo los casos es dependiendo como se comporten los datos.

7-Medidas Paramtricas

Laestadstica paramtricaes una rama de laestadsticainferencial que comprende los procedimientos estadsticos y de decisin que estn basados en las distribuciones de los datos reales. Estas son determinadas usando un nmero finito deparmetros. Esto es, por ejemplo, si conocemos que la altura de las personas sigue unadistribucin normal, pero desconocemos cul es la media y la desviacin de dicha normal. La media y la desviacin tpica de la desviacin normal son los dos parmetros que queremos estimar. Cuando desconocemos totalmente que distribucin siguen nuestros datos entonces deberemos aplicar primero untest no paramtrico, que nos ayude a conocer primero la distribucin.

La mayora de procedimientos paramtricos requiere conocer la forma de distribucin para las mediciones resultantes de la poblacin estudiada. Para la inferencia paramtrica es requerida como mnimo una escala de intervalo, esto quiere decir que nuestros datos deben tener un orden y una numeracin del intervalo. Es decir nuestros datos pueden estar categorizados en: menores de 20 aos, de 20 a 40 aos, de 40 a 60, de 60 a 80, etc, ya que hay nmeros con los cuales realizar clculos estadsticos. Sin embargo, datos categorizados en: nios, jvenes, adultos y ancianos no pueden ser interpretados mediante la estadstica paramtrica ya que no se puede hallar un parmetro numrico (como por ejemplo la media de edad) cuando los datos no son numricos.

Cuestin Ejemplo

Cmo ha influido mi cambio de mtodo?

Una profesora de idiomas decide cambiar el mtodo de enseanza del vocabulario. Pasa a sus alumnos una prueba que produce una calificacin del 0 al 5. Establece en sus clases el nuevo mtodo durante dos meses y vuelve a pasar una prueba de dificultad proporcionada al nuevo aprendizaje. Despus de corregirla desea saber si ha subido el nivel de clase y si el nuevo mtodo ha acercado los niveles de los alumnos o si, por contra, los ha dispersado.

Los resultados de ambas pruebas, ordenados de 0 a 5 (no por alumnos) han sido los siguientes

Antes del cambio de mtodo

0 0 0 1 1 1 2 2 2 2 2 2 3 3 3 3 3 4 4 4 4 4 5 5 5

Despus del cambio

0 0 1 1 1 1 2 2 2 2 3 3 3 3 3 4 4 4 4 4 4 5 5 5 5

Para estudiar diferencias que no se aprecian por simple inspeccin de las tablas (en el ejemplo parece que el nivel ha subido algo, pero no se tiene la seguridad) debemos calcular losestadsticosde la muestra. Llamamos estadsticos a todas las medidas realizadas sobre el conjunto (muestra) que se estudia, y que pueden resumir algunos aspectos interesantes del mismo:

Medidas centrales:Mediana, media, moda

Medidas de dispersin:Desviacin tpica, rango,...

Medidas de asimetra y aplastamiento

8-Las medidas no Parametrica

La estadstica no paramtricaes una rama de laestadsticaque estudia las pruebas y modelos estadsticos cuya distribucin subyacente no se ajusta a los llamados criterios paramtricos. Su distribucin no puede ser definidaa priori, pues son los datos observados los que la determinan. La utilizacin de estos mtodos se hace recomendable cuando no se puede asumir que los datos se ajusten a una distribucin conocida, cuando el nivel demedidaempleado no sea, como mnimo, de intervalo.

Las principalespruebasno paramtricas son las siguientes:

Prueba de Pearson

Prueba binomial

Prueba de Anderson-Darling

Prueba de Cochran

Prueba de Cohen kappa

Prueba de Fisher

Prueba de Friedman

Prueba de Kendall

Prueba de Kolmogrov-Smirnov

Prueba de Kruskal-Wallis

Prueba de Kuiper

Prueba de Mann-Whitneyoprueba de Wilcoxon

Prueba de McNemar

Prueba de la mediana

Prueba de Siegel-Tukey

Prueba de los signos

Coeficiente de correlacin de Spearman

Tablas de contingencia

Prueba de Wald-Wolfowitz

Prueba de los rangos con signo de Wilcoxon

La mayora de estos test estadsticos estn programados en lospaquetes estadsticosms frecuentes, quedando para el investigador, simplemente, la tarea de decidir por cul de todos ellos guiarse o qu hacer en caso de que dos test nos den resultados opuestos. Hay que decir que, para poder aplicar cada uno existen diversas hiptesis nulas y condiciones que deben cumplir nuestros datos para que los resultados de aplicar el test sean fiables. Esto es, no se puede aplicar todos los test y quedarse con el que mejor convenga para la investigacin sin verificar si se cumplen las hiptesis y condiciones necesarias pues, si se violan, invalidan cualquier resultado posterior y son una de las causas ms frecuentes de que un estudio sea estadsticamente incorrecto. Esto ocurre sobre todo cuando el investigador desconoce la naturaleza interna de los test y se limita a aplicarlos sistemticamente.

Es importante mencionar que si la distribucin de los datos se ajusta a un tipo de distribucin conocida, existen otras [pruebas] que, en la prctica, son ms aconsejables pero que as mismo requieren otros supuestos. En este caso, la estadstica a emplear es laestadstica paramtrica, dentro de la cual muchas veces podemos encontrar equivalencias entre pruebas pero con diferencias en la potencia entre ambas siendo siempre la potencia de las pruebas no paramtricas menor que la potencia de las pruebas paramtricas equivalentes. Aun as, el uso adecuado de los tamaos muestra les disminuye la posibilidad de cometer un [error tipo II], puesto que aumenta al mismo tiempo la eficacia de la prueba . Es decir, a medida que se aumenta el tamao de la muestra, disminuye la posibilidad de cometer un error tipo II (un falso negativo: No rechazar la hiptesis nula cuando sta en realidad es falsa).

Las pruebas estadsticas paramtricas y no paramtricas se diferencian por eltipode datosque se usan para analizar. Las pruebas paramtricas hacen muchas suposiciones, la ms significativa de las cuales es que los datos se distribuyen normalmente. Las pruebas no paramtricas hacen menos suposiciones y hacen frente a los datos que no se distribuyen normalmente. Las pruebas paramtricas generalmente tienen una mayorpotencia estadstica.

1