EYGDD - Unidad No 1 : Presentacion de Datos
Unidad No 1Presentacion de Datos
Prof. Milton A. Ramırez [email protected]
Instituto Profesional AIEPEscuela de Desarrollo Social
Trabajo Social
Marzo de 2008
EYGDD - Unidad No 1 : Presentacion de Datos
Part I
Preliminar
EYGDD - Unidad No 1 : Presentacion de Datos
Estadıstica
Definicion
Estadıstica
Caracterısticas Generales
La Estadıstica es una rama de la Matematica que se refiere a larecoleccion, agrupacion, clasificacion, estudio e interpretacion de los datosobtenidos en un estudio determinado.
La Estadıstica se subdivide en dos ramas que pasaremos a revisar a
continuacion:
Estadıstica Descriptiva.Inferencia Estadıstica.
EYGDD - Unidad No 1 : Presentacion de Datos
Estadıstica
Campo de Aplicacion
Campo de Aplicacion
A ver
Ciencias de la Salud.
Nutricion.
Computacion.
Meteorologıa.
Demografıa.
Deporte.
Sociologıa.
Educacion del Transito.
etc.
EYGDD - Unidad No 1 : Presentacion de Datos
Estadıstica
Estadıstica Descriptiva
Estadıstica Descriptiva
Que es
La Estadıstica Descriptiva se define como un conjunto de tecnicas y metodoscuyo proposito es describir alguna caracterıstica de interes en base a lainformacion contenida en una muestra.
La metodologıa que se emplea para recabar informacion de interes en nuestros
estudios contempla las siguientes etapas:
1 Seleccion y determinacion de la muestra (saber con certeza sobre quetratara el estudio).
2 Obtencion de los datos.3 Clasificacion y organizacion de los datos recogidos en la etapa anterior.4 Estudio descriptivo de los datos a traves de tabulaciones y calculo de
estadıgrados tanto de tendencia central como de dispersion.5 Representacion Grafica de los datos.6 Conclusiones.
Con estos elementos nos vamos a entretener durante este semestre.
EYGDD - Unidad No 1 : Presentacion de Datos
Estadıstica
Inferencia Estadıstica
Inferencia Estadıstica
Nada mas que por cultura general
La Inferencia Estadıstica se dedica a la generacion de modelosmatematicos que permitan hacer predicciones o inferencias respecto alcomportamiento estadıstico de una poblacion a partir de los datosrecogidos en una muestra.
En este ambito lo que se hace es tratar de deducir cuales serıan losparametros estadısticos de una poblacion en base a una ciertaprobabilidad de exito o de fracaso (segun como se mire).
Otras aristas del estudio se refieren al establecimiento de ciertas hipotesis,a partir de las cuales podemos obtener respuestas sı o no con un ciertomargen de error prefijado.
EYGDD - Unidad No 1 : Presentacion de Datos
Conceptos Fundamentales
Poblacion
Poblacion
Que es
La poblacion estadıstica corresponde al conjunto de elementos dereferencia sobre el cual se realizaran las observaciones.
Tambien se le conoce como universo o colectivo.
El tamano de una poblacion corresponde a la cantidad de elementos queesta posee, y su valor lo representaremos mediante el sımbolo N. Por logeneral, N es un numero grande.
Por ejemplo
La poblacion de todas las mujeres chilenas nacidas a la fecha.
La poblacion del parque automotriz en Sudamerica.
La poblacion de todas las personas del mundo que sean mayores de 18anos.
EYGDD - Unidad No 1 : Presentacion de Datos
Conceptos Fundamentales
Muestra
Muestra
Que es
Corresponde a una parte de la poblacion (subconjunto).
El tamano de la muestra se denota con el sımbolo n, y se cumple quen < N
Por ejemplo
Si la poblacion fuera igual a todas las mujeres chilenas nacidas a la fecha,una posible muestra serıan las mujeres que estan embarazadas
Si la poblacion fuera el parque automotriz en Sudamerica, una muestraserıa los vehıculos que tienen placa patente de la ciudad de Buenos Aires.
Si la poblacion fuera igual a todas las personas del mundo que seanmayores de 18 anos, una posible muestra serıan todas las personas quetengan dos hijos y sean mayores de 50 anos.
EYGDD - Unidad No 1 : Presentacion de Datos
Conceptos Fundamentales
Variable
Variable
Veamos
Las variables representan las caracterısticas de los casos, entes u objetosque forman la poblacion.
Distinguiremos dos tipos de variables:
X Cualitativas (cualidades)X Cuantitativas (cantidades)
Se diferencian entre sı porque a una no se le puede atribuir valoresnumericos y a la otra sı.
A continuacion pasaremos a revisarlas.
EYGDD - Unidad No 1 : Presentacion de Datos
Conceptos Fundamentales
Variable
Variables Cualitativas
Cualitativa, cualidad
Son aquellas que no toman valores numericos y solo describen cualidades.
Por ejemplo
Raza.
Color de pelo.
Estado civil.
Sexo.
EYGDD - Unidad No 1 : Presentacion de Datos
Conceptos Fundamentales
Variable
Variables Cuantitativas
Cuantitativa, cantidad
Son aquellas a las cuales podemos asignarles un valor numerico.
Se clasifican en:
Variables cuantitativas discretas.Variables cuantitativas continuas.
Ejemplos
Estatura.
Edad.
Potencia del motor de un automovil.
Cantidad de DVDs que hay en un videoclub.
EYGDD - Unidad No 1 : Presentacion de Datos
Conceptos Fundamentales
Variable
Variables Cuantitativas Discretas
Discreto, conteo
Son variables cuantitativas que suelen emplearse para hacer conteos oenumeraciones.
Toman valores enteros (sin decimales).
Ejemplos
Cantidad de alumnos presentes en una sala.
Cantidad de alumnos ausentes en una sala.
Cantidad de manzanas que caben en un kilo.
Numero de clientes que espera ser atendido en la caja de unsupermercado.
EYGDD - Unidad No 1 : Presentacion de Datos
Conceptos Fundamentales
Variable
Variables Cuantitativas Continuas
Continuo, medicion
Son aquellas variables cuantitativas que puede tomar cualquier valor enun intervalo dado.
Pensemos en cosas que puedan ser traducidas a numeros decimales.
Ejemplos
Peso corporal (es posible que uno pueda pesar 80.7 kilos)
Estatura (se puede medir 1.82 metros)
Tiempo de espera (podrıa ser de 1 hora con 27 minutos, donde en estecaso los minutos serıan los decimales)
EYGDD - Unidad No 1 : Presentacion de Datos
Part II
Frecuencia
EYGDD - Unidad No 1 : Presentacion de Datos
Introduccion
Introduccion al concepto de Frecuencia
La frecuencia es uno de los terminos mas usados en estadıstica.
Esta constituye un elemento esencial a la hora de analisis datosmuestrales.
Es un concepto relacionado con la cantidad de veces que se repite undeterminado valor en una variable (cualitativa o cuantitativa).
Existen diversos tipos de frecuencias:
X frecuencia absolutaX frecuencia relativaX frecuencia relativa porcentual
EYGDD - Unidad No 1 : Presentacion de Datos
Introduccion
Frecuencia Absoluta
Frecuencia Absoluta
Es el numero de veces que se repite un valor particular de cierta variable.
Si la variable en cuestion toma un numero k de valores, la frecuencia sedenota con el sımbolo fi donde i es un ındice que puede tomar valoresentre 1 y k.
EYGDD - Unidad No 1 : Presentacion de Datos
Introduccion
Frecuencia Absoluta
Frecuencia Relativa
Es denotada por f ri y se define como el cuociente entre la frecuencia
absoluta y el numero de observaciones.
Esto es:
f ri =
fin
i = 1, . . . , k.
EYGDD - Unidad No 1 : Presentacion de Datos
Introduccion
Frecuencia Absoluta
Frecuencia Relativa Porcentual
Se denota por f ri % y se define como:
f ri % = f r
i × 100, i = 1, . . . , k.
Ademas, como f ri = fi
nla expresion anterior se puede escribir como
f ri % =
fin× 100 i = 1, . . . , k.
EYGDD - Unidad No 1 : Presentacion de Datos
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencia segun el tipo de Variable
Para calcular la frecuencia se debe tener presente el tipo de variable quese desea analizar, pues a partir de dicho analisis se realiza la agrupacionde datos respectivos.
Recordemos que los tipos de variable que existen son:
X cualitativaX cuantitativa discretaX cuantitativa continua
Lo que veremos a continuacion es justamente como hacer los calculos decada tipo de frecuencia a traves de ejemplos que ayudaran a clarificar losconceptos que vimos anteriormente.
EYGDD - Unidad No 1 : Presentacion de Datos
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cualitativas
Calculo de Frecuencias para Variables Cualitativas
Vamos viendo
La presentacion de datos cualitativos suele hacerse indicando los atributosconsiderados y sus frecuencias de aparicion.
Ejemplo
Supongase que los datos siguientes representan las marcas extranjeras deautomoviles preferidas en una muestra de 40 personas.
A C C J C F B F J A C C J F A B F F A CJ J B F C J C J C B A F C J J C J A F C
En donde A significa aleman, C coreano, J japones, F frances y Bbrasileno.
Se pide representar los datos en una tabla que contenga las frecuenciasabsolutas y relativas e interpretar algunas de ellas.
EYGDD - Unidad No 1 : Presentacion de Datos
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cualitativas
Ejemplo (Cont.)
Solucion
En primer lugar, definamos la variable con la que estamos trabajando.Sea X :“Variable cualitativa o atributo que representa la marca extranjerade automovil preferida.”
En este caso la muestra consta de n = 40 observaciones.
Por lo tanto: la suma de las frecuencias debe ser igual a 40.
Para tabular los datos en una tabla de frecuencias, se coloca en laprimera columna los valores de i , donde i varıa entre 1 y k, donde kcorresponde al numero de valores que toma la variable. En este casok = 5 ya que tenemos los valores X = A, X = C , X = J, X = F y X = B.
EYGDD - Unidad No 1 : Presentacion de Datos
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cualitativas
Ejemplo (Cont.)
Solucion
En la columna siguiente se presentan los valores que toma la variable.Como se trata de una variable cualitativa, ella representa una cualidad ypor lo tanto se denota con una letra en un orden arbitrario, como porejemplo, A, C, J, F y B para mantener la notacion original del ejercicio.
En la tercera columna se colocan las frecuencias absolutas de cada uno delos valores que toma la variable, la que se obtiene contando el numero deveces que aparece una respectiva cualidad en la muestra.
Finalmente en la ultima columna se presenta la frecuencia relativa la quese obtiene la dividir la frecuencia absoluta por el numero total deobservaciones (n = 40), es decir: f r
i = fin.
EYGDD - Unidad No 1 : Presentacion de Datos
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cualitativas
Ejemplo (Cont.)
Solucion
Luego, la tabla de frecuencias queda de la siguiente manera:
i Marca Frecuencia(fi) Frec. Relativa(f ri )
1 A 6 6/40 = 3/20
2 C 12 12/40 = 3/10
3 J 10 10/40 = 1/4
4 F 8 8/40 = 1/5
5 B 4 4/40 = 1/10
Total 40 1
EYGDD - Unidad No 1 : Presentacion de Datos
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cualitativas
Ejemplo (Cont.)
Solucion
Interpretemos algunos valores particulares de la tabla:
X f1 representa el total de veces que el valor A se repite en la muestra.Como el valor X = A se repite 6 veces y como a la A le asignamosarbitrariamente el valor i = 1 se tiene que f1 = 6. Lo mismo ocurrecon el resto de los valores.
X Veamos el caso de f r4 , es decir la frecuencia relativa del cuarto valor
que toma la variable. Que f r4 = 3
10significa que un quinto de las
preferencias de la gente se la lleva los vehıculos de nacionalidadfrancesa.
EYGDD - Unidad No 1 : Presentacion de Datos
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cualitativas
Ejemplo (Cont.)
Solucion
X f r2 = 1
10significa que los tres decimos de la gente prefiere los automoviles
coreanos.
X f r4 % significa interpretar la frecuencia porcentual del cuarto valor quetome la variable. La expresion para calcularlo es
f r4 % = f r
4 × 100
=1
5× 100
= 20
Esto significa que el 20% de las preferencias de la gente se las llevan losautomoviles de origen frances. J
EYGDD - Unidad No 1 : Presentacion de Datos
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Discretas
Calculo de Frecuencias para Variables CuantitativasDiscretas
Veamos
Para presentar los datos cuantitativos discretos se indica el numeroconsiderado y su frecuencia de aparicion.
Es similar al caso cualitativo.
Ejemplo
Supongase que los datos siguientes representan el numero de vehıculosque llega a una estacion de servicio en 30 perıodos de 5 minutos.
3 4 3 2 1 1 0 0 3 4 5 5 4 4 33 2 3 4 1 1 1 2 0 2 1 3 2 3 1
Agrupense los datos en una tabla que contenga las frecuencias y lasfrecuencias relativas.
EYGDD - Unidad No 1 : Presentacion de Datos
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Discretas
Ejemplo (Cont.)
Solucion
Sea X : “Variable que denota el numero de vehıculos que llega a unaestacion de servicio”.
Al igual que en el problema anterior, la construccion de la tabla defrecuencias se realiza de la siguiente forma: La primera columnarepresenta los valores de i , donde i = 1, . . . , k, con k = numero devalores que toma la variable. Para este ejemplo k = 6.
En la columna siguiente se colocan los valores que toma la variable (0, 1,2, 3, 4 y 5). En la tercera columna las frecuencias absolutas para cadauno de los valores de la variable, la que se obtiene al contar el numero deveces que aparece cada valor en la muestra.
Finalmente en la ultima columna se presenta la frecuencia relativa la quese obtiene: f r
i = fin
EYGDD - Unidad No 1 : Presentacion de Datos
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Discretas
Ejemplo (Cont.)
Solucion
La tabla de frecuencias queda de la siguiente manera:
i xi Frecuencia(fi) Frec. Relativa(f ri )
1 0 3 3/30 = 1/10
2 1 7 7/30
3 2 5 5/30 = 1/6
4 3 8 8/30 = 4/15
5 4 5 5/30 = 1/6
6 5 2 2/30 = 1/15
Total 30 1
X f4 = 8 significa que en 8 periodos de 5 minutos llegaron exactamente 3vehıculos.
X f r5 = 1
6significa que en la sexta parte de los vehıculos que se consideraron
llegaron exactamente 4 vehıculos. J
EYGDD - Unidad No 1 : Presentacion de Datos
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Continuas
Calculo de Frecuencias para Variables CuantitativasContinuas
Veamos
En este caso cuando se dispone de cierto numero de valores referidos a unavariable continua, es conveniente agruparlos en intervalos de clase o categorıas.
Para seleccionar el numero k de intervalos de clases, o simplemente el numero k
de clases, existen diversas formas.
1 Una de ellas es considerar tal numero k de clases no menor de 5 ni mayorde 15. No menor de 5 para evitar la perdida de informacion que seproducirıa al reunir en una clase un grupo de datos muy diferentes; y, nomayor de 15 para de esta forma tener un facil manejo y con el propositode asegurar una compactacion de la informacion.
2 Otra forma de seleccionar el numero de k de clases es empleando la Reglade Sturges, en donde k = 1 + 3.3× log n, siendo n el tamano de lamuestra.
En general, las clases se eligen de modo que la amplitud de cada una de ellassea igual para todas las categorıas o intervalos de clases.
EYGDD - Unidad No 1 : Presentacion de Datos
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Continuas
Calculo de Frecuencias para Variables CuantitativasContinuas
Veamos
Antes de ver un ejemplo es necesario definir el concepto de Marca de Clase. Sedenota por mi y corresponde al punto medio del intervalo de clase. Ella es larepresentante de la clase pues se atribuye el valor de la frecuenciacorrespondiente a dicha clase.
Ejemplo
Supongase que los datos a continuacion representan el precio aproximado de lalibra de cobre, en centavos de dolar para una muestra de 30 dıas, los que hansido ordenados convenientemente.
70 71 71 72 73 73 73 75 76 76 77 78 78 78 7878 79 79 80 81 81 82 83 84 84 84 84 87 89 91
Se pide agrupar los datos en una tabla de frecuencias.
EYGDD - Unidad No 1 : Presentacion de Datos
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Solucion
A continuacion se presenta paso a paso la forma de realizar una tabla de
frecuencias para una variable cuantitativa continua:
1 Se determina el rango o recorrido r , el que se define como ladiferencia entre los valores maximo y mınimo de la variablepresentes en la muestra.
2 Se determina el numero k de clases o categorıas, empleando Reglade Sturges.
3 Se obtiene la amplitud o tamano a del intervalo, dividiendo el rangopor el numero de clases.
4 Se seleccionan los lımites de clase que definen los intervalos, demanera que las clases sean de la misma magnitud y que cadaobservacion se clasifique sin ambiguedad en una sola clase.
5 Se cuenta el numero de observaciones en cada clase, es decir, sedeterminan las frecuencias absolutas de cada clase.
EYGDD - Unidad No 1 : Presentacion de Datos
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Paso 1 - Valor del Rango
El rango o recorrido lo obtenemos de la siguiente manera:
r = xmax − xmin = 91− 70 = 21
xmax corresponde al maximo valor observable de la variable X (91) y xmin
al mınimo valor de X (70).
EYGDD - Unidad No 1 : Presentacion de Datos
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Paso 2 - Numero de Clases
Como el valor de n = 30, aplicando la Regla de Sturges se llega a que
k = 1 + 3.3× log n
= 1 + 3.3× log 30
= 5.87 ≈ 6
Cabe destacar que el valor de k tiene que ser un numero entero (sindecimales).
El sımbolo ≈ significa aproximado o aproximadamente. Entonces5.87 ≈ 6 se lee 5.87 es aproximadamente 6.
EYGDD - Unidad No 1 : Presentacion de Datos
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Paso 3 - Amplitud o Tamano del Intervalo
Se calcula dividiendo el rango por el numero de clases.
Si a denota la amplitud del intervalo entonces
a =r
k
=21
6= 3.5 ≈ 4
EYGDD - Unidad No 1 : Presentacion de Datos
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Paso 4 - Lımites de cada Clase o Intervalo
En primer lugar obtenemos el primer intervalo de clase, cuyo lımiteaparente inferior es igual al mınimo valor que toma la variable en lamuestra. En este caso este lımite inferior vale xmin = 70.
Para obtener el lımite aparente superior del primer intervalo de clase,sumamos al lımite aparente inferior la amplitud menos 1. En este casoserıa xmin + (a− 1) = 70 + 4− 1 = 73.
Por lo tanto, nuestro primer intervalo (o clase) aparente es [70, 73[.
Por notacion, [70, 73[ se interpreta como el intervalo que contiene a todosaquellos numeros que sean mayores o iguales que 70 y menores que 73.Esta explicacion es valida para todos los intervalos que construyamos,salvo que hay que reemplazar por los valores numericos que correspondan.
EYGDD - Unidad No 1 : Presentacion de Datos
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Ojo
En este caso restamos una unidad, pero si la amplitud del intervalo declase se hubiese presentado con un decimal hubiesemos tenido que restar0.1.
Si se hubiese presentado con dos decimales tendrıamos que haber restado0.01.
Con tres decimales restamos 0.001 y ası sucesivamente.
EYGDD - Unidad No 1 : Presentacion de Datos
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Paso 4 - Lımites de cada Clase o Intervalo
Tengamos presente que tenemos que construir un total de 6 intervalos, yaque k = 6 por la regla de Sturges.
Determinemos el lımite inferior del segundo intervalo. Este es igual allımite aparente inferior del intervalo anterior mas la amplitud. Es decir70 + 4 = 74.
El lımite superior aparente del intervalo se obtiene sumando el lımitesuperior aparente del intervalo anterior con la amplitud. En este caso73 + 4 = 77.
Con esto, nuestro segundo intervalo (o clase) aparente es [74, 77[.
EYGDD - Unidad No 1 : Presentacion de Datos
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Paso 4 - Lımites de cada Clase o Intervalo
Determinemos el lımite inferior del tercer intervalo. Este es igual al lımiteaparente inferior del intervalo anterior mas la amplitud. Es decir74 + 4 = 78.
El lımite superior aparente del intervalo se obtiene sumando el lımitesuperior aparente del intervalo anterior con la amplitud. En este caso77 + 4 = 81.
Con esto, nuestro tercer intervalo (o clase) aparente es [78, 81[.
EYGDD - Unidad No 1 : Presentacion de Datos
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Paso 4 - Lımites de cada Clase o Intervalo
Determinemos el lımite inferior del cuarto intervalo. Este es igual al lımiteaparente inferior del intervalo anterior mas la amplitud. Es decir78 + 4 = 82.
El lımite superior aparente del intervalo se obtiene sumando el lımitesuperior aparente del intervalo anterior con la amplitud. En este caso81 + 4 = 85.
Con esto, nuestro cuarto intervalo (o clase) aparente es [82, 85[.
EYGDD - Unidad No 1 : Presentacion de Datos
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Paso 4 - Lımites de cada Clase o Intervalo
Determinemos el lımite inferior del quinto intervalo. Este es igual al lımiteaparente inferior del intervalo anterior mas la amplitud. Es decir82 + 4 = 86.
El lımite superior aparente del intervalo se obtiene sumando el lımitesuperior aparente del intervalo anterior con la amplitud. En este caso85 + 4 = 89.
Con esto, nuestro quinto intervalo (o clase) aparente es [86, 89[.
EYGDD - Unidad No 1 : Presentacion de Datos
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Paso 4 - Lımites de cada Clase o Intervalo
Determinemos el lımite inferior del sexto y ultimo intervalo. Este es igualal lımite aparente inferior del intervalo anterior mas la amplitud. Es decir86 + 4 = 90.
El lımite superior aparente del intervalo se obtiene sumando el lımitesuperior aparente del intervalo anterior con la amplitud. En este caso89 + 4 = 93.
Con esto, nuestro sexto intervalo (o clase) aparente es [90, 93[.
EYGDD - Unidad No 1 : Presentacion de Datos
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Paso 4 - Lımites de cada Clase o Intervalo
Una vez que se obtienen los intervalos o clases aparentes, se tienen queconstruir los intervalos o clases reales.
Esto se debe a que existe una diferencia numerica entre el lımite inferioraparente de un intervalo con el lımite superior aparente de otro intervalo,lo que le quita el caracter de continuo a la variable X :“Variable quedescribe el precio diario aproximado de la libra de cobre en centavos dedolar”.
Determinando las clases reales, recobramos lo continuo de X .
EYGDD - Unidad No 1 : Presentacion de Datos
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Paso 4 - Lımites de cada Clase o Intervalo
Para la formacion de los intervalos de clase real, a cada uno de los lımitesinferiores de las clases aparentes se le debe restar 0.5, en caso que losdatos estan presentados sin decimales.
En nuestro caso, como los datos los tenemos sin decimales, tendremosque el lımite real inferior asociado con el primer intervalo sera igual a70− 0.5 = 69.5.
De igual forma, para obtener el lımite real superior de cada intervalo declase se debe sumar 0.5, en caso que los datos vengan sin decimales.
En este caso, el lımite real superior asociado con el primer intervalo esigual a 73 + 0.5 = 73.5.
EYGDD - Unidad No 1 : Presentacion de Datos
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Ojo
Si los datos se presentan con un decimal, para obtener el lımite realinferior de cada intervalo de clase se debe restar 0.05 al lımite aparenteinferior.
Si estan presentados con dos decimales se debe restar 0.005.
Si estan con 3 decimales, restaremos 0.0005 y ası sucesivamente.
Para el caso de los lımites reales superiores en vez de restar, sumamos 0.5o 0.05 o 0.005 segun como se presenten los datos.
EYGDD - Unidad No 1 : Presentacion de Datos
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Paso 5 - Conteo de la Frecuencia Absoluta de cada ClaseLa tabla de frecuencias nos queda de la siguiente forma:
i Clase Aparente Clase Real fi f ri mi
1 [70, 73[ [69.5, 73.5[ 7 7/30 71.5
2 [74, 77[ [73.5, 77.5[ 4 4/30 = 2/15 75.5
3 [78, 81[ [77.5, 81.5[ 10 10/30 = 1/3 79.5
4 [82, 85[ [81.5, 85.5[ 6 6/30 = 1/5 83.5
5 [86, 89[ [85.5, 89.5[ 2 2/30 = 1/15 87.5
6 [90, 93[ [89.5, 93.5[ 1 1/30 91.5
Total 30 1
EYGDD - Unidad No 1 : Presentacion de Datos
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Observacion
Se entiende por lımite de clase a los numeros que aparecen en losextremos de cada clase, con lo cual los lımites de la izquierda y de laderecha corresponden a los lımites de clase inferior y superiorrespectivamente.
Al respecto tambien se definen los lımites de clase aparentes oaproximados y los lımites reales o verdaderos de clase.
En los lımites aparentes se consideran los valores tal como aparecen en lamuestra, esto es, tal como fueron aproximados, ya sea al numero enteromas proximo.
En el caso de los lımites reales , estos se determinan de tal modo quereflejen la forma como fueron redondeados los datos, por lo que estossiempre contienen como mınimo un decimal que termina en cinco.
EYGDD - Unidad No 1 : Presentacion de Datos
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Algunas Interpretaciones
X f2 = 4 significa que durante cuatro dıas el precio aproximado de la librade cobre fluctuo entre los 74 y 77 centavos de dolar. (Revisando lasclases aparentes).
X Viendo las clases reales, podrıamos decir que f2 = 4 durante 4 dıas lalibra de cobre tuvo un precio mayor o igual que los 73.5 centavos de dolary menor que 77.5 centavos de dolar.
X f r6 = 1
30significa que en la treintava parte de las observaciones el valor
diario del precio de la libra de cobre vario entre los 90 y 93 centavos dedolar.
X En terminos porcentuales, se ve que en el f r6 % = 1
30× 100 = 3.33 por
ciento de las observaciones, el valor diario del precio de la libra de cobreoscilo entre los 90 y 93 centavos de dolar. J
EYGDD - Unidad No 1 : Presentacion de Datos
Introduccion
Introduccion a los Graficos
La representacion grafica de los datos es un complemento que permiteapreciar visualmente como se presenta la informacion.
Existe una gran variedad de graficos para representar los datos, lo quenaturalmente depende del tipo de variable que se esta estudiando.
EYGDD - Unidad No 1 : Presentacion de Datos
Introduccion
Tipos de Grafico segun la clasificacion de la variable enestudio
Dependiendo si la variable que estamos analizando es cualitativa,cuantitativa discreta o cuantitativa continua, tendremos los siguientestipos de grafico:
Tipo de Variable Grafico(s) Asociado(s)Cualitativa Torta, Barra.
Cuantitativa Discreta Varas.
Cuantitativa Continua Histograma, Polıgono de frecuencias, Ojiva.
EYGDD - Unidad No 1 : Presentacion de Datos
Graficos para variables Cualitativas
Grafico de Torta (o Sectorial)
Grafico de Torta
A cada frecuencia porcentual se le asocia un angulo de la circunferencia.
Si f ri % representa la frecuencia porcentual asociada con el i−esimo valor
de la variable cualitativa, entonces los grados que le corresponden en elgrafico quedan determinados por la expresion
αo
i =f ri %
100%× 360o
EYGDD - Unidad No 1 : Presentacion de Datos
Graficos para variables Cualitativas
Grafico de Torta (o Sectorial)
Grafico de Torta (Cont.)
Por ejemplo
Consideremos la tabla de frecuencias del ejemplo de la nacionalidad deauto extranjero preferido por la gente:
i Marca Frecuencia(fi) Frec. Relativa(f ri ) f r
i %
1 A 6 6/40 = 3/20 15
2 C 12 12/40 = 3/10 30
3 J 10 10/40 = 1/4 25
4 F 8 8/40 = 1/5 20
5 B 4 4/40 = 1/10 10
Total 40 1 100
EYGDD - Unidad No 1 : Presentacion de Datos
Graficos para variables Cualitativas
Grafico de Torta (o Sectorial)
Grafico de Torta (Cont.)
Por ejemplo, para i = 3 (es decir, X = J) le hacemos corresponder
αo
3 =f r3 %
100%× 360o = 25
100× 360o = 90o.
Para i = 5 tendremos αo
5 =f r5 %
100%× 360o = 10
100× 360o = 36o y ası
sucesivamente.
El grafico que resulta se muestra en la siguiente lamina.
EYGDD - Unidad No 1 : Presentacion de Datos
Graficos para variables Cualitativas
Grafico de Torta (o Sectorial)
Grafico de Torta (Cont.)
EYGDD - Unidad No 1 : Presentacion de Datos
Graficos para variables Cualitativas
Grafico de Barras
Grafico de Barras
Esta formado por una serie de rectangulos cuyas bases estan sobre el ejehorizontal y cuyas alturas son proporcionales a las frecuencias.
Las dimensiones de las bases de los rectangulos son arbitrarias pero debenser iguales.
Los rectangulos no tienen frontera vertical comun, pero por convenciontienen que estar a una misma distancia.
EYGDD - Unidad No 1 : Presentacion de Datos
Graficos para variables Cualitativas
Grafico de Barras
Grafico de Barras (Cont.)Ejemplo
Consideremos nuevamente las preferencias por marcas extranjeras devehıculos, de acuerdo a un sondeo realizado a 40 personas queparticiparon de una muestra.
El grafico de barras es el siguiente:
EYGDD - Unidad No 1 : Presentacion de Datos
Grafico para Variable Cuantitativa Discreta
Grafico de Varas
Grafico de Varas
Consiste en una serie de segmentos de recta situadas sobre el ejehorizontal y cuyas longitudes son proporcionales a las frecuencias.
Los segmentos de recta tienen forma de varas. De ahı el nombre.
EYGDD - Unidad No 1 : Presentacion de Datos
Grafico para Variable Cuantitativa Discreta
Grafico de Varas
Grafico de Varas (Cont.)Ejemplo
Consideremos la variable X :“Numero de vehıculos que llega a una estacion deservicio en intervalos de 5 minutos” que esta asociada con el ejemplo deconstruccion de tablas de frecuencia para variables cuantitativas discretas. Sugrafico de varas es el siguiente:
EYGDD - Unidad No 1 : Presentacion de Datos
Graficos para Variables Cuantitativas Continuas
Histograma
Histograma
El Histograma representa datos que se encuentran agrupados en clases ocategorıas.
Consiste en una serie de rectangulos con fronteras verticales comunes, endonde las bases de los rectangulos son iguales a las amplitudes o anchurasde clase y las alturas son proporcionales a las frecuencias.
Se “parece” a un grafico de barras con la diferencia que los rectangulosvan unidos entre sı.
Por ejemplo
Consideremos el ejemplo dado para el caso de creacion de tablas defrecuencias en variables cuantitativas continuas que estaba relacionadocon la variacion del precio de la libra de cobre, expresada en centavos dedolar.
EYGDD - Unidad No 1 : Presentacion de Datos
Graficos para Variables Cuantitativas Continuas
Histograma
Histograma (Cont.)
El histograma asociado con el ejemplo anterior es el que se muestra acontinuacion:
EYGDD - Unidad No 1 : Presentacion de Datos
Graficos para Variables Cuantitativas Continuas
Polıgono de Frecuencias
Polıgono de Frecuencias
Proporciona una representacion suavizada de un conjunto de valores.
Para construir este grafico, hay que unir los puntos medios situados sobrelos techos de rectangulos del histograma, en donde tales puntos medioscorresponden a las marcas de clase.
El polıgono de frecuencias se completa agregando dos segmentos derecta: uno antes de la primera clase y el otro despues de la ultima claseasignandoles artificialmente el valor cero en cada tipo de frecuencia. Estodebido a que “antes” y “despues” de recogidos los datos no se registraronobservaciones con esos valores.
EYGDD - Unidad No 1 : Presentacion de Datos
Graficos para Variables Cuantitativas Continuas
Polıgono de Frecuencias
Polıgono de FrecuenciasEjemplo
Considerando el mismo ejemplo de la variacion del precio de la libra de cobre encentavos de dolar, el polıgono de frecuencias serıa el siguiente:
EYGDD - Unidad No 1 : Presentacion de Datos
Graficos para Variables Cuantitativas Continuas
Ojiva
Ojiva
La Ojiva representa las frecuencias acumuladas y ademas proporciona unadescripcion visual de como se acumulan los valores de la variable.
Los puntos que unen cada uno de los segmentos de recta que forman elpolıgono son aquellos que tienen como coordenadas el lımite real superiorde clase en la abscisa y el valor de la frecuencia acumulada en laordenada (que tambien puede ser la frecuencia relativa acumulada o lafrecuencia porcentual acumulada).
EYGDD - Unidad No 1 : Presentacion de Datos
Graficos para Variables Cuantitativas Continuas
Ojiva
Ojiva(Cont.)Ejemplo
Construyamos una nueva columna a la tabla de frecuencias del ejemplo de lalibra de cobre donde registremos los valores de la frecuencia acumulada:
i Clase Aparente Clase Real fi f ri mi Frec. Acum.
1 [70, 73[ [69.5, 73.5[ 7 7/30 71.5 7
2 [74, 77[ [73.5, 77.5[ 4 4/30 = 2/15 75.5 11
3 [78, 81[ [77.5, 81.5[ 10 10/30 = 1/3 79.5 21
4 [82, 85[ [81.5, 85.5[ 6 6/30 = 1/5 83.5 27
5 [86, 89[ [85.5, 89.5[ 2 2/30 = 1/15 87.5 29
6 [90, 93[ [89.5, 93.5[ 1 1/30 91.5 30
Total 30 1
EYGDD - Unidad No 1 : Presentacion de Datos
Graficos para Variables Cuantitativas Continuas
Ojiva
Ojiva(Cont.)Ejemplo (Cont.)
De esta manera, el grafico de ojiva es el siguiente:
EYGDD - Unidad No 1 : Presentacion de Datos
Graficos para Variables Cuantitativas Continuas
Ojiva
Ojiva (Cont.)
Algunas observaciones
La gracia que tiene este tipo de grafico es que permite ver cuantasobservaciones son menores o iguales a un cierto valor especificado.
Por ejemplo, a partir de la ojiva exhibida en la lamina anterior quedurante 21 dıas el valor del precio de la libra de cobre fue aumentandohasta alcanzar un valor aproximado de 81.5 centavos de dolar.
EYGDD - Unidad No 1 : Presentacion de Datos
Graficos para Variables Cuantitativas Continuas
Ojiva
Por su atencion muchas gracias. . .
♠♠♠♠♠♠ ♠♠♠ ♠♠ ♠♠♠♠ ♠♠♠ ♠♠♠ ♠♠♠♠ ♠♠♠ ♠♠♠♠ ♠♠♠♠♠♠♠♠ ♠♠♠ ♠♠♠♠♠ ♠♠♠♠ ♠♠♠ ♠♠♠♠♠♠ ♠♠♠♠ ♠♠♠ ♠♠♠♠♠♠♠♠♠
Top Related