SOCI 4186 Estadística Descriptiva Profa. Vivianna De Jesús

download SOCI 4186 Estadística Descriptiva Profa. Vivianna De Jesús

of 44

Transcript of SOCI 4186 Estadística Descriptiva Profa. Vivianna De Jesús

SOCI 4186 TCNICAS DE COMPUTADORA EN LA INVESTIGACIN SOCIOLGICA

PROF. V. DE JESS

1 Estadstica Descriptiva -Medidas de tendencia central-

Estadsticas Profa. V. De Jess, SOCI 4186, UPR-RP 2 .La relacin entre las Matemticas y la Sociologa es por medio de las Estadsticas .Subdivisin de las Matemticas Puras .Ciencia de obtener, clasificar, organizar e interpretar datos. .El propsito es describir y llegar a conclusiones sobre el conjunto de datos de inters.

Estadsticas (cont.) Profa. V. De Jess, SOCI 4186, UPR-RP 3 MATEMTICAS PURAS 1) lgebra a) Aritmtica b) lgebra c) Teora de los nmeros d) Clculo de probabilidades i) Teora de los errores ii) Estadstica 2) Anlisis 3) Geometra diferencial MATEMTICAS APLICADAS 1) Mecnica 2) Fsica 3) Geodesia y geofsica 4) Astronoma 5) Ciberntica

Estadsticas (cont.) Profa. V. De Jess, SOCI 4186, UPR-RP 4 .Subdivisin de las estadsticas: .Estadstica descriptiva - trata sobre la presentacin de los datos de forma grfica y el cmputo de medidas descriptivas. .Inferencia estadstica - permite hacer generalizaciones basadas en los datos estudiados.

Estadstica descriptiva Profa. V. De Jess, SOCI 4186, UPR-RP 5 .Ordenamiento y tratamiento mecnico de la informacin para su presentacin por medio de tablas y grficas .Puede ser usado para lo siguiente: .Comparar 2 caractersticas medibles sobre las personas en mismo grupo .Comparar grupos usando la misma caracterstica .Comparar un grupo con el universo .Es un primer acercamiento a la informacin

Estadstica inferencial Profa. V. De Jess, SOCI 4186, UPR-RP 6 .O estadstica inductiva .Formula una deduccin acerca de poblacin a partir de la cual se muestra .Proceso por el cual se infieren caractersticas de una poblacin una muestra significativa

la obtuvo la propiedades o a partir de

Variable Profa. V. De Jess, SOCI 4186, UPR-RP 7 .Cualitativa .Caractersticas pueden presentarse o no en individuos que constituyen un conjunto .Categoras difieren ms en clase (ej. sexo) .Cuantitativa .Categoras o propiedades que pueden presentarse en diversos grados o intensidad .Discreta o discontinua - cuyos valores aparecen con saltos o interrupciones abruptas (Ej. # votos, # cuartos, # autos) .Continua - valores o categoras no tienen interrupciones (Ej. edad: 23 aos, con 8 meses, 23 das...)

Variable (cont.) Profa. V. De Jess, SOCI 4186, UPR-RP 8 Segn escala o nivel donde se ubica, .Nominal datos se rotulan, etiquetan o denominan. Ninguna relacin de orden ni distancia. O categrica. (Ej. gnero) .Ordinal categoras en trminos de grado. Ordena rangos (Ej. clase social) .Intervalo la diferencia o magnitud entre categoras se conoce y son iguales (Ej. fecha). .Razn la diferencia o magnitud entre categoras se conoce y son iguales. 0 tiene significado (0 es nada). (Ej. edad, peso, estatura, largo)

Variable (cont.) Se puede calcular Nominal Ordinal Intervalo Razn Distribucin de Frecuencias S S S S Medianas y percentilas No S S S Sumar y restar No No S S Promedio y desviacin estndar No No S S Razn y coeficiente de variacin No

No No S

Profa. V. De Jess, SOCI 4186, UPR-RP 9 GraphPad Software Inc. (2004). What is the difference between ordinal, interval and ratio variables? Why should I care? Accesado de http://www.graphpad.com/faq/viewfaq.cfm?faq=1089

Datos Profa. V. De Jess, SOCI 4186, UPR-RP 10 .Fuentes de datos: .Primarios .Censos (ej. de poblacin y vivienda) .Estadsticas vitales (nacimientos, muertes, matrimonios y divorcios) .Secundarios .Encuestas .Registros o archivos administrativos

Indicadores Profa. V. De Jess, SOCI 4186, UPR-RP 11 .Expresin numrica que describe un fenmeno, que puede ser un nmero absoluto o relativo. .Reflejan las condiciones que describen a una comunidad. .Permiten establecer comparaciones. .Sirven para describir una situacin dada y sealar algunas tendencias.

Indicadores (cont.) Profa. V. De Jess, SOCI 4186, UPR-RP 12 .Nmeros absolutos (0, 1, 2, 3, 4...) .Nmeros relativos (que se comparan entre s) .Razn .Proporcin .Por ciento .Tasas .Medidas de tendencia central o de localizacin

Por ciento Profa. V. De Jess, SOCI 4186, UPR-RP 13 .Proporcin por 100 .Proporcin expresada en forma de... tanto por ciento del total .Cuntos de cada 100 cumplen con la condicin que interesa. .A/(A+B) x 100 = ___ %

Ejemplo de por ciento Profa. V. De Jess, SOCI 4186, UPR-RP 14 Por ciento de personas de 65 aos y ms en Vieques en 2000

1,263 personas de 65 aos y ms en Vieques en 2000 9,106 poblacin total en Vieques en 2000

= 0.1386997 = 0.1386997 x 100 = 13.9%

106,9263,1 Negociado del Censo Federal. (2001). Compendio de Datos 1 del Censo 2000. San Ju an: el autor.

Medidas de tendencia central Profa. V. De Jess, SOCI 4186, UPR-RP 15 .Se llaman tambin medidas de localizacin porque identifican un punto tpico o central de los datos. .Permiten establecer conclusiones sobre poblacin pertinente. .Promedio es un valor que representa o tipifica de alguna manera un conjunto de datos. .Mediana .Media .Moda

Mediana Profa. V. De Jess, SOCI 4186, UPR-RP 16 .Punto medio (sin agrupar), donde la mitad tiene valores iguales o mayores que sta y la otra mitad tiene valores iguales o menores. .Es til, cuando hay posibilidades de encontrar pocos valores extremos, como ingreso (familiar y personal) y edad.

Mediana (cont.) Profa. V. De Jess, SOCI 4186, UPR-RP 17 .Ordenar datos de menor a mayor .Impar: (n+1)/2 = # .Par: n/2 y (n/2) +1 = # + # / 2 = .El resultado es la posicin de la mediana. .Debe haber el mismo nmero de datos a cada lado de la mediana.

Ejemplo de mediana Profa. V. De Jess, SOCI 4186, UPR-RP 18 Nmero de cigarrillos consumidos por 10 jvenes en un da

3 1 5 3 7 11 8 10 4 9 (sin ordenar) 1 3 3 4 5 7 8 9 10 11 (ordenados de menor a mayor)

=10/2 = 5 (posicin quinta) y (10/2) + 1 = 6 (posicin sexta)

= 5 + 7= 12/2 = 6

= 6 cigarrillos al da es la mediana Nmero de cigarrillos consumidos por 9 jvenes en un da

3 1 5 3 7 8 10 4 9 (sin ordenar) 1 3 3 4 5 7 8 9 10 (ordenados de menor a mayor)

=9+1 = 10/2=5 (posicin quinta)

= 5 cigarrillos al da es la mediana

Media Profa. V. De Jess, SOCI 4186, UPR-RP 19 .Tambin se llama media aritmtica. .Punto de equilibrio o balance de los datos .Sensitiva a valores extremos .Suma de todas las observaciones divida entre el nmero de observaciones

Media (cont.) Profa. V. De Jess, SOCI 4186, UPR-RP 20 .En la mayora de los casos, es imposible o costoso obtener la media de toda la poblacin. (se lee mu) .Por lo tanto, se toma una muestra para obtener la media. (se lee x barra) .Si la muestra es representativa, la media muestral deber tener un valor cercano a la media poblacional. . x

Media (cont.) Profa. V. De Jess, SOCI 4186, UPR-RP 21 . = . = . = . = x . x n nxx . . media aritmtica sumatoria observacin total de observaciones

Ejemplo de media Profa. V. De Jess, SOCI 4186, UPR-RP 22 Nmero de cigarrillos consumidos al da por 10 jvenes

3 1 5 3 7 11 8 10 4 9 = 61 cigarrillos

= 6.1 cigarrillos consumidos al da por cada joven 1061 .x

Moda Profa. V. De Jess, SOCI 4186, UPR-RP 23 .En datos sencillos, es la observacin que ocurre con mayor frecuencia. .Puede haber ms de una moda, pero si todos los valores tienen la misma alta frecuencia, la moda no existe. .En datos agrupados, punto medio de intervalo con el mayor nmero de observaciones. .(Lmite inferior + lmite superior)/2

Ejemplo de moda Profa. V. De Jess, SOCI 4186, UPR-RP 24 Nmero de cigarrillos consumidos al da por 10 jvenes

3 1 5 3 7 11 8 10 4 9

Moda: 3 cigarrillos consumidos al da Cigarrillos Jvenes 1 a 4 4 5 a 8 3 9 o ms 3 Total 10

Intervalo con mayor nmero de observaciones es 1 al 4 cigarrillos con 4 jvenes

(1 + 4)/2 = 5/2 = 2.5 cigarillos

Medidas de localizacin Profa. V. De Jess, SOCI 4186, UPR-RP 25 .Percentila .Valor tal que aproximadamente el % de los datos observados son menores o iguales a ste. .Percentilas especiales .Primera cuartila - Q1 - Percentila del 25% .Segunda cuartila - Q2 -Percentila del 50% - Mediana .Tercera cuartila - Q3 - Percentila del 75% .Q1, Q2 y Q3 dividen la distribucin de los datos en 4 partes aproximadamente iguales.

26 Estadstica Descriptiva -Medidas de dispersin

Medidas de dispersin Profa. V. De Jess, SOCI 4186, UPR-RP 27 .Medidas de dispersin .Medidas de variacin .Medidas de variabilidad

Medidas de dispersin (cont.) Profa. V. De Jess, SOCI 4186, UPR-RP 28 .Conocer .Variabilidad .Diferencias entre las puntuaciones en s .Dispersin de los valores con respecto a medida de tendencia central .Cmo estn diseminados los puntajes alrededor del centro de distribucin

Medidas de dispersin (cont.) Profa. V. De Jess, SOCI 4186, UPR-RP 29 .Indican el grado en que los sujetos se dispersan respecto al centro de distribucin .Verificar cun homogneos, parecidos o estables son los elementos bajo

Medidas de dispersin (cont.) Profa. V. De Jess, SOCI 4186, UPR-RP 30 .Si todos los valores son los mismos, no hay dispersin. .Si no todos son los mismos, hay dispersin en los datos. .La magnitud de la dispersin puede ser pequea, cuando los valores, aunque diferentes, estn prximos entre s. .Si los valores estn ampliamente separados, la dispersin es mayor.

Medidas de dispersin (cont.) Profa. V. De Jess, SOCI 4186, UPR-RP 31 .Ms conocidas: .Recorrido, rango o amplitud (range en ingls) .Desviacin estndar (standard deviation en ingls)

Recorrido Profa. V. De Jess, SOCI 4186, UPR-RP 32 .Sencilla y directa .Menos confiable porque slo toma 2 valores .Distancia entre el valor menor y el valor mayor en un conjunto de observaciones .Si hay un valor extremo, dar la impresin de que la dispersin es grande. .Slo debe considerarse como un ndice preliminar.

Recorrido (cont.) Profa. V. De Jess, SOCI 4186, UPR-RP 33 .Todos los datos observados debern estar entre estos dos valores. .Mientras ms cerca entre s estn los valores extremos, ms cerca entre s debern estar los datos.

Recorrido (cont.) Profa. V. De Jess, SOCI 4186, UPR-RP 34 R = Vmax Vmin

R = Recorrido, rango o amplitud Vmax = valor mximo de los datos de un conjunto Vmin = valor mnimo de los datos de un conjunto

Varianza y Desviacin estndar Profa. V. De Jess, SOCI 4186, UPR-RP 35 .Medidas de dispersin ms adecuadas .Toman en consideracin todos los puntajes y controlan por el efecto de valores extremos.

Varianza Profa. V. De Jess, SOCI 4186, UPR-RP 36 .Las desviaciones cuadradas medias respecto a la media.

Clculo de la varianza (s2) Profa. V. De Jess, SOCI 4186, UPR-RP 37 .Encontrar la media muestral de los n datos .Buscar la diferencia de cada dato a la media encontrada .Tomar el cuadrado de las diferencias encontradas .Sumar estos cuadrados y dividir el resultado entre n-1

Desviacin estndar Profa. V. De Jess, SOCI 4186, UPR-RP 38 .Raz cuadrada de la varianza .Distancia promedio de los valores observados a su media .Si todos los sujetos son iguales en una caracterstica; entonces, el resultado ser igual a 0. .Si aumentan las diferencias, aumentar el ndice, alejndose ms y ms del punto 0.

Desviacin estndar (cont.) Profa. V. De Jess, SOCI 4186, UPR-RP 39 . Indica el grado en que los sujetos se dispersan (se alejan o se acercan) respecto al centro (la media) de una distribucin. . A mayor la desviacin estndar, mayor es la dispersin, con respecto a la media. . Si la desviacin estndar es grande, los datos estarn ms dispersos en promedio que si sta es pequea.

Desviacin estndar (cont.) Profa. V. De Jess, SOCI 4186, UPR-RP 40 .A menor la desviacin estndar, menor es la dispersin de los sujetos, con respecto a la media. . Se puede saber cun homogneos, parecidos o estables son los sujetos bajo estudio cuando estos son comparados con otro/s grupo/s de inters.

Clculo de la desviacin estndar (s) Profa. V. De Jess, SOCI 4186, UPR-RP 41 .Encontrar la varianza muestral (s2) de los datos .Tomar la raz cuadrada de s2

Referencias Profa. V. De Jess, SOCI 4186, UPR-RP 42 Departamento de Salud. SAPEESI. Divisin de Estadsticas. (2004). Informe anual de estadsticas vitales: 2002. San Juan: Autor.

Gran Diccionario Enciclopdico Universal. (1987). Bilbao: Editorial Cantbrica, S.A.

Negociado del Censo Federal. (2001). Compendio de Datos 1 del Censo 2000.

Pagano, M. & Gauvreau, K. (2000). Principles of Biostatistics. (2da. ed.). Pacif ic Grove: Duxbury.

Rodrguez, P.J., Quintero, A.H. & Vega, G.E. (1997). Estadstica Descriptiva: Una introduccin conceptual al anlisis de datos. San Juan: Publicaciones Puertorriqueas, Inc.

Torres Degr, A. & Afanador Mejas, E. (2005). Estadstica descriptiva en el campo soc ial puertorriqueo. Mayagez: Autores.