Introducción a la estadística · PDF fileDorado 175 Cantidad de casos 20.47 ......

Post on 30-Jan-2018

224 views 2 download

Transcript of Introducción a la estadística · PDF fileDorado 175 Cantidad de casos 20.47 ......

Introducción a la estadística

Profa. Bárbara González

COMU

Puerto Rico Puerto Rico Características Sociales Seleccionadas en Puerto Rico: 2005-2009 Conjunto de Datos: Encuesta sobre la Comunidad de Puerto Rico del 2005-2009 --Estimados de 5 Años Encuesta: Encuesta sobre la Comunidad de Puerto Rico Social - Educación, Estado Civil, Parentesco, Fecundidad, Abuelos...Económico - Ingreso, Empleo, Ocupación, Viaje al trabajo...Vivienda - Ocupación y Estructura, Valor de la Vivienda y Costos, Servicios Públicos...Demográfico - Sexo y Edad, Raza, Origen Hispano, Unidades de Vivienda...Narrativo - Perfil con texto y gráficas para análisis fácil

http://factfinder.census.gov/

http://www.censo.gobierno.pr/

Definición de estadística

• La estadística es considerada como un método

para tratar datos numéricos. Es un

instrumento que se orienta a la recolección,

organización, y análisis de datos numéricos oorganización, y análisis de datos numéricos o

de observaciones. (Haber y Runyon, 1973)Infiere: partiendo de casos particulares, se producen conocimientos generales.

estadística

• La estadística intenta explicar la variación.

• Infiere propiedades de la variación a partir de

la muestra.

Tipos de estadística

La estadística se subdivide en:

• Estadística Descriptiva: describe y resume un cuerpo deinformación. Los datos pueden resumirse estadísticamente

(moda, media, desviación estándar) o pueden representarse

gráficamente (histograma, gráfica de barras, pie chart)gráficamente (histograma, gráfica de barras, pie chart)

• Estadística Inferencial: proceso de llegar a generalizaciones

acerca del todo (llamado población) examinando una porción

(llamada muestra). Le interesa conocer cuán confiable es la

magnitud de las diferencias en la variabilidad.

Ejemplos de Tipos de Estadística

• Descriptiva: la información que se obtiene de una encuesta.

(Ej. Un 25% de las personas encuestadas contestó que estaba

a favor del cierre de los negocios de bebidas alcohólicas en la

madrugada.)

• Inferencial: Si de esa información se extrapola resultados para• Inferencial: Si de esa información se extrapola resultados para

todos los ciudadanos (por ejemplo, decir que dada la muestra,

un 30% de la población de Puerto Rico apoya el cierre …. con

un margen de error de .05% y un 95% de confiabilidad).

¿Quiénes usan la estadística?

• Organismos gubernamentales.

• Diarios y revistas.

• Políticos.

• Deportes.

• Marketing.• Marketing.

• Control de calidad.

• Administradores.

• Investigadores científicos.

• Médicos

• etc.

Abusos que se pueden cometer con la Abusos que se pueden cometer con la

EstadísticaEstadística

� Conclusiones erróneas debido a que los datos

son numéricamente insuficientes.

� Representaciones gráficas engañosas (escalas).

� Datos muestrales no representativos:Datos muestrales no representativos:

–– Muestra que no incluye a elementos de toda la Muestra que no incluye a elementos de toda la

población.población.

–– Ciertas categorías de personas no responden Ciertas categorías de personas no responden

correctamente.correctamente.

–– Respuestas voluntarias (sesgadas).Respuestas voluntarias (sesgadas).

Caso

• Un investigador concluye que las mujeres en

el primer año de universidad tienen un mayor

coeficiente intelectual que los hombres. Para

esto somete a 5 mujeres y 5 hombres de esto somete a 5 mujeres y 5 hombres de

primer año de universidad a una prueba de IQ

y encuentra que la media de las mujeres es de

110 y la de los hombres es de 102. ¿La

conclusión del investigador es correcta?, ¿La

variabilidad de estos datos es significativa o

no?, ¿Se pueden hacer inferencias de

muestras no probabilísticas?

Estadísticas Descriptivas

• Distribuciones: Ordenación de los datos para

observar como se distribuyen.

– Distribución de Frecuencias

• Número de veces que aparece un valor observado• Número de veces que aparece un valor observado

Tabla 1 Frecuencia de personas que usan el tren urbano

provenientes de los pueblos cercanos.

Pueblo Frecuencias Por ciento %

Bayamón 250 29.24

San Juan 230 26.90

Toa Baja 200 23.39

Dorado 175

Cantidad

de casos

Dorado 175 20.47

Total 855

% = Frecuencia / total * 100

250/855*100=29.24%

Ejercicio: Busque la frecuencia para cada alimento y

Obtenga el %

Arroz Pollo Cerdo Cerdo

Ensalada Pasta Arroz Pasta

Pollo Cerdo Pollo Cerdo

Pasta Pavo Cerdo Pasta

Arroz Pollo Arroz Arroz

Cerdo Cerdo Pasta Pasta

Pollo Arroz Cerdo Pollo

Tabla de frecuencias

Concepto Frecuencias Por ciento %

Estadísticas Descriptivas: Medidas de

Tendencia Central

• Busca los valores que se ubican en el centro de distribución

permitiendo hacer comparaciones.

• Muestra en qué lugar se ubica la persona promedio o típica

del grupo.

• Sirve como un método para comparar o interpretar una • Sirve como un método para comparar o interpretar una

puntuación particular en relación con la puntuación total.

• Compara el puntaje obtenido por una misma persona en dos

diferentes ocasiones.

• Compara los resultados medios obtenidos por dos o más

grupos.

Estadísticas descriptivas

•• Las medidas de tendencia central más Las medidas de tendencia central más

importantes son:importantes son:

–– Media.Media.

–– Mediana.Mediana.–– Mediana.Mediana.

–– Moda.Moda.

Media aritmética

• Es la suma de todas las observaciones dividida entre el número total de observaciones.

• Por ejemplo, si en una habitación hay tres personas, la media de dinero que tienen en sus bolsillos sería el resultado de tomar todo el dinero de los tres y dividirlo a partes iguales entre cada uno de ellos. Es decir, la media es una forma de entre cada uno de ellos. Es decir, la media es una forma de resumir la información de una distribución (dinero en el bolsillo) suponiendo que cada observación (persona) tendría la misma cantidad de la variable. (wikipedia)

• Toma en consideración todos los valores de la distribución bajo estudio, se afecta por valores extremos.

Cálculo de la media aritmética

Con distribuciones de frecuencia

agrupadas

Ejemplo calificaciones:

Puntos del examen 1 = 25/50 = 50%Puntos del examen 2 = 45/50 = 90%Puntos del examen 2 = 45/50 = 90%Puntos del examen 3 = 35/40 = 88%

Total de % 228 dividido por 3 = 76%

Otro ejemplo de la media

La media X barra

Suma de todas

Valores dela variable

Frecuencia de los valores de la variable

Num. calificaciones

Suma de todas las observaciones

Ref. Haber/Runyon : Estadística General

Ejercicio: Busca la media de los

siguientes números

Horas a la semana dedicadas al uso de la

computadora:

25 15 28 29 25 26 21 26

Mediana

• Es el valor que ocupa la posición central de un

conjunto de observaciones, una vez que han

sido ordenados en forma ascendente o

descendente.descendente.

• Divide al conjunto de datos en dos partes

iguales.

• No se afecta por valores extremos, por lo que

representa de forma más fiel las

características del objeto de estudio en cuanto

a la tendencia central.

• Para calcular la mediana se ordenan los

números de menor a mayor y luego se busca

el punto medio. Le mediana sería el valor que

ocupa la posición n + 1 / 2ocupa la posición n + 1 / 2

Ejercicio:Calcula la mediana de los

siguientes números

3, 13, 7, 5, 21, 23, 39, 23, 40, 23,

14, 12, 56, 23, 2914, 12, 56, 23, 29

Ejercicio:Calcula la mediana de los

siguientes números

3, 13, 7, 5, 21, 23, 23, 40, 23, 14,

12, 56, 23, 12, 56, 23,

Moda

• Observación o clase que tiene la mayor frecuencia (el

mayor número de casos) en un conjunto de

observaciones.

• Es el valor que más se repite.

Pueblo Frecuencias Por ciento %Pueblo Frecuencias Por ciento %

Bayamón 250 29.24

Carolina 230 26.90

San Juan 200 23.39

Caguas 175 20.47

Total 855

No se afecta por valores extremos

Ejercicio: Busca la Moda

Pepsi Coca Cola Coca Cola

Pepsi Sprite Coca Cola

Coca Cola Coca Cola Sprite

Pepsi Coca Cola SpritePepsi Coca Cola Sprite

Sprite Pepsi Pepsi

INTERPRETACIÓN DE LOS DATOS

Obama

P.430

Ver video: Asignación

• Medidas de Tendencia Central y Dispersión Excel

• http://www.youtube.com/watch?v=jstpOsLt_Y• http://www.youtube.com/watch?v=jstpOsLt_Y

I&feature=related

Presentación de los datos

Género Frec.

Hombre 4

Mujer 6

0

1

2

3

4

5

6

7

0

Hombre Mujer

�� Las tablas de frecuencias y las representaciones gráficas Las tablas de frecuencias y las representaciones gráficas son dos maneras son dos maneras equivalentesequivalentes de presentar la de presentar la información. Las dos exponen ordenadamente la información. Las dos exponen ordenadamente la información recogida en una muestra.información recogida en una muestra.

Tablas de frecuencia�� Exponen la información recogida en la muestra, de forma que no se pierda nada de Exponen la información recogida en la muestra, de forma que no se pierda nada de

información (o poca).información (o poca).

–– Frecuencias absolutasFrecuencias absolutas: Contabilizan el número de individuos de cada modalidad: Contabilizan el número de individuos de cada modalidad

–– Frecuencias relativas (porcentajes)Frecuencias relativas (porcentajes): : IdemIdem, pero dividido por el total, pero dividido por el total

–– Frecuencias acumuladasFrecuencias acumuladas: Sólo tienen sentido para variables ordinales y numéricas: Sólo tienen sentido para variables ordinales y numéricas

Nivel de felicidad

467 30,8 31,1 31,1

872 57,5 58,0 89,0

165 10,9 11,0 100,0

1504 99,1 100,0

13 ,9

1517 100,0

Muy feliz

Bastante feliz

No demasiado feliz

Total

Válidos

No contestaPerdidos

Total

Frecuencia Porcentaje

Porcentaje

válido

Porcentaje

acumulado

Sexo del encuestado

636 41,9 41,9

881 58,1 58,1

1517 100,0 100,0

Hombre

Mujer

Total

VálidosFrecuencia Porcentaje

Porcentaje

válido

Tipos de variables

� Cuantitativas o NuméricasSi sus valores son numéricos (representan las diferencias de los participantes bajo estudio)

� Discretas: Si toma valores enteros. No tienen punto decimal.� Número de hijos, Número de cigarrillos, Num. de “cumpleaños”

� Continuas: Si entre dos valores, son posibles infinitos valores intermedios. Por lo regular tienen punto decimal.� Altura, Presión intraocular, Dosis de medicamento administrado, edad

Tipos de Escala

� Nominales: Sus valores no se pueden ordenar porque identifican particularidades y no cantidades. (Cualitativas)� Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No), Actitud a favor o en

contra

� Ordinales: Sus valores se pueden ordenar porque refleja el orden de los sujetos bajo estudio, pero no mide la magnitud de las diferencias)� Mejoría a un tratamiento, Grado de satisfacción, Intensidad del dolor, actitud

(fuertemente a favor, moderadamente a favor, moderadamente en contra, fuertemente en contra) – Deben presentarse de forma ordenada.en contra) – Deben presentarse de forma ordenada.

38

Tipos de Escalas

• Intervalos: Sus números reflejan tanto el orden como la

magnitud de las diferencias entre los sujetos. Pero carecen de

0 absoluto, lo que impide comparaciones entre sujetos.

Ejemplo: IQ, temperatura. Juan tiene un IQ de 50 y Pedro de

100 (Se puede decir que Pedro es más inteligente que Juan, 100 (Se puede decir que Pedro es más inteligente que Juan,

pero no que Pedro es el doble de inteligente que Juan.

• Razones: Igual a la de intervalo pero estas si tienen 0

absoluto. Ejemplo: peso, tiempo, sonoridad, longitud. Se

pueden hacer comparaciones. Juan pesa 100 y Pedro 200,

Pedro es el doble de pesado que Juan.

Representación gráfica de los datos:

diagramas de barras

Diagramas barras para v. nominales u ordinales (discretas)Se deja un hueco entre barras.

Representación gráfica de los datos:

Histograma

Histogramas para v. continuas (intérvalo)

El área que hay bajo el histograma entre dos puntos cualesquiera indica la cantidad (porcentaje o frecuencia) de individuos en el intervalo.

Representación gráfica de los datos: Polígono de

frecuencias

Representación gráfica de los datos:

ojiva

Representación gráfica de los datos:

Diagrama circular (Pie Chart)

No se usa con variables ordinales

Representación gráfica de los datos:

Pictogramas

http://www.spssfree.com/spss/analisis4.html

Aprendiendo con YouTube

• Estadística Inferencial

• http://www.youtube.com/watch?v=I0FqjIzDuo4

• Estadística descriptiva

• http://www.youtube.com/watch?v=lexatrv3TcE&feature=cha

nnelnnel

Programas para calculos estadisticos

• http://www.softonic.com/s/calculos-estadistica

• http://www.openepi.com/Menu/OpenEpiMenu.htm

• Estadisticas básicas con Excel

• http://www.youtube.com/watch?v=q3LR_CfGvS4• http://www.youtube.com/watch?v=q3LR_CfGvS4

• Guía de SPSS 15

– http://www.um.es/ae/soloumu/pdfs/pdfs_manuales_spss/SPS

S%20Brief%20Guide%2015.0.pdf

Datos cualitativos

Ver:http://www.youtube.com/watch?v=_7tXEXwPGJ

Y

Enfoque Cualitativo

• Busca obtener datos de personas, comunidades, contextos,

situaciones…

• Los datos son conceptos, percepciones, imágenes mentales,

creencias, emociones, interacciones, pensamientos

experiencias.experiencias.

• La finalidad de los datos es analizarlos y comprenderlos para

responder a la pregunta de investigación.

• Busca entender significados, razones del comportamiento.

• No se reducen a números para ser analizados

estadísticamente.

¿Cuál es el instrumento de recolección de datos

cualitativos?

• El propio investigador: recoge los datos, los

analiza, genera las respuestas para entender el

fenómeno estudiado.

• No se utilizan pruebas estandarizadas, ni • No se utilizan pruebas estandarizadas, ni

cuestionarios, ni un sistema de medición.

Tipos de unidades de análisis (Lofland

y Lofland, 1995)

Significados: definiciones, estereotipos, ideologías, reglas, normas.

Prácticas: rituales, hábitos

Episodios: eventos críticos como el divorcio, el 11 de Episodios: eventos críticos como el divorcio, el 11 de sept.

Encuentros: una reunión, una consulta médica

Papeles: roles de cada cual

Relaciones: - vínculos- íntimas, paternales, filiales

Tipos de unidades de análisis

Grupos: conjunto de personas con metas y que se consideran así mismos una entidad: familia, redes, equipos de trabajo

Organizaciones: Unidades formadas con un fin colectivo, se analiza su origen, cultura, rol, control, jerarquías

Comunidades: Asentamientos en territorios reales o virtuales – pueblo o ciudad

Subculturas: porciones de la comunidad que se organizan bajo una idea particular – roqueros, cocolos, cibercultura

Estilos de vida: estilos adoptados por la clase social

Rol del investigador

• Supervisor

• Lider

• Amigo

• Debe minimizar su influencia sobre los

participantes.

• Debe obtener información tal cual los

participantes la revelan.

Analisis de datos cualitativos

• Los datos recolectados hay que interpretarlos

• Cada estudio requiere de un esquema propio a diferencia de los datos

cuantitativos.

• Hay un plan básico pero en el camino va sufriendo modificaciones de

acuerdo a los resultados y la necesidad.

• Se usan categorías• Se usan categorías

• Se buscan semejanzas y diferencias

• Las observaciones del investigador son tomadas en cuenta.

• La reflexión continua se hace necesaria.

• Las observaciones se enfocan en la solución del problema.

Ejercicio: ¿Qué datos puedes obtener

del texto?

“A las 8:30 pm se encontraba a muchos kilómetros del lugar del

crimen. Su novia puede manifestarlo, ya que estuvo al cine

con ella, aunque no recuerda exactamente el nombre de la

sala ni el de la película , pero sí recuerda que era una

película de misterio, ya que son sus preferidas. Sobre la película de misterio, ya que son sus preferidas. Sobre la

ocupación del arma blanca que llevaba en el momento de la

detención, mantiene que la compró la semana pasada en el

pulguero de los sábados de la localidad de Carolina, ya que

le gusta llevar navaja por temor a ser asaltado por

atracadores, pues en una ocasión le robó un negro … “.

Ejemplos

• http://es.scribd.com/doc/53505901/Ejemplo-

Analisis-de-Contenido

• http://www.ejemplode.com/11-

escritos/1568-escritos/1568-

ejemplo_de_analisis_de_contenido.html