Post on 05-Mar-2015
TEMA:
ANÁLISIS DE ANÁLISIS DE CONGLOMERADOSCONGLOMERADOS
K-MEDIASK-MEDIASINTEGRANTES:
Chan Tun Claudia
Cunil González Mayra
Pastrana Castro Jenifer
Valle López Ariane
DEFINICIÓN
- El análisis de conglomerados K-medias es un método de agrupación de
casos que se basa en las distancias existentes entre ellos en un conjunto de
variables (no permite agrupar variables).
- Identifica grupos relativamente homogéneos basándose en las
características seleccionadas.
DEFINICIÓN
A diferencia del método jerárquico, el análisis de k-medias es útil cuando se
dispone de un gran número de datos, y conlleva a que el usuario determine
el número de conglomerados que desea manejar.
Este proceso se puede utilizar para identificar segmentos de mercado.
REQUERIMIENTOS
ESTADÍSTICOS:•Centros iniciales de los conglomerados
•Tabla de ANOVA
•Información de cada conglomerado
•Distancia del centro de cada conglomerado
DATOS:•Variables cuantitativas de intervalo o razón.
• Si las variables son binarias o recuentos, utilizar el análisis de
conglomerado jerárquico.
PROCESO (OPCIONAL)
A continuación se procederá a un procedimiento que para el análisis de
conglomerados k-medias supone un complemento que permita:
•Filtrar el número de casos a analizar (en caso de no querer tomar el total de
casos).
•Tener una idea de cuántos conglomerados determinar.
PROCESO (OPCIONAL)
Menú:
Datos
Seleccionar Casos
PROCESO (OPCIONAL)
Muestra aleatoria de casos
Ejemplo…
PROCESO (OPCIONAL)
Ingresamos un % de casos a
considerar
Continuar
Aceptar
PROCESO (OPCIONAL)
Gráficos Generador de gráficos
PROCESO (OPCIONAL)
Galería
Diagrama de dispersión
PROCESO (OPCIONAL)
Elementos básicos
Punto (doble clic)
PROCESO (OPCIONAL)
Se seleccionan las variables
(arrastrar hacia cada eje)
Aceptar
PROCESO (OPCIONAL)
PROCESO
Menú:
Analizar
Clasificar
Conglomerado de K
medias...
Figura 1.1 Cuadro de diálogo Análisis de Conglomerados K- medias
ANALISIS: ITERAR
Limita el número de
iteraciones en el algoritmo k-
medias.
Determina cuándo cesa la iteración.
Debe ser mayor que 0 y no mayor a 1. Permite solicitar la actualización de los
centros de los conglomerados tras la
asignación de cada caso.
ANÁLISIS: GUARDAR
•Conglomerado de pertenencia: crea una nueva variable que indica el
conglomerado final al que pertenece cada caso.
•Distancia desde centro del conglomerado: crea una nueva variable que
indica la distancia entre cada caso y su centro de clasificación.
ANÁLISIS: OPCIONES
Primera estimación de las
medias de las variables para
cada conglomerado.
Muestra una tabla de análisis de
varianza que incluye las pruebas
F univariadas para cada variable
de aglomeración.
Muestra, para cada caso: el conglomerado final asignado y la distancia entre el caso y el
centro del conglomerado utilizado; y la distancia entre los centros de los conglomerados
finales.