Instructor: Lic. Cristian R. Arroyo L. Diplomado de Especialización en:

Post on 08-Jan-2015

22 views 2 download

Transcript of Instructor: Lic. Cristian R. Arroyo L. Diplomado de Especialización en:

Instructor: Lic. Cristian R. Arroyo L.

Diplomado de Especialización en:Diplomado de Especialización en:

Los Datos

Elementos: son las entidades acerca de las cuales se reúnen los datos

Variables: es una característica de interés de los elementos.

Observaciones: es el conjunto de mediciones, reunido para cada elemento.

Datos Cualitativos y cuantitativos

Cuantitativos: Cuánto o cuantos, siempre son datos numéricos. Edad Ingreso Anual

Cualitativos: son atributos de cada elemento. Estado Civil Profesión

Fuentes de Información

Información procesada Superintendencia de Bancos Data Credit Registro Civil Otros...

Información no procesada Información histórica de los clientes Otras...

Estadística Descriptiva

Información procesada o resumida mediante: Tablas Gráficos Números

02468

1012141618

Porcenta

je

NYSE AMEX OTC

Casa de Bolsa

Operaciones Bursátiles de las Acciones de 25 Empresas

Distribución de Frecuencias

Es un resumen tabular de un conjunto de datos agrupados por clases que no se traslapan

Ejemplo 1 Ejemplo 2

Diagrama de Dispersión

Es una representación gráfica de la relación entre dos variables cuantitativas.

Diagrama de Disperción

0

10

20

30

40

50

60

70

0 1 2 3 4 5 6

Serie X

Se

rie

Y

Ejemplo 3

Media

Medida de localización central, conocida también como promedio, se obtiene sumando todos los datos y dividiendo el resultado entre la cantidad de valores.

Formula:

Ejemplo 4

nx

x i

Percentiles

Nos permite conocer como de distribuyen los valores sobre el intervalo seleccionado

Pasos:1. Ordenar los datos2. Calcular el índice i3. Redondear en caso de ser necesario

np

i

100

Percentiles

Medidas de Variabilidad

Permite conocer con más precisión el comportamiento de los datos y su efecto producto de la variabilidad de los datos

Rango Varianza Desviación Estándar Coeficiente de Variación

Rango

Se complementa con algún medida adicional por la escasez de datos

MínimoValor - máximoValor Rango Morosidad Cliente 1

1 4

2 45

3 7

4 16

5 1

6 30

Morosidad Cliente 2

1 1

2 4

3 18

4 25

5 3

6 5

Varianza

Emplea todos los datos Diferencia entre el dato y la media

Nxi

22

1

22

nxx

s i

Población Muestra

Varianza

Expresado en unidades al cuadrado Es una medida de variación

comparativa Es útil para comparar la dispersión o

variabilidad, de dos conjuntos de datos.

Desviación Estándar

De fácil interpretación Relaciona cuan dispersos están los

datos en relación con la media.

2ss 2 Población Muestra

Coeficiente de Variación

Análisis entre la volatilidad de los datos y la media.

100Media

EstándarDesviaciónVariacióndeeCoeficient

Resumen Gráfico y ejercicio

Practica No.1.docPractica No.1.xls

Medidas de localización relativa

s

xxz ii

s

xxz ii

xszx ii xszx ii

Regla Empírica “Teorema de Chebyshev”

99.9%

-3 395%

-2 268%

-1 1

Aplicaciones

Identificar un valores extremo Bajo pruebas de escenarios

determinar si tengo cobertura con el nivel de confianza establecido

Determinar los límites de mis intervalos de confianza

Medidas de Asociación entre dos variables

Permite conocer la relación entre dos variables. Covarianza Correlación Diagrama de dispersión

Diagrama de DispersiónDiagrama de dispersión Edad vrs. Atasos

0

5

10

15

20

25

30

35

40

45

0 1 2 3 4 5 6

No. Atrasos

Ed

ad

Covarianza

1

n

yyxx iixy

1

nyyxx ii

xy

Interpretación: El signo señala el tipo de relación, sin embargo no permite determinar con exactitud del nivel de asociación

Coeficiente de Correlación

Conocido también como el coeficiente de Person

Relación entre los datos Intensidad de la relación -100, 0, 100.

yx

xyxy ss

sr

yx

xyxy ss

sr

Ejemplo 9Ejemplo 9