Proyecto Grupal a Ultima Parte 2

21
ESTADISTICA PROYECTO FINAL Presentado Por: Judith Lázaro Pabón Carolín Aponte Wilches Profesora. Diana Velásquez

Transcript of Proyecto Grupal a Ultima Parte 2

Page 1: Proyecto Grupal a Ultima Parte 2

ESTADISTICAPROYECTO FINAL

Presentado Por:Judith Lázaro PabónCarolín Aponte Wilches

Profesora. Diana Velásquez

III semestrePolitécnico Grancolombiano2009

Page 2: Proyecto Grupal a Ultima Parte 2

v1 = SALDO DE CUENTA (en miles de pesos) v2 = NUMERO DE TRANSACCIONES EN CAJERO AUTOMATICO AL MES v3 = NUMERO DE OTROS SERVICIOS BANCARIOS UTILIZADOS v4 = TIENE TARJETA DEBITO (1=SI, 0=NO) v5 = RECIBE INTERESES SOBRE SU CUENTA (Si =1; No =2) v6 = SUCURSAL DONDE SE MANEJA LA CUENTA (Unicentro =1; Suba=2; Chapinero = 3; Restrepo = 4) v7 = ESTADO CIVIL (Soltero =1; Casado=2;Divorciado= 3; Otro = 4) v8 = NÚMERO DE HIJOS v9= NIVEL EDUCATIVO (Postgrado =1; Universidad =2;Técnico = 3; Bachiller = 4; 5 Primaria ) v10= VALOR PRESTAMO SOLICITADO PARA VIVIENDA (Cien miles de pesos) v11 = HA SOLICITADO PRESTAMO BANCARIO (Si =1; No =2)

Page 3: Proyecto Grupal a Ultima Parte 2

1. Considere aleatoriamente sólo uno de los encuestados y el evento elegir una persona aleatoriamente que tenga tarjeta débito; puede esta ser una variable aleatoria de tipo Bernoulli?

Rta/ Sí Por que cada persona sólo tiene dos posibles resultados o tiene tarjeta debito o no tiene

tarjeta debito y cada evento es el complemento del otro.

Y = 0, 1X = 0 significa que la persona no tiene tarjeta débitoX = 1 significa que la persona tiene tarjeta débito

Encuestado Nro. v1 v2 v3 v4 v5 v6 v7 v8 v9 v10 v111 2000 13 4 0 1 2 2 3 1 3000 12 3100 9 2 1 0 1 2 2 1 4650 13 800 10 1 0 0 1 1 0 5 1200 14 3800 10 4 0 1 3 1 1 1 5700 15 2800 6 4 0 0 4 4 2 5 4200 16 1550 18 6 0 0 2 4 1 4 2325 17 1300 12 6 1 0 3 2 0 3 1950 18 800 15 4 1 0 3 2 0 3 1200 19 3800 4 3 0 0 4 1 1 1 4750 1

10 650 9 5 1 1 3 2 3 2 812,5 111 3500 8 4 1 0 4 2 5 5 4375 112 550 12 3 0 1 2 4 5 4 715 113 3500 17 3 0 1 1 2 4 5 4550 114 2800 6 3 0 0 3 4 2 5 3640 115 1550 10 8 1 0 1 4 1 4 2015 116 3800 6 4 0 0 4 1 1 1 4940 117 1100 18 6 0 0 2 3 3 1 1430 118 3100 7 5 1 0 1 2 1 1 3410 119 750 6 5 0 0 1 1 0 3 825 120 400 10 3 1 0 1 1 1 3 021 400 10 3 1 0 1 1 1 3 022 500 12 4 0 0 1 1 0 5 023 1100 20 3 1 0 4 2 1 5 1210 124 800 7 2 0 0 3 2 1 5 880 125 200 20 7 1 0 4 4 1 1 026 800 15 4 1 0 3 2 0 3 1440 127 800 11 2 0 1 1 1 0 1 1440 128 400 10 3 1 0 1 1 1 3 029 650 6 3 0 0 3 2 3 2 1170 130 3500 10 8 1 0 1 2 4 5 6300 1

Page 4: Proyecto Grupal a Ultima Parte 2

2. Considere el número de encuestados que tienen tarjeta débito:

a.- Es ésta una variable aleatoria? Es discreta o continua? ¿Qué tipo de variable aleatoria, de las vistas en clase o en las lecturas, Bernoulli, Binomial, Poisson o Normal, es esta variable.

Es una variable aleatoria discreta, tipo Binomial, porque en cada prueba del experimento se tiene

sólo dos posibles resultados, o tiene tarjeta debito o no tienen. Permiten realizar n ensayos

Bernoulli independientes.

b. Según su base de datos, ¿cuál es la probabilidad de elegir aleatoriamente una persona con tarjeta débito? Ahora considere su base de datos como la población y determine la probabilidad de que 7 personas elegidas al azar de una muestra aleatoria de 15 personas tengan tarjeta débito.

N=30

X=número de personas con tarjetas debito

P=14/30= 0.46666

q=1-p = 1-0.4666

= 0.53333

Para el análisis de una sola persona, teniendo como base de datos n=30, nuestra variable aleatoria

tener o no tener tarjeta débito es de tipo Bernoulli.

c. Realice una tabla de la distribución de probabilidad de la variable aleatoria número de personas que tienen tarjeta débito. Ésta en Excel para los siguientes tamaños de muestra: n=15, n=20, n=30 dejando fija la p que le dio en el literal b.

Tamaño de la muestra

15Tamaño de la muestra

20Tamaño de la muestra

30

Probabilidad 0.4666 Probabilidad 0.4666 Probabilidad 0.4666

Número de personas con tarjeta débito

P(X=x)Número de

personas con tarjeta débito

P(X=x)Número de

personas con tarjeta débito

P(X=x)

0 8.04999E-05 0 3.47584E-06 0 6.4802E-09

1 0.001056278 1 6.0811E-05 1 1.7006E-07

Page 5: Proyecto Grupal a Ultima Parte 2

2 0.006467969 2 0.000505356 2 2.1571E-06

3 0.024517813 3 0.002652408 3 1.7611E-05

4 0.064342023 4 0.009860999 4 0.00010399

5 0.123825223 5 0.027603401 5 0.00047302

6 0.180530087 6 0.060366269 6 0.0017241

7 0.203041954 7 0.105612677 7 0.00517092

8 0.177614127 8 0.150127807 8 0.0130046

9 0.120843908 9 0.175102199 9 0.02780795

10 0.06342606 10 0.168490729 10 0.05108342

11 0.025219518 11 0.133990821 11 0.08124732

12 0.007353723 12 0.087907926 12 0.11253124

13 0.001484489 13 0.04732236 13 0.13629941

14 0.000185511 14 0.020697987 14 0.14477934

15 1.08186E-05 15 0.007242355 15 0.13509119

16 0.001979801 16 0.11078732

17 0.000407497 17 0.07981066

18 5.94107E-05 18 0.05042239

19 5.47057E-06 19 0.02785754

20 2.39274E-07 20 0.01340285

21 0.00558303

22 0.00199793

23 0.0006079

24 0.0001551

25 3.2562E-05

26 5.4778E-06

27 7.0989E-07

28 6.6535E-08

29 4.0139E-09

30 1.1704E-10

Para la muestra de tamaño 15 determine la probabilidad de que:

i. Tres personas tengan tarjeta débito.

Como se observa en la tabla de tamaño de muestra 15, p=0.4666, la probabilidad de que 3 personas tengan tarjeta debito es de 0,024517813.

De manera analítica se expresa de la siguiente forma:

n=15 x=3 p= 0.4666 q= 0.5333

Page 6: Proyecto Grupal a Ultima Parte 2

p(3) = (153 )(0.4666)3(0.5333)12

p(3) = 0,024517813

ii. Ninguna persona tenga tarjeta débito.

Como se observa en la tabla de tamaño de muestra 15, p=0.4666, la probabilidad de que

ninguna persona tengan tarjeta debito es de 8,04999E-05 = 0.0000804999.

iii. Diez personas tengan tarjeta débito.

Como se observa en la tabla de tamaño de muestra 15, p=0.4666, la probabilidad de que

10 personas tengan tarjeta debito es de 0,06342606.

Page 7: Proyecto Grupal a Ultima Parte 2

d. Realice una tabla de distribución de probabilidades acumuladas para n=15 y determine la probabilidad de que:

Tamaño de la muestra 15

Probabilidad 0.4666

Número de personas con tarjeta débito

P(X=x)

0 8.04999E-05

1 0.001136778

2 0.007604746

3 0.03212256

4 0.096464583

5 0.220289806

6 0.400819893

7 0.603861846

8 0.781475974

9 0.902319881

10 0.965745941

11 0.990965459

12 0.998319181

13 0.99980367

14 0.999989181

15 1

i. Al menos tres personas tengan tarjeta débito.

Como se observa en la tabla de tamaño de muestra 15, p=0.4666, la probabilidad de que al menos 3 personas tengan tarjeta debito es de 0,991190352. Para calcular este valor hay que usar la propiedad del complemento:

Page 8: Proyecto Grupal a Ultima Parte 2

n=15 x=0 p= 0.4666 q= 0.5333

p(0) = (150 )(0.4666)0(0.5333)15

p(0) = 0,000080499

p(1) = (151 )(0.4666)1(0.5333)14

p(1) = 0,001136778

p(2) = (152 )(0.4666)2(0.5333)13

p(2) = 0,007604746

P(X<3) = P(X≤2) = P(X¿0) P(X¿1) P(X¿2)P(X<3) = P(X≤2) = 0,000080499 + 0,001136778 + 0,007604746P(X<3) = P(X≤2) = 0.008822024P(X<3) = 1 -P(X≤2) = 1 – 0.008822024 = 0.991177976

ii. Como máximo 8 personas tengan tarjeta débito.

Como se observa en la tabla de tamaño de muestra 15, p=0.4666, la probabilidad de que máximo 8 personas tengan tarjeta debito es de 2.143856686.

iii. Entre 4 y 10 personas tengan tarjeta débito

Como se observa en la tabla de tamaño de muestra 15, p=0.4666, la probabilidad de que entre 4 y 10 personas tengan tarjeta debito es de 3.970977924.

Page 9: Proyecto Grupal a Ultima Parte 2

e. Realice la gráfica de dichas distribuciones. En Excel. ¿Observa algún cambio de la gráfica cuando el tamaño de muestra cambia?

Muestra: 15 personas

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 160

0.05

0.1

0.15

0.2

0.25

Número de Personas con tarjeta débito

P(X)

0 1 2 3 4 5 6 78.04999E-05 0.001056278 0.006467969 0.024517813 0.064342023 0.123825223 0.180530087 0.203041954

8 9 10 11 12 13 14 150.17761412

7 0.120843908 0.06342606 0.025219518 0.007353723 0.001484489 0.000185511 1.08E-05

Page 10: Proyecto Grupal a Ultima Parte 2

Muestra: 20 personas

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 210

0.02

0.04

0.06

0.08

0.1

0.12

0.14

0.16

0.18

0.2

Número de personas con TD

P(X)

0 1 2 3 4 5 6

3.47584E-06 6.0811E-05 0.000505356 0.002652408 0.009860999 0.027603401 0.060366269

7 8 9 10 11 12 13

0.105612677 0.150127807 0.175102199 0.168490729 0.133990821 0.087907926 0.04732236

14 15 16 17 18 19 20

0.020697987 0.007242355 0.001979801 0.000407497 5.94E-05 5.47057E-06 2.39274E-07

Muestra: 30 personas

Page 11: Proyecto Grupal a Ultima Parte 2

1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 310

0.02

0.04

0.06

0.08

0.1

0.12

0.14

0.16

Número de personas con TD

P(X)

0 1 2 3 4 5

6.48023E-09 1.7006E-07 2.15706E-06 1.76113E-05 0.000103989 0.000473023

6 7 8 9 10 11

0.001724101 0.005170916 0.013004603 0.02780795 0.051083424 0.081247317

12 13 14 15 16 17

0.112531241 0.136299413 0.14477934 0.135091194 0.110787316 0.079810655

18 19 20 21 22 23

0.050422392 0.027857543 0.013402852 0.005583026 0.001997934 0.000607904

24 25 26 27 28 29

0.000155101 3.25624E-05 5.47778E-06 7.09893E-07 6.65346E-08 4.01395E-09

30

1.17042E-10

Page 12: Proyecto Grupal a Ultima Parte 2

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

0

0.02

0.04

0.06

0.08

0.1

0.12

0.14

0.16

Tamaño de la muestra 15 Tamaño de la muestra 20 Tamaño de la muestra 30

f. Calcule el valor esperado y la varianza de la variable aleatoria número de encuestados con tarjeta débito y explique su significado en lenguaje cotidiano (no matemático).

Valor esperado:E (X)= n*p E (15) = (15)(0.4666) = 6.999 =7 personas

Esperamos que 7 personas tengan tarjeta debido de la muestra analizada.

Varianza (X)

Page 13: Proyecto Grupal a Ultima Parte 2

g. Ahora realice una tabla de distribución de probabilidad de la variable aleatoria número de personas que tienen tarjeta débito. Ésta en Excel pero ahora deje fijo el tamaño de muestra de 15 personas y cambie la probabilidad que le dio en el literal d. Por ejemplo, si p le dio 0.2 determine la distribuciones para p=0.1, 0.4, 0.5, 0.7, 0.8, observe… son dos números antes y tres después pero en su ejercicio es obligatorio que aparezca 0.5.

Tamaño de la muestra

15 Tamaño de la muestra

15 Tamaño de la muestra

15

Probabilidad 0.15 Probabilidad 0.25 Probabilidad 0.5

Número de personas

con tarjeta débito

P(X=x)Número de

personas con tarjeta débito

P(X=x)Número de

personas con tarjeta débito

P(X=x)

0 0.087354219 0 0.013363461 0 3.05176E-05

1 0.231231756 1 0.066817305 1 0.000457764

2 0.285639229 2 0.155907045 2 0.003204346

3 0.218429998 3 0.225199065 3 0.013885498

4 0.115639411 4 0.225199065 4 0.041656494

5 0.044895301 5 0.165145981 5 0.091644287

6 0.0132045 6 0.091747767 6 0.152740479

7 0.002995979 7 0.039320472 7 0.196380615

8 0.000528702 8 0.013106824 8 0.196380615

9 7.2567E-05 9 0.003398065 9 0.152740479

10 7.68356E-06 10 0.000679613 10 0.091644287

11 6.16328E-07 11 0.000102972 11 0.041656494

12 3.62546E-08 12 1.14413E-05 12 0.013885498

13 1.47643E-09 13 8.801E-07 13 0.003204346

14 3.7221E-11 14 4.19095E-08 14 0.000457764

15 4.37894E-13 15 9.31323E-10 15 3.05176E-05

Tamaño de la muestra

15 Tamaño de la muestra

15

Probabilidad 0.65 Probabilidad 0.75

Número de personas con tarjeta débito

P(X=x)Número de

personas con tarjeta débito

P(X=x)

0 1.44884E-07 0 9.31323E-10

1 4.03606E-06 1 4.19095E-08

2 5.24687E-05 2 8.801E-07

3 0.000422248 3 1.14413E-05

4 0.002352527 4 0.000102972

5 0.009611752 5 0.000679613

6 0.029750661 6 0.003398065

7 0.071037293 7 0.013106824

8 0.131926401 8 0.039320472

9 0.190560357 9 0.091747767

10 0.212338683 10 0.165145981

11 0.179246941 11 0.225199065

12 0.110962392 12 0.225199065

13 0.047555311 13 0.155907045

14 0.012616715 14 0.066817305

15 0.001562069 15 0.013363461

Page 14: Proyecto Grupal a Ultima Parte 2

h. Realice la grafica de dichas distribuciones En Excel. ¿Observa algún cambio de la gráfica cuando la probabilidad cambia?

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 160

0.05

0.1

0.15

0.2

0.25

0.3

P=0.15

Número de personas con TD

P(X)

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 160

0.05

0.1

0.15

0.2

0.25

P=0.25

Número de Personas con TD

P(X)

Page 15: Proyecto Grupal a Ultima Parte 2

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 160

0.05

0.1

0.15

0.2

0.25

P=0.5

Número de Personas con TD

P(X)

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 160

0.05

0.1

0.15

0.2

0.25

P=0.65

Número de Personas con TD

P(X)

Page 16: Proyecto Grupal a Ultima Parte 2

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 160

0.05

0.1

0.15

0.2

0.25

P=0.75

Número de Personas con TD

P(X)

Si. Ya que la curva de acuerdo a la probabilidad asignada para el evento, va asumiendo un comportamiento simétrico o asimétrico.

i. Indique en qué casos la gráfica da simétrica, es decir que el área observado a la derecha es idéntico al observado a la izquierda.

Según los resultados observados en la gráfica número 3 con probabilidad de 0.5 es simétrica, ya que el área es idéntica tanto a la derecha como a la izquierda.

3. Con base en sus anteriores respuestas, escriba otra variable aleatoria que sea Binomial dentro de la base de datos y expliqué el razonamiento que realizó para determinar que efectivamente es de tipo Binomial.

Nuestra variable de análisis: tiene tarjeta de debito (1=SI, 0=NO) tiene comportamiento Binomial por las razones expuestas y que sustentamos

Para la nueva variable de análisis: ha solicitado préstamo bancario (1=SI, 2=NO). Esta variable propuesta tiene comportamiento Binomial, porque;

1. En cada prueba del experimento solo se tienen dos posibles resultados; ÉXITO=SI, FRACASO=NO.

2. Permite realizar “n” ensayos Bernulli independientes. La probabilidad que una persona haya solicitado un préstamo bancario, es totalmente independiente que otra persona de la base de datos lo haya solicitado

3. La probabilidad de suceso: personas que han solicitado préstamo bancario, es constante a través de las pruebas y no varía de una prueba a otra.

Page 17: Proyecto Grupal a Ultima Parte 2

4. ¿Identifica usted dentro de las variables aleatorias alguna que sea de tipo Poisson? Si su respuesta es negativa, ¿puede usted establecer alguna variable aleatoria que relacione alguno de los diferentes contextos que trabaja la base de datos? Escriba alguna.

La distribución de Poisson describe la probabilidad como un acontecimiento fortuito ocurrido en un tiempo o intervalo de espacio bajo las condiciones que la probabilidad de un acontecimiento ocurre es muy pequeña, pero el número de intentos es muy grande, entonces el evento actual ocurre algunas veces.

Las variables tipo Poisson indican: Está formulada sobre éxitos y fracasos, pero en un tiempo determinado. La probabilidad de ocurrencia del fenómeno es constante en el tiempo o en

el espacio.

En nuestra base de datos podemos observar que la variable que se acoge a los términos definidos anteriormente es:

v2 = NUMERO DE TRANSACCIONES EN CAJERO AUTOMATICO AL MES.

5. Basados en el ejercicio 2 si el tamaño de muestra fuera grande por ejemplo de 100 o más datos en una muestra, ¿cree usted que la variable aleatoria Binomial número de encuestados con tarjeta débito podría tender a convertirse en una distribución normal?

Según la información proporcionada, las características de la distribución normal son: Las tres medidas son iguales (media, mediana y moda) y se ubican en el

pico de la curva. La distribución es simétrica con respecto a su promedio. La curva es asintótica con respecto al eje X.

Una de sus características más importantes de la distribución normal es que casi cualquier distribución de probabilidad, tanto discreta como continua se puede aproximar por una normal bajo ciertas condiciones por lo que asumimos que: entre mayor sea el número de la muestra (n) mayor será la posibilidad de convertirse en una distribución normal.

Page 18: Proyecto Grupal a Ultima Parte 2

A partir del gráfico anterior, podemos observar que podemos aproximar la probabilidad de que una variable Binomial tome un determinado valor mediante la f.d.p. de una distribución normal. Así, por ejemplo, podemos estimar P(X=7) (área en azul) por P(6,5 < X < 7,5) área comprendida entre la curva roja y ambos puntos). En el primer caso estamos considerando que la variable X es Binomial, mientras que en el segundo consideramos que dicha variable es normal (y por tanto hacemos uso de la aproximación por continuidad, puesto que para cualquier variable continua la probabilidad puntual es cero).