Capítulo 1. Conceptos básicos de la Estadística

16
1 Capítulo 1. Conceptos básicos de la Estadística 1.1 El análisis estadístico El análisis estadístico de datos engloba un conjunto de procedimientos diseñados para: 1. Seleccionar datos 2. describirlos y 3. extraer conclusiones de ellos. Estadística: Ciencia que recoge, ordena y analiza los datos de una muestra población, para hacer inferencias acerca de esa población valiéndose del c criptiva. Organizar y resumir la información contenida en un conjunto (muest erencial. Generalizar (inferir) las propiedades de un conjunto de datos empí al de datos (población) a los que representa. Para poder efectuar esta genera que el conjunto de datos utilizados para obtener información sea representat de datos sobre el que se desea realizar la inferencia, es decir, es necesario ión de los datos (Técnicas de muestreo).

description

Capítulo 1. Conceptos básicos de la Estadística. 1.1 El análisis estadístico. El análisis estadístico de datos engloba un conjunto de procedimientos diseñados para: Seleccionar datos describirlos y extraer conclusiones de ellos. - PowerPoint PPT Presentation

Transcript of Capítulo 1. Conceptos básicos de la Estadística

Page 1: Capítulo 1. Conceptos básicos de la Estadística

1

Capítulo 1. Conceptos básicos de la Estadística

1.1 El análisis estadístico

El análisis estadístico de datos engloba un conjunto de procedimientos diseñados para:1. Seleccionar datos2. describirlos y3. extraer conclusiones de ellos.

Estadística: Ciencia que recoge, ordena y analiza los datos de una muestra extraida de una determinada población, para hacer inferencias acerca de esa población valiéndose del cálculo de probabilidades

•Estadística descriptiva. Organizar y resumir la información contenida en un conjunto (muestra) de datos.

•Estadística inferencial. Generalizar (inferir) las propiedades de un conjunto de datos empíricos (muestra) al conjunto total de datos (población) a los que representa. Para poder efectuar esta generalización es imprescindible que el conjunto de datos utilizados para obtener información sea representativo del conjunto total de datos sobre el que se desea realizar la inferencia, es decir, es necesario efectuar una correcta selección de los datos (Técnicas de muestreo).

Page 2: Capítulo 1. Conceptos básicos de la Estadística

2

Capítulo 1. Conceptos básicos de la Estadística

1.2 Conceptos básicos Población. Conjunto de elementos que poseen una o más características en común. Dependiendo del número de elementos de que constan, las poblaciones son finitas o infinitas.Muestra. Subconjunto de elementos de una población. El objetivo de la inferencia estadística es extraer conclusiones referidas a todos los elementos de la población a partir de la observación de sólo unos pocos elementos de esa población. Para que esto sea posible es necesario que la muestra sea representativa de la población, esto se consigue mediante las técnicas de muestreo.Parámetro. Valor numérico que describe una característica de una población. Los parámetros son, en general, valores poblacionales desconocidos. Los parámetros son valores numéricos constantes, es decir, NO son variables.Estadístico. Valor numérico que describe una característica de la muestra. NO es un valor numérico constante, sino que es una variable: su valor concreto depende de la muestra en la que es calculado. Muestreo. Proceso seguido para extraer una muestra de una población. Es necesario utilizar muestras representativas del total de la población, es decir, muestras en las que exista alguna garantía de que cualquier elemento de la población ha podido estar representado en ellas. El muestreo puede ser de dos tipos: - Muestreo probabilístico. En este muestreo se conoce (o puede calcularse) la probabilidad asociada a cada una de las muestras que es posible extraer de una determinada población - Muestreo no probabilístico. En él se desconoce o no se tiene en cuenta la probabilidad asociada a cada

una de las muestras posibles; el investigador selecciona aquella muestra que, en su opinión, es más representativa.

Solo el muestreo probabilístico permite obtener una idea sobre el grado de representatividad de una muestra. Distribución muestral. El concepto de distribución muestral se refiere al comportamiento de un estadístico. Los estadísticos son variables aleatorias. Como tales, tienen su propia función de probabilidad. Una distribución muestral puede quedar caracterizada haciendo explícita su forma o su valor esperado y su varianza.

Page 3: Capítulo 1. Conceptos básicos de la Estadística

3

Capítulo 1. Conceptos básicos de la Estadística

1.3 Distribuciones de probabilidad más usuales DISTRIBUCIÓN NORMAL.

2

22

Una v.a. X se dice que sigue una distribucion Normal de media y desviacion tipica (X N( , )) si

su funcion de densidad es

1 1 ( ) exp ,

22

xf x x

Caso tabulado: N(0,1) Tipificación: Si ( , ) (0,1)X

X N Z N

DISTRIBUCIÓN CHI-CUADRADO 2 2 2

1 n 1 nSean X ,...,X v.a. independientes e identicamente distribuidas segun N(0,1) Y=X + +X

DISTRIBUCIÓN T-STUDENT 2n

ZSean Z (0,1), Y , Z e Y v.a. independientes T=

Yn

nN t

DISTRIBUCIÓN F-SNEDECOR 2 2

m ,

/Sean X , Y , X e Y v.a. independientes F=

/n n m

X nF

Y m

Page 4: Capítulo 1. Conceptos básicos de la Estadística

4

Capítulo 1. Conceptos básicos de la Estadística

1.4 La inferencia estadística

Consiste en utilizar la información muestral para inferir alguna propiedad de la población. Es decir, utilizar un estadístico que recibe el nombre de estimador para inferir el valor de algún parámetro. A esta estimación directa se le llama estimación puntual.Si al valor muestral o estimador puntual se le suma y resta una cantidad para estimar no un valor concreto, sino un rango de valores, se habla de estimación por intervalos. La cantidad que se suma y se resta se llama error máximo y depende de la distribución muestral del estadístico. El error máximo se calcula intentando que el intervalo construido incluya el valor del parámetro con una probabilidad alta y conocida. Esta probabilidad recibe el nombre de nivel de confianza y suele establecerse en 0.95. El intervalo de valores se le llama intervalo de confianza y viene definido por dos valores: el límite inferior y el límite superior.

1.4.1 La estimación de parámetros

1.4.2 Contrastes de hipótesisEs un método de toma decisiones. Es un procedimiento que permite decidir si una proposición acerca de una población puede ser mantenida o debe ser rechazada. Pasos:

1. Formular estadísticamente la hipótesis científica que se desea contrastar. 2. Buscar evidencia empírica relevante capaz de informar sobre si la hipótesis establecida es o no

sostenible.3. Establecer una regla de decisión. Esta regla es de este tipo: si el resultado muestral observado es,

suponiendo correcta la hipótesis, muy poco probable, se considerará que la hipótesis es incompatible con los datos; por el contrario, si el resultado muestral observado es, suponiendo correcta la hipótesis, probable, se considerará que la hipótesis es compatible con los datos.

Page 5: Capítulo 1. Conceptos básicos de la Estadística

5

Capítulo 1. Conceptos básicos de la Estadística

1.4 La inferencia estadística

1.4.2 Contrastes de hipótesis

Hipótesis estadísticas. Una afirmación sobre la forma de una o más distribuciones de probabilidad o sobre el valor de uno o más parámetros de esas distribuciones. Un contraste de hipótesis se basa en la formulación de dos hipótesis:

1. Hipótesis nula. Es la que se somete a contraste.2. Hipótesis alternativa. Es la negación de la hipótesis nula. Incluye todo lo que excluye la hip. nula.Suelen plantearse como hipótesis rivales. Son exhaustivas y mutuamente excluyentes.El signo = siempre va en la hipótesis nula ya que es desde donde se inicia el proceso de contrastación.Si en la hip. alternativa aparece el signo distinto estamos ante un contraste bilateral. En otro caso será uncontraste unilateral.

Supuestos. Una hipótesis que especifica por completo la distribución poblacional se le llama simple. En otrocaso se denomina compuesta. Los supuestos son un conjunto de afirmaciones que hay que establecer sobre la población de partida y sobre la muestra utilizada para conseguir determinar la distribución de probabilidad en la que se basará la decisión sobre la hipótesis nula.

Estadístico de contraste. Es un resultado muestral que 1. proporciona información empírica relevante sobre la afirmación propuesta en la hipótesis nula.2. posee una distribución muestral conocida.

Page 6: Capítulo 1. Conceptos básicos de la Estadística

6

Capítulo 1. Conceptos básicos de la Estadística

1.4 La inferencia estadística

1.4.2 Contrastes de hipótesis Regla de decisión. Criterio que se utiliza para decidir si la hipótesis nula planteada debe o no ser rechazada. Se basa en la partición de la distribución muestral del estadístico de contraste en dos zonas exclusivas y exhaustivas:

1.Zona de rechazo. Área de la distribución muestral que corresponde a los valores del estadístico de contraste que se encuentran tan alejados de la afirmación de la hipótesis nula, que es muy poco probable que ocurran si la hipótesis nula es verdadera. Su probabilidad se denomina nivel de significación.

2.Zona de aceptación. Área de la distribución muestral que corresponde a los valores del estadístico

próximos a la afirmación establecida en la hipótesis nula.Los valores que separan ambas regiones se denominan valores críticos. La regla de decisión consiste en rechazar la hipótesis nulas si el estadístico de contraste toma un valor perteneciente a la región de rechazo ymantenerla si el estadístico toma un valor perteneciente a la zona de aceptación. El tamaño de las zonas de rechazo y de aceptación se determina fijando el nivel de significación (1%, 5%)La forma de dividir la distribución muestral en zona de rechazo y zona de aceptación depende de que el contraste sea bilateral o unilateral.

La decisión. Consiste en rechazar o mantener la hipótesis nula particular. Si se rechaza se está afirmando que esa hipótesis es falsa. Por el contrario, si se mantiene, no se está afirmando que ha quedado probado que esa hipótesis es verdad, simplemente se está afirmando que no se dispone de evidencia empírica suficiente para rechazarla y que, por tanto, puede considerarse compatible con los datos.

Page 7: Capítulo 1. Conceptos básicos de la Estadística

7

Capítulo 1. Conceptos básicos de la Estadística

1.5 Intervalos de confianza en poblaciones normales

Media poblacional:

Diferencias de medias poblacionales: Muestras pequeñas (< o = 30):

Diferencias de medias pobl.: Muestras grandes

1

21;1 n

StXPn

22yx 2 2

2;12

1 1 1 11

2x y

x yn m

n S m SP X Y t

n m n m

22yx

2

22 2 2

2 2 2;12

2 2

1

1 , ,1

1 1

yx x xx y

vy y

SS Sn mP X Y t v

n m Sn n m m

1

22

21

y

y

x

xyx n

S

n

SzYXP

Page 8: Capítulo 1. Conceptos básicos de la Estadística

8

Capítulo 1. Conceptos básicos de la Estadística

1.5 Intervalos de confianza en poblaciones normales

Varianza poblacional:

Cociente de varianzas pob.:

Proporción poblacional:

Diferencia de proporciones poblacionales

2 2 2

2 2 21, 1;12

1, 1;12

1, 1y y y

n mx x x

m n

S SP f

f S S

1

)ˆ1(ˆˆ

21 n

ppzppP

1

2

ˆ ˆ(1 )ˆ ˆ(1 )ˆ ˆ 1y yx x

x y x y

p pp pP p p p p z

n m

11

,1

2

2;1

2

2

21;1

22

nn

SnSnP

Page 9: Capítulo 1. Conceptos básicos de la Estadística

9

Sobre la media poblacional

Capítulo 1. Conceptos básicos de la Estadística

1.6 Contrastes de hipótesis en poblaciones normales

Hipótesis Nula Valor del Estadístico bajo Hip. Nula

Hipótesis Alternativa Región Crítica

00 : Hn

SX

t 0exp

1;1exp001

1;1exp001

21;1

exp

21;1

exp

001

tsi Rechazar :H

tsi Rechazar :H

si Rechazar :H

n

n

n

n

tH

tH

tt

ó

tt

H

Page 10: Capítulo 1. Conceptos básicos de la Estadística

10

Sobre la diferencia de medias poblacionales. Varianzas Poblacionales desconocidas pero iguales. Muestras Pequeñas

Hipótesis Nula Valor del Estadístico bajo Hip. Nula

Hipótesis Alternativa Región Crítica

00 : yxH

0exp 2 21 1 1 1

2x y

X Yt

n S m S

n m n m

exp2;1

2

1 0 0

exp2;1

2

1 0 0 exp 2;1

1

H : Rechazar si

H : Rechazar si t

H :

n m

x y

n m

x y n m

t t

H ó

t t

H t

0 0 exp 2;1 Rechazar si tx y n mH t

Capítulo 1. Conceptos básicos de la Estadística

1.6 Contrastes de hipótesis en poblaciones normales

Page 11: Capítulo 1. Conceptos básicos de la Estadística

11

Hipótesis Nula Valor del Estadístico bajo Hip. Nula

Hipótesis Alternativa Región Crítica

00 : yxH 0exp 22

yx

X Yt

SSn m

1;exp001

1;exp001

21;

exp

21;

exp

001

tsi Rechazar :H

tsi Rechazar :H

si Rechazar :H

vyx

vyx

v

v

yx

tH

tH

tt

ó

tt

H

2

2 2

2 2 2

2 2 2 2

1

;1

1 1

x x

y y

Sn mv

S

n n m m

Sobre la diferencia de medias poblacionales. Varianzas Poblacionales desconocidas y diferentes. Muestras Pequeñas

Capítulo 1. Conceptos básicos de la Estadística

1.6 Contrastes de hipótesis en poblaciones normales

Page 12: Capítulo 1. Conceptos básicos de la Estadística

12

Hipótesis Nula Valor del Estadístico bajo Hip. Nula

Hipótesis Alternativa Región Crítica

00 : yxH 0exp 22

yx

X Yz

SSn m

1exp001

1exp001

21

exp

21

exp

001

si Rechazar :H

si Rechazar :H

si Rechazar :H

zzH

zzH

zz

ó

zz

H

yx

yx

yx

Sobre la diferencia de medias poblacionales. Varianzas Poblacionales desconocidas. Muestras grandes

Capítulo 1. Conceptos básicos de la Estadística

1.6 Contrastes de hipótesis en poblaciones normales

Page 13: Capítulo 1. Conceptos básicos de la Estadística

13

Hipótesis Nula Valor del Estadístico bajo Hip. Nula

Hipótesis Alternativa Región Crítica

20

20 : H

20

2

exp

1

Sn

2;1exp0

20

21

21;1exp0

20

21

2

21;1

exp

2

2;1

exp

020

21

si Rechazar :H

si Rechazar :H

si Rechazar :H

n

n

n

n

H

H

óH

Sobre la varianza poblacional

Capítulo 1. Conceptos básicos de la Estadística

1.6 Contrastes de hipótesis en poblaciones normales

Page 14: Capítulo 1. Conceptos básicos de la Estadística

14

Hipótesis Nula Valor del Estadístico bajo Hip. Nula

Hipótesis Alternativa Región Crítica

220 : yxH 2

2

expy

x

S

Sf

exp

1, 1;122 2

1 0

exp1, 1;1

2

2 21 0

1

H : Rechazar si

H : Rechazar si

m n

x y

n m

x y

ff

f f

H

exp 1, 1;1

2 21 0 exp

1, 1;1

f

1H : Rechazar si f

n m

x ym n

f

Hf

Sobre igualdad de varianzas poblacionales

Capítulo 1. Conceptos básicos de la Estadística

1.6 Contrastes de hipótesis en poblaciones normales

Page 15: Capítulo 1. Conceptos básicos de la Estadística

15

Hipótesis Nula Valor del Estadístico bajo Hip. Nula

Hipótesis Alternativa Región Crítica

00 : ppH npp

ppz

00

0exp

1

ˆ

1exp001

1exp001

21

exp

21

exp

001

si Rechazar p:H

si Rechazar p:H

si Rechazar p:H

zzHp

zzHp

zz

ó

zz

Hp

Sobre una proporción poblacional

Capítulo 1. Conceptos básicos de la Estadística

1.6 Contrastes de hipótesis en poblaciones normales

Page 16: Capítulo 1. Conceptos básicos de la Estadística

16

Hipótesis Nula Valor del Estadístico bajo Hip. Nula

Hipótesis Alternativa Región Crítica

yx ppH :0exp

ˆ ˆ

ˆ ˆ ˆ ˆ1

x y

x y x y

p pz

np mp np mpn mnm n m n m

1exp0yx1

1exp0yx1

21

exp

21

exp

0yx1

si Rechazar p:H

si Rechazar p:H

si Rechazar p:H

zzHp

zzHp

zz

ó

zz

Hp

Sobre igualdad de proporciones poblacionales

Capítulo 1. Conceptos básicos de la Estadística

1.6 Contrastes de hipótesis en poblaciones normales