¿Nuestros resultados son suficientemente confiables para enunciar una conclusión?

Supongamos que seleccionamos al azar a dos alumnos de dos cursos diferentes que llamaremos D8 y C1…

D8 C1

… y comparamos su altura …

D8 C1… resulta que un alumno es

más alto que el otro

¿POR QUÉ?

RAZÓN 1: Existe una diferencia significativa entre los dos cursos, por lo tanto los alumnos de C1 son más

altos que los de D8D8

7mo. año

C1

11avo. año

RAZÓN 2: Por casualidad elegimos un alumno de baja estatura de D8 y uno alto de C1

D8 C1

TITCH

(9 años)

HAGRID

(9 años)

¿Cómo decidimos cuál de las razones es la más probable?

¡¡MIDAMOS MÁS ALUMNOS!!

Si existe una diferencia significativa entre los dos grupos…

D8 C1… la altura media o promedio de la altura

de ambos grupos será muy …

… DIFERENTE

Si no existe una diferencia significativa entre ambos grupos…

D8 C1… el promedio o altura media de

ambos grupos será muy…

… SIMILAR

Recuerda que los seres vivos generalmente muestran variaciones…

Es MUY POCO probable que las medias de ambos grupos resulten exactamente iguales

Muestra C1

Altura promedio = 162 cm

Muestra D8

Altura promedio = 168 cm

¿La diferencia entre las alturas medias de cada muestra es suficientemente grande como para

considerarla significativa?

Se puede analizar la distribución de las alturas, de los estudiantes muestreados, graficando histogramas

En este caso, los intervalos de las dos muestras tienen escasa superposición…

… por consiguiente la diferencia entre las medias de ambas muestras IS probablemente resulte significativa.

2

4

6

8

10

12

14

16

Fre

cuen

cia

140-149

150-159

160-169

170-179

180-189

Altura (cm)

Muestra C1

2

4

6

8

10

12

14

16

Fre

cuen

cia

140-149

150-159

160-169

170-179

180-189

Altura (cm)

Muestra D8

En este caso los intervalos de ambas muestras tienen una gran superposición, por consiguiente…

… puede ser que la diferencia entre ambas muestras NO SEA significativa.

La diferencia entre las medias puede deberse a un error del muestreo al azar

2

4

6

8

10

12

14

16

Fre

cuen

cia

140-149

150-159

160-169

170-179

180-189

Altura (cm)

Muestra C1

2

4

6

8

10

12

14

16

Fre

cuen

cia

140-149

150-159

160-169

170-179

180-189

Altura (cm)

Muestra D8

Parta decidir si existe una diferencia significativa entre dos muestras se deben comparar las alturas medias de ambas muestras…

… y la dispersión de las alturas dentro de cada muestra

En estadística se calcula el desvío standard de una muestra como una medida de la dispersión de los valores dentro de una muestra con respecto a la media. El 68% de los valores difieren de la media una vez el valor de la desviación típica o desvío standard. Si los datos presentan una distribución normal aproximadamente el 68% de todos los valores diferirán de la media ǂ1 desviación típica (s o σ)y un 95% de los valores diferirán 2 desviaciones típicas.

Sx =Σx2 -

(Σx)2 n

n - 1

Donde:Sx es el desvío standard de una muestraΣ significa la “sumatoria de”’x representa cada una de las mediciones

individuales dentro de una muestran es el número de individuos en una muestra

El desvío standard se calcula utilizando la formula:

Es mucho más fácil utilizar las funciones estadísticas con una calculadora científica!

Seleccione el statistics mode en la calculadora

MODE 2 (CASIO fx-85MS)

Borre la memoria estadística

SHIFT CLR 1 (Scl) =

Ej. Para los datos 25, 34, 13

Entre los datos

2 5 DT (M+ Button) 3 4 DT 1 3 DT

Calcule la media

AC SHIFT S-VAR (2 Button) 1 ( x ) = 24

Calcule el desvío standard

AC SHIFT S-VAR 3 =(xσn-1) 10.5357

Cálculo del t-test Student• Calculamos las medias de ambas

muestras y sus correspondientes desvíos standards.

• Ahora debemos poner a prueba una hipótesis para decidir si los valores de la medias muestrales son significativamente distintos o no

• Hipótesis nula = H0 = No hay diferencias significativas entre las medias poblacionales. Esto se abrevia simplemente como:

H0 = μ1 = μ2 o bien H0 = (μ1 - μ2) = 0

Nuestra hipótesis alternativa

Ha = μ1 ǂ μ2

• Tenemos las hipótesis planteadas ¿cómo las probamos?

• Utilizando un estadístico llamado t-Student.

• Como se trata de probabilidades nuestras hipótesis serán aceptadas o rechazadas de acuerdo con un nivel de confianza.

• Los investigadores suelen manejarse, en general con el 95% de nivel de confianza.

• Esto significa que existe una zona crítica de rechazo del 5%.

• Al valor crítico se lo denomina con la letra griega alfa α por lo tanto

α = 0.05

Formulas para el cálculo del t-test de Student

El t-test de Student compara los promedios y los desvíos standards (d.s) de dos muestras para determinar si existe una diferencia significativa entre ellas- Un d.s grande indica una dispersión grande respecto de la mediaLos supuestos bajo los que se aplican el t-test son:1-Las muestras son elegidas al azar y de modo independiente de poblaciones con distribución normal. Las fórmulas presentadas aquí son aplicables en muestras no menores a diez observaciones.2- Las varianza poblacionales deben ser iguales o similares.Bajo estos supuestos se utilizará la ecuación (1)Siendo:

la media de la muestra 1

el número de observaciones de la muestra 1 Ecuación (1)

la media de la muestra 2

varianza agrupado

el número de observaciones de la muestra 2

Hipótesis nula =H0 = μ1 – μ2 = Do Si se supone que no hay diferencias entre μ1 y μ2 entonces Do = 0

Hipótesis alternativa (Prueba a dos extremos) = Ha = μ1 ǂ μ2

x1

x2n1

n2

s2

2

)1()1(

21

2

22

2

112

nnsnsns

nns

Dxxt

21

2

021

11

Fórmulas de trabajo

• 3- Como regla práctica para las varianzas puede utilizarse el siguiente procedimiento:

• En caso de obtener un resultado mayor o igual a tres se aplicará la ecuación (2)

• Si el resultado es menor a 3 se aplicará la ecuación (1)

• S2 subíndices 1 y 2 representas las varianzas de las muestras 1 y 2 respectivamente

• Grados de libertad = n1 + n2 – 2 ec.(3)

32

2

menor

mayor

ss

ns

ns

Dxxt

2

2

2

1

2

1

021

)2.(Ec

En el ejemplo trabajado: se tomaron muestras al azar de los alumnos de C1 y D8

Las alturas registradas se muestran en la tabla siguiente:

Estudiantes en C1 Estudiantes in D8

Altura de los

estudiantes(cm)

145 149 152 153 154 148 153 157 161 162

154 158 160 166 166 162 163 167 172 172

166 167 175 177 182 175 177 183 185 187

Paso 1: Calcule la altura media de cada muestra

161.60C1: x1 = 168.27D8: x2 =

Paso 2: Calcule la diferencia entre las medias

6.67x2 – x1 = 168.27 – 161.60 =

Paso 3: Calcule el desvío standard de cada muestra

C1: s1 = 10.86 D8: s2 = 11.74

Paso 4: Calcule si

No olvide que los datos obtenidos por la calculadora representan el desvío Standard y las formulas de trabajo utilizan la VARIANZA por lo tanto debe hacer el cuadrado de s

s1 = (10.86)2 = 117.94 y s2 = (11.74)2 = 137.83137.83 / 117.94 = 1.2 < 3

utilizo la ecuación (1)

Paso 5Calcule

s 2 = 127.89

32

2

menor

mayor

ss

2

)1()1(

21

2

22

2

112

nnsnsns

nns

Dxxt

21

2

021

11

nns 21

2 11

Calculo:1)

• 4.13

2)

t = 1.60

3) Comparo el valor de t contra el valor de t obtenido de la tabla 4-

4) La tabla 4 es una tabla de doble entrada por un lado están los grados de libertad (df) y por el otro los valores críticos es decir tα, nosotros decidimos utilizar un α = 0.05, pero vamos a a realizar una prueba a dos extremos por lo tanto debemos dividir α/2 = 0.025. Esto significa que la hipótesis nula será rechazada si:

t > t α/2 o t <- t α/2

5) Los grados de libertad de acuerdo con la ec. (3) son 28.

6) El valor crítico obtenido de tabla con 28 grados de libertad y un nivel de significancia de 2.5% es 2.048.

7)Comparo los valorest > t α/2 o t < - t α/2

1.60 es < 2.048 y1.60 es > -2.048

Esto significa que no puedo rechazar la hipótesis nula por lo tanto:

No existen diferencias significativas entre la altura de los estudiantes de las muestras tomadas en C1 y D8

nns

Dxxt

21

2

021

11

Intervalos de confianza

Otra alternativa utilizada muy comúnmente es el cálculo de intervalos de confianza. Tal como observará las formulas son muy similares

Utilizará la ecuación 4 cuando las varianzas sean similares o iguales

Ec. (4)

O la ecuación 5 cuando las varianzas sean distintas

Ec. (5)

nnstxx21

2

2/21

11

ns

nstxx

2

2

1

12/21

Buscando un intervalo de confianza para nuestro ejemplo

1- Utilizaremos la ec.(4)

6.67 ǂ2.048 x 4.13 = 6.67 + 8.45 = 15.12 6.67 – 8.45 = -1.78

2- ¿Cómo comparo este intervalo de confianza?

Dado que nuestra hipótesis nula fue que la diferencia entre las medias era igual a cero, entonces debo verificar si en el intervalo:

-1.78 – 15.12se encuentra el cero.3- Dado que efectivamente el cero está comprendido en

este intervalo entonces no existen diferencias significativas entre las medias, es decir NO RECHAZO LA HIPÓTESIS NULA

nnstxx21

2

2/21

11

¿Nuestros resultados son suficientemente confiables para enunciar una conclusión?

Documents

Transcript of ¿Nuestros resultados son suficientemente confiables para enunciar una conclusión?