¿Nuestros resultados son suficientemente confiables para enunciar una conclusión?
-
Upload
manuelita-batista -
Category
Documents
-
view
7 -
download
0
Transcript of ¿Nuestros resultados son suficientemente confiables para enunciar una conclusión?
¿Nuestros resultados son suficientemente confiables para enunciar una conclusión?
Supongamos que seleccionamos al azar a dos alumnos de dos cursos diferentes que llamaremos D8 y C1…
D8 C1
… y comparamos su altura …
D8 C1… resulta que un alumno es
más alto que el otro
¿POR QUÉ?
RAZÓN 1: Existe una diferencia significativa entre los dos cursos, por lo tanto los alumnos de C1 son más
altos que los de D8D8
7mo. año
C1
11avo. año
RAZÓN 2: Por casualidad elegimos un alumno de baja estatura de D8 y uno alto de C1
D8 C1
TITCH
(9 años)
HAGRID
(9 años)
¿Cómo decidimos cuál de las razones es la más probable?
¡¡MIDAMOS MÁS ALUMNOS!!
Si existe una diferencia significativa entre los dos grupos…
D8 C1… la altura media o promedio de la altura
de ambos grupos será muy …
… DIFERENTE
Si no existe una diferencia significativa entre ambos grupos…
D8 C1… el promedio o altura media de
ambos grupos será muy…
… SIMILAR
Recuerda que los seres vivos generalmente muestran variaciones…
Es MUY POCO probable que las medias de ambos grupos resulten exactamente iguales
Muestra C1
Altura promedio = 162 cm
Muestra D8
Altura promedio = 168 cm
¿La diferencia entre las alturas medias de cada muestra es suficientemente grande como para
considerarla significativa?
Se puede analizar la distribución de las alturas, de los estudiantes muestreados, graficando histogramas
En este caso, los intervalos de las dos muestras tienen escasa superposición…
… por consiguiente la diferencia entre las medias de ambas muestras IS probablemente resulte significativa.
2
4
6
8
10
12
14
16
Fre
cuen
cia
140-149
150-159
160-169
170-179
180-189
Altura (cm)
Muestra C1
2
4
6
8
10
12
14
16
Fre
cuen
cia
140-149
150-159
160-169
170-179
180-189
Altura (cm)
Muestra D8
En este caso los intervalos de ambas muestras tienen una gran superposición, por consiguiente…
… puede ser que la diferencia entre ambas muestras NO SEA significativa.
La diferencia entre las medias puede deberse a un error del muestreo al azar
2
4
6
8
10
12
14
16
Fre
cuen
cia
140-149
150-159
160-169
170-179
180-189
Altura (cm)
Muestra C1
2
4
6
8
10
12
14
16
Fre
cuen
cia
140-149
150-159
160-169
170-179
180-189
Altura (cm)
Muestra D8
Parta decidir si existe una diferencia significativa entre dos muestras se deben comparar las alturas medias de ambas muestras…
… y la dispersión de las alturas dentro de cada muestra
En estadística se calcula el desvío standard de una muestra como una medida de la dispersión de los valores dentro de una muestra con respecto a la media. El 68% de los valores difieren de la media una vez el valor de la desviación típica o desvío standard. Si los datos presentan una distribución normal aproximadamente el 68% de todos los valores diferirán de la media ǂ1 desviación típica (s o σ)y un 95% de los valores diferirán 2 desviaciones típicas.
Sx =Σx2 -
(Σx)2 n
n - 1
Donde:Sx es el desvío standard de una muestraΣ significa la “sumatoria de”’x representa cada una de las mediciones
individuales dentro de una muestran es el número de individuos en una muestra
El desvío standard se calcula utilizando la formula:
Es mucho más fácil utilizar las funciones estadísticas con una calculadora científica!
Seleccione el statistics mode en la calculadora
MODE 2 (CASIO fx-85MS)
Borre la memoria estadística
SHIFT CLR 1 (Scl) =
Ej. Para los datos 25, 34, 13
Entre los datos
2 5 DT (M+ Button) 3 4 DT 1 3 DT
Calcule la media
AC SHIFT S-VAR (2 Button) 1 ( x ) = 24
Calcule el desvío standard
AC SHIFT S-VAR 3 =(xσn-1) 10.5357
Cálculo del t-test Student• Calculamos las medias de ambas
muestras y sus correspondientes desvíos standards.
• Ahora debemos poner a prueba una hipótesis para decidir si los valores de la medias muestrales son significativamente distintos o no
• Hipótesis nula = H0 = No hay diferencias significativas entre las medias poblacionales. Esto se abrevia simplemente como:
H0 = μ1 = μ2 o bien H0 = (μ1 - μ2) = 0
Nuestra hipótesis alternativa
Ha = μ1 ǂ μ2
• Tenemos las hipótesis planteadas ¿cómo las probamos?
• Utilizando un estadístico llamado t-Student.
• Como se trata de probabilidades nuestras hipótesis serán aceptadas o rechazadas de acuerdo con un nivel de confianza.
• Los investigadores suelen manejarse, en general con el 95% de nivel de confianza.
• Esto significa que existe una zona crítica de rechazo del 5%.
• Al valor crítico se lo denomina con la letra griega alfa α por lo tanto
α = 0.05
Formulas para el cálculo del t-test de Student
El t-test de Student compara los promedios y los desvíos standards (d.s) de dos muestras para determinar si existe una diferencia significativa entre ellas- Un d.s grande indica una dispersión grande respecto de la mediaLos supuestos bajo los que se aplican el t-test son:1-Las muestras son elegidas al azar y de modo independiente de poblaciones con distribución normal. Las fórmulas presentadas aquí son aplicables en muestras no menores a diez observaciones.2- Las varianza poblacionales deben ser iguales o similares.Bajo estos supuestos se utilizará la ecuación (1)Siendo:
la media de la muestra 1
el número de observaciones de la muestra 1 Ecuación (1)
la media de la muestra 2
varianza agrupado
el número de observaciones de la muestra 2
Hipótesis nula =H0 = μ1 – μ2 = Do Si se supone que no hay diferencias entre μ1 y μ2 entonces Do = 0
Hipótesis alternativa (Prueba a dos extremos) = Ha = μ1 ǂ μ2
x1
x2n1
n2
s2
2
)1()1(
21
2
22
2
112
nnsnsns
nns
Dxxt
21
2
021
11
Fórmulas de trabajo
• 3- Como regla práctica para las varianzas puede utilizarse el siguiente procedimiento:
• En caso de obtener un resultado mayor o igual a tres se aplicará la ecuación (2)
• Si el resultado es menor a 3 se aplicará la ecuación (1)
• S2 subíndices 1 y 2 representas las varianzas de las muestras 1 y 2 respectivamente
• Grados de libertad = n1 + n2 – 2 ec.(3)
32
2
menor
mayor
ss
ns
ns
Dxxt
2
2
2
1
2
1
021
)2.(Ec
En el ejemplo trabajado: se tomaron muestras al azar de los alumnos de C1 y D8
Las alturas registradas se muestran en la tabla siguiente:
Estudiantes en C1 Estudiantes in D8
Altura de los
estudiantes(cm)
145 149 152 153 154 148 153 157 161 162
154 158 160 166 166 162 163 167 172 172
166 167 175 177 182 175 177 183 185 187
Paso 1: Calcule la altura media de cada muestra
161.60C1: x1 = 168.27D8: x2 =
Paso 2: Calcule la diferencia entre las medias
6.67x2 – x1 = 168.27 – 161.60 =
Paso 3: Calcule el desvío standard de cada muestra
C1: s1 = 10.86 D8: s2 = 11.74
Paso 4: Calcule si
No olvide que los datos obtenidos por la calculadora representan el desvío Standard y las formulas de trabajo utilizan la VARIANZA por lo tanto debe hacer el cuadrado de s
s1 = (10.86)2 = 117.94 y s2 = (11.74)2 = 137.83137.83 / 117.94 = 1.2 < 3
utilizo la ecuación (1)
Paso 5Calcule
s 2 = 127.89
32
2
menor
mayor
ss
2
)1()1(
21
2
22
2
112
nnsnsns
nns
Dxxt
21
2
021
11
nns 21
2 11
Calculo:1)
• 4.13
2)
t = 1.60
3) Comparo el valor de t contra el valor de t obtenido de la tabla 4-
4) La tabla 4 es una tabla de doble entrada por un lado están los grados de libertad (df) y por el otro los valores críticos es decir tα, nosotros decidimos utilizar un α = 0.05, pero vamos a a realizar una prueba a dos extremos por lo tanto debemos dividir α/2 = 0.025. Esto significa que la hipótesis nula será rechazada si:
t > t α/2 o t <- t α/2
5) Los grados de libertad de acuerdo con la ec. (3) son 28.
6) El valor crítico obtenido de tabla con 28 grados de libertad y un nivel de significancia de 2.5% es 2.048.
7)Comparo los valorest > t α/2 o t < - t α/2
1.60 es < 2.048 y1.60 es > -2.048
Esto significa que no puedo rechazar la hipótesis nula por lo tanto:
No existen diferencias significativas entre la altura de los estudiantes de las muestras tomadas en C1 y D8
nns
Dxxt
21
2
021
11
Intervalos de confianza
Otra alternativa utilizada muy comúnmente es el cálculo de intervalos de confianza. Tal como observará las formulas son muy similares
Utilizará la ecuación 4 cuando las varianzas sean similares o iguales
Ec. (4)
O la ecuación 5 cuando las varianzas sean distintas
Ec. (5)
nnstxx21
2
2/21
11
ns
nstxx
2
2
1
12/21
Buscando un intervalo de confianza para nuestro ejemplo
1- Utilizaremos la ec.(4)
6.67 ǂ2.048 x 4.13 = 6.67 + 8.45 = 15.12 6.67 – 8.45 = -1.78
2- ¿Cómo comparo este intervalo de confianza?
Dado que nuestra hipótesis nula fue que la diferencia entre las medias era igual a cero, entonces debo verificar si en el intervalo:
-1.78 – 15.12se encuentra el cero.3- Dado que efectivamente el cero está comprendido en
este intervalo entonces no existen diferencias significativas entre las medias, es decir NO RECHAZO LA HIPÓTESIS NULA
nnstxx21
2
2/21
11