Desviación Estándar Muestral

7
Desviación Estándar Muestral. La varianza muestral está medida en el cuadrado de las unidades observadas al hacer las mediciones contenidas en la muestra. Para devolverse a una estadística que use las mismas unidades que las observaciones, es necesario calcular su raíz cuadrada. Lo anterior conduce a la definición de la estadística denominada 'desviación estándar muestral', que no es otra cosa que la raíz cuadrada de la varianza. Para una muestra de tamaño n, x 1 , ..., x n , se tiene que: El uso de esta estadística es recomendado en aquellos conjuntos de datos que ofrecen cierto grado de simetría respecto de su centro. En estos casos, habitualmente tiene sentido medir discrepancias de un valor con el centro de los datos usando múltiplos de la desviación estándar. A modo de ejemplo, se puede decir que un valor está bastante alejado del centro de los datos si su distancia de él supera dos desviaciones estándar. Apoyándose en la idea anterior, la desviación estándar puede ser usada para determinar valores que se encuentran 'cerca' del centro. Este uso va más allá de la simple descripción, en otros ámbitos de Estadística es usada para tomar decisiones respecto de la población de la que fue extraída la muestra.

description

Desviación Estándar Muestralapuntes

Transcript of Desviación Estándar Muestral

Desviación Estándar Muestral.

La varianza muestral está medida en el cuadrado de las unidades observadas al hacer las mediciones contenidas en la muestra. Para devolverse a una estadística que use las mismas unidades que las observaciones, es necesario calcular su raíz cuadrada.

Lo anterior conduce a la definición de la estadística denominada 'desviación estándar muestral', que no es otra cosa que la raíz cuadrada de la varianza.

Para una muestra de tamaño n, x1, ..., xn, se tiene que:

El uso de esta estadística es recomendado en aquellos conjuntos de datos que ofrecen cierto grado de simetría respecto de su centro. En estos casos, habitualmente tiene sentido medir discrepancias de un valor con el centro de los datos usando múltiplos de la desviación estándar.

A modo de ejemplo, se puede decir que un valor está bastante alejado del centro de los datos si su distancia de él supera dos desviaciones estándar.

Apoyándose en la idea anterior, la desviación estándar puede ser usada para determinar valores que se encuentran 'cerca' del centro. Este uso va más allá de la simple descripción, en otros ámbitos de Estadística es usada para tomar decisiones respecto de la población de la que fue extraída la muestra.

Teorema de ChebyshevTeorema de Chebyshev: Para un conjunto cualquiera de observaciones (muestra o población), la proporción mínima de los valores que se encuentran dentro de k desviaciones estándares desde la media es al menos 1 - 1/k2, donde k es una constante mayor que 1.o Regla empírica: Para una distribución de frecuencias simétrica de campana, aproximadamente 68% de las observaciones estará a más y menos una desviación estándar desde la media, aproximadamente 95% de tales observaciones se encontrará a más y menos dos desviaciones estándares de la misma; y prácticamente todas las observaciones (99,7%)se hallarán a más y menos tres desviaciones con respecto a la media.

Curva simétrica de campana que muestra las relaciones entre la desviación estándar y la media-3s -2s -1s X 1s 2s 3s70 80 90 100 110 120 13068%95%99,7%

Si una distribución es simétrica con forma de campana, prácticamente todas las observaciones se encuentran entre la media más o menos tres desviaciones estándares.

· Dispersión Relativa:Karl Pearson (1857-1936) desarrolló una medida relativa denominada coeficiente de variación(CV). Es una medida útil cuando:· Los datos están en unidades diferentes(como U$S y días de asistencia).· Los datos están en la mismas unidades, pero las medias muy distantes (ingresos de superiores e ingresos de empleados).o Coeficiente de variación: es la razón (cociente) de la desviación estándar a la media aritmética, expresada como un porcentaje:sCV = (100)X

Karl Pearson desarrolló tb una medida para evaluar el grado de orientación al sesgo, denominada coeficiente de asimetría (CA):3 ( media - mediana)CA =

Desviación Estándar· Otras medidas de dispersión:Un método es determinar la ubicación de los valores que dividen un conjunto de observaciones en partes iguales. Estas medidas son:

o Los cuartiles, que dividen un conjunto de observaciones en 4 partes iguales(conjuntos ordenados de menor a mayor). El primer cuartil (Q1) es el valor abajo del cual se encuentra el 25% de las observaciones, y, el tercer cuartil (Q3) es el valor por abajo del cual se encuentra el 75% de las observaciones. Q2 es la mediana.

o Los deciles dividen un conjunto de observaciones en 10 partes iguales.o Los centiles se utilizan para reportar resultados acerca de ciertas pruebas nacionales estandarizadas, empleado para calificar la admisión a programas.

· Cuartiles, Deciles y Centiles ( o Porcentiles):Para formalizar el procedimiento, sea Lp la ubicacióndel centil deseado.Ej: porcentil 33 L33 . El número de observaciones es n. Entonces se aplica: (n +1) /2Ubicación de un centil Lp = (n +1) P/100o Diagramas de caja: representación gráfica basada en cuartiles, que ayuda a ilustrar un conjunto de dato. Se necesitan 5 valores estadísticos: el valor mínimo; Q1 ; la mediana; Q3 ; y el valor máximo.

MedianaQ1 Q3

Valor mínimo Valor MáximoLa distancia entre los extremos de la caja se denomina amplitud cuartílica ( o intercuartílica). Dicho intervalo es la distancia entre el primero y el tercer cuartiles.Se indican dos asteriscos (**) . Uno indica n dato “impropio”. Un dato incongruente es un valor inconsciente con el resto de los datos. Es como aquel valor que más de 1,5 veces el valor de la amplitud intercuartílica, mayor que Q3 o bien, menor que Q1.

Dato incongruente = Q1 - 1,5 (Q3 - Q1)

Leyes de De MorganEn lógica, Leyes de De Morgan o Teorema de De Morgan están las reglas adentro lógica formal relacionar pares de dual operadores lógicos de una manera sistemática expresada en términos de negación. Se llama la relación así que inducido Dualidad de De Morgan.no (P y Q) = (no P) o (no Q)no (P o Q) = (no P) y (no Q)Los leyes de De Morgan se basan en los verdad-valores equivalentes de cada par de declaraciones.La ley se nombra después Augustus De Morgan (1806-1871)[1] quién introdujo una versión formal de los leyes a clásico lógica del propositional. La formulación de De Morgan fue influenciada por el algebraisation de la lógica emprendido cerca George Boole, que demanda de De un Morgan cementado más último al hallazgo. Aunque una observación similar fue hecha cerca Aristotle y era sabido a los logicians griegos y medievales[2], Dan De Morgan el crédito para indicar los leyes formalmente e incorporarlos adentro a la lengua de la lógica. Laws de De Morgan puede ser probado fácilmente, y puede incluso parecerse trivial.[3] No obstante, estos leyes son provechosos en la fabricación de inferencias válidas en pruebas y discusiones deductivas.

PROPIEDADES DE LA INTERSECCIÓN DE CONJUNTOS

А ∩ (B ∩ C) = (А ∩ B) ∩ C

2.- Popiedad Idempotente

А ∩ А = А

 

3.- Propiedad Conmutativa.

А ∩ B = B ∩ А

 

4.- Intersección con el Vacío

А ∩ Ø = Ø

PROPIEDADES DE LA UNIÓN DE CONJUNTOS

1.- Propiedad Asociativa

А U (B U C) = (А U B) U C

2.- Propiedad Idempotente

5.- PROPIEDAD DE ABSORCIÓN

Si  B С A U B entonces  А U B = B

PROPIEDADES COMBINADA

1.- Propiedad Distributiba

a) A U (B ∩ C) = (A U B) ∩ (A U C)

b) A ∩ (B U C) = (A ∩ B) U (A ∩ C)

 

2.- Propiedad Simplificativa

a)  A U B (B ∩ A) = A

b) A ∩ (B U A) = A