Muest Ra

30
ESTADISTICA Muestra Es el conjunto de observaciones (datos) que se obtienen de alguna fuente de observación (población). Estadísticas de la muestra Son magnitudes que se calculan para caracterizar a un conjunto de observaciones o datos llamada muestra aleatoria extraída de una población. Usualmente a la estadística de la muestra se denomina como estadístico o estadística. A los estadísticos se acostumbra representar mediante el

description

Muestra

Transcript of Muest Ra

ESTADISTICA

MuestraEs el conjunto de observaciones (datos) que se obtienen de alguna fuente de observación (población). Estadísticas de la muestraSon magnitudes que se calculan para caracterizar a un conjunto de observaciones o datos llamada muestra aleatoria extraída de una población. Usualmente a la estadística de la muestra se denomina como estadístico o estadística. A los estadísticos se acostumbra representar mediante el alfabeto Latino como por ejemplo el promedio se representa por:

ESTADISTICA

Población

Es la fuente de observación o de los datos.Parámetros de una poblaciónSon magnitudes que caracterizan a la población y cuyo valor no se puede calcular con exactitud, sólo se pueden estimar a través de los estadísticos. Los parámetros dependen básicamente del tipo de distribución de la variable aleatoria que representa a la población, por ejemplo la población de las precipitaciones medias anuales puede ser explicada mediante la distribución normal, cuyos parámetros son la media y la varianza. A los parámetros se acostumbra representar mediante el alfabeto Griego como por ejemplo la media poblacional se representa por .

Métodos estadísticosSon los métodos que permiten obtener conclusiones acerca de la población a partir de la muestra, o por medio de muestras; la palabra estadística se usa comúnmente en vez de usar métodos estadísticos.Los métodos estadísticos o la estadística está basado en principios matemáticos que describen el comportamiento de un conjunto de observaciones (muestra) donde se centra la atención en los datos mismos sin considerar las causas que influyeron en el suceso, es decir la estadística es una ciencia de descripción de los resultados y no de causalidad.

Métodos estadísticos

Por las consideraciones indicadas a la estadística se define como una técnica que proporciona un conjunto de métodos que permiten recopilar, clasificar y presentar los datos en forma adecuada, a esta parte de la estadística se le denomina como la estadística descriptiva. La otra parte de la estadística que permite tomar decisiones relacionadas a la población a partir de la muestra es la estadística inferencial (estimación de parámetros y prueba de hipótesis).

RECOPILACION

La recopilación de la información en la hidrología se realiza tomando muestras (datos), dado que no es posible recopilar todos los datos de la población referente a una variable hidrometeorológica. Como se trata de una muestra y se considera que la recopilación de los datos se efectúa al azar, se dice que el muestreo es aleatorio y por consiguiente a la muestra se denomina muestra aleatoria.

REGISTROS DE DESCARGAS DEL RIO QUEROCOCHA –ESTACION QUEROCOCHA

DESCARGAS MÁXIMAS INSTANTÁNEAS ANUALES DEL RIO QUEROCOHA

AÑO Q AÑO Q AÑO Q1953-1954 6.94 1963-1964 5.88 1973-1974 7.481954-1955 7.95 1964-1965 9.10 1974-1975 10.721955-1956 6.50 1965-1966 6.52 1975-1976 10.211956-1957 6.77 1966-1967 9.80 1976-1977 8.971957-1958 6.39 1967-1968 4.93 1977-1978 8.131958-1959 6.26 1968-1969 3.98 1978-1979 8.961959-1960 8.90 1969-1970 6.87 1979-1980 4.891960-1961 8.00 1970-1971 6.70 1980-1981 9.401961-1962 9.40 1971-1972 8.90 1981-1982 10.781962-1963 7.56 1972-1973 5.80

CLASIFICACION

Para facilitar la interpretación y la evaluación correspondiente, estos datos deben ser clasificados o categorizados o distribuidos en clases, es decir los datos deben ser organizados en clases o grupos. La clasificación se logra ordenando los datos según su magnitud en forma ascendente o descendente y luego se agrupan en clases. Al clasificar los datos, se determina el número de datos en cada clase, dado que cada una de estas clases tienen sus límites (valores) superior e inferior definidos.

Procedimiento para obtener las distribuciones de frecuencias

1. Ordenar los datos en forma descendente2. Calcular el rango o la amplitud de la muestra 3. Calcular el número de intervalos de clase4. Calcular la amplitud de cada intervalo de clase5. Calcular los límites de clase de cada intervalo de clase.6. Calcular las marcas de clase7. Calcular la frecuencia absoluta8. Calcular la frecuencia relativa de cada intervalo de

clase9. Calcular la función densidad empírica

Presentación de datos

Después de la clasificación de datos, es necesario presentar los resultados en forma de tablas y en forma de gráficos, con la finalidad de facilitar su interpretación y su posterior análisis.1. Presentación tabular o distribuciones de frecuenciaLa presentación tabular o las distribuciones de frecuencia o tabla de distribuciones de frecuencia es una tabla que divide los datos de la muestra en cierto número de clases, donde se muestra el número de datos en cada clase, a este número de datos en cada clase se le conoce con el nombre de frecuencia de clase o simplemente frecuencia

FORMATO DE LA TABLA DE FRECUENCIAS

NUMERO DE INTERVALO DE CLASE K

(1)

INTERVALO DE CLASE

(2)

MARCA DE CLASE

(3)

FRECUENCIA ABSOLUTA

(4)

FRECUENCIA RELATIVA

(5)

FRECUENCIA ABSOLUTA

ACUMULADA

(6)

FRECUENCIA RELATIVA

ACUMULADA

(7)

FUNCION DENSIDAD EMPÍRICA

(8)

1

K

TOTAL

Presentación en forma gráfica

Una distribución de frecuencia como lo indicado en el cuadro N°1.3.3, es más fácil de interpretar en presentaciones gráficas. Las presentaciones gráficas son: histograma, polígono de frecuencias, distribución de frecuencias acumulada, distribuciones de frecuencias relativas acumuladas y función densidad empírica.

Ejemplo

– Para los datos del cuadro N°1.1.1 hallar la tabla de distribuciones de frecuencia, histogramas, polígonos de frecuencias, las funciones de distribución acumulada y la función densidad empírica.

– Hallar la frecuencia relativa de cada dato, la probabilidad que el evento sea mayor o igual a un valor determinado y la probabilidad de que el evento sea menor a un valor dado.

Descripción de datos

La razón fundamental de clasificar los datos en una tabla y graficar las frecuencias es para describir la naturaleza de la distribución de frecuencias, La descripción se realiza mediante los estadísticos o los estadígrafos1.Estadísticas de posición2.Medidas muestrales de dispersión 3.Momentos muestrales, medidas de asimetría y curtosis

1 Estadísticas de posición

Son números que indican la localización del valor medio o valor central de la distribución de frecuencias, estos estadísticos son denominados como medidas de localización o medidas de tendencia central; por tanto las medidas de posición determinan la ubicación del valor central de los datos de una distribución de frecuencias. Los estadísticos de posición comúnmente usados son: media, mediana y moda.

2 Medidas muestrales de dispersión

Estos estadísticos (números) indican el grado de dispersión o desfases en los datos de la muestra, poca dispersión indica una uniformidad en los valores de la muestra, mientras que alta dispersión indica poca uniformidad en los valores de la muestra. Cuando los valores son muy cercanos al promedio existe uniformidad y cuando los valores de la muestra son muy alejados al promedio se dice que no hay uniformidad, es decir los valores de la muestra son diferentes o dispersos. Los estadísticos de dispersión son: rango, varianza, desviación estándar y coeficiente de variación.

Momentos muestrales, medidas de asimetría y curtosis

Para evaluar el tipo de una curva de una distribución de frecuencias y para comparar las distribuciones es necesario calcular cuatro valores a partir de la muestra:Promedio que mide la localización del valor central de la distribución de frecuencias.Desviación estándar que mide el grado de dispersión de las frecuencias con respecto al del valor central.Coeficiente de asimetría que mide el grado asimetría o la falta de equilibrio de la distribución de frecuencias entre las dos regiones en que queda dividida la curva de la distribución por la ordenada trazada sobre el valor más alto de la distribución de frecuencias (moda).Coeficiente de curtosis que mide el grado de concentración en los valores centrales de la curva.

Momentos muestrales, medidas de asimetría y curtosis

Existen varias clases de descriptores aritméticos, siendo los momentos el método adecuado para calcular los estadígrafos, es decir con el cálculo de momentos se determina los estadígrafos o estadísticos Como en los cursos de estática, resistencia de materiales, física, matemáticas, etc. se calculan los momentos de órdenes primero, segundo, etc. generalizando se tiene: momento con respecto al origen de coordenadas y momentos con respecto a la media.

Medida de asimetría

La asimetría de una muestra se mide mediante el coeficiente de asimetría, para el cálculo del coeficiente de asimetría se emplea el tercer momento con respecto a la media y para que este coeficiente no tenga dimensiones el tercer momento se divide entre la desviación estándar elevado a la potencia 3. El coeficiente de asimetría o sesgo de una muestra se calcula mediante las siguientes ecuaciones:

Medida de apuntamiento

El grado apuntamiento del polígono de frecuencias (forma puntiaguda del polígono de frecuencias) se mide mediante el coeficiente de curtosis. Para el cálculo del coeficiente de curtosis se emplea el cuarto momento con respecto a la media y para que este coeficiente no tenga dimensiones el cuarto momento se divide entre la desviación estándar elevado a la potencia 4. El coeficiente de curtosis de una muestra se calcula mediante las siguientes ecuaciones:

33

2

21 Snn

mnCg s

∑1

33

1 n

iixn

m

x-

44

3

321 SnnnMn

CK

n

xxM

n

ii

1

4

4

– Sí g=0 es una distribución simétrica– Sí g>0 es una distribución sesgada a la derecha

(polígono de frecuencias con cola más larga a la derecha)

– Sí g<0 es una distribución sesgada a la izquierda (polígono de frecuencias con cola más larga hacia la izquierda).

• El sesgo del polígono de frecuencias se aprecia trazando una vertical por la moda donde se diferencia la cola del polígono de frecuencias.

• Es importante indicar que los tres números son suficientes para tener una idea de la forma del histograma.

el valor del coeficiente de curtosis es costumbre comparar con Ck=3 que es coeficiente de apuntatamiento de una curva continua de forma de una campana (curva normal).– Sí Ck>3 es una distribución leptocúrtica, picuda o

puntiaguda.– Sí Ck=3 es una distribución mesocúrtica o

moderada (curva normal)– Sí Ck<3 es una distribución platicúrtica, achatada o

plana.