2015 UNIDAD 1 Estadistica DESCRIPTIVA.pptx

34
UNIDAD “1” ELEMENTOS DE ESTADÍSTICA DESCRIPTIVA

Transcript of 2015 UNIDAD 1 Estadistica DESCRIPTIVA.pptx

UNIDAD 1

UNIDAD 1ELEMENTOS DE ESTADSTICA DESCRIPTIVAPOBLACIONEs el total del conjunto de elementos u objetos de los cuales se quiere obtener informacin. Aqu el trmino poblacin tiene un significado mucho ms amplio que el usual, ya que puede referirse a personas, cosas, actos, reas geogrficas e incluso al tiempo.

Es un subconjunto de casos o individuos de una poblacin estadstica. Se obtienen con la intencin de inferir propiedades de la totalidad de la poblacin, para lo cual deben ser representativas de la misma. Los elementos tienen que ser elegidos de forma aleatoria.MUESTRARECOLECCION DE DATOSLa recoleccin se realiza para conseguir lo que uno necesita saber sobre las variables que se han elegido anteriormente.Existen numerosos mtodos para poder recolectar estos datos tales como: censos, encuestas, etc.

REQUISITOS DE LOS DATOSMediblesExactosAccesibles

Los datos estadsticos necesarios para la comprensin de los hechos pueden obtenerse a travs de fuentes primarias y fuentes secundarias.Fuentes primarias: es la persona o institucin que ha recolectado directamente los datos. son las efectuadas por oficinas gubernamentales encargadas de tal fin, en ltima instancia usar estadsticas de fuentes secundarias.Fuentes secundarias: son las publicaciones y trabajos hechos por personas o entidades que no han recolectado directamente la informacin. La calidad de las conclusiones estadsticas dependen en grado sumo de la exactitud de los datos que se recaben.

FUENTES DE DATOSCLASIFICACION DE DATOSDatos Cualitativos: cuando los datos son cuantitativos, la diferencia entre ellos es de clase y no de cantidad.Ejemplo: Si deseamos clasificar los estudiantes que cursan la materia de estadstica I por su estado civil, observamos que pueden existir solteros, casados, divorciados, viudos.Datos cuantitativos: cuando los valores de los datos representan diferentes magnitudes, decimos que son datos cuantitativos.Ejemplo: Se clasifican los estudiantes del Ncleo San Carlos de la UNESR de acuerdo a sus notas, observamos que los valores (nota) representan diferentes magnitudes.

TIPOS DE VARIABLESContinuas se caracterizan por el hecho de que para todo para de valores siempre se puede encontrar en valor intermedio, (el peso, la estatura, el tiempo empleado para realizar un trabajo, etc.)Una variable es continua, cuando puede tomar infinitos valores intermedios dentro de dos valores consecutivos. Por ejemplo, la estatura, el peso, la temperatura.Discretas sern aquellas que pueden tomar solo un nmero limitado de valores separados y no continuos; son aquellas que solo toman un determinado nmeros de valores, porque entre dos valores consecutivos no pueden tomar ningn otro; por ejemplo el nmero de estudiantes de una clase es una variable discreta ya que solo tomar los valores 1, 2, 3, 4... ntese que no encontramos valor como 1,5 estudiantes

Tras la recogida de informacin en una investigacin, nos encontraremos con una serie de datos sobre diferentes variables de los individuos de una muestra. El primer paso para comenzar a analizar los datos es el de organizarlos de manera que podamos ver las caractersticas de los diferentes valores que han tomado las observaciones. El tipo de organizacin de los datos depende del tipo de variable.

TABULACION DE LOS DATOS

FRECUENCIAFrecuencia absoluta: es el nmero de apariciones en una muestra de un determinado valor de una variable. Frecuencia relativa: nos indica las ocurrencias de un valor determinado, pero no nos indica la proporcin o tamao relativo respecto a los otros valores. Para esto se utilizan las frecuencias relativas, que no son otra cosa que la relacin entre la frecuencia absoluta de cada valor y el tamao muestral n.DISTRIBUCION DE FRECUENCIASEs un mtodo estadstico para estudiar el comportamiento de un conjunto de datos. Consiste en arreglar los datos ordenndolos en intervalos de clase e indicar el nmero de datos comprendidos en cada clase.RANGOSe calcula el rango como la diferencia entre el mayor de los datos y el menor de los datos:

R = M - mAMPLITUD

Es el espacio comprendido entre dos limites (superior e inferior) y es obtenida como el cociente entre el rango R y el nro. de intervalos que se desean

H = R NUn grfico es un dibujo complementario a una tabla o cuadro, que permite observar las tendencias de un fenmeno en estudio y facilita el anlisis estadstico de las variables all relacionadas.Los grficos se utilizan para realizar un anlisis exploratorio, permitiendo una descripcin preliminar de lo que se va a estudiar.

REPRESENTACION DE DATOS TIPOS DE GRAFICOSPictogramasGrficos circularesGrficos de barrasCurvasHistogramas

De torta y de BarraEstos grficos se utilizan para representar informacin de carcter cualitativa.Grfico de torta o circular: Estos grficos nos permiten ver la distribucin interna de los datos que representan un hecho, en forma de porcentajes sobre un total. Permiten ver la proporcin que corresponde a cada categora representando con ellas el todo.

Grfico de Barras: El grfico de barras, como su nombre lo indica, est constituido por barras rectangulares de igual ancho, conservando la misma distancia de separacin entre s. Se utiliza bsicamente para mostrar y comparar frecuencias de variables cualitativas o comportamientos en el tiempo, cuando el nmero de tems es reducido.stos grficos suelen ser de barras verticales, aunque se pueden utilizar de forma horizontal.De Barra

Histograma de Frecuencias Este grfico se utiliza para representar informacin de carcter cuantitativa. sta informacin se debe primero representar en una tabla de distribucin de frecuencias. Lo que representa este grfico es la frecuencia (fi) de una distribucin. Las barras del histograma cubren todo el rango de una variable. En el eje horizontal se debe indicar las marcas de clase. En el eje vertical se representa la frecuencia. Debido a que las clases son de la misma magnitud (del mismo ancho) el rea es representada por el alto de ellas.

OjivaUna ojiva representa la frecuencia acumulada en un grfico de lneas.

MEDIDAS DE POSICIONLas medidas de posicin buscan dar una idea numrica de donde se encuentra situada una distribucin de frecuencias.Buscan sintetizar la informacin contenida en una distribucin de frecuencias estimando dnde se encuentra el centro de la misma.Nos dan un centro de la distribucin de frecuencias, es un valor que se puede tomar como representativo de todos los datos.

MEDIA ARITMETICAEs el promedio aritmtico de las observaciones, es decir, el cociente entre la suma de todos los datos y el numero de ellos. Si xi es el valor de la variable, tenemos que:

Para datos no agrupados:

Para datos agrupados:

Si los datos estn agrupados utilizamos las marcas de clase, es decir ci en vez de xi y se calcula como el promedio de los extremos del intervalo correspondiente

MEDIANAEs el valor que separa por la mitad las observaciones ordenadas de menor a mayor, de tal forma que el 50% de estas son menores que la mediana y el otro 50% son mayores. Si el nmero de datos es impar la mediana ser el valor central, si es par tomaremos como mediana la media aritmtica de los dos valores centrales.Para datos sin agrupar el valor es el dato central si el nmero de datos es impar o el promedio de los valores centrales si el nmero de datos es par.

Para datos agrupados:Donde: Li es el extremo inferior del intervalo de la Mediana n es el nmero total de observaciones Fi-1 es la frecuencia acumulada del intervalo anterior al de la mediana fi es la frecuencia del intervalo de la mediana h es la amplitud del intervalo

MODO O MODAEs el valor de la variable que ms veces se repite, es decir, aquella cuya frecuencia absoluta es mayor. No tiene porque ser nica.

Para datos no agrupados : El modo o moda es el valor de la variable que tiene la mayor frecuencia.

Para datos agrupados: Usamos la frmula:

Donde: Li = lmite inferior de la clase del modo fi = frecuencia del intervalo del modo fi-1 = frecuencia del intervalo anterior al del modo fi+1 = frecuencia del intervalo posterior al del modo h = amplitud del intervalo del modoMEDIDAS DE DISPERSIONLas medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas de dispersin nos dicen hasta que punto estas medidas de tendencia central son representativas como sntesis de la informacin. Las medidas de dispersin cuantifican la separacin, la dispersin, la variabilidad de los valores de la distribucin respecto al valor central. Distinguimos entre medidas de dispersin absolutas, que no son comparables entre diferentes muestras y las relativas que nos permitirn comparar varias muestras.

VARIANZAEs una variable estadstica que mide la dispersin de los valores respecto a un valor central (media), es decir, la media de las diferencias cuadrticas de las puntuaciones respecto a su media aritmtica. Para datos agrupados: Para datos sin agrupar:

DESVIO ESTANDARLa varianza a veces no se interpreta claramente, ya que se mide en unidades cuadrticas. Para evitar ese problema se define otra medida de dispersin, que es la desviacin tpica, que se halla como la raz cuadrada positiva de la varianza. La desviacin tpica nos informa sobre la dispersin de los datos respecto al valor de la media; cuanto mayor sea su valor, ms dispersos estarn los datos.Para datos agrupados:

Para datos sin agrupar: