ESTADISTICA DESCRIPTIVA I unidad

download ESTADISTICA DESCRIPTIVA I unidad

of 41

Transcript of ESTADISTICA DESCRIPTIVA I unidad

INSTITUTO TECNOLGICO DE CAMPECHECARRERA:INGENIERA EN ADMINISTRACIN

MATERIA:ESTADISTICA I

ACREDITADA A LA UNIDAD NMERO: 1TEMA DE INVESTIGACION:ESTADSTICA DESCRIPTIVA

ALUMNA:CAHUICH NOH SHEYLA AURORA

MAESTRO:RAMON AGUSTIN BOCOS PATRON

GRADO:3 SEMESTRE

GRUPO:VD3FECHA DE ENTREGA:2 DE SEPTIEMBRE 2015

NDICE

que es un ensayo?3

qu es la estadstica moderna?4por qu estudiar estadstica?5partes en que se divide la estadstica moderna para su estudio6el mtodo cientfico en la estadstica6mtodos para la obtencin de datos, principio "bebs".7cmo recolectar datos?7tipos de datos estadsticos8propiedades que describen una serie numrica de datos9medidas de tendencia central para cantid. pequeas11comparacin entre la media, mediana y moda15medidas de dispersin para cantidades pequeas de datos16el manejo de grandes cantidades de datos19medidas de tendencia central para datos agrupados20medidas de posicin24medidas de dispersin para datos agrupados27histograma, polgono de frecuencia y ojivas29importancia de la forma de los datos32

grafica para datos cualitativos o categricos34QU ES UN ENSAYO?El ensayo es un gnero literario que se caracteriza por permitir desarrollar un tema determinado de una manera libre y personal. Comnmente, las personas escriben ensayos para manifestar alguna opinin o idea, y sin tener que preocuparse de ceirse a una estructura rgida de redaccin o documentarlo exhaustivamente.Ensayo expositivo. Ensayo argumentativo. Ensayo crtico.Estas tres denominaciones pueden prestarse a cierta confusin. En verdad, se trata siempre del mismo tipo de obra. Esas expresiones se suelen usar en ciertos contextos, especialmente en el acadmico, ya sea en la secundaria o en la universidad. Por ejemplo, con la expresin deensayo crticose quiere resaltar que es un escrito en el cual lo ms importante es lo que piense su autor, su crtica.Todo ensayo, es unaexposicinde ideas, basada enargumentos, por eso es expositivoyargumentativo, y al mismo tiempo es crtica, ya que se est juzgando una determinada cuestin.CMO ESCRIBIR UN ENSAYO.Escribir un ensayo siempre implica esa expresin personal del autor en sus ideas. No existe un mtodo a seguir o unas reglas precisas.Sin embargo, es posible tener en cuenta algunos consejos y sugerencias, especialmente en los casos para aquellas personas que por primera vez desean adentrarse al estilo ensaystico.CARACTERISTICAS DE UN ENSAYO

Aunque sea difcil describir todas las caractersticas de un ensayo por ser un gnero literario esencialmente libre, podemos resumir sus principales caracteres en la siguiente lista:- Libertad temtica- Estilo personal o amistoso en la escritura- Puede incluir citas o referencias- Sin una estructura definida, el autor escoge el orden en que desarrolla su argumento- Su extensin depende del autor- Dirigido generalmente a un pblico amplioQU ES LA ESTADSTICA MODERNA?Al proporcionar herramientas metodolgicas generales para analizar la variabilidad, determinar relaciones entre variables, disear en forma ptima estudios y experimentos y mejorar las predicciones y toma de decisiones en situaciones de incertidumbre. Las tcnicas estadsticas se aplican de manera amplia en mercadotecnia, contabilidad, control de calidad y en otras actividades; estudios de consumidores; anlisis de resultados en deportes; administradores de instituciones; en la educacin; organismos polticos; mdicos; y por otras personas que intervienen en la toma de decisiones.Laestadsticaes unaciencia formaly una herramienta que estudia el uso y los anlisis provenientes de una muestra representativa dedatos, busca explicar las correlaciones y dependencias de un fenmeno fsico o natural, de ocurrencia en formaaleatoriaocondicional.Sin embargo, la estadstica es ms que eso, es decir, es la herramienta fundamental que permite llevar a cabo el proceso relacionado de la estadstica con lainvestigacin cientfica.Es transversal a una amplia variedad de disciplinas, desde la fsica hasta lasciencias sociales, desde laciencia de la saludhasta elcontrol de calidad.Se usa para la toma de decisiones en reas denegocioso institucionesgubernamentales.La estadstica se divide en dos grandes reas:1. Estadstica descriptiva: Se dedica a la descripcin, visualizacin y resumen de datos originados a partir de los fenmenos de estudio. Los datos pueden ser resumidos numrica o grficamente. Ejemplos bsicos de parmetros estadsticosson: lamediay ladesviacin estndar. Algunos ejemplos grficos son:histograma, pirmide poblacional,grafico circular, entre otros.2. Estadstica inferencial: Se dedica a la generacin de losmodelos, inferencias y predicciones asociadas a los fenmenos en cuestin teniendo en cuenta laaleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de lapoblacinbajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas s/no (prueba de hiptesis), estimaciones de unas caractersticas numricas (estimacin),pronsticosde futuras observaciones, descripciones de asociacin (correlacin) o modelamiento de relaciones entre variables (anlisis de regresin). Otras tcnicas demodelamiento incluyenanlisis de varianza, series de tiempo yminera de datos.Ambas ramas (descriptiva e inferencial) comprenden laestadstica aplicada. La estadstica inferencial, por su parte, se divide en estadstica paramtrica y estadstica no paramtrica.Hay tambin una disciplina llamadaestadstica matemtica, la que se refiere a las bases tericas de la materia.POR QU ESTUDIAR ESTADSTICA?La primera razn es que la informacin numrica est en todas partes. Por ejemplo en los peridicos, revistas de noticias, revistas de negocios, revistas de inters general, revistas del hogar, revistas deportivas, revistas de coches, noticias de televisin, radio, etc.se encuentra gran informacin numrica. Para ser consumidores educados en esta informacin, es necesario poder leer las tablas y grficas, as como entender el anlisis de la informacin numrica

Una segunda razn para tomar un curso de estadstica es que las tcnicas estadsticas se utilizan para tomar decisiones que afectan nuestra vida diaria, que afectan nuestro bienestar personal.

Una tercera razn es que el conocimiento de los mtodos estadsticos ayudar a entender cmo se toman las decisiones y a comprender de qu manera nos afectan.En cualquier lnea de trabajo habr que tomar decisiones en las que el entendimiento del anlisis de datos ser muy til.

La estadstica nos va a ayudar a seleccionar las conclusiones generales ms adecuadas a partir de datos parciales y representativos. Distinguiremos los tres campos bsicos de la Estadstica: la estadstica descriptiva, el clculo de probabilidades y la estadstica inferencial.

La Estadstica es la ciencia cuyo objetivo es reunir una informacin cuantitativa o cualitativa referente a individuos, grupos, series de hechos, etc. Analizar los datos obtenidos y deducir; a partir de este anlisis y mediante tcnicas propias, conclusiones generales o previsiones para el futuro con cierto grado de incertidumbre.

Variables cualitativas: Son las variables que expresan distintas cualidades, caractersticas o modalidad. Cada modalidad que se presenta se denomina atributo o categora y la medicin consiste en una clasificacin de dichos atributos.

PARTES EN QUE SE DIVIDE LA ESTADSTICA MODERNA PARA SU ESTUDIO

La estadstica puede dividirse en dos reas: estadstica descriptiva y estadstica inferencias.La estadstica descriptiva, que se dedica a los mtodos de recoleccin, descripcin, visualizacin y resumen de datos originados a partir de los fenmenos en estudio. Los datos pueden ser resumidos numrica o grficamente. Ejemplos bsicos de descriptores numricos son la media y la desviacin estndar. Resmenes grficos incluyen varios tipos de figuras y grficos.La estadstica inferencia o inductiva, que se dedica a la generacin de los modelos, inferencias y predicciones asociadas a los fenmenos en cuestin teniendo en cuenta lo aleatorio e incertidumbre en las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la poblacin de estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba de hiptesis), estimaciones de caractersticas numricas (estimacin), preclasificacin clsica de la estadstica.

EL MTODO CIENTFICO EN LA ESTADSTICA El mtodo cientfico es un conjunto de principios y procedimientos para la bsqueda sistemtica del conocimiento.

El mtodo cientfico est compuesto por los siguientes pasos:

1. Formula una teora (problema). 2. Recoger datos para probar la teora. 3. Analizar los datos. 4. Interpretar los resultados y tomar una decisin.

El mtodo cientfico es un procedimiento iterativo de aprendizaje. No podemos tener certeza de la veracidad de las teoras que probemos usando el mtodo cientfico, eso es inherente a la ciencia. La ciencia est, por lo tanto, todo el tiempo revisando sus teoras. La Estadstica no es un conjunto de diferentes tcnicas aisladas unas de otras, sino que la Estadstica, en conjunto con el mtodo cientfico, nos entrega un procedimiento analtico para tomar decisiones.

Los mtodos estadsticos utilizan el mtodo cientfico, que consiste en cinco pasos bsicos:

1. Definir cuidadosamente el problema. Asegurarse de que est claro el objeto de un estudio o un anlisis. 2. Formular un plan para recopilar los datos necesarios. 3. Reunir los datos. 4. Analizar e interpretar los mismos. 5. Anotar las conclusiones y otros descubrimientos, de manera que sean fcilmente comprendidos por los que utilizarn los resultados al tomar decisiones.

Datos Estadsticos Los datos estadsticos se obtienen mediante un proceso que comprende la observacin o medicin de conceptos como: Ingresos anuales en una comunidad.

Calificaciones de exmenes. Cantidad de caf por taza despachada por una mquina vendedora. Resistencia a la rotura de fibras de plstico. Porcentaje de azcar en cereales, etc. Tales conceptos tambin reciben el nombre de variables, ya que producen valores que tienden a mostrar cierto grado de variabilidad, al efectuarse mediciones Sucesivas.

MTODOS PARA LA OBTENCIN DE DATOS, PRINCIPIO "BEBS".

La forma de obtener la informacin original de las unidades de anlisis que componen el universo por investigar puede ser efectuada a travs de un censo, una encuesta o un registro administrativo.

Una variante reciente de GIGO lo traduce como (Entra Basura, basura Sale). Esto describe la tendencia de la gente de aceptar el rendimiento de un sistema sin juzgarlo crticamente. Aun si la entrada es basura, creemos en el resultado, normalmente porque no entendemos bien cmo funciona el sistema para producirlo. Esto se llama a veces la fe ciega. Si entra basura en el proceso de riesgo puede haber una falta de objetivos convenidos, identificacin de riesgo inadecuada o perezosa, o el uso de respuestas al riesgo poco apropiadas.CMO RECOLECTAR DATOS?

La recoleccin de datos, se puede definir como: al medio a travs del cual el investigador se relaciona con los participantes para obtener la informacin necesaria que le permita lograr los objetivos de la investigacin.

De modo que para recolectar la informacin hay que tener presente:

1. Seleccionar un instrumento de medicin el cual debe ser vlido y confiable para poder aceptar los resultados

2. Aplicar dicho instrumento de medicin

3. Organizar las mediciones obtenidas, para poder analizarlos

TIPOS DE DATOS ESTADSTICOSExisten varios tipos de datos estadsticos, que se agrupan en dos clasificaciones: datos de caractersticas cuantitativas y cualitativas.

Los datos de caractersticas cuantitativas:Son aquellos que se pueden expresar numricamente y se obtienen a travs de mediciones y conteos. Un dato cuantitativo se puede encontrar en cualquier disciplina; sicologa, contabilidad, economa, publicidad, etc. Se clasifican en:

1-Variables continas: Es cuando los datos estadsticos se generan a travs de un proceso de medicin se dice que estos son datos continuos; son aquellas que aceptan valores en cualquier punto fraccionario de un determinado intervalo, o sea, que aceptan fraccionamiento en un determinado intervalo.

2-Variables discretas: Se generan a travs de un proceso de conteo. Son aquellas que no aceptan valores en puntos fraccionarios dentro de un determinado intervalo, o sea, son aquellas que no aceptan fraccionamiento dentro de un determinado intervalo.

Datos de caractersticas cualitativas:Los datos de caractersticas cualitativas son aquellos que no se pueden expresar numricamente. Estos datos se deben convertir a valores numricos antes de que se trabaje con ellos.

Los datos de caractersticas cualitativas se clasifican en:

1-Datos nominales: Comprenden categoras, como el sexo, carrera de estudio, material de los pisos, calificaciones, etc. Las caractersticas mencionadas no son numricas por su naturaleza, pero cuando se aplican, ya sea en una poblacin o una muestra, es posible asignar a cada elemento una categora y contar l nmero que corresponde a cada elemento. De esta manera estas caractersticas se convierten en numricas.

2-Datos jerarquizados: Es un tipo de datos de caractersticas cualitativas que se refiere a las evaluaciones subjetivas cuando los conceptos se jerarquizan segn la preferencia o logro. Las posiciones de una competencia de atletismo se jerarquizan en primer lugar, segundo lugar, tercer lugar, etc.

Tanto los datos nominales como los jerarquizados, que por su naturaleza no son numricas, se convierten en "datos discretos".

Existe otro tipo de datos que por su naturaleza especial pueden ser clasificados segn tu conveniencia, estos son los cronolgicos, por ejemplo los aos de la historia 2005,2006, 2007 puedes usarlos como discretos (aos enteros), continuos (aos con subdivisiones en decimales de ao), nominales (por el nombre) o jerarquizados (ordenados), depende del uso que se le van a dar.

Variable contina

Son aquellas variables que pueden asumir cualquier valor en determinado intervalo de valores. Caractersticas tales como altura, peso, longitud, espesor, velocidad, temperatura, etc., quedan dentro de esta categora.

Datos continuos Son aquellos datos que se obtienen de variables continuas. Ejemplo: La cantidad de caf que se vende por da, la gasolina que se expende por hora, la velocidad del aire, etc.PROPIEDADES QUE DESCRIBEN UNA SERIE NUMRICA DE DATOSPropiedades de los datos numricos.Las tres mejores propiedades que describe una serie numrica de datos son:1. Tendencia central2. Variacin3. FormaSi estas mediciones se calculan a partir de una muestra, se denominan estadsticas, si se calculan a partir de los datos de una poblacin se denominan parmetros.Mediciones de tendencia Central La media aritmtica, es el promedio. Se calcula sumando todas las observaciones y luego dividiendo el total entre el nmero de elementos involucrados.La media acta como punto de equilibrio de tal forma que las observaciones menores compensan a las observaciones que son mayores.La media aritmtica se ve afectada en gran medida por valores extremos. La mediana. Es el valor medio de una secuencia ordenada de datos. Si no hay empates, la mitad de las observaciones sern menores y la otra mitad sern mayores. La mediana no se ve afectada por valores extremos. Para calcular la mediana, primero se deben poner los datos en orden. Despus usamos la frmula del punto de posicionamiento.El clculo del valor de la media se ve afectado por el nmero de observaciones, no por la magnitud de cualquier extremo. La moda. Es el valor de una serie de datos que aparece con ms frecuencia. La moda no se ve afectada por la ocurrencia de cualquier valor extremo. Cuartiles. Los cuartiles son mediciones descriptivas que dividen los datos ordenados en cuatro cuartos.Mediciones de la VariacinLa variacin es la cantidad de dispersin o propagacin en los datos. El rango: es la diferencia entre la mayor y la menor observacin en una serie de datos. El rango mide la propagacin total en la serie de datos. La debilidad del rango es que no logra tomar en cuenta la forma en que los datos se distribuyen realmente entre el mayor y el menor valor. Sera impropio usar el rango como una medicin cuando uno de o ambos componentes son observaciones extremas. El rango inter-cuartil: es la diferencia entre el tercer y primer cuartil. No se ve influida por valores extremos. La varianza y la desviacin estndar: a diferencia de las mediciones anteriores la varianza y la desviacin estndar toman en cuenta como se distribuyen las observaciones. La Varianza de muestra es el promedio de las diferencias cuadradas entre cada una de las observaciones de una serie de datos y la media. La desviacin estndar es simplemente la raz cuadrada de la varianza. La varianza y la desviacin miden la dispersin promedio alrededor de la media, es decir, como las observaciones mayores fluctan por encima de sta y como las observaciones menores se distribuyen por debajo de sta. El Coeficiente de Variacin: es una medida relativa de variacin. Se expresa como porcentaje antes que en trminos de las unidades de los datos particulares. Mide la dispersin en los datos relativa a la media.El coeficiente de variacin es til al comparar la variabilidad de dos o ms series de datos que se expresan en distintas unidades de medicin.

MEDIDAS DE TENDENCIA CENTRAL PARA CANTIDADES PEQUEAS DE DATOS

Las medidas de tendencia central se utilizan con bastante frecuencia para resumir un conjunto de cantidades o datos numricos a fin de describir los datos cuantitativos que los forman. Ejemplos de ello, pueden ser: la edad promedio o la estatura promedio de los estudiantes de la universidad o el peso promedio de las bolsas de cereal que son llenadas por una determinada mquina en un proceso de produccin o las ventas de un negocio. Las medidas de tendencia central son tambin frecuentemente usadas para comparar un grupo de datos con otro, por ejemplo: el promedio de ventas obtenido por un grupo de vendedores de una zona comparado con el promedio de ventas otro grupo de vendedores de otra zona, el promedio de reclamos de clientes de una sucursal, comparado con el promedio de reclamos de otra sucursal. Otras caractersticas generales de las medidas de tendencia central son las siguientes: Permiten apreciar qu tanto se parecen lo grupos entre s. Son valores que se calculan para un grupo de datos y que se utiliza para describirlos de alguna manera..Normalmente se desea que el valor sea representativo de todos los valores incluidos en el grupo. Es el valor ms representativo o tpico de un grupo de datos, no es el valor ms pequeo o el ms grande, sino un valor que est en algn punto intermedio del grupo, ms exactamente, se acerca a estar al centro de todos los valores, por ello se les llama medidas de tendencia central. Se utilizan como mecanismo para resumir una caracterstica de un grupo de datos en particular. Tambin para comparar un grupo de datos contra otro. El clculo de las medidas de tendencia central se hace mediante frmulas, las cuales cambian segn como se encuentren los datos del grupo con el que se va a trabajar, esto es si estn como Datos no agrupados o como Datos agrupados (Distribuciones de frecuencias).Media aritmticaLamedia aritmtica(tambin llamadapromedioo simplementemedia) de un conjunto finito de nmeros es el valor caracterstico de una serie de datos cuantitativos objeto de estudio que parte del principio de la esperanza matemtica o valor esperado, se obtiene a partir de la suma de todos sus valores dividida entre el nmero de sumandos. Cuando el conjunto es unamuestra aleatoriarecibe el nombre demedia muestralsiendo uno de los principalesestadsticos mustrales.Expresada de forma ms intuitiva, podemos decir que la media (aritmtica) es la cantidad total de la variable distribuida a partes iguales entre cada observacin.Por ejemplo, si en una habitacin hay tres personas, la media de dinero que tienen en sus bolsillos sera el resultado de tomar todo el dinero de los tres y dividirlo a partes iguales entre cada uno de ellos. Es decir, la media es una forma de resumir la informacin de una distribucin (dinero en el bolsillo) suponiendo que cada observacin (persona) tuviera la misma cantidad de la variable.Tambin la media aritmtica puede ser denominada comocentro de gravedadde unadistribucin, el cual no est necesariamente en la mitad.Una de las limitaciones de la media aritmtica es que se trata de una medida muy sensible a los valores extremos; valores muy grandes tienden a aumentarla mientras que valores muy pequeos tienden a reducirla, lo que implica que puede dejar de ser representativa de la poblacin.La media aritmtica se calcula sumando todos los componentes y dividiendo el resultado entre el nmero de componentes. El resultado entero o decimal es la media aritmticaDados losnnmeros, lamedia aritmticase define como:

Por ejemplo, la media aritmtica de 8, 5 y -1 es igual a:

Se utiliza la letraXcon una barra horizontal sobre el smbolo para representar la media de una muestra (), mientras que la letra (mu) se usa para la media aritmtica de una poblacin, es decir, elvalor esperadode una variable.En otras palabras, es la suma denvalores de lavariabley luego dividido porn: dondenes el nmero de sumandos, o en el caso de estadstica el nmero de datos se da el resultado.Media ponderadaEs unamedida de tendencia central, que es apropiada cuando en un conjunto de datos cada uno de ellos tiene una importancia relativa (o peso) respecto de los dems datos. Se obtiene multiplicando cada uno de los datos por su ponderacin (peso) para luego sumarlos, obteniendo as unasuma ponderada;despus sedivide esta entre la suma de los pesos, dando como resultado lamedia ponderada.Para una serie de datos no vaca:

a la que corresponden los pesos:

Lamedia ponderadase calcula de la siguiente manera:

MedianaRepresenta el valor de la variable de posicin central en un conjunto de datos ordenados.Existen dos mtodos para el clculo de la mediana:1. Considerando los datos en forma individual, sin agruparlos.2. Utilizando los datos agrupados en intervalos de clase.A continuacin veamos cada una de ellas:DATOS SIN AGRUPARSeanlos datos de una muestraordenada en orden crecientey designando la mediana como, distinguimos dos casos:

a) Sin es impar, la mediana es el valor que ocupa la posicinuna vez que los datos han sido ordenados (en orden creciente o decreciente), porque ste es el valor central. Es decir: .Por ejemplo, si tenemos 5 datos, que ordenados son: ,,,,=> El valor central es el tercero:. Este valor, que es la mediana de ese conjunto de datos, deja dos datos por debajo (,) y otros dos por encima de l (,).

b) Sin es par, la mediana es la media aritmtica de los dos valores centrales. Cuandoes par, los dos datos que estn en el centro de la muestra ocupan las posicionesy. Es decir: .Por ejemplo, si tenemos 6 datos, que ordenados son: , , ,, , . Aqu dos valores que estn por debajo dely otros dos que quedan por Encima del siguiente dato . Por tanto, la mediana de este grupo de datos es la media aritmtica de estos dos datos:.DATOS AGRUPADOSAl tratar con datos agrupados, sicoincide con el valor de una frecuencia acumulada, el valor de la mediana coincidir con laabscisacorrespondiente. Si no coincide con el valor de ninguna abscisa, se calcula a travs de semejanza de tringulos en elhistogramao polgono de frecuencias acumuladas, utilizando la siguiente equivalencia:

Dondeyson las frecuencias absolutas acumuladas tales que,yson los extremos, interior y exterior, del intervalo donde se alcanza la mediana yes la abscisa a calcular, la mediana. Se observa quees la amplitud de los intervalos seleccionados para el diagrama.ModaEs el valor con una mayor frecuencia en una distribucin de datos.Se hablar de una distribucin bimodal de los datos adquiridos en una columna cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta mxima. Una distribucin tri-modal de los datos es en la que encontramos tres modas. Si todas las variables tienen la misma frecuencia diremos que no hay moda.Elintervalo modales el de mayor frecuencia absoluta. Cuando tratamos con datos agrupados antes de definir la moda, se ha de definir el intervalo modal.La moda, cuando los datos estn agrupados, es un punto que divide al intervalo modal en dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que verifiquen que:

Siendo la frecuencia absoluta del intervalo modal las frecuencias absolutas de los intervalos anterior y posterior, respectivamente, al intervalo modal.

Para obtener la moda en datos agrupados se usa la siguiente frmula:

Dnde:=-inferior de la clase modal.= es el delta de frecuencia absoluta modal y la frecuencia absoluta pre-modal.= es el delta de frecuencia absoluta modal y la frecuencia absoluta post-modal. = Amplitud del intervalo modalCOMPARACIN ENTRE LA MEDIA, MEDIANA Y MODASi media=moda=mediana, la distribucin es simtrica Si media > mediana, la distribucin es asimtrica con cola a la derecha (sesgada a la derecha). Si media < mediana, la distribucin es asimtrica con cola a la izquierda (sesgada a la izquierda).

Maneras de recordar la diferenciaLa mejor manera de recordar la diferencia entre los tres tipos de nmeros es: la media es el promedio de los nmeros, la mediana es el valor del medio y la moda es el nmero que aparece con mayorfrecuencia.

MEDIDAS DE DISPERSIN PARA CANTIDADES PEQUEAS DE DATOS Tambin llamadas medidas de variabilidad, muestran la variabilidad de una distribucin, indicando por medio de un nmero si las diferentes puntuaciones de una variable estn muy alejadas de lamedia. Cuanto mayor sea ese valor, mayor ser la variabilidad, y cuanto menor sea, ms homognea ser a lamedia. As se sabe si todos los casos son parecidos o varan mucho entre ellos.Para calcular la variabilidad que una distribucin tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmtica. Pero la suma de las desviaciones es siempre cero, as que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (desviacin media) y otra es tomando las desviaciones al cuadrado (varianza).Las medidas de dispersin, variabilidad o variacin nos indican si esos datos estn prximos entre s o s estn dispersos, es decir, nos indican cun esparcidos se encuentran los datos. Estas medidas de dispersin nos permiten apreciar la distancia que existe entre los datos a un ciertovalorcentral e identificar la concentracin de los mismos en un cierto sector de la distribucin, es decir, permiten estimar cun dispersas estn dos o ms distribuciones de datos.Estas medidas permiten evaluar la confiabilidad del valor del dato central de un conjunto de datos, siendo la media aritmtica el dato central ms utilizado. Cuando existe una dispersin pequea se dice que los datos estn dispersos o acumulados cercanamente respecto a un valor central, en este caso el dato central es un valor muy representativo. En el caso que la dispersin sea grande el valor central no es muy confiable. Cuando una distribucin de datos tiene poca dispersin toma el nombre de distribucin homognea y si su dispersin es alta se llama heterognea.RangoEs unintervaloentre el acceso autorizado y el valor mnimo; por ello, comparteunidadescon lo obtener una idea de ladispersinde los datos, cuanto mayor es los rangos, ms dispersos estn los datos de un grupo Por ejemplo, para una serie de datos de carcter cuantitativo, como lo es la estatura medida en centmetro tendramos:

es posible ordenar los datos como sigue:

Donde la notacin indica que se trata del elementoi-psimo de la serie de datos. De este modo, el rango sera la diferencia entre el valor mximo (q) y el mnimo; o, lo que es lo mismo:

En nuestro ejemplo, con cinco valores, nos da queR= 185-155 = 30.VarianzaEnteora de probabilidad, lavarianza(que suele representarse como) de unavariable aleatoriaes unamedida de dispersindefinida como laesperanzadel cuadrado de la desviacin de dicha variable respecto a su media.Est medida en unidades distintas de las de la variable. Por ejemplo, si la variable mide una distancia en metros, la varianza se expresa en metros al cuadrado. Ladesviacin estndares la raz cuadrada de la varianza, es una medida de dispersin alternativa expresada en las mismas unidades de los datos de la variable objeto de estudio. La varianza tiene como valor mnimo 0.Hay que tener en cuenta que la varianza puede verse muy influida por losvalores atpicosy no se aconseja su uso cuando las distribuciones de las variables aleatorias tienen colas pesadas. En tales casos se recomienda el uso de otras medidas de dispersin msrobustas.Desviacin estndarLadesviacin tpicaodesviacin estndar(denotada con el smboloos, dependiendo de la procedencia del conjunto de datos) es unamedida de dispersinpara variables de razn (variables cuantitativas o cantidades racionales) y de intervalo. Se define como la raz cuadrada de lavarianzade lavariable.Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de tendencia central, sino que necesitamos conocer tambin la desviacin que presentan los datos en su distribucin respecto de la media aritmtica de dicha distribucin, con objeto de tener una visin de los mismos ms acorde con la realidad al momento de describirlos e interpretarlos para la toma de decisiones.La desviacin tpica es unamedida del grado de dispersinde los datos con respecto al valor promedio. Dicho de otra manera, la desviacin estndar es simplemente el "promedio" o variacin esperada con respecto a lamedia aritmtica.Por ejemplo, las tres muestras (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8) cada una tiene una media de 7. Sus desviaciones estndar mustrales son7,5y1, respectivamente. La tercera muestra tiene una desviacin mucho menor que las otras dos porque sus valores estn ms cerca de 7.La desviacin estndar puede ser interpretada como una medida deincertidumbre. La desviacin estndar de un grupo repetido demedidasnos da laprecisinde stas. Cuando se va a determinar si un grupo de medidas est de acuerdo con el modelo terico, la desviacin estndar de esas medidas es de vital importancia: si la media de las medidas est demasiado alejada de laprediccin(con la distancia medida en desviaciones estndar), entonces consideramos que las medidas contradicen lateora. Esto es coherente, ya que las mediciones caen fuera del rango de valores en el cual sera razonable esperar que ocurrieran si elmodelo tericofuera correcto. La desviacin estndar es uno de tres parmetros de ubicacin central; muestra la agrupacin de los datos alrededor de un valor central (la media o promedio).Coeficiente de variacinEnestadstica, cuando se desea hacer referencia a la relacin entre el tamao de la media y la variabilidad de la variable, se utiliza elcoeficiente de variacin.

Su frmula expresa la desviacin estndar como porcentaje de la media aritmtica, mostrando una mejor interpretacin porcentual del grado de variabilidad que la desviacin tpica o estndar. Por otro lado presenta problemas ya que a diferencia de ladesviacin tpicaeste coeficiente es variable ante cambios de origen. Por ello es importante que todos los valores sean positivos y su media d, por tanto, un valor positivo. A mayor valor del coeficiente de variacin mayor heterogeneidad de los valores de la variable; y a menor C.V., mayor homogeneidad en los valores de la variable. Suele representarse por medio de las siglasC.V.Se calcula:

Dondees ladesviacin tpica, yes la Media. Se puede dar en tanto por ciento calculando:

EL MANEJO DE GRANDES CANTIDADES DE DATOS

En ingeniera, como en todas las ramas de la ciencia y la tecnologa, resulta indispensable el manejo de grandes cantidades de datos. El manejo de estos datos, se realiza por tcnicas matemticas, que se han compilado en una ciencia denominada estadstica, que es la encargada del manejo de datos, para describir los fenmenos, pero ms importante an, para predecirlos.

En estadstica se conoce como muestreo a la tcnica para la seleccin de una muestra a partir de una poblacin.

Se har referencia sobre el muestreo estadstico, tcnicas, niveles y tipos fundamentales de un muestreo; se describen conceptos bsicos que explican lo que esto se refiere al igual se aprecia cmo y qu tipo de tcnicas se pueden utilizar para poner en practica la realizacin de una auditoria con la finalidad de obtener una informacin determinada para lograr un objetivo especfico.

El muestreo estadstico es un procedimiento por el que se ingresan los valores verdaderos de una poblacin a travs de la experiencia obtenida con una muestra

El muestreo como herramienta de la investigacin cientfica arroja resultados que se pueden utilizar para concluir un determinado estudio X de poblacin, al igual las tcnicas selectivas que se requieren para dicho estudio de acuerdo a lo que se va a evaluar.

El muestreo permite una reduccin considerable de los costos materiales del estudio, una mayor rapidez en la obtencin de la informacin y el logro de resultados con mxima calidad.

Se llama frecuencia a la cantidad de veces que se repite un determinado valor de la variable. Se suelen representar con histogramas y con diagramas de Pareto.

MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOSAl describir grupos de observaciones, con frecuencia es conveniente resumir la informacin con un solo nmero. Este nmero que, para tal fin, suele situarse hacia el centro de la distribucin de datos se denominamedidaoparmetro de tendencia centralode centralizacin. Cuando se hace referencia nicamente a la posicin de estos parmetros dentro de la distribucin, independientemente de que sta est ms o menos centrada, se habla de estas medidas comomedidas de posicin.En este caso se incluyen tambin loscuantilesentre estas medidas.Entre las medidas de tendencia central tenemos:MediaMedia ponderadaMedia geomtricaMedia armnicaMedianaModaSe debe tener en cuenta que existen variables cualitativas y variables cuantitativas, por lo que lasmedidas de posicinomedidas de tendenciase usan de acuerdo al tipo de variable que se est observando, en este caso se observanvariables cuantitativas.MEDIA ARITMTICALamedia aritmticaes el valor obtenido por la suma de todos sus valores dividida entre el nmero de sumadores.Por ejemplo, las notas de 5 alumnos en una prueba:Nio nota 1 6,0 Primero, se suman las notas: 2 5,4 6,0+5,4+3,1+7,0+6,1 = 27,6 3 3,1 Luego el total se divide entre la cantidad de alumnos: 4 7,0 27,6/5=5,52 5 6,1 La media aritmtica en este ejemplo es 5,52Lamedia aritmticaes, probablemente, uno de los parmetros estadsticos ms extendidos.Se le llama tambinpromedioo, simplemente,media.

MEDIANALa mediana es un valor de la variable que deja por debajo de s a la mitad de los datos, una vez que stos estn ordenados de menor a mayor.Por ejemplo, la mediana del nmero de hijos de un conjunto de trece familias, cuyos respectivos hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una vez ordenados los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la posicin central es 2:

En caso de un nmero par de datos, la mediana no correspondera a ningn valor de la variable, por lo que se conviene en tomar como mediana el valor intermedio entre los dos valores centrales. Por ejemplo, en el caso de doce datos como los siguientes:

Se toma como medianaExisten mtodos de clculo ms rpidos para datos ms numerosos (vase elartculo principaldedicado a este parmetro). Del mismo modo, para valores agrupados en intervalos, se halla el "intervalo mediano" y, dentro de ste, se obtiene un valor concreto por interpolacin.MODALa moda es el dato ms repetido de la encuesta, el valor de la variable con mayorfrecuencia absoluta.En cierto sentido la definicin matemtica corresponde con la locucin "estar de moda", esto es, ser lo que ms se lleva.Su clculo es extremadamente sencillo, pues solo necesita un recuento. En variables continuas, expresadas en intervalos, existe el denominado intervalo modal o, en su defecto, si es necesario obtener un valor concreto de la variable, se recurre a lainterpolacin.Por ejemplo, el nmero de personas en distintos vehculos en una carretera: 5-7-4-6-9-5-6-1-5-3-7. El nmero que ms se repite es 5, entonces la moda es 5.Hablaremos de una distribucin bimodal de los datos, cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta mxima. Cuando en una distribucin de datos se encuentran tres o ms modas, entonces es multimodal. Por ltimo, si todas las variables tienen la misma frecuencia diremos que no hay moda.Cuando tratamos con datos agrupados en intervalos, antes de calcular la moda, se ha de definir el intervalo modal. El intervalo modal es el de mayor frecuencia absoluta.La moda, cuando los datos estn agrupados, es un punto que divide el intervalo modal en dos partes de la formapyc-p, siendocla amplitud del intervalo, que verifiquen que:

Siendola frecuencia absoluta del intervalo modal yylas frecuencias absolutas de los intervalos anterior y posterior, respectivamente, al intervalo modal.Las calificaciones en la asignatura de Matemticas de 39 alumnos de una clase vienen dadas por la siguiente tabla (debajo):Calificaciones123456789

Nmero de alumnos224589342

Construccin de una distribucin de frecuencia realDistribucin de Frecuencias de pesos en Kg de 100 estudiantes. Clase Intervalo de claseFrecuencia

A60 625

B63 6518

C66 6842

D69 7127

E72 748

Total100

Conceptos bsicos. Clase. Es el nmero de subconjuntos en que se han agrupado los datos. Cada clase se puede denominar mediante una letra, un nmero o alguna caracterstica del subconjunto. Intervalo de clase. Es un conjunto de elementos que forman a una clase, conteniendo un lmite inferior y un lmite superior. Tamao de clase. Es la diferencia entre dos lmites inferiores o superiores de clases sucesivas. Frecuencia. Es el nmero de datos que pertenecen a cada clase. A) Recopilacin de datos. B) Ordenamiento de los datos. C) Determinacin del nmero de clases.D) Clculo del tamao de clase. E) Elaboracin de intervalos. F) Obtencin de frecuencias.A) Recopilacin de datos. Consiste en escribir los datos de la muestra que nos interesa conocer, sin importar el orden. Ejemplo: A continuacin se presentan los datos obtenidos de una muestra de _____ estudiantes, a quienes se les pregunt su estatura, las cuales se utilizarn para la elaboracin de la Distribucin de Frecuencias. Datos no ordenados

1.87 -1.64- 1.57- 1.55- 1.68- 1.55- 1.57 -1.66- 1.64- 1.66- 1.65- 1.64- 1.64- 1.72 1.52- 1.58- 1.56- 1.75- 1.70- 1.70- 1.74- 1.58- 1.75- 1.81- 1.57- 1.72- 1.56- 1.64 1.64- 1.72- 1.62

B) Ordenamiento de los datos. Consiste en ordenar los datos en forma ascendente o descendente para facilitar el conteo de datos que correspondan a cada uno de los intervalos. Ejemplo: A continuacin se presenta la tabla de datos ordenados de las estaturas en metros de _____ estudiantes de 6Datos ordenados

1.52 -1.55- 1.55- 1.56- 1.56- 1.57- 1.57- 1.57- 1.58- 1.58- 1.62- 1.64- 1.64- 1.64 1.64- 1.64- 1.64- 1.65- 1.66- 1.66- 1.68- 1.70- 1.70- 1.72- 1.72- 1.72- 1.74- 1.75 1.75- 1.81- 1.87

C) Determinacin del nmero de clases. El nmero de clases en que se agrupan los datos se determina con la raz cuadrada del nmero de datos cuando este es menor de 200. Nmero de clases raz de nmero de datos Para muestras con 200 o ms datos el nmero de clases se determina con la raz cbica del nmero de datos. Nmero de clases raz cubica de Nmeros de datos Ejemplo: Determinar el nmero de clases de la muestra de las estaturas de los alumnos de 6D) Clculo del tamao de clase. Para determinar el tamao de clase es necesario conocer el rango de la muestra, que se obtiene con la diferencia entre el dato mayor y el dato menor de la muestra y se representa con la letra R. R dato mayor dato menor El tamao de clase se obtiene al dividir el rango entre el nmero de clases, y se representa con la letra c. Tamao de clases= rango/ Nmero de claseC R /raz de nmero de datosE) Elaboracin de intervalos. El tamao de clase indica el nmero de datos que conforman a cada intervalo, considerando los valores extremos llamados lmites. En cada intervalo aparece un lmite inferior (LI) y un lmite superior (LS). Cada intervalo se forma sumando al lmite inferior (LI) un nmero menos que el tamao de clase para obtener el lmite superior (LS). En la elaboracin de la distribucin de frecuencias se debe dejar un rengln antes de la primera clase y otro despus de la ltima.Si en la elaboracin de los intervalos se observa que algunos datos quedan fuera del nmero de clases, entonces se debe agregar una clase ms al final, esto no alterar los resultados.F) Obtencin de Frecuencias. La frecuencia de clase se obtiene contando, en la tabla de datos ordenados, los que correspondan al intervalo de dicha clase.MEDIDAS DE POSICINSonindicadoresusados para sealar que porcentaje de datos dentro de una distribucin de frecuencias superan estas expresiones, cuyo valor representa el valor del dato que se encuentra en el centro de la distribucin de frecuencia, por lo que tambin se les llama " Medidas de Tendencia Central.Pero estas medidas de posicin de una distribucin de frecuencias han de cumplir determinadas condiciones para que lean verdaderamente representativas de la variable a la que resumen. Todasntesisde una distribucin se considerara como operativa si intervienen en su determinacin todos y cada uno de los valores de la distribucin, siendo nica para cada distribucin de frecuencias y siendo siempre calculable y de fcil obtencin. A continuacin se describen las medidas de posicin ms comunes utilizadas enestadstica, como lo son: Cuartiles: Hay 3 cuartiles que dividen a una distribucin en 4 partes iguales: primero, segundo y tercer cuartil. Deciles: Hay 9 deciles que la dividen en 10 partes iguales: (primero al noveno decil). Percentiles: Hay 99 percentiles que dividen a una serie en 100 partes iguales: (primero al noventa y nueve percentil).Cuartiles (Q1, Q2, Q3)a. Aquel valor de una serie que supera al 25% de los datos y es superado por el 75% restante.Formula de Q1 para series de Datos Agrupados enClase.

Dnde:: Posicin de Q1, la cual se localiza en la primera frecuencia acumulada que la contenga, siendo la clase de Q1, la correspondiente a tal frecuencia acumulada.Li, faa, fi, Ic: idntico a los conceptos vistos para Mediana pero referidos a la medida de la posicin correspondiente.b. Primer cuartil (Q1):c. Segundo cuartil (Q2):Coincide, es idntico o similar al valor de la Mediana (Q2 = Md). Es decir, supera y es superado por el 50% de los valores de una Serie.c) Tercer cuartil (Q3):Aquel valor, termino o dato que supera al 75% y es superado por el 25% de los datos restantes de la Serie.Formula de Q3 para series de Datos Agrupados en Clase.

Dnde:: Posicin de Q3, todo idntico al clculo de la Mediana.Deciles (D1, D2, D9)Primer Decil (D1), Quinto Decil (D5) y Noveno Decil (D9).El primer decil es aquel valor de una serie que supera a 1/10 parte de los datos y es superado por las 9/10 partes restantes (respectivamente, hablando en porcentajes, supera al 10% y es superado por el 90% restante),

El D9 (noveno decil) supera al 90% y es superado por el 10% restante. Como se observa, son formulas parecidas a la del clculo de la Mediana, cambiando solamente la respectivas posiciones de las medidas.Percentiles (P1, P2, P99)Primer Percentil (P1), Percentil 50 (P50) y Percentil 99 (P99).El primer percentil supera al uno por ciento de los valores y es superado por el noventa y nueve por ciento restante.Frmulas de P1, P50, P99 para series de Datos Agrupados en Clase.

El P99 (noventa y nueve percentil) supera al 99% de los datos y es superado a su vez por el 1% restante. Idnticas formulas al clculo de la Mediana, cambiando obviamente las correspondientes posiciones de cada medida.Para determinar estas medidas se aplicara el principio de la mediana; as, el primer cuartil cereal valor por debajo del cual se encuentra el 25 por ciento de los datos; bajo el tercer cuartil se encuentra el 75 por ciento; el 80 decil ser el valor por encima del cual estar el 20 por ciento de los datos, etc.Como se observa, todas estas medidas no son sino casos particulares del percentil ya que el primer cuartil no es sino el 25 percentil, el tercer cuartil el 75 percentil, el cuarto decil el 40 percentil, etc.

MEDIDAS DE DISPERSIN PARA DATOS AGRUPADOSLas Medidas deDispersinque se enlistaron en laseccinanterior,varanun poco en la estructura de sus frmulas, por ello es necesario integrar un nuevo formulario que seatilpara estaseccin.

FORMULARIO

RANGO

VARIANZA

Recuerde que la frmula de la Media para datos agrupados es

DESVIACINESTNDAR

o en este caso, la formula se puede expresaras

La cual se puede emplear cuando ya se tiene el valornumricode laVarianza.COEFICIENTE DEVARIACIN

HISTOGRAMA, POLGONO DE FRECUENCIA Y OJIVAS

Un Histograma es un tipo especial de grfica de barras que despliega la variabilidad dentro de un proceso, tambin toma datos variables (tales como alturas, pesos, densidades, tiempo, temperaturas, etc.) y despliega su distribucin.Un histograma es una representacin grfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. En el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las variables, normalmente sealando las marcas de clase, es decir, la mitad del intervalo en el que estn agrupados los datos.Tipos de histogramaDiagramas de barras simplesRepresenta la frecuencia simple (absoluta o relativa) mediante la altura de la barra la cual es proporcional a la frecuencia simple de la categora que representa.Diagramas de barras compuestasSe usa para representar la informacin de unatabla de doble entradao sea a partir de dos variables, las cuales se representan as; la altura de la barra representa la frecuencia simple de las modalidades o categoras de la variable y esta altura es proporcional a la frecuencia simple de cada modalidad.Diagramas de barras agrupadasSe usa para representar la informacin de una tabla de doble entrada o sea a partir de dos variables, el cual es representado mediante un conjunto de barras como se clasifican respecto a las diferentes modalidades.

OJIVASLa representacin grfica de un cuadro de frecuencia acumulada son curvas llamadas ojivas. En la grfica de ojiva, el ltimo intervalo no se une con el eje horizontal.La ojiva apropiada para informacin que presente frecuencias mayores que el dato que se est comparando tendr una pendiente negativa (hacia abajo y a la derecha) y en cambio la que se asigna a valores menores, tendr una pendiente positiva. Una grfica similar al polgono de frecuencias es la ojiva, pero sta se obtiene de aplicar parcialmente la misma tcnica a una distribucin acumulativa y de igual manera que stas, existen las ojivas mayores que y las ojivas menores que.

POLGONO DE FRECUENCIA

El polgono de una variable cuantitativa corresponde al diagrama de lneas. Se construye a partir del histograma de frecuencias.Para esto, se unen los puntos medios de cada una de las barras con un segmento recta. Para que la grfica sea un polgono, es necesario construir un segmento de recta. Para que la grfica sea un polgono, es necesario construir un segmento de recta que inicie en el eje horizontal y termine en el punto medio de barra. De forma similar, se debe hacer en la ltima barra que la figura que se obtenga sea cerrada.Para construir elpolgono de frecuenciase toma lamarca de claseque coincide con elpunto mediode cadarectngulode unhistograma.

IMPORTANCIA DE LA FORMA DE LOS DATOSLa importancia de los datos estadsticos se funda en el hecho de que sirven para evaluar la tendencia futura de un fenmeno determinado. En efecto, luego de un anlisis concienzudo, los datos estadsticos pueden revelar en alguna medida que esperar a futuro en algn rea de la actividad humana. Es por ello que la forma de recopilacin de dichos datos es fundamental, buscando en todo momento que sean representativos de un universo ms grande. Algunas de las aplicaciones de este procedimiento estadstico en funcin de datos recopilados pueden referir al mbito de la poltica, de las finanzas, del mercadeo, etc.ASIMETRAEs una medida de forma de unadistribucinque permite identificar y describir la manera como losdatostiende a reunirse de acuerdo con la frecuencia con que se hallen dentro de la distribucin. Permite identificar las caractersticas de la distribucin de datos sin necesidad de generar el grfico.

TIPOS DE ASIMETRALa asimetra presenta las siguientes formas:Asimetra Negativa o a la Izquierda.-Se da cuando en una distribucin la minora de los datos est en la parte izquierda de la media. Este tipo de distribucin presenta un alargamiento o sesgo hacia la izquierda, es decir, la distribucin de los datos tiene a la izquierda una cola ms larga que a la derecha. Tambin se dice que una distribucin es simtrica a la izquierda o tiene sesgo negativo cuando elvalorde la media aritmtica es menor que la mediana y ste valor de la mediana a su vez es menor que lamoda, ensmbolos

Nota:Sesgo es el grado de asimetra de una distribucin, es decir, cunto se aparta de la simetra.

SIMTRICA.-Se da cuando en una distribucin se distribuyen aproximadamente la misma cantidad de los datos a ambos lados de la media aritmtica. No tiene alargamiento o sesgo. Se representa por una curva normal en forma de campana llamada campana de Gauss (matemtico Alemn 1777-1855) o tambin conocida como deLaplace(1749-1827).Tambin se dice que una distribucin es simtrica cuando su media aritmtica, su mediana y su moda son iguales, en smbolosMd=Mo

Asimetra Positiva o a la Derecha.-Se da cuando en una distribucin la minora de los datos est en la parte derecha de la media aritmtica. Este tipo de distribucin presenta un alargamiento o sesgo hacia la derecha, es decir, la distribucin de los datos tiene a la derecha una cola ms larga que a la izquierda.Tambin se dice que una distribucin es simtrica a la derecha o tiene sesgo positivo cuando el valor de la media aritmtica es mayor que la mediana y ste a valor de la mediana a su vez es mayor que la moda, en smbolos

MEDIDAS DE ASIMETRA

Coeficiente de Karl Pearson

Dnde:= media aritmtica.Md = Mediana.s = desviacin tpica o estndar.

CURTOSIS O APUNTAMIENTOLa curtosis mide el grado de agudeza o achatamiento de una distribucin con relacin a la distribucin normal, es decir, mide cun puntiaguda es una distribucin.

TIPOS DE CURTOSISLa curtosis determina el grado de concentracin que presentan losvaloresen la regin central de la distribucin. As puede ser:Leptocrtica.-Existe una gran concentracin.Mesocrtica.-Existe una concentracin normal.Platicrtica.-Existe una baja concentracin.

MEDIDAS DE CURTOSIS

Medida de FisherPara datos sin agrupar se emplea la siguiente frmula:

Para datos agrupados en tablas de frecuencias se emplea la siguiente frmula:

Para datos agrupados en intervalos se emplea la siguiente frmula:

Dnde:= cada uno de los valores; n = nmero de datos;= media aritmtica;= Cudruplo de la desviacin estndar poblacional; f = frecuencia absoluta; xm = marca de clase

GRAFICA PARA DATOS CUALITATIVOS O CATEGRICOS

Los datos cualitativos pueden ser difciles de ilustrar. El mejor mtodo para presentar los datos, cualitativos o cuantitativos, es a travs del uso de grficas. Muchos mtodos de grficas pueden ilustrar los datos cualitativos y cuantitativos. Una representacin visual de los datos reunidos te puede ayudar a describir rpidamente que el dato se est ilustrando sin tener que entrar en una explicacin profunda, que tal vez no sea fcilmente entendida sin las grficas de todas formas. Una grfica es una forma rpida y eficiente de captar la atencin y describir unaideasin utilizar mucho tiempo o muchas palabras.GRFICAS ESTADSTICAS

Las grficas estadsticas nos permiten familiarizarnos con los datos que se hanrecopilado y resumido. Se considera como una tcnica inicial de ANLISISEXPLORATORIO DE DATOS que produce una representacin visual. Las grficasresultantes revelan un patrn de comportamiento de la variable en estudio. Se ofrecenmuchos tipos de grficos para describir el conjunto de datos. Dependiendo del tipo dedatos y lo que se quiera representar, se har uso del mtodo grfico ms adecuado.

ELEMENTOS DE UNA GRAFICA:

En general se deben tener en cuenta los siguientes elementos: 1. Titulo 2. Tabla o Distribucin de Frecuencias3. Escala 4. Cuerpo de la grfica 5. Convenciones 6. Notas aclaratorias 7. Numeracin.

GRAFICA DE BARRAS

Ungrfico de barras, tambin conocido comogrfico de columnas, es una forma de representar grficamente un conjunto de datos o valores, y est conformado por barras rectangularesdelongitudesproporcionales a los valores representados. Los grficos de barras son usados para comparar dos o ms valores. Las barras pueden orientarse verticalmente u horizontalmente.Ejemplo:Este diagrama de ejemplo est basado en los resultados de laEleccin del Parlamento Europeo en el 2004y en el de 1999. La tabla siguiente lista el nmero de asientos asignadas a cada partido. Los resultados de1999han sido multiplicados por 1.16933, para compensar el cambio en el nmero de asientos entre estos aos.GrupoAsientos (2004)Asientos (1999) a escala

EURO33333333

EFA333333EDD333333ELDR6760

EPP276272

UEN2736

Otros6629

Un grfico de barras que represente los resultados anteriores de la eleccin del2004se vera as:(Si todos los datos fuesen ordenados en orden descendiente, este tipo de grfico de barras sera llamado undiagrama de Pareto.)

Este grfico de barras muestra ambos resultados (2004y1999):

GRAFICA DE PASTELUnagrfica circular, tambin llamadagrfico de pastel,grfico de tortaogrfica de 360 grados, es un recursoestadsticoque se utiliza para representarporcentajesyproporciones. El nmero de elementos comparados dentro de un grfico circular puede ser de ms de 4.Al igual que en lagrfica de barras, el empleo de tonalidades o colores facilita la diferenciacin de los porcentajes o proporciones. A diferencia de otros tipos de grficos, el circular no tiene ejes x o y.Se utilizan en aquellos casos donde interesa no slo mostrar el nmero de veces que se da una caracterstica o atributo de manera tabular sino ms bien de manera grfica, de tal manera que se pueda visualizar mejor la proporcin en que aparece esa caracterstica respecto del total.A pesar de su popularidad, se trata de un tipo de grfico poco recomendable debido a que nuestra capacidad perceptual para estimar relaciones de proporcin o diferencias entre reas de sectores circulares es mucho menor que, por ejemplo, entre longitudes o posiciones, tal y como sucede en otras grficas.

DIAGRAMA CIRCULAR

Es de especial utilidad para mostrar proporciones (porcentajes) relativas de unavariable. Se crea marcando una porcin del crculo correspondiente a cada categora dela variable.

ENSAYO

Aplicacin de la estadstica en salud pblicarea de aplicacinComentarioEjemplo

Estudios de variacinLa variacin de una caracterstica se produce cuando su valor cambia de un sujeto a otro, o de un momento a otro en el mismo sujetoEdad, peso, estatura, presin sangunea, niveles de colesterol, albmina srica, recuento de plaquetas.

Diagnstico de enfermedades y de la salud de la comunidadProceso mediante el cual se identifican el estado de salud de un individuo, o de un grupo, y los factores que lo producenValoracin de los sntomas declarados o recabados en los individuos para realizar un diagnstico de salud

Prediccin del resultado probable de un programa de intervencinEs la evaluacin del resultado de un programa de intervencin en una comunidad o de una enfermedad en los pacientes, a la luz de los sntomas, signos y circunstancias existentesPrograma de intervencin nutricional para determinar el impacto de la aplicacin de un suplemento alimenticio

Eleccin apropiada de intervencin en paciente o comunidadSe basa en la experiencia anterior con pacientes o comunidades de anlogas caractersticas que haban sufrido una intervencinEvaluacin de la eficacia de un frmaco y/u otros mtodos de tratamiento

Administracin sanitaria y planificacinRefiere al empleo de los datos relativos a la enfermedad en la poblacin a fin de hacer un diagnstico en la comunidadDeterminar el perfil sanitario de la poblacin en trminos de distribucin de la enfermedad y la utilizacin de los recursos de salud

Realizacin y anlisis en la investigacin en salud pblicaContempla otorgar la validez a investigaciones analticas o de encuestas descriptivas.Probabilidad de cncer de prstata en individuos con edad mayor a 60 aos