Estadística

download Estadística

of 12

description

estadistica.

Transcript of Estadística

Estadstica: Se designa con el nombre de estadstica a aquella ciencia que ostenta en sus bases una fuerte presencia y accin de las matemticas y que principalmente se ocupa de la recoleccin, anlisis e interpretacin de datos que buscan explicar las condiciones en aquellos fenmenos de tipo aleatorio.Mtodos estadsticos: El mtodo estadstico consiste en una secuencia de procedimientos para el manejo de los datos cualitativos y cuantitativos de la investigacin. Dicho manejo de datos tiene por propsito la comprobacin, en una parte de la realidad, de una o varias consecuencias verificables deducidas de la hiptesis general de la investigacin. Las caractersticas que adoptan los procedimientos propios del mtodo estadstico dependen del diseo de investigacin seleccionado para la comprobacin de la consecuencia verificable en cuestin. El mtodo estadstico tiene las siguientes etapas: 1. Recoleccin (medicin) 2. Recuento (cmputo) 3. Presentacin 4. Sntesis 5. Anlisis.Investigacin: Desde el punto de vista de su etimologa, investigar proviene del latn in (en) y vestigare (hallar, inquirir, indagar, seguir vestigios) lo que conduce al concepto ms elemental de . De esta manera se podra considerar a un investigador, como aquella persona que se dedica a alguna actividad de bsqueda, independiente a su metodologa, propsito e importancia.Investigacin cientfica: Es la actividad de bsqueda que se caracteriza por ser reflexiva, sistemtica y metdica; tiene por finalidad obtener conocimientos y solucionarproblemascientficos, filosficos o emprico-tcnicos, y se desarrolla mediante un proceso.Lainvestigacin cientficaes la bsqueda intencionada de conocimientos o desolucionesa problemas decarctercientfico; elmtodo cientficoindica el camino que se ha de transitar en esa indagacin y las tcnicas precisan la manera de recorrerlo.

Mtodos cientficos: El mtodo cientfico es un proceso destinado a explicar fenmenos, establecer relaciones entre los hechos y enunciar leyes que expliquen los fenmenos fsicos del mundo y permitan obtener, con estos conocimientos, aplicaciones tiles al hombre.Los cientficos emplean el mtodo cientfico como una forma planificada de trabajar. Sus logros son acumulativos y han llevado a la Humanidad al momento cultural actual.Anteproyecto: El anteproyecto o protocolo de investigacin, es un compromiso escrito mediante el cual el investigador presenta de manera sucinta o breve, clara y estructurada, los diferentes elementos del tema y del plan de investigacin que se propone emprender. El investigador, a travs del anteproyecto de investigacin pretende demostrar la importancia de la investigacin que propone, as como su aptitud para llevarla a cabo. Este documento debe, por lo tanto, convencer o persuadir al lector de la importancia del tema de investigacin, en razn de su objeto de estudio, su metodologa, sus alcances, su marco terico y sus hiptesis. Debe adems evidenciar que la investigacin es sustentable de valor tal que intrnsecamente se fundamenta- y es susceptible de alcanzar resultados originales, todo lo cual justifica invertir el tiempo y los recursos necesarios para su realizacin.

Perfil del proyecto: Un proyecto es una planificacin que consiste en un conjunto de actividades que se encuentraninterrelacionadas y coordinadas;1 la razn de un proyecto es alcanzar objetivos especficos dentro de los lmites que imponen un presupuesto, calidades establecidas previamente y un lapso de tiempopreviamente definido.Proyecto de investigacin: El proyecto es un documento que especfica qu es lo que el investigador se propone estudiar y cmo tiene planificada la realizacin del estudio, por lo que siempre debe elaborarse antes de iniciar la investigacin. El Proyecto recibe tambin las denominaciones de Protocolo y de Propuesta; sin embargo, si entendemos la investigacin como un proyecto que debe realizarse, el protocolo puede visualizarse como el documento que resume el proyecto de investigacin que se ejecutar.Definicin: Documento que contiene, con el mximo posible de detalle, precisin y claridad pertinente el plan de investigacin cientfica. Incluye sus aspectos y pasos fundamentales, colocados en tiempo y espacio.Proyecto de inversin: Es una propuesta de accin tcnico econmica para resolver una necesidad utilizando un conjunto de recursos disponibles, los cuales pueden ser, recursos humanos, materiales y tecnolgicos entre otros. Es un documento por escrito formado por una serie de estudios que permiten al emprendedor que tiene la idea y a las instituciones que lo apoyan saber si la idea es viable, se puede realizar y dar ganancias.

Tiene como objetivos aprovechar los recursos para mejorar las condiciones de vida de una comunidad, pudiendo ser a corto, mediano o a largo plazo. Comprende desde la intencin o pensamiento de ejecutar algo hasta el trmino o puesta en operacin normal.Simbologa: La simbologa es el estudio que se lleva a cabo sobre los smbolos.En tanto, por smbolo se refiere a aquella representacin perceptible que se hace de una idea, cuyos rasgos se encuentran socialmente aceptados por convencin. El smbolo es un signo pero sin semejanza ni contigidad. Vale destacar que los signos nicamente significan cosas, es decir, son meros y simples referentes o imgenes de alguna cosa y el smbolo, adems de significar lo propio, ostenta la funcin de simbolizar, que es lo mismo a decir que transmite un mensaje que deviene de la ideas que simboliza el smbolo en cuestin.

Poblacin: Una poblacin se precisa como un conjunto finito o infinito de personas u objetos que presentan caractersticas comunes.

Poblacin Finita:es el conjunto compuesto por una cantidad limitada de elementos, como el nmero de especies, el numero de estudiantes, el nmero de obreros.Poblacin Infinita:es la que tiene un nmero extremadamente grande de componentes, como el conjunto de especies que tiene el reino animal.Poblacin Real:es todo el grupo de elementos concretos, como las personas que en Europa se dedican a actividades artsticas.Poblacin Hipottica:es el conjunto de situaciones posibles imaginables en que puede presentarse un suceso, como por ejemplo las formas de reaccionar de una persona ante una catstrofe.Poblacin estable:es aquella en que sus calores o cualidades no presentan variaciones, o stas, por pequeas que sean, son despreciables, como la rotacin de la tierra o la velocidad de la luz.Poblacin inestable:es la que contienen los valores en constante cambio. Prcticamente la totalidad de las poblaciones corresponden a este tipo. El cambio de los valores se presentan en el tiempo o en el espacio.Poblacin aleatoria:es la que presenta cambios en sus calores debidos al azar, sin que exista una causa aparente, como las variaciones en el contenido del producto.Poblacin dependiente:es la que cambia sus valores debido a una causa determinada y medida. La dependencia puede sertotal, como las variaciones obtenidas en una funcin matemtica, la regresin lineal, por ejemplo. La dependencia esparcialcuando la causa influye en la variable dependiente en una proporcin menor a la total, por ejemplo, el incremento en las ventas proveniente de una mayor gasto publicitario. Esta ltima influencia no es proporcional.Poblacin binomiales aquella en la que se busca la presencia o ausencia de una caracterstica, por ejemplo, la presencia de ozono en el aire.Poblacin polinomial:es la que tiene varias caractersticas que deben ser definidas, medidas o estimadas, como la obediencia, la inteligencia y la edad de los alumnos de postgrado.Muestra: Lamuestraes una parte, generalmente pequea, que se toma del conjunto total para analizarla y hacer estudios que le permitan al investigador inferir o estimar las caractersticas de un problema.La persona interesada en resolver un problema no tiene siempre a la mano toda la informacin, por lo que debe conformarse con pequeos detalles, carentes de precisin, que le ayuden a tomar decisiones bajo riesgo.A un paciente que debe ser operado quirrgicamente se le analiza su sangre tomando una muestra pequea para conocer el grado de coagulacin. No es necesario extraerle toda la sangre.Promedio: Se conoce con el trmino de promedio a aquella cantidad o valor medio que resulta de dividir la suma de todos los valores entre el nmero de estos.

Para obtener tal cantidad necesitamos contar como mnimo con al menos dos cantidades de las cuales se obtendr ese punto medio, es decir, se trata de un concepto relacional, es imposible promediar una cifra consigo misma.

Medidas de dispersin: En secciones anteriores se ha discutido sobre tres medidas descriptivas del centro. Sin embargo, estas medidas no son suficientes para caracterizar la distribucin, puesto que otro aspecto que debe se tomar en cuenta es la variabilidad de las observaciones.Con el propsito de medir la dispersin o variabilidad, se discutirn en este apartado las medidas de: Amplitud (llamada tambin rango o recorrido), Desviacin media, Varianza, Desviacin Estndar (tambin llamada desviacin tpica) y Coeficiente de Variacin.Distribucin de frecuencia: Las distribuciones de frecuencias son tablas en que se dispone las modalidades de la variable por filas. En las columnas se dispone el nmero de ocurrencias por cada valor, porcentajes, etc. La finalidad de las agrupaciones en frecuencias es facilitar la obtencin de la informacin que contienen los datos.Ejemplo: Quieren conocer si un grupo de individuos est a favor o en contra de la exhibicin de imgenes violentas por televisin, para lo cual han recogido los siguientes datos:

Media de tendencia central: Las medidas de tendencia central son valores que se ubican al centro de un conjunto de datos ordenados segn su magnitud. Generalmente se utilizan 4 de estos valores tambin conocidos como estadigrafos, la media aritmtica, la mediana, la moda y al rango medio.Distribucin de z : La distribucin de probabilidad conocida como distribucin normal es, por la cantidad de fenmenos que explica, la ms importante de las distribuciones estadsticas. A la distribucin normal tambin se la denomina con el nombre de campana de Gauss, pues al representar su funcin de probabilidad, sta tiene forma de campana.Distribucin de F: La necesidad de disponer de mtodos estadsticos para comparar las varianzas de dos poblaciones es evidente a partir del anlisis de una sola poblacin. Frecuentemente se desea comparar la precisin de un instrumento de medicin con la de otro, la estabilidad de un proceso de manufactura con la de otro o hasta la forma en que vara el procedimiento para calificar de un profesor universitario con la de otro.Distribucin T de student: La distribucin t de student (desarrollada porGosset) es , con la chi2 , la F de Snedecor, y , por supuesto,la normal, transcendental para aplicaciones inferenciales , en especial para aquellas en las que sedesconoce la varianza; dado que no depende de las varianzas de las variables que la integran.Su expresin formal parte de dos variables X e Y tales que : ede manera que siendo t una nueva distribucin conocida como t de student con n grados de libertad.La distribucin t de student . admite , tambien , una definicin alternativa , tomada como la distribucin marginal de la primera variable de una distribucin "normal-gamma" ; en este sentido la expresin de sufuncin de densidadvendra dada por : siendo n los grados de libertad que actuan de parmetro y la funcin gamma deEulerChi cuadrado. Esta prueba puede utilizarse incluso con datos medibles en una escala nominal. La hiptesis nula de la prueba Chi-cuadrado postula una distribucin de probabilidad totalmente especificada como el modelo matemtico de la poblacin que ha generado la muestra.Para realizar este contraste se disponen los datos en una tabla de frecuencias. Para cada valor o intervalo de valores se indica la frecuencia absoluta observada o emprica (Oi). A continuacin, y suponiendo que la hiptesis nula es cierta, se calculan para cada valor o intervalo de valores la frecuencia absoluta que cabra esperar o frecuencia esperada (Ei=npi , donde n es el tamao de la muestra y pi la probabilidad del i-simo valor o intervalo de valores segn la hiptesis nula). El estadstico de prueba se basa en las diferencias entre la Oi y Ei y se define como:

Limites de confianza: n el contexto de estimar un parmetro poblacional, un intervalo de confianza es un rango de valores (calculado en una muestra) en el cual se encuentra el verdadero valor del parmetro, con una probabilidad determinada.La probabilidad de que el verdadero valor del parmetro se encuentre en el intervalo construido se denominanivel de confianza, y se denota 1-. La probabilidad de equivocarnos se llamanivel de significanciay se simboliza. Generalmente se construyen intervalos con confianza 1-=95% (o significancia=5%). Menos frecuentes son los intervalos con=10% o=1%.Para construir un intervalo de confianza, se puede comprobar que la distribucin Normal Estndar cumple1:P(-1.96 < z < 1.96) = 0.95Diseo experimental: La experimentacin es una tcnica utilizada para encontrar el comportamiento de una variable a partir de diferentes combinaciones de factores o variables de entrada de un proceso, que al cambiar afectan la respuesta. Para entrar a experimentar es necesario pasar primero por el diseo de experimentos, esta tcnica busca la manipulacin sistemtica de las variables de entrada de un proceso para entender el efecto que estas pueden causar en la variable respuesta. Es ampliamente utilizado en las empresas debido a que stepermite visualizar situaciones que pueden suceder a partir de la realizacin de un proceso. En la industria se utiliza principalmente para buscar el mejoramiento del rendimiento de un proceso, para reducir la variabilidad y permitir que haya un mayor acercamiento a los parmetrosde la empresa, para reducir tiempos de procesamiento y reducir costos. Cualquier problema experimental incluye: diseo del experimento y anlisis de los datos.Error experimental: es la desviacin del valor medido de una magnitud fsica respecto al valor real de dicha magnitud. En general los errores experimentales son ineludibles y dependen bsicamente del procedimiento elegido y la tecnologa disponible para realizar la medicin.Exactitud: Un instrumento de medida es exacto si tiene la capacidad de describir el fenmeno sin sobrevalorarlo o subvalorarlo sistemticamente. Si un instrumento no es exacto, se dice que tiene sesgo. Un instrumento de medida exacto proporciona medidas exactas. Por ejemplo, un examen puede no rendir una medida exacta de los conocimientos de los alumnos si es extremadamente fcil o extremadamente difcil, en relacin al conocimiento que se quiere medir.Precisin: se denominaprecisina la capacidad de uninstrumentode dar el mismo resultado en mediciones diferentes realizadas en las mismas condiciones. Esta cualidad debe evaluarse a corto plazo. No debe confundirse conexactitudni conreproducibilidad.La precisin refleja la proximidad de distintas medidas entre s, y es funcin exclusiva de los errores accidentales.Repeticin: se denominan de esta forma a las unidades experimentales que reciben el mismo tratamiento de forma independiente.Aleatorizacin: es la asignacin aleatoria de los tratamientos a las unidades experimentales. Fisher sealo que la aleatorizacin permite obtener estimaciones vlidas de la varianza del error y fundamenta el uso de los mtodos estadsticos en el diseo de experimentos. Control local: son las acciones empleadas por elinvestigador para disminuir o controlar el error experimental TECNICA SELECCIN DE UNIDADES EXPERIMENTALES UNIFORMES BLOQUIZACION SELECCIN DEL DISEO EXPERIMENTAL ADECUADO UTILIZACION DE COVARIABLES.Tratamiento: Conjunto de condiciones experimentales que sern impuestas a una unidad experimental en un diseo elegido. En experimentos unifactoriales, un tratamiento corresponde a un nivel de factor. En experimentos multifactoriales, un tratamiento corresponde a la combinacin de niveles de factores.Unidad experimental: es la parte ms pequea de material experimental expuesta al tratamiento, independientemente de otras unidades.Efecto de borde: En los experimentos agrcolas, muchas veces existen diferencias en el crecimiento y la produccin de las plantas que estn situadas en los permetros de la parcela en relacin con aquellas plantas situadas en la parte central; esta diferencia es llamado efecto de borde y puede causar sobre-estimacin o sub-estimacin de las respuestas de los tratamientos, llegando con esto a comparaciones sesgadas entre ellos. El efecto de bordes puede ser causado por: - Vecindad de las parcelas reas no cultivadas, que hace que las plantas en los permetros tengan menor competencia de luz y nutrientes. - Competencia entre tratamientos, que depende de la naturaleza de los tratamientos vecinos. Para controlar el efecto de borde se acostumbra a evaluar solamente las plantas centrales para los fines experimentales. Estas plantas centrales constituyen lo que se llama PARCELA NETA EXPERIMENTAL.Varianza: Lavarianzaes lamedia aritmtica del cuadrado de las desviaciones respecto a la mediade una distribucin estadstica.La varianza se representa porDesviacin stndar: a desviacin estndar es un ndice numrico de la dispersin de un conjunto de datos (o poblacin). Mientras mayor es la desviacin estndar, mayor es la dispersin de la poblacin. La desviacin estndar es un promedio de las desviaciones individuales de cada observacin con respecto a la media de una distribucin. As, la desviacin estndar mide el grado de dispersin o variabilidad. En primer lugar, midiendo la diferencia entre cada valor del conjunto de datos y la media del conjunto de datos. Luego, sumando todas estas diferencias individuales para dar el total de todas las diferencias. Por ltimo, dividiendo el resultado por el nmero total de observaciones (normalmente representado por la letra n) para llegar a un promedio de las distancias entre cada observacin individual y la media. Este promedio de las distancias es la desviacin estndar y de esta manera representa dispersin. Formula Hiptesis: Es una proposicin que establece relaciones, entre los hechos; para otros es una posible solucin al problema; otros mas sustentan que la hiptesis no es mas otra cosa que una relacin entre las variables, y por ltimo, hay quienes afirman que es unmtodode comprobacin.La hiptesis como proposicin que establece relacin entre los hechos: una hiptesis es el establecimiento de un vnculo entre los hechos que el investigador va aclarando en la medida en que pueda generar explicaciones lgicas del porqu se produce este vnculo.P valor: Elp-valores una medida directa de lo verosmil que resulta obtener una muestra como la actual si es cierta H0. Los valores pequeos indican que es muy infrecuente obtener una muestra como la actual, en cambio, los valores altos que es frecuente. Elp-valorse emplea para indicar cunto (o cun poco) contradice la muestra actual la hiptesis alternativa.Grado de significancia:establece el lmite de la regin de rechazo, por tanto la hiptesis nula en un estudio se rechaza cuando el valor p asociado a la prueba estadstica utilizada para contrastar la hiptesis, es inferior al valor alfa establecido por el investigador (valor p < nivel de significancia).De lo que podemos inferir que valores altos de la significancia observada constituyen evidencia a favor de la hiptesis nula, valores bajitos apoyan la hiptesis alterna.Las dos siguientes medidas utilizan dos parmetros que ya nos son familiares: el rango y la desviacin; con el primero trabajamos en la construccin de intervalos de clase y con el segundo en la construccin de la varianza y de la desviacin absoluta media.Por ejemplo consideremos las dos siguientes muestras:Muestra 1: 0, 45, 50, 55, 100 (la media para este conjunto de datos la media y mediana es igual a 50)Muestra 2: 47, 49.5, 50, 51.5, 52 (la media para este conjunto de datos la media y mediana es igual a 50)Aunque ambas muestras tiene la misma media y mediana, su dispersin es diferente.DesviacinEl concepto de desviacin ya ha sido explotado para la construccin de la varianza y de la desviacin absoluta media. En realidad hemos podido constatar que hablar de una sola desviacin no tiene el mayor inters y que sin embargo la suma de los cuadrados de las desviaciones o diferencias, o valores absolutos de las diferencias, con respecto a la media nos ha llevado a la construccin de conceptos, la principal de estas desviaciones es la desviacin estndar.Coeficiente de variacin.Una de las medidas suficientemente til es la obtencin del coeficiente de variacin, el cual se define como el cociente entre la desviacin estndar y la media aritmtica, mostrando para bajos valores una alta concentracin de los datos. En el caso en que la media es igual a cero esta medida no esta definida, por lo que se recurre a cualquiera de las anteriores. Su expresin es dada por

dondeson la media y la desviacin estndar, respectivamente, para una misma poblacin.

Coeficiente de determinacin: El coeficiente de determinacin es una medida estadstica de la bondad del ajuste o fiabilidad del modelo estimado a los datos. Se representa por R2e indica cul es la proporcin de la variacin total en la variable dependiente (Y), que es explicada por el modelo de regresin estimado, es decir, mide la capacidad explicativa del modelo estimado.Rangos mltiplos: Croquis de campo: se utiliza para conducir experimentos en condiciones heterogneas donde las propiedades cambian en dos direcciones como en la toma de muestras. Esto se representa en un diseo experimental en campo.Bloques: Un bloque es (en Estadstica) un grupo de observaciones que tienen condicin de unicidad estadstica, esto es, que pueden y deben ser analizadas e interpretadas slo de modo conjunto.Parametros. Unparmetro estadsticoes unnmeroque se obtiene a partir delosdatosde unadistribucin estadstica.Losparmetros estadsticossirven para sintetizar la informacin dada por unatabla o por una grfica.Tipos de parmetros estadsticosHaytres tipos parmetros estadsticos:De centralizacin.De posicinDe dispersinFACTOR: es la variable independiente. Es la variable que manipula el investigador, para estudiar sus efectos sobre la variable dependiente.1. RegresionLa regresin es una tcnica estadstica utilizada para simular la relacin existente entre dos o ms variables. Por lo tanto se puede emplear para construir un modelo que permita predecir el comportamiento de una variable dada.

Correlacin:Es frecuente que estudiemos sobre una misma poblacin los valores de dos variables estadsticas distintas, con el fin de ver si existe alguna relacin entre ellas, es decir, si los cambios en una de ellas influyen en los valores de la otra. Si ocurre esto decimos que las variables estn correlacionadas o bien que hay correlacin entre ellas.Lacovarianzade una variable bidimensional es la media aritmtica de los productos de las desviaciones de cada una de las variables respecto a sus medias respectivas.Lacovarianzase representa porsxyoxy.