Unidad 1 Nueva Corre Gid A

15
 ESTADISTICA INFERENCI AL I UNIDAD I.- INTRODUC CION A LA ESTADISTICA INTRODUCCIÓN: La palabra "estadística" procede del latín statisticum collegium ("consejo de Estado") y de su derivado italiano statista ("hombre de Estado" o "político"). El término estadística es ampliamente escuchado en diversos sectores de la sociedad. Sin embargo desde los comienzos de la civilizacin han e!istido ormas sencillas de estadística# pues ya se utilizaban representaciones gr$icas y otros símbolos en pieles# rocas# pal os de mad era y pared es de cuevas para conta r el n%mero de personas# animales o ciertas cosas. El trabajo del e!perto estadístico no consiste ya slo en reunir y tabular los datos# sino sobre todo en el proceso de "interpretac in" de esa inormaci n. El desarrollo de la teoría de la probabilidad ha aumentado el alcance de las aplicaciones de la estadística. El sigu ient e trab ajo brin dar$ la ino rmac in necesar ia para aliment ar el con ocimi ent o acerca de la Estadística# su evolucin# etc. La Estadística es una disciplina &ue uti li za recursos matem$ticos  para orga niza r y res umi r una gra n canti dad de datos obte nid os de la real idad # e ine rir conc lusi ones respecto de ellos. 'or ejemplo# la estadística  interviene cuando se &uiere conocer el estado sanitario de un país# a través de ciertos par$metros como la tasa de morbilidad o mortalidad de la poblacin. En est e caso la estadíst ica desc ribe la muestra en términos de datos organizados y resumidos# y luego iniere conclusiones respecto de la poblacin.  plicada a la investiga cin cientíica# ta mb n in i er e cuan do prove e lo s medios matem$ticos para establecer si una hiptesis debe o no ser rechazada. La estadística puede aplicarse a cual&uier $mbito de la realidad# y por ello es utilizada en ísica#  &uímica# biología#  medicina#  astronomía # psicología #  sociología # lingística# demograía # etc. 1

description

g

Transcript of Unidad 1 Nueva Corre Gid A

ESTADISTICA INFERENCIAL IUNIDAD I.- INTRODUCCIN A LA ESTADSTICA INFERENCIAL.

INTRODUCCIN: La palabra "estadstica" procede del latn statisticum collegium ("consejo de Estado") y de su derivado italiano statista ("hombre de Estado" o "poltico").El trmino estadstica es ampliamente escuchado en diversos sectores de la sociedad. Sin embargo desde los comienzos de la civilizacin han existido formas sencillas de estadstica, pues ya se utilizaban representaciones grficas y otros smbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el nmero de personas, animales o ciertas cosas. El trabajo del experto estadstico no consiste ya slo en reunir y tabular los datos, sino sobre todo en el proceso de "interpretacin" de esa informacin. El desarrollo de la teora de la probabilidad ha aumentado el alcance de las aplicaciones de la estadstica. El siguiente trabajo brindar la informacin necesaria para alimentar el conocimiento acerca de la Estadstica, su evolucin, etc.La Estadstica es una disciplina que utiliza recursos matemticos para organizar y resumir una gran cantidad de datos obtenidos de la realidad, e inferir conclusiones respecto de ellos.Por ejemplo, la estadstica interviene cuando se quiere conocer el estado sanitario de un pas, a travs de ciertos parmetros como la tasa de morbilidad o mortalidad de la poblacin.En este caso la estadstica describe la muestra en trminos de datos organizados y resumidos, y luego infiere conclusiones respecto de la poblacin.Aplicada a la investigacin cientfica, tambin infiere cuando provee los medios matemticos para establecer si una hiptesis debe o no ser rechazada.La estadstica puede aplicarse a cualquier mbito de la realidad, y por ello es utilizada en fsica, qumica, biologa, medicina, astronoma, psicologa, sociologa, lingstica, demografa, etc.

UNIDAD I.- INTRODUCCION A LA ESTADISTICA 1.1 BREVE HISTORIA DE LA ESTADISTICA Hasta el comienzo del siglo XIX no se empieza a utilizar la palabra Estadstica en el sentido que le damos hoy da. En su origen, el trmino estadstica aparece ligado a la actividad gubernamental y el de estadstico con el de estadista o poltico. Ello se deba principalmente a que el primer yfundamental uso de la estadstica se realizaba por los gobernantes que deseaban conocer la extensin de sus dominios, la poblacin residente en ellos y la cantidad de impuestos que se podan planificar de la poblacin.Hasta 1850 la palabra "estadstica" se usaba en un sentido diferentedel actual, significando bsicamente informacin sobre estaos polticos. Tal informacin tenda a crecer rpidamente en cantidad y en extensin teniendo que adoptarse formas de recoger la informacin en tablas, cuadros, grficos y matrices. Se lleg as de manera natural a que la palabra estadstica significase todo el material surgido de la observacin del muno aceptndose este uso a partirdel siglo XIX. En la actualidad el trmino estadstica tiene un sentido ms amplio, y se refiere a la misma, como ciencia que estudia el comportamiento de los fenmenos de masas, no ocupndose de comportamientos individuales e incluyendo mtodos especiales de elaboracin. El Diccionario de la Lengua Espaola considera que el trmino Estadstica procede de estadista, esta voz de estado y estado e la palabra latina "status", o situacin en que una persona o cosa, y en especial cada uno de los sucesivos modos de ser de una persona o cosa, sujeta a cambios que influyen en su condicin. Se llega a dos acepciones: Como censo o recuento de la poblacin, de los recursos naturales e industriales, del trfico o de cualquier otra manifestacin de un estado, provincia, pueblo o conjunto. Estudio de los hechos morales o fsicos del mundo que se prestan a numeracin o recuento y a comparacin de las cifras referentes a ellos.Cuando se construyen estadsticas para comparar cifras, aparece de forma natural la existencia de valor medio, concepto que facilit un campo de investigacin a los Aritmticos polticos : Juan Graunt, Petty o Sssmilch.Los precursores de la Estadstica la intencin como una aritmtica de la poltica.

1.2- CONCEPTO DE LA ESTADSTICA 2. La Estadstica es una disciplina que utiliza recursos matemticos para organizar y resumir una gran cantidad de datos obtenidos de la realidad, e inferir conclusiones respecto de ellos. Tiene como propsito la descripcin del conjunto de datos colectados, as como la generalizacin y/o toma de decisiones acerca de las caractersticas de todas las observaciones potenciales bajo consideracin. En consecuencia nos permite organizar y resumir datos para poder realizar inferencias (conclusiones) relativas a los mismos. 3. La Estadstica es la ciencia cuyo objetivo es reunir una informacin cuantitativa concerniente a individuos, grupos, series de hechos, etc. y deducir de ello gracias al anlisis de estos datos unos significados precisos o unas previsiones para el futuro.

1.3- ESTADSTICA DESCRIPTIVA La estadstica Descriptiva es el mtodo de obtener de un conjunto de datos conclusiones sobre s mismos y no sobrepasan el conocimiento proporcionado por stos. Puede utilizarse para resumir o describir cualquier conjunto ya sea que se trate de una poblacin o de una muestra, cuando en la etapa preliminar de la Inferencia Estadstica se conocen los elementos de una muestra. La estadstica descriptiva trabaja con todos los individuos de la poblacin.As pues, si aplicamos las herramientas ofrecidas por la estadstica descriptiva a una muestra, solo nos limitaremos a describir los datos encontrados en dicha muestra, por lo que no se podr generalizar la informacin hacia la poblacin.

1.4- ESTADSTICA INFERENCIALLa estadstica inferencial, trabaja con muestras, subconjuntos formados por algunos individuos de la poblacin. A partir del estudio de la muestra se pretende inferir aspectos relevantes de toda la poblacin. Cmo se selecciona la muestra, cmo se realiza la inferencia, y qu grado de confianza se puede tener en ella. La Estadstica Inferencial investiga o analiza una poblacin partiendo de una muestra tomada. Es as que permite realizar conclusiones o inferencias, basndose en los datos simplificados y analizados de una muestra hacia la poblacin o universo.Para que stas generalizaciones sean vlidas la muestra deben ser representativa de la poblacin y la calidad de la informacin debe ser controlada, adems puesto que las conclusiones as extradas estn sujetas a errores, se tendr que especificar el riesgo o probabilidad que con que se pueden cometer esos errores.Por ejemplo, a partir de una muestra representativa tomada a los habitantes de una ciudad, se podr inferir la votacin de todos los ciudadanos que cumplan los requisitos con un error de aproximacin. En sus particularidades la Inferencia distingue la Estimacin (cuando se usan las caractersticas de la muestra para hacer inferencias sobre las caractersticas de la poblacin) y la Contrastacin de Hiptesis (cuando se usa la informacin de la muestra para responder a interrogantes sobre la poblacin).

1.5 BREVE INTRODUCCIN A LA INFERENCIA ESTADSTICA.La inferencia estadstica es el conjunto de mtodos y tcnicas que permiten inducir, a partir de la informacin emprica proporcionada por una muestra, cual es el comportamiento de una determinada poblacin con un riesgo de error medible en trminos de probabilidad.La inferencia estadstica estudia cmo sacar conclusiones generales para toda la poblacin a partir del estudio de una muestra, y el grado de fiabilidad o significacin de los resultados obtenidos.

Muestreo probabilsticoConsiste en elegir una muestra de una poblacin al azar. Podemos distinguir varios tipos de muestreo:

1. Muestreo aleatorio simple Para obtener una muestra, se numeran los elementos de la poblacin y se seleccionan al azar los (n) elementos que contiene la muestra.2. Muestreo aleatorio sistemtico Se elige un individuo al azar y a partir de l, a intervalos constantes, se eligen los dems hasta completar la muestra.3. Muestreo aleatorio estratificado Se divide la poblacin en clases o estratos y se escoge, aleatoriamente, un nmero de individuos de cada estrato proporcional al nmero de componentes de cada estrato.Estimacin de parmetros Los mtodos paramtricos de la inferencia estadstica se pueden dividir, bsicamente, en dos: mtodos de estimacin de parmetros y mtodos de contraste de hiptesis. Ambos mtodos se basan en el conocimiento terico de la distribucin de probabilidad del estadstico muestral que se utiliza como estimador de un parmetro.La estimacin de parmetros consiste en asignar un valor concreto al parmetro o parmetros que caracterizan la distribucin de probabilidad de la poblacin. Cuando se estima un parmetro poblacional, aunque el estimador que se utiliza posea todas las propiedades deseables, se comete un error de estimacin que es la diferencia entre la estimacin y el verdadero valor del parmetro. El error de estimacin es desconocido por lo cual es imposible saber en cada caso cual ha sido la magnitud o el signo del error; para valorar el grado de precisin asociado con una estimacin puntual se parte de dicha estimacin para construir un intervalo de confianzaSe refiere a los siguientes:1. Intervalo de confianza:Se llama as a un intervalo en el que sabemos que est un parmetro, con un nivel de confianza especfico. Un intervalo de confianza est formado por un conjunto de valores numricos tal que la probabilidad de que ste contenga al verdadero valor del parmetro puede fijarse tan grande como se quiera2. Nivel de confianza:Probabilidad de que el parmetro a estimar se encuentre en el intervalo de confianza.

3. Error de estimacin admisibleQue estar relacionado con el radio del intervalo de confianza.Los mtodos de contraste de hiptesis tienen como objetivo comprobar si determinado supuesto referido a un parmetro poblacional, o a parmetros anlogos de dos o ms poblaciones. Para cualquier hiptesis paramtrica, el contraste se basa en establecer un criterio de decisin, que depende en cada caso de la naturaleza de la poblacin, de la distribucin de probabilidad del estimador de dicho parmetro y del control que se desea fijar a priori sobre la probabilidad de rechazar la hiptesis contrastada en el caso de ser sta cierta.Existen dos tipos de hiptesis: 1. La hiptesis nula (Ho) es aquella que recoge el supuesto de que el parmetro toma un valor determinado y es la que soporta la carga de la prueba. La decisin de rechazar la hiptesis nula, que en principio se considera cierta, est en funcin de que sea o no compatible con la evidencia emprica contenida en la muestra.

2. La hiptesis alternativa (H1) suele presentar un cierto grado de indefinicin: si la hiptesis alternativa se formula simplemente como 'la hiptesis nula no es cierta', el contraste es bilateral o a dos colas; por el contrario cuando se indica el sentido de la diferencia, el contraste es unilateral o a una sola cola.1.6 TEORA DE DECISIN EN ESTADSTICA.Algunos de los problemas ms importantes de la inferencia estadstica se refieren a la evaluacin de los riesgos y las consecuencias que pueden ocurrir al hacer generalizaciones a partir de una muestra de datos. Esto incluye una estimacin de la probabilidad de tomar decisiones errneas, las posibilidades de hacer predicciones incorrectas. En los ltimos aos, se han hecho intentos de abordar todos estos problemas dentro del marco de referencia de una teora unificada llamada teora de decisin. Si bien esta teora tiene muchas ventajas conceptuales y tericas, plantea algunos problemas de aplicacin que son difciles de resolver. Para entenderlos debe comprenderse que, por muy objetivamente que se planee un experimento o investigacin, es imposible eliminar todos los elementos subjetivos. Un elemento de subjetividad interviene aun cuando definimos elementos como bueno o mejor con respecto a la razn de criterios de decisin (por ejemplo buscaremos una lnea recta que mejor se ajuste a un conjunto dado de pares ordenados de datos).La gran mayora de los mtodos que sern usados para plantear y resolver estos problemas pertenecen al enfoque clsico, ya que no toman en cuenta los varios factores subjetivos mencionados antes. Algunas otras aplicaciones pertenecen al enfoque Bayesiano, que consideran, informalmente al menos, algunos de estos factores subjetivos. La subjetividad influye mucho en la eleccin de los mtodos estadsticos o frmulas empleadas en una situacin especfica.1. Poblacin (o universo): Es la totalidad de elementos o cosas bajo consideracin.2. Una Muestra: Es la porcin de la poblacin que se selecciona para su anlisis.3. Un Parmetro: Es una medida de resumen que se calcula para describir una caracterstica de toda una poblacin.4. Una Estadstica: Es una medida de resumen que se calcula para describir una caracterstica de una sola muestra de la poblacin.5. Muestra aleatoria: Es una muestra elegida independientemente de todas las dems, con la misma probabilidad que cualquier otra y cuyos elementos estn elegidos independientemente unos de otros y con la misma probabilidad.

1.7 COMPONENTES PARA LA INVESTIGACIN ESTADSTICA El proceso de aplicacin de la estadstica implica una serie de pasos:1. Seleccin y determinacin de la poblacin (Finita.-Que puede ser listada o Infinita: Que no puede ser listada) o muestra y las caractersticas contenidas que se desean estudiar. En el caso de que se desee tomar una muestra, es necesario determinar el tamao de la misma y el tipo de muestreo a realizar (probabilstico o no probabilstico).

2. Obtencin de los datos o Censo . Esta puede ser realizada mediante la observacin directa de los elementos, la aplicacin de encuestas y entrevistas, y la realizacin de experimentos.

3. Clasificacin, tabulacin y organizacin de los datos. La clasificacin incluye el tratamiento de los datos considerados anmalos que pueden en un momento dado, falsear un anlisis de los indicadores estadsticos. La tabulacin implica el resumen de los datos en tablas y grficos estadsticos.4. Anlisis descriptivo de los datos. El anlisis se complementa con la obtencin de indicadores estadsticos como las medidas: de tendencia central, dispersin, posicin y forma.

5. Anlisis inferencial de los datos. Se aplican tcnicas de tratamiento de datos que involucran elementos probabilsticos que permiten inferir conclusiones de una muestra hacia la poblacin (opcional).6. Elaboracin de conclusiones. Se construye el informe final.

1.8 RECOLECCIN DE DATOS La recoleccin de datos se refiere al uso de una gran diversidad de tcnicas y herramientas que pueden ser utilizadas por el analista para desarrollar los sistemas de informacin, los cuales pueden ser 4 mtodos principales: la entrevista, la encuesta, el cuestionario y la observacin. Para la recoleccin de datos primarios en una investigacin cientfica se procede bsicamente por observacin.La observacin, deber ser el principal mtodo al hacer una recoleccin de datos tomando en cuenta que es una tcnica bsica en la iniciacin de cualquier actividad: La tarea de observar no puede reducirse a una mera percepcin pasiva de hechos, situaciones o cosas. Encuesta: Constituye el trmino medio entre la observacin y la experimentacin. En ella se pueden registrar situaciones que pueden ser observadas y en ausencia de poder recrear un experimento se cuestiona a la persona participante sobre ello. Por ello, se dice que la encuesta es un mtodo descriptivo con el que se pueden detectar ideas, necesidades, preferencias, hbitos de uso, etc.El cuestionario: Es un documento formado por un conjunto de preguntas que deben estar redactadas de forma coherente, y organizadas, secuenciadas y estructuradas de acuerdo con una determinada planificacin, con el fin de que sus respuestas nos puedan ofrecer toda la informacin que se precisa.La entrevista: pueden ser de tipo cientficas, cuya intencin es promover la investigacin sobre algn tema relacionado con la ciencia y que supone la obtencin de informacin en torno a la labor de un individuo o grupo para poder influir sobre las opiniones y sentimientos que la comunidad a la que vaya dirigida la entrevista tenga sobre ese tema.

1.9 ESTADSTICA PARAMTRICA La estadstica paramtrica es una rama de la estadstica inferencial que comprende los procedimientos estadsticos y de decisin que estn basados en las distribuciones de los datos reales. Estas son determinadas usando un nmero finito de parmetros. Esto es, por ejemplo, si conocemos que la altura de las personas sigue una distribucin normal, pero desconocemos cul es la media y la desviacin de dicha normal. La media y la desviacin tpica de la desviacin normal son los dos parmetros que queremos estimar. Cuando desconocemos totalmente que distribucin siguen nuestros datos entonces deberemos aplicar primero un test no paramtrico, que nos ayude a conocer primero la distribucin. 1. La muestra es una parte, generalmente pequea, que se toma del conjunto total para analizarla y hacer estudios que le permitan al investigador inferir o estimar las caractersticas de un problema. La persona interesada en resolver un problema no tiene siempre a la mano estimacin, por lo que debe conformarse con pequeos detalles, carentes de precisin, que le ayuden a tomar decisiones bajo riesgo.

2. Una poblacin es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales intentamos sacar conclusiones.

"Una poblacin es un conjunto de elementos que presentan una caracterstica comn".

El tamao que tiene una poblacin es un factor de suma importancia en el proceso de investigacin estadstica y en nuestro caso social, y este tamao vienen dados por el nmero de elementos que constituyen la poblacin, segn el nmero de elementos la poblacin puede ser finita o infinita. Cuando el nmero de elementos que integra la poblacin es muy grande, se puede considerar a esta como una poblacin infinita, por ejemplo; el conjunto de todos los nmeros positivos.Una poblacin finita es aquella que est formada por un limitado nmero de elementos, por ejemplo; el nmero de habitantes de una comarca.

La informacin o caractersticas que se encuentran en la muestra se llaman estimadores y sirven para deducir cmo son las caractersticas llamadas parmetros de la poblacin. Al investigador le puede interesar conocer de la poblacin, entre otras cosas, lo siguiente:

El valor medio. El grado de dispersin de los valores incluidos. La proporcin de una caracterstica. Si hay una causa que origina la variacin. El grado de influencia en las variables. Si las variaciones son aleatorias. La probabilidad de ocurrencia de un valor. Un valor fututo o un valor anterior. La diferencia entre dos o ms poblaciones.

1.10 EJERCICIOS 20.149.660.992.4130.2151.6165.7175.6195.8222.6

20.150.162.493.6132.6151.8165.7179.8196.7223.8

20.350.664.694.7134.9152.9165.9180.9197.8231.1

20.550.766.496.8136.3153.2166.1182.3198.9232.6

20.650.667.897.9138.9154.9166.2182.7199.6234.4

20.950.970.498.0139.0154.9166.4182.7200.0236.2

22.452.470.998.2140.0156.3166.6188.3201.6239.4

22.754.674.498.4142.6156.6167.4188.4203.3240.1

23.655.876.8100.2142.8157.8168.1188.6204.6242.0

23.955.976.9103.4146.9157.9168.4189.3204.7243.3

24.656.478.2104.2147.4158.4169.9190.1205.6250.1

27.856.978.4104.4147.8158.6170.0190.2205.8251.4

28.958.779.9106.9148.9159.1170.1190.3207.9252.6

30.158.880.6109.0148.9159.3171.2191.4208.9253.7

30.459.980.9111.0149.0160.2172.4191.6209.1261.7

30.460.082.4115.6149.6161.1172.5192.3209.2262.2

30.660.082.6122.0149.7161.2172.6193.6211.3270.0

31.660.489.7123.4149.9161.3173.4194.7211.4271.0

32.460.690.6126.6150.0162.4174.4194.8220.6281.2

47.960.892.8129.8151.0164.3175.3195.6221.7290.0

ESTADISTICA INFERENCIAL I UNIDAD I.- INTRODUCCION A LA ESTADISTICA

10

LRILiLsLRSFXFXdFdUFUIx-IF Ix-I(x-)F(x-)UFU

19.9520.050.050.052135735-120.4-2528.4-4-84103.852180.8510784.82226481.2216336

50.0550.180.180.153265.12083.2-90.3-2889.6-3-9673.7523605439.06174049.929288

80.1580.2110.2110.252195.21999.2-60.2-1264.2-2-4243.65916.651905.3240011.72484

110.25110.3140.3140.3513125.31628.9-30.1-391.3-1-1312.9167.7166.412163.33113

140.35140.4170.4170.4546A=155.47148.4000016.55761.3273.9012599.400

170.45170.5200.5200.5533185.56121.530.1993.313346.651539.452176.2271815.26133

200.55200.6230.6230.6516215.63449.660.2963.223276.7512285890.5694248.96464

230.65230.7260.7260.7512245.72948.490.31083.6336106.851282.211416.92137003.049108

260.75260.8290.8290.856275.81654.8120.4722.4424136.95821.718755.30112531.81696

20027769-3311-11011257.91022

Li = 20.01C= 30

14

MEDIA Mtodo clave

= 138.85

Mtodo corto

= 138.85

DESVIACIN ESTANDARMtodo corto

DESVIACIN MEDIA

MEDIANA

MODA