Material de Lectura
-
Upload
jose-sanchez-alarcon -
Category
Documents
-
view
29 -
download
1
description
Transcript of Material de Lectura
-
Estadstica
Responsable:
Lic. Jessica L. Oliva Gastulo
Chiclayo, Marzo 2014
-
Estadstica - Lic. Jessica Oliva G. Pgina | 2
ASPECTOS BSICOS DE LA ESTADSTICA Y
ORGANIZACIN DE DATOS
ETIMOLOGA DE LA PALABRA ESTADSTICA
La nocin de estadstica procedi primitivamente del vocablo estado, porque ha sido ocupacin
tradicional de todos los gobiernos de la civilizacin llevar registros de las poblaciones que dominaban
o gobernaban, entre eso registros se pueden mencionar: los nacimientos, las defunciones, los censos
poblacionales, cosechas, impuestos y muchas otras clases de cosas y actividades que eran y son de
importancia para un gobernante. Contar y medir estos hechos generan muchas clases de datos
numricos. Esta se ha convertido en un instrumento cotidiano de todos los tipos de profesionales que
se ponen en contacto con datos cuantitativos o extraen conclusiones de ellos. Tales tcnicos requieren
con urgencia familiarizarse con los principios bsicos de los mtodos estadsticos para poder evaluar
los informes numricos y otro gran cmulo de informacin para as evitar malos usos comunes de la
estadstica como lo es la generalizacin e inferencia que es bsica en el razonamiento estadstico. Los
estudiantes de diversas reas del conocimiento deberan tener un conocimiento prctico de los mtodos
estadsticos.
Son heterogneos los vocablos que se citan como antecedentes del trmino estadstica. Sin intentar ser
exhaustivos, pero si indagando para describir los de mayor mencin, se pueden nombrar los siguientes:
STATUS (latn), que significa situacin, posicin, estado.
STATERA (griego), que quiere decir balanza, ya que la estadstica mide o pesa hechos.
STAAT (alemn), que se refiere a estado como expresin de unidad poltica superior.
LA ESTADSTICA: Segn Allen (1996), Chao (1996), Yule y Kendal (1986) y Rivas Gonzlez
(1993) la estadstica es una ciencia (otros investigadores la consideran como un conjunto de mtodos)
que se encarga de la recoleccin, clasificacin, presentacin, organizacin, anlisis e interpretacin de
un conjunto de fenmenos, (naturales, econmicos, polticos o sociales) de manera metdica y
numrica, que permitan extraer conclusiones de un hecho, en un momento determinado y as poder
tomar decisiones valederas. De acuerdo con la definicin anterior la estadstica se encarga de la
recoleccin, clasificacin, anlisis e interpretacin de un conjunto de datos en una investigacin
determinada.
Segn, algunos investigadores la estadstica, es una rama de las matemticas que se ocupa de reunir,
organizar y analizar datos numricos y que ayuda a resolver problemas como el diseo de experimentos
y la toma de decisiones. Tambin, se puede decir que es una rama de las matemticas que utilizando un
conjunto de mtodos y tcnicas se encarga de la recoleccin, organizar, presentacin, analizar e
interpretacin de datos naturales, econmicos, polticas, sociales, etc., para presentar los resultados
obtenidos y sacar conclusiones vlidas basadas en dicho anlisis y as poder tomar una decisin. La
funcin principal de la estadstica es elaborar principios y mtodos que ayuden a tomar decisiones
frente a la incertidumbre. En realidad, muchos autores definen la estadstica actualmente como un
mtodo de toma de decisiones frente a la incertidumbre. La estadstica puede presentar conclusiones
referentes nicamente al grupo estudiado, o puede generalizarlas para grupos mayores.
-
Estadstica - Lic. Jessica Oliva G. Pgina | 3
El gran nmero de informacin estadstica que se ofrece al pblico, por una razn u otra, escapa al
entendimiento, y una incertidumbre colectiva radica en que porcin de la estadstica es buena y cual
es mala. Indudablemente, no se puede aceptar toda la informacin sin emitir crtica. Algunas veces,
conclusiones totalmente errneas se basan en datos fehacientes. Por ejemplo, en alguna ocasin cierto
alcalde afirm que la ciudad x era la ms sana de la nacin, ya que su ndice de mortalidad era el ms
bajo del pas. Aunque concordamos con su afirmacin de que ser sano significa no estar muerto, existen
otros factores que no se tomaron en consideracin: cmo la ciudad no tena hospital, sus habitantes
tenan que ser hospitalizados en otra ciudad y si el enfermo mora el fallecimiento se registraban en el
lugar donde ciertamente ocurri la muerte y no en la ciudad de origen del difunto. Los siguientes son
algunos de los otros casos errnea basada en datos estadsticos, en otra informacin que eran fidedigna:
la estadstica seala que hubo menos accidentes de aviacin en 1920 que 1990, por lo tanto, era ms
seguro volar en 1920 que 1990, anlisis estadstico errneo aunque la estadstica es verdad. Como
existen ms accidentes de automviles en el da que en la noche es ms seguro conducir de noche, otro
error al realizar tal afirmacin, como se puede observar no siempre con las estadsticas se pueden hacer
afirmaciones tomando en cuenta algunos datos estadsticos valederos, si antes no se analizan otras
variables relacionadas con las estadsticas.
Hay que hacer una explicacin antes de comenzar un estudio formal aplicando las tcnicas estadstica;
se pondr en claro que los procedimientos estadsticos acertado de un problema implican mucho ms
que hacer algunas observaciones en la elaboracin, realizar algunas operaciones y llegar a cierto tipo
de conclusiones. Existen muchas incgnitas en la elaboracin de un estudio estadstico tales como: la
forma en que se recolectan los datos y como se planifica una investigacin o es un estudio en su
totalidad, es de importancia primordial. Como en cualquiera otra ciencia, en la estadstica hay que tener
la precaucin adecuada en todo la fase de cualquiera investigacin, desde la concepcin y
planteamiento del problema, que algunas veces es el trabajo ms dificultoso, hasta la planificacin y
el diseo, pasando por las etapas de recoleccin, organizacin, tabulacin, anlisis e interpretacin de
los datos, si no se toman en cuenta estas etapas no se podr llegar a una conclusin til o valedera. En
trminos generales, ni siquiera un prolongado y elegante manejo matemtico o estadstico de los datos,
aun con el equipo de computacin ms costoso y sofisticado del mundo, pueden salvar los estudios o
experimentos mal diseado. En realidad, los estadsticos profesionales insisten en que hasta los estudios
de muestreo ms simple deben llevarse a cabo con estricto apego a reglas bien definidas; de tal forma
que, no existe una justificacin para llamar estadstico a un estudio que no se ajuste a estas normas.
Cuando coloquialmente se habla de estadstica, se suele pensar en una relacin de datos numricos
presentados de forma ordenada y sistemtica. Esta idea es la consecuencia del concepto popular que
existe sobre el trmino y que cada vez est ms extendido debido a la influencia de nuestro entorno, ya
que hoy da es casi imposible que cualquier medio de difusin, peridico, radio, televisin, etc., no nos
tope diariamente con cualquier tipo de informacin estadstica sobre accidentes de trfico, ndices de
crecimiento de poblacin, turismo, tendencias polticas, etc. La palabra estadstica ha sido
frecuentemente referida a la informacin cuantitativa o numrica. Tambin ha sido referida
ampliamente a los mtodos que tratan con la informacin. Sin embargo, esto debera aclararse y llamar
a la informacin datos estadsticos y a los mtodos utilizados para su recoleccin, tcnicas estadsticas.
Cuando un lector tiene pocos hechos numricos, puede utilizar la informacin numrica en su mxima
extensin sin perder mucho tiempo o pensar demasiado en analizar los hechos.
-
Estadstica - Lic. Jessica Oliva G. Pgina | 4
Ejemplo: Luis tiene 25 aos y Luisa tiene 18.
Un lector puede fcilmente interpretar la informacin anterior de muchas maneras diferentes. Por
ejemplo, Luis es un hombre joven de 25 aos de edad, pero es 5 aos mayor que Luisa; sin embargo,
cuando un lector tiene un gran volumen de hechos numricos, puede encontrar que la informacin le
es de poco valor, puesto que no puede interpretar la duda al mismo tiempo. Ejemplo, Luis tiene 25aos,
Luisa tiene18 aos, Mara tiene 16 aos, Jaime tiene 26 aos, Pedro tiene 19 aos, y as sucesivamente
hasta llegar al estudio de 1000 alumnos seleccionados en un momento determinado.
El gran volumen de informacin numrica origina la necesidad de mtodos sistemticos, los cuales
pueden ser utilizados para organizar, presentar, analizar e interpretar la informacin efectivamente. De
esta manera pueden extraerse conclusiones vlidas y tomarse decisiones razonables mediante el uso de
los mtodos. Los mtodos estadsticos son desarrollados primeramente para llenar esta necesidad.
Slo cuando nos introducimos en un mundo ms especfico como es el campo de la investigacin de
las Ciencias Sociales, Administracin, Contadura, Medicina, Biologa, Psicologa, etctera,
empezamos a percibir que la Estadstica no slo es algo ms, sino que se convierte en la nica
herramienta que, hoy por hoy, permite dar luz y obtener resultados, y por tanto beneficios, en cualquier
tipo de estudio, cuyos movimientos y relaciones, por su variabilidad intrnseca, no puedan ser abordadas
desde la perspectiva de las leyes deterministas. Podramos, desde un punto de vista ms amplio, definir
la estadstica como la ciencia que estudia cmo debe emplearse la informacin y cmo dar una gua de
accin en situaciones prcticas que entraan incertidumbre.
La Estadstica se ocupa de los mtodos y procedimientos para recoger, clasificar, resumir, hallar
regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea una causa
intrnseca de los mismos; as como de realizar inferencias a partir de ellos, con la finalidad de ayudar a
la toma de decisiones y en su caso formular predicciones. La estadstica puede ser definida como un
mtodo de investigacin de los fenmenos que se producen masivamente. Intenta establecer el enlace,
formacin o estructura de una serie, as como su desarrollo temporal o la relacin entre varios de estos
fenmenos; por consiguiente, su objetivo es el anlisis e interpretacin de los datos numricos. La
estadstica es una ciencia auxiliar moderna que facilita el estudio de datos masivos, para as sacar
conclusiones valederas y efectuar predicciones razonables de ellos; permitiendo una visin de conjunto
clara y de ms fcil apreciacin, as como describirlos y compararlos.
La Estadstica tambin es definida como parte de la matemtica que se ocupa del estudio, anlisis y
clasificacin de los datos recogidos en una experiencia, cuando los resultados de esta no son explicables
por una ley natural conocida, es decir, cuando del hecho estudiado no se tiene un conocimiento cierto,
o cuando el mismo fenmeno es aleatorio. Otras definiciones que se le da a la estadstica que es una
tcnica especial apta para el estudio cuantitativo de los fenmenos de masa o colectivos entendiendo
por tales aquellos fenmenos de masa, naturales, econmicos, sociales, etc., cuya medicin requiere
una masa de observaciones de otros fenmenos ms simples llamados individuales o particulares. En
una forma prctica, la estadstica proporciona los mtodos cientficos para la recopilacin,
-
Estadstica - Lic. Jessica Oliva G. Pgina | 5
organizacin, resumen, representacin y anlisis de datos o hechos, que se presten a una evaluacin
numrica; tales como: fenmenos sociales, econmicos, polticos, culturales, etc.
Ya que solo a travs del empleo de los mtodos estadsticos es posible el ordenamiento, clasificacin,
presentacin y estudio preciso de datos, hechos y ocurrencia masivas; que estn sujetas a la explicacin
de dicha ciencia, la cual permite un mejor entendimiento del estudio que se est realizando.
Se puede por tanto clasificar la Estadstica en descriptiva, cuando los resultados del anlisis no
pretenden ir ms all del conjunto de datos, e Inferencial cuando el objetivo del estudio es derivar las
conclusiones obtenidas a un conjunto de datos ms amplio.
RAMAS DE LA ESTADSTICA
ESTADSTICA DESCRIPTIVA: Describe, analiza y representa un grupo de datos utilizando
mtodos numricos y grficos que resumen y presentan la informacin contenida en ellos. Se puede
definirse como aquel mtodo que contiene la recoleccin, organizacin, presentacin y resumen de
una serie de datos. El mencionado resumen puede ser tabular, grfico o numrico. El anlisis que se
realiza se limita en s mismo a los datos recolectados y no se puede realizar inferencia alguna o
generalizacin alguna, acerca de la poblacin de donde provienen esos datos estadsticos.
Una de las ramas de la Estadstica ms accesible a la mayora de la poblacin es la Descriptiva. Esta
se dedica nica y exclusivamente al ordenamiento y tratamiento mecnico de la informacin para su
presentacin por medio de tablas y de representaciones grficas, as como de la obtencin de algunos
parmetros tiles para la explicacin de la informacin.
La Estadstica Descriptiva es la parte de la estadstica que conocemos desde los cursos de educacin
secundaria, que se ensea en los siguientes niveles y que, por lo general, no pasa a ser un anlisis ms
profundo de la informacin. Es un primer acercamiento a la informacin y, por esa misma razn, es la
manera de presentar la informacin ante cualquier lector, ya sea especialista o no. Sin embargo, lo
anterior no quiere decir que carezca de metodologa o algo similar, sino que, al contrario, por ser un
medio accesible a la mayora de la poblacin humana, resulta de suma importancia considerar para as
evitar malentendidos, tergiversaciones o errores.
La Estadstica Descriptiva analiza, estudia y describe a la totalidad de los individuos de una poblacin,
su finalidad es obtener informacin, analizarla, elaborarla y simplificarla lo necesario para que pueda
ser interpretada cmoda y rpidamente y, por tanto, pueda utilizarse eficazmente para el fin que se
desee.
El proceso que sigue la Estadstica Descriptiva para el estudio de una cierta poblacin consta de los
siguientes pasos:
Seleccin de caracteres dignos de ser estudiados.
Mediante encuesta o medicin, obtencin del valor de cada individuo en los caracteres
seleccionados.
Elaboracin de tablas de frecuencias, mediante la adecuada clasificacin de los individuos dentro
de cada carcter.
-
Estadstica - Lic. Jessica Oliva G. Pgina | 6
Representacin grfica de los resultados (elaboracin de grficos estadsticos).
Obtencin de parmetros estadsticos, nmeros que sintetizan los aspectos ms relevantes de una
distribucin estadstica.
Por ejemplo: si un investigador aplica un test de aptitud a un grupo de graduados de un instituto superior
recientemente contratados por una empresa; entre lo que puede hacer con las puntuaciones que resultan
del test valindose de la estadstica descriptiva, estn los aspectos siguientes: arreglar las puntuaciones
o clasificarlas de manera que con solo dar un vistazo a los datos se pueda obtener una imagen general
de los mismos, construir tablas, grficas y cuadros estadsticos para visualizar el comportamiento de
los datos o bien convertir las puntuaciones brutas en rangos o en percentiles para realizar
comparaciones, etc.
ESTADSTICA INFERENCIAL: Es aquella rama de la estadstica que apoyndose en el clculo de
probabilidades y a partir de datos mustrales, efecta estimaciones, decisiones, predicciones u otras
generalizaciones sobre un conjunto mayor de datos. Puede definirse como aquella rama de la estadstica
que hace posible la estimacin de una caracterstica de una poblacin o la toma de una decisin referente
a una poblacin, fundamentndose slo en los resultados de la muestra.
La Estadstica Inferencial, por otro lado, se refiere a la rama de la estadstica que trata de los procesos
inferenciales, la que a su vez vislumbra la teora de estimacin y prueba de hiptesis. Uno de los
primordiales aspectos de la inferencia estadstica es el proceso que radica en utilizar estadsticos
mustrales para adquirir conclusiones sobre los verdaderos parmetros de la poblacin.
Los requerimientos de los mtodos de la inferencia estadstica se originan de la necesidad del muestreo.
Al tornarse muy grande una poblacin, comnmente resulta demasiado costoso, prolongado en el tiempo
y complicado obtener informacin de la poblacin completa. Las decisiones con respecto a las
caractersticas de la poblacin se deben basar en la informacin contenida en una muestra de esa
poblacin. La teora de la probabilidad suministra l vnculo, determinando la probabilidad de que los
resultados provenientes de la muestra reflejen los resultados que se obtendran de la poblacin.
Se pueden observar con albor estas ideas en el ejemplo de una encuesta poltica. Si el encuestador desea
estimar el porcentaje de votos que un candidato obtendr en una eleccin especfica, no entrevistara a
cada uno de los millares (o inclusive millones) de votantes. Ms bien, seleccionara una muestra de los
votantes. Tomando como base el resultado de la muestra, obtendra conclusiones acerca de la poblacin
total de votantes. A estas conclusiones se les asociara un planteamiento de probabilidad que especfica
la esperanza o la confianza que se tiene de que los resultados de la muestra reflejen la verdadera conducta
de los votantes de toda la poblacin.
La fidelidad de cualquier estimacin tiene una importancia enorme. Esta precisin depende en gran parte
de la forma de tomar la muestra y de la atencin que se ponga en que esta muestra suministre una imagen
fiable de la poblacin, pero casi nunca la muestra representa la poblacin en toda su plenitud, y de ello
resultar un error muestral.
La Estadstica Inferencial complementa a la descriptiva y a travs de ella se puede inferir el
comportamiento de un grupo grande (poblacin) a partir del estudio de una pequea parte de esa
(muestra). La estadstica inferencial nos permite, entre otras cosas, analizar el comportamiento de los
-
Estadstica - Lic. Jessica Oliva G. Pgina | 7
mercados a partir de las tendencias de la oferta y de la demanda, y permite tambin visualizar el futuro
comportamiento de una empresa, permitiendo el anlisis de la eficiencia de las empresas. Tambin se
entiende por estadstica inferencial aquella que trata de los procesos inferenciales, la que a su vez
comprende la teora de estimacin y prueba de hiptesis. Esta, tambin provee conclusiones o inferencia,
en base a los datos simplificados y analizados; detectando las interrelaciones que puedan unirlos, las
leyes que los rigen y eliminando las influencias al azar; llegando ms all de las verificaciones fsicas
posibles. Basndose, en la muestra estudiada saca conclusiones, o sea, hace inferencia o induccin, en
cuanto al universo o poblacin, de donde se obtuvo dicha muestra. Para su estudio son necesarios
conocimientos ms profundos de la teora de probabilidades y anlisis matemticos, ya que parte de los
conocimientos resultantes en el proceso descriptivos, para deducir nuevos hechos o relaciones del
conjunto observado con otros conjuntos. Un ejemplo, en el cual se aplica la estadstica inferencial es en
la prediccin de los resultados de unas elecciones antes de que haya concluido el recuento de votos.
FINALIDAD DE LA ESTADSTICA
La estadstica es una ciencia o mtodo cientfico que en la actualidad es considerada como un poderoso
auxiliar en las investigaciones cientficas, que le permite a sta aprovechar el material cuantitativo. No
existen ciencias cuyos fenmenos no puedan ser tratados estadsticamente; por tal razn, la estadstica
la denominan algunos investigadores (Rivas Gonzlez) como el lenguaje cientfico. La misma es
indispensable en la formacin de cualquier profesional universitario o tcnico medio, ya que, por medio
de esta se pueden realizar diagnsticos de cualquiera investigacin que se desee realizar. Esta es
indispensable para realizar cualquier trabajo de investigacin que requiera una recoleccin de
informacin. Ella permite resumir los resultados de una investigacin en una forma significativa y
cmoda. La misma permite deducir conclusiones generales y as afirmar hasta donde se puede ampliar
una generalizacin de una investigacin determinada. De la misma forma permite predecir qu suceder
algo tomando en cuenta ciertas condiciones que se han analizado con datos anteriores.
En las ciencias sociales, administrativas, polticas, medicas, en educacin y en otras ciencias permite
analizar algunos de los factores casuales en sucesos complejos y que de alguna manera confundiran a
un investigador determinado. De acuerdo a lo antes planteado los mtodos estadsticos son por lo tanto
los compaeros constantes de los que realizan investigacin. La estadstica y su aplicacin, ha avanzado
de tal forma en los ltimos aos, que hoy da se ha hecho imprescindible en todas las investigaciones
cientficas sea cual fuere el carcter de esta ltima.
LA ESTADSTICA EN NUESTROS DAS
Hoy en da, la estadstica se ha convertido en un mtodo efectivo para describir con exactitud los valores
de datos econmicos, polticos, sociales, psicolgicos, biolgicos o fsicos, y sirve como herramienta
para relacionar y analizar dichos datos. El trabajo del experto estadstico no consiste ya slo en reunir
y tabular los datos, sino sobre todo en el proceso de interpretacin de esa informacin. El desarrollo
de la teora de la probabilidad ha aumentado el alcance de las aplicaciones de la estadstica. La
Probabilidad, es una rama de las matemticas que se ocupa de medir o determinar cuantitativamente la
posibilidad de que ocurra un determinado suceso. La probabilidad est basada en el estudio de la
combinatoria y es fundamento necesario de la estadstica. Numerosas colecciones de datos se pueden
aproximar con gran exactitud, utilizando determinadas distribuciones probabilsticas; los resultados de
stas se pueden utilizar para analizar datos estadsticos. La probabilidad es til para comprobar la
-
Estadstica - Lic. Jessica Oliva G. Pgina | 8
fiabilidad de las inferencias estadsticas y para predecir el tipo y la cantidad de datos necesarios en un
determinado estudio estadstico. En la actualidad la estadstica ha alcanzado tal grado de
perfeccionamiento y especializacin, que podra decirse, que no existe disciplina cientfica en la cual
no se apliquen los mtodos estadsticos como herramienta indispensable para iniciar cualquiera
investigacin de envergadura.
Todo lo que hasta apartadamente tiene que ver con la recoleccin, procesamiento, anlisis e
interpretacin de datos numricos pertenece al dominio de la estadstica, comprende, por ejemplo, el
clculo del aumento, en promedio, de las utilidades de una importante compaa de ventas de artculos
por Internet los ltimos tres aos; la recoleccin y presentacin anual de la deuda a corto plazo de tres
compaas de electricidad, as como un porcentaje de su deuda a largo plazo; la evaluacin de la eficacia
de dos diferentes programas de computacin, destinado reducir el nmero de accidentes personales en
una empresa, el tiempo perdido en trabajo de alto riesgo; y el anlisis de las variaciones que ocurren de
cuando en cuando en serie de datos econmicos, ventas al menudeo, precios al consumidor y al
mayoristas, y distribucin de dinero, precios de productos comunes, productividad del sector agrcola,
etctera.
La palabra estadstica, por s sola se utiliza en varias formas. En un contexto, significa un conjunto de
datos como los que se pueden encontrar en las pginas financieras de los diarios o en los compendios
estadsticos. Pero, en otro mbito, se refiere a la totalidad de los mtodos que se aplican en la
recoleccin, organizacin, presentacin, anlisis e interpretacin de cualquier tipo de datos. En este
ltimo sentido, la estadstica es una rama de las matemticas aplicadas, y es este campo de las
matemticas el que constituye el tema central de este curso.
Una de las manifestaciones ms comentado en los ltimos aos del pasado siglo y del presente milenio,
ha sido el desarrollo de mtodos y conceptos estadsticos. Durante muchos aos, a la estadstica le
concernan principalmente la recoleccin de datos y su presentacin en tablas y grfica; hoy da ha
evolucionado hasta el punto en que su impacto se percibe en casi todas las reas de trabajo del ser
humano. Esto es debido a que la estadstica posmoderna est relacionada directamente con el problema
de la toma decisiones en condiciones de incertidumbre. Sin necesidad de entrar en detalles, existen
elementos de incertidumbre en casi todo lo que el ser humano realiza actualmente.
La caracterstica ms trascendental del reciente avance de la estadstica ha sido el cambio de los
mtodos meramente descriptivo por otros que sirven para hacer generalizaciones o, dicho lo otra
manera, un cambio de la estadstica descriptiva a la deductiva o inferencia estadstica. Por estadstica
descriptiva se entiende a cualquier tratamiento de datos que este diseado para ser resumido o describir
algunas de sus propiedades ms importantes sin intentar deducir nada que escape al alcance de los
datos. Por ejemplo, si un gobierno informa, con base a un censo, que la poblacin del pas fue de 27
millones de habitantes, esto pertenece al campo de estadstica descriptiva. Este sera tambin el caso si
calculamos el crecimiento % correspondiente de una dcada a la siguiente. Sin embargo; ste no sera
el caso si empleramos tales datos para percibir la poblacin del pas en tres aos ms o el crecimiento
porcentual en una dcada.
-
Estadstica - Lic. Jessica Oliva G. Pgina | 9
La Estadstica Descriptiva es una rama importante de la estadstica y se siguen empleando ampliamente
en el rea comercial y en otras reas de la actividad administrativa. Sin embargo, en la mayor parte de
los casos, la informacin estadstica surge de muestras, de observaciones realizadas slo en algunos
elementos de un conjunto grande, o de la observacin de acontecimientos pasados. El tiempo, el costo
o la imposibilidad de hacer lo contrario suele requerir un procedimiento de este tipo, aunque nuestro
inters real yace en todo el conjunto de elementos de los cuales provino la muestra y los
acontecimientos futuros, no en el pasado. Las generalizaciones de cualquier tipo escapan al contenido
de la estadstica descriptiva; se nos induce al uso de la diferencia estadstica para resolver muchos
problemas de operaciones cotidianas y para la elaboracin de planes a corto y largo plazo. Por Ejemplo
los mtodos de la inferencia estadstica son necesarios para decidir si un lote grande de acumuladores
de nueve voltios para equipos de sonido cumplen en promedio con la vida til garantizada por el
fabricante; para determinar la dosis mnima eficaz y la mxima seguridad de un nuevo medicamento
anti-inflamatorio en el tratamiento de inflamaciones locales dolorosa, o bien para estimar la demanda
de nuevas cauchos para vehculos rsticos en la poca de lluvia.
No obstante, siempre que se haga una inferencia estadstica (una generalizacin que escape a los lmites
de nuestras observaciones) se debe proceder con mucha precaucin. De hecho, hay que considerar
concienzudamente si resulta posible hacer algunas generalizaciones vlidas del todo y, si lo es, hasta
donde se puede generalizar. Sin embargo, algunas veces aunque se actu cautelosamente al generalizar,
se puede errar por completo en las generalizaciones y encontrarse con algunas dificultades. En realidad,
uno de los problemas bsicos de la inferencia estadstica es el de la apreciacin de los riesgos que
representa hacer generalizaciones equivocadas y quizs hacer algo incorrecto, tomando como base los
datos analizados de una muestra. El hecho de que aqu se solicite que se preste atencin a los errores
estadsticos puede parecer una manera negativa de dar comienzo a un estudio pero, en realidad, la
constante advertencia de que existe la posibilidad de hacer conclusiones y acciones equivocadas, y el
deseo de controlarla, permiten dirigir correctamente el curso de la investigacin en estadstica. La
realidad es dura e inflexible y se debe enfrentar en sus propios trminos. Se vive hoy, en un mundo
lleno de incgnitas y no existe manera de eliminar por completo los riesgos de tomar decisiones
equivocadas. Siendo ste el caso, el verdadero problema no consiste ahora en cmo eliminarlos, sino
como vivir con ellos de manera inteligente. Cuanto ms pronto se comprenda esto, ms seguros se
estar y tanto mejo se entender por qu la estadstica es una disciplina que vale la pena estudiarla.
Una de las razones principales para estudiar estadstica es que se consagra en forma directa al problema
universal de cmo tomar decisiones inteligentes en condiciones de incertidumbre o bien, en forma ms
breve, al problema de la toma de decisiones con incertidumbre lo cual es muy comn para aquel
profesional de la contadura o administracin comercial.
EL PAPEL DE LA ESTADSTICA EN LA CIENCIA
La importancia de la estadstica en la ingeniera, la ciencia y la administracin ha sido subrayada por
la participacin de la industria en el aumento de la calidad. Muchas compaas se han dado cuenta de
que la baja calidad de un producto (ya sea en la forma de defectos de fabricacin, en una baja
confiabilidad en su rendimiento, o en ambos), tiene un efecto muy pronunciado en la productividad
global de la compaa, en el mercado y la posicin competitiva y, finalmente, en la rentabilidad de la
empresa. Mejorar estos aspectos de la calidad puede eliminar el desperdicio; disminuir la cantidad de
material de desecho, la necesidad de volver a maquilar piezas, los requerimientos para inspeccin y
-
Estadstica - Lic. Jessica Oliva G. Pgina | 10
prueba y las prdidas de garanta; adems de mejorar la satisfaccin del consumidor y permitir que la
empresa se convierta en un productor de alta calidad y bajo costo en el mercado. La estadstica es un
elemento decisivo en el incremento de la calidad, ya que las tcnicas estadsticas pueden emplearse
para describir y comprender la variabilidad.
Virtualmente todos los procesos y sistemas de la vida real exhiben variabilidad. Por ejemplo, considere
la situacin donde, de un proceso de maquinado, se seleccionan varios componentes del motor de una
aeronave y se mide la altura de la turbina del propulsor de cada parte. Si el instrumento de medicin
tiene una resolucin suficiente, la altura de cada turbina ser diferente; esto es, habr variabilidad en la
dimensin. Otro ejemplo: si se cuenta el nmero de defectos en los gabinetes para computadoras
personales, se encontrar cierta variabilidad en los conteos, ya que algunos gabinetes tendrn pocos
defectos, mientras que otros tendrn muchos. Esta nocin de variabilidad se extiende a todos los
ambientes. Existe variabilidad en el espesor del recubrimiento de xido en las pastillas de silicio, en el
rendimiento por hora de un proceso qumico, en el nmero de errores en los dibujos de ingeniera y en
el tiempo necesario para ensamblar el motor de un automvil.
Por qu se presenta variabilidad? En general, la variabilidad es el resultado de cambios en las
condiciones bajo las que se hacen las observaciones. En el contexto de la manufactura, estos cambios
pueden ser diferencias en las propiedades de los materiales utilizados, en la forma en que trabajan los
obreros, en las variables del proceso (tales como la temperatura, la presin o el tiempo de ocupacin)
y en factores ambientales (como la humedad relativa). La variabilidad tambin se presenta debido al
sistema de medicin utilizado. Por ejemplo, la medicin obtenida a partir de una escala puede depender
del lugar del panel en que se coloque el objeto que se ha de medir.
El campo de la estadstica y la probabilidad consiste de mtodos tanto para describir y modelar la
variabilidad, como para tomar decisiones en presencia de sta. En la Estadstica Inferencial lo que se
desea hacer es tomar una decisin acerca de una poblacin en particular. El trmino poblacin se refiere
a la recoleccin de mediciones de todos los elementos del universo con respecto al cual se quieren
obtener conclusiones o tomar decisiones. En la mayora de las aplicaciones de la estadstica, los datos
disponibles consisten de una muestra de la poblacin de inters. Esta muestra es slo un subconjunto
de observaciones seleccionadas de una poblacin.
El campo de la Estadstica Inferencial se ha desarrollado principalmente desde comienzos de este siglo.
Es resultado de los mtodos para organizar y resumir datos, cuyos orgenes se remontan a varios siglos
atrs. Estos mtodos para resumir y organizar datos se denominan Estadstica Descriptiva. La mayor
parte del uso moderno de la estadstica, particularmente en la ciencia y la ingeniera, se dirige ms hacia
la inferencia que a la descriptiva. Por ejemplo, un ingeniero que disea un nuevo circuito de
computadora fabricar una muestra (prototipo) de ellos, y entonces querr conclusiones sobre la forma
en que estos dispositivos funcionarn una vez que se produzcan a gran escala.
Las computadoras y la estadstica
La computadora se ha convertido en una herramienta importante en la presentacin y el anlisis de
datos. Si bien muchas tcnicas estadsticas slo necesitan una calcula de mano, cuyo empleo consume
-
Estadstica - Lic. Jessica Oliva G. Pgina | 11
mucho tiempo y esfuerzo, la computadora realiza las tareas con mucha mayor eficiencia. La mayor
parte del anlisis estadstico se realiza utilizando una biblioteca de programas estadsticos. El usuario
introduce los datos y luego selecciona los tipos de anlisis y la presentacin de los resultados que le
interesan. 1
CONCEPTO BSICOS
POBLACIN: En estadstica el concepto de poblacin va ms all de lo que comnmente se
conoce como tal. En trminos estadsticos, poblacin es un conjunto finito o infinito de personas,
animales o cosas que presentan caractersticas comunes, sobre los cuales se quiere efectuar un estudio
determinado. En otras palabras, la poblacin se define como la totalidad de los valores posibles
(mediciones o conteos) de una caracterstica particular de un grupo especificado de personas, animales
o cosas que se desean estudiar en un momento determinado. As, se puede hablar de la poblacin de
habitantes de un pas, de la poblacin de estudiantes universitarios del Departamento de Lambayeque,
de la poblacin de casas de la Urbanizacin Las Brisas de la ciudad de Chiclayo, el nmero de carros
marca Toyota de la ciudad de Lambayeque, la estatura de un grupo alumnos de la USAT, la talla, etc.
La poblacin es el conjunto formado por todos los valores posibles que puede asumir la variable objeto
de estudio, ya que constituye la totalidad del grupo que se quiere estudiar los que van a poseer una
caracterstica de ese grupo especfico de individuos, animales o cosas. Es la coleccin de todos los
elementos que se estn estudiando, acerca de los cuales se intenta sacar conclusiones, el cual puede
ser un conjunto finito o infinito de personas, animales o cosas que presentan caractersticas comunes.
As por ejemplo, en un estudio sobre la preferencia de los electores que participaran en una eleccin
presidencial, la poblacin consiste en todos los participantes registrados para votar en ese proceso.
Pero el trmino no slo est asociado a la coleccin de seres humanos y organismos, tambin pueden
ser cosas no vivientes tales como: el estudio de mercado que se realiza para determinar las ventas
anuales de los supermercados de una zona determinada de una ciudad, luego, las ventas anuales de
todos los supermercados constituyen as mismo la poblacin.
MUESTRA: La muestra es un subconjunto de la poblacin, seleccionado de tal forma, que sea
representativo de la poblacin en estudio, obtenindose con el fin de investigar alguna o algunas de
las propiedades de la poblacin de la cual procede. En otras palabras es una parte de la poblacin que
sirve para representarla. Es una parte o porcin extrada de un conjunto por mtodos que permiten
considerarla como representativa del mismo. Entonces, una muestra no es ms que una parte de la
poblacin que sirve para representarla. La muestra debe obtenerse de la poblacin que se desea
estudiar; una muestra debe ser definida sobre la base de la poblacin determinada, y las conclusiones
que se obtengan de dicha muestra slo podrn referirse a la poblacin en referencia.
La muestra debe ser representativa ya que debe contener las caractersticas relevantes de la poblacin
en las mismas proporciones en que estn incluidas en tal poblacin, es decir, contiene las caractersticas
ms importantes de esa coleccin de elementos que representan la poblacin bajo estudio, a fin de
investigar alguna o algunas de las propiedades de la poblacin de la cual procede; y las conclusiones
que se obtengan de dicha muestra slo podrn referirse a la poblacin en referencia.
1 Douglas C. Montgomery, George C. Runger: Probabilidad y Estadstica aplicadas a la Ingeniera
-
Estadstica - Lic. Jessica Oliva G. Pgina | 12
La muestra es el elemento bsico sobre el cual se fundamenta la posterior inferencia acerca de la
poblacin de donde se ha tomado. Por ello, su escogencia y seleccin debe hacerse siguiendo ciertos
procedimientos o parmetros que son indispensables, es decir, se selecciona de acuerdo con una regla
o plan definido. En estadstica, en vez de estudiar las poblaciones en su totalidad, se acude al recurso
de considerar solamente una parte de ella, a la cual se le denomina muestra. Por lo tanto, una muestra
es una parte de la poblacin, seleccionada de acuerdo con una regla o plan definido.
MUESTREO: Es el procedimiento mediante el cual se obtiene una o ms muestras de una
poblacin determinada. Existen dos tipos de muestreos a saber:
Muestreo no Probabilstico: Es aquel en el cual se toma la muestra segn el criterio del investigador,
estos pueden ser: muestreo intencional u opintico y el muestreo sin norma o circunstancial.
Muestreo Probabilstico: Es aquel que se selecciona utilizando mtodos aleatorios en los que se
utilizan las probabilidades matemticas. Entre estos se pueden mencionar: Muestreo aleatorio simple,
muestreo estratificado, muestreo por conglomerado o por rea y muestreo sistemtico.
UNIDAD DE ANLISIS: es el objeto o elemento indivisible que ser estudiado en una poblacin,
sobre los cuales se van a obtener datos. Es el que genera el fenmeno estudiado y proporciona datos
concretos.
DATO: es el valor o respuesta que adquiere la variable en cada unidad de anlisis. Es el resultado
de la observacin, entrevista o recopilacin en general. Son la materia prima de la estadstica. Es el
elemento primario de toda observacin o bsqueda.
VARIABLES: Las variables son magnitud que puede tener un valor cualquiera de los
comprendidos en un conjunto de valores de un estudio o investigacin determinada. Son todos aquellos
datos u observaciones que pueden ser expresados mediante nmeros, es decir, son caractersticas de
una poblacin determinada, susceptible de medicin. Son caractersticas que pueden ser observadas
en determinado fenmeno natural, social, econmico, poltico etc. Las mismas son susceptibles de
adoptar distintos valores o ser expresadas en varias categoras. Existen muchas definiciones de
variables, entre las cuales tenemos:
Son aquellos datos u observaciones que pueden ser expresados cuantitativamente, es decir, son
caractersticas de una poblacin especfica, en las cuales se realiza una investigacin en un momento
dado. Las variables por lo general se representan con letras maysculas y sus valores particulares con
minsculas, es decir, si se hace referencia a los salarios devengados por un grupo de trabajadores la
variable salario estara representado por una letra mayscula, en este caso Xi y varios salarios de
diferentes trabajadores en particular, estaran representados con la letra minscula correspondiente,
as: x1 = 180.000, x2 = 190.000, x3 = 480.00, etctera.
Es aquella caracterstica de una poblacin que puede tomar diferentes valores en un estudio
determinado. Son smbolos tal como X, Y, Z, A, B, etc., que puede tomar un valor cualquiera de una
caracterstica especificada de un estudio determinado. Por ejemplo, la estatura de las personas, la talla
de un grupo de trabajadores petroleros, la edad de un conjunto de estudiantes universitarios, el ndice
acadmico de los estudiantes de la USAT, son variables. En otras palabras, una variable es una funcin
que asocia a cada elemento de la poblacin la medicin de una caracterstica, particularmente de aquella
que se desea observar.
-
Estadstica - Lic. Jessica Oliva G. Pgina | 13
TIPO DE VARIABLES
Cualitativa o de Atributos: Cuando expresan una cualidad, caracterstica o atributo, tienen un
carcter cualitativo, sus datos se expresan mediante una palabra, es no numrico, por lo tanto
las operaciones aritmticas, como sumar y obtener promedios, no son significativas. Cuando la
informacin es cualitativa, generalmente interesa saber cuntas o qu proporcin entra en cada
categora.
Ejemplos: sexo, nacionalidad, marcas de auto, grado de satisfaccin con la universidad, causas
de accidentes, lugar de nacimiento, estado civil, etc.
Cuantitativa o Numrica: Cuando el valor de la variable se expresa por una cantidad, es de
carcter numrico. El dato o valor puede resultar de la operacin de contar o medir, por lo tanto
las operaciones aritmticas, como sumar y obtener promedios, son significativas.
Ejemplos: Nmero de hijos, kilmetros recorridos, tiempo de vuelo, la velocidad de las
embarcaciones, etc.
Las variables cuantitativas se pueden clasificar a su vez en discretas o continuas.
- Cuantitativas Discretas: cuando el valor de la variable resulta de la operacin de contar,
su valor est dado slo por nmeros (enteros positivos).
Ejemplos: cantidad de materias aprobadas, nmero hijos, nmero de computadoras, etc.
- Cuantitativas Continuas: cuando la variable es susceptible de medirse, es toda variable
cuyo valor se obtiene por medicin o comparacin con una unidad o patrn de medida.
Puede asumir cualquier valor dentro del rango de medicin, por tanto se expresa en
cualquier nmero real. Normalmente se miden magnitudes como ser longitud, superficie,
volumen, peso, tiempo, dinero.
Ejemplos: peso al nacer, tiempo de servicios, horas trabajadas, ingreso mensual,
temperatura, etc.
MEDICIN: La asignacin o magnitud que se aplica a las categoras o clases de acuerdo a ciertas
reglas o smbolos. Consiste en la recopilacin de datos y su utilizacin mediante el empleo de una serie
de normas de tipo estadstico; es la representacin simblica de un dato o serie de datos obtenidos por
algn tipo de observacin.
ESCALAS DE MEDICIN DE LAS VARIABLES
Una escala de medicin es una asignacin de valores numricos a las caractersticas de una muestra
o una poblacin, se mide bsicamente en proporcin de escala. Las escalas de medicin son el
conjunto de los posibles valores que determinada variable puede tomar. Por tal razn, los tipos de
escala de medicin estn ntimamente ligados con los tipos de variables a estudiar. Las magnitudes
de las observaciones cuantitativas se conocen como los valores que una variable puede asumir.
Consiste entonces, en una serie de graduaciones que permiten darle un valor numrico a las
caractersticas que estamos midiendo; para hacer ms comprensible y que adquiera un significado
mediante un arreglo ordenado para establecer un anlisis estadstico. Son denominaciones o
clasificaciones de individuos o caractersticas. Las escalas de medicin es el alma fundamental de
toda investigacin Cientfica, puesto que, slo a travs de ellas es como se pueden calibrar los
fenmenos, sus relaciones, entre otros.
-
Estadstica - Lic. Jessica Oliva G. Pgina | 14
Se refieren habitualmente a las asignaciones de nmeros a observaciones, de una forma tal que los
nmeros sean susceptibles de anlisis por medio de manipulaciones u operaciones; estas escalas
permiten asignarle un valor numrico a las caractersticas que se estn midiendo. Por lo general
proceden de las medidas de una o ms variables. Dependiendo de la medicin y de la esencia de
las variables, se obtienen diversas clases de datos que originan diferentes escalas. Resulta
intensamente conocer el tipo de escala que representan los datos, debido a que, de su esencia
dependen las tcnicas estadsticas que se debern aplicar para su anlisis. Para lograr estadsticas
confiables hay que manipular cuantiosos datos estadsticos, los cuales poseen determinadas
caractersticas.
Por ejemplo, si los datos son alumnos, entre algunas de ellos se puede sealar el peso, la estatura,
el sexo, el rendimiento acadmico, entre otros. Al elaborar estadsticas con datos y su caracterstica
es necesario contarlas, jerarquizarlas y medirlas, es por ello que, se utilizan las escalas de medicin
como el proceso de asignar nmeros o establecer una correspondencia uno a uno entre objetivos y
observaciones.
Las escalas de medicin se clasifican de la siguiente forma: Escala Nominal, Escala Ordinal,
Escala de Intervalos y Escalas de razn o Proporcin.
Escala de Medicin Nominal: Es aquella en la que los nmeros slo se emplean para
diferenciar los objetos de distintas categoras o cuando se emplean nombres. Se dice que los
datos que se obtienen para una variable cualitativa se miden en una escala nominal. Si los datos
observados simplemente se clasifican en distintas categoras que no implican orden, se tiene un
nivel de medicin nominal. Ejemplos de nmeros, esta caracterstica son las que usan los
jugadores de bisbol, los nmeros telefnicos, los nmeros de las Cedulas de Identidad,
etctera. Se usa una escala nominal cuando se distribuyen conjuntos de objetos, personas o
caractersticas entre dos o ms categoras. La Escala Nominal se utiliza como medida de
identidad. Los nmeros pueden servir como indicativos o etiquetas para identificar objetos o
clases, pues se usa cuando un objeto se diferencia de otro solamente por la nominacin con que
se conoce. La escala nominal es la forma ms dbil de medicin porque no se puede intentar
el conteo de las diferencias dentro de una categora determinada o especificar cualquier orden
o direccin a lo largo de las diversas categoras. Sin embargo, no se intenta medir diferencias
entre los valores clasificados dentro de una categora determinada.
Propiedades de la escala Nominal
1. No intervienen mediciones, ni escala, en vez de esto solo hay cuentas o conteos.
2. Esta escala es considerada excluyente, es decir que la persona u objeto se incluye solamente
en una categora.
3. No existe un orden especfico para esta categora.
4. No presentan el cero.
5. No se basa en diferencia cuantitativa.
6. Los elementos de una categora deben de ser equivalentes, idnticos.
Ejemplos:
Una muestra de personas puede clasificarse con base en la religin profesada:
-
Estadstica - Lic. Jessica Oliva G. Pgina | 15
(1) Cristianos;
(2) Judos;
(3) Musulmanes;
(4) Otros; y
(5) Sin Creencia alguna.
O bien podran clasificarse segn el sexo, el color de los ojos, algn partido poltico, etctera.
Otros ejemplos de escala nominal puede ser el nmero de placa de los vehculos, los nmeros
de los telfonos de una ciudad, la Cedula de Identidad de los habitantes de un pas, etctera.
El tipo de operacin estadstica ms utilizada en la escala nominal es el conteo de las
frecuencias con que se presentan las caractersticas en las unidades de las respectivas
subclases. Estas frecuencias pueden ser presentadas con nmeros absolutos, porcentajes y
proporciones. Adems, puede calcularse razones, tasas de incremento, y el coeficiente de
contingencia.
Escala de Medicin Ordinal: Es aquella en la que los nmeros se utilizan para diferenciar en
orden de supremaca de acuerdo con cierto criterio jerrquico, como son los nmeros que se
emplean para clasificar los distintos estratos socio-econmicos o para designar preferencias.
Si los datos observados se clasifican en categoras distintas en las que existe algn orden, se
obtiene un nivel de medicin ordinal Cuando los objetos son medidos en escala ordinal los que
tengan la misma asignacin se consideran iguales; pero los que tengan asignaciones diferentes
pertenecen a categoras distintas. La diferencia entre dos nmeros ordinales no tiene significado
cuantitativo, slo expresan, por ejemplo, que una situacin es mejor que otra, pero no cunto.
La escala ordinal es una forma un tanto ms fuerte de medicin que la nominal, porque se dice
que un valor observado que se clasifica en una categora posee ms la propiedad que se mide
que algn valor observado que se clasifica en otra categora.
Tambin, la escala ordinal siegue siendo una forma de medicin dbil porque no se pueden
hacer planteamientos numricos significativos con respecto a las diferencias entre las
categoras. Es decir, la ordenacin establece slo cul categora es mayor, mejor o
preferida; y no se habla cunto es mayor, mejor o ms preferida. Esta escala se emplea,
cuando un estudio est basado en ciertas normas que se asignan a un conjunto de objetos,
personas o caractersticas o a un conjunto de categoras ordenadas. Las categoras de la escala
se ordenan d acuerdo con la cantidad de rasgos o caractersticas que representan cada una de
ellas ya que la escala ordinal distingue los diferentes valores de la variable, ubicando las
caractersticas en orden, desde la ms alta hasta la ms baja.
Propiedades de la escala Ordinal
1. Las observaciones o elementos se les ordena en rangos o categoras diferentes.
2. Cada categora o rango mantiene una relacin entre s, estas relaciones se expresan en
trminos algebraicos de desigualdades (mayor que o menor que).
3. No es posible definir unidades de mediciones iguales en todos los puntos de la escala.
-
Estadstica - Lic. Jessica Oliva G. Pgina | 16
4. Las categoras son mayores o menores que otras categoras, es decir, que existe una
clasificacin de mayor a menor (jerarqua).
5. Las categoras son mutuamente excluyentes y exhaustivas.
6. No presentan el cero.
Se pueden clasificar los habitantes de una ciudad de acuerdo a su situacin econmica, a los
estudiantes tomando en cuenta a su rendimiento acadmico, etctera. Aunque la escala ordinal
resulta en cierta forma ms precisa que la nominal, no alcanza el grado de precisin deseado
en una investigacin.
Otro ejemplo, el orden jerrquico de los militares (Subteniente, Teniente, Capitn, Mayor,
Teniente Coronel, Coronel, General) y la clasificacin acadmica de los profesores
universitarios (instructor, asistente, agregado, asociado, titular) son ejemplos de escala ordinal.
En la escala ordinal las unidades de las subclases guardan una cierta relacin entre s, esto se
pone de manifiesto cuando existe la posibilidad de establecer la relacin menor que o mayor
que, respecto a las caractersticas de las unidades escaladas. Por ejemplo, el grado militar de
A es el de Subteniente y el de B es el de Teniente, luego el grado de B es mayor que el de A
(BA)
Escala de Medicin de Intervalos: Es una escala ms especializada que las dos anteriores,
puesto que es posible ordenar las mediciones y expresar adems en cunto difiere una situacin
de la otra. Por Ejemplo, en las mediciones de temperatura ambiental no slo se puede afirmar
hoy hace ms calor que ayer, si no que de la misma forma se puede expresar hoy la
temperatura es cuatro grados centgrados ms alta que la de ayer a la misma hora. Esta
escala se caracteriza por tener una unidad de medida y un origen (cero) arbitrario. La distancia
entre dos mediciones tiene un significado preciso. La escala de intervalos a diferencia de la
nominal y ordinal, es una escala efectivamente cuantitativamente. Una escala de intervalo es
una escala ordenada en la cual la diferencia entre las mediciones es una cantidad significativa.
La escala de intervalos posee adems, de las caractersticas de la escala nominal y ordinal, la
propiedad de que la distancia entre dos valores es de una magnitud conocida, lo que le permite
a esta escala un mayor grado de perfeccin, ya que proporciona nmeros que manifiestan
diferencias palpables entre individuos, objetos o cosas. Por tal razn, la escala de intervalo
revela que un individuo u objeto es tantas unidades ms grande o ms pequeo, ms pesado o
ms ligero, ms rpido o ms lento que otro, es decir, muestra la cantidad en la que un objeto
se diferencia de otro cuantitativamente. En esta escala el punto cero y la unidad de medicin
son arbitrarios. La razn entre dos intervalos es siempre independiente del punto cero y de la
unidad que se emplee en la medicin. En el caso de las escalas de intervalos las unidades de
medicin son iguales.
Propiedades de la escala de Intervalo:
1. Esta escala implica la cuantificacin de los datos
2. En estas medidas se utilizan unidades constantes de medicin (capacidad, peso, cntimos,
grados Fahrenheit o centgrados) los cuales producen intervalos iguales entre puntos de la
escala.
-
Estadstica - Lic. Jessica Oliva G. Pgina | 17
3. Proporcionan nmeros que manifiestan diferencias palpables entre individuos, objetos o
cosas.
4. En esta escala de intervalos el punto cero (0) y la unidad de medida es arbitrario.
5. Se pueden aplicar todas las medidas estadsticas ms conocidas, con excepcin del
coeficiente de variacin.
6. Son mutuamente exclusivas y exhaustivas.
Un ejemplo de esta escala lo constituyen las escalas utilizadas para medir temperatura, bien sea
en grados Centgrados o Fahrenheit. En estas escalas la diferencia entre 80 y 85 es igual a la
que existe entre 90 y 95 o entre dos puntos cualesquiera de la escala. La escala de intervalo
tiene carcter cuantitativo y esto le permite el clculo de las medidas estadsticas ms comunes
(medias, desviaciones tpicas o estndar, coeficientes de correlacin de Pearson, entre otros),
esto confirma l porque muchos valores estadsticos se utilizan con las escalas de intervalos.
Escala de Medicin de Razn o Proporcin: Esta constituye el nivel ms alto de medicin,
posee todas las caractersticas de las escalas nominales, ordinales y de intervalos; adems tiene
un cero absoluto o natural que tiene significado fsico. Si en ella la medicin es cero, significa
ausencia o inexistencia total de la propiedad considerada. Son posibles todas las operaciones
aritmticas. Los nmeros indican los valores concretos de la propiedad que s est midiendo;
peso, estatura, ingresos monetarios y gastos directos, son ejemplos de medidas con una escala
de razn.
La distancia entre dos valores de la escala es conocida en el sentido cuantitativo y su razn es
independiente de las unidades empleadas. Por ejemplo, en las unidades de longitud, peso y
capacidad el valor cero indica ausencia de medida, mientras que en la escala de intervalo si se
tiene cero grado centgrado no se puede afirmar que hay ausencia de temperatura. La escala de
razn permite establecer ciertas comparaciones entre los valores que no son permitidos en la
escala de intervalo. Por lo tanto, la proporcin de un punto cualquiera de la escala a otro es
independiente de la unidad de medida. Si una persona mide 2.00 m puede afirmarse que duplica
en estatura a otro que mide 1.00 m Las escalas de razn ms comunes corresponden a medidas
de longitud, peso, capacidad, sonido, entre otros. Al medir la temperatura absoluta la escala de
Kelvin, que es de este tipo, tiene su punto cero a 273, este valor es el ms bajo posible. Cuando
se emplea este tipo de escala, los nmeros indican razones o cocientes entre ciertas magnitudes
de los objetos, y los datos obtenidos con tales escalas pueden ser sometidos a los tratamientos
ms elaborados.
-
Estadstica - Lic. Jessica Oliva G. Pgina | 18
Propiedades de la escala a razn:
1. La distancia entre los nmeros es un tamao conocido y constante.
2. Los datos tienen un punto cero significativo.
3. Puede utilizarse cualquier prueba de tipo estadstico, incluyendo el coeficiente de
variacin.
4. Permite hacer comparaciones entre los nmeros verdaderos con un cero aritmtico siendo
arbitrario nicamente la unidad de medida.
Ejemplo de escala a razn:
Nmero de televisores vendidos en el ltimo trimestre del ao 2007
Meses N de televisores
Octubre 4.000
Noviembre 6.000
Diciembre 15.000
Generalmente, se supone que los datos que se obtienen para una variable cuantitativa se miden
en escalas de intervalo o de razn. Estas escalas constituyen los niveles ms elevados de
medicin. Son formas ms fuertes de medicin que la escala nominal y ordinal, porque
permiten comprender no slo cul de los valores de un estudio es mayor o menor, sino por
cuntas unidades de medida. Las escalas de razn son medidas de Longitud, peso, capacidad,
etc., los nmeros reflejan razones entre particularidades y los datos obtenidos segn tales
escalas pueden ser sometidos a cualquier tratamiento estadstico
LOS PARMETROS.- Son cualquiera caracterstica que se pueda medir y cuya medicin se lleve
a cabo sobre todos los elementos que integran una poblacin determinada, los mismos suelen
representarse con letras griegas. El valor de un parmetro poblacional es un valor fijo en un momento
dado.
Ejemplo: La media Aritmtica = (mu), La desviacin Tpica = , (Sigma) etctera.
LOS ESTADGRAFOS (Estadsticos o Estimadores).- Son aquellas caractersticas medibles,
cuya medicin se realiza sobre los componentes de una muestra, los mismos se representan con letras
del alfabeto castellano. Los estadgrafos no tienen un valor nico, sino que pueden tomar distintos
valores al ser calculados a partir de muestras diferentes.
Ejemplos: la media aritmtica = X , La desviacin Tpica = S.
-
Estadstica - Lic. Jessica Oliva G. Pgina | 19
Elaboracin de matriz de datos en Excel.
BARRAS DE HERRAMIENTAS DE EXCEL.
A continuacin se relacionan para cada una de las ventanas principales de Excel los iconos que aparecen
en la barra de herramientas.
REA DE TRABAJO
Veamos algunos de los conceptos bsicos de Excel:
Un libro de Excel equivale a un documento de Word o archivo.
Una hoja es una porcin del libro, formada por filas y columnas.
Se sabe en qu hoja estamos trabajando si miramos su etiqueta.
Una columna es una seleccin vertical de celdas, en cada hoja hay 16000 columnas nombradas con
las letras de la A a la XFD.
Una fila es una seleccin horizontal de celdas, desde la fila 1 a 1 milln por hoja.
Una celda es la interseccin entre una fila y una columna.
La celda activa es aquella que se representa con un contorno y es donde se encuentra el cursor.
Excel es una hoja de clculo que facilita los clculos y la obtencin de indicadores y estadsticos
para estudiar el comportamiento de una o varias variables.
Se podra entender como una matriz de filas y columnas.
Cada combinacin de fila y columna se denomina celda. Por ejemplo la celda A1, B33, Z68.
Un conjunto de celdas se denomina rango, y en Excel se expresa como A1:B4.
En cada celda se puede recoger: - rtulo, nmero, frmula
-
Estadstica - Lic. Jessica Oliva G. Pgina | 20
Como su nombre indica, la hoja de clculo nos permite calcular, hacer operaciones matemticas,
lgicas, estadsticas, financieras, etc.
Con la hoja de clculo EXCEL (u otras similares) se pueden obtener fcilmente estadsticos y
medidas que resuman y caractericen una variable, una distribucin de frecuencias, o una
distribucin bidimensional (n-dimensional) de frecuencias, es decir varias variables conjuntamente.
La primera pantalla que aparece en Excel es la siguiente:
Un primer recorrido por la hoja de clculo nos permite conocer las:
- opciones de men
- barra de herramientas
- barra de estado.....
Podemos utilizar la hoja de clculo:
a. Para obtener representaciones grficas segn el tipo de variable.
b. Para ir haciendo los clculos necesarios para obtener los distintos estadsticos (media,
mediana, moda, cuantiles, varianzas, g1, etc.). A partir de unos datos (o de una
distribucin de frecuencias) hacemos los clculos necesarios para desarrollar una
frmula y paso a paso calcular hasta obtener el resultado final. (Sumas, productos,
divisiones, potencias, races, etc.)
-
Estadstica - Lic. Jessica Oliva G. Pgina | 21
c. Para analizar un conjunto de informacin. Se usar en el men de Herramientas la
opcin Analizar Datos. Permite describir un conjunto de informacin correspondiente
a una o varias variables.
d. Permite aplicar tcnicas estadsticas ms sofisticadas (regresin, contrastes de
hiptesis, estimacin por intervalos, etc.).
INTRODUCCIN DE DATOS
En Excel se distingue tres tipos de datos:
Ttulos (texto y caracteres).
Valores (Constantes numricas).
Frmula o funciones.
Una vez introducido un dato en una celda debemos pulsar INTRO o TAB para hacerlo efectivo.
DISEO DE LA BASE DE DATOS
Una base de datos, tabla o lista como se conoce habitualmente en Excel, no es ni ms ni menos que una
hoja de clculo, pero con la diferencia de que lleva siempre una fila superior con una lista de ttulos o
cabeceras.
Los datos que contendr sern estructurados y organizados, los datos completos de una fila se
denominarn Registro y cada dato contenido en una columna ser un campo. La primera fila siempre
debe contener los Ttulos de los campos.
Para crear correctamente una BASE DE DATOS debemos tener en cuenta:
No debemos dejar filas ni columnas en blanco.
Crear rtulos de columna en la primera fila de la lista. Excel utiliza los rtulos para generar
informes, as como para buscar y organizar los datos.
En los rtulos de columna utiliza una fuente, un formato o un estilo de letras maysculas que sea
diferente del formato que se asigne a los datos de la lista.
No insertes espacios adicionales al comienzo de una celda ya que afectarn a las clasificaciones y
bsquedas.
Se utilizar como ejemplo el siguiente cuestionario para la construccin de una base de datos en Excel.
Ejemplo de cuestionario
1. Sexo: 1. Hombre 2. Mujer
2. Marca de gaseosa que prefiere
3. Percepcin acerca del sabor de la gaseosa
4. Marca de gaseosa que no comprara
En la hoja de clculo de Excel, se procede a disear la base de datos para el cuestionario elaborado.
La primera celda A1, debe ser el nmero de registro y a continuacin en las siguientes celdas (B1, C1,
D1.) los nombres o abreviaturas que corresponde a la pregunta del cuestionario.
-
Estadstica - Lic. Jessica Oliva G. Pgina | 22
Luego que se tienen los ttulos en la primera fila, se procede al llenado de los registros (cuestionarios),
debe tener en cuenta que cada fila es un registro.
Una vez llenado el primer registro (Cuestionario N 1), se contina con los dems registros hasta
completar la base datos. Para este ejemplo se completar 30 registros. Si los primeros caracteres que
escribes en una celda coinciden con una entrada ya existente en la misma columna, Excel rellenar
automticamente los dems. A esta operacin se la conoce como Autocompletar.
-
Estadstica - Lic. Jessica Oliva G. Pgina | 23
ORGANIZACIN Y PRESENTACIN DE DATOS
Cuando se realiza la recopilacin de antecedentes con fines estadsticos, se obtiene una gran cantidad de
datos, algunas veces estos estn en su forma natural o emprica (fuentes primarias) y otras ya estn
organizadas en tablas, cuadros y grficos (fuentes secundarias). Los datos pueden estar incompletos,
incorrectos, desordenados, pero en todos los casos constituyen los datos bsicos para iniciar un estudio,
conocer y analizar el comportamiento y las caractersticas de los elementos de una poblacin.
En el trabajo estadstico, siempre se dispone de muchos datos que, definitivamente tienen que ser
clasificados, ordenados y presentados adecuadamente, de tal manera que facilite la comprensin,
descripcin y anlisis del fenmeno estudiado, y obtener conclusiones vlidas para la toma de decisiones.
En general, la organizacin y presentacin de los datos estadsticos, supone realizar los siguientes pasos:
a) Evaluacin y crtica: consiste en inspeccionar la validez y confiabilidad de los datos, para corregir
los errores y omisiones de acuerdo a ciertas reglas fijas. A partir de datos incorrectos no se pueden
obtener buenos resultados.
b) Codificacin: es una tcnica mediante la cual los datos o respuestas (numrica o verbal) se convierte
en un nmero, smbolo o lenguaje que permita su procesamiento o tabulacin.
c) Clasificacin: consiste en establecer las categoras de las variables.
d) Procesamiento o tabulacin de datos: es el registro de nmero de casos (frecuencia o repeticin) en
cada una de las categoras de la variable de acuerdo al plan de tabulacin previamente establecido.
e) Presentacin de los datos: los resultados de la tabulacin se presentan en tablas y grficos. La
presentacin de datos implica tener la informacin estadstica organizada para proceder al anlisis
e interpretacin de los resultados.
En el trabajo estadstico, lo que se tiene disponible en un primer momento es un material numrico, producto
de la observacin o recopilacin de datos, que son categorizados, ordenados, procesados y presentados en
tablas y grficos; hay proceso de resumen estadstico que se concreta con el clculo de indicadores.
Hay dos formas de presentar ordenadamente los datos estadsticos:
i) En forma de tablas estadsticas
ii) Mediante grficos y diagramas
Fundamentalmente se usa la forma tabular, los grficos se utilizan complementariamente para ilustrar
mediante figuras el comportamiento de las variables y facilitar la comprensin de los fenmenos estudiados.
TABLAS ESTADSTICAS
Presentan ordenadamente los datos estadsticos en filas y columnas, clasificados y agrupados de acuerdo a
un criterio especfico. Los datos presentados en tablas constituyen la informacin estadstica. Esta
informacin no slo es un valor numrico sino que adems merece una interpretacin de tipo cualitativo
segn el contexto que lo origin. Una tabla estadstica es el resultado de trabajos previos (planeamiento,
recopilacin, tabulacin, clculos, etc.), son las que se incluyen frecuentemente en el cuerpo de los estudios
de las investigaciones o de los informes.
Son esquemas organizados en los que se registran los datos estadsticos en forma organizada con la
frecuencia de cada uno de estos, los mismos se observan en columnas y filas con la finalidad de presentar
la informacin recopilada de una investigacin o estudio determinado. Por lo tanto, las tablas estadsticas
es una ordenacin de datos numricos en filas y columnas con las especificaciones correspondientes acerca
-
Estadstica - Lic. Jessica Oliva G. Pgina | 24
de la naturaleza de los datos. Constituye una forma til de presentar los datos estadsticos obtenidos en una
investigacin a travs de cuadros, tablas y grficos. Esta puede presentar la informacin para referencias
generales o para un uso especfico o particular.
La ordenacin de datos en tablas estadsticas, denominada forma tabular o tabulacin, estn constituidos
por datos cuantitativos y stos a su vez estn en filas y columnas de acuerdo con las especificaciones de los
datos. La tabulacin es una presentacin sistemtica de los datos estadsticos de una investigacin
determinada, estos se presentan en forma resumida a travs de las tablas o cuadros estadsticos.
Las tablas estadsticas estn compuestas por las siguientes partes:
1. Ttulo.
2. Encabezamiento.
3. Columna Matriz. o Concepto
4. Cuerpo.
5. Notas de Encabezado
6. Nota de Pie
7. Fuente de Datos
1. Ttulo: Es una descripcin del contenido de la tabla. Debe ser compacta y completa. Este comprende las
siguientes partes:
Numeracin de la tabla: cuando las tablas forman parte de un texto o de un grupo deben ser
numerados en la parte superior central de la hoja.
Titulo Propiamente Dicho: se debe seguir los siguientes puntos:
- Se debe ubicar centrado en la parte superior de la tabla, y usando letras maysculas para todo el
enunciado.
- Se debe redactarse con precisin y que exprese brevemente los datos que se presentan en el
cuadro.
- Un ttulo completo indica:
Qu son los datos incluidos en el cuerpo de la tabla?
Dnde est el rea representada por los datos?
Cmo estn los datos clasificados?
Cundo ocurrieron los datos?
2. Encabezado: Es el ttulo de la parte de una columna o columnas. Las tablas ms simples pueden consistir
solamente de dos columnas y dos encabezados: Una para los conceptos y otra para los datos. Debe
disponerse en la parte superior del cuadro y las designaciones que comprenden debern escribirse en lo
posible horizontalmente, debiendo ser preciso y breves, as mismos se dispondr en un orden lgico de
izquierda a derecha. Otra observacin para la elaboracin del encabezamiento, es que tanto l como las
diversas columnas deben separarse con rayas, cerrando el cuadrado por la parte superior e inferior con
-
Estadstica - Lic. Jessica Oliva G. Pgina | 25
una raya gruesa o una doble raya, en la actualidad existe la preferencia de no rayar verticalmente el
encabezamiento.
3. Concepto o Columnas Matriz: La descripcin en hilera de la tabla son llamados conceptos; y estos son
colocados al lado izquierdo de la tabla. La naturaleza de las clasificaciones es indicada por los
encabezados de las columnas, incluyendo la columna matriz. Es bueno Recordar que los datos
estadsticos pueden referirse a clasificaciones cualitativas, cuantitativas, cronolgicas o geogrficas;
recordar esto es importante puesto que la naturaleza de los datos tomando en cuenta esta clasificacin
determinar en parte el arreglo en que se lleven stos a la columna matriz. Existen variadas formas de
arreglo de los datos en la columna matriz. Es permisible disponerlos en orden alfabtico, mtodo que se
usa habitualmente cuando los datos se clasifican geogrfica o cualitativamente. Pueden ordenarse
tambin segn clases fijadas por la costumbre: casado, soltero, divorciado, viudo. Es factible observar
que si las diferentes nominaciones son ordenadas alfabticamente, se hace muy sencillo localizarlas.
Cuando se trata de clasificaciones cuantitativas, el arreglo puede hacerse en orden ascendente o
descendente. Cuando se refiere a clasificaciones cronolgicas, se ordenan los aos en sentido ascendente:
1995, 1996, 1997, 1998, y cuando se trate de meses se comienza por el mes de Enero.
4. Cuerpo del cuadro: El cuerpo del cuadro es la parte que contiene los datos estadsticos presentados en
ste. Cada dato individual ocupa en el cuadro un lugar que corresponde a la interseccin de una fila y
una columna dada; por tanto, el significado de los datos en un lugar est indicado por las especificaciones
o partidas combinadas de la columna y la fila que se interceptan. Cuando el valor de uno de los lugares
del cuerpo del cuadro sea cero es conveniente marcar ese lugar con un guin, si no existe el dato, si es
estimado, o si la cifra indica alguna consideracin distinta a la del resto de los otros, debe indicarse con
una llamada y su respectiva aclaratoria al pie del cuadro. La representacin efectiva de los datos en la
tabla depende de los arreglos de las columnas en hileras.
5. Nota de Encabezado: Son usualmente escritas justamente arriba de los encabezados y debajo de los
ttulos. Son usados para explicar ciertos puntos relacionados con la tabla completa que no han sido
incluidos en el ttulo ni en los encabezados ni en los conceptos.
6. Nota de Pie: Las notas de pie son usualmente colocadas debajo de los conceptos. Son usados para
clarificar algunas partes incluidas en la tabla que no son explicadas en otras partes, tal como las notas de
pie en la tabla. Las notas al pie de los cuadros se utilizan para hacer aclaratorias sobre uno o varios
elementos en particular. La nota sobre la fuente de los datos debe indicar el origen de la informacin
presentada en el cuadro.
7. Fuentes: Las fuentes de datos o simplemente fuentes, es usualmente escrita debajo de las notas de pie.
Si los datos fueron recopilados y presentados por la misma persona, es costumbre no establecer la fuente
en la tabla. El objeto de la indicacin de las fuentes de los datos es el de proporcionar el debido
reconocimiento a la persona u organismo que recopil y /o public los datos, adems de indicar, a quienes
deseen ampliar la informacin, el origen de la misma
Uso de porcentajes: En las tablas estadsticas, normalmente se utilizan porcentajes. Existen cuadros que
slo poseen datos en forma de porcentajes, mientras que otros vienen expresados tanto en valores absolutos
como en porcentajes. La finalidad del uso de los porcentajes en los cuadros es facilitar la comparacin, de
tal manera que las relaciones que puedan existir se perciban. Cuando se usan estos es necesario recalcar las
bases sobre las cuales se han establecido dichos porcentajes; esto tiene como propsito indicar al lector cual
es la base que se est utilizando para determinar el mismo.
-
Estadstica - Lic. Jessica Oliva G. Pgina | 26
PROPIEDADES DE LAS TABLAS ESTADSTICAS
o Deben simplificar la presentacin de los datos
o Tratar un solo tema
o Elaborar un arreglo apropiado de clasificacin.
o El tamao de la tabla debe crearse de tal manera que no sea ni muy largo y angosto, ni muy ancho o
corto.
o Cada signo de presentacin que se va a utilizar debe estar plenamente identificado.
o Las notas que se encuentran al pie de los cuadros deben incluir las descripciones en forma precisa.
Ejemplo de tabla:
Razn de la falla N veces %
Servidor sin memoria disponible 32 43.2
Software del servidor 30 40.5
Falla elctrica 6 8.1
Hardware del servidor 4 5.4
Conexin fsica 2 2.7
Total 74 100.0
Tabla N 1
Razn de falla en el sistema de cajeros automticos del Banco UAW durante los ltimos 6 meses en la ciudad de Chiclayo
Fuente: Banco UAW
Nmero de cuadro
Ttulo
Encabezamiento
C U E R P O
Fuente
-
Estadstica - Lic. Jessica Oliva G. Pgina | 27
DISTRIBUCIONES DE FRECUENCIA
Despus de la recopilacin de los datos, es necesario resumirlos y presentarlos en forma tal, que faciliten
su comprensin y su posterior anlisis y utilizacin. Para ello, se ordenan en cuadros numricos y luego se
presentan en grficos.
DISTRIBUCIN DE FRECUENCIAS PARA VARIABLE CUALITATIVA:
Supongamos que en una muestra de n unidades estadsticas se observan k categoras o modalidades
diferentes C1, C2,..., Ck de alguna variable cualitativa X. La tabulacin de estos n datos, es la distribucin
de frecuencias por categoras.
Categoras de la
variable X
Frecuencias
Absoluta ni
Frecuencias
Relativas hi
Frecuencia
Porcentajes Pi
C1
C2
Ck
n1
n2
nk
h1
h2
hk
p1
p2
pk
Total N 1.00 100.00
La frecuencia absoluta ni, es el nmero de datos observados en cada categora o modalidad. La suma de
todas las frecuencias absolutas es igual al total n de datos observados.
La frecuencia relativa hi, se define en cada categora por hi = ni / n. La suma de todas las frecuencias
relativas es igual a uno.
La frecuencia relativa porcentual se define en cada fila por hi %= hi x 100%. El total de las frecuencias
porcentajes es igual a cien.
Ejemplo:
Razn de la falla ni hi hi%
Servidor sin memoria disponible 32 0.432 43.2
Software del servidor 30 0.405 40.5
Falla elctrica 6 0.081 8.1
Hardware del servidor 4 0.054 5.4
Conexin fsica 2 0.027 2.7
Total 74 1.000 100.0
-
Estadstica - Lic. Jessica Oliva G. Pgina | 28
DISTRIBUCIN DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS DISCRETAS
Sea x1, x2,..., xn un conjunto de n observaciones discretas y sean y1, y2, ..., ym el conjunto de valores
diferentes que toman las observaciones originales (m n).
En general para construir una tabla de distribucin de frecuencias requiere realizar las siguientes
operaciones:
Clasificacin: que consiste en determinar las categoras, que son los distintos valores que toman las
variables o los intervalos de clase.
Tabulacin: que consiste en distribuir las observaciones en las respectivas categoras de la variable. Aqu
se contabiliza cuantos elementos hay en cada categora, es decir, determinar cuntas veces se repite
(frecuencia) cada valor distinto o categora de la variable.
Cuando es grande el nmero de datos observados de una variable discreta, su organizacin es muy
engorrosa. En este caso para resumir los datos y poder calcular las medidas descriptivas, es conveniente
seguir el mtodo de organizacin de variable continua por intervalos.
Se llama frecuencia absoluta, al nmero de veces que aparece este valor en el conjunto de observaciones
y se representa por ni, i= 1, 2, ..., m.
La suma de todas las frecuencias absolutas simple es igual al nmero total de observaciones.
Valores
diferentes
observados
Frecuencias
absolutas
ni
Frecuencias
Relativas
hi
Frecuencias
Relativas
Porcentuales
hi%
y1
y2
...
ym
n1
n2
...
nm
h1
h2
...
hm
h1%
h2%
...
hm%
Total Nm 1 100
Se llama frecuencia relativa, al cociente de la frecuencia absoluta entre el nmero de observaciones.
n
nh ii
La suma de todas las frecuencias relativas es igual a la unidad.
Se llama frecuencia relativa porcentual, a la frecuencia relativa multiplicada por cien.
-
Estadstica - Lic. Jessica Oliva G. Pgina | 29
Ejemplo:
Cantidad de Artculos
defectuosos N Lotes hi hi%
1
2
3
4
5
6
7
8
5
14
18
25
20
10
5
3
0.05
0.14
0.18
0.25
0.20
0.10
0.05
0.03
5
14
18
25
20
10
5
3
Total 100 1.00 100
DISTRIBUCIN DE FRECUENCIAS PARA VARIABLES CONTINUAS
Sea x1, x2,..., xn un conjunto de n observaciones continuas, siendo n el tamao de la muestra.
En general para construir una tabla de distribucin de frecuencias requiere realizar los siguientes pasos:
1. Determinar la amplitud o recorrido(R): es la longitud del recorrido de los datos. O sea:
R = xmx xmin
2. Determinar el nmero de intervalos(m): Haciendo uso de la frmula de STURGES
m = 1 + 3.32 log(n)
Se recomienda que el nmero de clases est entre 5 y 15
3. Determinemos la amplitud de clase (C):
C = R / m
4. Construir los intervalos de clase partiendo de xmin luego se va sumando la amplitud de clase. Los
extremos de un intervalo deben estar preferentemente definidos, de modo que no exista duda o
ambigedad en el momento de la tabulacin. Un valor xi slo puede pertenecer a un intervalo y
slo uno. En este caso denominaremos el intervalo Li-Ls que significa que es cerrado por la
izquierda y abierto por la derecha.
5. Luego se calcula la marca de clase, que es el punto medio del intervalo denotado por yi.
2
LLy sii
Donde: Li es el lmite inferior del intervalo
Ls es el lmite superior del intervalo
6. Luego obtener la frecuencia absoluta (ni ) que es el procedimiento que consiste en distribuir las
observaciones en los diferentes intervalos.
-
Estadstica - Lic. Jessica Oliva G. Pgina | 30
7. Calcular las frecuencias absolutas acumuladas (Ni), que es la suma de las frecuencias absolutas
hasta la i-sima frecuencia absoluta.
i
1j
ji21i nn...nnN
8. Calcular la frecuencia relativa, que es el cociente de la frecuencia absoluta entre el nmero de
observaciones.
n
nh ii
La suma de todas las frecuencias relativas es igual a la unidad.
9. Calcular la frecuencia relativa acumulada, que es la suma de las frecuencias absolutas hasta la
i-sima frecuencia relativa.
i
1j
jn21i hh...hhH
o tambin: n
NH ii
Intervalos de
clase
Li-Ls
Marcas
de clase
yi
Frecuencias
Absolutas
ni
Frecuencias
Absolutas
Acumuladas
Ni
Frecuencias
Relativas
hi
Frecuencias
Relativas
Acumuladas
Hi
Frecuencias
Relativas
Porcentuales
hi%
Y0 y1
y1 y2
....
ym-1 ym
y1
y2
...
ym
n1
n2
...
nm
N1
N2
...
Nm=n
h1
h2
...
hm
H1
H2
...
Hm=1
h1%
h2%
...
hm%
Totales n 1 100
Ejemplo:
Ingresos
($) yi ni Ni hi Hi %
36 45 40.5 6 6 0.13 0.13 13
45 54 49.5 5 11 0.11 0.24 11
54 63 58.5 16 27 0.36 0.60 36
63 72 67.5 12 39 0.27 0.87 27
72 81 76.5 4 43 0.09 0.96 9
81 90 85.5 2 45 0.04 1.00 4
Total 45 1.00 100
-
Estadstica - Lic. Jessica Oliva G. Pgina | 31
REPRESENTACIN GRFICA DE INFORMACIN ESTADSTICA
El fin que persigue todo grfico es el de dar una idea rpida de la situacin que en ese momento se est
investigando. Por tal motivo, la presentacin de los datos por medio de grficos debe ser de una forma
simple y de una compresin fcil. Es preferible construir un conjunto de grficos en donde cada uno de
ellos presente un aspecto sencillo de una situacin determinada, que presentar un solo grfico en el cual se
observen demasiadas relaciones que se haga difcil estudiar de una forma efectiva. Por lo tanto, no debe
sobrecargarse un grfico para tratar de mostrar demasiadas categoras, ya que, la simplicidad es una de la
caracterstica bsica de estos.
Existe una gran variedad de tipos de grficos entre los que se pueden mencionar los pictogramas,
cartogramas, de cuadrados, de tringulos y crculos proporcionales, de sectores circulares, de barras,
lineales, estereogramas, polares, etc., pero los ms utilizados y de interpretacin sencilla son los: Los
grficos de barras, los de sectores circulares y los lineales. En esta asignatura solo se estudiaran las
siguientes grficas:
1. Diagrama de Barras.
2. Diagrama Circular o de Pastel.
3. Histograma.
4. Polgono de Frecuencia.
5. Diagrama de Lneas.
Los diagramas de lneas, el histogramas, el polgono de frecuencia y la ojiva son grficos cartesianos
porque para su construccin requieren del plano cartesiano, a estos se le denominan en trminos generales
grficos de lneas. El diagrama de barras y el de pastel se les denomina grficos de sectores, puesto que, no
requieren del plano cartesiano para su construccin.
Diagrama de Barras
Los diagramas de barras son grficas que se utilizan con mucha frecuencia para representar datos de
una investigacin determinada, son de fcil interpretacin para cualquier lector. Estos grficos estn
constituidos por una serie de rectngulos o barras. La longitud y anchura de cada barra representa un
fenmeno.
-
Estadstica - Lic. Jessica Oliva G. Pgina | 32
La forma de elaborar los mismos es la siguiente: se utiliza un sistema de coordenadas rectangulares y
se llevan al eje de las x los valores que toma la variable en estudio y en el eje de las y se colocan las frecuencias de cada barra. Luego se construyen los rectngulos, tomando como base al eje de las
abscisas, cuya altura ser igual a cada una de las diferentes frecuencias que presentan las variables en
estudio. La magnitud con que viene expresada la variable se observa en la longitud de las barras
(rectngulos). Es importante destacar que solamente la longitud de las barras y no su anchura es lo que
denota la diferencia de magnitud entre los valores de la variable. Todas las barras tienen que tener una
anchura igual, separadas entre s, preferiblemente por una longitud igual a la mitad del ancho de estas
o distancias iguales entre barras. Es recomendable, que las barras no sean ni e