Apuntes 1 de Estadística completo

download Apuntes 1 de Estadística completo

of 155

Transcript of Apuntes 1 de Estadística completo

  • 8/15/2019 Apuntes 1 de Estadística completo

    1/155 

     Apuntes de Estadística

    Para Ing. Industrial

    (2015)

    Elaborado por: Manuel Francisco Hurtado Sánchez Lic. Estad. MsC. 

    Profesor adscrito al Dpto. de Ingeniería - USAT

    Director de Información Estadística USAT

    CONTENIDOTema 1: Aspectos básicos de la estadísticaTema 2: Técnicas de recolección de datos, elaboración de cuestionarioTema 3: Organización y presentación de datos.Tema 4: Medidas de resumen. 

    Chiclayo Agosto del 2015

  • 8/15/2019 Apuntes 1 de Estadística completo

    2/155

     

    2

    INDICE

    ContenidoPáginaResumen…………………………………………………………………................................... 2Presentación………………………………………………………………………………………  4Resumen ejecutivo ……………………………………………………………………………….  5

    I. INTROCUCCIÓN1.1 Antecedentes….…………………………………………………………………………….  101.2. Formulación del problema………………………………………………………………….. 111.3. Objetivos………………………………………………………………………………………  111.4. Variables...…………………………………………………………………………………….  121.5. Cuadro de operacionalización de variables ………………………………………………  13

    II. METODOLOGÍA2.1. Tipo de estudio ……………………….……………………………………………………..  142.2. Diseño de contrastación ……….……………………………………………………………  142.3. Población y Muestra …………………………………………………………………………  162.4. Métodos, técnicas e instrumentos de recolección de datos …………………………….  22

    III. RESULTADOS3.1. Demanda de formación profesional en estudiantes de 5° de secundaria ………......... 23

    3.2. Oferta de formación profesional en universidades e institutos ……………………….... 553.3. Oferta Laboral en hogares …………………………………………………….……………  743.4. Demanda laboral en empresas e instituciones ………………………………………..…  863.5. Análisis prospectivo para las carreras objeto de estudio ……………………………….  92

    IV. CONCLUSIONES………………………………………………………………………………….  100V.  ANEXOS………..…………………………………………………………………………………..  106

  • 8/15/2019 Apuntes 1 de Estadística completo

    3/155

     

    3

    Introducción a la Estadística

    El término estadística tiene, entre otros, dos significados de uso común. De un lado se entiende

    estadística como dato; y en tal sentido los gobiernos cuentan con institutos que se encargan de

    preparar y difundir estadísticas públicas. Pero, de otro lado, se entiende como una disciplina

    científica, cuya importancia es cada día mayor.

    En realidad siempre han existido estadísticas, en un inicio, de forma muy elemental, como cuando

    se utilizaban diversos símbolos utilizando pieles, rocas, palos o cualquier otro objeto, para

    representar cuentas de personas, animales o ciertas cosas. En la antigüedad los babilonios usaban

    pequeñas tablillas de arcilla para recopilar datos sobre la producción agrícola; los egipcios

    llevaban cuentas sobre la población y las cosechas; el libro bíblico de Números presenta el

    informe de dos censos de la población de Israel, etc.

    El Imperio romano fue el primer gobierno que recopiló una gran cantidad de datos sobre la

    población, superficie y renta de todos los territorios bajo su control. Durante la edad media, en

    Europa, sólo se realizaron algunos censos exhaustivos.

    El registro de nacimientos y defunciones comenzó en Inglaterra a principios del siglo XVI, y en

    1662 apareció el primer estudio estadístico notable de población, titulado Observations on the

    London Bills of Mortality  (Comentarios sobre las partidas de defunción en Londres). La estadística

    demográfica se difundió luego por Europa.

    En los siglos posteriores el desarrollo de la investigación científica en prácticamente todas las

    ramas del saber hizo que se aceptara la necesidad de manipular los datos siguiendo reglas

    objetivas y reconocidas por todos. La formulación de la teoría de la probabilidad ha permitido quela estadística desarrolle métodos de inducción que han tenido un efecto muy positivo en la toma

    de decisiones en los más diversos campos de la actividad humana.

    El origen etimológico de la palabra “estadística” no está bien determinado, puesto que existen

    distintas opiniones y referencias. Para algunos viene de la voz griega STATERA que significa

    “balanza”, otros sostienen que deriva del latín STATUS que significa “situación”, mientras que

    algunos autores afirman que procede del latín STAAT que significa “estado”. En el caso concreto

    de suponer que viene del vocablo “estado”, es por el hecho que una de las funciones tradicionalesdel gobierno central y del estado es llevar registros sobre la situación de la población,

    nacimientos, defunciones, producción, impuestos y otros hechos contables o de control.

  • 8/15/2019 Apuntes 1 de Estadística completo

    4/155

     

    4

    La evolución y desarrollo de la estadística en el mundo actual definitivamente ha superado en

    significado etimológico de esta ciencia; la estadística constituye hoy en día un valioso

    instrumento de decisión en todas las situaciones de la vida, desde el hogar hasta la política

    nacional y mundial.

    En el mundo actual por Estadística debemos entender algo más elaborado y susceptible de u

    tratamiento científico. La Estadística ya no es la errónea concepción de recopilaciones de grandes

    masas de datos y presentarlos en tabla o gráficos; ni tampoco el simple cálculo de totales,

    promedios y porcentaje, etc. En todo caso estas ideas corresponden a inicios de la Estadística o a

    las etapas del proceso estadístico.

    En el intento de precisar una idea o definición, se puede decir que la Estadística es la “Ciencia que

    tiene por objeto el desarrollo de modelos y metodologías para la recolección, clasificación y

    análisis de conjuntos de datos de observaciones, para interpretarlos y obtener leyes y relacionesentre ellas, y facilitar así la toma de decisiones, cuando prevalecen condiciones de

    incertidumbre. 

    Es la ciencia que orienta la toma de decisiones a partir del análisis e interpretación de

    observaciones realizadas en forma directa o experimentalmente”. 

    Los estudiantes confunden comúnmente los demás términos asociados con las Estadísticas, una

    confusión que es conveniente aclarar debido a que esta palabra tiene tres significados: la palabra

    estadística, en primer término se usa para referirse a la información estadística; también para

    referirse al conjunto de técnicas y métodos que se utilizan para analizar la información estadística;y el término estadístico, en singular y en masculino, se refiere a una medida derivada de una

    muestra.

    Aún cuando aquí se establece que la Estadística es una ciencia, sin embargo entre los propios

    especialistas existen algunas discrepancias de considerarla como ciencia o como una técnica.

    Mientras que se supone definitivamente esta discusión, resultaría más preciso describir a la

    Estadística como “LA TECNOLOGÍA DEL MÉTODO CIENTÍFICO” (A.M.MOOD), entendiendo que la

    tecnología se ocupa de la aplicación sistemática del conocimiento científico para resolver

    problemas prácticos. En este sentido la Estadística proporciona reglas, técnicas e instrumentos

    para los investigadores, las que pueden ser de aplicación completamente general y útiles encualquier campo de las ciencias: Física, química, biología, economía, sociología, ingeniería, etc., y

    en cualquier campo del conocimiento.

    H.Cramer, sostiene que “el principal objeto de la teoría Estadística consiste en la investigación de

    la posibilidad de obtener inferencias válidas a partir de los datos estadísticos, y en la construcción

    de métodos para realizar dichas inferencias”. 

    Jerzy Neyman, afirma que la “Estadística trata de los problemas relativos alas características

    operatorias de las reglas de comportamiento inductivo basado en experimentos aleatorias”. Para

    A.Wald el “objetivo principal de la Estadística es el estudio de las funciones decisoriasestadísticas”. 

  • 8/15/2019 Apuntes 1 de Estadística completo

    5/155

     

    5

    Kennedy- Neville, asevera que “La Estadística es una ciencia que comprende la recopilación,

    tabulación, análisis e interpretación de los datos cuantitativos y cualitativos”. 

    William Gunther establece que “La Estadística es un campo de ensayo en el que se recogen yanalizan datos con el propósito de sacar conclusiones… proporciona instrumentos para la toma de

    decisiones cuando prevalecen condiciones de incertidumbre”. 

    Proponer ahora una definición de la Estadística puede resultar poco significativa porque no se

    lograría precisar se esencia, su cobertura y los hechos que estudia esta ciencia. A manera de

    información, conviene indicar que hace más de un siglo Gustavo Rumelin sostenía que había por

    lo menos 63 definiciones de Estadística, y que pueden añadir otras si se tiene en cuenta el avance

    de esta disciplina.

    La función principal de la Estadística es “elaborar principios y métodos que nos ayuden a tomar

    decisiones frente a la incertidumbre” sostiene Ya Luu Chou, por esta razón, podría definirse la

    Estadística como “un método de toma de decisiones frente a la incertidumbre”. Y cuyo objetivo

    principal de la Estadística es “Reunir una información cuantitativa concerniente a individuos,

    grupos, serie de hechos, etc. y deducir de ello gracias al análisis de estos datos, unas previsiones

    para el futuro”. 

    La Estadística como ciencia cumple los aspectos principales del método científico, tales como:

    Realización de experimentos y observaciones;

    Obtención de conclusiones o proposiciones objetivas a partir de los resultados de dichos

    experimentos y observaciones,

    Formulación de leyes que simplifiquen la descripción de un gran número de experiencias u

    observaciones.

    2. Objetivos de la Estadística

    En términos generales los objetivos de la estadística pueden ser clasificados o agrupados en tres

    grandes capítulos: Descripción, Análisis y Predicción.

    Descripción  de grandes colecciones de datos empíricos, según la terminología de R.A. Fisher, este

    proceso se conoce con la denominación de “reducción de datos”. La descripción supone que los

    datos que vienen expresados en su forma natural deben ser clasificados y presentados

    sistemáticamente en cuadros o tablas como una primera reducción de datos propiamente dicha

    se obtiene cuando en comportamiento y características de los datos se expresan por un conjunto

    de indicadores, medidas de resumen o estadígrafos.

  • 8/15/2019 Apuntes 1 de Estadística completo

    6/155

  • 8/15/2019 Apuntes 1 de Estadística completo

    7/155

     

    7

    También los chinos efectuaron censos hace más de cuarenta siglos. Los griegos efectuaron censos

    periódicamente con fines tributarios, sociales (división de tierras) y militares (cálculo de recursos y

    hombres disponibles). La investigación histórica revela que se realizaron 69 censos para calcular

    los impuestos, determinar los derechos de voto y ponderar la potencia guerrera.

    Los hebreos utilizaron datos

    estadísticos a menudo; así la

    Biblia menciona el censo que

    moisés levantó instancias a

    Yahvé. En el año 2258 AC, el emperador Yao dispuso el levantamiento de un censo en la China. En

    Roma, se llevaban registros numéricos para fines tributarios, en el tiempo de Octavio Augusto se

    realizó un censo. Algunos sostienen que en el año 0, año del nacimiento de Jesucristo, está

    relacionado con un empadronamiento.

    Pero fueron los romanos, maestros de la organización política, quienes mejor supieron emplear

    los recursos de la estadística. Cada cinco años realizaban un censo de la población y sus

    funcionaros públicos tenía la obligación de anotar nacimientos, defunciones y matrimonios, sin

    olvidar los recuentos políticos del ganado y de las riquezas contenidas en las tierras conquistadas.

    Se sabe que en el año 727, los árabes realizaron un censo más o menos completo en la península

    Ibérica. En la Edad Media ya se encontraban estadísticas sistematizadas. El clero se dedicó a la

    recopilación, ordenamiento y estudio de los datos de tipo demográfico.

    Durante la caída del imperio romano se realizaron muy pocas operaciones estadísticas, con la

    notable excepción de las relaciones de tierras perteneciente a la iglesia, copiladas por Pepino elBreve en el año 758 DC y por Carlomagno en el año 762 DC. Durante el siglo IX se realizaron en

    Francia algunos censos parciales de siervos. En Inglaterra, Guillermo el conquistador recopiló el

    DOMESDAY BOOK O LIBRO DEL GRAN CATASTRO para el año 1086, un documento de la

    propiedad, extensión y valor de las tierras de Inglaterra. Esa obra fue el primer compendio

    estadístico en Inglaterra.

    Aunque Carlomagno, en Francia; y Guillermo el conquistador, en Inglaterra, trataron de revivir la

    técnica romana, los métodos estadísticos permanecieron casi olvidados durante la Edad Media.

    Durante los siglos XV, XVI y XVII, los hombres como Leonardo de Vinci, Nicolás Copérnico, Galileo,Neper, William Harvey, Sir Francis Bacón y René Descartes, hicieron grandes operaciones con el

  • 8/15/2019 Apuntes 1 de Estadística completo

    8/155

     

    8

    método científico, de tal forma que cuando se crearon los estados nacionales y surgió como

    fuerza el comercio internacional existía ya un método capaz de aplicarse a los datos económicos.

    Para el año 1532 empezaron a registrarse en Inglaterra las defunciones debido al temor queEnrique VII temía por la peste. Más o menos por la misma época, en Francia la ley exigió a los

    clérigos registrar los bautismos, fallecimientos y matrimonios. Durante un brote de peste que

    apareció a fines de la década de 1500, el gobierno inglés comenzó a publicar estadísticas

    semanales de los decesos. Esa costumbre continuó muchos años y en el año 1632 estos BILLS OF

    MORTALITY (CUENTAS DE MORTALIDAD) contenían los nacimientos y fallecimientos por sexo. En

    1662 el capitán John Graunt usó documentos que abarcaban treinta años y efectúa predicciones

    sobre el número de personas que morirían de varia enfermedades y sobre las proporciones de

    nacimiento de varones y mujeres que cabría esperar.

    El trabajo de Graunt, condensado en su obra NATURAL AND POLITICAL OBSERVATIONS…MADEUPON THE BILLS OF MORTALITY (OBSERVACIONES POLÍTICAS Y NATURALES… HECHAS A PARTIR

    DE LAS CUENTAS DE MORTALIDAD), fue un esfuerzo innovador en el análisis estadístico.

    En América latina es posible encontrar algunos antecedentes estadísticos en la época PRE-

    colombina. Aún cuando los pobladores del tahuantinsuyo no conocían la estadística como tal,

    estaban familiarizados con datos e informes sobre aspectos demográficos y económicos.

    En el Imperio Incaico existía la costumbre de registrar todos los hechos demográficos y

    socioeconómicos, la cual permitió desarrollar técnicas de recopilación y archivo de datos. El Inca y

    su esforzada élite cooperadora, conocían por medio de los Quipus el potencial humano y

    económico del Imperio y, en consecuencia, deducían las necesidades que debían satisfacer.

    El Quipu consistía en un cordón central de lana del que pendían otros cordones unidos por otros,que se diferenciaban entre sí por su grosor, color, número y forma de nudos. El “nudo” dice

    Gracilaso de la Vega, expresa el número pero no la palabra. La Yupana o Abaco, era el accesorio

    del Quipu, y facilitaba el cálculo de grandes cantidades. El Quipu Camayoc era el funcionario que

    conocía la técnica del registro por medio de los nudos. En el Cusco se ubicaba la Oficina Central de

    los Quipus.

    El Quipu sirvió a los antiguos peruanos para levantar los censos de población de cada cierto

    número de años. El Imperio Incaico era una sociedad veraz y, por tanto todos los habitantes

    estaban acostumbrados a decir la verdad en el acto censal.

  • 8/15/2019 Apuntes 1 de Estadística completo

    9/155

     

    9

    Durante el Depotismo Ilustrado de Federico Guillermo I y de Federico El Grande de Prusia, la

    Estadística pasó a ser una organización estatal. Desde hace mucho tiempo, la iglesia siempre se

    dedicó a recopilar ciertos datos demográficos y, a partir del Concilio de Trento (1545-1563), se

    establece la obligatoriedad de inscribir los nacimientos, matrimonios y defunciones.

    Los antecedentes históricos de la Estadística se encuentran fundamentalmente en la demografía,

    recién a mediados del siglo XVII se considera a la Estadística como una disciplina independiente.En Alemania, se creó por primera vez la cátedra de Estadística, originándose la Escuela

    Universitaria Administrativa, la que consideraba la Estadística como una descripción de los

    fenómenos pertenecientes al estado, según la orientación de Vito de Seckendorft (1626-1689) y

    Hermann Conring (1606-1681), quien en 1660 empezó a dictar un curso en la Universidad de

    Helmstadt. Su discípulo Godofredo de Achenwall (1719-1772), fue el primer gran teórico de la

    Estadística en lengua alemana y le dio el nombre de Estadística, basándose en el origen

    etimológico “STATUS”. 

    Por la misma época en Inglaterra nace la Escuela Demográfica o de los aritméticos políticos,

    quienes se proponían determinar en forma cuantitativa las leyes empíricas que regían elcomportamiento de los fenómenos políticos y sociales, que de ninguna manera eran

    independientes del volumen, estructura y distribución de la población. Entre los miembros de

    esta escuela destacaron William Petty (1623-1687), Edmundo Halley (1662-1742), King, Devenant

    y John Graunt (1623-1674), este último realizó un trabajo matemático de estadísticas vitales y

    económicas. En Alemania, esta orientación, en dura lucha con la escuela Achenwall y SchlӦzer,

    obtuvo el primer éxito definitivo gracias al esfuerzo de Johann Meter Sussnilch.

    Por la época Contemporánea, en Francia se originó la Escuela Probabilística, basada en los

    problemas de juegos de azar planteadas por Blas Pascal (1623-1662) por el Caballero de Mére

    (Antonio Gambaud). La solución de estos problemas motivó el auge del Cálculo de Probabilidades,con destacada participación de Pedro de Fermat (1601-1665), Laplace (1749-1827), Poisson

    (1777-1855), los hermanos Bernouilli (Daniel, Jacob y Nicolás), Gauss y Moivré (1667-1754).

  • 8/15/2019 Apuntes 1 de Estadística completo

    10/155

     

    10

    Poco tiempo después el Cálculo de Probabilidades toma un gran impulso debido a los trabajos de

    los franceses Borel, Fréchet y Levy, y de los rusos Tchevyshev (1821-1894), Tchuprov, Markov,

    Kintchine y Kolmogorov (nacido en 1903). Entre los ingleses destacó el clérigo Tomás Bayes.

    Cabe destacar el aporte de Adolph Quetelet  primer presidente de la ISI (1796-1874) que fue el

    primero en aplicar métodos estadísticos modernos al estudio de conjuntos de datos, razón por la

    cual se le reconoce como padre de la Estadística Moderna.

    Durante el siglo XIX y a principios del XX el trabajo estadístico se caracteriza por el estudio de

    grandes masas de datos. La idea básica era la colección completa de datos. Pero, a principios del

    siglo XX y específicamente alrededor de los años treinta, se produjo un nuevo giro en el desarrollo

    de la Estadística. Nació la Estadística Moderna, la Estadística Inductiva o Inferencia Estadística, la

    Estadística Analítica. Se espera obtener información de cada detalle en particular; actualmente se

    buscan métodos que hagan posibles obtener conclusiones generales a partir de muestras y deestudios parciales. En la Estadística moderna, la palabra clave es “MUESTRA”. 

    Estos cambios en la teoría y práctica estadística requirieron cada vez más de las matemáticas

    superiores, entonces surge la Estadística Matemática, cuyos procedimientos característicos son el

    análisis de la varianza, el cálculo de correlaciones y las pruebas de hipótesis estadísticas.

  • 8/15/2019 Apuntes 1 de Estadística completo

    11/155

     

    11

    Los progresos más recientes en el campo de la Estadística se refieren al ulterior desarrollo del

    cálculo de probabilidades, particularmente en la rama denominada indeterminismo o relatividad,

    se ha demostrado que el determinismo fue reconocido en la Física como resultado de las

    investigaciones atómicas y que este principio se juzga aplicable tanto a las ciencias sociales como

    a las físicas.

    En el campo de Estadística Moderna destacaron Francisco Galcton (1822-1911) y Kart Pearson

    (1857-1936), que desarrollaron ideas sobre regresión y correlación, William Gosset (1876-1962),

    quienes desarrollaron métodos de trabajo usados en el análisis estadístico y en la prueba de la

    hipótesis. Por su parte en 1894, Jerzy Neyman, conjuntamente con el hijo de Pearson, crearon la

    teoría del muestreo. Otro destacado estadístico fue Abraham Wald (1902-1950) con aplicaciones

    en el campo de la Genética.

    Resumiendo, en la historia de la evolución de la Estadística se pueden distinguir tres fases:

    CENSOS Y EMPADRONAMIENTOS (HASTA EL SIGLO XVI).

    Desde el momento en que se constituye una autoridad política, la idea de inventariar de una

    forma más o menos regular de la población y las riquezas existentes en el interior está ligada a la

    conciencia de soberanía y a los primero esfuerzos administrativos.

    DE LA DESCRIPCIÓN DE POBLACIONES A LA ARITMÉTICA POLÍTICA (S. XVII a XVIII).

    Las ideas mercantilistas extrañan una intensificación de este tipo de investigación.

    Colbert multiplica las encuestas sobre artículos manufacturados, el comercio y la población: losintendentes del Reino envían a París sus memorias. Vauban, más conocidos por sus fortificaciones

  • 8/15/2019 Apuntes 1 de Estadística completo

    12/155

  • 8/15/2019 Apuntes 1 de Estadística completo

    13/155

     

    13

    Capítulo 1: Introducción a la Estadística Descriptiva

    1.  ¿Qué es la Estadística?

    La Estadística es una ciencia, que se encarga de desarrollar métodos para la recopilación,

     presentación, análisis y uso de los datos, para facilitar la toma de decisiones frente a

    condiciones de incertidumbre y resolver problemas. Cualquier persona, tanto en su carrera

    profesional como en la vida cotidiana recibe información en forma de datos a través de

    diferentes medios de comunicación. A menudo es necesario obtener alguna conclusión a

    partir de la información contenida en los datos, por eso será útil para cualquier persona

    tener cierta comprensión de la estadística. Puesto que los Ingenieros y los científicos

    obtienen y analizan datos de manera rutinaria, el conocimiento de la estadística tiene unaimportancia especial en estos campos. De manera específica, el conocimiento de la

    estadística y la probabilidad puede constituirse en una herramienta poderosa para ayudar a

    los científicos e ingenieros a diseñar nuevos productos, y sistemas, a perfeccionar los

    existentes y a diseñar, desarrollar y mejorar los procesos de producción.

    2.  El papel de la Estadística

    La estadística ha jugado un papel muy importante en el desarrollo de todas las ciencias que

    tienen que ver con la verificación empírica como la ingeniería, la administración, salud,

    Psicología, educación, etc. Así por ejemplo en la industria ha contribuido en el aumento de la

    calidad. Muchas empresas se han dado cuenta de que la baja calidad de un producto tiene un

    efecto pronunciado en la productividad global de la empresa, en el mercado y la posición

    competitiva y, finalmente en la rentabilidad de la empresa.

    3.  El método estadístico de investigaciónEn la investigación estadística por su naturaleza, pueden distinguirse cinco etapas:

    1.  Planeamiento:

    a.  Fundamentación y comprensión del estudio del estudio e identificación de las variables.

    b.  Determinación de objetivos

    c.  Organización de las variables, precisión de los datos e información requerida.d.  Identificación y evaluación de las fuentes de información.

    e.  Identificación y análisis de estudios similares.

    f.  Determinación del ámbito de investigación.

    g.  Preparación del plan para ejecutar la investigación.

    h.  Formación y capacitación del equipo de trabajo.

    i.  Elaboración del calendario de actividades

     j.  Formulación del presupuesto y fuentes de financiamiento.

    k.  Diseño y ejecución de una prueba piloto o experimental

  • 8/15/2019 Apuntes 1 de Estadística completo

    14/155

     

    14

    2.  Recopilación de datos: Es el momento en el cual el investigador se pone en contacto conlos objetos o elementos sometidos a estudio, con el propósito de obtener los datos delas variables analizadas. Los métodos de recolección son diversos, su utilización dependede las posibilidades de acceso a los elementos investigados, del tamaño de la poblacióno muestra de la oportunidad de obtener datos, del presupuesto y de las exigencias deltiempo.

    3.  Organización y presentación de datos,

    Después de la recolección de datos, se procede a su organización, clasificación y

    tabulación, de modo que se facilite la presentación en tablas, cuadros o gráficos.

    Como tarea previa a la organización es indispensable realizar una evaluación, crítica,

    corrección y ajuste de los datos, el propósito es superar las omisiones, o inconsistencias

    y desechar las respuestas no significativas o erróneas. La validez de los resultados y

    conclusiones dependen en gran medida de la fidelidad de los datos utilizados.

    Realizadas las correcciones o ajustes, se inicia el procesamiento de datos con un análisis

    exploratorio, y la construcción de tablas o gráficos  de distribuciones de frecuencias,

    cálculo de medidas de resumen, etc.

    4.  Análisis e interpretación de datos.

    En esta etapa se aplican los argumentos matemáticos y teóricos de la estadística. A través

    de métodos estadísticos se calcula indicadores y medidas de resumen, se establecen

    relaciones entre variables, se estiman valores, se ejecutan pruebas estadísticas, etc.,

    como elementos de referencia para la descripción, análisis e interpretación delcomportamiento de los datos, hacer inferencias válidas y obtener información de los

    elementos o unidades estudiadas.

    5.  Formulación de conclusiones y preparación del informe

    En toda investigación debe analizarse el cumplimiento de los objetivos, en función de los

    resultados fundamentales. Esta contrastación permite elaborar un resumen de los

    aspectos sustantivos, que luego se expresarán en forma de conclusiones y sugerencias

    orientadoras en la toma de decisiones.

    4.  VariablesSon características observables, susceptibles de adoptar distintos valores o ser expresados

    en distintas categorías. Matemáticamente sería X: Ω R

  • 8/15/2019 Apuntes 1 de Estadística completo

    15/155

     

    15

    5.  Clasificación de variables

    5.1.  Por su Naturaleza5.1.1.  Cualitativas: Expresan una cualidad de la unidad elemental o de análisis. Ej. Lugar

    de procedencia, Lugar de nacimiento, sexo, etc.

    5.1.2.  Cuantitativas: Expresan una cantidad, la cual puede obtenerse mediante procesosde conteo o de medición haciendo uso de algún instrumento de medida para dichavariable; por lo que a su vez se pueden subdividir en:

    5.1.2.1.  Discretas:  Expresan cantidades aisladas mediante números enteros oracionales (a/b), su valor se suele obtener mediante procesos de conteo. Ej.Número de hijos por mujer, número de estudiantes matriculados porasignatura, número de trabajadores por empresa, número de productos

    terminados por turno de trabajo, etc.

    5.1.2.2.  Continuas: Expresan cantidades usando los números reales, los cuales sonobtenidos mediante procesos de medición utilizando algún instrumento demedida. Ej. Peso de un recién nacido, Tiempo de vida de una lámparaincandescente, estatura de una persona, etc.

    5.2. Por su escala de medida

    5.2.1. Nominal: Permite clasificar y no admite ninguna operación matemática. Ejemplo:Carrera de estudio, lugar de procedencia, sexo, etc.

    5.2.2. Ordinal: Permite clasificar y ordenar, además es posible establecer relaciones < y >.

    Ejemplo: Rango militar, clase social, nivel de instrucción, etc.

    5.2.3. Intervalo: Permite clasificar, ordenar y medir distancias pero con cero relativo.Admite todas las operaciones matemáticas, excepto la división. Ejemplo:Temperatura, puntaje de un test psicométrico validado, etc.

    5.2.4. Razón: Permite clasificar, ordenar y medir distancias con cero absoluto. Admite todaslas operaciones matemáticas. Ejemplo: Peso, estatura, número de hijos por mujer,etc.

    5.3.  Por el tipo de relación:  es necesario la presencia de por lo menos dos variables. Laclasificación se hace dentro del conjunto de variables que están siendo estudiadas.

    5.3.1. Dependientes: Su valores dependen del valor de otra variable. Ejemplo: rendimientoacadémico.

    5.3.2. Independientes: Sus valores no dependen de otra variable, sino de la voluntad delinvestigador. Ejemplo: Horas de estudio

    5.3.3. Intervinientes:  Son aquellas que condicionan el modo de influencia de la variableindependiente sobre la dependiente. Ejemplo: Nivel de estrés.

    5.4. Por el orden en el registro de datos.

    5.4.1. Atemporales. Los valores NO están asociados al tiempo en que fueron registrados.Sexo, Lugar de procedencia, etc.

  • 8/15/2019 Apuntes 1 de Estadística completo

    16/155

     

    16

    5.4.2. Temporales (Series de tiempo). Los valores están asociados al tiempo en que fueronregistrados de la fuente primaria. Ejemplo: Preferencia electoral actual, ventasmensuales, etc.

    5.5. Por la amplitud

    5.5.1.  Individuales: Se refieren a las características de las unidades elementales, comopor ejemplo personas

    5.5.1.1.  Privadas: Se refieren a las características de las unidades elementales quevoluntariamente permiten su observación, por ejemplo: Coeficiente deinteligencia, Nivel de estrés, etc.

    5.5.1.2.  Públicas. Se refieren a características que pueden ser observadas inclusosin el permiso del individuo, por ejemplo: Sexo, raza, color de cabello, etc.

    5.5.2.  Colectivas:  son características que se refieren a colectivos de unidades

    elementales, por ejemplo: Tasa de morbilidad en una población, inflación, etc.

    6.  Operacionalización de variables

    Es el proceso mediante el cual se hace medible una variable con un nivel de abstracción

    elevado o que no es directamente medible.

  • 8/15/2019 Apuntes 1 de Estadística completo

    17/155

     

    17

    Ejemplo del cuadro de operacionalización de la variable Nivel Socioeconómico (NSE)

    CONCEPTO

    (Variable teórica)

    DIMENSIÓN INDICADOR

    (Variable Empírica)

    Valores o

    cualidades

    NSE:

    Es una característica de unhogar. El hogar obtiene suNSE a partir decaracterísticas propias delmismo y el entorno en quese mueve. La primeraforma la parte “económica”

    del NSE y la segunda laparte “socio” del NSE.

    Además, el NSE incorporatanto características físicasde la vivienda que habita elhogar, como de las

    personas que integran alhogar.

    D1: Nivel Social: 

    Es el entorno en que elhogar se mueve (los demás

    hogares con los queinteractúa; La ocupaciónque tienen, las escuelas aque se asiste, el clubdeportivo al que pertenece,las actividades culturales). 

    I1: Número de años deestudio del jefe del hogar  

    Número

    I2: Grado académico del jefedel hogar  

    Ninguno, Br., Mg.,Dr.

    I3: Ocupación del Jefe delhogar  

    Gerente, …, obrero

    eventual o ambulante

    I4: Zona de residencia  Urb. Santa Victoria,…, P.J. El Bosque 

    I5: Turismo 

    Turismo Internacional,

    Turismo nacional,

    Turismo local,

    No hace turismo

    D2: Nivel económico: 

    Está determinado por lacapacidad económica delhogar (cómo estáconstituido y cómo son laspersonas que lo conforman;qué artículos o posesionestiene) 

    I6: Ingreso económico familiar

    mensualEn nuevos soles

    I7: Gasto en alimentación  En nuevos soles

    I8: Vehículos 

    Uso particular del año

    Uso Partic. No del año

    Para trabajo

    1.  Nivel Alto A1: En esta categoría se encuentran las personas que tienen un nivel deestudios Superior / post-grado, con un promedio en años de estudios de 17.5. Estas personas ocupan cargos de Gerentes Generales cuyo ingreso es de $5000. Y tienenun gasto promedio mensual de $750 en alimentos. En servicios de televisión acontrol remoto es al 100% de igual manera en tenencia de teléfono y serviciosdomésticos.

    2.  Nivel Medio Superior A2: En esta categoría se encuentran las personas con un nivelde estudios Superior Universitarios, con un promedio de años de estudios de 16.8.Estas personas ocupan cargos profesionales independientes / dependientes.

    Con un ingreso familiar mensual más de $2000, y tienen un gasto promedio

    mensual de $450 en alimentos.

    En servicios de tenencia de televisión a control remoto es de 100% de igual

    manera en tenencia de teléfono y servicios domésticos.

  • 8/15/2019 Apuntes 1 de Estadística completo

    18/155

     

    18

    3.  Nivel Medio Típico B1: En esta categoría se encuentran las personas con un nivelde estudios Superior Universitario, con un promedio en años de estudios de 16.7.Estas personas ocupan cargos profesionales independientes / dependientes. Conun ingreso familiar mensual mas de $1000, y tienen un gasto promedio mensual de$280 en alimentos. En servicios de tenencia de televisión a control remoto es de92% en tenencia de teléfono es de 96% y en servicios domésticos es de 67%.

    4.  Nivel Medio Inferior B2: En esta categoría se encuentran las personas con un nivelde estudios Universitario y no Universitario, con un promedio en años de estudiosde 15.1. Estas personas ocupan cargos especializado/ profesional independiente.Con un ingreso familiar mensual mas de $780, y tienen un gasto promedio mensualde $235 en alimentos. En servicios de tenencia de televisión a control remoto esde 82% en tenencia de teléfono es de 92% y en servicios domésticos es de 32%.

    5.  Nivel Bajo Superior C1: En esta categoría se encuentran las personas con un nivelde estudios Superior no Universitario/ Secundaria, con un promedio en años deestudios de 13.1. Estas personas ocupan cargos pequeños Comerciantes/ Trabajoespecializado Con un ingreso familiar mensual mas de $400, y tienen un gastopromedio mensual de $180 en alimentos. En servicios de tenencia de televisión acontrol remoto es de 77% en tenencia de teléfono es de 73% y en serviciosdomésticos es de 8%.

    6.  Nivel Bajo Inferior C2: En esta categoría se encuentran las personas con un nivelde estudios Secundaria, con un promedio en años de estudios de 10.6. Estaspersonas ocupan cargos pequeños Comerciantes/ Trabajo especializado Con uningreso familiar mensual mas de $320, y tienen un gasto promedio mensual de$150 en alimentos. En servicios de tenencia de televisión a control remoto es de61% en tenencia de teléfono es de 56% y en servicios domésticos es de 2%.

    7.  Nivel Muy Bajo D: En esta categoría se encuentran las personas con un nivel deestudios Secundaria/ Primaria, con un promedio en años de estudios de 8.8. Estaspersonas ocupan cargos como Empleado poco especializado/ Obrero con uningreso familiar mensual mas de $230, y tienen un gasto promedio mensual de$135 en alimentos. En servicios de tenencia de televisión a control remoto es de42% en tenencia de teléfono es de 25% y en servicios domésticos es de 1%.

    8.  Nivel Bajo Extremo E : En esta categoría se encuentran las personas con un nivelde estudios Primarios, con un promedio en años de estudios de 6.2. Estas personasocupan cargos como Obrero eventual/ Ambulante con un ingreso familiar mensualmas de $150, y tienen un gasto promedio mensual de $105 en alimentos. Enservicios de tenencia de televisión a control remoto es de 16% en tenencia de

    teléfono es de 7% y en servicios domésticos es de 0%. 

    PERFIL DE LOS NIVELES SOCIO ECONOMICOSA1 A2 B1 B2 C1 C2 D E

  • 8/15/2019 Apuntes 1 de Estadística completo

    19/155

     

    19

    Característicasdominantes

    Alto Medio superior Medio TípicoMedioinferior

    Bajo superior Bajo inferior Muy Bajo Bajo Extremo

    % de hogares en LimaMetropolitana

    0.8 3.5 6.5 8.8 10.9 21.5 36.1 11.9

    Educación del jefe delhogar

    Superioruniversitaria /

    PostgradoSuperioruniversitaria Superioruniversitaria

    Superior

    universitaria /nouniversitaria

    Superior nouniversitaria /secundaria

    Secundaria Secundaria/ Primaria Primaria /Secundaria

    Años de estudio del jefe del hogar

    17.5 16.8 16.7 15.1 13.1 10.6 8.8 6.2

    Ocupación del jefe delhogar

    Empresario /Gerente General

    ProfesionalIndependiente /

    Dependiente

    ProfesionalIndependiente /

    Dependiente

    Trabajadorespecializado/ Profesional

    Independiente

    Pequeñocomerciante /

    TrabajadorEspecializado

    Pequeñocomerciante /

    TrabajadorEspecializado

    Empleadopoco

    especializado / Obrero

    Obrero eventual/ ambulante

    Ingreso familiarmensual bruto

    + us$ 5,000 + us$ 2,800 Us$ 1,000 Us$ 780 Us$ 400 Us$ 320 Us$ 230 Us$ 150

    Promedio(aproximado) gasto

    mensual en alimentosUs$ 750 Us$ 450 Us$ 280 Us$ 235 Us$ 180 Us$ 150 Us$ 135 Us$ 105

    Promedio(aproximado) tenencia

    de TV LSD / PLASMA

    100% 100% 92% 82% 77% 61% 42% 16%

    Tenencia deteléfono/Internet

    100% 100% 96% 92% 73% 56% 25% 7%

    Tenencia de TV – Cable

    Servicio doméstico 100% 100% 67% 32% 8% 2% 1% 0%Vehículo de uso

    particularDel año De 1 año De 3 años De 4 años

    Fuente: Apoyo Opinión y Mercado S.A. Actualizado por M. Hurtado S. Junio/2006

    7.  Recolección de datos

    Es el uso de técnicas e instrumentos para recopilar información acerca de un determinado

    tema que es objeto de investigación. Es una de las tareas más importantes en lainvestigación, pues de ello depende la calidad de conocimiento que se pueda obtener en

    dicha investigación.

    7.1. Etapas de la recolección de datos:

    a.  Planificación: Comprende el diseño del cuestionario, diseño de muestra, selecciónde informantes, reclutamiento y capacitación de encuestadores, incluyendo unaprueba piloto como práctica de campo, reajustes del cuestionario y cálculo detiempos y costos del operativo de recolección de datos.

    b.  Registro de datos: Consiste en la acción de registrar los datos de acuerdo a lamodalidad prevista en la planificación.

    c.  Revisión y crítica: Esta etapa se realiza en dos momentos, la primera a cargo delsupervisor de encuestadores, se realiza en el escenario mismo de la recolección dedatos y la segunda a cargo del equipo de investigación y se realiza en el centro deoperaciones de la investigación. La actividad consiste en revisar que los datos seanconsignados en el instrumento de acuerdo a lo previsto guardando la coherenciacorrespondiente a cada informante. Finalmente comprende la codificación de lasrespuestas abiertas si las hubiera.

    d.  Digitación a una base electrónica de datos: Previamente se debe diseñar la basede datos definiendo los códigos numéricos en cada una de las preguntas, para luegoconsignar cada uno de los datos en la base. En esta etapa se enumera loscuestionarios y se consigna en la base.

  • 8/15/2019 Apuntes 1 de Estadística completo

    20/155

     

    20

    e.  Limpieza de la base de datos: Se procede a revisar la consistencia de la base dedatos, para lo cual se procede en dos etapas, la primera consiste en seleccionar unamuestra aleatoria del 5% de registros de la base y se procede a revisar cada uno delos registros de la base comparándolos con el cuestionario correspondiente,posteriormente se elaboran tablas de frecuencia de una y dos entradas y se examinala consistencia de los datos de cada uno de las variables, poniendo especial cuidadoen los filtros que pueda tener el cuestionario

    7.2. Técnicas de recolección de datos:

    Existen diversas técnicas, las mismas que pueden ser utilizadas de acuerdo a la

    naturaleza de los datos que se pretenden recolectar. Entre las más conocidas

    tenemos:

    a. Entrevistab.  Encuestac. Observaciónd.  Sesión de Grupo

    La Entrevista: Se utilizan para obtener información de forma verbal, a través de

    preguntas, acerca de las necesidades del tema de investigación. Los entrevistados

    deben ser personas pertenecientes a la población objeto de estudio.

    Para realizar una entrevista se deben preparar las preguntas que van a plantearse, y

    los documentos necesarios, se debe también fijar un límite de tiempo y preparar laagenda para la entrevista, finalmente se debe elegir un lugar donde se puede

    conducir la entrevista con la mayor comodidad, para lo cual se debe hacer la cita

    con la debida anticipación.

    Los tipos de preguntas que se utilizan pueden ser abiertas o no estructuradas, con

    las que se obtienen respuestas cualitativas y subjetivas, por ejemplo: ¿Qué opina

    acerca de la actual gestión municipal?, también se pueden utilizar preguntas

    cerradas o estructuradas, pudiéndose obtener respuestas cuantitativas y concretas,

    por ejemplo ¿Cuántos accidentes de transito ocurrieron en las ultimas fiestas

    navideñas?

    La encuesta: Es una técnica para recopilar información tomando una muestra de la

    población objetivo. Se obtiene información sobre las necesidades y preferencias de

    usuarios o clientes. Difiere de un censo en donde toda la población es estudiada. Se

    pueden obtener datos estadísticos de la información recolectada. Las preguntas

    suelen ser cerradas.

    Observación: Esta técnica se usa con el fin de estudiar a las personas en sus

    actividades de grupo y como miembros de la organización. Permite al analista

    determinar que se está haciendo, como se está haciendo, quien lo hace, cuando selleva a cabo, cuanto tiempo toma, dónde se hace y por qué se hace.

  • 8/15/2019 Apuntes 1 de Estadística completo

    21/155

     

    21

    Tipos de Observación: Observar sin ser detectado, observar siendo detectado sin

    intervenir, observar e intervenir o interactuar con la persona observada.

    Preparación para la observación: Determinar y definir aquello que va a observarse.Estimar el tiempo necesario de observación. Obtener la autorización de la gerencia

    para llevar a cabo la observación. Explicar a las personas que van a ser observadas

    lo que se va a hacer y las razones para ello.

    Sesión de Grupo.  Consiste en reunir a todos los participantes del proyecto para

    generar alternativas de solución ante un determinado problema. La lluvia de ideas

    es una de las técnicas más utilizada en estos casos en donde cada miembro hace

    sus aportaciones y al final se decide por votación cuales serán las alternativas más

    adecuadas frente al problema planteado.

    8.  Instrumentos de recolección de datos.De acuerdo al tipo de variable existen instrumentos apropiados para la recolección de datos;así, tenemos que para las variables naturales o físicas, existen hojas de registro oinstrumentos físicos para cada caso, por ejemplo, para medir el peso, se puede utilizar unabalanza, para medir una distancia, se puede utilizar el metro, para medir el voltaje del fluidoeléctrico, se puede utilizar el voltímetro, etc.; en cambio para variables sociales se suelenutilizar los cuestionarios, los mismos que deben ser elaborados cuidadosamente pararecolectar adecuadamente los datos que se necesitan.

    a.  Propiedades de los Cuestionarios: Cada uno de los ítems de un cuestionario debe tener las

    propiedades de validez y confiabilidad. Validez, significa que el ítem debe medir lo que sepretende medir, y confiabilidad, significa que cada ítem debe medir siempre lo mismocuanta veces sea utilizado.

    b.  Partes de un cuestionario: 

    i.  Nombre de la Institución:  a la que pertenece o está adscrito el proyecto deinvestigación, podría ser suficiente con el “logo” institucional, el cual se suelo colocaren la parte superior izquierda. A esta misma altura pero al lado derecho se coloca unespacio para la numeración correlativa de los cuestionarios “N° ___ “, lo cual permitiráuna fácil ubicación en la base de datos.

    ii.  Título del cuestionario: El cual contiene el objeto de estudio

    iii.  Objetivo de la investigación: Es opcional, se justifica sólo cuando el cuestionario va haser autodiligenciado, en cambio cuando su aplicación va ha estar a cargo de unencuestador, no es necesario, pues ocuparía un espacio que haría elevar los costosinnecesariamente.

    iv.  Identificación del Informante: La identificación precisa del informante con nombre ydirección, y otros datos como DNI, Teléfono, etc. Se puede justificar sólo en estudiosde a nivel censo, en los que se pretende elaborar un padrón a nivel poblacional. Si ésteno fuera el caso, la identificación puede ser a un nivel muy leve, solo lo necesario parahacer los cruces o identificación de clústeres en el análisis, para lo cual no es necesarioel nombre u otros datos del informante.

    v.  Batería de preguntas:  las cuales se organizan por áreas temáticas u objetivos de lainvestigación, teniendo cuidado la secuencia de las preguntas para evitar que el

  • 8/15/2019 Apuntes 1 de Estadística completo

    22/155

  • 8/15/2019 Apuntes 1 de Estadística completo

    23/155

     

    23

    i.  Respuesta única:  Sólo admiten una única respuesta, de una lista de alternativasposibles.¿Cuál es su estado civil?

    Soltero(a)……  1 Divorciado(a)…  4Casado(a)……  2 Conviviente……  5Viudo(a)….......   3 Separado……..  6

    ii.  Respuesta múltiple: pueden admitir una o más respuestas posibles de la relación dealternativas posibles.

    Ejemplo:¿Con qué servicios cuenta actualmente su vivienda?

    Teléfono fijo……  1  Agua Potable……  4TV Cable………  2 Desagüe…………  5Internet…………  3 Luz eléctrica……  6

    c.  Por su graduación

    i.  Preguntas valorativas: Se suelen utilizar para asignar valoraciones en una escalaespecífica, generalmente entre 0 y 10, acerca del grado de aceptación o conformidadcon un servicio, de la intención de acudir o tomar un servicio, o acerca de undesempeño.

    ¿Durante su permanencia en el establecimiento cómo valora el trato general que lebrindaron?. Utilice una escala entre 0 y 10, teniendo en cuenta que:

    0 1 2 3 4 5 6 7 8 9 10

    Pésimo Excelente

    Señale aquí su respuesta:

    ii.  Preguntas en escala de Licker. Se redactan en forma de proposición, redactada yasea en positivo o en negativo y se le pide al informante que manifieste su nivel deacuerdo o desacuerdo con dicha proposición, para lo cual se les presentageneralmente cinco niveles: Total acuerdo, De acuerdo, Indiferente, En Desacuerdoy en Total Desacuerdo.

    Ejemplo

    Los contenidos del curso evidencian en su desarrollo una actualización teórica

    práctica

    - En Total desacuerdo ………..  1-  En desacuerdo……………….  2-  Indiferente ……………………  3-  De acuerdo ………………….  4-  Totalmente de acuerdo …….  5

    10  Matriz tripartita de datos (Base de datos)Es un ordenamiento de los datos en filas y columnas, de moda tal que en cada columna

    aparecen los datos de una variable en todos los informantes y en cada fila aparecen los datos

    de un informante correspondiente a todas las variables correspondientes al estudio. Esta base

  • 8/15/2019 Apuntes 1 de Estadística completo

    24/155

     

    24

    se suele registrar en formato electrónico como una hoja de Excel o algún software estadístico

    como el SPSS.

    Ejemplo: A continuación se presenta una base de datos de 8 variables de respuesta únicacorrespondiente a 12 informantes en formato Excel.

    Informante  Variables: Sexo, Edad, Escuela, …., N° de dormitorios 

    N°cuest.

    Sexo 

    1=Varón2=Mujer 

    Edad (años)

    Escuela 1=Estad.2=Matem.3=Física.

    4=Comp.5=Ing.Electr. 

    Depart.

    Proced. 1=Lamb.2=Piura3=Cajam.4=Amaz.5=Tumbes

    6=SanMart.7=Otros 

    Distrito de

    residencia 1=Chiclayo2=J.L.O.3=La.Victoria

    4=Lambayeque5=Otro 

    N° de

    miembros

    del hogar

    nuclear(padre,

    madre ehijos) 

    Condición

    Tenencia de

    Vivienda1=Propia

    2=Alquil.

    3=Cedida

    4=Invasión5=Otra 

    Número de

    dormitorios

    1 2 20 2 2 1 5 1 42 1 18 2 1 1 4 1 23 2 18 2 1 4 4 1 54 1 18 1 3 4 7 2 15 2 19 2 3 2 5 2 26 1 18 2 1 2 6 1 37 2 18 2 1 2 4 2 28 2 21 2 1 5 6 1 39 2 18 2 1 1 4 1 610 1 21 2 1 4 3 1 311 1 20 2 1 1 5 1 612 1 20 2 1 5 4 1 3

    Esta misma base en formato SPSS tiene la siguiente presentación

    Pasos hacer una base en el SPSS:

    1°. En el SPSS, seleccionar la hoja “Vista de variables” . Como se puede apreciar,

    en esta hoja aparecen 10 columnas, de las cuales sólo utilizamos las 6primeras par ingresar cada una de los atributos o características de cada

  • 8/15/2019 Apuntes 1 de Estadística completo

    25/155

     

    25

    variable. Cada una de las filas se utilizan para definir una variable derespuesta única.

    En la primera columna designada con el encabezamiento “nombre” se escribeel nombre de la variable, el cual puede ser un texto de a lo más 8 caracteres sinespacios en blanco, pudiendo admitir un punto o guion bajo como parte de loscaracteres. Generalmente se escribe una abreviatura del nombre de la variable,

    como por ejemplo: “Edad_mad ” para hacer referencia a la Edad de la madre, osimplemente la letra “p” seguida de un número para hacer referencia al número de

    la pregunta del cuestionario, por ejemplo “ p14” para hacer referencia a la

    pregunta 14, la cual contiene los datos de la “Edad de la madre”.

    En la segunda columna designada con el encabezamiento “tipo” se escribe eltipo de variable, el cual puede ser visualizado colocando el cursor en ladoizquierdo de la celda, tal como se aprecia en la siguiente figura

    El cuadro de tipos de variable que se visualizará es el siguiente:

  • 8/15/2019 Apuntes 1 de Estadística completo

    26/155

     

    26

    Es este cuadro debemos marcar el tipo de variable; si ésta es numérica, se deberáconsignar el número de decimales, caso contrario el SPSS asumirá por defecto 2decimales. Asimismo cuando la variable es cualitativa es decir se ingresará textos,debemos marcar como tipo de variable “cadena” y a continuación asignar el número

    máximo de caracteres que se puede registrar en la base, en forma similar, si nohacemos esto, el SPSS asumirá por defecto un ancho de 8 caracteres. Estas dos

    especificaciones aparecerán en las columnas 3 y cuatro designadas con losnombres “Anchura” y “Decimales” respectivamente. Debemos tener presente queuna variable cualitativa cuya información es recopilada con una pregunta cerrada ycuyas categorías han sido codificadas con números, se debe definir como variablenumérica., puesto que a la base se ingresará códigos numéricos sin decimales, encuyo caso cada código debe ser definido en la sexta columna.

    En la quinta columna designada con el encabezamiento “Etiqueta” se escribe elnombre completo de la variable, el cual aparecerá como título del cuadro defrecuencias cuando esta variable sea procesada. Se debe tener cuidado con laortografía para no tener que corregir posteriormente en las salidas del

    procesamiento de la variable.

    En la sexta columna designada con el encabezamiento “Valores” se escribe ladefinición de cada código numérico utilizado en la pregunta específica. Para teneracceso a realizar esta definición, también debemos hacer “Click” en la parte

    izquierda de la celda, con lo cual aparecerá el siguiente cuadro de diálogo, en elcual se asigna el nombre a cada código utilizado en la pregunta, por ejemplo parala pregunta:

    Sexo: Varón … 1 Mujer … 2 

  • 8/15/2019 Apuntes 1 de Estadística completo

    27/155

     

    27

    El 1 significará “varón” y el 2 significará “mujer”, lo cual se irá asignando con el

    botón “añadir”. Al culminar con la definición de todos los códigos se debe hacer clic

    en el boton “Aceptar” 

    Note que la primera fila siempre es utilizada para definir la numeración correlativade los cuestionarios por lo que se le suele dar el nombre de “número”. A partir de

    la segunda fila se definen los campos para cada una de las variables queaparecen en el cuestionario.

    Al visualizar la otra hoja “vista de datos”, aparecerá la siguiente presentación:

    Ejemplo: supongamos que deseamos estudiar la relación entre el rendimiento académico

    de los estudiantes universitarios de Lambayeque en el semestre académico 2014-II, y las

    condiciones de estudio de dichos estudiantes.

    Aquí existen dos variables:

    1.  Rendimiento Académico2.  Condiciones de estudio

    A continuación presentamos las definiciones operacionales dichas variables:

  • 8/15/2019 Apuntes 1 de Estadística completo

    28/155

     

    28

    Variable Y: Rendimiento académico de los estudiantes Universitarios en el semestre2014-II: Está dado por el promedio ponderado obtenido por el estudiante en elsemestre académico 2014-II

    Variable X: Condiciones de estudio de los estudiantes en el semestre 2014-II: Se refiere acada una de las condiciones de estudio que tuvieron en el semestre académico 2014-IIlos estudiantes universitarios de Lambayeque, en cuanto a lugar de procedencia,características del hogar, carga académica, recursos de apoyo al estudio, y situaciónlaboral.

    Cuadro de Operacionalización de la variable “Condiciones de estudio” 

    Variable Dimensiones Indicadores Valores / categoría

    Condiciones deEstudio:Se refiere a cada unade las condiciones deestudio que tuvieronen el semestreacadémico 2013-Ilos estudiantesuniversitarios deLambayeque, encuanto a lugar de

    procedencia,características delhogar, cargaacadémica, recursosde apoyo al estudio,y situación laboral. 

    Información general

    Sexo Varón, Mujer

    Edad AñosEscuela Profesional Estadística, Física, … 

    Dpto. procedencia Lambayeque, Piura, ..

    Distr. residencia Lambayeque, ….. 

    Características elhogar

    N° de miembros del hogar Número

    Tenencia de la vivienda Propia, alquiler, …. 

    N° de dormitorios de la vivienda Número

    Servicios de la vivienda Luz, Agua, …. 

    Espacio en la vivienda para estudiar Si, No

    Carga académica

    N° de cursos matriculados Número

    N° de cursos aprobados NúmeroN° de horas de estudio a la semana

    Recursos de apoyo alestudio

    N° de textos adquiridos

    Fuentes de consulta

    Tenencia de computadora

    Situación laboral

    Ocupación laboral

    N° de horas de trabajo a la semana

    Actividad en el trabajo

    El cuestionario para este tema de investigación será el siguiente:

  • 8/15/2019 Apuntes 1 de Estadística completo

    29/155

     

    29

    CONDICIONES DE ESTUDIO DE ESTUDIANTES UNIVERSITARIOS EN EL 2014-II

    Objetivo: Medir la relación entre el rendimiento académico y las condiciones de estudio en estudiantes universitarios I.  Información General 

    Nombre: ___________________ Sexo: 1. Varón ( ) 2. Mujer ( ) Fecha de Nac. ___ / ___ / __

    Escuela: ______________________ Año y semestre de ingreso: (Ejemplo: 2014-I): ______ - __

    Departamento donde vivía habitualmente y terminó sus estudios secundarios: 1.Lambayeque( )2.Piura ( ) 3.Cajamarca ( ) 4.Amazonas ( ) 5.Tumbes ( ) 6.San Martín ( ) 7.Otros ( ): _________

    Distrito donde reside actualmente para estudiar:  1.Chiclayo ( ) 2 . J.L.O. ( ) 3 . La Victoria ( ) 4.Lambayeque ( ) 5. Ferreñafe ( ) 6. Mórrope ( ) 7. Otro ( ) Especifique: _______________

    II.  Características del hogar 1. Si Hogar es el conjunto de personas que satisfacen sus necesidades de alimentación y vivienda

    de un mismo presupuesto, ¿Cuántos miembros tiene su hogar? : ______

    2. ¿Cuál es la condición de tenencia de la vivienda de su hogar?: 1.Propia( ) 2.Alquilada ( ) 3.Cedidaen uso sin pago ( ) 4.Invasión( ) 5.Otra forma ( ) ____________________

    3. ¿Cuál es el número de dormitorios de la vivienda?. _____

    4. ¿Con qué servicios cuenta la vivienda?:  1. Agua ( ) 2. Desagüe ( ) 3. Electricidad ( ) 

    4.Teléfono ( ) 5. TV Cable ( ) 6. Internet ( ) 

    5. ¿Su vivienda dispone de un espacio solo para estudiar?: 1. Si ( ) 2.No ( ) 

    III. Carga académica en el semestre 2014-II 6. ¿En cuántas asignaturas estuvo matriculado(a) en el semestre 2014-II?: _____

    7. ¿Cuántas asignaturas aprobó en el semestre 2014-II?: _____8. Indique en forma aproximada el nº de horas a la semana que le dedicó al estudio de todas sus

    asignaturas en el semestre 2014-II (tome referencia un periodo típico que no sea tiempo de evaluaciones, además noincluya en la estimación las horas que le dedica a asistir a clases):   ____

    IV. Recursos de apoyo al estudio 9. ¿Cuántos textos adquirió para apoyar sus estudios en el semestre 2014-II?: _____

    10.  ¿Cuál fue su fuente habitual de consulta, para hacer sus trabajos académicos en el semestre 2014-II?: 1.  Libros propios( ) 2. Biblioteca ( ) 3.Internet ( ) 4.Otro ( ): _______________

    11. ¿Ud. tuvo acceso a usar una PC o Latop personal en su casa en el semestre 2014-II?:1.Si ( ) 2.No ( )

    V. Situación laboral12. ¿Ud. realizó alguna ocupación laboral regular en el semestre 2014-II? (Incluye trabajo remunerado o no

    remunerado en algún negocio familiar):  1. Si ( ) → ¿Cuántas horas a la semana? _____

    2. No ( ) → Pase a pregunta 14

    13. ¿Cuál fue la actividad principal que realizó en su trabajo?:_________________________

    VI. Rendimiento Académico14. ¿Cuál fue su promedio ponderado en el semestre 2014-II?: _______

    Muchas graciasFecha: ____ / ___ / ____ Encuestador:______

    N° ____

  • 8/15/2019 Apuntes 1 de Estadística completo

    30/155

     

    30

    11 . Organización de datos en tablas de frecuencia

    La organización de los datos en tablas de frecuencia, constituye el primer pasopara un análisis descriptivo de los datos y sirve para identificar empíricamente, la

    estructura de la distribución de una variable en estudio. Una tabla nos puedereflejar, el máximo y mínimo de la variable y por lo tanto el rango en el cual lavariable toma sus valores, también nos puede revelar si los datos de la variableestán concentrados en una clase o categoría, o en un grupo de clases ocategorías.

    Una tabla de frecuencias, en general tiene tres partes principales:

    1°. El Número y títu lo de l a t ab la : El número de la tabla sirve para hacer unareferencia rápida de la tabla, en cambio el título, debe contener el nombre de lavariable, en donde han sido observados los datos de la variable, es decir las

    unidades elementales o de análisis, según sea el caso, finalmente el momentoen fueron tomados los datos, o el período temporal al cual corresponden losdatos.

    Ejemplo:

    2°. El cuerpo de la tabla : Es la tabla de frecuencias propiamente dicha, en la cualtambién podemos identificar tres componentes:

    Encabezamiento: En la parte superior de la primera columna del ladoizquierdo se escribe el nombre de la variable y las unidades de medida.

    Clases o categorías: En la primera y debajo del nombre de la variable(encabezamiento) se ubican las clases o categorías de la variable. el númerode clases se suele representar por “m ” 

    Frecuencias: A partir de la segunda columna se escriben las frecuencias, lasmismas que pueden ser de dos clases, absolutas y relativas, y cada una deellas a su vez pueden ser simples o acumuladas; así tenemos:

      Frecuencias absolu tas simples   (   in ): Indica el número de elementos o

    datos que contiene la clase o categoría “i ”. 

      Frecuencias absolu tas acum uladas menor igual que   (   i N  ): Expresa el

    número de elementos o datos acumulados desde la primera clase hasta lai-ésima clase.

    i

     j

     ji   n N 1

     

  • 8/15/2019 Apuntes 1 de Estadística completo

    31/155

     

    31

      Frecuencias absolu tas acum uladas mayor igual que  (   i N  ): Expresa el

    número de elementos o datos acumulados desde la i-ésima clase hasta laúltima clase.

    m

    i j

     ji   n N   

      Frecuencias relat ivas sim ples (   ih ): Expresa la proporción de elementos o

    datos que representan los “ni ”  datos contenidos en la i-ésima clase.

    n

    nh   ii     donde

    m

    i

    inn1

    = número total de datos y 11

    m

    i

    ih  

      Frecuencias relat ivas porcentuales simples   (   %ih ): Expresa el

    porcentaje de elementos o datos que representan los ni datos contenidos enla i-ésima clase.

    100%   n

    nh   ii  

      Frecuencias relat ivas porcentu ales acumuladas menor igu al que  (   %i H 

    ): Expresa la proporción en términos porcentuales de elementos o datosacumulados desde la primera clase hasta la i-ésima clase.

    100%   n

     N  H    ii  

      Frecuencias relat ivas porcentu ales acumuladas mayor igu al que   (%i H  ): Expresa la proporción porcentual de elementos o datos

    acumulados desde la i-ésima clase hasta la última clase.

    100%  

    n

     N  H    ii  

    3°. Fuente:  Expresa el lugar de donde fueron obtenidos los datos, de modo talque cualquier persona pueda acudir a la fuente y encontrarlos. Cuando el

    investigador que presenta una tabla de frecuencias es el que obtuvo los datosdirectamente del informante utilizando sus propios instrumentos, no esnecesario que escriba la fuente, en virtud que él mismo es el autor.

  • 8/15/2019 Apuntes 1 de Estadística completo

    32/155

     

    32

    Tabla N° 1 Base datos para ejemplos de tablas de frecuencias

    Jefe dehogar

    Lugar_ProcChic=1Lamb=2Ferr=3

    Cajam=4Piura=5Otros=6 

    N° Personaspor hogar

    Edad(años)

    Peso(Kgr.) Cuenta

    1 1 1 42 66.6 12 1 3 39 59 13 6 6 35 69.2 14 1 1 41 73 15 2 4 50 66.3 16 1 2 39 58.6 1

    7 1 2 33 67.5 18 1 3 30 66.1 19 1 3 26 63.1 1

    10 2 4 32 55.8 111 1 3 35 69.1 112 1 2 26 53.9 113 3 5 43 64.4 114 1 2 40 72.2 115 1 2 30 64.4 116 2 4 46 68.1 117 4 5 47 73.2 118 1 3 38 60.5 1

    19 1 4 38 66.4 120 2 4 45 61.9 121 1 3 28 69.1 122 4 5 43 57.9 123 2 4 37 62.7 124 1 3 36 65.7 125 1 3 40 63.8 126 1 4 32 71.6 127 3 5 38 52.4 128 1 4 49 61.9 129 1 3 54 58.8 130 2 5 31 67 1

    31 1 3 33 63.8 132 1 3 44 73.4 133 2 4 43 61.3 134 1 3 25 61.3 135 1 4 31 66 136 5 6 34 69.8 137 1 2 34 71.1 138 3 5 36 76.9 139 1 2 35 67.2 140 6 6 36 65.9 1

  • 8/15/2019 Apuntes 1 de Estadística completo

    33/155

     

    33

    12.1. Tabla de frecuencias para variables cualitativas

    En este caso las categorías están determinadas por cada una de lascategorías de la variable cualitativa. En esta clase de tablas solamentese pueden obtener frecuencias simples, tanto absolutas comorelativas, y las clases deben ser ordenadas de mayor a menor, deacuerdo a su frecuencia absoluta simple, teniendo presente que sihubiera una categoría “otros ”, ésta debería ser ubicada al final, aun

    cuando no tenga la mínima frecuencia. Finalmente se recomiendaevitar el uso de símbolos en el encabezamiento de cada una de lascolumnas de la tabla, así como también evitar las líneas verticales,solamente se deben marcar las líneas horizontales delencabezamiento y la del final para totalizar las frecuencias. Lasfrecuencias absolutas simples se obtienen mediante un proceso deconteo, el cual puede hacerse manualmente mediante la técnica delpaloteo o usando algún software como el Excel o el SPSS.

    Ejemplo 1: Usando la base de datos presentada en la tabla N° 1construir una tabla de frecuencias para la variable Lugar deprocedencia.

    1° Paso: Usando la técnica del paloteo obtenemos las frecuencias

    absolutas simplesugar e proce encia e je es e ogar

    Chiclayo IIIII IIIII IIIII IIIII IIIII = 25Lambayeque IIIII II = 7Ferreñafe III = 3Cajamarca II = 2Piura I = 1Otros II = 2

    Total = 40

    2° Paso: Construir la tabla

    Tabla N° 2 Lugar de procedencia de los jefes de hogar residentes enel distrito de Chiclayo. Marzo 2011

    Lugar deprocedencia

    N° de jefes dehogar

    Proporción de jefes de hogar

    % de jefes dehogar

    Chiclayo 25 0.625 62.5Lambayeque 7 0.175 17.5Ferreñafe 3 0.075 7.5Cajamarca 2 0.05 5.0Piura 1 0.025 2.5

    Otros 2 0.050 5.0Total 40 1 100Fuente: Encuesta a hogares, marzo 2011

  • 8/15/2019 Apuntes 1 de Estadística completo

    34/155

     

    34

    Note en esta tabla que:

    Variable: Lugar de procedencia del jefe del hogar, aparece en el título dela tabla y en el encabezamiento de la primera columna, y suscategorías son: Chiclayo, Lambayeque, … , otros. 

    Frecuencias absolutas simples (ni): Número de jefes de hogar, aparecen

    en la segunda columna, así tenemos que: n1 = 25, significa

    que existen 25 jefes de hogar procedentes de Chiclayo, n2 =7, significa que existen 7 jefes de hogar procedentes deLambayeque, así sucesivamente. Finalmente el número totalde datos está dado por la suma de todas las frecuenciasabsolutas simples, que en este caso suman 40, es decir quese han entrevistado a un total de 40 jefes de hogar.

    Matemáticamente se puede expresar así:

    406

    1

    nnm

    i

    i  

    Frecuencias relativas simples (hi ): Proporción de jefes de hogar, aparecen

    en la tercera columna, así tenemos que: h1 = 0.625, significala proporción de jefes de hogar procedentes de Chiclayo esde 0.625, h2 = 0.175, significa que la proporción de jefes dehogar procedentes de Lambayeque es de 0.175, así

    sucesivamente. Finalmente la suma de todas las frecuenciasrelativas simples suman 1. Matemáticamente se puedeexpresar así:

    16

    1

    m

    i

    ih  

    Frecuencias relativas simples porcentuales (hi %): Porcentaje de jefes de

    hogar, aparecen en la cuarta columna, así tenemos que: h1 

    %= 62.5%, significa que el 62.5% de jefes de hogar proceden

    de Chiclayo, h2 %= 17.5%, significa que 17.5% de jefes dehogar proceden de Lambayeque, así sucesivamente.Finalmente la suma de todas las frecuencias relativas simplesporcentuales suman 100. Matemáticamente se puedeexpresar así:

    100%6

    1

    m

    i

    ih  

     A continuación se presenta los pasos para hacer esta tabla con ayudadel Excel

  • 8/15/2019 Apuntes 1 de Estadística completo

    35/155

     

    35

    1° paso: Agregue una columna de unos en la parte final de la basecon el nombre de “cuenta”. 

    2° paso:  Active el comando “Insertar ” y coloque el cursor en la celdasuperior de la primera columna de la base.

    3° paso: Seleccione el botón “Tabla dinámica” y haga click nuevamenteen el siguiente botón “Tabla dinámica”. 

  • 8/15/2019 Apuntes 1 de Estadística completo

    36/155

     

    36

    4° paso: Se seleccione toda la base de datos y aparecerá un cuadrocon el nombre “Crear tabla dinámica”, en este cuadro hacer click en

    “ Aceptar ”. 

    5° paso: Seleccione la variable “Lugar_proc” y arrástrela al cuadro

    “Rótulos de variable” y la Variable “Cuenta” arrástrela al cuadro “ ∑ devalores”, con lo cual aparecerá automáticamente una tabla dinámica

    indicando el número de cada uno de los rótulos de la variable. estaes la tabla propiamente dicha.

  • 8/15/2019 Apuntes 1 de Estadística completo

    37/155

     

    37

    6° paso: Seleccione el contenido de esta tabla y cópielo en la parteinferior, a continuación remplace cada código por su significado ycomplete la construcción de la tabla de frecuencias.

    Lugar deprocedencia

    N° dehogares

    Proporción dehogares

    % dehogares

    Chiclayo 25 0.625 62.5Lambayeque 7 0.175 17.5Ferreñafe 3 0.075 7.5Cajamarca 2 0.05 5.0Piura 1 0.025 2.5Otros 2 0.05 5.0

    Total 40 1 100

    12.2. Tabla de frecuencias para variables cuantitativas

    En variables cuantitativas se presentan dos casos, a saber, cuando lavariable cuantitativa tiene pocos valores diferentes (menos de 15valores diferentes) y cuando la variable tiene muchos valoresdiferentes. En ambos casos, las clases se ordenan de acuerdo al valorde la variable y las frecuencias que se pueden obtener pueden sersimples y acumuladas, estas últimas pueden ser del tipo “menor que”  o

    “mayor que” . Finalmente, al igual que para el caso de variablescualitativas, se recomienda evitar el uso de símbolos en el

    encabezamiento de cada una de las columnas de la tabla, así comotambién se debe evitar las líneas verticales, solamente se deben

  • 8/15/2019 Apuntes 1 de Estadística completo

    38/155

     

    38

    marcar las líneas horizontales del encabezamiento y la del final paratotalizar las frecuencias.

    Primer caso, Cuando la variable tiene pocos valores diferentes. En este

    caso, las clases están conformadas por cada uno de los valores

    diferentes de la variable. Las frecuencias absolutas simples se

    obtienen mediante procesos de conteo.

    Ejemplo 2: Usando la base de datos presentada en la tabla N° 1construir una tabla de frecuencias para la variableNúmero de miembros por hogar.

    1° Paso: Usando la técnica del paloteo obtenemos las frecuenciasabsolutas simples

    N° de miembros por hogar N° de hogares

    1 II = 22 IIIII II = 73 IIIII IIIII II = 124 IIIII IIIII = 105 IIIII I = 66 III = 3

    Total = 40

    6° Paso: Construir la tabla de frecuencias obteniendo todas las clases

    de frecuencias, absolutas y relativas, simples y acumuladas.

    Ejemplo 3. Usando la base de datos presentada en la tabla N° 1construir una tabla de frecuencias para la variable Número demiembros por hogar.

    Tabla N° 2 Número de miembros por hogar en el distrito de Chiclayo.Marzo 2011

    Número demiembrospor hogar

    N° dehogares

    Proporciónde hogares

    % dehogares

    N°Acumulado

    ≤ de

    hogares

    %Acumulado

    ≤ de

    hogares

    N°Acumulado

    ≥ de

    hogares

    %Acumulado

    ≥ de

    hogares1 2 0.0500 5.00 2 5.00 40 1002 7 0.1750 17.50 9 22.50 38 953 12 0.3000 30.00 21 52.50 31 77.54 10 0.2500 25.00 31 77.50 19 47.55 6 0.1500 15 37 92.50 9 22.56 3 0.0750 7.5 40 100.00 3 7.5

    Total 40 1 100Fuente: Encuesta a hogares, marzo 2011

    Note en esta tabla que:

  • 8/15/2019 Apuntes 1 de Estadística completo

    39/155

     

    39

    Variable: Número de miembros por hogar, aparece en el título de la tabla

    y en el encabezamiento de la primera columna, y sus valores son: 1, 2, 3,…, 6. 

    Frecuencias absolutas simples (ni): Número de hogares, aparecen en lasegunda columna, así tenemos que: n1 = 2, significa que existen 2

    hogares conformados por un solo miembro, n2 = 7, significa que existen7 hogares conformados por dos miembros, así sucesivamente.Finalmente el número total de datos está dado por la suma de todas lasfrecuencias absolutas simples, que en este caso suman 40, es decir quese han entrevistado a un total de 40 hogares. Matemáticamente sepuede expresar así:

    40

    6

    1

    nn

    m

    ii  

    Frecuencias relativas simples (hi ): Proporción de hogares, aparecen en latercera columna, así tenemos que: h1 = 0.05, significa la proporción de

    hogares conformados por un solo miembro es de 0.05, h2 = 0.175,

    significa que la proporción de hogares conformados por dos miembroses de 0.175, así sucesivamente. Finalmente la suma de todas lasfrecuencias relativas simples suman 1. Matemáticamente se puedeexpresar así:

    16

    1

    m

    i

    ih   dondennh   ii    

    Frecuencias relativas simples porcentuales (hi %): Porcentaje de jefes de

    hogar, aparecen en la cuarta columna, así tenemos que: h1 %= 5%,

    significa que el 5% de hogares están conformados por un solo miembro,h2 %= 17.5%, significa que 17.5% de hogares están conformados pordos miembros, así sucesivamente. Finalmente la suma de todas lasfrecuencias relativas simples porcentuales suman 100.Matemáticamente se puede expresar así:

    100%6

    1

    m

    i

    ih   donde 100%   n

    nh   ii  

    Frecuencias absolutas acumuladas ≤ (Ni ): Número acumulado ≤ de

    hogares, aparecen en la quinta columna, así tenemos que: N1 = 2,significa que existen 2 hogares conformados por un solo miembro, N2 =

    9, significa que existen 90 hogares conformados por dos miembros omenos (menor o igual que 2), N3 = 21, significa que existen 21 hogaresconformados por tres miembros o menos (menor o igual que 3) así

    sucesivamente. Finalmente la ultima frecuencia absoluta acumulada ≤,es igual al número total de datos, es decir que es igual a la suma detodas las frecuencias absolutas simples, que en este caso suman 40, es

  • 8/15/2019 Apuntes 1 de Estadística completo

    40/155

     

    40

    decir que se han entrevistado a un total de 40 hogares.Matemáticamente se puede expresar así:

    i

    i

     j

     j   N n   1   donde n N m

       

    Frecuencias relativas acumuladas ≤ porcentuales (Hi %): Porcentajeacumulado ≤ de jefes de hogar, aparecen en la sexta columna, así

    tenemos que: H1 %= 5%, significa que el 5% de hogares están

    conformados por un solo miembro, H2 %= 22.5%, significa que 22.5% de

    hogares están conformados por dos miembros o menos, H3 %= 52.5%,significa que 52.5% de hogares están conformados por tres miembros omenos, así sucesivamente. Finalmente la última de estas frecuencia esigual a la suma de todas las frecuencias relativas simples porcentuales

    la cual debe llegar a 100. Matemáticamente se puede expresar así:

    %%1

    i

    i

     j

     j   H h  

      o también %100 im

    i  H  N 

     N    y 100% m H   

    Frecuencias absolutas acumuladas ≥ (Ni ↑): Número acumulado ≥ dehogares, aparecen en la séptima columna, así tenemos que: la primerafrecuencia absoluta acumulada mayor igual que es igual al número totalde datos, en este caso N1↑ = 40 = n, significa que existen 400 hogares

    conformados por un solo miembro o más, N2↑ = 38, significa que

    existen 38 hogares conformados por dos miembros o más (mayor oigual que 2), N3↑ = 31, significa que existen 31 hogares conformados portres miembros o más (mayor o igual que 3) así sucesivamente.Finalmente la última frecuencia absoluta acumulada ≥ es igual a la

    última frecuencia absoluta simple, que en este caso es igual a 3, esdecir que se han entrevistado a un total de 40 hogares.Matemáticamente se puede expresar así:

    i

    m

    i j

     j   N n   donde n N   1   y mm   n N     

    Frecuencias relativas acumuladas ≥ porcentuales (Hi %↑): Porcentajeacumulado ≥ de jefes de hogar, aparecen en la octava columna, así

    tenemos que: la primera frecuencia relativa porcentual acumulada ≥ es

    siempre igual al 100%, H1 %↑= 100%, significa que el 100% de

    hogares están conformados por un miembro o más, H2 %↑ = 95%,significa que 95% de hogares están conformados por dos miembros omás, H3%↑= 77.5%, significa que 52.5% de hogares están conformadospor tres miembros o más, así sucesivamente. Finalmente la última deestas frecuencia es igual a la última frecuencias relativas simples

    porcentual. Matemáticamente se puede expresar así:

  • 8/15/2019 Apuntes 1 de Estadística completo

    41/155

     

    41

    %% i

    m

    i j

     j   H h   o también

    %100 im

    i  H  N 

     N   y

    %100%1    H    %% 1h H m    

    La elaboración de este tipo de tablas con ayuda del Excel es similar que para el

    caso de variables cualitativas, solo que en este caso se completa con las

    frecuencias acumuladas.

    Segundo caso: Cuando la variable tiene muchos valores diferentes. En este

    caso las clases están constituidas por intervalos, para lo cual se siguen los

    siguientes pasos:

    1° Paso: Determin ar el Rango  R = Máximo – Mínimo

    2° Paso: Elegir o calcu lar el número de clases “m”

    Este número depende del número de observaciones, en algunoscasos se desea construir una tabla de modo tal que sirva para hacercomparaciones con otros estudios, en tal caso el número de clasesqueda determinado por la amplitud de clase deseada para hacerdichas comparaciones. Si éste no fuera el caso, se adoptar algunasfórmulas para obtener este número de clases, a continuación sepresentan algunas:

    )(322.31   n Log m   …. (1) regla de Sturges 

    )(n Log m   ………… (2) 

    nm   …………… (3) 

    Donde n  es en número de datos 

    La primera fórmula conocida como la Regla de Stugers es la másutilizada. En general se sugiere que el número de clases podría estar

    comprendido entre 5 y 15 inclusive.

    3° Paso: Calcular la amp l i tud d e clase “C ”.

    Se recomienda que todos los intervalos sean de igual amplitud,siempre que los datos distribuyan mas o menos en forma uniforme encada uno de los intervalos; pero si existen variaciones muypronunciadas, podría convenir analizar la conveniencia de utilizarintervalos de amplitudes diferentes.

    Para el caso de utilizar intervalos de igual amplitud, ésta se puedeobtener mediante la siguiente fórmula

  • 8/15/2019 Apuntes 1 de Estadística completo

    42/155

     

    42

    m

     RC   

    Donde:

    [ ] : Significa que el cocientem

     R   es redondeado al menor mayor

    entero, siempre que C sea redondeado a un número entero, pero si Ces un número con un decimal, el redondeo se realizará al decimalinmediato superior. Pero nunca se debe truncar.

    55

    25

    m

     RC    es una división exacta, no es necesario redondear

      66.55

    28

    m

     RC   

      64.55

    27

    m

     RC   

      6.3571.37

    25

    m

     RC   

    4° Paso: Constru ir los intervalos de clase . 

    Calcular la cobertura C m  , a continuación se debe obtener el exceso

    con respecto al rango R y dividirlo en dos partes:   

        

    2

    C m  con lo cual

    se procede a construir los intervalos del siguiente modo:

    - Cuando el cociente 54

    20

    m

     RC   es un número exacto

    - Cuando el cociente   725.64

    25

    m

     RC   no es un número exacto y

    fue necesario de redondear  

    Redondeo a un número menor mayor entero

    Redondeo al decimal inmediato superior anivel de decenas 

  • 8/15/2019 Apuntes 1 de Estadística completo

    43/155

     

    43

    5° Paso: Conteo del número de datos co ntenidos en cadaintervalo de clase. 

    Clases Conteo (ejemplo de conteo)[ ) IIII = 4 = n1 [ ) IIIII IIIII II = 12 = n2 [ )  IIIII II = 7 = n3 [ )  III = 3 = n4 Total 16 = n

    6° Paso: Constru ir la tabla de frecuencia

    Ejemplo 3: Usando los datos de la base que aparece en la tabla N° 1,construya una tabla de frecuencia para la variable edad.

    1° Paso: Determin ación del Rango  

    R = Máximo – Mínimo = 54 – 25 = 29

    2° Paso: Cálcu lo del número de c lases “m”

    Usaremos la regla de Sturges 

    632.6)40(322.31)(322.31     Log n Log m  

    3° Paso: Cálcu lo d e la ampli tu d de clase “C ”.

      58.46

    29

    m

     RC   

    4° Paso: Constru cción de los intervalos de clase . 

    Cálculo de la cobertura 3056   C m  ,

    Obtención el exceso de la cobertura respecto al rango R

    129302956     RC m  

  • 8/15/2019 Apuntes 1 de Estadística completo

    44/155

     

    44

    Como el exceso es 1, no es necesario dividirlo en dos partes, debido aque construiremos intervalos cuyos límites serán números enteros, conlo cual se procede a construir los intervalos del siguiente modo:

    5° Paso: Conteo del número de datos co ntenidos en cada intervalode clase. 

    Edad (años) Número de jefes de hogar[ 25 - 30) IIII = n1 = 4[30 - 35) IIIII III = n2 = 8[35 - 40)  IIIII IIIII = n3 = 10[40 - 45)  IIIII IIIII II = n4 = 12[45 - 50)  IIII = n5 = 4 [50 - 55)  II = n6 = 2 Total n = 40

    6° Paso: Constru ir la tabla de frecuencia

    Tabla N° 3 Edad de 40 jefes de hogar en el distrito de Chiclayo. Marzo 2011

    Edad del jefe delhogar

    N° de jefes de

    hogar

    Proporciónde jefes dehogar

    % de jefes de

    hogar

    N°Acumulado≤ de jefesde hogar

    %Acumulado≤ de jefesde hogar

    N°Acumulado≥ de jefesde hogar

    %Acumulado≥ de jefesde hogar

    [ 25 -30) 4 0.10 10

    4 10 40 100

    [30 - 35) 8 0.20 20 12 30 36 90[35 - 40) 10 0.25 25 22 55 28 70[40 - 45) 12 0.30 30 34 85 18 45

    [45 - 50) 4 0.10 10 38 95 6 15[50 - 55) 2 0.05 5 40 100 2 5Total 40 1 100

    Fuente: Encuesta a hogares, marzo 2011

    Note en esta tabla que la Variable Edad del jefe del hogar , aparece en eltítulo de la tabla y en el encabezamiento.

    Frecuencias absolutas simples (ni): Número de jefes de hogar, aparecen en

    la segunda columna, así tenemos que: n1 = 4, significa que existen 4

     jefes de hogar con edades comprendidas entre 25 y 30 años, n2 = 8,

    significa que existen 8 hogares con edades comprendidas entre 30 y 35años, así sucesivamente. Finalmente el número total de datos está dadopor la suma de todas las frecuencias absolutas simples, que en este

  • 8/15/2019 Apuntes 1 de Estadística completo

    45/155

     

    45

    caso suman 40, es decir que se han entrevistado a un total de 40 jefesde hogar. Matemáticamente se puede expresar así:

    40

    6

    1

    nn

    m

    i

    i  

    Frecuencias relativas simples (hi ): Proporción de jefes de hogar, aparecenen la tercera columna, así tenemos que: h1 = 0.10, significa la

    proporción de jefes de hogar con edades comprendidas en el intervalo[25-30) años es de 0.10, h2 = 0.20, significa que la proporción de jefesde hogar con edades comprendidas en el intervalo [30-35) es de 0.20,así sucesivamente. Finalmente la suma de todas las frecuenciasrelativas simples es igual a 1. Matemáticamente se puede expresar así:

    16

    1

    m

    i

    ih   donden

    nh   ii    

    Frecuencias relativas simples porcentuales (hi %): Porcentaje de jefes de

    hogar, aparecen en la cuarta columna, así tenemos que: h1 %= 10%,

    significa que el 10% de jefes de hogar tienen edades comprendidas enel intervalo [25-30) años, h2 %= 20%, significa que el 20% de jefes de

    hogar tienen edades comprendidas en el intervalo [30-35), asísucesivamente. Finalmente la suma de todas las frecuencias relativassimples porcentuales es igual a 100. Matemáticamente se puede

    expresar así:

    100%6

    1

    m

    i

    ih   donde 100%   n

    nh   ii  

    Frecuencias absolutas acumuladas ≤ (Ni ): Número acumulado ≤ de jefes

    de hogar, aparecen en la quinta columna, así tenemos que: N1 = 4,significa que existen 4 jefes de hogar con edades menores de 30 años,N2 = 12, significa que existen 12 jefes de hogar con edades menores

    que 35 años, N3 = 22, significa que existen 22 jefes de hogar con

    edades menores que 40 años, así sucesivamente. Finalmente la últimafrecuencia absoluta acumulada ≤, es igual al número total de datos, es

    decir que es igual a la suma de todas las frecuencias absolutas simples,que en este caso suman 40, es decir que se han entrevistado a un totalde 40 hogares. Matemáticamente se puede expresar así:

    i

    i

     j

     j   N n   1

      donde n N m   

    Frecuencias relativas acumuladas ≤ porcentuales (Hi %): Porcentaje

    acumulado ≤ de jefes de hogar, aparecen en la sexta columna, asítenemos que: H1 %= 10%, significa que el 10% de jefes de hogar tienen

    edades menores que 30 años, H2 %= 30%, significa que el 30% de jefes

  • 8/15/2019 Apuntes 1 de Estadística completo

    46/155

     

    46

    de hogar tienen edades menores que 35 años, H3 %= 55%, significa que

    el 55% de jefes de hogar tienen edades menores que 40 años, asísucesivamente. Finalmente la última de estas frecuencias es igual a la

    suma de todas las frecuencias relativas simples porcent