Unidad 2.docx

7
Unidad 2. ESTADíSTICA DESCRIPTIVA (VIII) 2.6 TABLA DE DISTRIBUCIÓN DE FRECUENCIAS Una vez que se ha obtenido la muestra, el investigador puede realizar dos tipos de acción, primordialmente: - Organizar sus datos para una adecuada presentación - Realizar un Análisis Exploratorio de Datos (EDA) Los datos “tienen mucha información”; tienen mucho que decirle al investigador. Éste debe ser capaz de usar la herramienta estadística adecuada para interpretar lo que los datos quieren decirle. Respecto a la primera acción, el investigador puede presentar los datos en forma tabular, a los cuales se les conoce como “Tablas de distribución de frecuencias”. En el caso de la segunda acción, existen muchas herramientas gráficas a los cuales se puede someter los datos. El tratamiento gráfico de los datos es una herramienta muy poderosa que, como veremos, nos permite conocer el comportamiento de la muestra y con ello de la población y estimar y/o predecir el comportamiento futuro de la población sujeta a estudio. En esta sección haremos uso del Excel para construir tablas de distribución de frecuencias. Usaremos las funciones y herramientas que ella tiene y codificaremos otras mediante el uso de macros. Supongamos que X 1 , X 2 , X 3 ,…, Xn es una muestra de tamaño n, extraída de una población sujeta a estudio. Supongamos también que esta muestra es una muestra aleatoria; es decir, que la muestra está formada por un conjunto de variables aleatorias independientes y que la selección de cada una de ellas tiene igual probabilidad de ser seleccionada. La siguiente imagen muestra la estructura de una tabla de distribución de frecuencias.

Transcript of Unidad 2.docx

Page 1: Unidad 2.docx

Unidad 2. ESTADíSTICA DESCRIPTIVA (VIII)

2.6 TABLA DE DISTRIBUCIÓN DE FRECUENCIAS

Una vez que se ha obtenido la muestra, el investigador puede realizar dos tipos de acción, primordialmente:

- Organizar sus datos para una adecuada presentación

- Realizar un Análisis Exploratorio de Datos (EDA)

Los datos “tienen mucha información”; tienen mucho que decirle al investigador. Éste debe ser capaz de usar la herramienta estadística adecuada para interpretar lo que los datos quieren decirle.

Respecto a la primera acción, el investigador puede presentar los datos en forma tabular, a los cuales se les conoce como “Tablas de distribución de frecuencias”.

En el caso de la segunda acción, existen muchas herramientas gráficas a los cuales se puede someter los datos. El tratamiento gráfico de los datos es una herramienta muy poderosa que, como veremos, nos permite conocer el comportamiento de la muestra y con ello de la población y estimar y/o predecir el comportamiento futuro de la población sujeta a estudio.

En esta sección haremos uso del Excel para construir tablas de distribución de frecuencias. Usaremos las funciones y herramientas que ella tiene y codificaremos otras mediante el uso de macros.

Supongamos que X1, X2, X3,…, Xn es una muestra de tamaño n, extraída de una población sujeta a estudio.

Supongamos también que esta muestra es una muestra aleatoria; es decir, que la muestra está formada por un conjunto de variables aleatorias independientes y que la selección de cada una de ellas tiene igual probabilidad de ser seleccionada.

La siguiente imagen muestra la estructura de una tabla de distribución de frecuencias.

Donde       LimInfi           : Límite inferior de la i – ésima clase o intervalo

Page 2: Unidad 2.docx

                        LimSupi             : Límite superior de la i – ésima clase o intervalo

                        Xi                    : Marca de clase del i - ésimo intervalo

                        fi                     : Frecuencia absoluta de la clase o intervalo i.

                        Fi                     : Frecuencia absoluta acumulada del intervalo i.

                        hi                     : Frecuencia relativa de la clase o intervalo i

                        Hi                    : Frecuencia relativa acumulada del intervalo i

Cálculo de la marca de clase o punto medio de cada intervalo:.

Procedimiento para construir una tabla de frecuencias en Excel 2007

El procedimiento lo daremos mediante la solución de los siguientes dos ejemplos.

Ejemplo 01

Construir una tabla de frecuencias para los saldos (en soles) en cuenta corriente de los clientes del Banco Bancordia contenidos en el archivo Bancordia

Grabe el archivo como SolBancordia.xls

Solución

Como se puede comprobar, en la primera hoja hay 2074 clientes. Vamos a extraer una muestra aleatoria de 320 cuentas y trabajaremos con ella. Seleccione el rango B9:B2083 y asígnele por nombre el contenido de la primera fila: Saldos.

Usando la secuencia: [Datos] - [An álisis de datos] - [Muestra] - [Aceptar] y completando la siguiente ventana como se muestra en la figura 2.5.

Page 3: Unidad 2.docx

No espere obtener los mismos datos que aquí mostramos. Es aleatorio. Inserte una fila al inicio y ponga como nombre de columna Saldos.Seleccione el rango A2:A351 y póngale por nombreMuestraSaldos.

Obtenga primero las siguientes estadísticas usando las funciones adecuadas, según

se muestran en la figura 2.6. A la derecha se muestra las fórmulas que se debe usar.

Diseñe una tabla como se muestra en la figura 2.7. Podría hacerlo a partir de C14.

A continuación vamos a calcular los límites inferior y superior de cada clase.

Primer intervalo (clase):        Lim. Inf:             =E3     Mínimo dato.

                                               Lim. Sup:        =D16+E7

Segundo intervalo                   Lim. Inf:         =E16

                                               Lim. Sup:        =D17+$E$7

Page 4: Unidad 2.docx

Copiando las fórmulas de D17:E17 para los otros intervalos, obtendrá los demás intervalos.

Cálculo de la marca de clase o punto medio (Xi)

En F16, digite: =(D16+E16)/2

Copie ahora para los otros intervalos.

Cálculo de la Frecuencia absoluta (fi):

Para ello usaremos la función:

=Frecuencia(RangoDeDatos,ColumnaGrupos)

Donde

RangoDeDatos: Contiene todos los elementos que conforman la muestra

ColumnaGrupos : Es el rango de los límites superiores de los intervalos

Como esta función implica el uso de operaciones con argumentos: - Seleccionamos primero todo el rango de salida: G16:G24 - Luego ingresamos la función: =Frecuencia(Saldos,E16:E24) - Usamos la combinación: [CTRL]+[SHIFT]+[ENTER].

En la celda G25 sume el rango G16:G24 para comprobar que n = 350.

Cálculo de la frecuencia absoluta acumulada (Fi):

En H16 ingresamos: =G16

En H17 ingresamos: =H16+G17

Luego copiamos esta última fórmula para los otros intervalos.

Compruebe que la última frecuencia acumulada coincida con el valor de n.

Cálculo de la frecuencia relativa (hi):

En I16 ingresamos: =G16/$G$25 (La fijamos para que no cambie al copiar).

Copiamos esta fórmula para los otros intervalos.

Cálculo de la frecuencia relativa acumulada(Hi):

En J16 ingresamos: =I16

En J17 ingresamos: =J16+I17

Page 5: Unidad 2.docx

Luego copiamos esta última fórmula para los otros intervalos.

Compruebe que la última frecuencia acumulada coincida con el valor de 1.

La siguiente figura 2.9, muestra los resultados que se deben obtener.

Observación:

Los resultados que obtenga es probable que no sean iguales con los que aquí se muestran pues son dos muestras diferentes.

Interpretación de la tabla de frecuencias (Usaré estos resultados)

Decíamos que los datos pueden proporcionarnos mucha información. Analicemos la tabla encontrada.

- El mínimo saldo en cuenta corriente de los clientes del banco es 114 mil soles

- El máximo saldo es de 3’575 mil soles

- El banco tiene 25 clientes (f1) cuyos saldos están entre 114 y 498.56 mil soles.

- Los mayores saldos pertenecen a 26 clientes (f9), y varían entre 3190.44 y 3575.00.

- El 5% de clientes del banco tienen saldos entre 498.56 y 883.11 (h2).

- Los mayores saldos en cuenta corriente del banco representan el 7% (h9).

- El banco tiene 41 clientes con saldos menores que 883.11 mil soles (F2).

- El banco tiene 217 clientes cuyos saldos van desde 114.00 hasta 2036.78 (F5).

- El banco tiene 51 clientes con saldos superiores a 2805.89 (F9 – F7)

- El 12% de los clientes del banco tienen saldos inferiores a 883.11 mil soles.