Material Infostat - Unidad 1.docx

27
Profesorados de Matemática y Biología – Licenciatura en Biodiversidad FHUC Material sobre uso de Infostat Realizado por Prof. Esteban Bulgarella Revisado y editado por Prof. Liliana Tauber CONTENIDO Unidad I. Introducción al manejo de Infostat.............2 A. Instalar y ejecutar Infostat ........................2 B. Conformación de la Tabla ............................8 C. Manejo de datos .....................................8 D. Tipos de datos .....................................11 E. Medidas Resumen ....................................12 F. Diagrama de Caja (Box-Plot) ........................13 G. Buscar y Reemplazar ................................15 H. El test T para muestras independientes .............16 I. Test de Normalidad .................................18 J. Uso de la Ayuda ....................................22 K. Actividad Complementaria 1 .........................22 L. Actividad Complementaria 2 .........................23 Cátedras de Estadística y Estadística I FHUC - UNL

Transcript of Material Infostat - Unidad 1.docx

Page 1: Material Infostat - Unidad 1.docx

Profesorados de Matemática y Biología – Licenciatura en Biodiversidad FHUC

Material sobre uso de InfostatRealizado por Prof. Esteban Bulgarella

Revisado y editado por Prof. Liliana Tauber

CONTENIDO

Unidad I. Introducción al manejo de Infostat...................................................2

A. Instalar y ejecutar Infostat..........................................................................2

B. Conformación de la Tabla............................................................................8

C. Manejo de datos..............................................................................................8

D. Tipos de datos................................................................................................11

E. Medidas Resumen........................................................................................12

F. Diagrama de Caja (Box-Plot)....................................................................13

G. Buscar y Reemplazar...................................................................................15

H. El test T para muestras independientes..............................................16

I. Test de Normalidad......................................................................................18

J. Uso de la Ayuda.............................................................................................22

K. Actividad Complementaria 1....................................................................22

L. Actividad Complementaria 2....................................................................23

Cátedras de Estadística y Estadística I FHUC - UNL

Page 2: Material Infostat - Unidad 1.docx

Profesorados de Matemática y Biología – Licenciatura en Biodiversidad FHUC

Material sobre uso de Infostat

Realizado por Prof. Esteban BulgarellaRevisado y editado por Prof. Liliana Tauber

Unidad I. Introducción al manejo de Infostat

El objetivo de esta guía es la introducción al uso del software estadístico Infostat a fin de utilizarlo para los objetivos de la cátedra.

La metodología propuesta para el aprendizaje es la utilización de una guía de actividades, para lo cuál deberá seguir los pasos propuestos.

A. Instalar y ejecutar Infostat

Infostat es un software estadístico desarrollado por la Facultad de Ciencias Agropecuarias de la Universiadad Nacional de Córdoba. Ofrece una interface amigable para el manejo de datos basada en el concepto de planilla electrónica. Permite importar y exportar bases de datos en diferentes formatos y es sencillo el acceso a las herramientas para el manejo de datos. La versión actual de Infostat está vinculada con R permitiendo expandir las potencialidades del software.

Infostat tiene dos versiones: la Profesional y la Estudiantil. La versión estudiantil es gratuita, sólo requiere un registro en Internet.

Para instalar Infostat siga los siguientes pasos

1. Acceda a la página http://www.infostat.com.ar/

2. Luego buque en el panel izquierdo, en Servicios el enlace “Descarga InfoStat”.

3. Finalmente haga clic en Descargar (figura de la derecha).

4. Una vez que haya finalizado la descarga ejecútelo haciendo doble clic sobre el archivo.

5. Luego, siga los pasos para su instalación que se muestran a continuación. Los pasos se dividen en dos parte, primero la instalación de Infostat y luego la instalación de un motor de base de datos.

Primera parte: Instalación de Infostat.

Cátedras de Estadística y Estadística I FHUC - UNL

Page 3: Material Infostat - Unidad 1.docx

Profesorados de Matemática y Biología – Licenciatura en Biodiversidad FHUC

Cátedras de Estadística y Estadística I FHUC - UNL

Clic!

Clic!

Clic!

Page 4: Material Infostat - Unidad 1.docx

Profesorados de Matemática y Biología – Licenciatura en Biodiversidad FHUC

Segunda parte: instalación de un motor de bases de datos (para leer y grabar archivos de datos en formato IDB y DBF)

Cátedras de Estadística y Estadística I FHUC - UNL

Clic!

Clic!

Page 5: Material Infostat - Unidad 1.docx

Profesorados de Matemática y Biología – Licenciatura en Biodiversidad FHUC

Cátedras de Estadística y Estadística I FHUC - UNL

Clic!

Clic!

Clic!

Page 6: Material Infostat - Unidad 1.docx

Profesorados de Matemática y Biología – Licenciatura en Biodiversidad FHUC

6. Luego de presionar el botón Finish va a estar instalado el programa. Ahora debe ejecutarlo.

Cátedras de Estadística y Estadística I FHUC - UNL

Clic!

Clic!

Clic!

Page 7: Material Infostat - Unidad 1.docx

Profesorados de Matemática y Biología – Licenciatura en Biodiversidad FHUC

7. Abra el menú Incio y busque el Icono InfoStat dentro de la carpeta InfoStat. Haga clic para ejecutarlo.

8. Primero informa que hay que activar el programa. Clic en OK.

9. La siguiente ventana tiene la opción de activar usando Internet, para eso hay que tener una clave que se puede gestionar gratuitamente (para la versión estudiantil) en la página Web www.infostat.com.ar. Sino puede usarse la Versión Libre.

10. Presionando el botón “Versión Libre” o luego de activar la copia, se abrirá la siguiente figura que muestra la ventana principal del programa.

Cátedras de Estadística y Estadística I FHUC - UNL

Clic!

Page 8: Material Infostat - Unidad 1.docx

Conformación de la Tabla

VARIABLES o CAMPOS (Columnas)

REGISTROSo

CASOS(Filas)

Fórmula ModificadaFórmula sin Modificar

Datos Ejemplo 1: Alimento para peces.

Profesorados de Matemática y Biología – Licenciatura en Biodiversidad FHUC

B. Conformación de la Tabla

Las tablas son objetos dentro de los cuales se almacena la información en un formato específico de manera que pueda ser leída por el software estadístico. Las partes que componen una tabla son:

Las filas de la tabla, que en ocasiones se denominan Registros o Casos (se utilizarán ambas denominaciones indistintamente). Cada registro o caso se corresponde a una unidad de análisis, por ejemplo cada registro puede representar una observación sobre un individuo en particular.

Por otro lado, las columnas de la tabla se denominan Campos o Variables (este último término se adoptará en el presente material). Las variables en Infostat pueden admitir diferentes tipos de datos, por ejemplo entero, real, categoría (texto o números) y fecha.

El siguiente diagrama resume la conformación de la tabla, aplicable a cualquier software estadístico.

C. Manejo de datos

Como introducción al manejo de datos se propone cargar y analizar los siguientes datos correspondientes a un diseño experimental con alimento para peces.

EJEMPLO 1: Alimento para Peces.

Un productor está interesado en comparar dos fórmulas de alimento para peces de una especie determinada: Interesa analizar si una fórmula modificada produce peces de mayor Tamaño que la fórmula sin modificar (que es la que está utilizando actualmente).

Se han alimentado a 20 peces de la misma especie, recolectado (luego de un período de tiempo fijo) 10 observaciones con cada fórmula.

Los valores se muestran en la figura de la derecha.

Para analizar este tipo de observaciones en cualquier software generalmente hay que colocar en cada fila la unidad de análisis, en este caso, cada observación de Tamaño debe estar en una fila (en total son 20 filas).

Cátedras de Estadística y Estadística I FHUC - UNL

Page 9: Material Infostat - Unidad 1.docx

Profesorados de Matemática y Biología – Licenciatura en Biodiversidad FHUC

A su vez, cada observación debe estar perfectamente identificada. Hay dos variables que identifican de manera única cada observación: la primera es el orden de recolección de las observaciones y la segunda es el tipo de fórmula utilizada.

Por lo tanto, hay que construir una tabla con 20 filas y 3 columnas.

1. Abra Infostat haciendo clic sobre su icono.

2. Vaya al menú “Archivo” y seleccione la opción “Nueva tabla”. Se abrirá una tabla de 1 fila y 2 columnas.

3. Para agregar una columna vaya al menú “Datos” y seleccione la opción “Nueva columna”. Se agregará una tercera columna a la derecha.

4. Modifique los nombres de cada columna (los nombres de las variables) haciendo doble clic sobre el nombre.

Coloque a la primera columna el nombre “Observación”. A la segunda “Fórmula” y a la tercera “Tamaño”

Cátedras de Estadística y Estadística I FHUC - UNL

Doble Clic!

Page 10: Material Infostat - Unidad 1.docx

Profesorados de Matemática y Biología – Licenciatura en Biodiversidad FHUC

5. Complete la tabla con los datos del ejemplo como se muestra en la figura de la derecha.

Se ha utilizado el código “1” para la fórmula modificada y el “2” para la sin modificar.

6. Nótese que hay que completar los diez primeros valores de la variable “Fórmula” con el valor 1 y los siguientes diez con el valor 2.

Para hacerlo, Infostat tiene un método práctico, simplemente hay que seleccionar la columna como se muestra en la figura y presionar la combinación de teclas Ctrl + D (o en el menú Datos, acciones sobre columnas, llenar con, completando hacia abajo)

El resultado se muestra en la figura siguiente(Ud. debería obtener la misma figura)

7. Antes de continuar Guarde la Tabla, presionando el botón Guardar de la barra de herramientas.

Guárdela con el nombre “Alimento” dentro de la carpeta: Mis Documentos, Estadística II.

Note que las tablas creadas con Infostat tienen extensión “.idb2”.

D. Tipos de datos

Es importante considerar el “tipo de dato” que se está analizando ya que de esa forma el software interpretará mejor qué acción es la que se quiere realizar. Con tipo de dato se hace referencia a la escala de medición que se utiliza.

Infostat, al igual que la mayoría de los programas, utiliza 4 tipos de datos:

Cátedras de Estadística y Estadística I FHUC - UNL

Page 11: Material Infostat - Unidad 1.docx

Clic Derecho!

Profesorados de Matemática y Biología – Licenciatura en Biodiversidad FHUC

a) Si se está registrando el orden de un grupo de alumnos en un listado, el tipo de datos será un entero. Los enteros tienen decimales. Ejemplo: orden=11.

b) Al medir la altura de una persona en metros, el tipo de datos será un real. Los reales admiten cifras decimales. Ejemplo: altura=1,73.

c) Si se está registrando una cualidad como el tipo de tratamiento aplicado a una planta, el tipo de dato serán categorías. Estos datos admiten letras y/o números. Ejemplo: nivel_de_fertilizante=bajo.

d) Por último existe un tipo de dato especial reservado para fechas que en realidad, para la computadora, es un caso especial del tipo de dato entero,

1. Continuemos con el ejemplo que venimos desarrollando “Ejemplo 1” (archivo alimento.ibd2). Siga los siguientes pasos:

2. Se dijo anteriormente que la fórmula 1 era la fórmula modificada, mientras que la 2 era la fórmula sin modificar. Esto significa que la variable Fórmula debe ser especificada como “categórica” para que el sistema pueda reconocerla como un criterio de clasificación para el análisis.

Nota: Cuando los datos se ingresaron no se especificó qué tipo de datos se estaba cargando, por lo que Infostat automáticamente (cuando se cargan números) le imputa el tipo de dato Real. Además, Infostat no permite marcar como “Categoría” a datos previamente marcados como “Reales”, entonces para poder cambiar el tipo de datos primero hay que pasarlos a Enteros (ver próximos pasos).

3. Para cambiar el tipo de dato, seleccione la columna “Fórmula” y luego haga clic con el botón derecho del mouse sobre el título de la columna.

Vaya hasta la opción “Tipo de dato” y seleccione “Entero” (figura de la derecha)

4. Luego repita el paso anterior pero seleccione “Categoría”

5. Finalmente a la variable “Observación” colóquele el tipo de dato “Entero”.

6. Observe que la variable “Tamaño” debe estar marcada como “Real”

7. Guarde el archivo presionando el botón Guardar

E. Medidas Resumen

Al comenzar a trabajar con datos desconocidos, luego de analizar qué variables son categóricas y cuáles numéricas, continuas o discretas, se proceda a sacar algunas medidas resumen para caracterizar la información recogida, siempre teniendo en cuenta el contexto del problema.

Cátedras de Estadística y Estadística I FHUC - UNL

Page 12: Material Infostat - Unidad 1.docx

Profesorados de Matemática y Biología – Licenciatura en Biodiversidad FHUC

1. Continuemos el archivo “alimento.ibd2” (del Ejemplo 1). Siga los siguientes pasos:

2. Vaya al menú “Estadísticas” y seleccione “Medidas resumen”.

Aparecerá el cuadro de diálogo de Estadística descriptiva.

3. Hay que seleccionar las variables y los criterios de clasificación.

En este problema interesa comparar las dos fórmulas de alimento para ver si alguna produce peces de mayor tamaño.

Por lo tanto: La variable de análisis es Tamaño. El criterio de clasificación está en la variable categórica Fórmula.

La figura de la derecha muestra cómo debe ubicar las variables.

4. Presione el botón Aceptar para continuar.

Se mostrará el siguiente cuadro de opciones:

Aquí hay que seleccionar las opciones que más nos interesen (puede consultarse la ayuda del programa par más detalle)

5. Mantenga las opciones por defecto y haga clic en Aceptar.

El resultado se muestra en la figura siguiente:

Cátedras de Estadística y Estadística I FHUC - UNL

Page 13: Material Infostat - Unidad 1.docx

Profesorados de Matemática y Biología – Licenciatura en Biodiversidad FHUC

Se observa en la ventana de resultados que en promedio la fórmula modificada (la 1) produce un menor tamaño que la fórmula sin modificar. Además la fórmula 1 tiene un mayor desvío estándar que la fórmula 2.

6. Infostat guarda separadamente los datos, las tablas y los gráficos. Para guardar la tabla

presione el botón Guardar en barra de herramientas de la tabla

F. Diagrama de Caja (Box-Plot)

1. Para completar el análisis se puede plantear un diagrama de caja que muestre la distribución de los datos observados.

Vaya al menú “Gráficos” y seleccione la opción “Gráfico de cajas (Box-Plot).

Al igual que para la estadística resumen coloque en Variable Tamaño y para Criterio de clasificación la Fórmula.

2. Presione el botón Aceptar para continuar.

Se mostrará el siguiente gráfico, que muestra claramente que la fórmula 1 (la modificada) produce en prácticamente todas las observaciones un menor tamaño de pez. El único valor en la zona en la que se distribuyen las observaciones de la Fórmula 2 es un valor extremo.

Observe que el diagrama de caja que proporciona Infostat muestra (además de las marcas típicas) un punto dentro del la caja. Éste es el valor de la media muestral.

Cátedras de Estadística y Estadística I FHUC - UNL

Page 14: Material Infostat - Unidad 1.docx

Profesorados de Matemática y Biología – Licenciatura en Biodiversidad FHUC

3. Para cambiar el título utilice las “Herramientas gráficas” que se encuentran en el sector izquierdo de la pantalla.

Coloque como título: “Diagrama de Caja: Tamaño Observado”.

4. Explore la posibilidad de cambiar colores y formatos utilizando las Herramientas gráfica y el botón secundario del mouse (figura de la derecha).

5. Para guardar el gráfico presione el botón

Guardar en la ventana de gráficos

Cátedras de Estadística y Estadística I FHUC - UNL

Page 15: Material Infostat - Unidad 1.docx

Profesorados de Matemática y Biología – Licenciatura en Biodiversidad FHUC

G. Buscar y Reemplazar

Si por ejemplo desea que en lugar de utilizar códigos para cada fórmula aparezcan los nombres de cada categoría, es posible hacerlo de una forma rápida.

Continuando con el Ejemplo 1 de las fórmulas alimento para peces. Vamos a cambiar en la columna fórmulas el valor 1 por “No Modificada” y el valor 2 por “Modificada”.

1. Seleccione la columna Fórmula haciendo clic sobre su título.

Vaya al menú “Datos” y elija la opción “Buscar”. Aparecerá la figura de la derecha.

2. Tilde la opción “Reemplazar”. La figura anterior se modificará por la figura siguiente.

3. Complete los datos como se muestra a continuación:

Primero reemplace el valor “1” por el texto “Modificada”. Presione Aceptar.

Luego, repita el procedimiento anterior pero ahora reemplace el valor “2” por el texto “No Modificada”.

Luego de cada acción se informará la cantidad de elementos que fuero reemplazados.

Nota: Recuerde que debe estar seleccionada la columna correspondiente para que el reemplazo tenga efecto.

El archivo de datos debe quedar como muestra la figura de la derecha.

4. Guarde los cambios.

5. Actividad: repita las secciones E y F con este conjunto de datos y observe la diferencia en la presentación de los resultados.

Cátedras de Estadística y Estadística I FHUC - UNL

Page 16: Material Infostat - Unidad 1.docx

Profesorados de Matemática y Biología – Licenciatura en Biodiversidad FHUC

H. El test T para muestras independientes

Infostat trae, como todos los programas estadísticos, todos los conceptos vistos en Estadística I, por ejemplo el test T (o prueba T) para muestras independientes: Este test permite probar hipótesis sobre la media de la variable aleatoria definida como la diferencia entre medias muestrales.

Continuando con los datos del Ejemplo 1: Alimento.idb2

Se quiere probar que en promedio la fórmula modificada es mejor que la fórmula tradicional (sin modificar), y que las diferencias entre las medias son estadísticamente significativas (y así justificar el uso de una u otra fórmula).

Si planteamos una prueba bilateral, la Hipótesis Nula es: µ1 - µ2 = 0 (o bien µ1 = µ2), contra la alternativa µ1 - µ2 ≠ 0 o bien µ1 ≠ µ2. Dónde µi es la media poblacional (desconocida) del tamaño de peces alimentados con la fórmula i (si i=1 es el caso de la fórmula sin modificar, mientras que i=2 indica la fórmula modificada).

El estadístico de prueba t0 varía según las varianzas de ambas poblaciones sean iguales o no.

- Si se asume que las varianzas de ambas poblaciones son iguales (σ21 = σ

22)

entonces:

dónde y1 e

y2 son las medias muestrales, n1 y n2 el tamaño de las muestras y S2p es

una estimación de la varianza común (σ21 = σ

22 = σ

2) que se calcula por la fórmula:

y S21 y S2

2 son las varianzas muestrales individuales. Hay que comparar t0 con una distribución t con n1 + n2 - 2 grados de libertad.

- Si se asume que las varianzas poblacionales son distintas (σ21 ≠ σ2

2) entonces el estadístico es:

dónde y1 e

y2 son las medias muestrales, n1 y n2 el tamaño de las muestras y S21 y

S22 son las varianzas muestrales individuales. Hay que comparar t0 con una

distribución t con υ grados de libertad dónde:

Para ver qué estadístico usar previamente hay que hacer un test de homogeneidad de varianzas y si el resultado del test no rechaza la hipótesis de varianzas homogéneas se realiza test T con el primer estadístico t0; en caso contrario se utiliza el segundo estadístico.

Cátedras de Estadística y Estadística I FHUC - UNL

Page 17: Material Infostat - Unidad 1.docx

Profesorados de Matemática y Biología – Licenciatura en Biodiversidad FHUC

Infostat hace ambos tests automáticamente en un solo paso, como se muestra a continuación.

Un supuesto importante del test T es que se tiene un diseño experimental aleatorizado (si no hay azar todas las técnicas estadísticas carecen de validez) y que la muestra proviene de una distribución normal.

Siga el siguiente procedimiento con el archivo Alimento.idb2:

1. Vaya al menú “Estadísticas”, “Inferencia basada en dos muestras”, y seleccione la opción “Prueba t”. (Figura siguiente)

2. Se abrirá la siguiente ventana para seleccionar las variables intervinientes. La variable es Tamaño y el criterio de clasificación es Fórmula. Presione Aceptar.

3. Luego aparecerá el siguiente cuadro de diálogo dónde se pueden seleccionar diferentes opciones del test.

Cátedras de Estadística y Estadística I FHUC - UNL

Page 18: Material Infostat - Unidad 1.docx

a)

b)

c)

d)

Criterio de Clasificación y VariableGrupos que se comparanTamaños muestralesMedia de cada grupop-valor del test de homogeneidad de varianzas

T observado p-valor del test T

Tipo de prueba

Profesorados de Matemática y Biología – Licenciatura en Biodiversidad FHUC

Mantenga las opciones que se muestran:

a) Prueba Bilateral.

b) Comparaciones todos contra todos (comparará las dos fórmulas)

c) Mostrar “N observado”, “Medias”, valor “p” y “T” (este último es el t0 que se explicó antes)

d) Si las varianzas no son homogéneas a nivel del 5% hacer automáticamente una prueba T para varianza heterogéneas (según el resultado del test, Infostat decidirá qué estadístico calcular).

4. Presione el botón Aceptar. Se mostrarán los siguientes resultados:

La figura explica brevemente cada valor de la salida.

El p-valor del test de homogeneidad de varianzas iguales es significativo con un nivel de significatividad del 5% (p=0,0317) por lo tanto se rechaza la hipótesis nula “las varianzas son iguales” y se acepta la alternativa “las varianzas son distintas”. Luego Infostat utiliza t0 correspondiente a σ2

1 ≠ σ22.

El resultado del test T es: las fórmulas de alimento para peces producen peces de tamaños diferentes. La fórmula no modificada es mejor que la modificada ya que produce en promedio peces de mayor tamaño con significatividad estadística (p=0,0001).

I. Test de Normalidad

Se mencionó en la sección anterior que un supuesto del test T es que la muestra proviene de una distribución normal. Es necesario verificar el cumplimiento de este supuesto para que las conclusiones anteriores sean válidas (aunque en realidad, ciertas desviaciones moderadas respecto de la normalidad no afectarán seriamente los resultados).

Hay varias formas para probar que una muestra proviene de una distribución normal. Entre las más utilizadas están: el Q-Q Plot y el test Shapiro-Wilks.

Cátedras de Estadística y Estadística I FHUC - UNL

Page 19: Material Infostat - Unidad 1.docx

Profesorados de Matemática y Biología – Licenciatura en Biodiversidad FHUC

Vamos a probar el supuesto de normalidad para el tamaño de peces producidos con la fórmula de alimento modificada y sin modificar. Siga el siguiente procedimiento con el archivo Alimento.idb2:

1. Vaya al menú “Gráficos” y seleccione la opción “Q-Q plot”, se abrirá la figura siguiente.

2. Coloque en variable “Tamaño”.

3. Haga clic en la pestaña particiones, la ventana cambiará como la figura de abajo.

4. Seleccione la variable “Fórmula” para particionar los datos (esto hará que se realicen dos gráficos: uno para la fórmula modificada y otro para la fórmula no modificada).

5. Finalmente presione Aceptar.

6. Este cuadro de diálogo permite seleccionar cuál es la distribución de la prueba. Mantenga seleccionado “Normal”.

Presione Aceptar.

Cátedras de Estadística y Estadística I FHUC - UNL

Clic!

Clic!

Clic!

Page 20: Material Infostat - Unidad 1.docx

Profesorados de Matemática y Biología – Licenciatura en Biodiversidad FHUC

7. Se generarán los siguientes gráficos.

Puede desplazarse entre ellos utilizando las pestañas inferiores.

Este gráfico compara los cuantiles observados en la muestra versus los cuantiles de una distribución normal. Si los puntos se aproximan a la línea recta y=x, la muestra es proviene de una distribución normal.

Se observa que la fórmula Modificada presenta algunas desviaciones de la normalidad, en cambio, la muestra de la fórmula No Modificada parece provenir de una distribución normal ya que los puntos están alrededor de la recta. Hay que tener en cuenta que se está trabajando con pocos datos, con lo que hay menos precisión.

8. Complementariamente es posible realizar un test de hipótesis acerca de la forma de la distribución.

La hipótesis Nula es: H0=“La distribución es Normal”

Contra la alternativa: H1=“La distribución no es Normal”

Haga clic en el menú “Estadísticas”, submenú “Inferencia basada en una muestra” y seleccione la opción “Prueba de Normalidad (Shapiro-Wilks modificado)” como muestra la figura siguiente.

Cátedras de Estadística y Estadística I FHUC - UNL

Page 21: Material Infostat - Unidad 1.docx

Clic!

Profesorados de Matemática y Biología – Licenciatura en Biodiversidad FHUC

9. Se abrirá la siguiente ventana de selección de variables.

Al igual que antes, coloque:

“Tamaño” en Variables y

“Fórmula” en Particiones.

10. Presione Aceptar. Los resultados se muestran en la figura siguiente:

Cátedras de Estadística y Estadística I FHUC - UNL

Page 22: Material Infostat - Unidad 1.docx

Profesorados de Matemática y Biología – Licenciatura en Biodiversidad FHUC

Las conclusiones son similares a las obtenidas en el Q-Q Plot. Se observa que la muestra obtenida por la fórmula modificada no parece ser normal (p=0,0787).

Por otro lado la muestra obtenida por el alimento realizado con la fórmula sin modificar el valor p indica que la muestra parece provenir de una distribución normal (recordemos que en los test de hipótesis se rechaza o no la hipótesis nula, en este caso no se rechazó).

Comentario: A pesar la falta de normalidad en la muestra con la fórmula modificada no se descartan las conclusiones anteriores ya que, como se dijo antes, desviaciones moderadas de la normalidad no afectan el test (otra opción sería aplicar algún método de comparación no paramétrico, aunque tienen menor potencia que el test T).

J. Uso de la Ayuda

En el menú Ayuda es posible acceder al manual de Infostat en formato PDF. Este manual es muy completo y tiene ejemplos desarrollados.

Además es posible verificar si existen nuevas versiones disponibles (con mejoras).

K. Actividad Complementaria 1

Los siguientes datos corresponden a la cantidad de flores a los 60 días en plantas de dos variedades de geranio, A y B. Grupo A: 4, 3, 7, 5, 2, 9, 1 Grupo B: 6, 4, 10, 12, 7, 5, 10

Utilizando Infostat realizar las siguientes actividades:

1. Cargue los datos en Infostat (en dos columnas).2. Calcule las siguientes medidas resumen: n, media, min, max, mediana, varianza, suma y suma de cuadrados.

3. Realice un Gráfico de Caja y un Gráfico de Densidad de Puntos.

Cátedras de Estadística y Estadística I FHUC - UNL

Page 23: Material Infostat - Unidad 1.docx

Profesorados de Matemática y Biología – Licenciatura en Biodiversidad FHUC

4. Realice un Gráfico de Caja y un Gráfico de Densidad de Puntos.

5. Formule y pruebe la hipótesis de igualdad de medias para ambos grupos (el test T). Use nivel de significación del 5% y una test bilateral.

L. Actividad Complementaria 2

Trabajando con el archivo “Ajoblanc.idb” (que se encuentra en los datos de prueba, ver figura) realice los siguientes ejercicios:

1. Utilizando el menú “Estadísticas”, “Tablas de frecuencias”, obtenga:

- Una tabla de frecuencias para la variable “perímetro” (variable perim).

2. Utilizando “Gráficos”, “Histograma” obtenga:

- Un histograma de frecuencias para la variable “perímetro” (variable perim)

- Realice el ajuste a una distribución normal (en las herramientas gráficas busque opciones del histograma)

- Obtenga el polígono de frecuencias acumuladas (mismo sector de opciones).

3. Utilizando “Gráficos”, “Gráfico de Barras”:

- Grafique el perímetro promedio clasificándolo por año, mostrando el error estándar.

- Luego grafique el peso promedio clasificándolo por año, mostrando también el error estándar.

- Finalmente grafique ambas variables en el mismo gráfico. Haga que el eje Y se inicie en cero (ver en herramientas gráficas).

Cátedras de Estadística y Estadística I FHUC - UNL