Aplicaciones de Epidemiología Vegetal en SAS

9
Especial de Utilidades Aplicaciones de la Epidemiología Vegetal en el Sistema SAS Ing. BYRON HUMBERTO GONZALEZ RAMIREZ Administrador Centro de Telemática, Facultad de Agronomia USAC M.C. VICTOR MANUEL ALVAREZ CAJAS Profesor Titular Centro de Estadística y Calculo, Facultad de Agronomia USAC Introducción En las últimas tres décadas el avance tecnológico ha permitido el desarrollo de modernas máqui computación electrónica asi como diversos paquetes de cómputo electrónico para procesar bajo d procedimientos, información generada en las diferentes ramas de las ciencias. En particular, las aplicaciones computacionales a la metodología estadística permiten en la actual aplicación de rutinas de análisis en forma rápida y eficiente para la solución de los problemas que ocu la investigación científica. Este aspecto permite que un investigador procese su información exper utilizando modernos paquetes de computación electrónica en forma fácil y prácticamente sin tener que a programadores especializados. A finales de los años setentas, James Barr y James Goodnigth de la Universidad Estatal de Carolina de desarrollaron un proyecto para facilitar la implementación de procedimientos estadísticos a conjuntos de que culminó dando orígen al Statistical Analysis System. Después de 1972, el proyecto SAS origi ampliado y mejorado hasta llegar a formar el SAS Institute, que en la actualidad ha producido gran núm versiones a partir de la original, contándose entre ellas la Versión 6.12 for Windows 95 como la más rec El Centro de Estadística y Cálculo (CEC) de la Facultad de Agronomía de la Universidad de San Ca usuario del Sistema SAS desde 1991, y al igual que en otros centros de cómputo de diversas entidades dedican a la investigación en el país, ha percibido la necesidad de contar con documentos de apoyo en español, que permitan conocer y manejar los elementos necesarios para el manejo de este s computacional. El propósito del presente documento, es servir como material de apoyo para la consulta de los procedim de uso más frecuente en el Sistema SAS, y en ningún momento pretende sustituir a los manuales edita SAS Institute, los cuales se encuentran a disposición de los interesados en ampliar información de su en la Biblioteca del CEC. Empleo del Sistema SAS Para iniciar una sesión se acude al menú de inicio, luego dentro del submenú programas se busca la alternativ Statistical Analisis System tal como se muestra a continuación. Página 1 de 9 Aplicaciones de la Epidemiología Vegetal en el Sistema SAS 07/04/2008 http://cete.iespana.es/manuales/sasepidem.htm

description

Muestra el uso de SAS para encontrar correlaciones y modelos de regresión entre variables epidemiológicas

Transcript of Aplicaciones de Epidemiología Vegetal en SAS

Especial de Utilidades

Aplicaciones de la Epidemiología Vegetal en el Sistema SAS

Ing. BYRON HUMBERTO GONZALEZ RAMIREZ Administrador Centro de Telemática, Facultad de Agronomia USAC

M.C. VICTOR MANUEL ALVAREZ CAJAS Profesor Titular Centro de Estadística y Calculo, Facultad de Agronomia USAC

Introducción

En las últimas tres décadas el avance tecnológico ha permitido el desarrollo de modernas máquicomputación electrónica asi como diversos paquetes de cómputo electrónico para procesar bajo dprocedimientos, información generada en las diferentes ramas de las ciencias.

En particular, las aplicaciones computacionales a la metodología estadística permiten en la actualaplicación de rutinas de análisis en forma rápida y eficiente para la solución de los problemas que ocula investigación científica. Este aspecto permite que un investigador procese su información experutilizando modernos paquetes de computación electrónica en forma fácil y prácticamente sin tener que a programadores especializados.

A finales de los años setentas, James Barr y James Goodnigth de la Universidad Estatal de Carolina dedesarrollaron un proyecto para facilitar la implementación de procedimientos estadísticos a conjuntos deque culminó dando orígen al Statistical Analysis System. Después de 1972, el proyecto SAS origiampliado y mejorado hasta llegar a formar el SAS Institute, que en la actualidad ha producido gran númversiones a partir de la original, contándose entre ellas la Versión 6.12 for Windows 95 como la más rec

El Centro de Estadística y Cálculo (CEC) de la Facultad de Agronomía de la Universidad de San Causuario del Sistema SAS desde 1991, y al igual que en otros centros de cómputo de diversas entidadesdedican a la investigación en el país, ha percibido la necesidad de contar con documentos de apoyo enespañol, que permitan conocer y manejar los elementos necesarios para el manejo de este scomputacional.

El propósito del presente documento, es servir como material de apoyo para la consulta de los procedimde uso más frecuente en el Sistema SAS, y en ningún momento pretende sustituir a los manuales editaSAS Institute, los cuales se encuentran a disposición de los interesados en ampliar información de su en la Biblioteca del CEC.

Empleo del Sistema SAS

Para iniciar una sesión se acude al menú de inicio, luego dentro del submenú programas se busca la alternativStatistical Analisis System tal como se muestra a continuación.

Página 1 de 9Aplicaciones de la Epidemiología Vegetal en el Sistema SAS

07/04/2008http://cete.iespana.es/manuales/sasepidem.htm

Otra alternativa de ingreso corresponde a la búsqueda del acceso directo que se encuentra en el escritorio, comuestra enseguida.

Página 2 de 9Aplicaciones de la Epidemiología Vegetal en el Sistema SAS

07/04/2008http://cete.iespana.es/manuales/sasepidem.htm

Al ingresar al sistema se presenta una pantalla compuesta por tres ventanas, de las cuales denominaremos vactiva a aquella en la que se encuentra el cursor, como se indica enseguida:

En orden ascendente, primero aparece la ventana PROGRAM EDITOR que básicamente es un editor en el ingresan, editan y ejecutan las instrucciones de programación. La ventana LOG es donde el sistema decomentarios relacionados con las instrucciones incluidas; y la ventana OUTPUT es donde el sistema despliresultados de los procedimientos ejecutados por los programas ingresados.

En todas las ventanas se distingue la linea de Command ===> desde la cual pueden ejecutarse diversas oDentro de ellas las principales son: (se anota entre paréntesis la tecla de función especial abreviada)

NEXT (F5) Ciclo a la ventana siguiente

CLEAR (ALT + E) Limpia todo el texto de la ventana correspondiente

BYE (F12) Salida del sistemaOUT (F4) Ventana outputLOG (F3) Ventana log

RECALL (F9) Restituye en pantalla el ultimo programa ejecutado

ZOOM (F7) Amplia la ventana correspondiente hasta ocupar toda la pantalla.

SUBMIT (F10) Ejecuta el programa de procesamiento

Página 3 de 9Aplicaciones de la Epidemiología Vegetal en el Sistema SAS

07/04/2008http://cete.iespana.es/manuales/sasepidem.htm

Si se desea ejecutar un análisis estadístico en el sistema SAS deberán seguirse algunas etapas secuenciamismas se desarrollan en la ventana PROGRAM EDITOR, y se describen a continuación.

En la linea 00001 escriba:

DATA enferm;

Esta instrucción le indica al sistema SAS que inicie e identifique a un nuevo conjunto de datos SAS con el enferm. En la siguiente linea escriba:

INPUT var $ sev incid;

Estas instrucciones le indican al sistema que se van a incluir tres variables para análisis, y las mismas van dispuestas en columnas, la primera de ellas identificada como var (que por cierto es alfanumérica dado el sdólar colocado después del nombre) y las siguientes como sev e incid.

A continuación en la linea 00003 escriba:

CARDS;

Esta instrucción permite indicarle al sistema que enseguida aparecerán el conjunto de datos a analizar.

La instrucción y datos completos serían:

CARDS;

TOP (F11) Posiciona el cursor en la parte superior del archivo

BOTTOM Posiciona el cursor en la parte inferior del archivo

A 34 21 B 34 23 B 27 19 A 41 25 A 22 22 B 23 22 A 25 21 B 27 18 A 19 27 A 24 24 B 26 19 A 26 21 B 22 21 B 25 24

Página 4 de 9Aplicaciones de la Epidemiología Vegetal en el Sistema SAS

07/04/2008http://cete.iespana.es/manuales/sasepidem.htm

;

Al terminar de ingresar la totalidad de datos a analizar note que se coloca un punto y como al final, lo que insistema que ya no habrán más datos a ser considerados.

El ingreso de los datos puede hacerse directamente en SAS, aunque su manejo dentro del sistema puedecierto momento complejo. La otra alternativa consiste en digitar los datos en una hoja electrónica y luego impa la ventana del PROGRAM EDITOR.

Después de estar seguro que todos los datos han sido correctamente ingresados, se escriben la instruccionharán las rutinas de análisis, habitualmente dichas rutinas son invocadas con el uso de la instrucción (abreviatura del inglés PROCEDURE). Asi dependiendo de lo que estemos interesados en solicitar se ingdiversas alternativas para esta instrucción. Veamos algunos ejemplos:

PROC sort; BY var;

RUN;

Aquí se indica a SAS que ordene el conjunto de datos en función de la variedad. La palabra RUN sugiere al sejecutar el conjunto de instrucciones previamente ingresadas.

PROC PRINT;

RUN;

Esta instrucción permite ordenar la impresión de los datos en la ventana de OUTPUT respetando el orden en escribieron.

Para correr el programa habrá que pulsar la tecla F10. Una vez corrido el programa deberá pulsarse F3 paraventana de LOG, observar los mensajes referentes a la sesión de análisis actual presionando F7 para amventana, usar PgUp o PgDn para ver toda la información, y finalmente corregir los errores que puedan aseñalados.

Si aparecieran errores señalados observe y anote atentamente cuáles son, enseguida presione ALT+E para bcontenido de la ventana de LOG, luego presione F6 para ir a la ventana de PROGRAM EDITOR, una presione F9 para llamar nuevamente al programa recien ejecutado, haga las correcciones debidas y nuevpresione F10 para correr el programa.

En algunos casos podrá ser necesario eliminar, copiar o mover filas completas o bien cambiar de posición alguellas, el siguiente caso sirve de ejemplo:

00001 DATA dos; 00002 INPUT x y; 00003 CARDS; 00004 5 11 00005 4 14 00006 7 10 00007 5 12 00008 6 13 00009 8 11 00010 1o 14 00011 5 10 00012 ;

Página 5 de 9Aplicaciones de la Epidemiología Vegetal en el Sistema SAS

07/04/2008http://cete.iespana.es/manuales/sasepidem.htm

00013 PROC UNIVARIATE PLOT NORMAL; 00014 RUN;

En el ejemplo anterior hay un número mal digitado en la linea 10, si decidieramos eliminar esta línea del bastará con colocarle una d sobre cualquiera de los números que identifican la fila, luego se presiona ENTERla linea abra desaparecido. La ilustración de este procedimiento se presenta enseguida:

00001 DATA dos; 00002 INPUT x y; 00003 CARDS; 00004 5 11 00005 4 14 00006 7 10 00007 5 12 00008 6 13 00009 8 11 0d010 1o 14 00011 5 10 00012 ; 00013 PROC UNIVARIATE PLOT NORMAL; 00014 RUN;

Cuando se desea eliminar varias líneas en un rango ininterrumpido se escribe dd en la primera linea y dd en lalinea del bloque a eliminar y listo.

Cerciorese de que el programa corre ahora sin errores, si esto es asi, pulse ahora F4 para ir a la ventOUTPUT y observar los resultados de los procedimientos solicitados.

Si los resultados obtenidos son satisfactorios se puede optar entre imprimir las salidas obtenidas o bien guardaun archivo magnético para su posterior consulta.

Si se desea guardar los resultados en un archivo electrónico en la linea de Command de la ventana de OUTescribe:

Command ===> "file a:\enferm.sal"

Las instrucciones anteriores ordenan al sistema guardar en el disco ubicado en el drive a toda la informaciónnombre enferm, la extensión sal sugiere que son resultados de análisis. Si igualmente se quiere guardar el proingresado en la ventana PROGRAM EDITOR el conjunto de instrucciones es el mismo, únicamente cambiarse la extensión sal por sas. Esto sugiere que el archivo contiene instrucciones de programación.

Es posible que en el futuro necesitemos revisar nuevamente los programas elaborados, para ello bastará con las instrucciones siguientes en la ventana del PROGRAM EDITOR:

Command ===> "inc a:\enferm.sas"

En las instrucciones indicadas deberá definirse sin equivocaciones el nombre del archivo correspondiente y

Página 6 de 9Aplicaciones de la Epidemiología Vegetal en el Sistema SAS

07/04/2008http://cete.iespana.es/manuales/sasepidem.htm

donde se encuentra guardado.

Ejemplos aplicados a la Fitopatología

Sesgo de Visualización

El propósito de este ejemplo es la identificación de errores que puedan cometerse en la estimación visual de laenfermedades de los cultivos.

Para realizar este ejemplo inicialmente deberá dirigirse a la figura 1, donde se encuentran 40 hojas enfermas simuladas, en la figura las manchas negras en cada hoja son lesiones y deben tomarse como tejido enfermo.

Para este ejercicio deberá examinar visualmente cada una de las siguientes hojas y asignarles un valor de sev

1,2,4,7,8,9,11,12,15,16,17,18,20,21,23,25,26,28,30,31,32,34,36,39,40

Finalmente deberá comparar los valores que usted asigne con los valores reales del porcentaje de severidahacer tal comparación deberá ingresar ambos conjuntos de valores al sistema SAS y solicitar un anácorrelación.

Las instrucciones de programación que deberán ingresarse son las siguientes:

OPTIONS NODATE; DATA dos; INPUT misev sevreal; CARDS; X Y X Y X Y . . . . X Y ; PROC CORR; VAR X; WITH Y; RUN;

Exactitud y Precisión en la Evaluación de Enfermedades

Cuando nos referimos a la cercanía de un valor estimado a uno verdadero estamos hablando de exactitud, y se evalua la diferencia entre una media verdadera y una media estimada cualquiera nos referimos a sesgo.

En torno a estos aspectos resalta la precisión como una medida de la variabilidad de un conjunto de

Página 7 de 9Aplicaciones de la Epidemiología Vegetal en el Sistema SAS

07/04/2008http://cete.iespana.es/manuales/sasepidem.htm

estimados en relación a los valores verdaderos. Esta precisión puede ser evaluada usando la varianza de unamuestral o bien el coeficiente de determinación de una modelo de regresión lineal simple.

En el último caso la pendiente del modelo puede emplearse como estimación de la precisión.

En el siguiente ejercicio se pretende determinar la exactitud y precisión que pueden tenerse en los casos en evalúen enfermedades.

Para desarrollar el ejercicio se considerarán nuevamente las evaluaciones de severidad de la enfermedad sien el ejercicio anterior.

Deberá usar esos valores para comparar su exactitud y precisión con los valores obtenidos por los estimadorey C.

El programa SAS para solicitar esta información es el siguiente:

OPTIONS NODATE; DATA dos; INPUT hoja sevreal misev sevA sevB sevC; CARDS; 1 X 1.4 3 4 2 2 X 2.6 5 6 3 4 X 4.3 2 8 4 7 X 2.6 6 8 3 8 X 15.4 16 25 15 9 X 10.2 15 15 12 11 X 6.8 5 10 8 12 X 20.5 16 25 20 15 X 27.3 35 35 30 16 X 9.1 15 20 10 17 X 3.4 3 8 4 18 X 6.8 12 19 8 20 X 10.2 5 15 10 21 X 5.1 8 10 15 23 X 15.4 20 25 15 25 X 23.1 15 28 25 26 X 18.2 15 25 20 28 X 27.3 35 35 30 30 X 27.3 28 35 30 31 X 8.0 12 15 10 32 X 10.2 10 15 10 34 X 8.0 15 15 8 36 X 20.5 20.5 30 20 39 X 34.5 34.5 40 35

Página 8 de 9Aplicaciones de la Epidemiología Vegetal en el Sistema SAS

07/04/2008http://cete.iespana.es/manuales/sasepidem.htm

______________________________________________________________________________________

Edificio T-8, Tercer Nivel, Ciudad Universitaria, Zona 12, Guatemala, Guatemala 01012, Apdo. Postal 1545 Telefax +502 4769842, Comunicación con el CETE [email protected]

; PROC PRINT; PROC PLOT; PLOT misev*sevreal sevA*sevreal sevB*sevreal sevC*sevreal; PROC GLM; MODEL misev sevA sevB sevC=sevreal; RUN;

40 X 54.6 54.6 60 55

Página 9 de 9Aplicaciones de la Epidemiología Vegetal en el Sistema SAS

07/04/2008http://cete.iespana.es/manuales/sasepidem.htm