Cueva López

download Cueva López

of 36

Transcript of Cueva López

  • 7/22/2019 Cueva Lpez

    1/36

  • 7/22/2019 Cueva Lpez

    2/36

    2

    1. INTRODUCCIN A R 3

    2. ESTADSTICA DESCRIPTIVA 14

    3. ESTADSTICA BIDIMENSIONAL 20

    4. ANLISIS DESCRIPTIVO DE SERIES TEMPORALES 22

    5. INFERENCIA ESTADSTICA 25

    6. MODELOS DE REGRESIN LINEAL 33

    7. BIBLIOGRAFA 36

  • 7/22/2019 Cueva Lpez

    3/36

    3

    Una vez realizado el proyecto de programas de prcticas, vamos a

    empezar a desarrollar el contenido de este en cada uno de los

    apartados propuestos.

    Para ello, vamos a ir desarrollando los temas a travs de las

    secciones de este documento.

    1. Introduccin a REn este primer contenido del temario, vamos a ensear al alumno como

    instalar R, as como empezar a manejar el programa.

    Para empezar, indicaremos que, para obtener el programa que se va autilizar, introduciremos la direccin cran.r-project.org.

    Esta es la pgina oficial donde est el programa y todos los paquetes

    que, personas, universidades, ect van creando y colgando en la web

    para facilitar el trabajo.

    A continuacin, le daremos al hipervnculo Download for R

    dirigindonos al hipervnculo que sea conveniente con el sistema

    operativo de nuestro ordenador.

  • 7/22/2019 Cueva Lpez

    4/36

    4

    Ej.:

    Mi sistema Operativo es Windows, por lo que pulsar:

    Una vez estemos en dicha pgina, pulsaremos install R forthe first

    time y seguiremos las instrucciones para instalar.

  • 7/22/2019 Cueva Lpez

    5/36

    5

    Ej.:

    Si seguimos con el ejemplo anterior, pulsaremos:

    Terminada la instalacindel programa, procederemos a mostrar el

    programa.

    Primero abrimos el programa R, obteniendo la siguiente pantalla:

  • 7/22/2019 Cueva Lpez

    6/36

    6

    Como se puede observar en la anterior imagen, existe una ventana

    llamada R Console, donde escribiremos las ordenes y se mostrarn los

    resultados. Arriba de la ventana, hay unos mens desplegables, con las

    siguientes funciones:

    a. Archivo:

    En esta ventana tenemos las funciones de Interpretar cdigo

    fuente R, que nos lee las rdenes implementadas en la consola y

    muestra los resultados, Nuevo script nos abre un archivo donde

    se puede escribir las ordenes y que se muestren las soluciones

    en la consola. Esta funcin, nos permite modificar las rdenes

    sin tener que volver a escribirlas o si existe algn error en

    las rdenes, poder obtener los resultados sin necesidad de estar

    interrumpido por el error. En Abrir script, podemos abrir

    archivos de rdenes previamente redactados.Otra funcin importante es Cambiar dir.., donde podremos poner

    la direccin donde R coger los datos, y as nos ahorraremos el

    poner la direccin del ordenador donde estn al abrirlos.

  • 7/22/2019 Cueva Lpez

    7/36

    7

    b. Editar:

    En esta ventana, estn las funciones caractersticas de dicho

    men en otros programas.

    c. Visualizar:

  • 7/22/2019 Cueva Lpez

    8/36

    8

    d. Misc:

    e. Paquetes:

    Este men es ms caracterstico de R. En l, podemos cargar

    paquetes, previamente instalados en el programa, buscar los

    paquetes para instalarlos o actualizarlos.

    Tambin podemos instalarlos a partir de .zip previamente

    descargados.

  • 7/22/2019 Cueva Lpez

    9/36

    9

    f. Ayuda:El ltimo men del programa est compuesto por:

    Una vez presentado el programa, procedemos a explicar al alumno cmo

    introducir los datos al programa.

  • 7/22/2019 Cueva Lpez

    10/36

    10

    Los datos los vamos a introducir de dos formas distintas.

    Introducimos los datos mediante rdenes:Se realizar a partir de la siguiente orden:

    Nombre_conjunto

  • 7/22/2019 Cueva Lpez

    11/36

  • 7/22/2019 Cueva Lpez

    12/36

    12

    Una vez cargado el paquete se abrir la siguiente ventana:

  • 7/22/2019 Cueva Lpez

    13/36

    13

    Finalmente, realizamos las siguientes acciones:

    As, podemos introducir los datos a travs de R, con la opcin

    Nuevo conjunto de datos o de Importar datos.

  • 7/22/2019 Cueva Lpez

    14/36

    14

    2. Estadstica DescriptivaPara el mdulo de estadstica descriptiva, se va a utilizar el paquete

    ds.

    Este mdulo lo cre Emmanuel Arnhold, y en l nos vamos a basar para

    obtener la mayora de las medidas que se aprendern.

    Por tanto, empezaremos introduciendo los datos de la forma que hemos

    visto en la seccin anterior. Una vez introducidos los datos,

    aplicaremos las siguientes rdenes:

    Grfico de nube de puntosLa funcin que usaremos es:dplot data,xlab=variable x,ylab=variabley,position=1,colors=TRUE,type=o,mean=TRUE)Donde los argumentos que hemos usado son:

    - data: es el nombre del conjunto de datos que hemosintroducido anteriormente en el programa

    - xlab: es el ttulo del eje x.- ylab: es el ttulo del eje y.- position: es la posicin que queremos en que quede la leyenda

    del grfico. Las posiciones que vienen dadas por el autor son

    las siguientes: top=1, bottomright=2, bottom=3, bottomleft=4,

    left=5, topleft=6, topright=7, right=8, center=9.

    - colors: si intoducimos TRUE, las lneas aparecern en color ysi utilizamos la orden FALSE, las lneas saldrn de color

    negro.

    - type: es el tipo de punto.- mean: si queremos que aparezca el punto media utilizaremos

    TRUE, si queremos que slo aparezca el dato original,

    pondremos false.

  • 7/22/2019 Cueva Lpez

    15/36

    15

    Estadsticos descriptivos general:La orden que utilizaremos para esto es:

    gds data)Dicha funcin nos devuelve la media, el mximo, el mnimo, la

    mediana, la media + o la desviacin tpica, los cuantiles, el

    nmero de datos, el rango, la varianza, la desviacin tpica, el

    error cuadrtico medio, el coeficiente de variacin de skewness,

    curtosis y el test de normalidad, mostrando el p-valor asociado

    al test de normalidad de Shapiro-Wilks.

    Ahora vamos a realizar un ejemplo de dicho paquete:

    Los datos introducidos en el programa son:

  • 7/22/2019 Cueva Lpez

    16/36

    16

    Y al usar la orden gds(Datos), obtenemos los siguientes resultados:

  • 7/22/2019 Cueva Lpez

    17/36

    17

    Finalmente, vamos a realizar un grfico con las dos variables que

    hemos introducido con nuestros datos.

  • 7/22/2019 Cueva Lpez

    18/36

    18

    Lo mismo que hemos realizado antes con el paquete ds, podemos

    realizarlo a travs del paquete descargado en la seccin anterior,

    RCMDR.

    Realizando la siguiente operacin:

    Una vez pulsado en Resmenes numricos realizamos la siguiente accin:

    Y al darle a aceptar, aparecern los valores que hayamos sealizado en

    esta ventana.

    A continuacin, vamos a introducir otro paquete de R, el cual, no slo

    nos servir para estaseccin, sino que lo utilizaremos ms adelante

    para realizar algunos anlisis.

    Este paquete se llama DescTools. Primero procederemos adescargarlo y una vez instalado, usaremos las siguientes funciones:

  • 7/22/2019 Cueva Lpez

    19/36

    19

    Media armnica:Para realizar la media armnica, utilizaremos la siguiente

    orden:

    Hmean x,na.rm=FALSE)Los argumentos que utilizaremos son:

    x: Datos introducidos en R.

    na.rm: Indica si existen valores lgicos en los datos que hemos

    introducido.

    Esta funcin nos devuelve el valor de la media armnica.

    Media geomtrica:La media geomtrica tiene la siguiente orden:

    Gmean x,na.rm=FALSE)Los argumentos que utilizaremos son:

    x: Datos introducidos en R.

    na.rm: Indica si existen valores lgicos en los datos que hemos

    introducido.

    Al final, la funcin nos devuelve el valor de la media

    geomtrica.

  • 7/22/2019 Cueva Lpez

    20/36

    20

    3. Estadstica BidimensionalHay veces que nos interesa ver el comportamiento de las variables que

    estn relacionados.

    Este comportamiento se conoce, a travs de la covarianza, el

    coeficiente de correlacin...

    Para dicha finalidad, vamos a usar los siguientes paquetes:

    - ds- stats ( puesta por defecto en el programa )

    Para calcular la covarianza, vamos a programarlo nosotros mismo,

    realizando el siguiente programa:

    table

  • 7/22/2019 Cueva Lpez

    21/36

    21

    El paquete estadstico para calcular la correlacin es ds, en

    concreto,la funcin que nos calcula la correlacin es:

    Dscor data,method=1,option=1)Esta orden nos devolver el dato de la correlacin y el p-valor del

    contraste de correlaciones asociado, pero en nuestro caso, slo nos

    interesa el valor de la correlacin.

    Si eligisemosel method=2, estaramos calculando la correlacin de

    Spearman, de la forma anteriormente escrita, se obtiene la correlacin

    de Pearson.

    Ejemplo:

    En este ejemplo, hemos introducido dos variables de datos, ponindolo

    en formato tabla posteriormente.

    Finalmente, aplicamos la orden y obtenemos el valor de la correlacin.

  • 7/22/2019 Cueva Lpez

    22/36

    22

    4.Anlisis Descriptivo de Series TemporalesEn dicha seccin, vamos a utilizar el paquete ya instalado en el

    programa, por defecto, como es el paquete stats.

    Dentro de este paquete, hay una funcin, llamada ts, en la que

    podremos realizar la descomposicin de la tendencia a travs de las

    Medias Mviles.

    Por tanto, introduciremos las siguientes rdenes en el programa:

    temp.ts=ts Datos,start=fecha,frequency=periodo)temp.tsplot temp.ts)tempdecomp.ts=decompose temp.ts)tempdecomp.tsHay que recalcar que, en nuestro fichero de datos, Datos, no

    introduciremos las fechas de nuestra serie temporal, por ello, la

    funcin ts, nos genera la la serie temporal.

    Start nos permite incluir la fecha de inicio de nuestros datos, y as

    no utilizar la cronologa puesta por defecto por el programa.Finalmente, en frecuency, marcaremos cual es la frecuencia de nuestros

    datos, es decir, si los datos son mensuales, cuatrimestrales,

    trimestrales,...

    Una vez vistas las rdenes que hay que utilizar para realizar la

    descomposicin, vamos a ver un ejemplo.

  • 7/22/2019 Cueva Lpez

    23/36

    23

    Ejemplo:

    Introducimos datos en el programa.

    Ahora introducimos la variable tiempo en nuestros datos,

    Finalmente, aplicamos la descomposicin por medias mviles:

  • 7/22/2019 Cueva Lpez

    24/36

    24

    Tambin, podemos realizar un grfico de los datos que hemos introducido:

    As, hemos obtenido la tendencia de la serie anteriormente

    introducida.

  • 7/22/2019 Cueva Lpez

    25/36

    25

    5. Inferencia EstadsticaLos contrastes que vamos a realizar sern a travs de los siguientes

    paquetes:

    -

    desctools ( ya instalado en secciones anteriores )- ds- n

    Esta seccin la dividiremos en los siguientes apartados:

    5.1. Intervalos de confianzaPara realizar intervalos de confianza para la media, utilizaremos el

    paquete desctools, y usaremos la siguiente orden:

    MeanCI x,trim=0,type=c classic,norm,basic,stud,perc,bca),conf.level=0.95,na.rm=FALSE,R=999)Donde tenemos los siguientes argumentos:

    - x: vector de datos- trim: vector de datos- type: tipo de intervalo que se quieres- conf.level: nivel de confianza que se requiere- na.rm: existencia de valores perdidos- R:Nmero de repeticiones posibles.

    Tambin, podemos realizar el intervalo de confianza para la diferencia

    de medias, utilizando la siguiente orden:

    MeanDiffCI x,y,type=c classic,norm,basic,stud,perc,bca),conf.level=0.95,na.rm=FALSE,R=999)Donde los argumentos son iguales que en la orden anterior.

    Si ahora queremos realizar el intervalo de confianza para la varianza,

    se utiliza la siguiente orden:

    VarCI x,type=c classic,norm,basic,stud,perc,bca),conf.level=0.95,na.rm=FALSE,R=999)Con argumentos iguales a la orden de intervalo de confianza para la

    media.

  • 7/22/2019 Cueva Lpez

    26/36

    26

    Hay que tener en cuenta que, en dichas rdenes, tambin aparecer la

    estimacin tanto de la media como de la varianza.

    As, realizamos un ejemplo:

  • 7/22/2019 Cueva Lpez

    27/36

    27

    5.2. Contrastes de HiptesisPara realizar el contraste de igualdad de medias vamos a usar el

    paquete estadstico Rcmdr.

    - Contraste de igualdad de mediasPrimero empezaremos por cargar el paquete. Una vez cargado, al ser un

    programa por mens, seguiremos los siguientes pasos:

    Una vez en introducidos, aparece la siguiente pantalla:

  • 7/22/2019 Cueva Lpez

    28/36

    28

    As, utilizaremos el tipo de contraste que se desee realizar, el valor

    con a comparar y la variable que vayamos a analizar.

    - Contraste de igualdad de medias de dos muestras dependientesSi estamos en un cotraste de igualdad de medias de dos muestras

    dependientes, realizaremos la siguiente operacin:

    As, aparecer la siguiente ventana:

  • 7/22/2019 Cueva Lpez

    29/36

    29

    Una vez sealadas las variables, nos introduciremos en la ventana

    Opciones, donde aparece:

    En dicha ventana introduciremos el tipo de contraste que se quiera

    realizar y el nivel de confianza al que queramos realizarlo.

    - Contraste de NormalidadVamos a realizar un contraste de normalidad. El contraste que vamos a

    usar es el test de Shapiro-Wilks, instalado en el paquete Ds,

    instalado anteriormente.

    La orden que utilizaremos para dicho test es la misma utilizado en elapartado 2 de este documento, gds.

    Aplicaremos un ejemplo para su uso:

    Los datos introducidos en el programa son:

  • 7/22/2019 Cueva Lpez

    30/36

    30

    Y al usar la orden gds(Datos), obtenemos los siguientes resultados:

  • 7/22/2019 Cueva Lpez

    31/36

    31

    5.3. ANOVAVamos a proceder a realizar el anlisis de la varianza apartir del paquete

    RCMDR.

    Para proceder con dicho paquete, primero vamos a crear un modelo por el cualse relacionen ambas variables.

    Este se crea a partir de:

  • 7/22/2019 Cueva Lpez

    32/36

    32

    Una vez creado el modelo, podemos realizar el anlisis de la varianza

    a partir del siguiente men:

    Por lo tanto, al aceptar obtendremos el contraste.

  • 7/22/2019 Cueva Lpez

    33/36

    33

    6. Modelos de Regresin LinealPara realizar el ajuste de regresin, vamos a utilizar el paquete

    Rcmdr.

    En dicho paquete, en el men de Estadsticos -> Ajuste de modelos ->Regresion lineal, podremos realizar una regresin del tipo:

    y=ax+b.

    Cuando realizamos dicho ajuste, nos aparece en la ventana de

    soluciones los coeficientes de nuestro modelo junto con los contrastes

    individuales de estos para saber si son o no significativos.

    Una vez estimados los coeficientes, realizaremos el ANOVA del modelo,

    usando lo explicado en el apartado anterior.

    Si no tenemos dos variables, y queremos realizar un anlisis del tipo:

    Y= ax1+bx2+Para realizar dicho contraste, seguiremos los siguientes pasos:

    Al introducirnos en Modelo Lineal, aparece la siguiente ventana:

  • 7/22/2019 Cueva Lpez

    34/36

    34

    Donde introduciremos la forma de nuestro modelo.

    Una vez realizados dichos pasos, obtenemos una estimacin de los

    parmetros del modelo, con sus respectivos contrastes individuales de

    los modelos.

    Para hacer ver si el modelo es significativo, realizaremos el anlisis

    ANOVA.

    A la hora de validar el modelo, se realizar el contraste de Breuch-

    Pagan para heterocedasticidad, utilizando el siguiente men:

    Una vez en el men,aparecer la siguiente ventana:

  • 7/22/2019 Cueva Lpez

    35/36

    35

    En donde podremos realizar el contraste.

    Tambin, realizaremos el test de Durbin-Watson para autocorrelacin,

    usando el siguiente men:

  • 7/22/2019 Cueva Lpez

    36/36

    7. BibliografaLa bibliografa utilizada para dicho trabajo es:

    - Cran.r-project.org-

    Apuntes de la asignatura Entornos de ComputacinEstadstica, Mster de Estadstica Aplicada, Universidad de

    Granada