Proyecto estadistica

16
PROYECTO DE ESTADÍSTICA Primer Parcial Integrantes: Gabriel Gallardo Hellen Alvarez Paralelo: 6

description

Proyecto estadistica

Transcript of Proyecto estadistica

Page 1: Proyecto estadistica

Proyecto de esTADÍSTICA

Primer Parcial

Integrantes:

Gabriel GallardoHellen Alvarez

Paralelo: 6

Page 2: Proyecto estadistica

Contenido

Introducción.................................................................................................................................2

Marco Teórico..............................................................................................................................3

Estadísticas Descriptivas...............................................................................................................6

Resultados de Análisis..................................................................................................................9

Conclusiones..............................................................................................................................11

Recomendaciones......................................................................................................................11

Bibliografía.................................................................................................................................12

Referencias.................................................................................................................................12

1

Page 3: Proyecto estadistica

Introducción.

Acogiéndonos al concepto de muestreo de aceptación, el cual indica que al evaluar un colectivo homogéneo a través de una muestra aleatoria, que nos permite determinar la aceptación o el rechazo del colectivo; es decir, es un contraste en el que se evalúa una característica (parámetro de una población) a través de valores muestrales, el presente proyecto tiene como objetivo simular y aplicar el  concepto, sus ventajas, la manera de llevarlo a cabo, sus usos y la función que tiene, el empleo de gráficos en esta técnica, explicara cómo se deben llevar a cabo las observaciones y los registros de datos de la manera más adecuada y efectiva para lograr un resultado de mayor certeza.

Mencionaremos como determinar la frecuencia de las observaciones, con el uso de un software, explicaremos la aplicación de la computación en esta técnica, con la que se facilita el proceso del muestreo del trabajo, agilizando la obtención de datos y sus resultados, disminuyendo notablemente el tiempo de realización del proceso.

Finalmente daremos las aplicaciones reales que han sido determinadas en los parámetros considerados en los requerimientos como son que las ánforas representan lotes o contenedores de cierto artículo que se compra de algún lugar, y que las bolitas marcadas representan artículos defectuosos, de las cuales se deberán extraer al azar 5 bolitas, y anotar cuántas de las 5 son defectuosas dando al proceso tal número de repeticiones proyectadas a 100 veces sin olvidar anotar cuántas de las 5 son defectuosas, de manera en que resulten 100 números.

2

Page 4: Proyecto estadistica

Marco Teórico

Para la elaboración de este proyecto consideraremos las definiciones detalladas a

continuación:

Frecuencia absoluta: el número de veces que aparece un valor, se representa

con fi donde el subíndice representa cada uno de los valores. La suma de las frecuencias

absolutas es igual al número total de datos, representado por N. f1+f2+f3+…+fn=N.

Frecuencia relativa: el resultado de dividir la frecuencia absoluta de un determinado

valor entre el número total de datos, se representa por ni. ni=fiN

La suma de la frecuencias relativas es igual a 1. Lo cual puede verse fácilmente si se

factoriza N.

Frecuencia absoluta acumulada: la suma de frecuencias absolutas de todos los valores

iguales o inferiores al valor considerado, se representa por Fi.

Frecuencia relativa acumulada: el resultado de dividir la frecuencia acumulada entre

el número total de datos, se representa por Ni.

Histograma: es una representación gráfica en la que la frecuencia (puede ser absoluta o

relativa) de la clase está representada por el área de la barra. Si todas las clases tienen

igual amplitud, la frecuencia de la clase está representada por la altura de la barra y el

gráfico se confunde como gráfico de barras. Pero si las clases tienen diferente amplitud

los gráficos de barra y los histogramas difieren. Despliega la variabilidad dentro de un

proceso, también toma datos variables (alturas, pesos, densidades, temperaturas, etc.) y

despliega su distribución. (Salvarrey, 2000)

Diagramas de barras: son una representación de cada una de las categorías de la variable mediante una barra colocada sobre el eje X y cuya altura sea la frecuencia o la frecuencia relativas de dichas categorías. (Sáez, 2012)

Ojiva: es la representación gráfica de un cuadro de frecuencia acumulada. En la gráfica

de ojiva, el último intervalo no se une con el eje horizontal. Para información que

presente frecuencias mayores que el dato que se está comparando tendrá una pendiente

negativa (hacia abajo y a la derecha) y en cambio la que se asigna a valores menores,

tendrá una pendiente positiva. (Salvarrey, 2000)

3

Page 5: Proyecto estadistica

Media muestral: dada una población X y una muestra de tamaño n, es decir, una

sucesión de variables aleatorias, X1,X2,...,Xn , réplicas de X; se entiende por media

muestral a: (Zurita, 2010)

Varianza: cuantificación de las distancias de los datos con respecto al valor de la media. (Zurita, 2010)

Distribución hipergeometrica: es una de las distribuciones de probabilidad discreta, se utiliza para calcular la probabilidad de una selección aleatoria de un objeto sin repetición (Zurita, 2010). La fórmula general es la siguiente:N: cantidad de elementos del conjunto de que se toma la muestraK: cantidad de elementos existentes que se consideran éxitosn: tamaño de la muestraX: variable aleatoria discretax: 0,1,2,….,n (son los valores que puede tomar X)

f ( X )=(Kx )(N−K

n−x )(Nn )

, x=0,1,2,3,…..n

Muestreo de aceptación: se define una muestra como una porción que se toma para

evidenciar la calidad del conjunto. El muestreo de aceptación es la inspección por

muestras en la que se toma la decisión de aceptar o no un producto o servicio; también

la metodología que trata de los procedimientos por los que las decisiones de aceptar o

no se basan sobre los resultados de la inspección de las muestras. (Sáez, 2012)

Curva de operación (OC):  representa gráficamente la relación existente entre un

porcentaje de artículos defectuosos de un lote productivo y la probabilidad de

aceptación que se obtiene del mismo luego de aplicar un plan de muestreo como los

detallados en la sección de muestreo simple. Cuando la calidad de un lote es buena tanto

al productor como al consumidor les interesa aceptar el lote con alta probabilidad, caso

contrario, especialmente al consumidor le interesa rechazar el lote la mayoría de las

veces. La probabilidad de aceptar un lote con 0 defectos es naturalmente un 100%.

Alternativamente si el 100% de las unidades son defectuosas la probabilidad de

aceptación del lote es 0%. Por lo tanto una curva característica de operación siempre

pasa por los puntos (0,1) y (100,0). (Moore, 2000)

Error o porcentaje de error: equivale a elegir una probabilidad de aceptar una hipótesis que sea falsa como si fuera verdadera, o la inversa: rechazar a hipótesis

4

Page 6: Proyecto estadistica

verdadera por considerarla falsa. Al igual que en el caso de la confianza, si se quiere eliminar el riesgo del error y considerarlo como 0%, entonces la muestra es del mismo tamaño que la población, por lo que conviene correr un cierto riesgo de equivocarse, comúnmente se aceptan entre el 4% y el 6% como error, tomando en cuenta de que no son complementarios la confianza y el error. (Salvarrey, 2000)

Variabilidad: es la probabilidad con el que se aceptó y se rechazó la hipótesis que se quiere investigar en alguna investigación anterior o en un ensayo previo a la investigación actual. El porcentaje con que se aceptó tal hipótesis se denomina variabilidad positiva y el porcentaje con el que se rechazó se la hipótesis es la variabilidad negativa. (Moore, 2000)

5

Page 7: Proyecto estadistica

Estadísticas Descriptivas

Primero se simulo el experimento estadístico realizando un programa en scilab con el cual creábamos el contenedor con los 40 objetos de los cuales 8 eran defectuosos y se procedía a sacar 5 al azar y anotar cuantas de las 5 estaban dañados un total de 100 veces.

El resultado se escribió en una hoja de cálculo y se la guardo en formato .csv para que se pueda leer luego en el programa R y ordenarlos mediante el siguiente código:

6

Page 8: Proyecto estadistica

Luego se procedió a realizar la tabla de frecuencias tanto absolutas como relativas:

Para luego proceder a Graficar el histograma y la Ojiva correspondiente:

7

Page 9: Proyecto estadistica

Luego calculamos media, varianza, desviación estándar, cuartiles, y el diagrama de cajas:

8

Page 10: Proyecto estadistica

Resultados de Análisis

Ahora se precede a realizar la distribución hipergeometrica (base de este experimento) para relacionar sus resultados con los obtenidos de manera “manual” con las 100 muestras:

Ahora obtenemos la diferencia entre ambos métodos estadísticos:

Como se puede observar las diferencias son muy pequeñas, por lo que se comprueba que la distribución del experimento es una distribución Hipergeometrica.

Ahora se procede a realizar la curva de operación aprobando el lote si como máximo existe un defectuoso entre ellos, a diferentes porcentajes de elementos defectuosos en el contenedor principal. Para ello se procede a realizar una distribución binomial (puede que el objeto este o no dañado) con una probabilidad de éxito que depende del

9

Page 11: Proyecto estadistica

porcentaje de elementos defectuosos totales. Como queremos aceptar el lote si hay como máximo un defectuoso, se deben sumar las probabilidades de que no existan defectuosos, y de que exista solo uno en el lote de prueba. A continuación se muestra el código utilizado:

Conclusiones

Los experimentos estadísticos, luego de muchos intentos nos damos cuenta que tienen resultados parecidos, es decir, tienen una tendencia a mostrar ciertos resultados una cantidad determinada de veces, es por eso que se pueden describir como distribuciones o modelos estadísticos muy precisos.

Como se pudo determinar con las pruebas, debido al bajo número relativo de objetos defectuosos, es normal que obtengamos como resultado que lo más probable es que de la muestra que escojamos tengamos un numero bajo de estos elementos defectuosos.

El experimento realizado es una distribución o modelo hipergeometrico. Resultado no solo previsto por la naturaleza del experimento sino confirmado

10

Page 12: Proyecto estadistica

por los errores casi nulos que obtuvimos al comparar los resultados de este modelo con los de estadística descriptiva.

Saber reconocer los modelos nos ayudan a tener una aproximación bastante certera del comportamiento de un experimento ahorrando en la práctica, el tiempo y recursos que conllevaría realizar las pruebas para los cálculos de estadística descriptiva.

La curva de operación es una técnica usada en calidad muy eficiente, y como se puede observar y es normal imaginarse que mientras menor sea el porcentaje de elementos considerados defectuosos, mayor será la probabilidad de que la producción sea aceptada. La curva depende también de los aspectos que se tomen en cuenta para definir un lote como “de calidad”, en este caso que máximo uno sea defectuoso, si al azar se extraen cinco.

Recomendaciones

Para la correcta utilización del lenguaje de programación R es necesaria la búsqueda de varias guías y referencias sobre el mismo, incluso el uso de la ayuda que los programas de lectura de código de R proporcionan acerca de los argumentos de cada función.

La curva de operación tiene distintas definiciones según la fuente de donde se investiga. Utilizar la que mayormente se adapte al experimento que estamos realizando.

Es preferible utilizar un programa para la realización del centenar de pruebas para dejar totalmente en la aleatoriedad la extracción de las muestras.

Analizar como los cambios en distintos parámetros afecta la forma de la curva de operaciones.

Bibliografía.

Moore, D. (2000). Estadística Aplicada Báasica (Segunda Edición ed.). W. H. Freeman and Company.

Sáez, A. (2012). Estadísticas para Ingrenieros (Primera Edición ed.). Jaen: Univerdad de Jaen.

Salvarrey, L. (2000). Curso de Estadística Básica (Segunda Edición ed.). Salto: Universidad de la República Oriental del Uruguay.

Zurita, G. (2010). Probabilidad y Estadística, Fundamentos y Aplicaciones (Segunda Edición ed.). Guayaquil: ESPOL.

11

Page 13: Proyecto estadistica

Referencias

cran.r-project.org/doc/contrib/Saez-Castillo-RRCmdrv21.pdf

www.youtube.com/watch?v=WD2HKtrl3wI

web.cortland.edu/matresearch/aceptacion.pdf

www.monografias.com/trabajos46/muestreo-de-aceptacion/muestreo-de-aceptacion2.shtml#formac

hyperphysics.phy-astr.gsu.edu/hbasees/math/mean.html

Simulacion_R-garcia-roman.pdf

ocw.uc3m.es/estadistica/aprendizaje-del-software-estadistico-r-un-entorno-para-simulacion-y-computacion-estadistica/introduccion-a-los-graficos-en-r

12