Separata Modulo II Estadistica

120
MODULO II METODOS ESTADISTICOS APLICADOS A LA INGENIERIA QUIMICA UNIVERSIDAD NACIONAL PEDRO RUIZ GALLO FACULTAD DE INGENIERIA QUIMICA E INDUSTRIAS ALIMENTARIAS CURSO DE TITULACION ESCUELA PROFESIONAL DE INGENIERIA QUIMICA MSc. ALFONSO TESEN ARROYO Grafico de control R. Nª de muestra Rango, R LC= 2.83 LCS=6.46 LCI=0.00 0 5 10 15 20 25 0 2 4 6 8

description

CURSO DE ESTADISTICA DISEÑOS

Transcript of Separata Modulo II Estadistica

UNIVERSIDAD NACIONAL PEDRO RUIZ GALLO

Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo

UNIVERSIDAD NACIONAL

PEDRO RUIZ GALLOFACULTAD DE INGENIERIA QUIMICA E INDUSTRIAS ALIMENTARIASCURSO DE TITULACION ESCUELA PROFESIONAL DE INGENIERIA QUIMICA

MSc. ALFONSO TESEN ARROYO

Lambayeque, Enero del 2015INTRODUCCIN

El presente curso responde a la necesidad de superar el nivel de anlisis y uso adecuado de la informacin en la toma de decisiones empresariales.

Cada da se viene implementando mejoras en las tcnicas de recoleccin, procesamiento y presentacin de los datos, pero muy poco se esta capacitando en el anlisis y uso de la informacin para la toma de decisiones gerenciales.

Este gran problema se hace continuo por la falta capacitacin y formacin constante en el rea y adems por no existir un sistema estadstico de informacin gerencial que facilite el anlisis y uso de la informacin.

Los mtodos estadsticos son herramientas eficaces para mejorar el proceso de produccin, y reducir sus defectos. Sin embargo, se debe tener en cuenta que las herramientas estadsticas son precisamente herramientas: no servirn si se usan inadecuadamente.

El anlisis de datos comprende la traduccin de informacin reunida durante un proyecto de investigacin, en una forma interpretable y til, independientemente del mtodo de reunin adoptado, esto es, cuestionario, mediciones Fsico-Qumico, medicin fisiolgica, escala de observacin, o de otro tipo; existe mucha ms informacin de la que puede ser manejada adecuadamente por el empleo causal de los datos

En gran medida, la abundante informacin que se dispone sobre los diseos de productos, procesos y el control de calidad en las empresas, no es usada para tomar decisiones y efectuar ajustes correctivos; de otro lado, existe escasa disposicin de instrumentos para detectar las necesidades de control de un proceso y las decisiones de la poblacin acerca de la buena utilizacin de las herramientas de estadsticas.

En los procesos industriales, el anlisis de datos por lo regular entraa el empleo de tcnicas estadsticas para organizar y reducir masas de datos a trminos descriptivos cmodos, y extraer inferencias de ellos. El anlisis estadstico genera informacin precisa y definida respecto a las caractersticas de los datos, en una forma que pueda ser comunicada con facilidad de un investigador a otro.

A muchos estudiantes amedrenta o desanima la simple idea de usar estadsticas. El temor es totalmente injustificado. El investigador no necesita tener conocimientos matemticos profundos para entender a la estadstica, ya que actualmente al encontrase fcilmente con computadoras y calculadoras, pero si es til tener idea de algunas operaciones. En la realidad todos utilizamos terminologa estadstica, inclusive en nuestra conversacin diaria, cuando hablamos de produccin, rendimiento de materia prima, calificaciones, promedios, o el porcentaje ingenieros colegiados que pertenecen a uno u otro sexo, en realidad hacemos tipos tiles de estadsticas descriptivas. As mismo cuando decimos que el nmero promedio de horas de trabajo de un ingeniero en planta es 10 horas, en realidad se ha organizado y entendido los datos, por innumerables operaciones que hacemos a nivel inconsciente, hasta lograr un anlisis estadstico de datos simple.

De todo lo anteriormente comentado, es que se vio en la necesidad ser incluido en el diplomado el curso de Mtodos Estadsticos y Control Estadstico de la Calidad, que ser de mucha utilidad al profesional de Ingeniera, Ciencias de la Salud, y Otros, teniendo como objetivos:

OBJETIVOS

Reconocer la importancia y necesidad de la informacin estadstica como herramienta fundamental de un proceso decisorio.

Utilizar las tcnicas bsicas del mtodo estadstico para la evaluacin de resultados de investigaciones.

Calcular e interpretar indicadores tiles en investigaciones y acciones de un ingeniero en una Planta.

CAPITULO I

METODOS ESTADISTICOS UTILES EN EL ASEGURAMIENTO DE LA CALIDAD

CONCEPTOS IMPORTANTES

ESTADSTICA.

Es la Ciencia que nos proporciona un conjunto mtodos cientficos para recolectar, organizar, resumir y analizar datos, para obtener conclusiones vlidas para la toma de decisiones razonables basadas con tal anlisis. La estadstica se divide en:

ESTADSTICA DESCRIPTIVA.La estadstica descriptiva, es la estadstica que slo se ocupa de describir y analizar un grupo de datos, sin sacar conclusiones sobre un grupo mayor.

ESTADSTICA INFERENCIAL.La estadstica inferencial, es un conjunto de procedimientos que nos permiten efectuar generalizaciones de la muestra a la poblacin. Se utiliza para probar hiptesis y estimar parmetros, se basa en el concepto de distribucin muestral.

UNIDAD DE ANALISIS O UNIDAD DE OBSERVACIN.Es la unidad indivisible a quien se estudia, del cual se obtiene el dato estadstico. Tambin se define como el objeto de estudio. Puede ser una paciente, una planta, un pescado, una lata de conserva, etc.

POBLACIN.

Es el conjunto de unidades de observacin o elementos de la misma especie que se pretende estudiar en una investigacin cientfica y de la cual se obtiene una muestra.PARMETRO.Es una medida de resumen que nos describe alguna caracterstica de la poblacin. Para calcular dicho valor es necesario utilizar todo los valores de la poblacin completa.

Algunos parmetros conocidos y que usaremos en este curso son:

La media poblacional denotado por (La varianza poblacional denotado por (2

La proporcin poblacional

denotado por P

El total poblacional denotado por X

El coeficiente de correlacin poblacional denotado por ( MUESTRA.Es un subconjunto de la poblacin sobre quienes se va estudiar, la cual debe haberse elegido al azar (aleatorio) y ser representativa de la poblacin a la cual pertenece, esto quiere decir sin sesgos. En general la muestra es toda parte representativa y adecuada de la poblacin. A partir del anlisis de la muestra obtenida correctamente y al azar , se puede hallar conclusiones que sean extrapolables a la poblacin de origen. Para elegir la muestra debe apelarse a un determinado mtodo de muestreo.

ESTADSTICO.Es una medida de resumen que nos describe algunas caractersticas de inters y cuyo valor es calculado usando slo los valores de los elementos o unidades de una muestra.

Algunos estadsticos conocidos y mas usados son:

La media muestral

denotado por

La varianza muestral denotado por S2

La proporcin muestral

denotado por p

El total muestral denotado por x

El coeficiente de correlacin muestral denotado por r

VARIABLES.Es una caracterstica o propiedad determinada de las unidades de anlisis, sea medible o no. Esta propiedad hace que las unidades de anlisis de un grupo pueden diferir de las de otro grupo en la muestra o poblacin de estudio.

CLASIFICACIN DE VARIABLES.

1.- Por Su Naturaleza. Se dividen.

Variable Cuantitativa: Es la que se puede medir. Habitualmente es llamada variable numrica o mtrica, estas se clasifican en:

Variables Cuantitativas Discretas: Tienen un recorrido finito o a lo mas numerable. Ejemplos: Nmero de latas de conserva que ingresan A una autoclave, Nmero de alumnos matriculados en el Diplomado de Supervisin y Control, Nmero de plantas Agroindustriales del departamento, Nmero de dientes con caries, Nmero de hijos por familia. etc.

Variables Cuantitativas Continuas: Tienen un recorrido infinito no numerable, la variable puede tomar, tericamente, cualquier valor en un cierto intervalo. Ejemplos: Densidad, humedad, acidez, temperatura, dureza del agua, Brix, Presin sangunea, nivel de colesterol en la sangre, estatura, peso, ingreso econmico, edad, longitud, etc.

Variable Cualitativa: Son variables que representan cualidades o atributos de la muestra, como por Ejemplo: El sabor, color, tipos de conservantes, tipos de licores, Genero ( masculino, femenino), VIH(presente, ausente), grupo sanguneo( A, B, AB, O), grado de instruccin, , desnutricin, etc.

2.- Por su Relacin.- Se clasifican en:

Variables dependientes: Es la variable motivo del estudio, cuyos valores dependen de otras variables que pueden influir en ella. Tambin se le llama variable respuesta. Ejemplo : Respuesta a un tratamiento, rendimiento escolar, ventas, etc.

Variable Independiente: Es la que modifica de una u otra manera a la variable dependiente, llamndose tambin segn el caso factor de riesgo, factor predictivo, Ejemplo: Horas de estudio, minutos de publicidad, etc.

Variable Interviniente: Son aquellas que coparticipan con la variable independiente condicionando a la variable dependiente.

Ejemplo: Material de trabajo, medios de publicidad, etc.ESCALAS DE MEDICION Variables categricas nominales: Son variables cualitativas que no permiten establecer un orden. Ejemplo: raza ( negra, blanca, trigueo, etc.), grupos sanguneos (A,B,AB,O). Tambin son excluyentes entre si, o sea que cada individuo pertenece a una u otra categora pero no a las dos al mismo tiempo.

Variables categricas ordinales: Estas si permiten establecer un orden determinado, por Ejemplo: grado de instruccin de un paciente (inicial, primaria, secundaria, superior), nivel socioeconmico (bajo, medio, alto). etc. Tambin son excluyentes entre si.

Escala Intervlica. Es una escala ordinal, que se usa en mediciones de variables continuas que adems de tener un orden tienen mantienen una equidistancia entre s y para lo cual pueden iniciar con un cero relativo o arbitrario y mantener un intervalo de separacin.

Ejemplo 1.- Temperatura, Presin de vapor, Brix, Acidez, Grado Alcholico, Las calificaciones de un test o de un examen de conocimientos. Estas tienen un cero elegido arbitrariamente, por ejemplo si un alumno obtuvo un calificativo de cero en un examen de matemticas I, esto significa que no sabe nada de la materia pues con otra prueba ms fcil podra tener otra calificacin.

Ejemplo 2.- Si tres alumnos A, B,C han obtenido los puntajes 2, 4, 16 respectivamente, no solo se verifica las relaciones 2 y 20

2. Prueba Unilateral de Cola a la Izquierda

H0: = 0 contra H1 0 H1: 64

2. Nivel de significacin: ( = 0.01

3. Estadstica: Poblacin normal con varianza conocida, la estadstica apropiada es.

Z=

4. Regin Crtica: Para ( = 0.01 y una prueba unilateral con cola a la derecha , en la tabla normal N( 0,1) se encuentra el valor crtico

Z( =Z0.01 = 2.33

5. Clculos: De los datos se tiene.

n=81, = 68, ( = 8

Z= = = 4.4

6. Decisin: Como el ZC = 4.4 ( Zt= 2.33, entonces rechazamos H0 y concluimos que podemos asegurar que a un nivel de confiabilidad del 99% que los postulantes han elevado su rendimiento.Ejemplo N4.

El gerente de la Empresa empresa de transportes E&S desconfa de la afirmacin de que la vida til promedio de ciertos neumticos es de almenos 28 000 millas. Para verificar ese argumento, la empresa instala 40 de esos neumticos en sus camiones y obtiene un ciclo de vida medio de 27463 millas con una desviacin estndar de 1348 millas. Qu puede concluir el gerente de ese dato, si la probabilidad de un error I se fija en cuando ms 0.05?

Solucin:

1.- Formulacin de las Hiptesis

H0 : ( ( 28 000 millas

H1 : ( ( 28 000 millas

2. Nivel de significacin: ( = 0.05

3. Estadstica: Poblacin normal con varianza conocida, la estadstica apropiada es.Z=

4. Regin Crtica: Para ( = 0.05 y una prueba unilateral con cola a la izquierda , en la tabla normal N( 0,1) se encuentra el valor crtico

Z( =Z0.05 = -1.645

5. Clculos: De los datos se tiene.

n=40 , = 27 46368 , ( = 1 348

Z= = = -2,52

6. Decisin: Como -2,52 ( -1,645 entonces rechazamos H0 a un nivel de significancia de 0.05; en otras palabras se confirma la sospecha del gerente de la empresa de transportes de que ((28000 millas.Ejemplo N5.

Una mquina llenadora de botellas de gaseosa; se supone que el volumen medio de gaseosa en cada botella es de 32 onzas, con una desviacin estndar de 0.06 de onza. En una comprobacin sistemtica para verificar que si la mquina funciona adecuadamente, se toman aleatoriamente 36 botellas llenas y se advierte que contiene una media de 32.1 onzas. A un nivel de significacin de 0.05, La mquina funciona adecuadamente ( o est bajo control)?

Solucin

1.- Formulacin de las Hiptesis

H0: ( = 32 onzas

H1: ( ( 32 onzas

2.- Nivel de significacin: ( = 0.053.-Estadstica: Poblacin normal con varianza conocida, la estadstica apropiada es.

Z=

4.- Regin Crtica: Para ( = 0.05; y una prueba bilateral con dos colas; en la tabla normal N( 0,1) se encuentra el valor crtico

Z(/2 =Z0.05/2 = Z0.025 = -1.96 Tambin es lo mismo:

Z1-(/2 =Z1-0.05/2 = Z0.975 = 1.96

5.- Clculos de los datos se tiene.

n = 36; = 32.1; ( = 0.06

Z= = = 10

6.- Decisin: Como Zc =10 > Zt =1,96, entonces rechazamos la H0 a un nivel de significancia de 0.05 y afirmamos que la mquina no funciona adecuadamente, por lo tanto, necesita un ajuste.

2.- Pruebas de Hiptesis acerca de una media : Varianza 2 supuesta desconocida.

A) Poblacin no normal.

Si la poblacin no tiene distribucin normal, pero si el tamao de la muestra es grande ( n ( 30 ), se suele utilizar la estadstica Z=

Donde la desviacin estndar ( se estima puntualmente por S.

Ejemplo.En la investigacin de varias denuncias respecto al aviso "Peso Neto 300gr"que aparece en los frascos de caf molido" El Morenito", el comit de Defensa del Consumidor seleccion una muestra de 36 frascos, la muestra arroj un peso neto medio de 298 g y una desviacin estndar de 7.5 gr. Utilizando un nivel de significancia de 0.01, Qu conclusin debe sacar el comit de Defensa acerca de la operacin de la compaa envasadora de caf?

Solucin.

1.- Formulacin de las Hiptesis

H0: ( =300 gr

H1: ( ( 300 gr

2. Nivel de significacin: ( = 0.01

3. Estadstica: Poblacin normal con varianza conocida, la estadstica apropiada es. Z=

4. Regin Crtica: Para ( = 0.01 y una prueba unilateral con cola a la izquierda , en la tabla normal N( 0,1) se encuentra el valor crtico

Z( =Z0.05 = -2.33

5. Clculos: De los datos se tiene.

n=36, = 298, ( = 7.5 ( S datos obtenidos de la muestra

t = = = -1.60

6.- Decisin: Como -1,60 ( -2.33; no se rechaza H0 ( se acepta H0), luego se puede concluir que la compaa envasadora est cumpliendo con el peso neto enunciado.

B) Poblacin normal.

Sean y S2 la media y la varianza de una muestra aleatoria de tamao n, seleccionada de una poblacin con distribucin normal N (( ,(2), donde ( y (2 son desconocidas. Entonces, la estadstica. t = , tiene distribucin t-Student con n-1 grados de libertad: Donde: t0 = t(1-() (n-1) Ejemplo 1.

Las cajas de un cereal producidas en una fbrica, deben tener un contenido de 16 onzas. Un inspector tom una muestra que arroj los siguientes pesos en onzas:

15.7, 15.7, 16.3, 15.8, 16.1, 15.9, 16.2, 15.9, 15.8, 15.6.

Indicar si es razonable que el inspector, usando un nivel de significacin del 5%, ordene se multe al fabricante.

Solucin.1.- Formulacin de las Hiptesis

H0: ( = 16

H1: ( < 16

2.- Nivel de significacin: ( = 0.05

3.- Estadstica: Poblacin normal con varianza conocida, la estadstica apropiada es.

t =, tiene distribucin t-Student con 9 grados de libertad. 4.- Regin Crtica: Para ( = 0.05 y una prueba de una cola a la izquierda, en la tabla de probabilidades t-Student se encuentra t0= t(() (n-1) = t(0.05)(9) = -1.833.

Observacin.

Si la cola estuviera hacia la derecha, entonces el valor de t se toma de la siguiente manera: t(1-() (n-1) = t(0.95)(n-1)

5.- Clculos: reemplazando en el estadstico de prueba los datos se tiene.

N =10, = 15.9 S= 0.231; Estos valores se calculan de la muestra.

tc = = = -1.368

6. Decisin: Como tc = 1.368 > tT = -1.833; no se rechaza H0 , por lo tanto se concluye que no se multara al fabricante a un nivel de significancia del 5%, por estar bien los pesos, la diferencia se debe al azar.

Ejemplo 2.

Se sabe que los ingresos quincenales de un gran nmero de individuos se distribuyen normalmente con una media de S/ 152. En un estudio estadstico reciente una muestra aleatoria de 9 individuos de esa poblacin ha dado los siguientes ingresos quincenales ( en soles):

158; 154; 152; 156; 151; 150; 153; 155; 157.

A nivel de significancia del 5% Ha cambiado el ingreso medio quincenal de tal poblacin?.

Solucin.

1.- Formulacin de las Hiptesis

H0: ( =152

H1: ( ( 152

2.- Nivel de significacin: ( = 0.05

3.- Estadstica: Poblacin normal con varianza conocida, la estadstica apropiada es.

t =, tiene distribucin t-Student con 8 grados de libertad.

4.- Regin Crtica: Para ( = 0.05 y una prueba bilateral con dos colas, en la tabla de probabilidades t-Student se encuentra t0 = t(1-(/2) (n-1) = t(0.975,8) = 2.306.

5.- Clculos: De los datos se tiene.

n= 9, = 154 S= 2.7386 de la muestra

t = = = 2.19

6. Decisin: Como 2.19(2.306; no se rechaza H0 y se concluye que la media de los ingresos quincenales no ha variado.

2.- Pruebas de Hiptesis acerca de dos medias:

Pruebas de hiptesis acerca de dos medias: Varianzas y supuestamente conocidas.

Si las dos poblaciones son normales o no, pero n1 y n2 son suficientemente grandes( n1 ( 30 y n2 (30), entonces tienen respectivamente distribucin normal o aproximadamente normal.

N((1, (2 - ) . Luego, la estadstica.

- (1 -2)

2

Ejemplo1: Dos grupos de trabajadores de una empresa Agroindustrial, han sido sometidos a un entrenamiento por dos mtodos diferentes, que llamaremos A y B. Una vez terminada la instruccin, para verificar la eficacia de los mtodos, se aplic un examen arrojando los siguientes resultados:

Mtodo AMtodo B

= 73.4

S1 = 8

n1 = 50= 70.3

S2 = 10

n2 = 50

Utilizando un nivel de significancia de 0.05 puede asegurarse que las medias de ambos mtodos no son iguales?

Solucin.

Como n1 ( 30 y n2 (30 entonces los datos se aproximan a una distribucin normal y por lo tanto se puede aproximar a S1 ( (1 y S2 ((2

1. - Formula de hiptesis.

H0: (1 = (2 , ((1 -(2= 0)

H1: ( ( (2

2.- Clculo del punto crtico"z0". Por ser una prueba de dos colas, con (=0.05, entonces:

P(Z ( z0 ) = 0.975

F(z0 ) = 0.975

z0 = 1.96

3.- Regin Crtica.

4. Clculo del estadstico "Z"

Por la frmula:

Z =

EMBED Equation.3 = = 1.71

5.- Toma de decisin. Como 1.71 no es mayor que 1.96, no se rechaza H0 ( se acepta H0) luego se puede concluir que las medias de ambos mtodos son iguales.

Ejemplo2. En un sistema acadmico universitario, se aplicaron dos mtodos A y B para la enseanza de la Tecnologa de Alimentos; en un grupo de n1 = 100 se aplic A y en otro de n2 = 300 se aplic B. Las medias de las calificaciones obtenidas fueron: = 12 para A e = 12.2 para B. Puede admitirse que los mtodos de enseanza no difieren en los resultados y que las diferencias encontradas en las muestras se deben al azar?. Por experiencias anteriores se conoce que cada variable X e Y, que representan los resultados respectivos, tiene distribucin normal con varianzas 3 y 3.12, respectivamente. Usar (=0.01

Solucin.

1.- Formula de hiptesis.

H0: (1 = (2 , ((1 -(2= 0)

H1: (1 ( (2 , ( (1 - (2 ( 0 )

2.- Clculo del punto crtico"z0". Por ser una prueba de dos colas, con (=0.01, pero como es una prueba de dos colas se tiene (/2=0.005 entonces:

P(Z ( z0 ) = 0.995

F(z0 ) = 0.995

z0 = -2.58

3.- Estadstica.

Z =

EMBED Equation.3

EMBED Equation.3 =4.- Regin Crtica

5.- El valor del estadstico, correspondiente a la diferencia de medias, es.

Z=

6.- Toma de Decisin: Como el valor de -0.9950 no cae en la regin de rechazo; podemos considerar que la diferencia hallada entre las medias muestrales no es significativa al nivel de 0.01.

CAPITULO IVANALISIS DE REGRESION LINEAL Y CORRELACION

ANALISIS DE REGRESION LINEALEn la investigacin estadstica es muy frecuente encontrar variables que estn relacionadas o asociadas entre s, es decir existen variables que se pueden explicar en funcin de otras variables.

Por ejemplo; el consumo de las familias depende de sus ingresos, el tiempo de servicios en el trabajo depende de la edad, el peso de los alumnos depende de la estatura, el rendimiento acadmico del alumno depende de las horas de estudio, las ventas dependen de la publicidad, etc., es decir existe una dependencia mutua entre los diferentes fenmenos o acciones vinculados con el hombre.

A esta relacin de dependencia entre variables se le conoce con el nombre de regresin; que en resumen consiste en observar en un determinado tiempo como ha influido el comportamiento de una variable en la otra. Ajustando este comportamiento a una recta (recta de regresin) estaremos en condiciones de efectuar predicciones para el futuro.

Cuando se tienen n observaciones bidimensionales, cada par de datos se puede expresar como pares ordenados {(X1,Y1), (X2,Y2)......(Xn,Yn)}, que al graficarse en el plano cartesiano estos puntos forman una NUBE DE PUNTOS que se le llama

DIAGRAMA DE DISPERSION que puede tomar diferentes formas:

Relacin lineal positiva

Relacin lineal negativa

Relacin no lineal

Ninguna relacin

En esta unidad trataremos de la parte bsica del tema de la regresin lineal simple determinado por la funcin lineal :Y = b0 + b1 X

REGRESION LINEAL SIMPLE

Es una tcnica estadstica que analiza si los valores de una variable dependiente e independiente puede predecirse mediante un modelo lineal.

Las variables implicadas en el modelo deben ser cuantitativas y continuas.

Para ajustar una lnea recta de Regresin, se considera la ecuacin de la recta:

= b0 + b1Xi; que tiene dos parmetros b0 y b1

Donde : b0 = distancia que existe entre el origen de coordenadas y el punto de interseccin de la recta con el eje Y

b1 = Coeficiente de Regresin (pendiente, proporcin de cambio)

X = Variable independiente. ( estimulo, de influencia, causa,)

Y = variable dependiente (respuesta, criterio, efecto)

Interpretacin del coeficiente b.

Si b1 ( 0 : La tendencia lineal es creciente , es decir a mayores valores de X corresponden mayores valores de y.

Si b1 ( 0 : La tendencia lineal es decreciente, es decir, a menor valores de X corresponden mayores valores de y.

Si b1 = 0 , entonces = b0 . luego; permanece estacionario para cualquier valor de X, es decir, no hay regresin.

Si los pares ( Xi , Yi ) se encuentran aproximadamente alineados, lo que indica que se puede ajustar una lnea recta a los puntos; esto es, se puede hacer pasar una recta que est lo mas cerca de ellos. La eleccin de tal recta puede hacerse por diversos mtodos, el ms simple es el que se realiza a mano alzada. Este mtodo no es tan riguroso pues depende de la persona que lo ejecuta. Otro mtodo es el que considera la recta que une los puntos ms extremos del grupo. Uno de los ms usados y que describiremos a continuacin, es el mtodo de mnimos cuadrados.

ESTIMACION POR EL METODO DE LOS MINIMOS CUADRADOS:

Una tarea principal en el anlisis de regresin lineal, es estimar los parmetros b0 y b1, cuyos valores se determinan a partir de los datos bidimensionales. El mtodo de los mnimos cuadrados consiste en hacer mnima la suma de los cuadrados de la diferencia entre los valores observados (yi), y los valores estimados ( ) es decir:

El clculo de los estimadores de los coeficientes de regresin a partir de los datos muestrales, viene dado por la siguiente expresin.

Ejemplo de Aplicacin.

En un estudio de la relacin entre la publicidad por radio y las ventas de un producto durante 10 semanas se han recopilado los tiempos de duracin en minutos de la publicidad por semana (X) y el nmero de artculos vendidos (Y), resultando

Semana12345678910

Publicidad (X)20303040506060607080

Ventas (Y)50736987108128135132148170

a)Trazar el diagrama de dispersin, e indicar la tendencia

b) Calcular la recta de regresin de mnimos cuadrados con el fin de predecir las ventas.

c) Si en la novena semana se incrementara la publicidad en 5 minutos determine en cuanto se estima se incrementen las ventas.

Solucin.

a) Al trazar el diagrama de dispersin, se observa que existe una relacin lineal positiva entre el nmero de artculos vendidos y el tiempo de publicidad semanal por radio.

b) Para determinar la recta de regresin por el mtodo de mnimos cuadrados a partir de los datos, es decir para calcular b0 y b1 se requiere realizar los siguientes clculos que se tienen a continuacin.

XYxyx 2Y 2

205010004002500

307321909005329

306920709004761

4087348016007569

501085400250011664

601287680360016384

601358100360018225

601327920360017424

7014810360490021904

8017013600640028900

50011006180028400134660

Donde :

n = 10 ;

Estimando el parmetro b1:

b1 == = 2Estimando el parmetro b0 :b0 = ( b ( ) = 110 - ( 2 )(50 ) = b0 = 10

Ecuacin de regresin estimada. = 10 + 2 xi

C.- Incremento de las Ventas

c.1.- El valor estimado de las ventas en la novena semana es :

Si en la novena semana se invirti X = 70 minutos ( se espera vender.

(

9 = 10 + 2 ( 70 ) = 150 artculos

En la novena semana se espera vender 150 artculos.

c.2.- Si en la novena semana se incrementa el tiempo de la propaganda en 5 minutos, entonces, el tiempo invertido con el incremento ser de X = 75 minutos ( la venta estimada ser de.

(

( = 10 + 2( 75 ) = 160 artculos, entonces el incremento de las ventas despus de aumentar los 5 minutos es de 160150= 10 artculos. Ejercicio propuesto.

1.- Los siguientes datos corresponden al ingreso mensual ( X) y egreso mensual ( Y ) de 10 profesores estatales.

x4506305007507506006508001000850

y420600500730720580600750850800

a) Construir el diagrama de dispersin

b) Estimar la ecuacin de regresin y graficarla en el diagrama de dispersin.

b) En cuanto se estima el egreso mensual de un profesor que tiene un ingreso de 920 soles mensuales.

CORRELACIN LNEAL

Es una parte de la Estadstica Descriptiva que tiene por objetivo investigar la relacin que hay entre dos o ms variables estadsticas, determinar el sentido de relacin y cuantificar el grado de nivel de correlacin entre las variables con respecto a sus coeficientes.

Coeficiente de correlacin

Es el valor numrico que da a conocer el grado de relacin que existe entre dos o ms variables. Se representa por la letra r.

EMBED Equation.2 Propiedades

EMBED Equation.2

a) Si r > 0 Correlacin Directa

b) Si r < 0 Se trata de una Correlacin Inverso Negativo.

c) Si r2 = 1 los datos forman una lnea recta.

d) Si r = +1 hay una correlacin perfecta (+)

e) Si r = -1 hay una correlacin perfecta (-)

f) Si r = 0 Los datos son incorrelacionados

Interpretacin Clsica ( Para valores positivos y negativos)

a) 0.00 < r < 0.20 es una correlacin no significativa.

b) 0.20

r < 0.40 es una correlacin baja.

c) 0.40

r < 0.70 es una significativa correlacin

d) 0.70

r < 1.00 alto grado de asociacin.

Ejemplo: Calcular el coeficiente de correlacin con los datos del ejemplo anterior para lo cual se requiere realizar los siguientes clculos que se tienen a continuacin.

XyxyX 2Y 2

205010004002500

307321909005329

306920709004761

4087348016007569

501085400250011664

601287680360016384

601358100360018225

601327920360017424

7014810360490021904

8017013600640028900

50011006180028400134660

Donde : n = 10 ;

Clculo del coeficiente de Correlacin.

Interpretacin: Existe un alto grado de asociacin entre los minutos de publicidad empleados en la radio y el nmero de artculos vendidos, por lo tanto estas dos variables se pueden relacionar mediante una funcin lineal y poder realizar pronsticos confiables, ya que los datos se ajustan muy bien a la recta estimada.

Coeficiente de Determinacin.( R2 ).- Mide la proporcin o porcentaje de variacin existente en Y que es explicada por la variacin de X, se expresa en trminos de porcentaje por 100*R2 y se define por:

Error de Estimacin (Se).- Es una medida de la cantidad media en que las observaciones reales Y varan en torno a la recta de regresin.(regresin de Y/X ) viene dada por :

Se = S Y/X =

ESTIMACION DE INTERVALOS EN EL ANALISIS DE REGRESION

Uno de los fines bsicos del anlisis de regresin es proyectar y predecir valores de la variable dependiente. Como hemos visto, una vez determinada la ecuacin de regresin, es sencillo hacer una estimacin puntual de la variable dependiente con slo sustituir el valor de X en la ecuacin y resolver sta para hallar . Pero adems, tambin se puede estar interesado en estimaciones de intervalo que en muchas oportunidades son muy importantes.

Hay como mnimo dos estimaciones de intervalo que se suele asociar con los procedimientos de regresin.

1.- Estimacin de Intervalo para el Valor Medio Y dado un valor de X. Se calcula de la siguiente manera:

I:C: para (y/x = tSy = t(1-(/2)Se ; t con ( n-2)g.l. Donde es el estimador puntual hallado a partir de la ecuacin de regresin original y el valor de t se basa en un nivel de confianza elegido con n-2 grados de libertad. Hay n-2 grados de libertad porque tenemos que calcular dos valores b0 y b1 a partir de los datos maestrales. Perderemos dos grados de libertad. Se es el error de estimacin.

2.- Intervalo predictivo para un valor nico de Y

I:C: para (y/x = tSy = t(1-(/2)Se ; t con ( n-2)g.l. REGRESIN MULTIPLE

En la regresin simple, se investiga la relacin entre las variables independiente y dependiente. A menudo, la relacin entre dos variables permite a una persona predecir con precisin la variable dependiente a partir del conocimiento de la variable independiente. Por desgracia, muchas de las situaciones de la vida real no son tan simples. Por lo regular, se necesita ms de una variable independiente para pronosticar con precisin la variable dependiente . Cuando se emplea ms de una variable independiente o de prediccin, el problema se convierte en uno para el anlisis de regresin mltiple. Los conceptos bsicos siguen siendo los mismos, slo se utiliza mas de una variable independiente para pronosticar la variable dependiente.

La Regresin mltiple comprende el uso de ms de una variable independiente para pronosticar una variable dependiente.

En el anlisis de regresin mltiple se utilizan X con subndices para representar a las variables independientes ( X2,, X3, X4, . . . Xn. La variable dependiente se continua representando con Y. Teniendo la siguiente ecuacin:

= bo + b2 X2 + b3 x3 + . . . + bn Xn Ecuacin de regresin mltiple

Ecuaciones normales cuando de tienen dos variables independientes y una variable dependiente.

= nb0 + b2+b3

= b0+b2 + b3

= b0+ b2 + b3

Ejemplo:

Jaimito observa el gasto en publicidad, precio y volumen de venta de galones de leche de 10 semanas elegidas en forma aleatoria. Los datos obtenidos se presentan en la siguiente tabla.

SemanaVentas( En Miles),

YPrecio por Galn

X2Publicidad( Cientos de Dlares) X3

1

2

3

4

5

6

7

8

9

1010

6

5

12

10

15

5

12

17

201.30

2.00

1.70

1.50

1.60

1.20

1.60

1.40

1.00

1.109

7

5

14

15

12

6

10

15

21

a) Calcular la ecuacin de Regresin

b) Calcular e interpretar el Coeficiente de Regresin, determinacin, y error estandar

Solucin

SemanaYX2X3X2YX3YX2X3Y2X

X

1

2

3

4

5

6

7

8

9

1010

6

5

12

10

15

5

12

17

201.30

2.00

1.70

1.50

1.60

1.20

1.60

1.40

1.00

1.109

7

5

14

15

12

6

10

15

2113

12

8.5

18

16

18

8

16.8

17

2290

42

25

168

150

180

30

120

255

42011.7

14.0

8.5

21.0

24.0

14.4

9.6

14.0

15.0

23.1100

36

25

144

100

225

25

144

289

4001.69

4.00

2.89

2.25

2.56

1.44

2.56

1.96

1.00

1.2181

49

25

196

225

144

36

100

225

441

Totales11214.40114149.31480155.3148821.561522

Medias11.21.4411.4

Reemplazando en las ecuaciones normales se obtiene los siguiente.

1) 112 = 10b0 + 14.4b2+ 114b32) 149.3 =14.4b0 +21.56b2+155.3b3

3) 1480 = 114b0 +115.3b2 + 1522b3Resolviendo las ecuaciones por cualquier mtodo, se obtiene los siguiente resultados: b2 = -8.2476 ;

b3 = 0.5851 ;

b0 = 16.4064

Sustituyendo en la ecuacin de regresin mltiple se tiene: = 16.41 8.25 X2 + 0.59 x3Esta ecuacin resulta til para pronosticar las ventas de la prxima semana. Si se planea un precio unitario de $ 1.50 y gastos de publicidad de $ 1000, el pronstico es de 9,930 galones; esto es.

= 16.41 8.25 X2 + 0.59 x3 = 16.41- 8.25(1.5)+ 0.59(10) = 9.93 ( miles de galones)Correlacin Mltiple. Es otra herramienta que se utiliza para evaluar un modelo. Para mayor comodidad, a menudo se da por su puesto el trmino mltiple en este contexto de la explicacin y se utiliza la denominacin abreviada de coeficiente de determinacin. Se calcula de la siguiente manera.

R2 = 1- = 1- 15.9/233.6= 1.0.068 =0.93 : Interpretacin: El 93.2% de la varianza del volumen de ventas, estn influenciados por el precio por galn de leche y los gastos de publicidad.

Error Estndar de Estimacin. Mide la cantidad estndar en que los valores reales (Y) difiere de los valores estimados (). Es una medida de la cantidad media en que varan las observaciones reales alrededor del plano de regresin y se calcula de la siguiente manera.

Sy..x2 x3 = = Sy..x2 x3 = = = 1.51

Interpretacin. La cantidad tpica en que el valor real de volumen de leche vendido difiere de lo pronosticado mediante la ecuacin de regresin mltiple es de 1.510 galones.CAPITULO V

Diseos Experimentales

INTRODUCCIN

Los experimentos son conducidos por los investigadores en todas las reas de estudio tanto para descubrir algo sobre un proceso particular como para comparar el efecto de varias condiciones sobre algn fenmeno. Por ejemplo, un analista de mercados podra estar interesado en saber si es que el tipo de envoltura es un factor importante como criterio de seleccin de los consumidores, o un pedagogo podra tener la intuicin de que los colegios con un nmero pequeo de alumnos por aula favorece la educacin de ellos. Lo intuitivamente razonable para dilucidar estas interrogantes puede ser tomar medias por tipo de envoltura o cantidad de alumnos por aula, para luego compararlas. Esto sin embargo nos conduce a muchas interrogantes adicionales, por citar: Qu nmero de consumidores o alumnos debern encuestar? Cuantos diseos o que cantidades de alumnos por aula se van a comparar?, cuantos y cuales factores se van a controlar?, qu tipo de muestreo debe ser utilizado para tomar las encuestas?, qu otros factores (aparte del tipo de envoltura o nmero de alumnos por aula) puede afectar tanto a la demanda del producto o el nivel educativo?, qu tipo de anlisis efectuar?. Qu diferencias de medidas sern consideradas importantes?, etc.

DISEO DE UN EXPERIMENTO

El diseo de un experimento es, la secuencia completa de pasos tomados de antemano para asegurar que los datos apropiados se obtendrn de modo que permitan un anlisis objetivo que conduzca a deducciones vlidas con respecto al problema establecido. Tal definicin de diseo de un experimento implica, por supuesto, que la persona que formule el diseo entienda claramente los objetivos de la investigacin propuesta.

NATURALEZA DEL DISEO EXPERIMENTAL.

En 1935, Sir Ronald A Fischer ech los cimientos de la materia que ha llegado a conocerse por el ttulo de su libro The Design of Experiments. Desde entonces la teora del diseo experimental ha sido considerablemente desarrollada y ampliada. Aplicaciones de esta teora se encuentran hoy en laboratorios y en la investigacin en ciencias naturales, ingeniera y casi todas las ramas de las ciencias sociales.

PROPOSITO DE UN DISEO EXPERIMENTAL

El propsito de un diseo experimental es proporcionar mtodos que permitan obtener la mayor cantidad de informacin vlida acerca de una investigacin, teniendo en cuenta el factor costo y el uso adecuado del material disponible mediante mtodos que permitan disminuir el error experimental.

ERROR EXPERIMENTAL

El error experimental viene a constituir la variabilidad motivada por las diferencias que se producen en los resultados de unidades experimentales tratadas en forma similar.

Las principales fuentes de error experimental son:

a. La variabilidad inherente al material experimental (unidades experimentales).

b. Falta de homogeneidad en la tcnica experimental.

c. Errores de experimentacin.

d. Errores de observacin y medicin.

e. Efectos combinados de todos los factores extraos que puedan influir sobre los resultados del experimento.

CONCEPTOS BASICOS DEL DISEOS DE EXPERIMENTOS.

TRATAMIENTO

Los tratamientos vienen a constituir los diferentes procedimientos, procesos, factores o materiales y cuyos efectos van a ser medidos y comparados.

El tratamiento establece un conjunto de condiciones experimentales que deben imponerse a una unidad experimental dentro de los fines del diseo seleccionado. Ejemplos:

Dosis del fertilizante, racin alimentaria, profundidad del sembrado, distanciamiento entre plantas, variedad de un cultivo.

TESTIGO

El testigo es el tratamiento de comparacin adicional, que no debe faltar en un experimento; por ejemplo, si se usan cinco tratamientos con fertilizante, el testigo puede ser aquel tratamiento que no incluye fertilizante. La eleccin del tratamiento testigo es de gran importancia en cualquier investigacin, este se constituye como referencial del experimento y sirve para la comparacin de los tratamientos en prueba.

UNIDAD EXPERIMENTAL

La unidad experimental, es el objeto o espacio al cual se aplica el tratamiento en donde se mide y analiza la variable que se investiga. En los experimentos pecuarios la unidad experimental por lo general esta conformada por un animal (cuy, cerdo, pato, etc.), en los experimentos forestales la unidad experimental en la mayora de los casos esta conformada por un rbol y en la mayor parte de las pruebas de campo agrcolas, la unidad experimental es una parcela de tierra en lugar de una planta individual; es en este ltimo caso que con frecuencia se presenta lo que se llama efecto de borde.FACTOR.- Es un conjunto de tratamientos de una misma clase o caracterstica.

Ejemplo. Tipos de Riego(Aspersin, Goteo, Riego comn), Dosis de fertilizacin (25%, 50%, 75% niveles de concentracin), variedades de cultivo, manejo de crianzas, etc.

ANALISIS DE LA VARIANZA

Es una tcnica estadstica que sirve para analizar la variacin total de los resultados experimentales de un diseo en particular, descomponindolo en fuentes de variacin independientes atribuibles a cada uno de los efectos en que se constituye el diseo experimental.

Est tcnica tiene como objetivo identificar la importancia de los diferentes factores tratamientos en estudio y determinar como interactan entre s.

DISEO Y ANALISIS DE EXPERIMENTOS CON UN SOLO FACTOR O VIA

I. DISEO COMPLETAMENTE ALEATORIZADO (D.C.A )

En este diseo, los tratamientos en estudio se distribuyen al azar en todas las unidades experimentales; siendo el nmero de repeticiones por tratamiento igual diferente. Este diseo se emplea cuando la variabilidad en todo el material experimental es relativamente pequeo y uniformemente distribuido.

Ventajas:

Fcil de planear y analizar; adems es flexible en el empleo del nmero de tratamientos y repeticiones. Finalmente, permite tener dentro del anlisis de varianza el mximo nmero de grados de libertad para la suma de cuadrados del error.

Desventaja:

La principal desventaja que presenta este diseo est relacionado a la homogeneidad del material experimental; el cual es difcil de encontrar en experimentos de campo, por lo que su uso se restringe con mucha frecuencia a experimentos de laboratorio, all donde se pueda tener control de los efectos no considerados en el estudio (ambiente, temperatura, luz, etc.)

Aleatorizacion.-En este diseo, la aleatorizacin de los tratamientos se realiza en forma irrestricta sobre las unidades experimentales, as pues si tenemos 3 tratamientos T1, T2, T3, una posible distribucin podra ser:

Modelo Estadstico

Modelo:Yij = (i + (i + eij Suma de = Myy + Tyy + Eyy

Cuadrados

Donde: Yij = Valor observado en la j-sima repeticin para el i-simo tratamiento.

( = Efecto de la media general.

(i = Efecto del i-simo tratamiento

eij = Efecto aleatorio del error experimental

t = Nmero de tratamientos.

n = r1 + r2 + + rt .Nmero total de repeticiones de los -simo tratamientos.

El efecto del -simo tratamiento esta dado por (i, siendo la expresin: (i = (i = (, donde (i es la media del -simo tratamiento y ( la media general.

CUADRO DE ANALISIS DE VARIANZA (ANVA) PARA IGUAL NUMERO DE OBSERVACIONES PARA CADA TRATAMIENTO

Fuente de VariacinGrados de libertad

(gl)Suma de Cuadrados

(S.C)Cuadrado Medio

( C.M)Razn

F

Entre Tratamiento

Error Experimentalt-1

n tTyy

EyyT=

E=

R==

R ( F

Totaln - 1

Ejemplo

En una determinada fbrica de galletas, se desea saber si las harinas de sus tres proveedores producen la misma viscosidad de masa. Para ello produce durante un da nueve masas, tres de cada tipo de harina, y se mide su viscosidad. Los resultados obtenidos son

Proveedor AProveedor BProveedor C

19

23

2117

18

2122

21

24

635667

Puede decirse que existen diferencias en las viscosidades obtenidas?

No satisfechos con el resultado, se repite el experimento quince das ms tarde, con los siguientes resultados.

Proveedor AProveedor BProveedor C

24

23

2522

20

2427

25

23

Considerando estos resultados, junto con los obtenidos anteriormente, cambia nuestra conclusin sobre la influencia del proveedor en la viscosidad obtenida?.

Solucin

Paso N 1.- Planteamiento de Hiptesis.

Hiptesis nula H0: (i = 0 (i = (1 = (2 .... (3 ; i =1,2..,3

Hiptesis alternativa H1 : No todos los (i son iguales.Paso N 2.- Nivel de significacin. ( = 0.05

Paso N 3.- Clculo de Ecuaciones Para el Anlisis de Varianza

1) Suma Total de Cuadrados

= Suma total de cuadrados

=: ( 19 )2 + (23 )2 + ... + (21)2 +(24)2 = 3886

2) Suma de Cuadrados debido a la Media ( Myy)

Myy = = = =

3) Suma de Cuadrados entre Tratamientos ( Tyy)

SCT = Tyy = - Myy = =

Tyy = 3864.66 - 3844 = 20,667

4) Suma de Cuadrados del Error Experimental ( Eyy )

S.C.E = Eyy = - Myy Tyy

= 3886 - 3844 - 20.667

Eyy = 21.33

CUADRO DE ANALISIS DE VARIANZA (ANVA)

Fuente de VariacinGrados de libertad

(gl)Suma de Cuadrados

(S.C)Cuadrado Medio

( C.M)Razn

F

Entre Tratamiento

Error Experimental2

620.667

21.3310.33

3.56 F= 2.90

Paso N 4.- Regin Crtica: Para ( = 5% t-1 = 3 1 = 2 y n t = 9 3 = 6 se tiene:

F( ( t-1 , n-t) = ( F0.05; 2 , 6 ) = 5.14

Luego la regin crtica de la prueba de tamao ( = 5% ser

C= ( Fcal: Fcal < 5.14 (Paso N 5.- Decisin: Como Fcal = 2.90 < Ftab = 5.14, entonces no se rechaza Ho, y Concluimos que no existen diferencias significativas en las viscosidades de la harina a un nivel del 5% de error.

Tarea

Para verificar si nuestra conclusin cambia sobre la influencia del proveedor en la viscosidad obtenida despus de los 15 das, se debe realizar la prueba con los nuevos datos.

Ejemplo

Un investigador desea indicar los efectos relativos de 4 tratamientos respecto a la vida activa de un tipo particular de bateras trmicas. Para el experimento se dispone de 20 bateras relativamente homogneas, las bateras se asignaron aleatoriamente a los 4 tratamientos; con la restriccin de que a cada tratamiento le corresponde 5 bateras.

Niveles o Tratamientos

IIIIIIIV

Observacin

73

73

73

75

7574

74

74

74

7568

69

69

69

7071

71

72

72

73

Total 369371345359

Solucin

Paso N 1.- Planteamiento de Hiptesis.

Hiptesis nula H0: (i = 0 (i = (1 = (2 .... (4 ; i =1,2..,4

Hiptesis alternativa H1 : No todos los (i son iguales.Paso N 2.- Nivel de significacin. ( = 0.05

Paso N 3.- Clculo de Ecuaciones Para el Anlisis de Varianza

1) Suma Total de Cuadrados

= Suma total de cuadrados

=: ( 73 )2 + (73 )2 + ... + (72)2 +(73)2 = 104352

2) Suma de Cuadrados debido a la Media ( Myy)

Myy = = = = = 104 256.8

3) Suma de Cuadrados entre Tratamientos ( Tyy)

SCT = Tyy = - Myy =

=- 104 256.8

=

Tyy = 104 341.6 - 104 256.8 = 84 .8

4) Suma de Cuadrados del Error Experimental ( Eyy )

S.C.E = Eyy = - Myy Tyy

= 104 352 - 104 256.8 - 84.8

Eyy = 10.4

CUADRO DE ANALISIS DE VARIANZA (ANVA)

Fuente de VariacinGrados de libertad

(gl)Suma de Cuadrados

(S.C)Cuadrado Medio

( C.M)Razn

F

Entre Tratamiento

Error Experimental3

1684.8

10.428.270.65 F= 43.49

Paso N 4.- Regin Crtica: Para ( = 5% t-1 = 4 1 = 3 y n t = 20 4 = 16 se tiene:

F( ( t-1 , n-t) = ( F0.05; 3 , 16 ) = 3.24

Luego la regin crtica de la prueba de tamao ( = 5% ser

C= ( Fcal: Fcal ( 3.24 (Paso N 5.- Decisin: Como Fcal = 43.49 ( Ftab = 3.24, entonces se rechaza Ho, y Concluimos con un nivel de 5% que existe diferencias significativa en la vida activa del tipo particular de bateras trmicas.

ESTIMACION DE PARAMETROS PARA DESIGUAL NMERO DE OBSERVACIONES

1) SUMA TOTAL DE CUADRADOS

= Suma total de Cuadrados

=: Suma de los cuadrados de todas las observaciones.

nt : N de observaciones.

2) Suma de Cuadrados debido a la Media ( Myy)

Myy = =

3) Suma de Cuadrados entre Tratamientos ( Tyy)

Tyy = - Myy =

4) Suma de Cuadrados del Error Experimental ( Eyy )

Eyy = - Myy Tyy

CUADRO DE ANALISIS DE VARIANZA (ANVA) PARA DESIGUAL NUMERO DE OBSERVACIONES

Fuente de VariacinGrados de libertad

(gl)Suma de Cuadrados

(S.C)Cuadrado Medio

( C.M)Razn

F

Entre Tratamiento

Error Experimentalt-1

Tyy

EyyT=

E=

R==

R ( F

Total

Ejemplo:

Se realiz un experimento para estudiar el efecto de la condicin de almacenamiento sobre el contenido de humedad en madera blanca de pino, se investigaron 5 mtodos de almacenamiento con varios nmeros de unidades experimentales, obtenindose los resultados que se presentan a condicin: a) Se puede afirmar que la variabilidad de las condiciones de almacenamiento es la misma para cada nivel?. Use (=0.01

b) La evidencia estadstica nos permite afirmar que almenos una de las condiciones de almacenamiento difiere de los dems. Use (=0.05

Tratamientos ( Condiciones de Humedad)

M1M2M3M4M5

Observacin

7.3

8.3

7.6

8.4

8.35.4

7.4

7.1

8.1

6.4

7.9

9.5

10.07.1

39.919.914.527.47.1

Solucin

1.- Planteamiento de Hiptesis

Hiptesis nula :H0 : ((i = 0 (i = (1 = (2.... (4 ;i = 1,2,...,4

Hiptesis alternativa : H1 : No todos los (i son iguales.2.- Nivel de significacin. ( = 0.05

3.- Criterio:

Rechace la hiptesis nula si FT ( 3.63, que es el valor de F0.95, para t -1 = 5 1= 4 y = 9: ( F0.95; 4 , 9 )=3.63 grados de libertad, donde F debe determinarse por medio de un anlisis de varianza; si no, acptala.4 CLCULO Y ESTIMACIN DE LOS PARMETROS.

1) Suma Total de Cuadrados

= Suma total de cuadrados

=: ( 7.3 )2 + (8.3 )2 + ... +(7.1)2 = 863.36

2) Suma de Cuadrados debido a la Media ( Myy)

Myy = = = = = 845.53

2) Suma de Cuadrados entre Tratamientos ( Tyy)

SCT= Tyy = - Myy = + + ... + - 845.53

=

Tyy = 856.1936 - 845.53 = 10.66

4) Suma de Cuadrados del Error Experimental ( Eyy )

S.C.E = Eyy = - Myy Tyy

= 863.36 - 845.53 - 10.66 = 7.17

Eyy = 7.17

CUADRO DE ANALISIS DE VARIANZA (ANVA)

Fuente de VariacinGrados de libertad

(gl)Suma de Cuadrados

(S.C)Cuadrado Medio

( C.M)Razn F

Entre Tratamiento

Error Experimental4

910.66

7.172.670.80F= 2.67/0.80

F= 3.34

Total20863.36

5.- Decisin: Como Fc= 3.34 ( Ft =3.63, el valor de F 0.95 para 4 y 9 grados de libertad, la hiptesis nula no se rechazarse: en otras palabras los efectos medios de los tratamientos en lo que se refiere a humedad no son significativos ( o sea que los tratamientos o efectos medios de los tratamientos son iguales). (no vara un tratamiento uno de otro) ( no hay significancia estadstica).

II. DISEO EN BLOQUES COMPLETAMENTE ALEATORIZADO (D.B.C.A)

Es aqul en el que:

1.- Las unidades experimentales se distribuyen en grupos o bloques, de manera tal que las unidades experimentales dentro de un bloque sean relativamente homogneas y que el nmero de unidades experimentales dentro de un bloque sea igual al nmero de tratamientos por investigar, y

2.- Los tratamientos se asignan al azar a las unidades experimentales dentro de cada bloque. En lo anterior, la formacin de los bloques refleja el criterio del investigador respecto a las respuestas diferenciales potenciales de las diversas unidades experimentales, mientras que el procedimiento de aleatorizacin acta como una justificacin de la suposicin de independencia.

Modelo Estadstico

Modelo: Yij = (i + Bi + (j + eij

Suma de = Myy + Byy + Tyy + Eyy

Cuadrados

Donde: Yij = Valor observado en la i-sima repeticin para el i-simo tratamiento.

= Efecto de la media general.

Bi = Efecto del i-simo bloque.

(j = Efecto del j-simo tratamiento

eij = Efecto aleatorio del error experimental

t = Nmero de tratamientos.

r = Nmero de repeticiones del -simo tratamiento.

El efecto del -esimo bloque esta dado por Bi , siendo la expresin:

Bi = (i. = (, donde (i es la media del i-esimo bloque y ( la media general.

El efecto del j-esimo tratamiento esta dado por (j , siendo la expresin: (j = (j = (, donde (j es la media del j-esimo tratamiento y ( la media general.

CUADRO DE ANALISIS DE VARIANZA (ANVA) PARA UN (DBCA)

Fuente de VariacinGrados de libertad (gl)Suma de Cuadrados (S.C)Cuadrado Medio

( C.M)Razn

F

Entre Tratamiento

(Columnas)

Entre

Bloques

(filas)

Error Experimentalt-1

b-1

(t-1) (b-1)Tyy

Byy

EyyT=

B =

E =

R1==

R2=

R( F

Totaltb-1

Tratamiento

BloqueDetergADeterg BDeterg

CDeterg

DTotal

Ti.Promedio

i.

Motor 14547484218245.5

Motor 24346503717644

Motor 35152554920751.75

Total T. j139145153128565

Promedio . j46.3348.335142.67

Ejemplo: Se diseo un experimento para estudiar el desempeo de cuatro detergentes diferentes para limpiar inyectores de combustible. Las siguientes lecturas de limpieza se obtuvieron con un equipo especialmente diseado para 12 tanques de gas distribuidos en tres diferentes modelos de motores: Considerando a los detergentes como tratamiento y los motores como bloques, obtenga la tabla apropiada de anlisis de varianza y pruebe en el nivel de significancia de 0.01 si hay diferencias en los detergentes en los motores

Solucin

Paso N1.- Planteamiento de Hiptesis.

a) Tratamientos

: (j = 0 = (Todos los tratamientos tienen el mismo efecto sobre la variable en estudio) .

j = 1,2, ..., t

: (j = 0

: (j ( 0 ( No todos los tratamientos tienen el mismo efecto sobre la variable en estudio)

b) Bloques.

: Bi = 0 = ( Todos los Bloques tienen el mismo efecto sobre la variable en estudio) . j = 1,2, ..., t

: (i = 0

: Bj ( 0 ( No todos los Bloques tienen el mismo efecto sobre la variable en estudio)

Paso N2.- Nivel de significancia: (= 0.01

PASO N 3 Construccin de la Tabla del ANVA.

Calculo de ecuaciones para el Anlisis de Varianza.

1) Suma Total de Cuadrados

= Suma total de cuadrados

== (45)2 + (47)2 + ... + (49)2 = 26867

2) Suma de Cuadrados debido a la Media ( Myy)

S.C.M=Myy = = = = =

Myy = 26602.083

3) Suma de Cuadrados entre Bloques ( Byy)

S.C.B. = Byy = - Myy =

=-26602.083 = - 26602.083 =

Byy = 135.167.

4) Suma de Cuadrados entre Tratamientos ( Tyy)S.C.T=Tyy = -Myy =-26602.08

= 267136 26602.083 = 110.917

5) Suma de Cuadrados del Error Experimental ( Eyy )

Eyy = - Myy - Byy Tyy

= 26867 26602.083 -135.167-110.917 = 18.833

Eyy = 18.833

CUADRO DE ANALISIS DE VARIANZA (ANVA) PARA UN (DBCA)

Fuente de VariacinGrados de libertad

(gl)Suma de Cuadrados

(S.C)Cuadrado Medio

( C.M)Razn

F

Entre Tratamiento

(Columnas)

Entre

Bloques

(filas)

Error Experimental3

2

6110.917

135.167

18.83336.97267.584

3.139RT=11.778RB= 21.530R( F

Total12271391.917

PASO N 4 : Regin Crtica. Para (= 1%,

i) Para los Tratamientos : t-1=3 ; (t-1)(b-1)= 6

En la tabla F se encuentra.

F tab = F 1% (3, 6) = 9.78

C T = ( : ( Ftab = 9.78(

Se rechaza en los tratamientos

ii) Para los Bloques: b-1 =2 ; (t-1)(b-1)= 6

F tab = F 1% (2, 6) = 10.9

Entonces la regin crtica de la prueba ( de tamao ser.C B = ( : ( Ftab =10.92(

Se rechaza en los Bloques.

PASO N 5: Conclusin:

i) Si ( Ftab = F( ( t 1, ( t-1)( b 1))(, se rechaza y se concluye con un riesgo de (=0.01 de que existe diferencia entre las medias de tratamientos y consecuentemente existe influencia del tipo de detergente en el desempeo de la limpieza de inyectores. ii) Si ( Ftab = F( ( b 1, ( t-1)( b 1))(, se rechaza y se concluye con un riesgo de (=0.01 de que existe diferencia entre las medias de bloques y consecuentemente hay influencia o diferencia significativa en el en el tipo de motor al cual se esta haciendo la limpieza

III. DISEO DE EXPERIMENTOS CON DOS FACTORES O DOS VIAS

En el anlisis de varianza con dos criterios de clasificacin o Factores los datos de la muestra son clasificados por medio de un arreglo rectangular en el cual las columnas representan los niveles de un factor A y las filas los niveles del factor B. Cada combinacin de fila y de columna define una celda en el arreglo. Entonces se tiene Kr celdas.

El anlisis de varianza de dos factores se clasifica segn el nmero de observaciones en las celdas. Si cada celda contiene una sola observacin de la muestra, el modelo se denomina sin replicas ( o sin repeticin ). En cambio, si cada celda contiene dos o ms observaciones de la muestra, el modelo se denomina con replicas ( o con repeticin).

El modelo de clasificacin de dos factores y sin replica es similar al modelo de clasificacin de un solo factor aleatorizado en bloques. En este caso los niveles de uno de los factores son los bloques.

En el modelo de clasificacin de dos factores, las dos variables son independientes, es decir no hay interaccin entre los dos factores. Slo hay interaccin si se toman las observaciones mltiples en las diversas combinaciones de los dos factores.

En el modelo de clasificacin de dos factores con replicas los tratamientos no son independientes. En este caso si hay interaccin de los factores.

a) ANALISIS DE VARIANZA DE DOS FACTORES SIN REPETICION.

Este modelo es exactamente igual que el modelo de clasificacin de una variable en bloques completamente aleatorizados, excepto la interpretacin de los datos.

En el modelo de clasificacin de una variable en bloques completamente aleatorizados solo investigamos los efectos de los tratamientos la variable independiente Aj; los bloques fueron considerados meramente como material experimental. En cambio en el modelo de clasificacin en el modelo de clasificacin de dos variables sin repeticin, los tratamientos y bloques son variables aleatorias independientes y son evaluados simultneamente. En consecuencia mientras que Aj son tratamientos en el modelo de clasificacin de una variables bloques completamente aleatorizados, los tratamientos en el modelo de clasificacin de dos variables son realmente combinaciones de tratamientos, Bi Aj.

b) ANALISIS DE VARIANZA DE DOS FACTORES CON REPETICION.

El anlisis de varianza con dos factores o criterios de clasificacin, con replica o repeticin, conocido tambin como diseo completamente aleatorizado de dos factores, se basa en un arreglo rectangular de las observaciones, en el que las c columnas representan los niveles o tratamientos del factor A y las r filas los niveles o tratamientos del factor B. Cada combinacin de tratamiento define una celda en la tabla. Se tiene entonces rc celdas. Cada celda contiene n(n ( 2) observaciones( replicas). Los rcn datos se muestran en la siguiente tabla 3.1 PASOS PARA EL CONTRASTE DE HIPOSTESIS EN UN MODELO DE DOS FACTORES CON REPETICION

PASO N1 Planteamiento de Hiptesis.

Las tres hiptesis que usualmente se prueban son las siguientes:

I) Planteamiento de Hiptesis para los tratamientos

: Todas las medias de tratamientos ( columnas) son iguales ((1 = (2 = = (k = 0 )

: No todas las medias de los tratamientos son iguales (almenos uno de los efectos (j no es igual a cero)De manera anloga, para determinar si las medias poblacionales de los bloques.

II) Planteamiento de Hiptesis para los bloques

: Todas los medias de bloques (filas) son iguales

( (1 = (2 = = (L = 0).

: No todos las medias de los bloques son iguales (al menos uno de los efectos (i no es igual a cero).

Y con respecto a las interaccin:

III) Planteamiento de Hiptesis para la Interaccin

: No existe interaccin entre los tratamientos y bloques.

( (11 = (12 = = (LK = 0 ).

: Existe interaccin entre los tratamientos y bloques (al menos uno de los efectos (Ij no es igual a cero).

Estas pruebas se basarn en una comparacin de los estimadores independientes de la varianza poblacional comn (2 . Estos estimadores se obtendrn separando la suma total de los cuadrados de los datos en cuatro componentes .

Paso N 2 :Nivel de significancia : ( ( 0( (( 1)

PASO N 3 Construccin de la Tabla del ANVA.

Calculo de ecuaciones para el Anlisis de Varianza.De lo anterior, la suma total de cuadrados de los datos se descomponen en cuatro componentes, por medio de la siguiente identidad.

SCT = SCTR +SCRL +SCI + SCE

Donde SCI = Suma de cuadrados debido a la interaccin.

Las formulas practicas para calcular estas sumas de cuadrados son:

a) Variacin Total.

SCT= , donde

b) Variacin entre tratamientos

SCF =

c) Variacin entre Bloques.

SCC = - C

d) Variacin Residual

SCE =

e) Variacin debido a la interaccin.

En la prctica, su valor ser obtenida por:

SCI = SCT SCC SCF SCE

CUADRO DE ANALISIS DE VARIANZA (ANVA) PARA DESIGUAL NUMERO DE OBSERVACIONES

Fuente de VariacinGrados de libertad

(gl)Suma de Cuadrados

(S.C)Cuadrado Medio

( C.M)Razn

F

Entre Tratamiento

(Columnas)

Entre

Bloques

(filas)

Debido a la interaccin

Error ResidualC-1

f-1

(c-1)(f-1)

cf(r-1)SCC

SCF

SCI

SCECMC=

CMF=

CMI=

CME=

FT==

FB=

FI =

Totaln-1SCT

PASO N 4 : Regin Crtica:

i) La regin crtica de la prueba de tamao ( para contrastar los efectos de las columnas ( factor A), es dado por:

C T = ( : ( Ftab = F( ( c 1, cf( r 1)(i) La regin crtica de la prueba de tamao ( para contrastar los efectos de las filas ( factor B), es dado por

C B = ( : ( Ftab = F( ( c 1, cf( r 1)(ii) La regin crtica de la prueba de tamao ( para contrastar los efectos de interaccin, es dado por.

C i = ( : ( Ftab = F( ( c 1, cf( r 1))(PASO N 5: Conclusin:

i) Si ( Ftab = F( ( c 1, cf( r 1))(, se rechaza y se concluye de que hay diferencia entre las medias de tratamientos (columnas ) y consecuentemente hay influencia del factor A sobre la variable analizada; en caso contrario no se rechaza y se concluye con un riesgo de ( de que el factor A no causa efecto en la variable dependiente o respuesta.

ii) Si ( F( ( f 1, cf(r 1))(, se rechaza y se concluye de que hay diferencia entre las medias de bloques ( filas) y consecuentemente hay influencia del factor B sobre la variable respuesta; en caso contrario no se rechaza . y se concluye con un riesgo ( de que el factor B no causa efecto en la variable dependiente o respuesta.

iii) Si ( F( (( c 1), (f-1), cf(r 1))(, se rechaza y se concluye de que hay interaccin entre las filas y columnas; en caso contrario no se rechaza y se concluye con un riesgo ( de que la interaccin no es significativa.

Ejercicio. Se comparan cuatro mtodos de dieta para determinar su eficacia en trminos del peso perdido en kilos. Con este fin se disea un modelo de anlisis de varianza de dos factores considerando el mtodo de dieta como el factor A con 4 niveles (A :Mtodo i, i =- 1. 2, 3, 4) y el peso inicial como el factor B con tres niveles (Bi = moderadamente pesado B2:=pesado. B3=muy pesado). Se eligen al azar a dos personas de B, para A1. dos para A2. etc Despus de un mes la prdida de peso en kilogramos de las 24 personas que se someten a las dietas se registran en la tabla siguiente. Utilice un nivel de significacin de 0.05.

Peso

InicialTipos de DietaTotal

A1A2A3A4T.j.

B18

76

57

75

6

Total Ai1511141151

B24

35

43

44

4

Total Ai797831

B37

66

75

67

6

Total Ai1313111350

Total Ti..35333232T= 132

Solucin

SCT =- C =( (8)2 + (4)2 + +(3)2 ( 726 = 772 -726 =46SCC = - C = ((35)2 + (32)2 + (32)2( - 726 =1

SCF = - C = ((51)2 + (31)2 + (50)2( - 726 = 31.75

SCE = - = 772 - ((15)2 + (11)++(13)2( = 5

SCI = SCT (SCC+SCF+SCE) = 46 ( 1 + 31.75 + 5) = 8.25

ANALISIS DE VARIANZA (ANVA )

Fuentes de VariacinGrados de LibertadSuma de Cuadrados Cuadrado Medio Razn F calculada

Dieta (A)

Peso Inicial (B)

Interaccin AXB

Error de Muestreo3

2

6

121.00

31.75

8.25

50.333

15.875

1.375

0.417FC=0.799

FF=38.10

FI =3.30

Total2346

5.- Decisin: Dado que:FC = = 0.799 < 3.49, se acepta H

FF = > 3.89 , se rechaza H

FI = > 3.00, se rechaza H

Ejercicio.

Para producir cierto bien una firma dispone de 4 mquinas de marcas distintas(Ai) que produce con igual velocidad y de tres fuentes distintas de materia prima (Bj )de igual calidad. No se sabe si el nmero de unidades defectuosas producidas es la misma para las mquinas y para las materias primas. Se hace operar cada de mquina con cada tipo de material durante 2 horas y se registra el siguiente nmero de unidades defectuosas por hora.

Utilice un nivel de significacin de 0.05 para verificar:

a) Si hay diferencias significativas entre las mquinas Ai

b) ) Si hay diferencias significativas entre las materas primas Bj

c) Si hay efecto de interaccin AxB

Materias

PrimasMquinas

A1A2A3A4

B16

54

35

53

4

B22

13

21

22

2

B35

43

43

44

3

UNIVERSIDAD NACIONAL PEDRO RUIZ GALLO

ESCUELA PROFESIONAL DE INGENIERIA QUIMICA E INDUSTRIAS ALIMENTARIAS

PRACTICA DE LABORATORIO

MSc. ALFONSO TESEN ARROYO

INTRODUCCION

Hoy en da, los mtodos cuantitativos, han dado un gran desarrollo con la ayuda de las tecnologas de la informacin y los software estadsticos que se encuentran en el mercado tales como Minitab, SAS, Spss entre otros, es por eso que incluso la clases de Mtodos cuantitativos se desarrollan en laboratorio de computacin haciendo uso de Software que es el SPSS V20.

OBJETIVOS:

Brindar habilidades y tcnicas de recoleccin, procesamiento, presentacin, anlisis e interpretacin de informacin de estadstica unidimensional.

Presentar procedimientos necesarios sencillos para calcular e interpretar las medidas de tendencia central y dispersin de variables unidimensionales y bidimensionales como regresin, correlacin y otros mtodos estadsticos que se utilizan en la Investigacin y sobre todo la utilizacin de una base de datos, haciendo uso del SPSS.

El SPSS.

Es un software estadstico y de gestin de datos, se maneja mediante instrucciones que se agrupan en mdulos. Contiene programas capaces de realizar desde un simple anlisis descriptivo hasta diferentes tipos de anlisis multivariante de datos.

Ejecucin del SPSS.

Para ejecutar el SPSS, se busca la ruta donde se encuentra el programa y se hace doble Click con el cono correspondiente al programa SPSS como se muestra a continuacin.

Al hacer doble click en el cono del programa se muestra la siguiente pantalla

Y posteriormente se muestra la pantalla con su respectiva ventana Editor de Datos y la Ventana de Resultados que se muestran a continuacin. Cada ventana es independiente por lo tanto, si se quiere grabar, se le tiene que dar un npmre que puede ser el mismo o diferente segn criterio del responsable del procesamiento de datos.

VENTANA DE EDITOR DE DATOS

VENTANA PARA LA DEFINICION DE VARIABLES

VENTANA DE INGRESO DE DATOS

SESIN BSICA.

Generar archivos de datos. SPSS. PRACTICA N01.SAV.

A continuacin se muestra una data hipottica con la que se va a realizar la prctica.

n de casosidsexolugar de procedenciaestado civiledadpesoaltura

1exped091114572168

2exped101212878171

3exped111323568174

4exped121226064166

5exped132112671164

6exped142113063156

7exped152122853158

8exped162323357155

Despus seguir los siguientes pasos:

Definir variables: (Ventana de definicin de variables en el SPSS), considerando las variables: id, sexo, estado civil, edad, peso, altura con sus respectivas codificaciones.

Sexo: ( 1= Masculino; 2 =Femenino)

Lugar de procedencia: ( 1= Chiclayo; 2= Ferreafe; 3= Lambayeque)

Estado Civil: (1=Soltero; 2 = Casado; 3 = viudo).

Como se puede observar en la siguiente pantalla, la definicin de las variables se hacen en forma de lneas lo que esta en columnas en la tabla de datos hipotticos. Adems hay que considerar el tipo de variable, n de decimales , etiqueta etc.

Una vez definida las variables ingresamos a la ventana de ingreso de datos que se muestran en la tabla anterior.

Como se observa en la pantalla anterior solo se muestran nmeros en las variables como sexo, lugar de procedencia etc, por lo que falta codificar las variables, tal como se muestra en la siguiente tabla.

Grabar el archivo dndole un nombre adecuado segn caractersticas o investigacin que se esta realizando, buscando una carpeta donde crea Ud. Conveniente guardarlos ya que el SPSS por defecto lo guarda en su archivo de programa.

Estando lista la base de datos, se procede a encontrar los diferentes estadsticos necesarios.

PASOS A SEGUIR PARA EL ANALISIS.

Una vez ingresado los datos al SPSS, se procede a realizar los anlisis estadsticos.

Ejemplo N1

Analizar/Estadsticos Descriptivos/Frecuencias

Si se pasan las variables a la ventana de dialogo y si se desea encontrar estadsticas y grficos

Ejemplo N02

(Analizar/ Estadsticos Descriptivos /Explorar/. Cuadro de dilogo: dependient List: Peso, Lista de Factores: sexo, Mostrar Statistic: En el cuadro dialogo: Descriptivos. Continuar / Mostrar Plots : Boxplot : factor levels; Descriptive : Stem and leat / Continuar / OK

Hacer Click en Descriptivos de igual manera en Plots

Ejemplo N 3

Cambiar en el ejemplo anterior, en lista de factores Estado Civil por Sexo

Ejercicio N01: Realizar un anlisis estadstico con los siguientes datos

Ejercicio N 02

Supongamos que se tiene la siguiente encuesta:

ENCUESTA SOBRE COMPRAS EN EL SUPERMERCADO.

Se quiere realizar un anlisis del comportamiento de los consumidores que realizaron sus compras semanales en un supermercado, realizndose la siguiente encuesta.

Marque con una X la alternativa correcta o escriba en las lneas punteadas.

1) Edad: a) Adolescente ( ) b) Joven ( ) c) Adulto ( ) 2) Sexo: a) Masculino ( ) b) Femenino ( )

3) Grado de Instruccion: a) Primaria ( ) b) Secundaria ( ) c) Superior ( ) d) No tiene ( )

4) Estado Civil : a) Soltero ( ) b) Casado ( ) c) Divorciado ( ) d) Viudo ( )

5) Horario de Compra: a) Maana ( ) b) Tarde ( ) c) Noche ( )

6) Compras Semanales en Artculos de Aseo Personal ( Nuevos Soles ) :

7) Compras Semanales en verduras ( Nuevos Soles ):

8) Compra de abarrotes ( Nuevos Soles ) ..

9) Compras Semanales en Bebidas ( Nuevos Soles ):CODIFICACIN DE LA ENCUESTA:

X1: Edad: (0: Adolescente; 1: Joven; 2: Adulto)

X2: Sexo (0:Femenino; 1: Masculino )

X3: Grado de Instruccin (1: No tiene; 2:Primaria; 3: Secundaria; 4: Superior)

X4: Estado Civil (1: Soltero; 2: Casado; 3: Divorciado; 4: Viudo)

X5: Turno (0:Maana; 1:Tarde; 2: Noche)

X6: Compra artculos de Aseo Personal ( Nuevos Soles)

X7: Compras de verduras ( Nuevos Soles )

X8: Compra de Abarrotes ( Nuevos Soles)

X9: Compra de Bebidas ( Nuevos Soles )

Resuelva lo siguiente:

Elabore e interprete una tabla de frecuencias de la variable edad, sexo y grado de instruccin y horarios de compra.

Cul es el promedio en verduras, aseo personal compra de abarrotes y bebidas.

Cul es gasto en bebidas segn edad

Cul es el gasto en abarrotes segn horario

Cual es el gasto en verduras segn sexo

Llenado de la Base de datos (SPSS)

Como paso ltimo se realizar el llenado de la base de datos representado por la muestra de 30 personas que realizaron sus compras en un supermercado. Los datos se pueden llenar directamente del cuestionario (Encuesta). Las columnas nos indican las variables que tenemos y las filas los casos o encuestados.

EncuestadoX1X2X3X4X5X6X7X8X9

1003202,017,034,56

2204123,020,040,06

3202320,310,031,66

4102413,39,035,46

5203421,323,030,06

6204420,413,032,96

7102201,512,033,26

8003204,519,033,16

9214322,518,035,66

10112210,324,033,06

11214121,07,034,56

12203226,010,033,26

13204425,65,031,56

14214426,014,036,21

15101111,215,036,81

16201220,212,035,42

17201326,014,033,22

18202225,56,035,92

19204426,59,036,53

20201420,213,038,23

21203122,36,034,53

22202220,27,036,23

23101112,310,036,83

24202421,513,030,13

25203425,07,036,03

26202224,518,035,43

27003200,324,031,53

28202325,57,036,24

29202220,510,033,94

30202220,24,034,94

Nombre Apellido:PRACTICA N3 DE LABORATORIOBASE DE DATOS

La base de datos que se evaluar con fines prcticos (BASE01.exe), es la siguiente:

X1: Tamao familiar (Numero de integrantes de su familia)

X2: Edad

X3: Sexo

X4: Profesin

X5: Estado civil

X6: Lugar de procedencia

X7: Tenencia de seguro

X8: Tipo de enfermedad

X9: Ingreso mensual

X10: Actividad

Con la siguiente base de datos realizar lo siguiente:

a. Indicar el comportamiento del tamao familiar de la muestra en estudio.

b. Determinar el comportamiento de la muestra son segn estado civil. Sealar sus respectivos porcentajes.

c. Determinar el comportamiento de la muestra segn tenencia de seguro.

d. Determinar la edad promedio.

e. Determinar el ingreso mensual.

f. Realizar un cuadro de doble entrada segn sexo y estado civil. Interprete algunos resultados.

g. Realizar un cuadro de doble entrada segn profesin y tenencia de seguros. Interprete algunos resultados.

N ENC.TAMAO FAMILIAREDADSEXOPROFESIONESTADO CIVILPROCEDENCIASEGUROENFERMEDADINGRESO MENSUALACTIVIDAD

1428FEMENINOEDUCACION INICIALSOLTEROTRUJILLONONINGUNA350CUIDA NIOS

2419MASCULINOINFORMATICASOLTEROTRUJILLONONINGUNA400VIGILANCIA

3142MASCULINOESTILISTASOLTEROTRUJILLONONINGUNA460ESTILISTA

4747MASCULINOESTILISTASOLTEROHUARALNONINGUNA460ESTILISTA

5473MASCULINOCATEDRTICOCASADOAREQUIPASININGUNA4000INVERSIONISTA

6318MASCULINOING. SISTEMASSOLTEROPIURASININGUNA1200COMERCIANTE

7426FEMENINOCONTADORACASADOTRUJILLONONINGUNA450NINGUNO

8521MASCULINOESTUDIANTESOLTEROTRUJILLONONINGUNA420NINGUNO

9925MASCULINOCOMERCIANTESOLTEROTRUJILLONONINGUNA420COMERCIANTE

10335MASCULINOCOMERCIANTECASADOTRUJILLONONINGUNA500NEGOCIO

11421MASCULINOESTUDIANTESOLTEROTALARASININGUNA600COMERCIANTE

12545FEMENINOCOMERCIANTECASADOHUANUCONONINGUNA500NEGOCIO

13629MASCULINOD. TECNICOSOLTEROTRUJILLONONINGUNA1200ACADEMIA

14320MASCULINOESTUDIANTESOLTEROTRUJILLOSININGUNA800ESTUDIANTE

15421MASCULINOESTUDIANTESOLTEROTRUJILLONONINGUNA460DOCENTE

16120MASCULINOESTUDIANTESOLTEROCAJAMARCANONINGUNA300ESTUDIANTE

17632MASCULINOCOMERCIANTECASADOTRUJILLONONINGUNA500COMERCIANTE

18330MASCULINOCOMERCIANTECASADOTRUJILLONONINGUNA500COMERCIANTE

19423FEMENINOVENDEDORASOLTEROTRUJILLONONINGUNA400VENDEDORA

20545FEMENINOCOMERCIANTECASADOCAJAMARCANONINGUNA600COMERCIANTE

21633MASCULINOECONOMISTASOLTEROTRUJILLOSININGUNA700ECONOMISTA

22632MASCULINOCOMERCIANTESOLTEROCHICLAYONONINGUNA500COMERCIANTE

23737MASCULINOING. QUIMICOCASADOTRUJILLOSININGUNA1200ING. QUIMICO

24580MASCULINOPROFESORCASADOCAJAMARCASIBRONQUITIS800COMERCIANTE

25640FEMENINOAMA DE CASACASADOTRUJILLOSIALERGIAS2000NINGUNO

26332MASCULINOCOMERCIANTESOLTEROVIRUNONINGUNA600COMERCIANTE

27281MASCULINOAGENTE VIAJEROCASADOSAN PEDRO SIESTEOPOR500NINGUNO

28450MASCULINOTOPOGRAFOCASADOTRUJILLONOBRONQUITIS1000NINGUNO

29421MASCULINODOCENTESOLTEROTRUJILLONONINGUNA460DOCENTE

30675MASCULINOCHEFFVIUDOOTUZCOSININGUNA700COMERCIANTE

31640FEMENINOAMA DE CASASOLTEROTRUJILLOSININGUNA415NINGUNO

32531FEMENINOINGENIERACASADOCHICLAYONONINGUNA1300INGENIERO

33452MASCULINOING. CIVILCASADOTRUJILLONOLA GOTA1000COMERCIANTE

34431MASCULINOADMINISTRADORSOLTEROTRUJILLOSININGUNA1500ADMINISTRADOR

35346MASCULINOCONTADORCASADOCARTAVIOSININGUNA2500CONTADOR

361281FEMENINOAMA DE CASACASADOTRUJILLONOPRESION700AMA DE CASA

37480MASCULINODOCENTEVIUDOAMAZONASSIARTROSIS900CESANTE

38532MASCULINOTECNICOSOLTEROTRUJILLOSININGUNA1200TECNICO

39768FEMENINODOCENTESOLTEROANCASHSININGUNA800CESANTE

40436FEMENINOSECRETARIACASADOTRUJILLOSININGUNA1500DOCENTE

41463MASCULINOARQUITECTOCASADOPIURASININGUNA7200ARQUITECTURA

42341FEMENINOCONTADORACASADOGUADALUPESININGUNA4000CONTADOR

43362MASCULINOABOGADODIVORCIADOLAMBAYEQUESININGUNA5800ABOGACIA

44349FEMENINOOBSTETRIZCASADOLAMBAYEQUESININGUNA3000OBSTETRIZ

45346MASCULINOABOGADOCASADOSAN PEDROSININGUNA7000ABOGACIA

46346MASCULINODOCTORCASADOTRUJILLOSININGUNA6500ODONTOLOGO

47256MASCULINOCONTADORCASADOCHICLAYOSININGUNA5600CONTADOR

48439FEMENINOENFERMERASOLTEROTRUJILLOSININGUNA3200ENFERMERIA

49342FEMENINOPROFESORASOLTEROLIMASININGUNA4300DOCENTE

50421MASCULINOESTUDIANTESOLTEROTRUJILLONONINGUNA460DOCENTE

NOMBRE Y APELLIDOS:

PRACTICA N4 DE LABORATORIA

MEDIDAS DE TENDENCIA Y VARIABILIDAD

1. EVALUACIN DE UN CASO: (Ejercicio obtenido de material de trabajo de ESAN) Wells y Asociados es una de las firmas consultoras financieras ms importantes de los Estados Unidos. Ofrece asesora financiera y servicios a firmas particulares y a gobiernos estatales y locales. Lori Mulier, acababa de ser encargada del departamento de personal de esta empresa. En los tres aos pasados, se han agregado otros ayudantes y hace seis semanas, se sum al departamento un estadstico recin graduado.

Lori Muller empez hace poco a revisar las prcticas de contratacin del departamento. Empez la revisin examinando el campo ms crtico, las personas en adiestramiento financiero. La firma contrata entre 60 y 130 de estas personas al ao, segn sea el crecimiento de la firma, el movimiento de empleados y el nmero de perspectivas notables" que encuentre. Prcticamente todos los que estn en adiestramiento financiero se contratan entre los estudiantes del ltimo ao de escuelas superiores con especializacin financiera.

Lori Muller seleccion al azar 100 de los 197 candidatos que haban sido contratados hace dos aos y an seguan trabajando. Cada ficha contena la informacin siguiente (los datos van en el apndice adjunto):

1. Genero. (0=Femenino y 1=Masculino)

2.Edad al contratarse

3.Promedio ponderado de sus notas universitarias (escala de 0 a 20).

4.Calidad de la universidad de procedencia. (1=Excelente, 2=Muy buena, 3=Buena y 4=Regular)

5.Nota de la prueba de aptitudes. La prueba produce una puntuacin de 0 (muy improbable que tenga xito en el trabajo) a 100 (muy probable que tenga xito en el trabajo).

6.Evaluacin del rendimiento al final del segundo ao. Esta evaluacin produce una puntuacin numrica desde 0 (muy malo) hasta 100 (excelente). Muller y Koehler estn seguros de que la escala es de intervalo y tambin han decidido, con base en los tres aos de experiencia con dicha escala, que una puntuacin inferior a 50 es insatisfactoria, 50-69 es satisfactoria, 70-89 por sobre el promedio, y por encima de 89 es excelente.

Lori Muller llama al estadstico a su oficina y le dice: "Estoy encantada de tener un estadstico que nos ayude. No estamos an listos a desarrollar un modelo estadstico acabado de lo que constituye una buena contratacin, pero es tiempo de empezar a evaluar algunas de las variables de que tenemos informacin. El gran nmero de personas que contratamos, el alto costo de adiestrarlas y el hecho de que no podemos evaluar realmente los rendimientos, hasta fines del segundo ao, significan que cualquier mejora en nuestra eficacia de contratacin tendr por resultado ahorros sustanciales para la firma. Para comenzar a tratar el tema, Podras dar respuesta a las siguientes preguntas?

1. Necesitamos un resumen de la edad del personal al contratarse, del promedio de calificaciones de grado y de la evaluacin del rendimiento en el segundo ao, para tener una apreciacin general del grupo en adiestramiento financiero. Cul es el perfil de este personal?

2. Es ms alto el puntaje de varones en la nota de la prueba de aptitudes que el de mujeres? Y en la evaluacin del rendimiento?

3. Un criterio inicial en Wells era mantener la calificacin promedio de grado de los contratados por encima de 14.00. Se sigue manteniendo este criterio?

4. Otro criterio era mantener por lo menos un tercio de los contratados que provengan de escuelas de categora 2. Se sigue manteniendo este criterio?

5. Son diferentes los rendimientos en la prueba de entrada para las diferentes calidades de escuelas de donde provienen los candidatos? Y en la Evaluacin del rendimiento del segundo ao?Si Ud. fuera el estadstico que conclusiones le dara a Lori respecto al anlisis que realiz.

Tener como referencia la base de datos que a continuacin se presenta.No.GeneroEdadCalificacinCalidad Universitariandice xitoRendimiento 2

112215.4136272

212615.7116071

312212.4528066

412315.6928691

512516.0518648

612616.2136495

702714.4225482

812312.8738092

912313.0826273

1012616.3037781

1112415.8246167

1202414.8536795

1303613.3149596

1412716.6746259

1502616.3525079

1612412.5016288

1712612.3218152

1812314.7227671

1912413.9428775

2012416.9227375

2102513.1438593

2212314.9235784

2312313.8128990

2402615.5337083

2512515.3336573

2602512.9528997

2712412.2448788

2812314.9448981

2912212.5739474

3003012.9237167

3112415.9416380

3212513.8046764

3312314.4239682

3412414.7227382

3512612.6039281

3602314.5338877

3712614.7648289

3802613.1238495

3912613.3548658

4002314.7627274

4112215.2748289

4212617.0027768

4312416.5726677

4412614.0237367

4512513.0818599

4612413.9335896

4712514.1725897

4802414.6537992

4912213.9215095

5012513.2839367

5112512.9627552

5202313.9728282

5312513.9235783

5412414.9236787

5512416.3326073

5602314.2545667

5712315.2919472

5812615.2339266

5912615.7338195

6002312.9417382

6112415.9619184

6212416.9627298

6312712.2338593

6412215.3529687

6502316.7728557

6612416.1228985

6702514.3439281

6812414.6936695

6912214.6728590

7012315.5625480

7112212.3528548

7212413.3936571

7302616.9917663

7402815.2946387

7502615.9328997

7612513.4138397

7712515.5525779

7812513.9719671

7902312.8147272

8012412.9927389

8112515.6725394

8212312.4738678

8312412.7736489

8402414.6718084

8502513.9437791

8612414.9015269

8712315.4427089

8802316.0349091

8912912.1547489

9002213.4229594

9102612.0248495

9202213.0436878

9303014.3549284

9412513.6525285

9512312.6628269

9612613.2235671

9712313.4338558

9812215.5448593

9912616.5136497

10012316.9136183

Nombre y Apellidos:

PRACTICA N5 DE LABORATORIA

Realice una anlisis estadsticos de los siguientes datos.

Cuadro N 1: caractersticas del Whisky

PrecioProporcinCategoraVejezApreciacin

702015.03

602015.02

652017.52

7425112.02

7025112.03

733015.00

703018.00

553015.02

773015.50

9330112.00

8230112.02

733326.51

623328.03

8733212.03

7835210.02

734028.54

874028.52

804029.52

854028.52

874029.54

804029.52

8340212.51

9040212.02

1104025.53

8740212.02

11345212.04

9645212.03

824528.53

127100312.04

160100312.03

90100312.04

86100312.02

100100310.03

100100311.03

95100312.00

MODULO II

METODOS ESTADISTICOS APLICADOS A LA INGENIERIA QUIMICA

EMBED Excel.Sheet.8

EMBED Excel.Sheet.8

12

11

10

9

8

7

6

5

4

3

2

1

320 370 420 470 520 570 620 670

fi

12

11

10

9

8

7

6

5

4

3

2

1

320 370 420 470 520 570 620 670

fi

Polgono

60

55

50

45

40

35

30

25

20

15

10

5

320 370 420 470 520 570 620 670

fi

Dlares

60

55

50

45

40

35

30

25

20

15

10

5

320 370 420 470 520 570 620 670

fi

Dlares

Ojiva Mayor

Ojiva Menor

( (yififi*yi320 - 37034541380370 - 42039583160420 - 470445114895470 - 520495125940520 - 570545105450570 - 62059595355620 - 67064563870Total6030050

( (yifiJ=1320 - 3703454J=2370 - 4203958J=3420 - 470445 11fj-1J=4470 - 52049512 fjJ=5520 - 570545 10 fj+1J=6570 - 6205959J=7620 - 6706456Total60

(Mo

(

mediana

( (yifiFiJ=1320 - 37034544J=2370 - 420395812J=3420 - 4704451123 Fj-1J=4470 - 52049512 fj35 FjJ=5520 - 5705451045 Fj+1J=6570 - 620595954J=7620 - 670645660Total60

(Me

EMBED Equation.3

EMBED Equation.3

Estimado

EMBED Equation.3

EMBED Equation.3

2.5%

EMBED Equation.3

EMBED Equation.3

EMBED Equation.3

EMBED Equation.3

EMBED Equation.3

0.99

0.95

-1.96

1.96

-2.33

=1%

0.99

-1.83

Zona de aceptacin

Z=

0.95

0.99

Y

Y

X

X

Y

Y

X

X

Y

EMBED Equation.3 = b0 + b1x i

b1

Unidad de X

b0

X

EMBED Excel.Sheet.8

METODOS ESTADISTICOS APLICADOS EN LA INGENIERA QUMICA

Definicin de variables

Ingreso de datos

LEYENDA

Precio: Precio de 1 litro de whisky en francos.

Proporcin: Proporcin de malta en %.

Categora: Categora del producto.

1=lujo

2=estndar

3= pura malta

Vejez: Vejez del producto en aos.

Apreciacin: Apreciacin de un jurado degustadores.

0= mala

1 = mediocre

2 = mediana

3 = buena

4 = muy buena

PAGE 94

_1060946162.unknown

_1145759172.unknown

_1159387656.unknown

_1181800522.unknown

_1182281846.unknown

_1182284087.unknown

_1193197137.unknown

_1182288423.unknown

_1182282698.unknown

_1182283722.unknown

_1181800827.unknown

_1182246347.unknown