Cuaderno Digital - Gustavo Castro

105
2015 UNIVERSIDAD DE GUAYAQUIL Realizado por: Mateo Espinoza Alarcon Catedrático: Ing. Lorenzo Cevallos Curso: N3A Carrera: Ing. Networking & telecomunicaciones Trabajo de Probabilidad y Estadística Guayaquil-Ecuador

description

Estadistica

Transcript of Cuaderno Digital - Gustavo Castro

Page 1: Cuaderno Digital - Gustavo Castro

2015

UNIVERSIDAD DE GUAYAQUIL

Realizado por:

Mateo Espinoza Alarcon

Catedrático:

Ing. Lorenzo Cevallos

Curso:

N3A

Carrera:

Ing. Networking &

telecomunicaciones

Trabajo de Probabilidad y Estadística

Guayaquil-Ecuador

Page 2: Cuaderno Digital - Gustavo Castro

1

Unidad 1: Estadística descriptiva

1.1 Introducción a la estadística

1.2 Tipos de datos y escalas de producción

1.3 Diferencia entre población, muestra, parámetro y estimador

1.4 Medidas de tendencia central y dispersión (datos no agrupados)

1.5 Datos agrupados y tablas de frecuencia

1.6 Medidas de tendencia central y dispersión (datos agrupados)

1.7 Medidas de forma y posicionamiento

1.8 Gráficas estadísticas (histograma, ojiva, pastel, diagrama de cajas)

1.9 Tipos de muestreo y elaboración de cuestionarios

1.10 Recopilación, tabulación, procesamiento de datos y elaboración de

informes

Unidad 2: Introducción a la probabilidad

2.1 Probabilidad clásica, empírica y subjetiva

2.2 Experimento, evento, espacio muestral y punto muestral

2.3 Eventos exhaustivos, independientes y mutuamente excluyentes

2.4 Reglas de probabilidad (complementaria, aditiva, multiplicativa,

condicional)

2.5 Técnicas de conteo y probabilidad

2.6 Teorema de probabilidad total y teorema de Bayes

2.7 Variables aleatorias discretas, análisis univariado

2.8 Función de probabilidad, distribución acumulada, esperanza

matemática, varianza y función generadora de momentos de una

variable aleatoria discreta

2.9 Variables aleatorias discretas (Análisis bivariado)

2.10 Función de probabilidad conjunta, valor esperado conjunto o

esperanza matemática conjunta covarianza, correlación

2.11 Distribución discretas de probabilidades: Distribución uniforme,

distribución hipergeométrica, distribución de Poisson

2.12 Variables aleatorias continuas, análisis univariado

2.13 Función de densidad, función acumulada, esperanza matemática,

varianza de una variable aleatoria continua

2.14 Variables aleatorias continuas, análisis bivariado

2.15 Función de densidad, valor esperado conjunto o esperanza

matemática conjunta, covarianza, correlación

Page 3: Cuaderno Digital - Gustavo Castro

2

2.16 Distribución uniforme, distribución normal, distribución gamma,

distribución exponencial, distribución beta

Unidad 3: Distribución muéstrales

3.1 Teorema limite central

3.2 Aproximación de la distribución normal a la binomial

3.3 Distribución t de student y Ji – cuadrado

3.4 Estimación puntual para la media y proporciones

3.5 Intervalos de confianza para la media, varianza y proporciones

Unidad 4: Estadística inferencial

4.1 Pruebas de hipótesis

4.2 Potencia de prueba y curva OC

4.3 Error tipo I y error tipo II

4.4 Prueba de hipótesis para media, varianza y proporciones

4.5 Modelo de regresión lineal simple

4.6 Modelo de regresión lineal múltiple

4.7 Tabla de ANOVA de regresión

Page 4: Cuaderno Digital - Gustavo Castro

3

¿Para qué sirve la estadística?

- Analizar

- Pronosticar Información

- Medir

Información

Encuesta

Base de datos

Variable cualitativa

Análisis

Variable cuantitativa

Análisis

Base de datos

Variables cuantitativas

Estadísticas

Media

Moda

Varianza

Datos estadisticos

Gráficos estadisticos

Page 5: Cuaderno Digital - Gustavo Castro

4

La Estadística

Es una parte de las matemáticas que nos ayuda a observar hechos, fenómenos leyes,

siempre y cuando estén dentro de la lógica para eso es necesario realizar

experimentos con las muestras u objetos a investigar. La estadística es de gran

ayuda en la actualidad ya que con ella podemos determinar qué porcentaje de un

suceso o experimento es factible o no.

Mendehall, W – Beaver, R – Beaver, B (2006): “La estadística es una rama de las

matemáticas que tiene aplicaciones en cada toda faceta de nuestra vida. Es un

lenguaje nuevo y poco conocido para casi todas las personas, pero, al igual que

cualquier idioma nuevo, la estadística puede parecer agobiante a primera vista.”

David Ruiz Muñoz. (2002 y 2004) “La Estadística es la ciencia cuyo objetivo es

reunir una a información cuantitativa concerniente a individuos, grupos, series de

hechos, etc. y deducir de ello gracias al análisis de estos datos unos significados

precisos o unas previsiones para el futuro además se trata de la recopilación,

organización presentación, análisis e interpretación de datos numéricos con el fin

de realizar una toma de decisión más efectiva".

Murria R. Spiegel, (1991) "La estadística estudia los métodos científicos para

recoger, organizar, resumir y analizar datos, así como para sacar conclusiones

válidas y tomar decisiones razonables basadas en tal análisis.”

Estadística Inferencial

Al obtener y formular inferencias (predicciones) acerca de una población, esta se la

hace en base a la información obtenida en una muestra.

Calmaestra, L. (2005). “Estadística inferencial realiza el estudio descriptivo sobre

un subconjunto de la población llamado muestra y, posteriormente, extiende los

resultados obtenidos a toda la población”

Barreto. A, (2012) “Estadística inferencial se define como aquellos métodos que

implican hacer estimación de una característica de la población o de toma de

decisiones respecto a una población con base solo en resultados obtenidos de una

muestra”.

Humberto Llinás Solano, Carlos Rojas Álvarez. (2005), "La estadística

inferencial abarca aquellos métodos y conjuntos de técnicas que se utilizan para

Page 6: Cuaderno Digital - Gustavo Castro

5

obtener conclusiones sobre las leyes de comportamiento de una población

basándose en los datos de muestras tomadas de esa población".

Estadística Descriptiva

Es cuando la información se la obtiene utilizando todos los datos de la población.

Córdova Enrique S. (2006): “La estadística descriptiva está formada por

procedimientos empleados para resumir y describir las características importantes

de un conjunto de ediciones.”

Castro, G (1998): “La estadística descriptiva es la encargada de estudiar a toda una

población mediante censos.”

Humberto Llinás Solano (2003), "La estadística descriptiva se compone de

aquellos métodos que incluyen técnicas para recolectar, presentar, analizar e

interpretar datos"

Media poblacional

Media muestral

Muestra

Variable Aleatoria (Al Azar)

𝑋𝑖 → Datos tomados al azar

𝑋(𝑖) →Datos ordenados

Población

Page 7: Cuaderno Digital - Gustavo Castro

6

Datos Tomados Al Azar # Edad Talla Sexo

X1 22 162 M

X2 22 149 F

X3 23 162 M

X4 21 164 M

X5 19 163 F

X6 20 180 M

X7 19 169 M

X8 22 160 F

X9 27 168 M

X10 22 169 M

X11 18 185 M

X12 19 163 M

X13 20 157 F

X14 19 152 F

X15 23 150 F

X16 19 164 F

X17 19 164 M

X18 19 168 M

X19 20 175 M

X20 19 149 F

X21 20 152 F

X22 22 154 F

X23 19 164 M

X24 19 150 F

X25 22 169 M

X26 20 169 M

X27 18 162 F

X28 19 166 M

X29 20 170 M

X30 20 146 F

X31 19 156 F

X32 19 175 M

X33 20 159 F

X34 20 160 M

X35 19 155 F

X36 20 154 F

X37 20 163 F

X38 20 155 F

X39 19 168 M

X40 20 165 M

Variables cuantitativas

Estadísticas

Centralización

Dispersión

Posición

Forma

Page 8: Cuaderno Digital - Gustavo Castro

1

Datos ordenados

# Edad Talla Sexo

X(1) 18 162 F

X(2) 18 185 M

X(3) 19 149 F

X(4) 19 150 F

X(5) 19 152 F

X(6) 19 155 F

X(7) 19 156 F

X(8) 19 163 F

X(9) 19 163 M

X(10) 19 164 F

X(11) 19 164 M

X(12) 19 164 M

X(13) 19 166 M

X(14) 19 168 M

X(15) 19 168 M

X(16) 19 169 M

X(17) 19 175 M

X(18) 20 146 F

X(19) 20 152 F

X(20) 20 154 F

X(21) 20 155 F

X(22) 20 157 F

X(23) 20 159 F

X(24) 20 160 M

X(25) 20 163 F

X(26) 20 165 M

X(27) 20 169 M

X(28) 20 170 M

X(29) 20 175 M

X(30) 20 180 M

X(31) 21 164 M

X(32) 22 149 F

X(33) 22 154 F

X(34) 22 160 F

X(35) 22 162 M

X(36) 22 169 M

X(37) 22 169 M

X(38) 23 150 F

X(39) 23 162 M

X(40) 27 168 M

Page 9: Cuaderno Digital - Gustavo Castro

2

Población Objetiva

Es un conjunto bien definidos de elementos que son sujetos a alguna medición.

Mendehall, W – Beaver, R – Beaver, B (2006): Una población es el conjunto de

mediciones de interés para el investigador.

Ordoñez. M, (2014) “La población objetiva se refiere a todo el grupo de personas u

objetos que les interesan a los investigadores para la generalización de las

conclusiones. La población objetiva por lo general tiene diversas características y

también es conocida como la población teórica”.

Gutiérrez González (2005), " Se llama población al conjunto de todos los

elementos de un tipo particular cuyo conocimiento es de interés".

Unidades de Investigación

Es un elemento o elementos de la población objetiva a las que se les efectúa alguna

medición.

La unidad de investigación más fácil es la edad.

𝑀𝑒𝑑𝑖𝑎 =∑ 𝑋𝑖

𝑛

Claudio Navarro (2006) “Una unidad experimental es el individuo u objeto en el

que se mide una variable. Resulta una sola medición o datos cuando una variable se

mide en realidad en una unidad experimental.”

Quintana. C, (1996) “La unidad estadística es la unidad de interés en los estudios

estadístico y es el objeto de nuestra observación de la cual se deriva la información

básica para el análisis”.

Olga Vladimirovna Panteleeva. (2005), " Se llama muestra a cualquier

subconjunto de la población".

Muestra

Es un subconjunto de n unidades de investigación tomados de la población objetiva.

Argibay. J, (2009) “Nos referimos a varios temas, uno tiene que ver con las técnicas

de muestreo empleados, y de manera estas no se asegura la calidad de la muestra”.

Page 10: Cuaderno Digital - Gustavo Castro

3

Ángel Serrano (2006): “Una muestra es un subconjunto de mediciones

seleccionado de la población de interés.”

Gloria Zavala (2015): “Una muestra es una X cantidad de personas que se toman

de nuestra población objetiva para investigar.”

Observación

Son cada uno de los valores incluidos en la muestra. (Datos recomendados)

Quevedo, F (2010): Llamaremos unidad de observación a la unidad física que nos

interesa estudiar u observar con fines de investigación.

Ronald Escalada (1995): Son todos los valores que serán sometidos a estudios

para nuestra investigación.

Santiago Fernández (2002). " La observación es la primera fase estadística, el cual

cumple con los procedimientos del funcionamiento establecidos, debido a la

responsabilidad que implica el hecho de que estos datos son la base de todos los

estudios posteriores".

Parámetros y Estimadores

Parámetro

Es una cantidad de números calculada a partir de los elementos de la población.

Rafael Rodríguez (2004): “Las mediciones descriptivas numéricas asociadas con

una población de mediciones se llaman parámetros; las calculadas a partir de

mediciones muéstrales reciben el nombre de estadísticas.”

Argote. C, (2009) “Un buen habito de realizar el ejercicio de comparación de dos

medidas es conocer claramente las características de la muestra como el tipo de

diseño utilizado para la obtención de datos”.

Antonio Vargas Sabadías. (1995), "Se llama parámetro al valor correspondiente

a una estadística inferencial en la población".

Estimador o estadístico

Es una cantidad de números calculada a partir de los elementos de una muestra.

La altura media de los alumnos de probabilidad y estadística del paralelo N3A.

Page 11: Cuaderno Digital - Gustavo Castro

4

Esto implica que son una muestra representativa de la población.

Si un estadístico se usa para aproximar un parámetro a este se le denomina como

estimador.

Jaime, (2011); "Un estimador es un valor que puede calcularse a partir de los datos

muéstrales y que proporciona información sobre el valor del parámetro que en el

cual se obtienen a partir de las observaciones de la variable y sus probabilidades

que determinan perfectamente la distribución de esta, así como las características

de la población".

Arnau. J, (1996) “A continuación, utilizando el sobreindice MCG para simbolizar,

mínimos cuadrados generalizados vamos a desarrollar de una forma muy breve las

propiedades que se deben reunir los estadísticos MCG es el mejor estimador lineal

insesgado del verdadero vector de parámetros”.

Antonio Elizalde (2001): Se denominan estadísticas cuando se calculan a partir de

mediciones muéstrales.

Variables

Cuantitativas

ContinuasHistogramas

DiscretasGráfico de barras

∑ Xi

Cualitativas

Ordinales Escala Likert

Nominales Grafico de barras

Page 12: Cuaderno Digital - Gustavo Castro

5

Variables cualitativas

Si sus valores (modalidades) no se pueden asociar naturalmente a un número, no se

pueden hacer operaciones algebraicas con ellas y se clasifican en:

Rosario Delgado de la Torre. (2004),"La Variable Cualitativa es una variable que

corresponde a una característica (o carácter) cualitativa y toma dos o más valores

(categorías); pero estos valores están predeterminados y son una asignación

numérica a las modalidades de la variable, que no son medibles en sí mismas".

Marcos Sandoval (2006): “Las variables cualitativas miden una cualidad o

característica en cada unidad experimental.”

Jaime Flores (1991): Las variables cualitativas son las que almacenan información

no numérica, generalmente son cualidades, características u opiniones.

Nominales

Son aquellas en las que sus valores no se pueden ordenar.

Ej: La religión, el grupo sanguíneo y la nacionalidad.

Jiménez, F. (2006) “Son variables expresadas en unidades monetarias corrientes

en función de soles corrientes o a precios de mercado actuales. Por ejemplo, si un

cuaderno cuesta cinco soles en 1995, el valor nominal o corriente de diez cuadernos

será de 50 soles”.

Quevedo, F (2010): “Asumen nombres, por ejemplo, la variable “estado civil”

asumirá los valores: “casado”, “soltero”, “viudo”, “divorciado”. Nótese que los valores

asumidos son nombres o palabras que bien podrían estar dispuestos en distinto

orden.”

Arturo Cabezas (2005): Son las variables que almacenan información sin orden

específico.

Ordinales

Es cuando sus valores se pueden ordenar.

Ej: El grado de satisfacción, la mejoría de un tratamiento.

Page 13: Cuaderno Digital - Gustavo Castro

6

Pablo Jiménez (2010): Asumen nombres o palabras con un cierto orden implícito.

Por ejemplo, la variable “grado de intensidad de un síntoma” asumirá los valores:

“alto”, “mediano”, “bajo”. Los valores asumidos por esta variable guardan entre sí

una relación de orden.

Mayra Ortega (1998): Son las variables que almacenan información que llevan un

orden específico.

Guaragna, B. Fridman, A. (2011) “Permiten determinar un orden jerárquico

entre las unidades perteneciente a las diferentes categorías. Podemos mencionar

variables ordinales tales como nivel de educación, clase social, cargo de empresa”.

Variables Cuantitativas o Numéricas

Este tipo de variables son aquellas en las que sus valores son numéricos, es decir

tiene sentido hacer operaciones algebraicas con letras:

Camacho. J, (2008) “En la investigación clínica frecuentemente se miden

numerosas variables en los individuos incluidos en el estudio. Muchas veces interesa

determinar si existe relación entre algunas de esas variables”.

Francisco Orellana (2006): “Las variables cuantitativas miden una cantidad

numérica en cada unidad experimental.”

Flora Gutierrez (2010): “Las variables cuantitativas son las que almacenan valores

numéricos, ya sean enteros o decimales.”

Discretas

Si toman valores puntuales.

Ej: El número de hijo, número de máquinas con problemas.

Fausto Sanchez (2010): Asumen valores numéricos enteros que generalmente

son resultado de recuentos.

Rey, C. Ramil, M. (2007) “las discretas son aquellas que puede tomar un numero

finito (o infinito numerable) de valores”.

Katherine Salazar (2009): Este tipo de variable cuantitativa se manejan valores

específicos y concretos.

Page 14: Cuaderno Digital - Gustavo Castro

7

Continuas

Si entre 2 valores son posibles infinitos valores intermedios.

Ej: Edad, tiempo de vida de un equipo electrónico.

Quevedo, F (2010): “Pueden asumir cualquier valor numérico, que generalmente

es resultado de una medición. Dada la naturaleza de su escala de valor, siempre es

posible encontrar, entre dos valores, un tercero.”

Arturo Hernández (1994): “Este tipo de variable cuantitativa se manejan valores

que pueden ser enteros o decimales, y se los almacena mediante intervalos que van

de X a Y.”

Sarria, A. Guardia, J. Freixa, l. (1999) “Si las variables, por lo menos

teóricamente, pueden tomar los infinitos valores posibles en un intervalo fijado,

recibe el nombre de “variables continuas”.

Tabla de frecuencia (Análisis de variables cuantitativas)

Análisis univariado

Para variables cuantitativas discretas se requiere conocer los siguientes términos:

Clase, marca de clase (continuas), frecuencia absoluta, frecuencia relativa,

frecuencia acumulada, frecuencia relativa acumulada.

Jaime Rivadeneira (2006): Resultan datos univariado cuando se mide una sola

variable en una sola unidad experimental.

Jorge, O (2009) “Las tablas de frecuencia o histograma están formados por un

conjunto de rectángulo que representa la frecuencia de cada categoría, siendo estos

las frecuencias de valores observados”.

Sergio Castro (1997): “Se da este tipo de análisis cuando se realiza un estudio

exhaustivo de las variables individualmente.”

Clase

Son intervalos de igual longitud que son exhaustivos y mutuamente excluyentes.

Rodríguez. L (2007). “son los valores agrupados en intervalos con la misma

amplitud”.

Page 15: Cuaderno Digital - Gustavo Castro

8

José María Cordero, Santiago Fernández, Alejandro Córdova. (2002), " Una

clase es cada uno de los diferentes grupos que se forman al reunir los valores

correlativos o próximos de la variable o las modalidades parecidas o similares del

atributo".

Pedro Sánchez Méndez (1997): “Son los valores que o intervalos que se

encuentran en una muestra.”

Marca clase

Es el punto medio de cada una de las clases (V. Cuantitativas continuas).

Rodríguez, L (2007): “Es el valor central del intervalo de la clase i.”

Arellano Ulloa Víctor M. , Verónica Quijada Monroy. (2006), " Una marca de

clase es el punto medio de cada intervalo de clase".

Fernández, S. Cordero, J. Córdoba, J. (2002) “Para poder operar

matemáticamente con estas distribuciones es preciso considerar un valor concreto

de la variable en cada clase que sea representativo, este valor se conoce como marca

de clase. Normalmente se tomó el valor que se calcula hallando la media aritmética

de los límites del intervalo.”

Frecuencia absoluta

Número de observaciones que se pueden clasificar en cada clase.

Leopoldo Salavarria (2015): Es la cantidad de veces que se repite un intervalo o

valor.

Gutiérrez González, Eduardo y Olga Vladimirovna Panteleeva. (2005), " La

construcción de los intervalos de clase de emplea para estudiar de una forma

simplificada la distribución de datos, por lo tanto, después de construir los

intervalos de clase se procede a contar la cantidad de datos que caen en cada una de

ella, a dicha cantidad se le llama frecuencia de clase o frecuencia de clase o

frecuencia absoluta y se simboliza por ni, en donde i representa el número de la

clase".

CBES. (2008) “Es el número de veces que se repite ese dato, también se presenta

la frecuencia absoluta de un intervalo que se refiere al número de datos que

pertenecen a ese intervalo.”

Page 16: Cuaderno Digital - Gustavo Castro

9

Frecuencia relativa

Se la obtiene dividiendo la frecuencia absoluta de clase i para el total de

observaciones.

Moreno. H, Hilario. N, (2013) “La frecuencia relativa se presenta en porcentaje y

se conforma con los datos de la frecuencia absoluta. Su símbolo es Fr.”

DR. Anahí Alvarado(2015): “Es la cantidad porcentual de cada uno de los

intervalos.”

Elsevier Inc. (2007), " La frecuencia relativa es una frecuencia de un valor dividida

entre el número total de datos del conjunto de éstos".

Frecuencia acumulada

Resulta de sumar la frecuencia acumulada de la clase i-1 con la frecuencia de la clase

i.

A. R, (2008) “Es la suma de las frecuencias absolutas de todos los datos anteriores,

incluyendo también la del dato mismo del cual se desea su frecuencia acumulada.”

Pablo Noriega (2012): “Es la cantidad de cada una de los datos que

progresivamente aumenta hasta completar el total de la muestra.”

Eduardo Gutiérrez González (2005), " Se llama frecuencia acumulada a la función

que representa la suma de la frecuencia por clase, y se simboliza por F".

Frecuencia relativa acumulada

Se lo obtiene dividiendo la frecuencia acumulada de la clase i para el total de

observaciones.

Alejandro Córdova. (2002), "La frecuencia relativa acumulada de un dato es igual

a la suma de las frecuencias relativas de todos los datos menores o iguales que dicho

valor"

Jorge Alarcon (2010): “Es la cantidad porcentual que aumenta progresivamente

hasta completar el total de la muestra.”

Vargas, A (1995) “Llamamos frecuencia absoluta acumulada en el valor x, a la suma

de las frecuencias absolutas de los valores menores o iguales a x; y la

representaremos por N”.

Page 17: Cuaderno Digital - Gustavo Castro

10

Para las variables cualitativas se necesita:

1. Tabla de frecuencia

2. Gráfico de barras

3. Explicación

Edad Frecuencia absoluta

Frecuencia relativa

Frecuencia acumulada

Frecuencia relativa

acumulada

18 2 0,05 2 0,05

19 15 0,375 17 0,425 20 13 0,325 30 0,75

21 1 0,025 31 0,775 22 6 0,15 37 0,925

23 2 0,05 39 0,975 27 1 0,025 40 1

Sexo Frecuencia absoluta Frecuencia relativa

M (1) 21 21/40 = 53% F (2) 19 19/40 = 47%

“De una muestra tomada al azar de 40 alumnos del paralelo N3A de la carrera de

ingeniería en Networking, el 53% de los encuestados pertenece al sexo

masculino y el 47% al sexo femenino.”

0,44

0,46

0,48

0,5

0,52

0,54

M F

Gráfica de tabla de frecuencia de sexo de una muestra tomada al

azar

Page 18: Cuaderno Digital - Gustavo Castro

11

Para variables cuantitativas continuas

Tiempo de meses de vida de un electrodoméstico

Tiempo de vida

Marca de clase

Frecuencia absoluta

Frecuencia relativa

Frecuencia acumulada

Frecuencia relativa

acumulada

[0-6] (0+6)/2=3 2 0,04 2 0,04

[6-12] (6+12)/2=9 6 0,12 8 0,16

[12-18] (12+18)/2=15 8 0,16 16 0,32

[18-24] (18+24)/2=21 16 0,32 32 0,64

[24-30] (24+30)/2=27 10 0,20 42 0,84

[30-36] (30+36)/2=33 7 0,14 49 0,98

[36-42] (36+42)/2=39 1 0,02 50 1

Histograma de frecuencias relativas

Histograma de frecuencia relativa

Es un gráfico bidimensional en cuyo eje de las x se encuentran las clases y en el eje

de las y las frecuencias relativas.

Sheldon M. Ross. (2007), " Histograma en el que se muestran gráficamente las

frecuencias relativas de cada dato del conjunto".

Mario Benavides (2002): “Un histograma de frecuencia relativa, para un conjunto

de datos cuantitativo es una gráfica de barras en la que la altura de la barra muestra

“con qué frecuencia” (medida como proporción o frecuencia relativa) las mediciones

caen en una clase o subintervalo particular. Las clases o subintervalos se grafican a

lo largo del eje horizontal.”

0,04

0,12

0,16

0,32

0,20

0,14

0,02

0,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0-6 06-12 12-18 18-24 24-30 30-36 36-42

Histograma de tiempo de meses de vida de un electrodoméstico

Page 19: Cuaderno Digital - Gustavo Castro

12

Andrés Sarmiento (1996): “Un histograma de frecuencia relativa es la manera de

representar la incidencia de cierto dato en una variable, se asigna las frecuencias

relativas a la distribución vertical y los intervalos a la distribución horizontal.”

Polígono de frecuencia relativa (Solo variables cuantitativas).- Es un gráfico

bidimensional en cuyo eje de las x se encuentra la marca de clase y y frecuencia

relativa.

Rodríguez, L (2007): “Es una manera de representar el perfil de la distribución de

los datos. Se obtiene uniendo mediante segmentos de recta los puntos (marca de

clase, frecuencia), para cerrar el polígono se puede agregar un punto a cada lado con

frecuencia 0.”

Elsevier Inc. (2007)," El polígono de frecuencia es el gráfico de los valores distintos

y sus frecuencias, en el que se conectan los puntos del gráfico mediante rectas".

Richard I. Levin, David S. Rubin (2004) “Los polígonos de frecuencias son otra

forma de representar gráficamente distribuciones tanto de frecuencias como de

frecuencias relativas”.

Ojiva

Es un gráfico que presenta en el eje horizontal la característica cuantitativa que se

está investigando y en el eje vertical la frecuencia relativa acumulada.

Llinás, H. Cabrera, J. Flórez, K. (2012) “La ojiva, llamada también polígono de

frecuencias acumuladas (o polígono de frecuencias relativas acumuladas), se

0,04

0,12

0,16

0,32

0,20

0,14

0,020,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

3 9 15 21 27 33 39

Polígono de frecuencia relativa

Page 20: Cuaderno Digital - Gustavo Castro

13

construye a partir de tablas de frecuencias (acumuladas o relativas acumuladas).

Las ojivas ofrecen un medio grafico para interpolar o aproximar el número o

porcentaje de observaciones menores o iguales que un valor específico”.

Rodríguez, L (2007): “Este gráfico se usa para representar la frecuencia

acumulada, absoluta o relativa. Se lo obtiene uniendo segmentos de recta que se

extienden entre los extremos de las clases y usando los valores de la frecuencia

acumulada.”

Vladimiro Panteleeva. (2005), " Los polígonos de frecuencia que se elaboran con

las frecuencias acumuladas o las frecuencias relativas acumuladas se llaman ojivas".

Edad Frecuencia absoluta

Frecuencia relativa

Frecuencia acumulada

Frecuencia relativa

acumulada

18 2 0,05 2 0,05

19 15 0,375 17 0,425 20 13 0,325 30 0,75

21 1 0,025 31 0,775 22 6 0,15 37 0,925

23 2 0,05 39 0,975 27 1 0,025 40 1

40 1

0,04

0,16

0,32

0,64

0,84

0,98 1

0

0,2

0,4

0,6

0,8

1

1,2

0-6 06-12 12-18 18-24 24-30 30-36 36-42

Ojiva

Page 21: Cuaderno Digital - Gustavo Castro

14

Talla Frecuencia absoluta

Frecuencia relativa

Frecuencia acumulada

Frecuencia relativa

acumulada

146 1 0,025 1 0,025 149 2 0,05 3 0,075

150 2 0,05 5 0,125

152 2 0,05 7 0,175 154 2 0,05 9 0,225

155 2 0,05 11 0,275 156 1 0,025 12 0,3

157 1 0,025 13 0,325 159 1 0,025 14 0,35

160 2 0,05 16 0,4

162 3 0,075 19 0,475 163 3 0,075 22 0,55

164 4 0,1 26 0,65 165 1 0,025 27 0,675

166 1 0,025 28 0,7

168 3 0,075 31 0,775 169 4 0,1 35 0,875

170 1 0,025 36 0,9 175 2 0,05 38 0,95

180 1 0,025 39 0,975 185 1 0,025 40 1

40 1

0,05

0,375

0,325

0,025

0,15

0,05 0,0250

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

18 19 20 21 22 23 27

Gráfica de tabla de frecuencia de edad

Page 22: Cuaderno Digital - Gustavo Castro

15

0,025

0,05 0,05 0,05 0,05 0,05

0,0250,0250,025

0,05

0,0750,075

0,1

0,0250,025

0,075

0,1

0,025

0,05

0,0250,025

0

0,02

0,04

0,06

0,08

0,1

0,12

146 149 150 152 154 155 156 157 159 160 162 163 164 165 166 168 169 170 175 180 185

Tabla de frecuencia de la talla

Page 23: Cuaderno Digital - Gustavo Castro

16

Preguntas

1. ¿Qué porcentaje de componentes tiene un tiempo de vida menor a 14

meses?

De una muestra tomada al azar de 50 electrodomésticos, el 16% de los

artefactos estudiados tuvo un tiempo de vida menor a 14 meses.

2. ¿Qué porcentaje de componentes tiene un tiempo de vida superior a 21

meses?

De una muestra tomada al azar de 50 electrodomésticos, el 36% de los

artefactos estudiados tiene un tiempo de vida superior a los 21 meses.

3. ¿Qué porcentaje de componentes tiene un tiempo de vida entre 21

meses y 32 meses?

De una muestra tomada al azar de 50 electrodomésticos, el 20% de los

artefactos estudiados tiene un tiempo de vida entre los 21 y 32 meses.

4. ¿Cuál es el tiempo de vida de los componentes de tal forma que la mitad

dure menos de ese valor?

5. ¿Cuál es el tiempo de vida de los componentes de tal forma que un 25%

dure menos de ese valor?

Reglas generales para formar intervalos en variables cuantitativas

continuas.

1. - Rango: X(max) − X(min)

2.- Número de intervalos 𝐧𝐢:

Formula de Esturgues.

ni = 1 + 3.32 log(n)

N= es el tamaño de la muestra u observaciones.

3.- Ancho del intervalo:

i =R

ni

Page 24: Cuaderno Digital - Gustavo Castro

17

4.- Cálculo del nuevo rango o 𝐑∗:

R∗ = ni ∗ i

Si hay diferencia, se resta la diferencia del nuevo rango.

Si hay una diferencia de 3 se le resta 1 al menor y se suma 2 al mayor.

Ejercicio

A 40 estudiantes se les pidió que estimen el número de horas que habrían

dedicado a estudiar la semana pasada, tanto en clase como fuera de ella,

obteniéndose los siguientes resultados.

36 30 47 60 32 35 40 50

54 35 45 52 48 58 60 38

32 35 56 48 30 55 49 39 58 50 65 35 56 47 37 56

58 50 47 58 55 39 58 43

𝑅 = 𝑋(𝑚𝑎𝑥) − 𝑋(𝑚𝑖𝑛) 𝑅 = 65 − 30 = 𝟑𝟓

𝑛𝑖 = 1 + 3.32 𝑙𝑜𝑔 (40) = 6.32 = 𝟔

𝑖 =𝑅

𝑛𝑖=

35

6= 5.83 = 𝟔

𝑅∗ = 𝑛𝑖 ∗ 𝑖 = 6 ∗ 6 = 𝟑𝟔

1.- Se determina cual es la variable a analizar y que tipo de variable es:

De una muestra de 40 estudiantes que fueron encuestados al azar, se necesita

conocer el rango de la cantidad de horas que estudian tanto dentro como fuera de

clases, por lo cual determinamos que nuestra variable a estudiar será “Horas de

estudio”.

La variable “Horas de estudio” almacena la cantidad de hora que estudian la muestra

de 40 estudiantes encuestados al azar, por lo que se determina que el tipo de

variable será cuantitativa, como se necesita conocer el rango de la cantidad de

horas, el tipo de variable será cuantitativa continua.

Page 25: Cuaderno Digital - Gustavo Castro

18

2.- Se toman los datos de la muestra y se los ordena

# Horas de estudio # Horas de estudio X1 36 X(1) 30 X2 54 X(2) 30 X3 32 X(3) 32 X4 58 X(4) 32 X5 58 X(5) 35 X6 30 X(6) 35 X7 35 X(7) 35 X8 35 X(8) 35 X9 50 X(9) 36

X10 50 X(10) 37 X11 47 X(11) 38 X12 45 X(12) 39 X13 56 X(13) 39 X14 65 X(14) 40 X15 47 X(15) 43 X16 60 X(16) 45 X17 52 X(17) 47 X18 48 X(18) 47 X19 35 X(19) 47 X20 58 X(20) 48 X21 32 X(21) 48 X22 48 X(22) 49 X23 30 X(23) 50 X24 56 X(24) 50 X25 55 X(25) 50 X26 35 X(26) 52 X27 58 X(27) 54 X28 55 X(28) 55 X29 47 X(29) 55 X30 39 X(30) 56 X31 40 X(31) 56 X32 60 X(32) 56 X33 49 X(33) 58 X34 37 X(34) 58 X35 58 X(35) 58 X36 50 X(36) 58 X37 38 X(37) 58 X38 39 X(38) 60 X39 56 X(39) 60 X40 43 X(40) 65

Page 26: Cuaderno Digital - Gustavo Castro

19

3.- Con los cálculos anteriormente realizados se realiza la tabla de

frecuencia de la variable cuantitativa continua.

Horas estudio

Marca de clase

Frecuencia absoluta

Frecuencia relativa

Frecuencia acumulada

Frecuencia relativa

acumulada

[29-35) 32 4 0,1 4 0,1

[35-41) 38 10 0,25 14 0,35 [41-47) 44 2 0,05 16 0,4

[47-53) 50 10 0,25 26 0,65 [53-59) 56 11 0,275 37 0,925

[59-65] 62 3 0,075 40 1 40 1

4.- Realizada la tabla de frecuencia, se realizan las gráficas (Histograma,

Polígono y Ojiva).

Histograma

0,1

0,25

0,05

0,25

0,275

0,075

0

0,05

0,1

0,15

0,2

0,25

0,3

[29-35) [35-41) [41-47) [47-53) [53-59) [59-65]

Horas de estudio

Page 27: Cuaderno Digital - Gustavo Castro

20

Polígono

Ojiva

5.- Se interpretan los resultados obtenidos de nuestro estudio:

De la muestra tomada al azar de 40 estudiantes, a los cuales se les ha consultado la

cantidad de horas que estudian, tanto dentro como fuera de clases, se obtuvieron los

siguientes resultados, el 10% de los estudiantes dedicaron entre 29 a 35 horas a

estudiar la semana anterior, el 25% de los estudiantes dedicaron entre 35 a 41 horas

a estudiar la semana anterior, el 5% de los estudiantes dedicaron entre 41 a 47 horas

a estudiar la semana anterior, el 25% de los estudiantes dedicaron entre 47 a 53

horas a estudiar la semana anterior, el 27,5% de los estudiantes dedicaron entre 53

a 59 horas a estudiar la semana anterior y el 7,5% de los estudiantes dedicaron entre

59 a 65 horas a estudiar la semana anterior.

Por lo que llegamos a la conclusión que el 65% de la muestra dedicó entre 47 a 65

horas a estudiar la semana anterior, y un 35% le dedicó de 29 a 47 horas a estudiar

la semana pasada, lo que demuestra que en la muestra de 40 estudiantes tomada al

azar, hay 24 estudiantes que se esfuerzan más en sus estudios para un mejor

aprendizaje.

0,1

0,25

0,05

0,250,275

0,075

0

0,05

0,1

0,15

0,2

0,25

0,3

32 38 44 50 56 62

Horas de estudio

0,1

0,35 0,4

0,65

0,9251

0

0,2

0,4

0,6

0,8

1

1,2

[29-35) [35-41) [41-47) [47-53) [53-59) [59-65]

Horas de estudio

Page 28: Cuaderno Digital - Gustavo Castro

21

Estimadores

Media

La media depende de la muestra ya que es una variable aleatoria es la suma de los

datos dividido para el número total de datos menos uno.

= ∑𝑿𝒊

𝒏

𝒏

𝒊=𝟏

𝑋𝑖 = 20,20,19,18,21,19,22,23,19,20,20

𝑋(𝑖) = 18,19,19,19,20,20,20,20,21,22,23

=20 + 20 + 19 + 18 + 21 + ⋯ + 20

11= 20,09

Centralización

• Media

• Mediana 𝒙

• Moda 𝑴

Dispersión

• Varianza 𝑺𝟐

• Desviación estandar

𝑺𝟐 = 𝑺

• Coeficiente de variación

𝑪𝑽 =𝑺

= %

Forma

• Coeficiente deasimetría

• Curtosis

Posición

• Cuantiles

• Deciles

• Percentiles

• Cuartiles

• Q1= Primer cuartil

• Q2= Segundo cuartil

• Q3= Tercer cuartil

Page 29: Cuaderno Digital - Gustavo Castro

22

Rigoberto Perez. (2010), "Llamamos media aritmética de la variable

estadística que denotamos por x, al valor de la expresión".

Pérez. (1995) “Descubrió cuatro técnicos existentes para calcular el tamaño de

la muestra requerida en la estimación de la media aritmética de una distribución log

normal con base en la amplitud del intervalo de confianza.”

Álvarez, R. (2007) “La media aritmética poblacional es uno de los parámetros

que más veces se estima en estudios estadísticos”.

Mediana

Si la mediana es par:

𝒙 = 𝒙(𝒊+𝟏) = 𝟐𝟎

Si la mediana es impar:

𝒙 = 𝒙(𝒊) = 𝟐𝟎

𝑋(𝑖) = 18,19,19,19,20,20,20,20,21,22

𝑥(𝑖) =𝑥(𝑖−1) + 𝑥(𝑖+1)

2=

20 + 20

2= 𝟐𝟎

Xavier García (2004): “La mediana m de un conjunto de n mediciones es el

valor de x que cae en la posición media cuando las mediciones son ordenadas de

menor a mayor.”

Daniela Acevedo (2003): “La mediana es el valor que se encuentra en la mitad

de nuestros datos, existen dos formas de hallarla, una para datos pares y otra para

impares.”

Rigoberto Perez. (2010), "Llamamos media aritmética de la variable

estadística que denotamos por x, al valor de la expresión".

Page 30: Cuaderno Digital - Gustavo Castro

23

Moda

𝑀 = 𝑉𝑎𝑙𝑜𝑟 𝑜 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑞𝑢𝑒 𝑚á𝑠 𝑠𝑒 𝑟𝑒𝑝𝑖𝑡𝑒𝑛

𝑀 = 20

Mendehall, W – Beaver, R – Beaver, B (2006): “La moda es la categoría

que se presenta con más frecuencia o el valor de x que se presenta con más

frecuencia.”

Rigoberto Perez. (2010), "Llamamos moda o valor modal de una distribución,

que denotamos por Mo, al valor de la variable que más veces se repite".

Andrade, A. (2003) “La moda es la medida de posición que indica la magnitud

del valor que se presenta con más frecuencia en una serie de datos; es pues, el valor

de la variable que más se repite en un conjunto de datos. De las medias de posición

la moda es la que se determina con mayor facilidad, ya que se puede obtener por

una simple observación de los datos en estudio, puesto que la moda es el dato que

se observa con mayor frecuencia. La moda se designa con las letras Mo.”

Los estimadores solo se aplican en variables cuantitativas

Distribución normal representada por campana de Gauss

Page 31: Cuaderno Digital - Gustavo Castro

24

Dispersión

Varianza

Varianza es una medida de dispersión la sumatoria del dato menor la media

dividida para la cantidad de datos menor a uno.

1

n − 1∑(𝑥𝑖 − )2

Klever Morales (2006): “La varianza de una muestra de n mediciones es la

suma de las desviaciones cuadradas de las mediciones alrededor la media dividida

entre (n - 1).”

José María Cordero (2002), "La varianza se puede definir como la media

aritmética de las desviaciones de los valores obtenidos de la variable con respecto a

su media aritmética elevadas al cuadrado".

Pérez, R. Covadonga Caso, Río, M. Lopez, A. (2012) “Llamamos varianza,

que denotamos por S^2 x, a la derivación cuadrática media respecto a la media

aritmética de los valores de la variable”.

Desviación estándar

Se considera desviación estándar al resultado de la varianza sacándole la raíz

cuadrada.

𝑆 = √𝑆2

Salking, Nell J. (1999) “La desviación estándar es la medida de variabilidad de

uso más común. La desviación estándar es la cantidad promedio en que cada uno de

los personajes, individuales varia respecto a la medida del conjunto de puntajes.

Cuanto mayor es la desviación estándar, más variable es el conjunto de puntajes”.

Santiago Alarcón (2015): “La desviación estándar se obtiene sacando la raíz

cuadrada de la varianza, el valor que se obtiene es una medida que indica la

variación de todos los datos en referencia a la media.”

Mario F. Triola. (2004), "La desviación estándar es una medida de variación

de todos los valores con respecto a la media".

Page 32: Cuaderno Digital - Gustavo Castro

25

Coeficiente de variación

Es la desviación estándar dividida para la media de la muestra y su resultado es

convertido a porcentaje.

𝑐. 𝑣 =𝑠

Rodríguez, L (2007): “Es un número que se usa para comparar la variabilidad

de los datos de diferentes grupos. Es una medida adimensional.”

Hernández, E. (2006) “Coeficiente de variación: La variación real o dispersión

determinada a partir de la desviación estándar u otra medida de dispersión, es

llamada la dispersión absoluta”.

Michael J. Evans, Jeffrey S. Rosenthal. (2005), "El coeficiente de variación

de una medida poblacional con media no nula se define como σ/µ, donde µ es la

media poblacional y σ la desviación estándar de la población".

Ejercicios

Media

= ∑𝑥𝑖

𝑛

𝑛

𝑖=1

=22 + 37 + 28 … + 33 + 35 + 28

75

= 35.69

Mediana

(𝑖) =𝑖𝑚𝑝𝑎𝑟

𝑝𝑎𝑟

(𝑖) =𝑥(𝑖−1) + 𝑥(𝑖+1)

2=

29 + 35

2= 𝟑𝟐

Moda

𝑀 = 35 𝑦 29

Varianza

Page 33: Cuaderno Digital - Gustavo Castro

26

𝑠2 =1

74[(21 − 35,69)2 + (22 − 35,69)2 + ⋯ + (74 − 35,69)2 + (80 − 35,69)2]

= 124.05

Derivación estándar

𝑠 = √𝑠2 = 11.137

Coeficiente de variación

𝑐. 𝑣 =𝑠

=

11.137

35.69= 0.3120

𝒙𝒊 𝒇𝒊 𝒙𝒊𝒇𝒊 𝒙𝒊𝟐 𝒇𝒊𝒙𝒊

𝟐 0 12 0 0 0 1 9 9 1 9

2 7 14 4 28 3 6 18 9 54

4 3 12 16 48

5 3 15 25 75 40 68 214

Media

= ∑𝑓𝑖𝑥𝑖

𝑓𝑖

𝑛

𝑖=1

=68

40= 1.7

Varianza

𝑠2 = ∑𝑓𝑖𝑥𝑖

2

𝑓𝑖− ()2

𝑛

𝑖=1

𝑠2 =214

40− (1,7)2 = 5,35 − 2,89 = 2,46

Desviación estándar

𝑠 = √𝑠2

𝑠 = √2,46 = 1,57

Page 34: Cuaderno Digital - Gustavo Castro

27

Coeficiente de variación

𝐶𝑣 =𝑠

𝐶𝑣 =1,57

1,7= 0,92261 = 92%

Tabla

Clase 𝒇𝒊 𝒙𝒊 𝒙𝒊𝒇𝒊 𝒙𝒊𝟐 𝒇𝒊𝒙𝒊

𝟐 [1,65-2,05) 4 1,85 7,40 3,4225 13,69

[2,05-2,45) 5 2,25 11,25 5,0625 25,3125

[2,45-2,85) 13 2,65 34,45 7,0225 91,2925

[2,85-3,25) 17 3,05 51,85 9,3025 158,1425

[3,25-3,65) 8 3,45 27,60 11,9025 95,22

[3,65-4,05) 3 3,85 11,55 14,8225 44,4673

50 144,1 428,25

=144,1

50= 2,882

𝑠2 =428,125

50− (2,882)2 = 0,256576

𝑠 = √0,256 = 0,506

𝐶𝑣 =0,50653315

2,882= 17,578% = 18%

Clase 𝒇𝒊 𝒙𝒊𝒇𝒊 𝒙𝒊𝟐 𝒇𝒊𝒙𝒊

𝟐 21 1 21 441 441

22 1 22 484 484

24 2 48 576 1152

25 1 25 625 625

26 4 104 676 2704

27 4 108 729 2916

28 4 112 784 3136

29 6 174 841 5046

30 3 90 900 2700

31 3 93 961 2883

32 3 96 1024 3072

33 5 165 1089 5445

Page 35: Cuaderno Digital - Gustavo Castro

28

34 3 102 1156 3468

35 6 210 1225 7350

36 1 36 1296 1296

37 3 111 1369 4107

38 4 152 1444 5776

39 2 78 1521 3042

40 1 40 1600 1600

41 5 205 1681 8405

42 2 84 1764 3528

43 1 43 1849 1849

45 1 45 2025 2025

46 1 46 2116 2116

49 1 49 2401 2401

50 1 50 2500 2500

54 1 54 2916 2916

60 1 60 3600 3600

61 1 61 3721 3721

63 1 63 3969 3969

74 1 74 5476 5476

80 1 80 6400 6400

75 2677 106149

=2677

75= 35,693

𝑠2 =106149

75− (35,69)2 = 141,543

𝑠 = √141,543 = 11,897

𝐶𝑣 =11,897

35,69= 0,33 = 33%

Clase 𝒙𝒊 𝒇𝒊 𝒙𝒊𝒇𝒊 𝒙𝒊𝟐 𝒇𝒊𝒙𝒊

𝟐 [19-28) 23,5 16 376 552,25 8836

[28-37) 32,5 32 1040 1056,25 33800

[37-46) 41,5 18 747 1722,25 31000,5 [46-55) 50,5 4 202 2550,25 10201

[55-64) 59,5 3 178,5 3540,25 10620,75 [64-73) 68,5 0 0 4692,25 0

[73-82) 77,5 2 155 6006,25 12012,5 75 2698,5 106470,75

Page 36: Cuaderno Digital - Gustavo Castro

29

=2698,5

75= 35,98

𝑠2 =106470,76

75− (35,98)2 = 125,0496

Estimadores de posición

𝑥𝑖 = 𝐶𝑙𝑎𝑠𝑒 𝑒𝑛 𝑑𝑖𝑠𝑐𝑟𝑒𝑡𝑎𝑠 − 𝑀𝑎𝑟𝑐𝑎 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 𝑒𝑛 𝑐𝑜𝑛𝑡𝑖𝑛𝑢𝑎𝑠

𝑓𝑖 = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 − 𝑃𝑎𝑟𝑎 𝑑𝑖𝑠𝑐𝑟𝑒𝑡𝑎𝑠 𝑦 𝑐𝑜𝑛𝑡𝑖𝑛𝑢𝑎𝑠

Percentiles del orden i

Es aquel que divide a los datos en 100 partes igual.

𝑖 = 1 … 99

Miguel silva (2004) “Un percentil es otra medida de posición relativa y se usa

con más frecuencia para conjuntos grandes de datos.”

Cástor Guisande González. (2006), “Los percentiles son los 99 puntos que

dividen la distribución en 100 partes, tales que dentro de cada una está incluido el

1% de los valores de la distribución.”

Carlos Méndez (1995): “Un percentil permite mostrar un conjunto de datos

extenso con más precisión.”

Deciles

Es aquel que divide los elementos de la muestra en 10 grupos con frecuencias

similares.

Rodríguez, L (2007): “Son números que dividen a los datos de la muestra en

grupos de tamaño aproximado a 10%.”

Cástor Guisande González. (2006), "Los deciles son 9 puntos que dividen la

distribución en 10 partes, tales que dentro de cada una está incluido el 10% de los

valores de la distribución".

Barreto. A, (2012) “En el ámbito del análisis de la distribución del ingreso de

las familias, es común que la curva de Lorenzo se construya a partir de datos

agrupados en subconjuntos de tamaño o por ciento, denominamos deciles de

hogares.”

Page 37: Cuaderno Digital - Gustavo Castro

30

Cuartiles

Es aquel que divide los elementos de la muestra en 4 grupos con frecuencia

similares.

Maximiliano Escobedo (2006): Un conjunto de n mediciones en la variable x

se ha acomodado en orden de magnitud. El cuartil inferior (primer cuartil), Q1, es el

valor de x que es mayor a un cuarto de las mediciones y es menor que los restantes

tres cuartos. El segundo cuartil es la mediana. El cuartil superior (tercer cuartil), Q3,

es el valor de x que es mayor a tres cuartos de las mediciones y es menor que el

restante un cuarto.

Cáceres, R (2007) “Los cuartiles dividen al conjunto de datos en cuarto partes

iguales en cuanto al número de datos, en cada una de ellas hay un 25% de datos. En

caso de que el número de datos no sea divisible por cuatro, los grupos no podrán

tener todos exactamente el mismo número de datos”.

Cástor Guisande González. (2006), "Los cuartiles son los tres valores de la

variable que dividen la distribución en partes iguales, es decir, en 4 intervalos,

dentro de cada cual está incluido el 25% de los valores de la distribución".

Cuantil

Se define el cuantil del orden α como un valor de la variable por debajo de la cual se

encuentra una frecuencia acumulada α. Entre los casos particulares tenemos los

percentiles, deciles, cuartiles. Para encontrar percentiles, deciles y cuartiles se aplica

una formula.

Nettleton, D. (2003) “La técnica de cuantiles genera tantas categorías como

deseamos, en función del rango de valor de valores de la variable para definir los

cuantiles, tenemos que especificar a la técnica cuantos queremos, y para cad uno el

porcentaje de los casos que deseamos incluir”

Cástor Guisande (2006), "Los cuantiles se definen al orden k como los valores

de la variable, supuesta ésta ordenada de menor a mayor, que la deividen en k partes

con la misma frecuencia de observaciones. Por lo tanto existirán k-1 cuantiles de

orden k".

Page 38: Cuaderno Digital - Gustavo Castro

31

Rodríguez, L (2007): Son números que distribuyen los datos ordenados de la

muestra en grupos de aproximadamente tamaño con el propósito de resaltar su

ubicación relativa. Estos números se denominan cuantiles en forma genérica.

𝑥(𝑖,𝑎) = 𝑥(𝑖) + 0, 𝑎(𝑥(𝑖+1) − 𝑥(𝑖)) → 𝐶𝑢𝑎𝑟𝑡𝑖𝑙𝑒𝑠

𝑖 𝑒𝑠 𝑝𝑎𝑟𝑎 𝑙𝑎 𝑝𝑎𝑟𝑡𝑒 𝑒𝑛𝑡𝑒𝑟𝑎

𝑎 𝑒𝑠 𝑝𝑎𝑟𝑎 𝑙𝑎 𝑝𝑎𝑟𝑡𝑒 𝑑𝑒𝑐𝑖𝑚𝑎𝑙

𝑝(𝑖) = 𝑥 ((𝑛 + 1)𝑖

100) → 𝑃𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙𝑒𝑠 → 𝑖 = 1 … 99

𝒙𝒊 Talla 𝒙(𝒊) Talla

𝒙𝟏 1,65 𝑥(1) 1,60

𝒙𝟐 1,60 𝑥(2) 1,60

𝒙𝟑 1,64 𝑥(3) 1,64

𝒙𝟒 1,69 𝑥(4) 1,65

𝒙𝟓 1,81 𝑥(5) 1,68

𝒙𝟔 1,68 𝑥(6) 1,69

𝒙𝟕 1,60 𝑥(7) 1,70

𝒙𝟖 1,70 𝑥(8) 1,70

𝒙𝟗 1,70 𝑥(9) 1,76

𝒙𝟏𝟎 1,76 𝑥(10) 1,81 Hallar los percentiles 25, 50 y 75

1) P(25) = x (11∗25

100) = 2,75

x(2,75) = 1,60 + 0,75(1,64 − 1,60) = 1,63

P(25) = 1,63

2) Q2 = 50% = P(50) = (11∗50

100) = 5,5

X(5,5) = (1,68 + 0,5)(1,69 − 1,68) = 1,685

P(50) = 1,69

3) Q3 = 75% = P(75) = (11∗75

100) = 8,25

X(8,25) = (1,70 + 0,25)(1,76 − 1,70) = 1,715

P(75) = 1,72

Page 39: Cuaderno Digital - Gustavo Castro

32

Diagrama de Cajas y Bigotes

Es una medida de dispersión asociado a la mediana, es la diferencia entre el primer

y tercer cuartil.

𝑅𝑖 = 𝑟𝑎𝑛𝑔𝑜 𝑖𝑛𝑡𝑒𝑟𝑐𝑢𝑎𝑟𝑡𝑖𝑙

𝑅𝑖 = 𝑄3 − 𝑄1

Correa. A, Burgos. C,(2012) “Este diagrama muestra que la

distribución de la finura es simétrica con respecto al valor central

promedio debido a que la longitud de ambos rectángulos alrededor de

cada mediana es igual en la mayoría de la operarios .”

Rodríguez, L (2007): “Es un dispositivo gráfico que se usa para

expresar en forma resumida, algunas medidas estadísticas de posición.”

Antoni Uchupelli (1994): Es un gráfico que permite analizar la

posición de los datos y también donde existe una mayor incidencia de

los mismos, observando el tamaño de los cuartiles y de los bigotes.

Rango Intercuartil

Es una medida de dispersión asociado a la mediana, es la diferencia entre el

primero y tercer cuartil.

𝑅𝐼 = 𝑄3 − 𝑄1

𝑅𝐼 = 1.715 − 1.63

𝑅𝐼 = 0.085

Page 40: Cuaderno Digital - Gustavo Castro

33

𝑅𝐼 = 𝑄3 − 𝑄1

David M. Levine, Mark L. Berenson, Timothy C. Krehbiel. (2006), "El

rango intercuartil (tambien llamado dispersión media) es la diferencia entre el

tercer y primer cuartil de un conjunto de datos, mide la dispersión en la mitad (parte

central) de los datos, así que no se ve influido por los valores extremos".

Pérez. F, (2012) “Por su parte el rango intercuartil se obtiene de la diferencia

entre el primer y tercer cuartil y, sirve para indicar la duración o tiempo que le toma

a un cohete completar una transición dada.”

Tigre, M. (2008) “En estadística descriptiva, se le llama rango intercuartílico o

rango intercuartil, a la diferencia entre el tercer y el primer cuartil de una

distribución. Es una medida de la dispersión estadística, a diferencia del rango, se

trata de un estadístico robusto.”

Valores alejados

Son valores observados que se apartan del resto de la muestra, para ello utilizamos

2 reglas:

1.- Si el valor de x, tomado de la muestra, es menor que 𝑄1 − 1,5(𝑄3 − 𝑄1) o lo mismo

que 𝑄1 − 1,5 ∗ 𝑅𝑖, entonces 𝑥𝑖 es alejado por defecto.

2.- Si el valor de x, tomado de la muestra, es menor que 𝑄3 + 1,5(𝑄3 − 𝑄1) o lo mismo

que 𝑄3 + 1,5 ∗ 𝑅𝑖, entonces 𝑥𝑖 es alejado por exceso.

Martín, Miguel, Horna, Olivia, Nedel, Fúlvio, Navarro, Albert.

(2010), "Podríamos hablar de un efecto revelador de valores alejados de la media

haciendo "invisibles" los que están a pocas desviaciones estándar".

Ximenez, P. (2004) “Son valores observados que se apartan demasiado del

resto de la muestra, dando como resultado una muestra alejada de la realidad.”

Gutiérrez. A, (2010) “Es una dispersión grande es una propiedad indeseada

del estimador, pues en generalmente en la práctica, tenemos solo una muestra”

Page 41: Cuaderno Digital - Gustavo Castro

34

Estimadores de forma

1) Asimetría

AS = 0 Simetría

AS > 0 Simetría hacia la derecha

AS < 0 Simetría hacia la izquierda

Distribución en forma simétrica

Se encuentran mayormente agrupados hacia la izquierda de la distribución normal,

o agrupados hacia la derecha de la distribución normal.

2) Curtosis

2 = 𝑆2 =1

𝑛 − 1∑(𝑋𝐼 − )

2

→ 𝑀𝑎𝑡𝑒𝑚á𝑡𝑖𝑐𝑎𝑚𝑒𝑛𝑡𝑒

3 = 𝐴𝑆 =∑(𝑋𝐼 − )

𝑛. 𝑆3𝑥

3

→ 𝐴𝑠𝑖𝑚𝑒𝑡𝑟í𝑎

4 = 𝐶𝑟 = [∑(𝑋𝐼 − )

4

𝑛. 𝑆4𝑥 ] − 3 → 𝐶𝑢𝑟𝑡𝑜𝑠𝑖𝑠

𝒙𝒊 𝑿𝒊 (𝑿𝒊)𝟐 (𝑿𝒊)

𝟑 (𝑿𝒊)𝟒

2 -2 4 -8 16

4 0 0 0 0

8 4 16 64 256

2 -2 4 -8 16

24 48 288

Page 42: Cuaderno Digital - Gustavo Castro

35

=2 + 4 + 8 + 2

4= 4

𝑆2 =1

3[(2 − 4)2 + (4 − 4)2 + (8 − 4)2 + (2 − 4)2] = 8

𝑆 = √𝑆2 = √8 = 2,83

2 = 𝑆2 = 8

3 = 𝐴𝑆 = (48

4(2,83)3) = 0,53

4 = (288

4(2,83)4) − 3 = −1,88

Antonio Rial Boubeta, Varela Mallou Jesus. (2014), " La Asimetría

informa del grado en que las observaciones se reparten proporcional y

equitativamente por encima y por debajo del punto central (más alto) de la

distribución".

Corea. L, Morales. A, (2000) “La convergencia a la distribución normal de los

promedios de variables aleatorias poisson, igual e independiente distribuidas, está

en función de su parámetro a mayor valor del mismo, más rápida es la

convergencia.”

Santander, K. (2005) “La simetría (también denominada sesgo) de una

distribución de frecuencias hace referencia al grado en que valores de la variable,

equidistantes a un valor que se considere centro de la distribución, poseen

frecuencias similares.”

Page 43: Cuaderno Digital - Gustavo Castro

36

La curtosis

Es el apuntamiento de la distribución normal

Antonio Rial Boubeta, Varela Mallou Jesus. (2014), "La Curtosis es una

medida que se relaciona con la frecuencia de aparición de valores centrales en una

distribución".

Peña, F. (2008) “La Curtosis es una medida de la forma. Así, las medidas de

Curtosis tratan de estudiar la proporción de la varianza que se explica por la

combinación de datos extremos respecto a la media en contraposición con datos

poco alejados de la misma. Una mayor Curtosis implica una mayor concentración de

datos muy cerca de la media de la distribución coexistiendo al mismo tiempo con

una relativamente elevada frecuencia de datos muy alejados de la misma”.

Ramírez. L, (2008) “Este se puede tomar como un indicador de la magnitud de

la variabilidad. Esta aproximación a la distribución normal, expresada

principalmente por la asimetría”.

Page 44: Cuaderno Digital - Gustavo Castro

37

POSICIÓN

Cuantiles Deciles Q1 primer cuartil Percentiles Q2 segundo cuartil Cuartiles Q3 tercer cuartil

Media

X = ∑𝑋𝑖

𝑛

𝑛𝑖=1

X= 20+20+19+18+21………+20

11

X=20.09

Medida

Impar 𝑋(𝑖)=20

𝑋 (𝑖)

Par 𝑋(𝑖)= 𝑋𝑖−1+𝑋𝑖∓1

2 = 𝑋(𝑖+2)=20

Moda

M = Valor 8 valores que más se repite

M =20

Campana de Gauss

16 25

18 24

17 18 19 25

20 20 30

La campana de gauss nos da a conocer la distribución de nuestros datos tomados de

una muestra estos sean hacia la derecha o hacia la izquierda. Donde se encuentre

acumulado los datos.

Page 45: Cuaderno Digital - Gustavo Castro

38

Guárdia, J. Freixa, M. Peró, M. Turbany, J. (2008) “La distribución normal es

un modelo teórico de probabilidad que se puede utilizar cuando trabajamos con

variables aleatorias continuas, aunque también lo utilizamos en variables aleatorias

discretas que tienen un rango de valores suficientemente amplio. Recibe el nombre

de campana de Gauss”.

González, K. (2007) “Campana de Gauss, es una representación gráfica de la

distribución normal de un grupo de datos. Éstos se reparten en valores bajos,

medios y altos, creando un gráfico de forma acampanada y simétrica con respecto a

un determinado parámetro. Se conoce como curva o campana de Gauss o

distribución Normal”.

Catmull, E. (2014) “Un concepto ligeramente menos obvio es el de la distribución

normal o campana de gauss, aunque muchos comprendemos intuitivamente su

significado. En el colegio nos suelen calificar de acuerdo con una campana de gauss:

unas pocas personas sacan, malas notas, otras pocas sacan notas excelentes y el

resto queda amontonado en el centro”.

Ejercicio

Edad

18 20 19

20 23 21

20 19

19 20

Media ∑𝑋𝑖

𝑛

𝑛𝑖=1 =20.09 =20

Mediana =20

Moda =20

Dispersión

Varianza = 1

𝑛−1 ∑ (𝑋𝑖 − 𝑋)𝑛

𝑖=

𝑠2 =1

10 =((18 − 20.09)2 + (19 − 20.09)2……………(23 − 20.09)2)

𝑠2 = 2.09

Page 46: Cuaderno Digital - Gustavo Castro

39

Desviación estándar S=√𝑠2

S=√2.09

S=1.44

Coeficiente de varianza CV = 𝑠

𝑥 dec, %

CV= 1.44

20.05 =0.072=7.2%

Estimación de edades, mejores actrices

Media = 21+22+⋯…….+80

75 = 35.69

Mediana = 33

Moda = 35.29

Varianza =1

14 [(21 − 35.69)2] =11.13

Desviación estándar S= √(11.13) = 3.33

Coeficiente varianza = CV = 𝑆

𝑋 dec % CV =

11.13

35.69 = 0.311 = 3.1%

Estimación tabla de frecuencia o datos cuantitativas discretas

clase Fi Xi Fi

Fi Xi^2

0 12 0 0 0

1 9 9 1 9

2 7 14 4 28

3 6 18 9 54

4 3 12 16 48

5 3 15 25 75

40 68 214

X=∑ 𝑓𝑖 𝑋𝑖

𝑛𝑖=1

X=68

40 = 1.7

𝑆2 =∑ 𝑓𝑖𝑋𝑖

2𝑛𝑖=1

∑ 𝑓𝑖 -𝑋2

𝑆2 = 214

40− 1.72 = 2.46

S =√𝑆2 =√2.46 = 1.37

C.V = 𝑆

𝑋=

1.57

1.7 =92%

𝑋𝑖2

Page 47: Cuaderno Digital - Gustavo Castro

40

Continuas

Clase Xi Fi Xi Fi

Fi Xi^2

[1,65-2,05] 1,85 4 7,4 3,4225 13,69

[2,05-2,45] 2,25 5 11,25 5,0625 25,3125

[2,45-2,85] 2,65 13 34,45 7,0225 91,2925

[2,85-3,25] 3,05 17 51,85 9,3025 158,1425

[3,25-3,65] 3,45 8 27,6 11,9025 95,22

[3,65-4,05] 3,85 3 11,55 14,8225 44,4675

50 144,1 428,125

X= 144.1

50= 2.88

𝑆2 = 428.125

50− 2.882 = 0.26

S =√𝑆2 =√0.26 = 0.51

C.V = 𝑆

𝑋=

0.51

2.88 =0.177 = 17.7%

𝑋𝑖2

Page 48: Cuaderno Digital - Gustavo Castro

41

Estimadores De Posición

Clase

𝑋𝐼

Marca de clase

Continuas

𝑓𝑖 Frecuencia absoluta

Discretas

Percentiles de orden i

Es el porcentaje dado por las observaciones de datos ordenadas de menor a mayor.

1 2 3 4 5 6 7 8 9

1 2 3 4 5 6 7 8 9 10 11

Vivo. M, Soria. E, (2001) ”En forma intuitiva podemos decir que es un valor tal

que supera un determinado porcentaje de los miembros de la población esta sirve

para comprar las variables”.

Vilar J (2005) “Sea 𝒙𝟏,𝒙𝟐, 𝒙𝟑,…,𝒙𝒏 un conjunto de n valores ordenados de menor a

mayor, se denomina percentil o al valor perteneciente al conjunto de datos que

cumple el p% de los datos sin menores que él”.

Jara, L. (2006) ”El percentil es una medida de tendencia central usada en

estadística que indica, una vez ordenados los datos de menor a mayor, el valor de la

variable por debajo del cual se encuentra un porcentaje dado de observaciones en

un grupo de observaciones”.

25% 50% 75%

Page 49: Cuaderno Digital - Gustavo Castro

42

DECILES

Se refiere en dividir los datos en diez partes iguales con alguna relación de orden.

Barreto. A, (2012) ”En el ámbito del análisis de la distribución del ingreso de

las familias, es común que la curva de Lorenzo se construya a partir de datos

agrupados en subconjuntos de tamaño o por ciento, denominamos deciles de

hogares”.

Richard I. Levin, David S. Rubin (2004) ” Los deciles tienen nombres

especiales, dependiendo del número de partes iguales en que dividen a los datos.

Los fractiles que los dividen en 10 partes iguales se llaman deciles”.

Hernández, (2003) “Decil se refiere a cada uno de los 9 valores que dividen un

grupo de datos (clasificados con una relación de orden) en diez partes iguales, y de

manera que cada parte representa un décimo de la población. En resumen, los

deciles son cada uno de los nueve valores que dividen un conjunto de datos en diez

grupos con iguales efectivos”.

CUARTILES

Los cuartiles son tres valores Q1, Q2, Q3 que dividen a un conjunto de datos

ordenados.

Moore. D, (2005) ” Estas ordenan los datos de menor a mayor y busca el lugar

que ocupa cada cuartil mediante 𝐾.𝑁

4 K = 1, 2,3”.

Cáceres, R (2007)”Los cuartiles dividen al conjunto de datos en cuarto partes

iguales en cuanto al número de datos, en cada una de ellas hay un 25% de datos. En

caso de que el número de datos no sea divisible por cuatro, los grupos no podrán

tener todos exactamente el mismo número de datos”.

Mendoza, B. (2002) “Los cuartiles son los tres valores que dividen al conjunto

de datos ordenados en cuatro partes porcentualmente iguales. La diferencia entre

el tercer cuartil y el primero se conoce como rango intercuartílico. Se representa

gráficamente como la anchura de las cajas en los llamados diagramas de cajas”.

Page 50: Cuaderno Digital - Gustavo Castro

43

Cuantiles

Son puntos tomados a intervalos regulares de una variable aleatoria.

Canaviri. D, (2012) ” Intenta modelar el efecto X sobre toda la distribución de

Y Z-fz continuas, monótona. El i-esimo cuartil de Z en un número Qzi que satisface

F (Q Z T) =T”.

Nettleton, D. (2003) “La técnica de cuantiles genera tantas categorías como

deseamos, en función del rango de valor de valores de la variable para definir los

cuantiles, tenemos que especificar a la técnica cuantos queremos, y para cada uno el

porcentaje de los casos que deseamos incluir”.

Suarez, A. (2000) “Se define el cuantil de orden alfa como un valor de la variable

por debajo de la cual se encuentra una frecuencia acumulada alfa”.

Entre los casos particulares tenemos los percentiles, deciles y cuartiles.

Q1 (primer cuartil)= 25% 25

Percentiles Q2 (segundo cuartil)=50%

Q3 (tercer cuartil)=75% 75

Edades

20, 20, 20, 21, 22, 23,25

Q2=50%=21

Q1=25%=20 P50 = 𝑋(8)∗5

100 =𝑋4 = 21

Q3=75%=23

Fórmula para hallar cuartil, percentil, deciles

𝑋𝑖,𝑎 = 𝑋𝐼 + 0. 𝑎(𝑋𝐼+1 − 𝑋𝐼)

Page 51: Cuaderno Digital - Gustavo Castro

44

Fórmulas para hallar posición

𝑃𝑖 = 𝑋(

(𝑛+1)𝑖

100) i=1…………….99

X1 1,65

X2 1,6

X3 1,64

X4 1,69

X5 1,81

X6 1,68

X7 1,6

X8 1,7

X9 1,7

X10 1,76

Datos ordenadas

X(1) 1,6

X(2) 1,6

X(3) 1,64

X(4) 1,65

X(5) 1,68

X(6) 1,69

X(7) 1,7

X(8) 1,7

X(9) 1,76

X(10) 1,81

𝑃𝑖 = 𝑋(

11∗25

100)

= 𝑋(2) + 0.75(𝑋(3) − 𝑋(2))

= 1.60+0.75 (1.64-1.60)

=1.63

Dz= 𝑃(70) = 𝑋(

11∗70

100) =𝑋(7.7)

= 𝑋(7) + 0.7(𝑋(8) − 𝑋(7))

= 1.70+0.7 (1.70-1.70)

=1.70

𝑃(70) = 𝑋(

11∗75

100) =𝑋(8.25)

= 𝑋(8) + 0.25(𝑋(9) − 𝑋(8))

= 1.70+0.25 (1.76-1.70)

=1.715

Page 52: Cuaderno Digital - Gustavo Castro

45

DIAGRAMA DE CAJA Y BIGOTE

Correa. A, Burgos. C,(2012) ”Este diagrama muestra que la distribución de la

finura es simétrica con respecto al valor central promedio debido a que la longitud

de ambos rectángulos alrededor de cada mediana es igual en la mayoría de la

operarios”.

Otamendi, F. Díaz, A. (2011) ”El diagrama de caja muestra los tres cuartiles,

que son los valores que cubren el 25%, el 50% y el 75% de los datos. La caja incluye

el 50% central de los datos. También se incluye como un punto la media y como

asterisco los valores o excesivamente altos o excesivamente bajos en relación con la

media y la variabilidad normal de los datos, marcada por los bigotes de las cajas”.

Espinoza, C. (2004) “Los diagramas de Caja-Bigotes son una presentación visual

que describe varias características importantes, al mismo tiempo, tales como la

dispersión y simetría”.

16

Q1 Q2 Q3

24 28 40

Page 53: Cuaderno Digital - Gustavo Castro

46

1.60 1.81

Rango Intercuartil

RI=Q3-Q1

RI=1.725-1.63

RI=0.085

Es la resta del tercer cuartil menos el primer cuartil de una distribución.

Pérez. F, (2012) “Por su parte el rango intercuartil se obtiene de la diferencia

entre el primer y tercer cuartil y, sirve para indicar la duración o tiempo que le toma

a un cohorte completar una transición dada”.

David M. Levine, Mark L. Berenson, Timothy C. Krehbiel (2004)”El

rango intercuartil (también llamado dispersión media) es la diferencia entre el

tercer y primer cuartil de un conjunto de datos.

El rango intercuartil mide la dispersión en la mitad (parte central) de los datos, así

que no se ve influido por los valores extremos”.

Tigre, M. (2008) “En estadística descriptiva, se le llama rango intercuartílico o

rango intercuartil, a la diferencia entre el tercer y el primer cuartil de una

distribución. Es una medida de la dispersión estadística, a diferencia del rango, se

trata de un estadístico robusto”.

Valor Alejado

Gutiérrez. A, (2010) “Es una dispersión grande es una propiedad indeseada

del estimador, pues en generalmente en la práctica, tenemos solo una muestra”.

Pérez, V. Figueroa, E. Duran. J, (2006) “Los valores alejados originados por

pequeñas desviaciones experimentales, pueden introducir distorsiones

Q1-(1.5*RI) Q3+ (1.5*RI)

1.63

1.685 1.713

Page 54: Cuaderno Digital - Gustavo Castro

47

importantes en los valores medios y sobre todo en los criterios de precisión, por lo

que deben ser revisados y eliminados, si así correspondiesen, antes de ejecutar la

evaluación de los datos”.

Ximenez, P. (2004) “Son valores observados que se apartan demasiado del

resto de la muestra, dando como resultado una muestra alejada de la realidad”.

ESTIMACIÓN POR FORMA

Asimetría AS

Curtosis RC

Distribución en Forma Simetría

La distribución en forma simétrica no muestra con claridad y precisión donde se

encuentra nuestra muestra en la población si a la derecha, izquierda o en la media.

Corea. L, Morales. A, (2000) “La convergencia a la distribución normal de los

promedios de variables aleatorias poisson, igual e independiente distribuidas, está

en función de su parámetro a mayor valor del mismo, más rápida es la

convergencia”.

Alpízar, A. Magno, C. (2004) “El grado de agudeza de una distribución de puntos”.

Santander, K. (2005) “La simetría (también denominada sesgo) de una

distribución de frecuencias hace referencia al grado en que valores de la variable,

Asimétrica

Page 55: Cuaderno Digital - Gustavo Castro

48

equidistantes a un valor que se considere centro de la distribución, poseen

frecuencias similares”.

Datos

Matemática

𝑀2 = 𝑆2 1

𝑛−1∑(𝑋𝐼 − 𝑋)2

Asimetría

𝑀3 = 𝐴𝑠 = ∑(𝑋𝑖)3

𝑛𝑆4𝑥

Curtosis

𝑀4 = 𝐶𝑟 = [∑(𝑋𝑖−𝑋)4

𝑛𝑆4𝑥] − 3

X=2+4+8+2

4 = 4

𝑠2 =1

3 =((2 − 4)2 + (4 − 4)2 + (8 − 4)2 + (2 − 4)2)

𝑠2 = 8

S=√𝑠2

S=√8

S=2.83

𝐴𝑆=

48

4(2.83)3

= 0.53

𝐶𝑟 =288

4(2.83)4 − 3

= -1.88

Xi Xi-x (Xi-X)ᵔ2 (Xi-X)ᵔ3 (Xi-X)ᵔ4

2 -2 4 -8 16

4 0 0 0 0

8 4 16 64 256

2 -2 4 -8 16

24 48 288

Page 56: Cuaderno Digital - Gustavo Castro

49

Análisis Bivariado

Variable De Cuantitativo

Análisis de correlación de Pearson

Variable Cualitativo

Tablas de contingencia estadístico 𝑋2 cori cuadrada

r=𝑆𝑥𝑦

𝑆𝑥𝑆𝑦

Análisis bivariado es cuando se está hablando de dos variables tiene como fi

encontrar si es que existe un tipo de relación entre estas dos variables.

Ramírez. V, Hernández. O, García. M, (2007) “Los análisis bivariado

mostraron ventajas sobre los univariado en su habilidad de predicción

usando la metodología de validación cruzada al usar el análisis bivariado o

Correlación positiva lineal Correlación negativa

lineal

Correlación

No hay correlación

Page 57: Cuaderno Digital - Gustavo Castro

50

cualquiera involucrado estas dos variables comparando con sus respectivos análisis

univariado”.

Martín, Miguel, Horna, Olivia, Nedel, Fúlvio, Navarro, Albert (2010)

”El análisis bivariado: consiste este en la representación, cuantificación y

comparación de las variabilidades observadas en una propiedad en función de las

existencia de un factor externo que puede introducir una variabilidad atribuido al

factor y adicionarle a la propia de la variable bajo un concepto estrictamente

aleatorio”.

Irwin y Miller, M. (1992) “El Análisis Bivariado Implica el análisis comparativo

de dos variables una de las cuales modifica a la otra. Al considerar dos variables, la

construcción de las tablas de distribución de frecuencias Bivariadas”.

Altura Peso

1,55 45KG

1,5 60KG

1,51 60KG

1,85 70KG

1,55 70KG

1,62 68KG

𝑆𝑥𝑦 =1

𝑛−1∑((𝑥𝑖 − 𝑥)(𝑦𝑖 − 𝑦))

𝑆𝑥 = √𝑠2𝑥

𝑆𝑦 = √𝑠2𝑦

𝑋𝑥 = ∑𝑥𝑖

𝑛

𝑛𝑖=1

𝑌𝑌 = ∑𝑌𝑖

𝑛

𝑛𝑖=1

𝑆𝑥2 =1

𝑛−1∑ (𝑋𝑖 − 𝑋)2𝑛

𝑖=1

𝑆𝑦2 =1

𝑛−1∑ (𝑌𝑖 − 𝑌)2𝑛

𝑖=1

𝑆𝑥𝑦 → 𝑋 = 𝑌

𝑆𝑥𝑦 =1

𝑛−1∑((𝑥𝑖 − 𝑥)(𝑥𝑖 − 𝑥))

𝑆𝑥𝑦 =1

𝑛−1∑(𝑋𝑖 − 𝑥)2

Si tienes una muestra con la clasificación de los estudiantes de primer parcial y

segundo parcial

Page 58: Cuaderno Digital - Gustavo Castro

51

r=𝑆𝑥𝑦

𝑆𝑥𝑆𝑦

𝑛 = 10

𝑋 = 58.4

𝑌 = 69.5

𝑆𝑥2 = 166.48

𝑆𝑦2 = 121.83

𝑆𝑥 = √166.48 =12.90

𝑆𝑦 = √121.83 =110.4

𝑆𝑥𝑦 =1

𝑛−1∑((𝑥𝑖 − 𝑥)(𝑦𝑖 − 𝑦))

𝑆𝑥𝑦 = 134.11

r=134.11

12.90∗11.04 = 0.06

Signo de La Covariancia

El signo de la covarianza nos muestra directamente el tipo de correlación lineal es

positiva, negativa.

Rodríguez. L, (2007) “Es importante que se mida la correlación entre variables

cuyas asociaciones tenga algún significado de interés. Así mismo si las variables no

están correlacionadas linealmente, pudiera ser que tengan algún otro tipo de

correlación”.

Primer parcial Segundo parcial

60 72

74 82

66 75

34 46

60 73

66 74

57 70

71 82

39 60

57 61

Page 59: Cuaderno Digital - Gustavo Castro

52

Richard L. Scheaffer, Mendenhall, W. Lyman Ott (2007) “Manera que

cada muestra posible de tamaño n tenga la misma probabilidad de ser seleccionada,

el procedimiento de muestreo se denomina muestreo aleatorio simple”.

Benjumea, J.(2006) “La covarianza de una Variable Estadística Bidimensional,

también llamada varianza conjunta de las dos variables, es el parámetro estadístico

más representativo de una distribución bidimensional”.

Matriz de Varianza y Covarianza

En la matriz de podemos observar la covarianza de dos elementos.

Ato, M. (1990) “Aunque la matriz de correlación entre variables debe constituir

se con coeficientes de correlación de PEARSON ha habido muchos intentos de

aplicar el análisis Factorial a matrices constituidas con otros coeficientes de

correlación fundamentalmente el coeficiente phi y el coeficiente de correlación

tetracorico”.

Rodríguez. L, (2007) “Es una matriz simétrica con la que se pueden representar

ordenadamente las varianzas y las covarianzas entre las variables”.

Mendenhall, W. (2008) “En estadística y teoría de la probabilidad, la matriz de

covarianza es una matriz que contiene la covarianza entre los elementos de un

vector. Es la generalización natural a dimensiones superiores del concepto de

varianza de una variable aleatoria escalar”.

[𝑆𝑥𝑖𝑥𝑗] = [𝑆𝑥12 𝑆𝑥1 𝑥2

𝑆𝑥1 𝑥2 𝑆𝑥22 ]

𝑋1 = 𝑥 𝑆𝑋1 = 𝑆𝑋

𝑋2 = 𝑦 𝑆𝑋2 = 𝑆𝑦

[166.48 134.11134.11 121.83

]

Page 60: Cuaderno Digital - Gustavo Castro

53

MATRIZ DE CORRELACIÓN

Matriz de correlaciones nuestra r está conformada por filas y columnas.

Montgomery, Douglas, C. (2008) “El análisis factorial se puede utilizar para

estudiar series numéricas o de valores cuantitativos para un determinado número

de variables cuantitativas y mayor de dos. Por ejemplo, tres características o más

para series numéricas con igual número de datos”.

Aguirre, A. (1994) “la correlación en el modelo, como dijo, puede indicar la

presencia de parámetros superfluos. Estos parámetros redundantes y no están

necesariamente entre aquellos para los cuales aparece el coeficiente de variación”.

Cobo, P. (1997) “Los coeficientes de un filtro fijo pueden obtenerse del cociente

de la matriz de correlación cruzada entre la salida ideal y la entrada y la matriz de

autocorrelacion de la entrada”.

[𝑟𝑖𝑗] = [𝑟1,1 𝑟1,2

𝑟2,1 𝑟2,2]

[rij] =Sxi xj

SxiSxj

r1,2 =

Sx1 x2Sx1Sx2

=134.11

12.90∗11.04

r1,1 =

Sx1 x1Sx1Sx1

=Sx12

Sx12 =1

r2,2 =

Sx2 x2Sx2Sx2

=Sx22

Sx22 =1

r2.1 =

Sx1 x2Sx1Sx2

=134.11

12.90∗11.04

Existe una dependencia lineal positiva entre estas dos variables lo podemos

colaborar en la figura resuelta anterior lo que no da a conocer una pendiente lineal.

Page 61: Cuaderno Digital - Gustavo Castro

54

Tipos de Muestreo

1.- Muestreo aleatorio simple (MAS)

2.- Muestreo sistemático

3.- Muestreo estratificado

4.- Muestreo por conglomerado

Muestreo Aleatorio Simple (Mas)

MÁS tabla de números aleatorios

RAM # (0-1)

A B C

50 45 60

20 5 5

155 50%

El muestreo aleatorio simple es el más común y el más recomendado a utilizar este

consiste.

Nivel de Confianza

El nivel de confianza en una encuesta a realizarse, es la que nos permite determinar

un grado exacto de confiabilidad en nuestra investigación a realizar, es de gran

utilidad para determinar el nivel mínimo o máximo de perdida de información.

Freedman, D. (1993) “El nivel de confianza del 95% nos informa sobre el

proceso de muestreo. Lo primero que hay que darse cuenta es que el intervalo de

confianza depende de la muestra. Si la muestra hubiese sido diferente, el intervalo

de confianza también sería diferente”.

Walpole, R. (1999) “El nivel de confianza se indica por 1-α y habitualmente se

da en porcentaje (1-α) %. Hablamos de nivel de confianza y no de probabilidad (la

probabilidad implica eventos aleatorios) ya que una vez extraída la muestra, el

intervalo de confianza estará definido al igual que la media poblacional”.

Rial, A. Valera, J. (2014) “El nivel de confianza (1-∞) es la probabilidad de

que el intervalo que hemos creado incluye dentro de si el valor del parámetro

poblacional”.

Page 62: Cuaderno Digital - Gustavo Castro

55

Formula

𝑛 =𝑍2𝑎/2𝑃𝑄𝑁

𝐸2(𝑁−1)+𝑍2𝑃𝑄

n= tamaño necesario de la muestra

Z= margen de error

P= probabilidad de que el evento ocurra

Q= probabilidad de que el evento NO ocurra

E= error de estimacion

N= tamaño de la población

Ejemplo:

𝑛 =𝑍2𝑎/2𝑃𝑄𝑁

𝐸2(𝑁−1)+𝑍2𝑃𝑄

𝑛 =(1.96)2(0.25)43700

(0.05)2(4700−1)+(1.90)20.25 =

41969.48

110.15 = 380.82

𝑍2 = 𝑍20.05 − (1.96)2

𝐸2 = (0.05)2

𝑁 = 43700

𝑃𝑄 = 0.25

Martin. F, (2011) “El muestreo aleatorio simple en sentido estricto se denomina

muestra aleatoria simple a la obtenida mediante el procedimiento de muestreo

aleatorio con reemplazamiento, a la unidad de muestreo independencia y

probabilidades iguales de pertenecer a la muestra”.

Spiegel, Murray, R. (2009) “En esta técnica, cada miembro de la población

tiene la misma probabilidad de ser seleccionado como sujeto. Todo el proceso de

toma de muestras se realiza en un paso, en donde cada sujeto es seleccionado

independientemente de los otros miembros de la población”.

Tamayo, M. Tamayo. (2004) “El elemento más común para obtener una

muestra representativa es la selección al azar aleatoria, es decir, que cada uno de los

individuos de una población tiene una misma posibilidad de ser elegido. Si no se

cumple este requisito se dice que la muestra es viciada, por lo que si cada uno de los

Page 63: Cuaderno Digital - Gustavo Castro

56

elementos de la población no tiene la misma posibilidad de ser elegido se habla

entonces se habla de una muestra viciada”.

Muestreo Sistemático

El muestreo sistemático este lo utilizamos cuando nuestra población es de gran

tamaño en este se elige un numero al azar de 1 a k.

Vivanco. M, (2005) “El muestreo sistemático es una variante del muestreo

simple. El procedimiento de selección es sistemático a partir de un elemento elegido

al azar que opera como arranque aleatorio para la selección automática del conjunto

de elemento que compone la muestra. El primer elemento seleccionado condiciona

los siguientes, que son elegidos a partir del arranque aleatorio y según su salto de

amplitud constante”.

Robert F. Drury (1979) “Muestreo Sistemático: La cantidad de trabajo

necesario para extraer una muestra simple al azar puede ser bastante considerable

cuando el número de unidades que hay que seleccionar es grande. Este tipo de

muestreo se denomina muestreo sistemático. No es exactamente igual al muestreo

simple al azar, pero es un método aceptable de muestreo ya que se conoce la

probabilidad de selección de cualquier elemento y se pueden calcular los errores de

muestreo”.

Devore, Jay L. (2008) “Es una técnica dentro de la categoría de muestreos

probabilísticos – y que por lo tanto requiere tener un control preciso del marco

muestral de individuos seleccionables junto con la probabilidad de que sean

seleccionados – consistente en escoger un individuo inicial de forma aleatoria entre

la población y, a continuación, seleccionar para la muestra a cada enésimo individuo

disponible en el marco muestral”.

Muestreo Estratificado

El muestreo estratificado este se divide en partes previa la que se va a estudiar aquí

utilizamos técnicas del muestreo sistemático.

Buckley, R. Cample, J, (2005) “Este método de muestreo es normalmente el

más eficiente para obtener una muestra que represente al total de la población”.

Page 64: Cuaderno Digital - Gustavo Castro

57

Elena Abascal, E. Ildefonso Grande, E. (2005) “El muestreo estratificado

se ha diseñado para reducir los errores muéstrales. Es adecuado cuando en la

población que se desea estudiar se pueden definir varios grupos o estratos sin

solapamientos de manera que el comportamiento respecto a la variable objeto del

estudio sea semejante en los componentes de un estrato”.

Larson, Harold, (1995) “Esta técnica, perteneciente a la familia de muestreos

probabilísticos, consiste en dividir toda la población objeto de estudio en diferentes

subgrupos o estratos disjuntos, de manera que un individuo sólo puede pertenecer

a un estrato. Una vez definidos los estratos, para crear la muestra se seleccionan

individuos empleando una técnica de muestreo cualquiera a cada uno de los estratos

por separado. Si por ejemplo empleamos muestreo aleatorio simple en cada estrato,

hablaremos de muestreo aleatorio estratificado (M.A.E. en adelante) ”.

Muestreo por Conglomerado

El muestreo por conglomeración este se usa cuando la población a estudiar está

dividida natural mente.

Contreras, (1995) “En el muestreo por conglomerados las unidades muéstrales

no son elementos individuales de la población, sino grupos de elementos. En el

muestreo por conglomerados se selecciona aleatoriamente una colección de

conglomerados. Se muestrean entonces todos los elementos individuales de todos

los conglomerados elegidos. A veces, es necesario elegir conglomerados dentro de

los conglomerados. Se dice entonces que se trata de un muestreo en etapas

múltiples”.

Gabin. M, (2005) “El muestreo por conglomerados se divide a la población en

grupos y luego se selecciona una muestra aleatoria de estos grupos”.

Quintana, C. (1996) “El muestreo por conglomeración es opuesto al muestreo

estratificado en sentido de que primero se seleccionan al azar grupos o

conglomerados de elementos de la población y luego se toman todos los elementos

de cada conglomerado para constituir la muestra global”.

Page 65: Cuaderno Digital - Gustavo Castro

58

SEGUNDO PARCIAL

Page 66: Cuaderno Digital - Gustavo Castro

59

Técnicas de conteo

Cuando el número de posibles resultados de un experimento es finito, su espacio

muestral es finito y su cardinal es un número natural. Pero si el experimento es

combinado, el cardinal puede ser tan grande, que sería del todo absurdo pretender

enumerarlos todos, por ser un proceso lento y tedioso.

(Ximena Anadrade, 2008) “Sea un experimento que se tiene que realizar en K

diferentes etapas, cada una se puede hacer de 𝑛𝑖 formas distintas, entonces el

experimento completo se lo puede hacer sin ningún reparo”.

(Carlos Siguencia , 2004) “Suponga que se encuentra al final de una línea de

ensamble final de un producto y que un supervisor le ordena contar los elementos

de un lote que se ha manufacturado hace unas horas y del que se desconoce el

número de productos que lo constituyen, de inmediato usted empezará a contar un

producto tras otro y al final informará al supervisor que son, 48, 54 u otro número

cualquiera”.

(Gustavo Rocha Beltran, 2004) “cuando el número de posibles resultados de

un experimento es fi nito, su espacio muestral es fi nito y su cardinal es un número

natural. Si el experimento es simple, el espacio muestral es unidimensional,

constituido por puntos muéstrales con una sola componente, y el cardinal es

simplemente el número de posibles resultados del experimento, los que se pueden

enumerar fácilmente.”

Ejercicio

Se tiene un ánfora con 7 canicas negras, 2 rojas y 3 amarillas.

1- ¿De cuantas formas se pueden extraer las 3 canicas?

𝑪𝟑𝟏𝟐

𝟏𝟐!

𝟑!(𝟏𝟐−𝟑)! =

𝟏𝟐𝒙𝟏𝟏𝒙𝟏𝟎𝒙𝟗!

𝟑!𝟗!

𝑪𝟑𝟏𝟐 = 𝟐𝟐𝟎

2- ¿De cuantas formas se pueden sacar 3 canicas negras?

𝑪𝟑𝟕

𝟕!

𝟑! (𝟕 − 𝟑)!= 𝟑𝟓

Page 67: Cuaderno Digital - Gustavo Castro

60

3- ¿De cuantas formas se pueden sacar 2 canicas negras y 2 amarillas?

𝑪𝟐𝟕 + 𝑪𝟐

𝟑

(𝟕

𝟐) + (

𝟑

𝟐) =

𝟕!

𝟐! (𝟕 − 𝟐)!+

𝟑!

𝟐! (𝟑 − 𝟐)!= 𝟐𝟒

4- ¿De cuantas formas se pueden sacar 1 canica de cada color?

𝑪𝟏𝟕 + 𝑪𝟏

𝟐 + 𝑪𝟏𝟑

(𝟕

𝟏) + (

𝟐

𝟏) + (

𝟑

𝟏) =

𝟕!

𝟏! (𝟕 − 𝟏)!+

𝟐!

𝟏! (𝟐 − 𝟏)!+

𝟑!

𝟏! (𝟑 − 𝟏)!= 𝟏𝟐

Si un elemento consiste en lanzar 3 monedas y observar que lados salen, liste

los elementos del conjunto Ω.

𝟐𝟑 = 𝟖

Ω = (𝑪, 𝑪, 𝑪); (𝑪, 𝑪, 𝑺); (𝑪, 𝑺, 𝑪); (𝑺, 𝑺, 𝑪); (𝑪, 𝑺, 𝑺); (𝑺, 𝑪, 𝑺); (𝑺, 𝑪, 𝑪); (𝑺, 𝑺, 𝑺)

Un experimento consiste en lanzar de datos, identifique el conjunto Ω

𝟐𝟔 = 𝟑𝟔

1 2 3 4 5 6

1 (1,1) (1,2) (1,3) (1,4) (1,5) (1,6)

2 (2,1) (2,2) (2,3) (2,4) (2,5) (2,6)

Ω = 3 (3,1) (3,2) (3,3) (3,4) (3,5) (3,6)

4 (4,1) (4,2) (4,3) (4,4) (4,5) (4,6)

5 (5,1) (5,2) (5,3) (5,4) (5,4) (5,6)

6 (6,1) (6,2) (6,3) (6,4) (6,5) (6,6)

Regla Multiplicativa

Si en un experimento pueden ocurrir los eventos A y B, entonces

P(A ∩ B) = P(A)P(B|A), dado que P(A)>0.

Así la probabilidad de que ocurran A y B es igual a la probabilidad de que ocurra A

multiplicada por la probabilidad condicional de que ocurra B, dado que ocurre A.

Page 68: Cuaderno Digital - Gustavo Castro

61

Como los eventos A ∩ B y B ∩ a son equivalentes, del teorema anterior se sigue que

también podemos escribir.

Jorge Larrea (2009) “Si un conjunto A tiene m elementos y un

conjunto B posee n elementos y formamos parejas de elementos elegidos de los

conjuntos A y B en el orden indicado, tendremos (m) (n) parejas posibles”.

Pedro Giménez (2006) “Principio de multiplicación Si un procedimiento puede

efectuarse de n formas distintas y un segundo procedimiento puede realizarse de m

formas diferentes, entonces el total de formas en que puede efectuarse el primer

procedimiento seguido del segundo es el producto n · m”.

Carlos Torres (2012) “Regla de multiplicación. Si una operación se puede llevar

a cabo en n1 formas, y si para cada una de Éstas se puede realizar una segunda

operación en n2 formas, entonces las dos operaciones se pueden ejecutar juntas

n1n2 formas”.

Combinaciones

Una combinación es un arreglo donde el orden NO es importante. La notación para

las combinaciones es C(n,r) que es la cantidad de combinaciones de “n” elementos

seleccionados, “r” a la vez. Es igual a la cantidad de permutaciones de “n” elementos

tomados “r” a la vez dividido por “r” factorial. Esto sería P(n,r)/r! en notación

matemática.

M.C. Pérez, F. (2012) “Combinaciones. En ocasiones nos interesa el número de

formas de seleccionar r objetos de n sin importar el orden. Estas selecciones se

llaman combinaciones”.

Rincón, L. (2006) “Ahora que no nos interesa el orden, observamos que cada

uno de los arreglos de la formula anterior, ¡está siendo contado k! veces, las veces

en que los mismos k elementos pueden ser permutados unos con otros, siendo que

el conjunto de elementos es el mismo. Para obtener arreglos en donde el orden no

importa, debemos entonces dividir por k!. La fórmula a la que hemos llegado se

llama combinaciones de n en k”.

Page 69: Cuaderno Digital - Gustavo Castro

62

Suarez, M. (2012) “COMBINACIONES En muchas situaciones no interesa el

orden de los resultados, sino sólo el número de maneras en las que r objetos pueden

seleccionarse a partir de n cosas, sin consideración de orden. Si dos subconjuntos se

consideran iguales debido a que simplemente se han reordenado los mismos

elementos, entonces se trata de combinaciones”.

Permutaciones

Se llama permutaciones de m elementos (m = n) a las diferentes agrupaciones de

esos m elementos de forma que Sí entran todos los elementos. Sí importa el orden.

No se repiten los elementos.

M.C. Ramírez, F. (2012) “Permutaciones. Algunas ocasiones nos interesa

encontrar un espacio muestral que contiene como elementos a todas las posibles

ordenaciones o arreglos de un grupo de objetos. Por ejemplo, podemos querer saber

cuántos arreglos diferentes son posibles para sentar a 5 personas alrededor de una

mesa los diferentes arreglos se llaman permutaciones”.

Sandoval, L. (2006) “La pregunta básica acerca del total de formas en que

podemos poner en orden lineal (uno detrás de otro y por lo tanto no hay repetición)

n objetos distintos tiene como respuesta la factorial de n, ¡denotado por n! y definido

como sigue: n! = n(n − 1)(n − 2)· · · 3 · 2 · 1. A este número también se le conoce como

las permutaciones de n objetos y se usa la notación P(n) = n!. ¡Adicionalmente y por

conveniencia se define 0! = 1”.

Patiño, R. (2002) “Es todo arreglo de elementos en donde nos interesa el lugar

o posición que ocupa uno de los elementos que construye dicho arreglo.

Si se seleccionan r objetos de un conjunto de n objetos distintos, cualquier arreglo

(orden) de estos objetos se conoce como permutación”.

Experimento Estadístico y Espacio Muestral

Experimento

Se puede considerar un experimento a toda forma de evento de laboratorio o que no

está ligada al mismo siempre y cuando se base ciertas condiciones específicas, para

poder obtener un resultado de icho experimento el cual pude ser variado.

Page 70: Cuaderno Digital - Gustavo Castro

63

Chipa, J. (2015) “Al hablar de experimentos se hace de la manera más amplia

posible, es decir, no sólo incluyen hechos asociados a situaciones experimentales en

un laboratorio, sino también se contemplan cualesquiera otras situaciones que den

origen a sucesos de interés”.

Luceño, A. González, J. (2006) “Decimos que un experimento es aleatorio

cuando al realizarse bajo condiciones específicas existe más de un posible resultado

del experimento, se conoce de antemano cuales son todos los posibles resultados,

en cada realización del experimento, se conoce el resultado concreto que ocurrirá

entre todos los posibles”.

Ministerio de educación, cultura y deporte (2003) “Experimento

designa todo acto que proporciona datos. El adjetivo aleatorio conduce a aquellos

actos cuyos resultados son imprescindibles, frente a los deterministas cuyos

resultados siempre serán los mismos”.

Espacio Muestral del Experimento

Se considera todo espacio de donde todos los resultados posibles de una muestra de

nuestro experimento se pueden dar, de manera independiente de las otras.

Chipia. J, (2005) “De un experimento aleatorio, es el conjunto de todos los

posibles resultados al realizar el experimento”.

Pinilla. V. (2009) “Espacio Muestral. Es el conjunto de todos los posibles

resultados de un experimento; constituye el conjunto universal de todas las

observaciones. Se suele denotar por la letra S”.

Juarez. A, Inzunsa. S, (2009) “El espacio muestral es el conjunto de todos los

posibles resultados de un experimento aleatorio. El número de elementos del

espacio muestral, constituye el total de resultados posibles que tiene el

experimento”.

Page 71: Cuaderno Digital - Gustavo Castro

64

Eventos

Son sucesos que conlleva el experimento tratado el cual se puede dar en un

experimento aleatorio, quiere decir que no se puede predecir lo que realmente

puede suceder con os elementos de nuestro conjunto.

Carlos Andrade, (2008) “Un Evento es un resultado particular de un

experimento aleatorio. En términos de conjuntos, un evento es un subconjunto del

espacio muestral. Por lo general se le representa por las primeras letras del

alfabeto”.

Rafael Díaz, (2004) “En la [teoría de la probabilidad], un evento o suceso es un

subconjunto de un espacio muestral, es decir, un conjunto de posibles resultados

que se pueden dar en un experimento aleatorio. Son aquellos hechos en los que no

se sabe con certeza lo que va a suceder, dependen del azar y no se puede determinar

sus resultados aun repitiéndolo en varias ocasiones “.

Rodolfo Vaqurizo, (2013) “Un evento es un subconjunto del espacio muestral

de un experimento aleatorio. Los eventos normalmente se denotan con las letras

mayúsculas A, B, C; y tienen la característica de ser subconjuntos de S ((A, B, C) Ì S)“.

Muestro con Reposición y Muestreo sin Reposición

Se pude considerar al igual que el muestreo simple donde nos indica que cada

elemento tiene la misma posibilidad de elegid, dando así una independencia ala cada

objeto escogido entre nuestros conjuntos experimentales.

Kai Lai Chung (1983) ” El muestreo con reposición se extraen sucesivamente

y es denominado muestreo aleatorio simple, que se caracteriza porque: cada

elemento del universo tiene la misma probabilidad de ser elegido, y las

observaciones se realizan con reemplazamiento. De este modo, cada observación es

realizada sobre el mismo universo (no disminuye con las extracciones sucesivas).y

se garantiza la independencia entre las unidades seleccionadas que representa cada

extracción.”

Page 72: Cuaderno Digital - Gustavo Castro

65

Ernesto Camaño, (2001) “Este muestreo nos indica que siempre que se

extraiga un elemento de nuestro conjunto el mismo no será devuelto o no se lo

repondrá a diferencias del muestreo con reposición donde sí se devuelve el

elemento tomado, dando por conclusión que cada elemento de nuestro conjunto

tiene la posibilidad de ser escogido sola una vez.

El muestreo sin reposición. Es cada vez que se hace una extracción, es decir que la

unidad seleccionada no se devuelve al universo. Por lo tanto, no se permite que una

misma unidad sea seleccionada más de una vez. Esto hace variar la probabilidad de

obtener una determinada muestra: La regla fundamental no es directamente

aplicable, pero el razonamiento de descomposición funciona como el caso anterior

dando el resultado”.

Michael J. (2004) “La distribución hipergeometrica se aplica en todo contexto

que implique un muestreo sin reposición de un conjunto finito de N, y cuando cada

elemento del conjunto tenga o no una determinada característica. Si se remplaza la

bola seleccionada antes de procesar la extracción de la siguiente bola, realizando un

muestreo con reposición, resulta evidente que el número de bolas obtenidas en n,

extracciones seguidas de una distribución binomial”.

Ejercicios

Si un experimento consiste en lanzar un dado y observar en número que

queda en la cara superior del mismo.

Ω = 1,2,3,4,5,6

E1 = Que salga el número 1 P(E1) =1

6

E2 = Que salga el número 2 P(E2) =1

6

E3 = Que salga un número par P(E3) =3

6=

1

2

Si un experimento consiste en lanzar tres monedas y observar que lados salen

23 = 8

Ω = (𝐶, 𝐶, 𝐶); (𝐶, 𝐶, 𝑆); (𝐶, 𝑆, 𝐶); (𝑆, 𝑆, 𝐶); (𝐶, 𝑆, 𝑆); (𝑆, 𝐶, 𝑆); (𝑆, 𝐶, 𝐶); (𝑆, 𝑆, 𝑆)

Page 73: Cuaderno Digital - Gustavo Castro

66

𝐸1 = 𝑄𝑢𝑒 𝑡𝑟𝑒𝑠 𝑚𝑜𝑛𝑒𝑑𝑎𝑠 𝑠𝑎𝑙𝑔𝑎𝑛 𝑐𝑎𝑟𝑎 𝑃(𝐸1) =1

8

𝐸2 = 𝑄𝑢𝑒 𝑠𝑎𝑙𝑔𝑎 𝑐𝑎𝑟𝑎 𝑝𝑜𝑟 𝑙𝑜 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛𝑎 𝑚𝑜𝑛𝑒𝑑𝑎 𝑃(𝐸2) =7

8

𝐸3 = 𝑄𝑢𝑒 𝑠𝑎𝑙𝑔𝑎 𝑐𝑢𝑎𝑛𝑑𝑜 𝑚á𝑠 𝑒𝑛 𝑢𝑛𝑎 𝑚𝑜𝑛𝑒𝑑𝑎 𝑐𝑎𝑟𝑎 𝑃(𝐸3) =4

8=

1

2

Si un experimento consiste sacar 5 cartas de un mazo de 52 cartas.

𝐸1 = 𝑄𝑢𝑒 𝑠𝑎𝑙𝑔𝑎𝑛 4 𝑎𝑠𝑒𝑠

𝑃(𝐸1) =(

44) (

481 )

(525

) =

(4!

4! 0!) (48!

1! 47!)

(52!

5! 47!)

= 0,0000185

𝐸2 = 𝑄𝑢𝑒 𝑠𝑎𝑙𝑔𝑎𝑛 3 𝑎𝑠𝑒𝑠 𝑦 2 𝑗𝑜𝑡𝑎𝑠

𝑃(𝐸2) =(

43) (

42) (

440 )

(525

) =

(4!

3! 1!) (4!

2! 2!) (44!

0! 44!)

(52!

5! 47!)

= 0,00000923

𝐸3 = 𝑆𝑎𝑙𝑔𝑎𝑛 5 𝑐𝑎𝑟𝑡𝑎𝑠 𝑑𝑒 𝑐𝑜𝑟𝑎𝑧𝑜𝑛 𝑛𝑒𝑔𝑟𝑜

𝑃(𝐸3) =(

135

) (390 )

(525

) =

(13!

5! 8!) (

39!0! 39!)

(52!

5! 47!)

= 0,000495

Se tiene un grupo de 12 estudiantes de los cuales 5 son de la Espol, 4 de la

católica, y dos restantes de la UG. Se eligen al azar 4 estudiantes de este grupo.

𝐸1 = 𝑄𝑢𝑒 4 𝑠𝑒𝑎𝑛 𝑑𝑒 𝑙𝑎 𝐸𝑠𝑝𝑜𝑙

𝑃(𝐸1) =(

54) (

70)

(124 )

= (

5!4! 1!) (

7!0! 7!)

(12!

4! 8!) = 0,010

𝐸2 = 𝑄𝑢𝑒 4 𝑠𝑒𝑎𝑛 𝑈𝐺.

𝑃(𝐸2) = Ø

Page 74: Cuaderno Digital - Gustavo Castro

67

𝐸3 = 𝑄𝑢𝑒 𝑐𝑢𝑎𝑛𝑑𝑜 𝑚á𝑠 𝑠𝑒𝑎 3 𝑑𝑒 𝑙𝑎 𝐸𝑠𝑝𝑜𝑙

𝑃(𝐸3) = 1 − 𝑃(𝐸𝐶)

𝑃(𝐸𝐶) =(

54) (

70)

(124 )

= (

5!4! 1!) (

7!0! 7!)

(12!

4! 8!) = 0,01

𝑃(𝐸3) = 1-0.01 = 0,99

En un grupo de 15 personas: 7 leen la revista A; 5 leen la revista B y 6 ninguna

revista. Encuentre la probabilidad que al elegir al azar una persona, esta lea al

menos 1 revista.

Representación Gráfica

15 Personas

A 𝑨𝑪 TOTAL B 0.2 0.13 0.33

𝑩𝑪 0.27 0.4 0.67 TOTAL 0.47 0.53 1

Lean A 4 Lean B 2 Lean A y B 3 9 = P(E) = 0.6

Page 75: Cuaderno Digital - Gustavo Castro

68

Si la Probabilidad que Juan valla al estadio, al cine o a estudiar son

respectivamente, 0.3, 0.2, 0.4. ¿Cuál es la probabilidad de que no haya algunas

de estas 3 actividades?

P (AuBuC)𝐶 = (0.3 + 0.2 +0.4) =0.9

1-0.9 = 0.1

P(E)= 0.1

Ley De Complemento

Esta ley nos indica que parada conjunto sean estos A y B el complemento entre ellos

será lo que esta fuera de estos conjuntos es decir lo que esta fuera de nuestro espacio

muestral.

Vilma Morales, (2010) “Dado un evento A, el complemento de A se define como

el evento formado por todos los puntos muéstrales que no están en A. El

complemento de A se representa con AC, conocido con Diagrama de Venn que ilustra

el concepto de un complemento“.

Leonardo Mendoza , (2012) “Sea A un evento definido sobre el espacio

muestral (Ω, δ) y AC su complemento entonces la probabilidad de AC=1-P(A). “

Ramon Macias , (2008) “Otra propiedad que se deriva de las anteriores es

cuando se busca la probabilidad del complemento de un evento E, que denotaremos

como ~E: Si E es un evento y ~E su complemento, entonces P(~E) = 1 − P(E)“.

Ley Aditivo De Probabilidad

Cuando hablamos de adictivo nos referimos que un evento se adhiere a otro, pero

esto no quiere decir que los dos eventos pueden ser elegidos al mismo tiempo, aquí

podemos aplicar la suma de los eventos considerados en nuestro experimento.

Scientia & Technica (2009) “La ley aditiva de la probabilidad simplifican el

cálculo de probabilidades, la primera, denominada regla aditiva, se aplica a uniones

de 2 ó más eventos. La ley aditiva o regla de la suma para eventos mutuamente

excluyentes o desarticulados, es decir, que no pueden suceder al mismo tiempo y

Page 76: Cuaderno Digital - Gustavo Castro

69

que no tienen puntos en común, se aplica sumando las probabilidades de los eventos

considerados”.

Kolobar aritmetičnih, (2002)“Sean A y B dos eventos no excluyentes, X E

, para cualesquiera dos elementos x e y en el dominio. Así, por ejemplo, cualquier

transformación lineal es aditiva. Cuando el dominio son los números reales, esta

función corresponde a la ecuación funcional de Cauchy “.

Guillermo Mendoza, (2004) “Para dos eventos E y F, la suma E+F representa

la unión de E y F, y EF representa su intersección. Los eventos E y F son mutuamente

excluyentes si no se intersecan, es decir, si la ocurrencia de un evento prohíbe la

ocurrencia del otro”.

Probabilidad Condicional

Las variables de nuestro conjunto se encuentran condicionadas, porque nos hace

referir que para que suceda un evento en el segundo conjunto debemos saber que

paso en el conjunto anterior, no puede suceder nada en el segundo conjunto si es

que no ha pasado algo en el primero ya que están sujetos a condiciones de

anticipación de los eventos.

Montes. F, (2007) “La probabilidad condicional se refiere a que un evento B

ocurra, cuando ya se sabe que ha ocurrido un evento A, este se llama probabilidad

condicional y se denota por P(B/A). el símbolo que se denota por lo general y se lee

la probabilidad de que ocurra B dado que ocurrió A o simplemente la probabilidad

de B, dado A.”

Roberto Rodriguez, (2007) “No tiene por qué haber una relación causal o

temporal entre A y B. A puede preceder en el tiempo a B, sucederlo o pueden ocurrir

simultáneamente. A puede causar B, viceversa o pueden no tener relación causal.”

Gloria Rocío Bautista Mendoza, (2002) “La probabilidad de que un

evento B ocurra cuando se sabe que ya ocurrió un evento A se llama probabilidad

condicional y se denota por P(B/A) que por lo general se lee como probabilidad de

que "ocurra B dado que ocurrió A".

Page 77: Cuaderno Digital - Gustavo Castro

70

Ejercicio

Tenemos una encuesta de 120 personas las cuales se necesitan saber con

respeto a los hábitos de lectura

LE GUSTA LEER NO LE GUSTA LEER TOTAL

HOMBRE 40 20 60

MUJER 50 10 60

TOTAL 90 30 120

Se pide:

a) ¿Cuál es la probabilidad que sea mujer?

b) ¿Cuál es la probabilidad de que una persona elegida al azar le guste leer y

sea mujer?

c) ¿Cuál es la probabilidad que una persona elegida que le guste leer al azar

dado que es una mujer?

P (M) = 60

120= 0.5

P (L, M) = 50

120= 42

P (𝐿𝑀⁄ ) =

𝑃(𝐿∩𝑀)

𝑃(𝑀)=

0.42

0.5 = 0.84

En una empresa hay 200 empleados, de los cuales 150 son graduados. 60

empleados realizan trabajo de administración. De estos últimos, 40 son

graduados. Si se toma al azar un empleado, encuentre la probabilidad que:

a) Sea graduado y no realiza trabajo de administración.

b) Sea graduado dado que no realiza trabajo de administración.

c) No sea graduado dado que realiza trabajo de administración.

SON DE ADMINISTRACIÓN

NO SON DE ADMINISTRACIÓN

TOTAL

GRADUADO 40 110 150

NO GRADUADO 20 30 50

TOTAL 60 140 200

Page 78: Cuaderno Digital - Gustavo Castro

71

P (G∩NA) = 𝟏𝟏𝟎

𝟐𝟎𝟎= 𝟎. 𝟓𝟓

P (𝑮𝑵𝑨⁄ ) =

𝟎.𝟓𝟓

𝟎.𝟕𝟎= 𝟎. 𝟕𝟗 ; 𝐏 (𝐍𝐀) =

𝟏𝟒𝟎

𝟐𝟎𝟎= 𝟎. 𝟕

P (𝑵𝑮𝑨⁄ ) =

𝟎.𝟏

𝟎.𝟑= 𝟎. 𝟑𝟑 ; 𝐏 (𝐍𝐀 ∩ 𝐀) =

𝟐𝟎

𝟐𝟎𝟎= 𝟎. 𝟏 ; 𝐏 (𝐀) =

𝟔𝟎

𝟐𝟎𝟎= 𝟎. 𝟑

Eventos Independientes

Un evento es independiente de otro, ya que en cada experimento no se dependerá

de que suceda del otro así que se puede realizar un número indeterminado de

experimentos y cada uno de ellos sus valores o sucesos dependerán de ellos mismos.

Clara Merchan, (2009) “Los eventos independientes pueden incluir la

repetición de una acción como lanzar un dado más de una vez, o usar dos

elementos aleatorios diferentes, como lanzar una moneda y girar una ruleta.

Muchas otras situaciones también pueden incluir eventos independientes. Para

calcular correctamente las probabilidades, necesitamos saber si un evento influye

en el resultado de otros eventos”.

Alexis Requena, (2007) “Dos o más eventos son independientes cuando la

ocurrencia o no-ocurrencia de un evento no tiene efecto sobre la probabilidad de

ocurrencia del otro evento (o eventos). Un caso típico de eventos independiente es

el muestreo con reposición, es decir, una vez tomada la muestra se regresa de nuevo

a la población donde se obtuvo”.

Alejandro Neira, (2009)“Dos eventos son independientes si el resultado del

segundo evento no es afectado por el resultado del primer evento. Si A y B son

eventos independientes, la probabilidad de que ambos eventos ocurran es el

producto de las probabilidades de los eventos individuales”.

Sistemas Exhaustos Y Excluyentes

Se considera a estos eventos la unión de varios eventos anteriormente planteados,

a los cuales la unión de todos ellos nos dará como resultado el espacio muestral, que

se necesitaran para realizar un experimento más detallado y con mayor

profundidad.

Page 79: Cuaderno Digital - Gustavo Castro

72

M.C. Guardado France, (2014)“Los teoremas que restan nos dicen como calcular las

probabilidades de sucesos cuando tenemos que el suceso seguro está descompuesto

en una serie de sucesos incompatibles de los que conocemos su probabilidad. Para

ello necesitamos introducir un nuevo concepto”.

Santiago Montesdeoca, (2001)“Se trata de una colección de sucesos A1, A2, A3, A4 ….

Tales que la unión de todos ellos forman el espacio muestral, y sus intersecciones

son disjuntas. Todo suceso B, puede ser descompuesto en componentes de dicho

sistema”.

Eduardo Véliz, (2004)“Eventos independientes son aquellos que no afectan en el

resultado del otro. Cumplen la propiedad: P(AB) = P(A)P(B)”.

Ejercicios

En una fábrica se tiene 4 líneas de producción, la línea 1 produce el 40% de los

artículos, la line 2 el 25% y la línea 3 el 15%. Se sabe que la probabilidad de

que un artículo producido en la línea 1 presenta defecto es de 0.02; las

probabilidades de que los artículos presentan defectos cuando fueron

producidos en las líneas 2,3 o 4 son 0.04; 0.08; 0.05 respectivamente.

¿Cuál es la probabilidad de que un artículo elegido al azar presente defectos?

𝐸1 = 0.4

𝐸2 = 0.25

𝐸3 = 0.15

L1

40%

L2

25%

L3 25%

L4 20%

Page 80: Cuaderno Digital - Gustavo Castro

73

𝐸4 = 0.2

A= Artículos Aprobados

P(𝐴𝐸1

⁄ ) = 0.02

P(𝐴𝐸2

⁄ ) = 0.04

P(𝐴𝐸3

⁄ ) = 0.08

P(𝐴𝐸4

⁄ ) = 0.05

P (A) = P(𝐸1 ) 𝑥 P (𝐴𝐸1

⁄ ) + P(𝐸2 ) 𝑥 P (𝐴𝐸2

⁄ ) + P(𝐸3 ) 𝑥 P (𝐴𝐸3

⁄ ) +

P(𝐸4 ) 𝑥 P (𝐴𝐸4

⁄ )

P (A) = 0.4 x 0.02 + 0.25 x 0.04 + 0.15 x 0.08 + 0.2 x 0.05

P (A) = 0.04

Si el artículo elegido presenta efectos ¿Cuál es la probabilidad que se haya

producido en la línea 3?

P(𝐸3

𝐴⁄ ) =𝑃(𝐴∩𝐸3)

𝑃 (𝐴)

P(𝐴 ∩ 𝐸3) = (0.15 𝑥 0.08)

P(𝐸3

𝐴⁄ ) =0.012

0.04= 0.3

En una fábrica se tiene 4 líneas de producción, la línea 1 produce el 40% de los

artículos, la line 2 el 25% y la línea 3 el 15%. Se sabe que la probabilidad de

que un artículo producido en la línea 1 presenta defecto es de 0.02; las

probabilidades de que los artículos presentan defectos cuando fueron

producidos en las líneas 2,3 o 4 son 0.04; 0.08; 0.05 respectivamente.

¿Cuál es la probabilidad de que un artículo elegido al azar presente defectos?

Page 81: Cuaderno Digital - Gustavo Castro

74

𝐸1 = 0.4

𝐸2 = 0.25

𝐸3 = 0.15

𝐸4 = 0.2

A= Artículos Aprobados

P(𝐴𝐸1

⁄ ) = 0.02

P(𝐴𝐸2

⁄ ) = 0.04

P(𝐴𝐸3

⁄ ) = 0.08

P(𝐴𝐸4

⁄ ) = 0.05

P (A) = P(𝐸1 ) 𝑥 P (𝐴𝐸1

⁄ ) + P(𝐸2 ) 𝑥 P (𝐴𝐸2

⁄ ) + P(𝐸3 ) 𝑥 P (𝐴𝐸3

⁄ ) +

P(𝐸4 ) 𝑥 P (𝐴𝐸4

⁄ )

P (A) = 0.4 x 0.02 + 0.25 x 0.04 + 0.15 x 0.08 + 0.2 x 0.05

P (A) = 0.04

Si el artículo elegido presenta efectos ¿Cuál es la probabilidad que se haya

producido en la línea 3?

P(𝐸3

𝐴⁄ ) =𝑃(𝐴∩𝐸3)

𝑃 (𝐴)

Page 82: Cuaderno Digital - Gustavo Castro

75

P(𝐴 ∩ 𝐸3) = (0.15 𝑥 0.08)

P(𝐸3

𝐴⁄ ) =0.012

0.04= 0.3

En un a aula el 70 % de los alumnos son mujeres. De ellas el 10 % son

fumadoras. De los varones, son fumadores el 20 %. ¿Qué porcentaje de

fumadores hay en total?

Mujeres = 0.7

Hombres = 0.3

P(𝐹𝑀⁄ ) = 0.1

P(𝐹𝐻⁄ ) = 0.2

P (F) = P(𝑀 ) 𝑥 P(𝐹𝑀⁄ ) + P(𝐻 ) 𝑥 P(𝐹

𝐻⁄ )

P (F) = 0.7 x 0.1 + 0,3 x 0.2

P (F) = 0.13

Page 83: Cuaderno Digital - Gustavo Castro

76

Sucesos

Sucesos son considerados como las posibles relaciones que podemos establecer

entre las mismas, estos sucesos pueden contener una infinidad de sucesos ligados a

un suceso principal como también no se puede encontrar ningún suceso en el miso.

Alejandro Sanchez , (2002) “Al definir los sucesos hablamos de las diferentes

relaciones que pueden guardar dos sucesos entre sí, así como de las posibles

relaciones que se pueden establecer entre los mismos. Vamos a ver ahora cómo se

refleja esto en el cálculo de probabilidades”.

Juan Miguel Marín Diazaraque, (2014) “Por supuesto los sucesos son más

generales que los elementales, ya que son conjuntos que pueden contener no a uno

sólo, sino a una infinidad de sucesos elementales (y también no contener ninguno)”.

Jorge Rendon Aviles , (1999) “Suceso de un fenómeno o experimento

aleatorio es cada uno de los subconjuntos del espacio muestral E. Todos estos

subconjuntos del espacio muestral E los llamamos sucesos”.

Eventos Mutuamente Excluyentes

Para este tipo de eventos son podemos referir que son excluyentes, porque al

realizar un experimento tenemos las posibilidades de que una opción salga y la otra

no, ya que no se puede representar las dos opciones al mismo tiempo es la una o es

la otra, pero no las dos.

Obagi. J, (2003) “La unión de eventos cualquiera puede expresar como la unión

de varios eventos mutuamente excluyentes, basándose en su repaso de la teoría de

conjuntos que compruebe la anterior afirmación”.

Richard I. Levin, David S. Rubin (2004) ”Se dice que los eventos son

mutuamente excluyente si uno de ellos puede tener lugar a un tiempo, que de una

manera parecida, usted puede pasar o reprobar una materia antes de que termine

el curso o desertar y no obtener calificaciones".

Page 84: Cuaderno Digital - Gustavo Castro

77

David M. Mark, L. Berenson, C .(2004) ”Son eventos excluyente al tirar una

moneda al aire, y pedir cara o cruz, el resultado no puede ser al mismo tiempo los

dos solo uno”.

Teorema De Bayes

Con bayes podemos deducir la probabilidad de que un suceso ocurra, porque

utilizamos probabilidades que anteriormente fueron analizadas con un suceso

inicial, solo cuando intervienen sucesos adicionales se deberá volver a realizar

cálculos en dicha probabilidad.

MC. Rita Luna Gandara, (2003)“A partir de que ha ocurrido el suceso B (ha

ocurrido un accidente) deducimos las probabilidades del suceso A (¿estaba

lloviendo o hacía buen tiempo?). El teorema de Bayes parte de una situación en la

que es posible conocer las probabilidades de que ocurran una serie de sucesos Ai”.

Mario Orlando Suárez Ibujes, (2005)“El teorema de Bayes se utiliza para

revisar probabilidades previamente calculadas cuando se posee nueva información.

Desarrollado por el reverendo Thomas Bayes en el siglo XVII, el teorema de Bayes

es una extensión de lo que ha aprendido hasta ahora acerca de la probabilidad

condicional.

Comúnmente se inicia un análisis de probabilidades con una asignación inicial,

probabilidad a priori. Cuando se tiene alguna información adicional se procede a

calcular las probabilidades revisadas o a posteriori”.

Eliseo Martínez H, (2003) “Supongamos que para un todo el posible resultado

de un fenómeno aleatorio, existen dos escenarios que son antagónicos y

complementarios. Es decir que puede ocurrir el escenario A, o el escenario

complementario Å, donde la unión de ambos cubre todos los posibles resultados.

Para ambos escenarios, tenemos definida una probabilidad, a saber, P(A) y P(Å)”.

Page 85: Cuaderno Digital - Gustavo Castro

78

Variables Aleatorias

Este tipo de variables toman valores ya sean reales como no reales y sirven para

medir algún experimento de forma aleatoria es decir sin importar el orden de la

muestra.

Peña Sánchez de Rivera, (2008) “Las variables aleatorias suelen tomar

valores reales, pero se pueden considerar valores aleatorios como valores lógicos,

funciones... El término elemento aleatorio se utiliza para englobar todo ese tipo de

conceptos relacionados. Un concepto relacionado es el de proceso estocástico, un

conjunto de variables aleatorias ordenadas (habitualmente por orden o tiempo)”.

Eduardo Manrique, (2011) “En probabilidad y estadística, una variable

aleatoria o variable estocástica es una variable estadística cuyos valores se obtienen

de mediciones en algún tipo de experimento aleatorio. Formalmente, una variable

aleatoria es una función, que asigna eventos a números reales”.

Estadística y Variables Aleatorias, (2006) “Una variable aleatoria es una

variable que toma valores numéricos determinados por el resultado de un

experimento aleatorio. No hay que confundir la variable aleatoria con sus posibles

valores”.

Distribución de una Variable Discreta

Este tipo de variables pueden medir sucesos concretos en los cuales el número de

veces que se repite dicho suceso tiene un valor significativo a la hora de hacer

nuestra representación experimental.

Héctor Chávez Velarde, (2001) “Diremos que una variable aleatoria es

discreta si su recorrido es finito o infinito numerable. Generalmente, este tipo de

variables van asociadas a experimentos en los cuales se cuenta el número de veces

que se ha presentado un suceso o donde el resultado es una puntuación concreta”.

Martínez Gómez, Mónica, (2004) “Se dice que hemos definido una variable

aleatoria para un experimento aleatoria cuando hemos asociado un valor numérico

a cada resultado del experimento. Existen varios tipos de variables aleatorias, una

variable aleatoria es discreta cuando solo puede tomar unos ciertos valores enteros

en un numero finito de valores o infinito numerable”.

Page 86: Cuaderno Digital - Gustavo Castro

79

Montero Alonso, (2004) “Es un modelo teórico que describe la forma en que

varían los resultados de un experimento aleatorio, es decir, nos da todas las

probabilidades de todos los posibles resultados que podrían obtenerse cuando se

realiza un experimento aleatorio. Se clasifican como discretas o continuas”.

Ejercicio

En un lote de 5 artículos, 3 son defectuosos y 2 son aceptables. Se toma una

muestra aleatoria sin remplazo de dos artículos. Encuentre la distribución de

la variable aleatoria, calidad de productos defectuosos que se obtiene en la

muestra.

Ω = a, b, c, d, e

a, b, c = artículos defectuosos.

d, e = artículo no defectuoso.

Ω = (a,b);(a,c);(a,d);(a,e);(b,c);(b,d);(b,e);(c,d);(c,e);(d,e)

ℓ (Valor Ω) x (Valor X) (a, b) (a, c) (a, d) (a, e) (a, c) (b, d) (b, e) (c, d) (c, e) (d, e)

2 2 1 1 2 1 1 1 1 0

X = Cantidad de artículos defectuosos.

P (X=0) + P(X=1) + P(X=2)

F(x) = Σ P(X=x) = 1

10+

6

10+

3

10= 1

P (X = 0) = 1

10

P (X = 1) = 6

10

P (X = 2) = 3

10

Page 87: Cuaderno Digital - Gustavo Castro

80

Regla De Correspondencia

Mide el proceso de vinculación que tiene el conjunto A con respecto al conjunto B,

esto quiere decir que para cada valor del elemento A existe un único valor en el

conjunto B no puede existir repetición en dichos sucesos.

Josseline Cardenas M, (2004) “Es el proceso que vincula a cada elemento de

un conjunto determinado con otro elemento único de otro conjunto determinado…

Donde dichos conjuntos pueden ser el de una función”.

Carloss Idrovo Alvarez, (2000)“Una regla de correspondencia consiste

en asignar un elemento único de un cierto conjunto a cada elemento único de

otro conjunto. Este concepto es de uso frecuente cuando se trabaja con funciones

matemáticas”.

Nayelli Manzanarez Gómez, (2009) “El Análisis de Correspondencias es una

técnica estadística que se utiliza para analizar, desde un punto de vista gráfico, las

relaciones de dependencia e independencia de un conjunto de variables categóricas

a partir de los datos de una tabla de contingencia”.

Función Acumulada

Esta distribución mide el grado de distribución que tiene un variable aleatoria

cualquiera, dando como resultado que solo puede tomar valores entre 0 y 1, estos

valores son fijos no puede tomar más de dicho valor.

Cecilia Rosas, (2009) “La función de distribución acumulada Fx de una V.A. X es

definida para cada número real x, La función de distribución acumulada únicamente

puede tomar valores entre cero y uno”.

Gutiérrez Martínez, (2004) “La función de distribución acumulada describe

el comportamiento probabilístico de una variable aleatoria X asociada a un

experimento aleatorio y se representan, Para estudiar la función de distribución

distinguiremos entre el caso discreto y el caso continuo”.

Gonzales Chávez, (2007) “Una función que ofrece la probabilidad total de

obtener un resultado de una variable aleatoria que varía desde el valor más bajo

posible para la variable aleatoria hasta cualquier valor específico de interés”.

Page 88: Cuaderno Digital - Gustavo Castro

81

Valores Esperados

Es valor que nos proporciona la realización de un experimento el cual será el

deseado y en el cual muchos profesionales se basan para tomar decisiones a la hora

de implementar un nuevo experimento.

Ángel Merizalde, (2012) “El valor esperado es un concepto fundamental en el

estudio de las distribuciones de probabilidad. Desde hace muchos años este

concepto ha sido Aplicado ampliamente en el negocio de seguros y en los últimos

veinte años ha Sido aplicado por otros profesionales que casi siempre toman

decisiones en Condiciones de incertidumbre”.

Blatt Frank J, (1992) “El valor que se espera obtener de un experimento

estadístico se llama el valor esperado. También llamado "esperanza matemática".

También lo llamamos "media" y esta es la palabra que vamos a seguir usando”.

Young Hugh D., (1968) “Cuando la variable aleatoria es discreta, la esperanza

es igual a la suma de la probabilidad de cada posible suceso aleatorio multiplicado

por el valor de dicho suceso. Por lo tanto, representa la cantidad media que se

"espera" como resultado de un experimento aleatorio cuando la probabilidad de

cada suceso se mantiene constante y el experimento se repite un elevado número de

veces.”

Varianza

Es una medida de dispersión con la cual se puede determinar el grado de cambio

que tendrá la muestra o el estudio estadístico y su valor se expresa elevado al

cuadrado.

Fisher R. A., (1919) “Está medida en unidades distintas de las de la variable. Por

ejemplo, si la variable mide una distancia en metros, la varianza se expresa en

metros al cuadrado. La desviación estándar es la raíz cuadrada de la varianza, es una

medida de dispersión alternativa expresada en las mismas unidades de los datos de

la variable objeto de estudio.

Ricard Boqué, Alicia Maroto, (1998) “Es una potente herramienta

estadística, de gran utilidad tanto en la industria, para el control de procesos, como

en el laboratorio de análisis, para el control de métodos analíticos.”

Page 89: Cuaderno Digital - Gustavo Castro

82

Milena Delgado, (1999) “La varianza puede interpretarse como un momento

de la distribución de probabilidad. La varianza de una variable aleatoria discreta”-

Experimento Binomial

Es la que se puede expresar matemáticamente que se utiliza en conjunto con la

variable aleatoria discreta cuando el número de resultados positivos de la muestra

es factible.

Moreno, Francis, (1993) “Cuando se dispone de una expresión matemática, es

factible calcular la probabilidad de ocurrencia exacta correspondiente a cualquier

resultado específico para la variable aleatoria. La distribución de probabilidad

binomial es uno de los modelos matemáticos (expresión matemática para

representar una variable) que se utiliza cuando la variable aleatoria discreta es el

número de éxitos en una muestra compuesta por n observaciones”.

Pablo Antonio Martín Álvarez, (2001) “Llamamos experiencia aleatoria

dicotómica a aquella que sólo puede tener dos posibles resultados A y A'.

Usualmente A recibe el nombre de éxito, además representaremos como p = p(A) y

q = 1-p=p(A')”.

Hamza K., (1995) “La distribución binomial es una distribución de

probabilidad discreta que cuenta el número de éxitos en una secuencia de n ensayos

de Bernoulli independientes entre sí, con una probabilidad fija p de ocurrencia del

éxito entre los ensayos. Un experimento de Bernoulli se caracteriza por ser

dicotómico, esto es, sólo son posibles dos resultados. A uno de estos se denomina

éxito y tiene una probabilidad de ocurrencia p y al otro, fracaso, con una

probabilidad q = 1 - p”.

Se sabe que la probabilidad de un artículo producido no cumple las

especificaciones es de 0.04, se observa 15 artes elegidos al azar.

¿Cuál es la probabilidad de que 3 de ellos, no cumplan las

especificaciones?

La probabilidad de que por lo menos 2 nos cumplen las especificaciones.

n= 15

Page 90: Cuaderno Digital - Gustavo Castro

83

q = 1-0.04 = 0.96

p=0.04

X= Tres nos cumplen con las especificaciones

P(X=3) = (𝟏𝟓𝟑

) 𝒑𝟑 𝒒𝟏𝟐

𝟏𝟓!

𝟑! (𝟏𝟓 − 𝟑)! (𝟎. 𝟎𝟒)𝟑 (𝟎. 𝟗𝟔)𝟏𝟐 = 𝟎. 𝟎𝟐

P (X ≥ 2) = 1-P (X<2)

1-P (X =0) + P(X<1)

P(X=0) = (𝟏𝟓𝟎

) (𝟎. 𝟎𝟒)𝟎 (𝟎. 𝟗𝟔)𝟏𝟓 = 𝟎. 𝟓𝟒𝟐𝟏

P(X=1) = (𝟏𝟓𝟏

) (𝟎. 𝟎𝟒)𝟏 (𝟎. 𝟗𝟔)𝟏𝟒 = 𝟎. 𝟑𝟑𝟖𝟖

Distribución Binomial Negativa

Es considera también distribución geométrica de la distribución binominal negativa,

donde se realizan repetidamente procesos experimentales en los cuales hemos

tenido un resultado desfavorable al requerido, también se dice que se realiza

independientemente cada experimento porque el uno no tiene nada que ver con el

otro.

White Harvey E, (1972) “Esta distribución puede considerarse como una

extensión o ampliación de la distribución geométrica. La distribución binomial

negativa es un modelo adecuado para tratar aquellos procesos en los que se repite

un determinado ensayo o prueba hasta conseguir un número determinado de

resultados favorables.”

Young Hugh D, (1968) “La distribución binomial negativa o distribución de

Pascal es una generalización de la distribución geométrica donde la variable

aleatoria X es el número de ensayos Bernoulli efectuados hasta que se tienen r

éxitos, con una probabilidad constante de éxito p”.

Weinberg Steven, (1977) “Se determina la definición de distribución binomial

negativa como extensión de la distribución geométrica, en donde se analizan varios

eventos antes de lograr un número determinado de éxitos”.

Page 91: Cuaderno Digital - Gustavo Castro

84

Ejercicios

La probabilidad de que un equipo funcione correctamente es de 0.97, se

prueban equipos hasta encontrar 3 que funcionen correctamente. ¿Cuál es la

probabilidad de que se necesiten 8 pruebas para lograr el objetivo?

P (X=8) = (8−33−1

) (0.97)3 (0.03)5

(7

2) (0.97)3 (0.03)5

7!

2! 5! (0.97)3 (0.03)5 = 0.0000004657

Distribución Geométrica

Podremos considerar que con esta distribución podemos realizar un experimento a

la vez, esto quiere decir que cada vez que realicemos un experimento y obtengamos

un resultado, al querer realizar otra vez el mismo proceso esta distribución no

guardara el resultado quiere decir que cada proceso será como uno nuevo con

respecto al primero también se la conoce como la distribución sin memoria.

Alonso. J, (2008) “la distribución geométrica es “sin memoria”. Esto significa que

si intentamos repetir el experimento hasta el primer éxito, entonces dado el primer

éxito todavía no ha ocurrido, la distribución de probabilidad condicional del número

de ensayo adicionales no dependen de cuantos fallos se hallan observado”.

ADS Quality, (2003) “también llamada distribución de pascal. Distribución de

probabilidad de una variable aleatoria definida, en el marco del proceso de

Bernouilli, como el número de unidades de un tipo que aparecen en un muestreo

antes de que aparezca la primera del otro tipo”.

Sánchez. P, (2006) “Supongamos u experimento aleatorio y consideremos en

relación con el suceso A de probabilidad p y sea Á el suceso contrario, cuya

probabilidad será q=1-p. se dice que obtener el suceso A se considera como un éxito,

y caso contrario, un fracaso”.

Page 92: Cuaderno Digital - Gustavo Castro

85

Ejercicio

Se sabe que la probabilidad de un artículo que falle durante un año de uso es

de 0.1, determine:

a) La probabilidad de que el séptimo articulo observado sea el segundo

que falle durante el primer año.

p= 0.1

q= (1- 0.1) = 0.9

r=2

x=7

X=que es séptimo articulo observado sea el segundo que falle durante el año.

P(X=7) = (7−12−1

) (0.1)2 (0.9)5 = 0.0354

b) Si se observa 10 de estos artículos elegido al azar ¿Cuál es la

probabilidad de que 4 fallan durante el primer año de uso?

n= 10

p=0.1

q=1-0.1=0.9

X= La probabilidad de que 4 fallen en el primer año de uso

X=4

P (X=4) = (104

) (0.1)4 (0.9)6 = 0.0112

Distribución Hipergeometrica

Este tipo de distribuciones se utilizan cuando el tamaño de experimento a realizar

supera en gran cantidad a cualquier otra, es primordial utilizarla solo en grandes

extensiones de información.

Page 93: Cuaderno Digital - Gustavo Castro

86

Griful. E, Canela, M. (2010) ”A la vista de los cálculos. El procedimiento

correcto en estos casos se utiliza la distribución hipergeometrica puesto que el

tamaño de lote es suficientemente grande”.

Prat, A (2005) ”La distribución de probabilidad de un modelo probabilístico

conocido como modelo hipergeometrica ya que muestra como las situaciones se

adapta conceptualmente es decir, que sería correcto basarnos en dicho modelo para

hacer las inferencias necesarias en los tres casos descritos”.

Mode, E. (1990) ”Supongamos que tenemos un universo finito de N objetos, cada

uno de los cuales pertenece a una de dos categorías mutuamente excluyentes,

llamadas “éxitos” y “fracasos”, y simbolizadas por 1 y 0, respectivamente

Supongamos que tenemos Np unos y Nq ceros con p+q=1”.

Ejercicio

Se tiene un grupo de 20 estudiante, 8 de los cuales son de la Universidad de

Guayaquil ¿Cuál es la probabilidad de que al dividir 4 estudiantes al azar sean

de la universidad de Guayaquil?

N= 20

a=8

n=4

X= 3 sean de la universidad de Guayaquil

X=3

P (X=3) = (8

3) (20−84−3 )

(204 )

= (8

3)(121 )

(204 )

(8!

3! 5!)(

12!

1! 19!)

(20!

4! 16!)

= 0.14

Función De Densidad Para Continuas

Este tipo de funciones pueden tomar valores infinitos, motivo por el cual pueden ser

representadas como curva por su grado de dificultad que puede tomar su cálculo al

tomar valores tan extensos.

Page 94: Cuaderno Digital - Gustavo Castro

87

Meza, J. (2010)”A diferencia de las variables aleatorias discretas, las variables

aleatorias continuas pueden adoptar infinitos valores en un intervalo. Esto complica

algo la matemática necesaria, pero por que no necesitaremos utilizar esta

matemática. La función de densidad de probabilidad de una variable aleatoria

continua puede representarse gráficamente mediante una curva”.

Delgado, R. (2007) “La función F recibe el nombre de función de densidad de la v.a.

X y juega un papel análogo para el caso continuo, al de la función de probabilidad del

caso discreto”.

Población, F. Serna, G. (2015) “A pesar de que las distribuciones discretas tienen la

función de probabilidad y las distribuciones continuas tienen la función de densidad

de probabilidad, ambas tienen características común a través de la función de

distribución (F)”.

Ejercicio realizado en clase

Supongamos que el tiempo de en años de vida de cierto equipo puede ser

modelado como una variable aleatoria simple:

a) Determine el valor de K para que la función sea de densidad

F(x)𝑲𝒙𝟐 ; 𝟎 ≤ 𝒙 ≤ 𝟐

𝟎 ; 𝒔𝒊 𝒏𝒐

∫ 𝑭 (𝒙)𝒅𝒙 = 𝟏+∞

−∞

∫ 𝑲𝒙𝟐 𝒅𝒙 = 𝟏𝟐

𝟎

𝑲𝒙𝟑

𝟑 |

𝟐𝟎

= 𝟏

𝑲𝟖

𝟑 = 𝟏

𝑲 =𝟑

𝟖

b) ¿Cuál es la probabilidad de que el equipo funcione por menos de un

año?

Page 95: Cuaderno Digital - Gustavo Castro

88

P (𝟎 ≤ 𝒙 ≤ 𝟏) = ∫ 𝑭 (𝒙)𝒅𝒙𝟏

𝟎

∫ 𝟑

𝟖 𝒙𝟐 𝒅𝒙

𝟏

𝟎

= 𝟑

𝟖 𝒙𝟑

𝟑 |

𝟏𝟎

= 𝟏

𝟖

c) Determine la probabilidad de que un equipo funcione entre año y

medio año

P (𝟏

𝟐≤ 𝒙 ≤

𝟑

𝟐) = ∫

𝟑

𝟖 𝒙𝟐 𝒅𝒙

𝟑

𝟐𝟏

𝟐

= 𝟑

𝟖 𝒙𝟑

𝟑 |

𝟑𝟐⁄

𝟏𝟐⁄

= 𝟎. 𝟒𝟏

d) ¿Cuál es la probabilidad de que un equipo funcione por lo menos

año y medio?

P (𝟑

𝟐≤ 𝒙 ≤ 𝟐) = ∫

𝟑

𝟖 𝒙𝟐 𝒅𝒙

𝟐𝟑

𝟐

= 𝟑

𝟖 𝒙𝟑

𝟑 |

𝟐𝟑

𝟐⁄ = 𝟎. 𝟓𝟕

e) Determine la distribución acumulada del trabajo de vida del equipo

𝑭(𝒙) = ∫ 𝟑

𝟖

𝒙

𝟎

𝒕 𝟐 𝒅𝒕

𝑭(𝒙) =𝟑

𝟖 𝒕𝟑

𝟑 |

𝒙𝟎

= 𝟏

𝟖[𝒙𝟑]

𝑭(𝒙) = 𝟏

𝟖𝒙𝟑

f) Determine el promedio del tiempo que forman los componentes y la

varianza

E(x) = ∫ 𝒙 (𝟑

𝟖𝒙 𝟐)

𝟐

𝟎 𝒅𝒙

∫ 𝒙 (𝟑

𝟖𝒙 𝟑)

𝟐

𝟎 𝒅𝒙 =

𝟑

𝟖 𝒙𝟒

𝟒 |

𝟐𝟎

= 𝟑

𝟐 = 𝒖

𝛅𝟐 = 𝑬[𝒙 𝟐] − (𝟑

𝟐)

𝟐

𝑬(𝒙 𝟐) = ∫ 𝒙 𝟐 (𝟑

𝟖𝒙 𝟐)

𝟐

𝟎

𝒅𝒙

𝟑

𝟖 𝒙𝟓

𝟓 |

𝟐𝟎

= 𝟑

𝟒𝟎[𝟑𝟐] =

𝟏𝟐

𝟓

Page 96: Cuaderno Digital - Gustavo Castro

89

𝛅𝟐 = 𝟏𝟐

𝟓− (

𝟑

𝟐)

𝟐

𝛅𝟐 = 𝟎. 𝟏𝟓

Distribución Uniforme Continuas

Esta distribución puede tratar tanto con variables discretas y continuas, no existe

ningún inconveniente que le impida hacerlo esto quiere decir que las

representaciones de los sucesos serán constantes.

Mateo Santiago Encalada, (2004) “La distribución o modelo uniforme puede

considerarse como proveniente de un proceso de extracción aleatoria. El

planteamiento radica en el hecho de que la probabilidad se distribuye

uniformemente a lo largo de un intervalo”.

Redondo, A. Francisco, L. (2002) ”Lo que caracteriza a las distribuciones

uniformes, tanto si trata de variables discretas o continuas, es la constancia en la

probabilidad de presentación de los sucesos. En el caso de un dado, la probabilidad

de obtener cualquier resultado es, constamente 1/6”.

Rius, F. Warnberg, J. (2014) ”Se dice que v.a. X posee una distribución

uniforme en el intervalo [a, b] X- U (a, b) la probabilidad de que al hacer un

experimento aleatorio, el valor X este comprendido en cierto subintervalo de [a,b]

depende únicamente de la longitud del mismo, no de su posición”.

Page 97: Cuaderno Digital - Gustavo Castro

90

Bibliografía

William Mendehall, Robert Beaver, Barbara Beaver (2006). La estadística en Introducción a la

probabilidad y estadística. (Pág. 3). Mexico DF, Mexico: Cengage Learning.

William Mendehall, Robert Beaver, Barbara Beaver (2006). Estadística inferencial en

Introducción a la probabilidad y estadística. (Pág. 4). México DF, México: Cengage Learning.

William Mendehall, Robert Beaver, Barbara Beaver (2006). Estadística descriptiva en

Introducción a la probabilidad y estadística. (Pág. 4). México DF, México: Cengage Learning.

William Mendehall, Robert Beaver, Barbara Beaver (2006). Población objetiva en Introducción a

la probabilidad y estadística. (Pág. 8). México DF, México: Cengage Learning.

William Mendehall, Robert Beaver, Barbara Beaver (2006). Unidades de investigación en

Introducción a la probabilidad y estadística. (Pág. 8). Mexico DF, Mexico: Cengage Learning.

William Mendehall, Robert Beaver, Barbara Beaver (2006). Muestra en Introducción a la

probabilidad y estadística. (Pág. 8). Mexico DF, Mexico: Cengage Learning.

William Mendehall, Robert Beaver, Barbara Beaver (2006). Parámetro en Introducción a la

probabilidad y estadística. (Pág. 53). Mexico DF, Mexico: Cengage Learning.

William Mendehall, Robert Beaver, Bárbara Beaver (2006). Estadísticas en Introducción a la

probabilidad y estadística. (Pág. 53). México DF, México: Cengage Learning.

William Mendehall, Robert Beaver, Bárbara Beaver (2006). Variables cualitativas en

Introducción a la probabilidad y estadística. (Pág. 10). México DF, México: Cengage Learning.

William Mendehall, Robert Beaver, Barbara Beaver (2006). Variables cuantitativas en

Introducción a la probabilidad y estadística. (Pág. 10). México DF, México: Cengage Learning.

William Mendehall, Robert Beaver, Barbara Beaver (2006). Análisis univariado en Introducción

a la probabilidad y estadística. (Pág. 9). Mexico DF, Mexico: Cengage Learning.

William Mendehall, Robert Beaver, Barbara Beaver (2006). Histograma de frecuencia relativa en

Introducción a la probabilidad y estadística. (Pág. 25). Mexico DF, Mexico: Cengage Learning.

William Mendehall, Robert Beaver, Barbara Beaver (2006). Media en Introducción a la

probabilidad y estadística. (Pág. 54). Mexico DF, Mexico: Cengage Learning.

William Mendehall, Robert Beaver, Barbara Beaver (2006). Moda en Introducción a la

probabilidad y estadística. (Pág. 55). Mexico DF, Mexico: Cengage Learning.

William Mendehall, Robert Beaver, Barbara Beaver (2006). Mediana en Introducción a la

probabilidad y estadística. (Pág. 55). Mexico DF, Mexico: Cengage Learning.

William Mendehall, Robert Beaver, Barbara Beaver (2006). Varianza en Introducción a la

probabilidad y estadística. (Pág. 62). Mexico DF, Mexico: Cengage Learning.

William Mendehall, Robert Beaver, Barbara Beaver (2006). Percentiles en Introducción a la

probabilidad y estadística. (Pág. 77). Mexico DF, Mexico: Cengage Learning.

Page 98: Cuaderno Digital - Gustavo Castro

91

William Mendehall, Robert Beaver, Barbara Beaver (2006). Cuartiles en Introducción a la

probabilidad y estadística. (Pág. 78). Mexico DF, Mexico: Cengage Learning.

William Mendehall, Robert Beaver, Barbara Beaver (2006). Variables cuantitativas en

Introducción a la probabilidad y estadística. (Pág. 10). México DF, México: Cengage Learning.

Luis Rodríguez Ojeda, Msc (2007). Marca de clase en Probabilidad y estadística básica para

ingenieros. (Pág. 13). Guayaquil, Ecuador: ESPOL – ICM.

Luis Rodríguez Ojeda, Msc (2007). Polígono en Probabilidad y estadística básica para ingenieros.

(Pág. 18). Guayaquil, Ecuador: ESPOL – ICM.

Luis Rodríguez Ojeda, Msc (2007). Ojiva en Probabilidad y estadística básica para ingenieros.

(Pág. 18). Guayaquil, Ecuador: ESPOL – ICM.

Luis Rodríguez Ojeda, Msc (2007). Coeficiente de variación en Probabilidad y estadística básica

para ingenieros. (Pág. 25). Guayaquil, Ecuador: ESPOL – ICM.

Luis Rodríguez Ojeda, Msc (2007). Decires en Probabilidad y estadística básica para ingenieros.

(Pág. 25). Guayaquil, Ecuador: ESPOL – ICM.

Luis Rodríguez Ojeda, Msc (2007). Cantiles en Probabilidad y estadística básica para ingenieros.

(Pág. 24). Guayaquil, Ecuador: ESPOL – ICM.

Luis Rodríguez Ojeda, Msc (2007). Diagrama de caja en Probabilidad y estadística básica para

ingenieros. (Pág. 31). Guayaquil, Ecuador: ESPOL – ICM.

Fernando Quevedo Ricardi (2010). Observación en Estadística aplicada a la investigación en

salud. (Pág. 1). Chile: Medwave

Fernando Quevedo Ricardi (2010). Variables cualitativas nominales en Estadística aplicada a la

investigación en salud. (Pág. 2). Chile: Medwave

Fernando Quevedo Ricardi (2010). Variables cualitativas ordinales en Estadística aplicada a la

investigación en salud. (Pág. 2). Chile: Medwave

Fernando Quevedo Ricardi (2010). Variables cuantitativas discretas en Estadística aplicada a la

investigación en salud. (Pág. 2). Chile: Medwave

Fernando Quevedo Ricardi (2010). Variables cuantitativas continúas en Estadística aplicada a la

investigación en salud. (Pág. 2). Chile: Medwave

(s.f.). Alejandro Neira . (2009). Probabilidades Para Universitarios. Bogota: NORIEGA.

Alejandro Sanchez . (2002). Probabilidad Total . Mexico: Pearson Educacion.

Alexis Requena. (2007). Probabilidaes. Mexico: Pearson.

Alonso Zambrano . (2008). Probabilidades. Revista de la ESPOL, 29.

Angel Merizalde. (2012). Valores Espeados y Varianza . Caracas: MASLIBROS.

Antonio Vargas Sabadías. (1995). Estadística descriptiva e inferencial. Cuenca: Universidad de

Castilla - La Mancha.

Page 99: Cuaderno Digital - Gustavo Castro

92

Blatt Frank J. (1992). Modern Physics. New York: McGraw-Hill.

Carlos Andrade . (2008). PROBABILIDADES. Mexico: Noriega.

Carlos Siguencia . (25 de Abril de 2004). Tecnologico de Monterrey. Obtenido de

http://www.mty.itesm.mx/dmti/materias/ma2006-1/recursos/ma2006-03.pdf

Carloss Idrovo Alvarez. (2000). Definiciones Probabilisticas. Bucaramanga: MASLIBROS.

David M. Levine, Mark L. Berenson, Timothy C. Krehbiel. (2006). Estadística para

administración. Pearson Educación.

Dr. Christiam Gonzales Chávez. (2007). Probabilidad de Distribucion. Guadalajaraa:

MASLIBROS.

Dr. Mauro Gutierrez Martinez . (2004). Funcionees de la Probabilidad. Puerto Rico: NORIEGA.

Dra. Luz M. Rivera. (9 de Marzo de 2001). UNIVESIDAD INTERAMERANA DE PUERTO RICO.

Obtenido de http://ponce.inter.edu/cremc/estadistica.htm

Eduardo Manrique . (2011). Diseño Probabilistico. Bogota: MASLIBROS.

Eduardo Véliz. (2004). Introducción a Probabilidad. Mexico: NORIEGA.

Eliseo Martínez H. (2003). Estadistica para Igenieria. Antofagasta: NORIEGA.

Espinoza M. (20 de 05 de 2015). Espinoza M. Espinoza M. Guayaquil, Guayas, Ecuador: Mateo.

Estadistica y Variables Aleatorias . (2006). Guadalajara: NORIEGA.

Fisher R. A. (1919). The Correlation Between Relatives on the Supposition of Mendelian

Inheritance. Inglaterra: Pearson Education.

Gloria Rocío Bautista Mendoza. (2002). Ciencias Estadisticas. Colombia: Universidad de

Colombia.

Guillermo Trujano Mendoza . (2004). Investigacion de Operaciones. Mexico : Pearson

Educacion.

Gustavo Rocha Beltran. (2004). Probabilidad y Estadisticas. Guadalajara: UNAM.

Hamza K. (1995). The smallest uniform upper bound on the distance between the mean and the

median of the binomial and Poisson distributions. Alemania: Pearson Education.

HECTOR EUGENIO CHAVEZ VELARDE. (2001). Distribuciones de probabilidad discreta. Panama:

MASLIBROS.

Jefferson Sanchez. (2008). Introduccion a las Probabilidaes . Mexico: Alianza Editorial.

Jorge Rendon Aviles . (1999). Probabilidad Total. Cali: NORIEGA.

Josseline Cardenas M. (2004). Probabilidad y su Regla de Correspondencia. Caracas:

MASLIBROS.

Juan Miguel Marín Diazaraque. (4 de Agosto de 2014). Universidad Carlos III de Madrid.

Obtenido de

http://portal.uc3m.es/portal/page/portal/dpto_estadistica/personal/juan_miguel_ma

rin_diazaraque

Page 100: Cuaderno Digital - Gustavo Castro

93

Kolobar aritmetičnih funkcij. (2002). Ring of arithmetical functions. Rusia.

Leonardo Hernández Mendoza . (2012). Folleto de Estadísticas. Guayaquil: ESPOL.

M.C. Rigoberto Guardado France . (2014). Metodos y Aplicaciones. California: Universidad de

Baja California.

Manuel Vivanco. (2005). Muestreo Estadistico. Diseño Y Aplicaciones. Santiago, Chile:

Universitaria, S.A.

Mario Orlando Suárez Ibujes. (2005). Probabilidad Total y Teorema de Bayes. Mexico:

NORIEGA.

Martín, Miguel, Horna, Olivia, Nedel, Fúlvio, Navarro, Albert. (2010). Fundamentos de

estadística en ciencias de la salud. Servei de Publicacions de la Universitat Autònoma

de Barcelona.

Martínez Gómez, Mónica. (2004). Distribuciones de Probabilidad para Variables Aleatorias

Discretas. Valencia: Universidad Politécnica de Valencia.

Mateo Santiago Encalada. (6 de Julio de 2004). UNIVERSIDAD DE VALENCIA. Obtenido de

http://www.uv.es/ceaces/base/modelos%20de%20probabilidad/uniforme.htm

MC. Rita Luna Gandara. (15 de Julio de 2003). Probabilidad y Estadistica. Obtenido de

http://www.itch.edu.mx/academic/industrial/sabaticorita/

Mendehall, W. -B.-B. (2006). Introducción a la probabilidad y estadística. Cengage Learning™.

Mg. Cecilia Rosas Meneses. (2009). Funcion de Distribucion Acumulada . Mexico: MASLIBROS.

Milena Delgado. (1999). Analisis Biodimencional. Francia : Pearson Education.

MONTEREY INSTITUTO. (2009). Folleto de Estadistica. Chicago: Pearson Educacion.

Montero Alonso. (2004). Sistemas Aleatorios . Granada : UNIVERSIDAD DE GRANADA .

MORENO, Francis. (1993). Estadística Inferencial. Loja: Universidad Particular de Loja.

Nayelli Manzanarez Gómez. (22 de Mayo de 2009). UNIVERSIDAD NACIONAL AUTONOMA DE

MEXICO. Obtenido de

http://www.dcb.unam.mx/users/angellbs/htm/GRUPO1/ARCHIVOS_VARIOS_G1/PyE_

T3.pdf

Pablo Antonio Martín Álvarez. (2001). La Distribución Binomial. Madrid: Ministerio de

Educación, Cultura y Deporte.

Peña Sánchez de Rivera. (2008). Fundamentos de Estadística . Guadalajara: Alianza Editorial.

Rafael Díaz. (2004). Introducción a la Probabilidad. Venezuela: NORIEGA.

Ramon Macias . (2008). Analisis Probabilistico. Bogota: NORIEGA.

Ricard Boqué, Alicia Maroto. (1998). EL ANÁLISIS DE LA VARIANZA. Tarragona: Smeyers-

Verbeke.

Roberto Rodriguez. (2007). Estadistica Para Todos . Lima : Pearson Educacion.

Rodolfo Vaqurizo. (2013). Estadistica General. Cali: NORIEGA.

Page 101: Cuaderno Digital - Gustavo Castro

94

Santiago Montesdeoca. (2001). Probabilidad Condicional Total . Bogota: NORIEGA.

Vilma Morales. (2010). Evento y sus Probabilidades. Chile: MAS LIBROS.

Walter L. Martínez Vaca. (2003). Estadistica Descriptiva con enfasis en Salud Publica. La

Holguera.

Weinberg Steven. (1977). The First Three Minutes, Bantam Book. Australia: Chapman and Hal.

White Harvey E. (1972). Modern College Physics. Nostrand Reinhold: Pearson Education.

Wilfredo Caballero A. (1975). Introduccion a la Estadisticas. San Jose, Costa Rica: IICA. Matilde

de la Cruz.

Ximena Anadrade. (9 de Marzo de 2008). UNIVERSIDAD NACIONAL DE COLOMBIA . Obtenido

de

http://www.unalmed.edu.co/~estadist/esta_inv/APENDICE.%20TECNICAS%20DE%20C

ONTEO).pdf

Young Hugh D. (1968). Optics and Modern Physics. Alemania: McGraw-Hill.

Young Hugh D. (1968). Optics and Modern Physics. New York: McGraw-Hill.

Page 102: Cuaderno Digital - Gustavo Castro

Tabla de contenido ¿Para qué sirve la estadística? ............................................................................................ 3

La Estadística ............................................................................................................................ 4

Estadística Inferencial ............................................................................................................. 4

Estadística Descriptiva ........................................................................................................... 5

Datos Tomados Al Azar .......................................................................................................... 6

Población Objetiva ................................................................................................................... 2

Unidades de Investigación .................................................................................................... 2

Muestra ................................................................................................................................... 2

Observación ........................................................................................................................... 3

Parámetros y Estimadores .................................................................................................... 3

Parámetro ............................................................................................................................... 3

Estimador o estadístico ...................................................................................................... 3

Variables cualitativas .............................................................................................................. 5

Nominales............................................................................................................................... 5

Ordinales ................................................................................................................................ 5

Variables Cuantitativas o Numéricas .................................................................................. 6

Discretas ................................................................................................................................. 6

Continuas ............................................................................................................................... 7

Tabla de frecuencia (Análisis de variables cuantitativas) ............................................. 7

Análisis univariado .............................................................................................................. 7

Clase ........................................................................................................................................ 7

Marca clase ............................................................................................................................ 8

Frecuencia absoluta ............................................................................................................ 8

Frecuencia relativa ............................................................................................................... 9

Frecuencia acumulada ........................................................................................................ 9

Frecuencia relativa acumulada ......................................................................................... 9

Histograma de frecuencias relativas ................................................................................ 11

Histograma de frecuencia relativa ................................................................................. 11

Ojiva ........................................................................................................................................... 12

Preguntas ................................................................................................................................. 16

Ejercicio ................................................................................................................................ 17

Estimadores ............................................................................................................................. 21

Media ..................................................................................................................................... 21

Page 103: Cuaderno Digital - Gustavo Castro

Moda ...................................................................................................................................... 23

Los estimadores solo se aplican en variables cuantitativas ...................................... 23

Distribución normal representada por campana de Gauss ........................................ 23

Dispersión ................................................................................................................................ 24

Varianza ................................................................................................................................ 24

Desviación estándar .......................................................................................................... 24

Coeficiente de variación ................................................................................................... 25

Ejercicios .............................................................................................................................. 25

Estimadores de posición.................................................................................................. 29

Percentiles del orden i ...................................................................................................... 29

Deciles ................................................................................................................................... 29

Cuantil ................................................................................................................................... 30

Diagrama de Cajas y Bigotes ...................................................................................................... 32

Rango Intercuartil ................................................................................................................... 32

Valores alejados ................................................................................................................. 33

Distribución en forma simétrica ......................................................................................... 34

La curtosis ........................................................................................................................... 36

POSICIÓN ................................................................................................................................. 37

Campana de Gauss ............................................................................................................ 37

Ejercicio ................................................................................................................................ 38

Estimadores De Posición ..................................................................................................... 41

Percentiles de orden i ....................................................................................................... 41

DECILES ............................................................................................................................... 42

CUARTILES .......................................................................................................................... 42

Cuantiles ............................................................................................................................... 43

DIAGRAMA DE CAJA Y BIGOTE ........................................................................................ 45

Rango Intercuartil ................................................................................................................... 46

Valor Alejado ........................................................................................................................... 46

ESTIMACIÓN POR FORMA .................................................................................................. 47

Distribución en Forma Simetría ...................................................................................... 47

Análisis Bivariado .................................................................................................................. 49

Signo de La Covariancia ...................................................................................................... 51

Matriz de Varianza y Covarianza ........................................................................................ 52

MATRIZ DE CORRELACIÓN ................................................................................................ 53

Page 104: Cuaderno Digital - Gustavo Castro

Tipos de Muestreo ................................................................................................................. 54

Muestreo Aleatorio Simple (Mas) ................................................................................... 54

Nivel de Confianza ............................................................................................................. 54

Muestreo Sistemático ....................................................................................................... 56

Muestreo Estratificado ...................................................................................................... 56

Muestreo por Conglomerado .......................................................................................... 57

Ejercicio ................................................................................................................................ 59

Regla Multiplicativa ................................................................................................................ 60

Combinaciones ....................................................................................................................... 61

Permutaciones ........................................................................................................................ 62

Experimento Estadístico y Espacio Muestral ................................................................. 62

Experimento ......................................................................................................................... 62

Espacio Muestral del Experimento ................................................................................ 63

Eventos ..................................................................................................................................... 64

Muestro con Reposición y Muestreo sin Reposición ................................................... 64

Ejercicios .............................................................................................................................. 65

Ley De Complemento ............................................................................................................ 68

Ley Aditivo De Probabilidad ................................................................................................ 68

Probabilidad Condicional ..................................................................................................... 69

Ejercicio ................................................................................................................................. 70

Eventos Independientes ....................................................................................................... 71

Sistemas Exhaustos Y Excluyentes .................................................................................. 71

Ejercicios .............................................................................................................................. 72

Sucesos .................................................................................................................................... 76

Eventos Mutuamente Excluyentes .................................................................................... 76

Teorema De Bayes ................................................................................................................. 77

Variables Aleatorias ........................................................................................................... 78

Distribución de una Variable Discreta .......................................................................... 78

Ejercicio ................................................................................................................................ 79

Regla De Correspondencia .................................................................................................. 80

Función Acumulada ............................................................................................................... 80

Valores Esperados ................................................................................................................. 81

Varianza ................................................................................................................................ 81

Experimento Binomial ........................................................................................................... 82

Page 105: Cuaderno Digital - Gustavo Castro

Distribución Binomial Negativa ...................................................................................... 83

Ejercicios .............................................................................................................................. 84

Distribución Geométrica ...................................................................................................... 84

Ejercicio ................................................................................................................................ 85

Distribución Hipergeometrica ............................................................................................. 85

Ejercicio ................................................................................................................................... 86

Función De Densidad Para Continuas .............................................................................. 86

Distribución Uniforme Continuas ...................................................................................... 89