Clase01 - Conceptos Generales

71
Curso Práctico de Bioestadística Con Herramientas De Excel Fabrizio Marcillo Morla Fabrizio Marcillo Morla MBA MBA [email protected] (593-9) 4194239

Transcript of Clase01 - Conceptos Generales

Curso Práctico de Bioestadística Con

Herramientas De Excel

Fabrizio Marcillo Morla MBAFabrizio Marcillo Morla MBA

[email protected](593-9) 4194239

Fabrizio Marcillo Morla Guayaquil, 1966.Guayaquil, 1966.

BSc. Acuicultura. (ESPOL 1991).BSc. Acuicultura. (ESPOL 1991). Magister en Administración de Empresas. (ESPOL, Magister en Administración de Empresas. (ESPOL,

1996).1996). Profesor ESPOL desde el 2001.Profesor ESPOL desde el 2001.

20 años experiencia profesional: 20 años experiencia profesional: Producción.Producción.

Administración.Administración. Finanzas.Finanzas.

Investigación.Investigación. Consultorías.Consultorías.

Otras Publicaciones del mismo autor en Repositorio ESPOL

Capitulo 1

Conceptos GeneralesConceptos Generales

Que es Estadistica?La ciencia pura y aplicada (no exacta), que La ciencia pura y aplicada (no exacta), que

crea, desarrolla y aplica técnicas de modo que crea, desarrolla y aplica técnicas de modo que pueda evaluarse la incertidumbre.pueda evaluarse la incertidumbre.

Ciencia: "un conjunto de conocimientos Ciencia: "un conjunto de conocimientos comprobados y sistematizados".comprobados y sistematizados".

Pura: Por que estudia ciertos procesos teóricos.Pura: Por que estudia ciertos procesos teóricos. Aplicada: En cuanto se encarga de resolver Aplicada: En cuanto se encarga de resolver

problemas específicos.problemas específicos. No exacta: No podemos obtener un resultado No exacta: No podemos obtener un resultado

único, si no probabilidades de resultados único, si no probabilidades de resultados esperados.esperados.

Otros Conceptos Estadísticas: Estadísticas: statísticum collegiumstatísticum collegium

Consejo de estado: Consejo de estado: Estadístico: Persona que al tener la cabeza en Estadístico: Persona que al tener la cabeza en

un horno y los pies en hielo dice “en promedio un horno y los pies en hielo dice “en promedio me siento muy bien”?me siento muy bien”?

Bestias Salvajes?Bestias Salvajes? No se puede generalizar?No se puede generalizar?

Historia Origenes en juegos de azar y censos.Origenes en juegos de azar y censos. Siglo XVIII desarrolló teoría de Probabilidades Siglo XVIII desarrolló teoría de Probabilidades

(Gauss, Laplace, Bayes, etc). Discusión (Gauss, Laplace, Bayes, etc). Discusión filosófica sigue hasta ahora.filosófica sigue hasta ahora.

Muchas teorías, principalmente de carácter Muchas teorías, principalmente de carácter biológico como las de Mendel o Darwin tuvieron biológico como las de Mendel o Darwin tuvieron bases estadísticasbases estadísticas

Mayoría de métodos modernos se desarrollaron Mayoría de métodos modernos se desarrollaron desde mediados del siglo XIX y principios del XX desde mediados del siglo XIX y principios del XX (Pearson, Student, Fisher…), principalmente (Pearson, Student, Fisher…), principalmente para uso en biología, agricultura y genéticapara uso en biología, agricultura y genética

Porque BIOestadistica? ““Muchos” biologistas desconfian de las Muchos” biologistas desconfian de las

matematicas: “los seres vivos son matematicas: “los seres vivos son impredecibles”; “Camarones no se comportan impredecibles”; “Camarones no se comportan como deberían”. como deberían”. FIMA – QUIBIO????FIMA – QUIBIO????

Métodos estadísticos desarrollados justo para Métodos estadísticos desarrollados justo para ser usados en ciencias biológicas: Toman en ser usados en ciencias biológicas: Toman en cuenta variabilidad propia de poblaciones cuenta variabilidad propia de poblaciones naturales en sus cálculos y tablas.naturales en sus cálculos y tablas.

Tipos de Estadistica DescriptivaDescriptiva: Trata resumir e interpretar datos : Trata resumir e interpretar datos

para poder describir una población.para poder describir una población. Enumeración, organización y representación Enumeración, organización y representación

gráfica de los datos.gráfica de los datos. InferencialInferencial: Usa la teoría de la probabilidad : Usa la teoría de la probabilidad

para extraer conclusiones acerca de una para extraer conclusiones acerca de una población, a partir de la información población, a partir de la información incompleta de los datos obtenidos en una incompleta de los datos obtenidos en una muestra:muestra: EstimaciónEstimación ComparativaComparativa PredictivaPredictiva

Aplicaciones de la Estadística

Obtener una muestra.Obtener una muestra. Resumir datos.Resumir datos. Haciendo inferencias de una población, Haciendo inferencias de una población,

basado en los resultados de la muestra.basado en los resultados de la muestra. Obteniendo un modelo más simple para Obteniendo un modelo más simple para

un grupo de datos.un grupo de datos.

Variables

Una propiedad con respecto a la cual los Una propiedad con respecto a la cual los individuos de una muestra o una población individuos de una muestra o una población

se diferencian en algo verificable.se diferencian en algo verificable.

Ciertas "características" que presentan Ciertas "características" que presentan variación.variación.

Tipos de Variables (1)Clasificación por su escala de mediciónClasificación por su escala de medición

CualitativasCualitativas Dicotómicas-binariasDicotómicas-binarias

Sexo: masculino o femenino.Sexo: masculino o femenino. Status de empleo: empleado o desempleado.Status de empleo: empleado o desempleado.

OrdinalesOrdinales Nivel socioeconómico: alto, medio o bajo.Nivel socioeconómico: alto, medio o bajo. Índice de lípidos: 1, 2 ,3 ,4 , 5, 6Índice de lípidos: 1, 2 ,3 ,4 , 5, 6

NominalesNominales Sitio de residencia: centro, sur, norte, este, oesteSitio de residencia: centro, sur, norte, este, oeste Estado civil: soltero, casado, viudo, divorciado, unión libre, T.L.A.Estado civil: soltero, casado, viudo, divorciado, unión libre, T.L.A.

Variables de IntervaloVariables de Intervalo:: Fiebre: Si (>37º C), No (<37º C)Fiebre: Si (>37º C), No (<37º C)

CuantitativasCuantitativas DiscretasDiscretas

Número de hijos: 1,2,3,4.Número de hijos: 1,2,3,4. ContinuasContinuas

Nivel de glucosa en sangre: 110 mg/dl, 145 mg/dl.Nivel de glucosa en sangre: 110 mg/dl, 145 mg/dl. Peso: 10 g, 11 g, 10.5 g, 10.1 g, 10.05 g, 10.001 g… Peso: 10 g, 11 g, 10.5 g, 10.1 g, 10.05 g, 10.001 g…

Tipos de Variables Cuantitativas

DiscretasDiscretas: su conjunto de posibles valores : su conjunto de posibles valores son fijos, y no pueden tomar valores son fijos, y no pueden tomar valores intermedios:intermedios: Número de peces en un acuario.Número de peces en un acuario.

ContinuasContinuas: su conjunto de posibles valores : su conjunto de posibles valores puede alcanzar un número infinito entre puede alcanzar un número infinito entre dos valores cuales quiera:dos valores cuales quiera: Longitud, PesoLongitud, Peso

Tipos de Variables (2)

Clasificación por su relaciónClasificación por su relación IndependientesIndependientes: Aquellas cuyo valor no : Aquellas cuyo valor no

depende de otra variable.depende de otra variable. DependientesDependientes: Aquellas cuyo valor va a : Aquellas cuyo valor va a

depender de otra variable.depender de otra variable.

Dependiente de que?Dependiente de que?

V. Intermedias y V. confusoras?V. Intermedias y V. confusoras?

Ejemplos de VariablesDe un ejemplo de cada una en su campoDe un ejemplo de cada una en su campo

CualitativasCualitativas Dicotómicas-binariasDicotómicas-binarias OrdinalesOrdinales NominalesNominales Variables de IntervaloVariables de Intervalo::

CuantitativasCuantitativas DiscretasDiscretas ContinuasContinuas

Independientes y DependientesIndependientes y Dependientes

Valores, Datos, etc.

Llamamos Valores, Datos u Pbservaciones a Llamamos Valores, Datos u Pbservaciones a cualquier valor numérico o cualitativo que cualquier valor numérico o cualitativo que

mida una variable. mida una variable.

Los valores experimentales que va a tomar Los valores experimentales que va a tomar una variable determinada.una variable determinada.

VariableVariable: Peso: Peso

ValoresValores: 125 lbs, 145 lbs, 180 lbs: 125 lbs, 145 lbs, 180 lbs

Población

El grupo de individuos bajo estudio sobre El grupo de individuos bajo estudio sobre el que deseamos hacer alguna inferencia.el que deseamos hacer alguna inferencia. Conjunto de objetos, mediciones u Conjunto de objetos, mediciones u

observaciones del que tomamos muestra. observaciones del que tomamos muestra. Puede ser finita o infinita, dependiendo de Puede ser finita o infinita, dependiendo de

su tamaño. su tamaño. Tamaño de población (número total de los Tamaño de población (número total de los

individuos que la conforman) se lo denota individuos que la conforman) se lo denota con la letra con la letra NN..

Ejemplos de poblaciones 20 camarones en una pecera.20 camarones en una pecera. Todos los camarones de una piscina.Todos los camarones de una piscina. Todos los camarones posibles a ser cultivados Todos los camarones posibles a ser cultivados

bajo cierto tratamiento.bajo cierto tratamiento. Todos los camarones del mundo.Todos los camarones del mundo.

Límites de población dependen de como la definamos Límites de población dependen de como la definamos nosotros acorde con nuestras necesidadesnosotros acorde con nuestras necesidades. .

Antes de empezar cualquier proceso estadístico es Antes de empezar cualquier proceso estadístico es necesario necesario Definir claramente la población o Definir claramente la población o

poblaciones bajo estudiopoblaciones bajo estudio..

Población y Muestra

Conociendo la Conociendo la distribución de frecuenciasdistribución de frecuencias de alguna característica (de alguna característica (variablevariable) de la ) de la poblaciónpoblación, es posible describirla por medio , es posible describirla por medio de una de una función de densidadfunción de densidad, la cual a su , la cual a su vez vendrá caracterizada por ciertos vez vendrá caracterizada por ciertos parámetrosparámetros..

Problema es que al ser población muy Problema es que al ser población muy grande, resulta más conveniente estudiar grande, resulta más conveniente estudiar un subconjunto de ella (un subconjunto de ella (muestramuestra) y decir ) y decir que representa mas o menos fielmente que representa mas o menos fielmente ((representativorepresentativo) a la población total.) a la población total.

Muestra Sea una variable aleatoria dada (X); los valores Sea una variable aleatoria dada (X); los valores

de esta variable aleatoria (Xde esta variable aleatoria (X11, X, X22,...X,...Xnn) forman ) forman

una muestra de la variable X, si ellas son una muestra de la variable X, si ellas son independientes entre síindependientes entre sí y siguen y siguen la misma la misma distribucióndistribución de X: de X: Representa fielmente a X.Representa fielmente a X.

Partimos suposición: muestra es porción de Partimos suposición: muestra es porción de población que la representa fielmente. población que la representa fielmente.

No tomamos en cuenta muestreos mal No tomamos en cuenta muestreos mal realizados. realizados.

Tamaño de la muestra se lo denota como Tamaño de la muestra se lo denota como nn..

Muestra

Igual que población, debe definirse Igual que población, debe definirse correctamente antes de empezar estudio. correctamente antes de empezar estudio. 20 camarones en una pecera.20 camarones en una pecera. Todos los camarones de una piscina.Todos los camarones de una piscina. Todos los camarones posibles a ser Todos los camarones posibles a ser

cultivados bajo cierto tratamiento.cultivados bajo cierto tratamiento. Todos los camarones del mundo.Todos los camarones del mundo.

Pueden representar una muestra de una Pueden representar una muestra de una población mayor. población mayor.

Objetivos de Muestreo

Obtener información sobre distribuciones Obtener información sobre distribuciones de frecuencia de la población (distribución de frecuencia de la población (distribución de probabilidad) o más preciso: de los de probabilidad) o más preciso: de los parámetros poblacionalesparámetros poblacionales que describen que describen dicha distribución de probabilidad.dicha distribución de probabilidad.

Distribucion de Frecuencias (introduccion)

Operación en que dividimos un conjunto Operación en que dividimos un conjunto de datos, en varios grupos, mostrando el de datos, en varios grupos, mostrando el número de elementos en cada grupo.número de elementos en cada grupo.

Más tarde veremos los detalles. Más tarde veremos los detalles. Ahora importante entender el concepto y Ahora importante entender el concepto y

su relación con la distribución de su relación con la distribución de probabilidad. probabilidad.

Archivo: Ejercicio01 - Distribucion de Archivo: Ejercicio01 - Distribucion de Frecuencias.xlsxFrecuencias.xlsx

Datos longitud cefálica O. niloticus

25.3 26.3 27.0 27.7 28.2 29.0 29.5

25.5 26.4 27.0 28.0 28.2 29.3 29.5

26.0 26.4 27.0 28.0 28.4 29.3 29.7

26.0 26.6 27.0 28.0 28.5 29.3 29.8

26.0 26.8 27.3 28.0 28.9 29.4 30.2

26.0 27.0 27.6 28.0 28.9 29.4 31.0

26.0 27.0 27.6 28.0 29.0 29.5 31.0

26.1 27.0 27.6 28.1 29.0 29.5 33.4

Tabla de Frecuencias

Int RepresInt Repres

Int RealInt Real

FrecFrec

Frec RelatFrec Relat Frec Frec AcumAcum

F. Acum F. Acum RelatRelat

Marca Marca ClaeClae

lim inflim inflim lim supsup

2222 2323 21.521.5 23.523.5 00 0.00%0.00% 00 0.00%0.00% 22.522.5

2424 2525 23.523.5 25.525.5 22 3.57%3.57% 22 3.57%3.57% 24.524.5

2626 2727 25.525.5 27.527.5 1919 33.93%33.93% 2121 37.50%37.50% 26.526.5

2828 2929 27.527.5 29.529.5 2929 51.79%51.79% 5050 89.29%89.29% 28.528.5

3030 3131 29.529.5 31.531.5 55 8.93%8.93% 5555 98.21%98.21% 30.530.5

3232 3333 31.531.5 33.533.5 11 1.79%1.79% 5656 100.00%100.00% 32.532.5

5656 100.00%100.00%

Histograma

Poligono de frecuencias

Ejercicio en Grupo 5 Grupos de 3 persona5 Grupos de 3 persona 2 Dados por grupo2 Dados por grupo 1 hoja de Excel con 3 columnas :1 hoja de Excel con 3 columnas :

1 / cada dado1 / cada dado 1 suma de dados1 suma de dados

2 personas lanzas al mismo tiempo pero por separado 2 personas lanzas al mismo tiempo pero por separado los dados. 60 veceslos dados. 60 veces

Para cada dado y suma hacer:Para cada dado y suma hacer: Tabla de frecuenciaTabla de frecuencia Histograma de frecuencia relativaHistograma de frecuencia relativa Poligono de frecuencia acumuladaPoligono de frecuencia acumulada AnalizarAnalizar

Teoria de Probabilidades

Originó en juegos de azarOriginó en juegos de azar O talvez antes?O talvez antes? Todos jugamos al riesgo dia a dia.Todos jugamos al riesgo dia a dia. Varios enfoques filosóficos a probabilidad:Varios enfoques filosóficos a probabilidad:

Teoria ClasicaTeoria Clasica FrecuentismoFrecuentismo BayesianaBayesiana etcetc

Probabilidad Eventos que son comunes o improbables son Eventos que son comunes o improbables son

aquellos cuya probabilidad de ocurrencia son aquellos cuya probabilidad de ocurrencia son grandes o pequeñas, respectivamente.grandes o pequeñas, respectivamente.

Dia a dia calculamos "al ojo" la probabilidad de Dia a dia calculamos "al ojo" la probabilidad de todas los sucesos que nos rodeantodas los sucesos que nos rodean

Determinamos que tan "común" o "raras" son.Determinamos que tan "común" o "raras" son. En Esmeraldas no es "común" encontrar un nativo rubio y En Esmeraldas no es "común" encontrar un nativo rubio y

ojos azules, en Suecia si. ojos azules, en Suecia si. Basado en "muestras" de Suecos y Esmeraldeños, sin Basado en "muestras" de Suecos y Esmeraldeños, sin

necesidad de ver todos los esmeraldeños y suecos. necesidad de ver todos los esmeraldeños y suecos. Problema de este método al "ojímetro“: carecemos Problema de este método al "ojímetro“: carecemos

de un término preciso para describir la probabilidad.de un término preciso para describir la probabilidad.

Probabilidad Estadísticos reemplazan como "con dificultad", Estadísticos reemplazan como "con dificultad",

"pudo" o "casi con seguridad" por número de 0 a "pudo" o "casi con seguridad" por número de 0 a 1, que indica de forma precisa que tan probable 1, que indica de forma precisa que tan probable o improbable es el evento.o improbable es el evento.

Haciendo inferencias sobre una población a Haciendo inferencias sobre una población a partir de muestras no podemos esperar llegar partir de muestras no podemos esperar llegar siempre a resultados correctos.siempre a resultados correctos.

Estadística ofrece procedimientos para saber Estadística ofrece procedimientos para saber cuántas veces acertamos "en promedio". cuántas veces acertamos "en promedio". (enunciados probabilísticos).(enunciados probabilísticos).

Espacio Muestreal

El conjunto universal de una poblaciónEl conjunto universal de una población Todos los valores posibles que nuestra Todos los valores posibles que nuestra

variable aleatoria puede tomarvariable aleatoria puede tomar Todas las formas en que podemos sacar 4 Todas las formas en que podemos sacar 4

bolas de una funda que contenga 8 bolas bolas de una funda que contenga 8 bolas rojas y 2 blancasrojas y 2 blancas

De cuantas formas puede caer un dadoDe cuantas formas puede caer un dado Todas las posibles supervivencias que Todas las posibles supervivencias que

podamos obtener en un cultivopodamos obtener en un cultivo Todos los posibles climas que puedan haber Todos los posibles climas que puedan haber

en un día determinadoen un día determinado

Probabilidad Clasica Si un evento puede ocurrir de N maneras Si un evento puede ocurrir de N maneras

mutuamente exclusivas e igualmente posibles, y mutuamente exclusivas e igualmente posibles, y si n de ellas tienen una característica E, si n de ellas tienen una característica E, entonces, la posibilidad de ocurrencia de E es la entonces, la posibilidad de ocurrencia de E es la fracción n/N y se indica por: fracción n/N y se indica por:

Funciona bien con espacio muestreal pequeño y Funciona bien con espacio muestreal pequeño y conocido, y en donde todas las N maneras sean conocido, y en donde todas las N maneras sean igualmente posibles.igualmente posibles.

(E)=n

N

Probabilidad Frecuentista Probabilidad de un evento es su frecuencia Probabilidad de un evento es su frecuencia

relativa a lo largo del tiempo.relativa a lo largo del tiempo.

Probabilidad de obtener “cara” al lanzar una Probabilidad de obtener “cara” al lanzar una moneda es 0.5: No porque se la calcula moneda es 0.5: No porque se la calcula matemáticamente, sino porque esto ocurre al matemáticamente, sino porque esto ocurre al lanzarla muchas veces.lanzarla muchas veces.

No se puede repetir experimento infinitas veces. No se puede repetir experimento infinitas veces. Al repetirlo pocas veces da distinta probabilidad.Al repetirlo pocas veces da distinta probabilidad. Error de probabilidad es una probabilidad… bis…Error de probabilidad es una probabilidad… bis…

Probabilidad La probabilidad que un carro sea robado en La probabilidad que un carro sea robado en

Guayaquil puede ser calculada en función al Guayaquil puede ser calculada en función al número de carros robados en y al número de número de carros robados en y al número de carros en Guayaquil.carros en Guayaquil. Aseguradoras usan esto, para calcular el valor Aseguradoras usan esto, para calcular el valor

esperado a pagar. +costos +utilidad = primaesperado a pagar. +costos +utilidad = prima.. Probabilidad que en cierta camaronera una Probabilidad que en cierta camaronera una

corrida a 130.000 Pl/Ha alcance 15 gr. en 120 corrida a 130.000 Pl/Ha alcance 15 gr. en 120 días puede ser calculada con base en veces que días puede ser calculada con base en veces que se ha logrado en condiciones similaresse ha logrado en condiciones similares

Ejercicio Individual

Calcular la posibilidad de que el sol salga Calcular la posibilidad de que el sol salga mañana.mañana.

Teoremas Basicos (1)

La probabilidad de un evento cualquiera va La probabilidad de un evento cualquiera va a estar en el rango de cero a uno. Esto a estar en el rango de cero a uno. Esto quiere decir que no existen probabilidades quiere decir que no existen probabilidades negativas ni mayores de 100%negativas ni mayores de 100%

0 ≤ P(E) ≤ 10 ≤ P(E) ≤ 1

Teoremas Basicos (2)

La suma de la probabilidad de ocurrencia La suma de la probabilidad de ocurrencia de un evento mas la probabilidad de no de un evento mas la probabilidad de no ocurrencia del mismo es igual a uno.ocurrencia del mismo es igual a uno.

P(E) + P(¬E) = 1P(E) + P(¬E) = 1 Probabilidad de que salga 1 en Probabilidad de que salga 1 en

lanzamiento de dados es 1/6 lanzamiento de dados es 1/6 Ocurrencia de que no salga 1 es:Ocurrencia de que no salga 1 es:

P(¬1) = 1 – 1/6 = 5/6P(¬1) = 1 – 1/6 = 5/6

Teoremas Basicos (3)

La probabilidad de ocurrencia de dos La probabilidad de ocurrencia de dos eventos independientes es igual al eventos independientes es igual al producto de la ocurrencia de cada uno.producto de la ocurrencia de cada uno.

P(A B) = P(A) x P(B)P(A B) = P(A) x P(B) Probabilidad de que al lanzar dos dados Probabilidad de que al lanzar dos dados

salga 1 y 2:salga 1 y 2: P(1) = 1/6 ; P(2) = 1/6P(1) = 1/6 ; P(2) = 1/6

P(1 y 2) = 1/6 x 1/6 = 1/36P(1 y 2) = 1/6 x 1/6 = 1/36

Teoremas Basicos (4) Para dos eventos cualesquiera A y B, la Para dos eventos cualesquiera A y B, la

probabilidad de que ocurra A o B viene dado, por probabilidad de que ocurra A o B viene dado, por la probabilidad de que ocurra A, mas la la probabilidad de que ocurra A, mas la probabilidad de que ocurra B, menos la probabilidad de que ocurra B, menos la probabilidad de que ocurran ambos.probabilidad de que ocurran ambos.

P(A o B) = P(A) + P(B) - P(AB)P(A o B) = P(A) + P(B) - P(AB) Probabilidad que al lanzar dos dados obtenga Probabilidad que al lanzar dos dados obtenga

solo un 1 o un 2:solo un 1 o un 2: P(1) = 1/6 ; P(2) = 1/6P(1) = 1/6 ; P(2) = 1/6

P( 1 o 2) = 1/6 + 1/6 – (1/6 x 1/6) = 11/36P( 1 o 2) = 1/6 + 1/6 – (1/6 x 1/6) = 11/36

Teoremas Basicos

Si dos eventos son mutuamente Si dos eventos son mutuamente excluyentes, P(AB) será 0 y la probabilidad excluyentes, P(AB) será 0 y la probabilidad de ocurrencia de ambos será : de ocurrencia de ambos será :

P(A o B) = P(A) + P(B)P(A o B) = P(A) + P(B) Probabilidad de que al lanzar un dado Probabilidad de que al lanzar un dado

obtenga 1 o 2:obtenga 1 o 2: P(1) = 1/6 ; P(2) = 1/6P(1) = 1/6 ; P(2) = 1/6

P( 1 o 2) = 1/6 + 1/6 = 2/6P( 1 o 2) = 1/6 + 1/6 = 2/6

Valor Esperado Llamamos valor esperado al valor probable que Llamamos valor esperado al valor probable que

podemos obtener al repetir cierto evento. podemos obtener al repetir cierto evento. Va a estar asociado a la probabilidad de Va a estar asociado a la probabilidad de

ocurrencia de cada opción del mismo, y al valor ocurrencia de cada opción del mismo, y al valor que tomará la variable cada caso.que tomará la variable cada caso.

Ejemplo:Ejemplo: Probabilidad de que ganemos al apostar a un número Probabilidad de que ganemos al apostar a un número

en la ruleta es 1/37 = 0.27.en la ruleta es 1/37 = 0.27. Premio obtenido es 35 veces la apuestaPremio obtenido es 35 veces la apuesta Calcule la esperanza de ganar en la ruleta apostando Calcule la esperanza de ganar en la ruleta apostando

US$1,000.US$1,000.

Valor Esperado P(Ganar) = 1/37P(Ganar) = 1/37 P(Perder)= 1- 1/37 = 36/37P(Perder)= 1- 1/37 = 36/37 Valor a Ganar = $35,000Valor a Ganar = $35,000 Valor a Perder = $1,000Valor a Perder = $1,000

Esperanza de Ganancia:Esperanza de Ganancia:E(G) = P(ganar)xValor Ganar + P(perder)*xValor PerderE(G) = P(ganar)xValor Ganar + P(perder)*xValor Perder

E(G) = 1/37 x $35,000 + 36/37 x - $1,000E(G) = 1/37 x $35,000 + 36/37 x - $1,000

E(ganancia) = $946 - $973 = - $27E(ganancia) = $946 - $973 = - $27

Si jugamos a la ruleta, apostando toda la noche a Si jugamos a la ruleta, apostando toda la noche a un número $1,000; la esperanza que tenemos es un número $1,000; la esperanza que tenemos es de perder “en promedio” $27 cada vez.de perder “en promedio” $27 cada vez.

Ejercicio Usted se Encuentra en el programa “Usted se Encuentra en el programa “Haga Haga

negocios conmigonegocios conmigo”.”. Polito le presenta 3 puertas:Polito le presenta 3 puertas: Detrás de una hay un flamante ferrari rojo Detrás de una hay un flamante ferrari rojo

descapotable ultimo modelo.descapotable ultimo modelo. Detrás de las otras dos un Detrás de las otras dos un

pectolpectol

Haga Negocio Conmigo Usted debe de escoger una puerta.Usted debe de escoger una puerta. Luego de que la ha escogido, El Eterno Luego de que la ha escogido, El Eterno

Perdedor abrirá de las otras dos, la que Perdedor abrirá de las otras dos, la que contenga un pectol.contenga un pectol.

En este momento usted podrá escoger: En este momento usted podrá escoger: mantenerse con la misma puerta inicial, o mantenerse con la misma puerta inicial, o cambiar por la otra puerta.cambiar por la otra puerta.

Que escogería y porque? Que escogería y porque?

Parámetros Mayoría de investigaciones estadísticas quieren hacer Mayoría de investigaciones estadísticas quieren hacer

inferencias a partir de la información contenida en inferencias a partir de la información contenida en muestras aleatorias sobre la población de donde fueron muestras aleatorias sobre la población de donde fueron obtenidas.obtenidas.

Gralmente inferencias sobre los Gralmente inferencias sobre los parámetros parámetros poblacionalespoblacionales (ej: media (ej: media y varianza y varianza 22). Que ). Que describen a la describen a la poblaciónpoblación. . Se usa letras griegas.(Se usa letras griegas.(, etc.). , etc.).

Definimos parámetros como Definimos parámetros como ciertas medidas que ciertas medidas que describen a la poblacióndescriben a la población. .

A los parámetros en general los podemos definir como A los parámetros en general los podemos definir como ..

Estadísticos Para hacer tales inferencias utilizaremos los Para hacer tales inferencias utilizaremos los

estadísticos muestrealesestadísticos muestreales o estimadores de los o estimadores de los parámetros (ej: promedio o media aritmeticaparámetros (ej: promedio o media aritmeticax y x y varianza muestreal svarianza muestreal s22)) Valores calculadas con base en observaciones de la Valores calculadas con base en observaciones de la

muestra.muestra. Definimos estadístico como una medida que Definimos estadístico como una medida que

describe a la muestra, y que sirve para estimar describe a la muestra, y que sirve para estimar los parámetros. los parámetros.

A los estadísticos en general los podemos definir como A los estadísticos en general los podemos definir como nn..

Estadísticos vs. Parámetros

Importante diferencia entre estadístico y Importante diferencia entre estadístico y parámetro: una las bases de estadística. parámetro: una las bases de estadística.

A pesar que estadísticos se usan para A pesar que estadísticos se usan para representar o estimar parámetros, representar o estimar parámetros, probabilidad de que sean exactamente probabilidad de que sean exactamente iguales es 0.iguales es 0.

Ej: Promedio x Variable aleatoria. Distribución de probabilidad Variable aleatoria. Distribución de probabilidad

(muestreo) depende mecanismo muestreo. (muestreo) depende mecanismo muestreo. Algunos valores Algunos valores x estarán cerca de x estarán cerca de , y otros , y otros

alejados (para arriba o abajo).alejados (para arriba o abajo). Al tomar varias muestras, queremos tener los Al tomar varias muestras, queremos tener los x x

concentrados cerca a concentrados cerca a , y que el promedio de , y que el promedio de x x esté muy cercano a esté muy cercano a . .

4.0 6.0 8.0 10.0 12.0 14.0 16.00%

2%

4%

6%

8%

10%

12%

14%

Values

PRO

BA

BIL

ITY

Dist. Deriv Dist. Pobl.

Distribucion de Medias

Estimadores Insesgados Eficientes

Queremos seleccionar un estimador y un plan de Queremos seleccionar un estimador y un plan de muestreo que:muestreo que:

1.1. Nos asegure que la esperanza de el estimador Nos asegure que la esperanza de el estimador sea el parámetro (E(sea el parámetro (E(00) = ) = ) ) InsesgadoInsesgado

2.2. La varianza del estimador tenga la menor La varianza del estimador tenga la menor varianza posible (varianza posible (22((00) → sea baja) ) → sea baja) EficienteEficiente

De dos estadísticos De dos estadísticos 11 y y 22, el que tenga menor , el que tenga menor

varianza será el mas eficiente.varianza será el mas eficiente.

Error de Estimación Conociendo el estadístico Conociendo el estadístico 00 usado, y su usado, y su

distribución de probabilidad, podemos evaluar su distribución de probabilidad, podemos evaluar su error de estimación. error de estimación.

““El valor absoluto de la diferencia entre el El valor absoluto de la diferencia entre el estadístico y el parámetroestadístico y el parámetro” (” (E=E=). ).

No sabemos exactamente cuanto es No sabemos exactamente cuanto es (desconocemos parámetro (desconocemos parámetro ), ),

Podemos encontrar límites entre los cuales Podemos encontrar límites entre los cuales existe una probabilidad de que se encuentre el existe una probabilidad de que se encuentre el parámetro parámetro :: P(P(. .

Estadísticos de CentralizaciónEjercicio02a - Estadisticos.xlsxEjercicio02a - Estadisticos.xlsx

Media poblacional Media poblacional La media aritmética de datos de toda la poblaciónLa media aritmética de datos de toda la población Representa esperanza matemática de variable Representa esperanza matemática de variable

aleatoria: aleatoria:

Este parámetro no lo conocemos, y no lo Este parámetro no lo conocemos, y no lo conoceremos nunca a no ser que conoceremos nunca a no ser que muestreáramos la población completa. muestreáramos la población completa.

Para estimarlo usamos el estadístico promedio o Para estimarlo usamos el estadístico promedio o media muestreal media muestreal x.x.

1

1Nxi

N

Estadísticos de Centralización Promedio o media poblacionalPromedio o media poblacionalx :x :

La media aritmética de los datos de la muestraLa media aritmética de los datos de la muestra

Al ser Al ser la esperanza matemática de los la esperanza matemática de los x, esta x, esta puede calcularse también de la siguiente forma:puede calcularse también de la siguiente forma:

j es j-esimo grupo de un total de k gruposj es j-esimo grupo de un total de k grupos nnjj es el número de individuos en el j-esimo grupo es el número de individuos en el j-esimo grupo

xxjj es la media del j-esimo grupo es la media del j-esimo grupo

x =1

nxii

n

1

k

jj xN

n

1

Estadísticos de Centralización

Promedio ponderadoPromedio ponderado

xn

nxjj

k

1

Estadísticos de Centralización Moda: Marca de clase del intervalo con mayor Moda: Marca de clase del intervalo con mayor

frecuencia frecuencia Aproximadamente: Valor que mas encontramos en Aproximadamente: Valor que mas encontramos en

nuestro muestreo.nuestro muestreo.

Mediana: valor más cercano a la mitad si los Mediana: valor más cercano a la mitad si los ordenamos, o valor con igual número de datos ordenamos, o valor con igual número de datos mayores que menores a él.mayores que menores a él. Valor del dato número (n+1)/2 cuando n es impar Valor del dato número (n+1)/2 cuando n es impar Media del dato # (n/2) y el dato # (n/2 +1) cuando n es Media del dato # (n/2) y el dato # (n/2 +1) cuando n es

par.par.

Estadísticos de Dispersión Medidas de centralización dan una idea de hacia Medidas de centralización dan una idea de hacia

dónde están distribuidos nuestros datos, pero no dónde están distribuidos nuestros datos, pero no de cómo están distribuidos. de cómo están distribuidos.

Probabilidad de dato igual a la media tiende a 0Probabilidad de dato igual a la media tiende a 0 Media de posibles valores un dado 3.5Media de posibles valores un dado 3.5 Cruce de Rio; Pies en horno, cabeza refrigeradorCruce de Rio; Pies en horno, cabeza refrigerador Dos poblaciones con igual media pero dispersión Dos poblaciones con igual media pero dispersión

de datos distinta: Poblaciones distintasde datos distinta: Poblaciones distintas

Estadísticos de Dispersión Parámetro Parámetro varianza poblacionalvarianza poblacional 22 : :

Promedio de cuadrados de las desviaciones Promedio de cuadrados de las desviaciones de los valores de una variable en población de los valores de una variable en población con respecto a media poblacionalcon respecto a media poblacional

xxii-- es distancia de cada punto a la media es distancia de cada punto a la media Se eleva al cuadrado porque si no distancias Se eleva al cuadrado porque si no distancias

positivas y negativas se anularían dando 0positivas y negativas se anularían dando 0

2 i2

=( x - )N

Varianza Fisher (1918) Fisher (1918) “The Correlation Between Relatives on the “The Correlation Between Relatives on the

Supposition of Mendelian Inheritance”Supposition of Mendelian Inheritance” El gran cuerpo de las estadísticas disponibles nos muestran que El gran cuerpo de las estadísticas disponibles nos muestran que

las desviaciones de una medida humana de su media siguen muy las desviaciones de una medida humana de su media siguen muy de cerca la ley normal de los errores, y, por tanto, que la de cerca la ley normal de los errores, y, por tanto, que la variabilidad puede ser medida de manera uniforme por la variabilidad puede ser medida de manera uniforme por la desviación estándar correspondiente a la raíz cuadrada de la desviación estándar correspondiente a la raíz cuadrada de la media del cuadrado del error. media del cuadrado del error.

Cuando hay dos causas de variabilidad independientes, capaces Cuando hay dos causas de variabilidad independientes, capaces de producir en una distribución poblacional de otra manera de producir en una distribución poblacional de otra manera uniforme, con desviaciones estándar θ1 y θ2, se encuentra que la uniforme, con desviaciones estándar θ1 y θ2, se encuentra que la distribución, cuando ambas causas actúan juntas, tiene una distribución, cuando ambas causas actúan juntas, tiene una desviación estándar desviación estándar

Por tanto, es conveniente en el análisis de las causas de la Por tanto, es conveniente en el análisis de las causas de la variabilidad, trabajar con el cuadrado de la desviación estándar variabilidad, trabajar con el cuadrado de la desviación estándar como la medida de la variabilidad. Vamos a llamar esta cantidad, como la medida de la variabilidad. Vamos a llamar esta cantidad, la la varianzavarianza

Propiedades de la Varianza (1)

1.1. Es positiva (Es positiva (22))

2.2. Es en distintas unidades que la variable (Es en distintas unidades que la variable (22))

3.3. No varía por localización. Sumar constante a todos los No varía por localización. Sumar constante a todos los datos: misma varianza. datos: misma varianza. Var(x + a) = Var(x)Var(x + a) = Var(x)

4.4. Si se multiplica todos los datos por una constante, Si se multiplica todos los datos por una constante, varianza se multiplica por constantevarianza se multiplica por constante22 Var(ax) = aVar(ax) = a22Var(x)Var(x)

5.5. La varianza de la suma de variables aleatorias es igual La varianza de la suma de variables aleatorias es igual a la suma de sus varianzas + 2 veces su covarianza.a la suma de sus varianzas + 2 veces su covarianza.

6.6. Generalizando para N VariablesGeneralizando para N Variables

Propiedades de la Varianza (2)7.7. Varianza = Promedio de cuadrados – el cuadrado del Varianza = Promedio de cuadrados – el cuadrado del

promediopromedio

Var (X)= 1/N Var (X)= 1/N xxii22 - - xx22

8.8. La varianza de la suma de variables aleatorias La varianza de la suma de variables aleatorias independientesindependientes es igual a la suma de sus varianzas: es igual a la suma de sus varianzas:

Var(X + Y) = Var(X) + Var (Y)Var(X + Y) = Var(X) + Var (Y)

generalizando:generalizando:

9.9. Si las variables independientes tienen la misma varianza, la Si las variables independientes tienen la misma varianza, la varianza de su promedio puede transformarse multiplicando varianza de su promedio puede transformarse multiplicando por (1/n)por (1/n)2 2 ((44). ).

**Recordar este Recordar este 22/n para teorema central del limite/n para teorema central del limite

Estadísticos de Dispersión Varianza empírica sVarianza empírica s22 es el estadístico mediante es el estadístico mediante

el cual hacemos estimaciones de nuestro el cual hacemos estimaciones de nuestro parámetro varianza poblacional. parámetro varianza poblacional.

Ya que sYa que s22 sería estimador sesgado de sería estimador sesgado de 22 si la si la dividimos para n, se la divide por n-1:dividimos para n, se la divide por n-1:

A medida que tamaño de la muestra (n) A medida que tamaño de la muestra (n) aumenta, sesgo entre aumenta, sesgo entre 22 y s y s22 disminuye disminuye

2 i2

s =( x - x )n -1

Estadísticos de Dispersión La desviación típica o La desviación típica o desviación estándardesviación estándar ( ( o o

s), es la raíz cuadrada positiva de la varianza. s s), es la raíz cuadrada positiva de la varianza. s es estimador es estimador sesgadosesgado de de ..

El El rangorango es la diferencia entre el valor del mayor es la diferencia entre el valor del mayor dato y el valor del menor dato.dato y el valor del menor dato.

Desviación mediaDesviación media: : promedio de las desviaciones promedio de las desviaciones absolutas respecto al promedio: absolutas respecto al promedio: DM=DM=|xi-|xi-x|/nx|/n

Error típicoError típico de la media: estima s para la de la media: estima s para la distribución dedistribución dex: x: SSx x = s / √n= s / √n

Coeficiente de variaciónCoeficiente de variación: expresión porcentual : expresión porcentual de variación (sin unidades): de variación (sin unidades): CV= s x 100 /CV= s x 100 /xx

Est. Disp. Usan 1 decimal más que la muestraEst. Disp. Usan 1 decimal más que la muestra

Introduccion al Excel Como Herramienta Estadistica

Versatilidad:Versatilidad: Hoja de calculoHoja de calculo Base de datosBase de datos DiagramadorDiagramador Lenguaje de programaciónLenguaje de programación Análisis de datosAnálisis de datos

Modelo de objeto:Modelo de objeto: AplicationAplication Workbook Workbook WorksheetWorksheet Range Range Otros objetos:Otros objetos:

Otros Objetos:Otros Objetos: RowRow ColumnColumn CellCell AreaArea Rangos con NombreRangos con Nombre

Interfaz de Usuario? VentanasVentanas Menu de Excel 2003 y anterioresMenu de Excel 2003 y anteriores Cinta de opciones Excel 2007Cinta de opciones Excel 2007 Barra(s) de HerramientasBarra(s) de Herramientas Barra de formulasBarra de formulas Cuadro de nombresCuadro de nombres Barra de estadoBarra de estado MacrosMacros ComplementosComplementos Archivos personalesArchivos personales Entrada de datos e interfaz con el usuarioEntrada de datos e interfaz con el usuario

Tipos de Datos/Objetos? TextoTexto NúmerosNúmeros FormatosFormatos FórmulasFórmulas

Referencias absolutas y relativasReferencias absolutas y relativas FuncionesFunciones MatricesMatrices Referencias RemotasReferencias Remotas ComentariosComentarios GráficosGráficos Tablas y gráficos dinámicosTablas y gráficos dinámicos Otros objetosOtros objetos

Operaciones Básicas?

DesplazamientoDesplazamiento Teclas de acceso rápidoTeclas de acceso rápido Funciones MouseFunciones Mouse SelecciónSelección Direcciones relativas y absolutasDirecciones relativas y absolutas Nombres de rangoNombres de rango Copiar, Cortar. Pegar , Pegado Especial.Copiar, Cortar. Pegar , Pegado Especial. AsistentesAsistentes PersonalizaciónPersonalización

Funciones Estadisticas

MuchasMuchas Muy UtilesMuy Utiles Algunas no se para que son o no las he Algunas no se para que son o no las he

usadousado Aplasten F1 y lean de que se tratanAplasten F1 y lean de que se tratan Pruebenlas y comparenlas con calculos Pruebenlas y comparenlas con calculos

“manuales”.“manuales”. Revisaremos las mas frecuentes.Revisaremos las mas frecuentes. Existen rutas alternas en ExcelExisten rutas alternas en Excel

Herramientas de Analisis de Datos

Complemento de Excel Complemento de Excel Existen otros complementos estadisticos Existen otros complementos estadisticos

de tercerosde terceros Tienen sus ventajas y sus limitacionesTienen sus ventajas y sus limitaciones Existen rutas alternas en ExcelExisten rutas alternas en Excel

Herramientas No Estadisticas Utiles Para la Estadistica

Modelo de Hoja de CalculoModelo de Hoja de Calculo FormulasFormulas Funciones no EstadisticasFunciones no Estadisticas Ordenar, filtrar.Ordenar, filtrar. GraficosGraficos Tablas Dinamicas y GraficosTablas Dinamicas y Graficos ODBC, conecciones y otros datos ODBC, conecciones y otros datos

externosexternos MacrosMacros

Ejercicio Practico Calcular en Ejercicio02b - Estadisticos.xlsx:Calcular en Ejercicio02b - Estadisticos.xlsx:

SumaSuma nn xx ModaModa MedianaMediana ss22 y s y s Maximo, mínimo y rangoMaximo, mínimo y rango Error típico, coeficiente de variaciónError típico, coeficiente de variación Analisis de Datos / Estadistica DescriptivaAnalisis de Datos / Estadistica Descriptiva

Usar Formula y FunciónUsar Formula y Función