Estadistica I (I Bimestre)

49
ESCUELA: PONENTE: ESTADISTICA I CICLO: INFORMATICA Ing. Carlina Rueda OCTUBRE 2008 – FEBRERO 2009 BIMESTRE: I BIMESTRE

Transcript of Estadistica I (I Bimestre)

ESCUELA:

PONENTE:

ESTADISTICA I

CICLO:

INFORMATICA

Ing. Carlina Rueda

OCTUBRE 2008 – FEBRERO 2009

BIMESTRE: I BIMESTRE

• Métodos de adquisición del conocimiento• Terminología básica• Estadística descriptiva e inferencial• Escalas de medición• Variables continuas y discretas• Distribuciones de frecuencias • Medidas de tendencia central y

variabilidad

CONTENIDOS:

CAPITULO I:

LA ESTADÍSTICA Y EL MÉTODO CIENTÍFICO

1.1 MÉTODOS DE ADQUISICIÓN DEL CONOCIMIENTO

Cuatro métodos para adquirir conocimiento:Autoridad: la verdad es una tradición o alguna persona importante dice que lo es.

Racionalismo: mediante el razonamiento correcto de acuerdo con las reglas de la lógica las conclusiones llegarán a la verdad.

Intuición: con frecuencia la idea parece surgir después de que ha fallado el razonamiento.

Método científico: se fundamenta en la evaluación objetiva que es lo que lo distingue de los otros métodos.

1.2 CICLOS ITERATIVOS DEL MÉTODO CIENTIFICO

Estadística:“La ciencia de la recolección y análisis de datos

para la toma de decisiones.”

1.3 CONCEPTOS BASICOS

Estadística Descriptiva: Estudia las técnicas que se utilizan para describir o caracterizar los datos obtenidos.

Estadística Inferencial: Parte de la deducción de leyes que rigen los diferentes fenómenos, para la toma de decisiones.

Población: es el conjunto de elementos de referencia sobre el que se realizan las observaciones.

Muestra: un subconjunto de casos o individuos de una población estadística.

Variable: es una característica que puede ser medida, adoptando diferentes valores en cada uno de los casos de un estudio.

Cualitativas Nacionalidad, profesor

Cuantitativas Temperatura, edad

Discretas sexo

Continuas Estatura, peso

Constantes El valor de ∏

Datos: medidas que se realizan sobre los sujetos de un experimento.

Estadística: número calculado a partir de los datos de una población.

Parámetro: valor calculado sobre los datos de una población, que cuantifica una característica de la población.

CAPITULO II:

CONCEPTOS BÁSICOS DE MATEMÁTICAS Y DE MEDICIÓN

2.1 NOTACIÓN MATEMÁTICA

X o Y Variable medida

N número total de sujetos o datos

Xi es el i-ésimo dato

SUMATORIA (∑)

∑=

N

i

Xi1

∑=

++++=N

iNXXXXXi

1321 ...

EJERCICIOS

Para los siguientes datos, determine:

a. b.

c. d.

13,11,12,10,8,6 654321 ====== XXXXXX

∑=

4

1i

Xi ∑=

−5

2

)2(i

Xi

∑=

3

!

2

i

X

23

1

⎟⎠

⎞⎜⎝

⎛∑=i

X

2.2 MEDICION

“La medición es la descripción de datos en términos de números” (Guilford)

Escalas de Medición: Nominales Ordinales De Intervalos De Razón

a. Escalas Nominales:Equivale a clasificar los objetos en categorías mutuamente excluyentes y darles un nombre.

b. Escalas Ordinales: Se ordenan los objetos medidos según si poseen

más, menos o la misma cantidad de la variable medida.

c. Escalas de Intervalos:Tiene intervalos iguales entre las unidades adyacentes. Las diferencias equivalentes entre los números son de la misma magnitud en la variable

d. Escalas de Razones:Posee las propiedades de magnitud, intervalos iguales entre las unidades adyacentes y un cero absoluto.

2.3 VARIABLES

Variables Continuas:Teóricamente puede asumir un número infinito de valores entre las unidades adyacentes de una escala.

Variables Discretas: Para la cual no existen valores posibles entre las

unidades adyacentes en una escala.

2.4 CIFRAS SIGNIFICATIVAS

Redondeo:

NúmeroRespuesta; Residuo

Residuo decimal

Respuesta final

Razón

34.01350

34.01;350 .350 34.01 El residuo decimal es menor que ½ se deja el ultimo digito.

34.01761

34.01;761 .761 34.02 El residuo decimal es mayor que ½, le sumo uno al ultimo digito.

45.04500

45.04;500 .500 45.04 El residuo decimal es igual a ½ y el ultimo dígito es par

45.05500

45.05;500 .500 45.06 El residuo decimal es igual a ½ y el ultimo dígito es impar

EJERCICIOS

Redondee cada uno de los siguientes números a una cifra decimal, dos cifras decimales y tres decimales.

39.8899 45.2534 55.5650 75.5350

CAPITULO III:

DISTRIBUCIONES DE FRECUENCIAS

3.1 DISTRIBUCION DE FRECUENCIAS

• Presenta los valores de los datos y su frecuencia de aparición, enumerados en orden donde por lo general el valor del dato menor aparece en la parte inferior.

• Muestra los datos de una manera que facilite su comprensión e interpretación.

Dist. de Frecuencia Relativa: Proporción del número total de datos que aparecen en cada intervalo.

Dist. de Frecuencia Acumulada: Número de datos que esta por debajo del limite real superior de cada intervalo.

Dist. de Porcentaje Acumulados: Porcentaje de datos que esta por debajo del limite real superior de cada intervalo.

N

fflativa =Re

100*%N

fAcumuladaacumulado =

Distribución de Frecuencia de datos no Agrupados: Corresponde a la variables discretas, se ordena los

valores de menor a mayor y cuantas se observa este valor.

Edad N° niños

xi ni fi Ni Fi

5 27 0,11 27 0,116 21 0,08 48 0,197 34 0,14 82 0,33

8 30 0,12 112 0,459 38 0,15 150 0,60

10 33 0,13 183 0,7311 32 0,13 215 0,8612 35 0,14 250 1,00

250 1,00

Distribución de Frecuencia de datos Agrupados: Asocia a las variable continuas, a través de intervalos en

los que agrupar los valores de la variables así como la amplitud de los mismos.

Edad N° niños

xi ni fi Ni Fi

11-12 67 0,27 67 0,27

9-10 71 0,28 138 0,55

7-8 64 0,26 202 0,81

5-6 48 0,19 250 1,00

250 1,00

ELABORACION DE UNA DISTRIBUCION DE FRECUENCIAS AGRUPADAS

1. Determinar el rango

2. Determinar la amplitud de cada intervalo de clase (i)

lasetervalodecNúmerodeIn

Rangoi =

min.max. DatDatRango −=

3. Listar los intervalos: El limite inferior debe contener al dato

mínimo El limite inferior del intervalo sea divisible

para i.

4. Conteo de datos

3. Suma de Frecuencias

3.2 PERCENTILES

“Son medidas de posición relativa”

PUNTO PERCENTIL: valor sobre la escala de medición, debajo del cual se encuentra un porcentaje dado de los datos incluidos en la distribución.

( )AcumuladafAcumuladaff

iXP Lp

iL −⎟⎟

⎞⎜⎜⎝

⎛+=

RANGO DE PERCENTIL: Es el porcentaje de datos que tienen valores más bajos que el dato en cuestión.

( )100*

N

xxif

AcumuladafntilRangoPerce

Li

L −⎟⎠⎞

⎜⎝⎛+

=

3.3 GRAFICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS

Representa datos de intervalos o de razones.1. Histogramas: barras2. Polígono de Frecuencias: puntos2. Diagrama de Tallos y de Hojas: resumir y

describir los datos de una muestra.82 8 tallo

2 hoja

EJERCICIOS

1. En una empresa se trabajo un año en un proyecto, por lo que se quiere obtener las horas trabajadas por empleados; para lo que se tomo una muestra de 50 empleados.

a. Realice una distribución de frecuencia de datos agrupados con 11 intervalos aproximadamente.

b. Elabore un histograma de la distribución.c. La distribución es simétrica o asimétrica.d. Construya un diagrama de tallo y hojas en

el que el último digito sea una hoja y los dos primeros dígitos un tallo. No repita los valores de los tallos.

320 282 341 324 340 302 336 265 313 317

310 335 353 318 296 309 308 310 277 288

314 298 315 360 275 315 297 330 296 274

250 274 318 287 284 267 292 348 302 297

270 263 269 292 298 343 284 352 345 325

2. De los datos de la tabla anterior determine:

La frecuencia relativa La frecuencia acumulada Percentil 50 Percentil 75 Rango Percentil del dato 275 Rango Percentil del dato 218

CAPITULO IV:

MEDIDAS DE TENDENCIA CENTRAL Y VARIABILIDAD

MEDIA ARITMETICA

“Suma de los datos dividida entre el número de los mismos”

Es el fundamento de muchas otras técnicas estadísticas

Se representa por M o__

X

N

XM ∑=

Propiedades:

La media es sensible al valor exacto de todos los datos de la distribución.

La suma de las desviaciones con respecto a la media es igual a cero.

La media es el centro de equilibrio de la distribución.

( )∑ =− 0XXi

Propiedades:

La suma de los cuadrados de las desviaciones de todos los datos en torno a su medida es la más pequeña posible.

( )∑ −2

XXi

MEDIANA

“El valor de la escala debajo del cual se encuentra 50% de los datos”

Se representa por Md La mediana es el dato que esta ubicado:

Si es impar en el centro Si es par es el promedio de los dos datos

ubicados al centro.

Propiedades:

La mediana es menos sensible que la media a la presencia de datos extremos.

La mediana no se ve afectada si todas las frecuencias se multiplican o dividen por una misma constante.

Para el cálculo no hace uso de toda la información que suministra la variable.

MODA

“Dato más frecuente en la distribución”

Se representa por Mo Puede existir mas de una moda:

Unimodal Bimodal Multimodal (pierde sentido)

No le afectan los valores extremadamente pequeños ni grandes.

Características:

No se usa mucho en las ciencias del comportamiento porque no es muy estable.

Propiedades similares a las de la mediana.

4.1 MEDIDAS DE VARIABILIDAD O DE DISPERSION

La variabilidad se refiere a cuan alejados de la media están los datos.

RangoDesviación EstándarVarianza

RANGO

”Diferencia entre los datos máximos y mínimos de una distribución”

MINMAX XXR −=

DESVIACION ESTÁNDAR

”Raíz cuadrada de la media de los cuadrados de las desviaciones con

respecto a la media de la distribución”

Distribución Poblacional Distribución Muestral

Datos en bruto

( )n

xxs

n

ii∑ −

=

2 ( )1

2

−=∑=

n

xxS

n

iii

( )

1

2

2

−=

−= ∑∑

N

SCS

N

xxSC

VARIANZA

”Es la diferencia entre el valor de cada observación y la media”

Varianza Poblacional Varianza Muestral

Es el promedio de las desviaciones respecto de la media aritmética

( )N

X∑ −=

2

2 μσ

( )1

2

2

−=∑

n

XXS

EJERCICIOS Dado los siguientes datos calcular.

1, 8,12,3,8,14,4,5,8,16 Media Mediana Moda Rango Desviación Estándar Varianza

Gracias

• E-mail: [email protected]• Telf. 2570-2750 ext. 2931• Tutoría: Martes y Miércoles de

16H00 – 18H00 pm

49