I Actividades de aprendizaje
Lee y analiza lo siguiente. Luego contesta lo que se te pide. Puedes trabajar cotí un
compañero. Si tienes alguna duda, consulta a tu maestro (a).
Q E S T A D Í S T I C A S DE LA DISTANCIA DE LA T I E R R A AL SOL
El astrónomo Johannes Kepler (1571-1630) descubrió que los planetas del
sistema solar se mueven en órbitas elíptica alrededor del Sol, pero las cuales
son casi circunferencias. En un observatorio astronómico se ha decidido
medir la distancia en kilómetros de la Tierra al Sol; se obtienen diez datos al
azar en un periodo de cinco meses. Enseguida se muestran los datos en el
orden en que fueron tomados: 149900000; 149800000; 149600000;
149400000; 148900000; 148600000; 148500000; 148400000; 148200000;
148050000.
Trayectoria elíptica de la Tierra alrededor del Sol
H ¿Cuál es el fenómeno que se estudia en el observatorio?
[b] ¿Qué preguntas se plantearía Kepler en su investigación? Externa dos
posibles.
0 ¿Cuál es la variable que se estudia en el observatorio?
[d¡ ¿Qué unidad tiene esa variable?
H ¿De qué tipo y densidad es la variable?
(Tj ¿En qué escala se mide esa variable?
ÜO ¿El universo o población de las mediciones de la distancia de la Tierra al
Sol comprende sólo estos 10 datos? ¿Cuántos datos pueden obtenerse de
esa distancia?
1.1.5 | Población y muestra
Población y muestra son conceptos que tienen que ver directamente con la materia
prima de la estadística: las variables y las mediciones o datos numéricos. Para expli
car sus diferencias y definirlos, tomaremos como referencia la siguiente situación.
En la Sierra Madre Occidental, en los estados de Colima, Jalisco, Nayarit y Zaca
tecas, viven los indígenas de la etnia Huichol. Una socióloga desea averiguar el peso
y la altura de las niñas entre 1 y 8 años inclusive; define tres poblaciones o univer
sos diferentes tomando en cuenta distintos factores:
A: El peso y la altura de las niñas huicholas con edades desde un año hasta inclusi
ve ocho años cumplidos.
B: El peso en kilogramos y la altura en metros de las niñas huicholas con edades
desde un año hasta inclusive ocho años cumplidos pero no más de nueve, que
viven en la Sierra Madre Occidental.
C: El peso en kilogramos y la altura en metros de las niñas huicholas con edades
desde un año cumplido hasta menos de nueve años cumplidos, que no padecen
alguna enfermedad; hijas de padres huicholes que en el año 2007 formen parte
de comunidades indígenas enclavadas en la Sierra Madre Occidental en los esta
dos de Zacatecas y Nayarit. .
Consideraciones:
1) Observemos que en la tercera definición de población se incluyen más factores,
lo cual la hace muy específica.
2) En la población A, ¿podría incluirse a las niñas que viven en las ciudades? ¿Por
qué?
3) E n l a población B, ¿podrían incluirse niñas huicholas de cualquier estado de la
República mexicana? ¿Por qué?
[h] ¿En qué hecho percibes que existe variabilidad en los datos?
[T] ¿Crees que las distancias obtenictas son medidas exactas o aproxima
das? ¿Por qué?
\T\ Al observar los datos, ¿qué puede inferirse acerca del desplazamiento de
la Tierra alrededor del Sol?
E ¿Cuál fue la conclusión de Kepler?
[Q ¿Kepler realizaría un procedimiento como el descrito en una situación
estadística? ¿Por qué? Explica.
P O B L A C I Ó N
Una población debe especificarse correctamente antes de iniciar un proceso de in
dagación sobre ella. Esto implicará un conocimiento preciso ,de la ubicación de la
misma, sus integrantes, la variable que se desea estudiar y su relación con el tiem
po, entre otros aspectos que permitirán tomar decisiones correctas sobre diferen
tes elementos que intervienen en la calidad de los datos. Esto quiere decir que entre
más factores se incluyan en la definición de una población, disminuirá la variación
de las mediciones; esto es, los datos numéricos se parecerán más.
Por ejemplo, si se estudia el grado de conocimientos de matemáticas de los alum
nos de tu bachillerato al terminar el quinto semestre, mediante un mismo examen
(eliminando que cualquier grupo de estudiantes sea favorecido de alguna forma)
parece obvio que definir a la población como "los alumnos del bachillerato que
acaban de terminar el quinto semestre", la diferencia entre la calificación mayor y
la menor será más grande que si se define a la población como "los alumnos de ba
chillerato del sexo masculino que acaban de terminar el quinto semestre con un
promedio académico igual a o mayor que 8.5". Esta segunda población conforma
un grupo de estudiantes más homogéneo y con promedios de calificación más pa
recidos que en la primera.
En la figura 1.8 se describen cinco factores esenciales que generalmente se utili
zan para definir una población o universo de investigación. No siempre se utilizan
todos, pero la variable, la unidad de medida y los objetos o individuos que poseen la
característica son imprescindibles.
Q U É : La(s) variable(s)
que se debe(n) medir.
C U Á N D O : El momento
en que se hará
la medición.
P A T R Ó N : La(s)
unidad(es) de medida
de la(s) variable(s).
Q U I É N E S : Los seres u objetos
cuya(s) característica(s) se
medirá(n).
D Ó N D E : El lugar donde se
ubican los seres u objetos cuya(s)
característica(s) se mediráfn).
Figura 1.8
Factores con que se
construye la definición
de una población
En la tabla 1.8 hemos identificado cuáles de los factores que se muestran en el
esquema de la figura 1.8 se incluyeron en las poblaciones A y C de nuestro ejemplo.
Tabla 1.8 Factores de definición de las poblaciones Ay C
FACTOR P O B L A C I Ó N A ¡ P O B L A C I Ó N C
Qué: la variable
o variables i El peso y la altura { El peso y la altura
Unidades de medida ¡ Kilogramo y metros
Quiénes
Niñas huicholas desde un año
| hasta inclusive ocho años
! cumplidos
1 Niñas huicholas de un año
i cumplido a menos
i : de nueve años
Dónde
i En comunidades indígenas
i enclavadas en la Sierra Madre
i Occidental en los estados de 1 Zacatecas y Nayarit
Cuándo ¡ Año 2007
Como puedes observar, para la población C se consideran más factores que para
la población A. Cuando se incluyen más factores en la definición de una población,
ésta tiene menor grado de generalidad. Así, la población A tiene mayor grado de
generalidad que la población C.
Población: Es el total de mediciones o conteos de una característica común
asociada a un conjunto bien definido de individuos u objetos.
Una población puede estar compuesta por un número finito de mediciones o ser
infinita (véase la figura 1.9).
Figura 1.9
Significado de población
finita e Infinita
F I N I T A : Se compone de un número
finito de mediciones.
I N F I N I T A : El número de mediciones
en ella no es finito.
Podemos ejemplificar lo anterior como sigue.
° Ejemplo 1.22
En el bachillerato "Lic. Benito Juárez", con sede en la ciudad de Quérétaro, hay 1500
estudiantes. Un investigador deseaba tener una idea acerca del tiempo diario en
horas que dedican al estudio los alumnos. Seleccionó 40 alumnos al azar y los en
trevistó. Luego ordenó los datos como se muestra en la tabla 1.9.
Tabla 1.9 T iempo en horas diarias que dedican al estudio 40 a lumnos
seleccionados al azar (datos ordenados del menor al mayor
por co lumna)
0.05 0.24 0.55 1.20 2.10 2.52 3.48 6.21
0.11 0.38 0.86 1.60 2.12 2.55 3.83 7.56
0.18 0.42 0.88 1.90 2.19 2.56 5.12 7.68
0.21 0.44 0.92 1.98 2.21 3.03 5.20 8.15
0.24 0.53 1.02 2.06 2.23 3.34 5.56 8.75
1) La pregunta del investigador es "¿Cuánto tiempo diario en horas dedican a es
tudiar los alumnos y alumnas del bachillerato?"
2) La variable en estudio es "el tiempo diario de estudio"; es continua y puede to
mar infinidad de valores.
3) La unidad de medición es "la hora".
4) Las mediciones poseen tres cifras significativas.
5) Se puede definir la población de la siguiente manera: El tiempo diario en horas
que estudian los alumnos en el bachillerato "Lic. Benito Juárez" establecido en la
ciudad de Quérétaro.
6) La población o universo de las mediciones tiene en total 1500 mediciones.
7) El investigador no estudia las 1500 mediciones posibles, sino sólo una porción
de ellas; esto puede ser por economía o rapidez.
8) El porcentaje de alumnos entrevistados que dedica al estudio más de 2 horas
21 diarias es: — X 100% = 52.5%.
40 9) La selección al azar quiere decir que el investigador seleccionó a los alumnos
sin preferencia alguna, utilizando un recurso como el que se usa en cualquier
lotería.
10) Si se incluyen más factores en la definición de la población, ésta es-más precisa
y limita más claramente lo que debe observarse. Por ejemplo, pudo haberse de
finido la población anterior como sigue: El tiempo diario en horas que estudian
los alumnos de sexo masculino inscritos en el primer semestre del bachillerato
"Lic. Benito Juárez" establecido en la ciudad de Quérétaro. Esta población tiene
menor grado de generalidad.
I Actividades de aprendizaje
En equipos de cuatro integrantes, lean y analicen los siguientes ejemplos y contes
ten lo que se pide. Aclara tus dudas con tu profesor(a).
Q D E F I N I C I Ó N DE UNA P O B L A C I Ó N
Q0 Definan la población estudiada en el ejemplo 1.22 con un menor grado
de generalidad, identificando las nuevas características o factores im
plicados.
[b] Den una nueva definición de la población anterior pero ahora con ma
yor grado de generalidad.
Q D I Á M E T R O DE V Á L V U L A S
La empresa Margolius desde el año 1980 produce válvulas de cobre circula
res para el drenaje de calentadores de agua. Produce alrededor de 100 mil
válvulas al año. Esas válvulas se producen en una línea automática que pro
cesa tubos de cobre doblándolos y enroscándolos. Las especificaciones indi
can que el diámetro debe ser de 2.54 cm ± 0.02 cm. Las válvulas que no cum
plen con la especificación se desperdician. Para verificar la calidad de las
válvulas, se toman 10 válvulas cada media hora, se mide el diámetro y se ob
serva la rosca. En un día de producción se toman 140 datos de la variable
"diámetro de la válvula" en cm, como se muestran en la siguiente tabla.
Diámetro de válvulas para drenaje. Catorce muestras de t a m a ñ o 10 (12 de mayo de 2007)
D A T O S
I—• 1 — ' — • I 1 1 1 1 1 : 1 1 1 —' r
1 2 3 4 5 6 7 8 9 1 0 1 1 1 2 1 3 1 4
2.567 2.566 2.566 2.544 2.574 2.574 2.513 2.552 2.549 2.567 2.542 2.540 2.559 2.532
2.503 2.541 2.541 2.552 2.531 2.531 2.499 2.565 2.543 2.552 2.520 2.531 2.544 2.527
2.549 2.540 2.540 2.561 2.552 2.552 2.540 2.541 2.513 2.525 2.563 2.550 2.507 2.554
2.520 2.553 2.553 2.522 2.555 2.555 2.537 2.579 2.524 2.538 2.536 2.516 2.556 2.545
2.548 2.538 2.538 2.546 2.534 2.534 2.576 2.587 2.530 2.538 2.554 2.570 2.530 2.529
2.529 2.561 2.561 2.547 2.548 2.548 2.535 2.548 2.569 2.520 2.529 2.580 2.551 2.567
2.527 2.523 2.523 2.532 2.527 2.527 2.507 2.525 2.537 2.526 2.555 2.523 2.558 2.505
2.545 2.513 2.513 2.562 2.513 2.513 2.550 2.556 2.576 2.548 2.552 2.571 2.516 2.557
2.593 2.557 2.557 2.536 2.530 2.530 2.583 2.539 2.550 2.535 2.536 2.546 2.550 2.485
2.557 2.531 2.531 2.554 2.561 2.561 2.567 2.509 2.552 2.538 2.564 2.533 2.541 2.549
[al ¿Cuántas mediciones se hicieron en el día?
[b] El total de observaciones hechas ese día, ¿es una población? ¿Por qué?
0 ¿Podría medirse en un momento dado toda la población? ¿Por qué?
[d] Definan la población bajo estudio en dos versiones: la versión dada en el
enunciado y una versión con menor grado de generalidad.
0 ¿De qué tamaño puede considerarse la población? ¿Finita o infinita?
¿Por qué?
|Tj ¿Cuáles dimensiones del diámetro de la válvula hacen que ésta se des
perdicie?
[s] ¿Qué porcentaje de las válvulas resultó defectuosa en la porción de me
diciones tomada para el estudio.
H M A E S T R O S A L B A Ñ I L E S
Una compañía constructora paga por destajo el pegado de ladrillos. La cons
tructora contrata 12 maestros que pegan ladrillo para construir una biblio
teca. Al final de la obra, que duró 20 días, calculan las ganancias en pesos por
maestro. Analicen la siguiente tabla para estimar el precio de la obra total.
Gananc ias en pesos de los 12 maestros albañi les
M A E S T R O A L B A Ñ L
A R T B E N C A R I DAV E R N | F E R ¡ G I L
1 1
¡ H U M ¡ 1 1
I G N ¡ Jos ¡ K R I Luí
8 500 7 9 0 0 9 9 0 0 8 700 7 9 0 0 ¡ 8 3 0 0 | 10700 1 1
9 2 0 0 ¡ 8 6 0 0 8 5 0 0 ] 8 2 0 0 9 9 0 0
0 ¿Cuál es la variable que se observa?
[b] ¿En qué escala se mide esa variable?
0 ¿Cuál es la población que se estudia? Defínanla.
[d] ¿De qué tamaño es la población? ¿Es finita o infinita? ¿Por qué?
0 ¿Cuánto ganaron en total los maestros albañiles?
0 ¿Quién puede decirse que es el albañil más eficiente? ¿Por qué?
En estas actividades has tenido que considerar la definición y elementos de una
población o universo en algunos contextos. Ahora bien, imagina que el inves
tigador de la empresa Margolius (actividad 2) decidiera medir cada una de las
100 000 válvulas que se producen al año para verificar la calidad. ¿Qué sucedería?
¿Qué fue lo que hizo el investigador? En la siguiente sección se estudia ese caso.
M U E S T R A
La muestra y los datos numéricos que de ella se obtienen son los elementos funda
mentales en la estadística inferencial. De la muestra se obtienen conclusiones acer
ca de la población. En el caso de la empresa Margolius de la actividad 2 anterior, el
investigador tomó una parte de las mediciones posibles de la población porque le
sería imposible medirlas todas. Se dice que tomó una muestra. Esto es, los investi
gadores generalmente no miden a toda la población porque es imposible o muy
costoso.
Muestra: Es una porción de medidas o conteos tomados de una población.
En una situación estadística, generalmente se sigue la pista del comportamiento
de la variabilidad de las mediciones de una o varias características de interés en
una población utilizando unos pocos datos contenidos en una muestra. Por diver
sas razones, sean éstas de economía, por necesidades de tiempo o porque la pobla
ción es infinita, no se miden o cuentan las característica de interés de todos los in
dividuos u objetos de una población. En lugar de esto, se toman algunos elementos
de ella y se conforma una muestra.
Ya que las mediciones en una muestra provienen de individuos u objetos, a éstos
se les designa como elementos de muestreo.
Elemento de la muestra o elemento de muestreo: Es una unidad en la muestra
de la que se obtienen una o varias mediciones.
Como de la muestra se obtienen los datos que nos llevan a las conclusiones acer
ca del comportamiento de una población, es muy importante obtener una muestra
representativa para que las conclusiones sean confiables.
En una investigación son muchos los factores que pueden afectar una conclu
sión; entre ellos están los instrumentos de medida, las cifras significativas usadas,
las variables o componentes no incluidas en la definición de una población, las
causas no controladas, el tipo de datos usados y la forma en que se toma la mues
tra, entre otros. Así que debe cuidarse cada uno de estos factores para producir,
con una probabilidad considerable, una muestra que se confíe que puede represen
tar a la población. Una manera de lograrlo es tomar la muestra y cada una de las
mediciones o conteos de individuos u objetos seleccionados al azar, o sea, elegidos
sin predilección y, por ejemplo, con igual probabilidad.
Para lograr una selección al azar o aleatoria, se utilizan tablas de números alea
torios o bien mecanismos de azar, como papeletas numeradas con los elementos
de una población que se toman a la suerte o utilizando computadoras. Sin este pro
cedimiento no se puede suponer que una muestra sea aleatoria.
Muestra aleatoria: Es aquella en la cual cada medición o canteo tiene igual
probabilidad de ser tomada dentro de la población.
Ejemplifiquemos lo anterior con el siguiente caso.
° Ejemplo 7.23
Se pretende conocer la proporción de personas adultas mayores de 30 años que vi
ven en la ciudad de Chihuahua, las cuales muestren síntomas de hipertensión arte
rial pero declaren que no saben si la tienen (aproximadamente unas 400 mil), a fin
de acercarse a la magnitud probable de las enfermedades asociadas. Se obtuvieron
primero los datos de una muestra piloto al azar de 100 personas, a las que se les
midió la tensión diastólica. Una tensión mayor de 90 mm Hg indica que es proba
ble la presencia de hipertensión. Los resultados aparecen en la tabla 1.10.
Tabla 1.10 Tensión diastólica en mm Hg de 100 adul tos mayores de 30 años residentes de
la ciudad de Chihuahua, México
86.48 8783 88.94 88.77 86.72 90.36 87.01 88.21 88.78 87.55
89.39 86.96 86.27 86.71 92.11 89.74 91.28 87.92 87.87 89.84
88.91 88.52 84.43 85.82 90.37 88.22 89.44 87.55 94.00 89.00
91.30 92.73 88.15 87.64 88.57 85.58 88.84 93.30 88.68 88.90
84.66 88.78 87.46 88.23 85.93 85.96 87.56 89.96 88.64 89.91
90.16 91.19 88.32 89.95 90.05 90.35 86.21 89.28 88.65 89.97
87.74 92.41 88.26 89.04 85.69 88.62 86.08 90.02 89.18 89.23
89.53 91.99 88.34 88.61 87.82 90.18 91.76 84.97 90.49 90.75
91.82 91.55 86.80 92.10 83.78 84.89 88.39 87.37 91.25 89.80
87.17 86.20 90.19 86.65 88.62 93.22 88.83 89.15 87.80 85.72
1) La pregunta de los investigadores sería probablemente: ¿Qué proporción de
personas en la ciudad de Chihuahua, supuestamente sin hipertensión arterial,
la tiene? O bien: ¿Qué porcentaje de personas que no saben que tienen hiper
tensión, la tienen?
2) La variable que se mide es "la tensión diastólica en mm Hg". Mediante la medi
ción de esta variable se quiere conocer la proporción de personas con síntomas
de hipertensión.
3) La variable "tensión diastólica" es cuantitativa y continua; se mediría en una
escala de relación. El número de personas que tiene síntomas o la enfermedad,
es una variable discreta.
4) En esta muestra hay 100 mediciones.
5) Las mediciones rio están ordenadas.
6) La población de la cual provienen las mediciones es aproximadamente de ta
maño 400 mil.
7) La definición de la población de interés puede describirse así: La proporción de
personas mayores de 30 años, que viven en la ciudad de Chihuahua y que mues
tran síntomas de hipertensión arterial. En consecuencia, cuando se entrevista a
cada persona, se le debe preguntar si vive en la ciudad y si tiene más de 30 años.
8) Al tomarse la muestra al azar, se indica que se tomó sin preferencia alguna. En
teoría cada individuo y tensión diastólica tuvo la misma probabilidad de ser
tomada.
9) En la muestra, 25 de 100 personas (25%) tienen tensión diastólica mayor a
90 mm Hg. Si padecen hipertensión, supuestamente no lo saben.
10) En la muestra, 75 de 100 personas (75%) no tiene tensión elevada.
11) Si la muestra es representativa de la población, cabría esperar que 25% de los
adultos en la población (40 000 X 0.25 = 100 000) tuvieran hipertensión.
° Ejemplo 1.24
Enseguida se muestra una población de 100 mediciones de peso en kilogramos de
jóvenes con edades de 15 a 18 años cumplidos, quienes viven en las calles de la ciu
dad de México.
Tabla 1.11 Peso en kg de jóvenes de 15 a 18 años en si tuación de calle en el DF
DATO 1-10 11-20 21-30 31-40 41-50 51-60 61-70 71-80 81-90 91-100
1 48.1 50.5 52.2 53.3 54.5 55.2 56.8 57.4 59.0 60.0
2 48.4 50.6 52.6 53.3 54.5 55.4 56.8 57.4 59.1 60.0
3 49.0 50.7 52.6 53.6 54.6 55.7 56.9 57.6 59.1 60.1
4 49.2 50.7 52.7 53.8 54.8 55.7 57.1 58.0 59.2 60.3
5 ' 49.2 50.9 52.7 53.9 55.0 55.8 57.1 58.0 59.2 60.5
6 49.4 51.8 52.8 54.0 55.0 55.8 57.2 58.3 59.2 60.8
7 49.4 51.8 52.9 54.1 55.1 56.0 57.2 58.5 59.5 61.4
8 49.8 52.1 52.9 54.1 55.1 56.4 57.2 58.6 59.5 61.8
9 49.9 52.2 53.2 54.2 55.1 56.4 57.3 58.9 59.6 61.9
1 0 50.5 52.2 53.3 54.4 55.2 56.7 57.4 59.0 59.9 62.0
Se tomará una muestra aleatoria de tamaño 10, utilizando números aleatorios
obtenidos con una calculadora.
En tu calculadora hay una tecla llamada PBB. Es una abreviación de la palabra
random en inglés, que significa aleatorio. Usando esta tecla, se pueden obtener nú
meros al azar entre 0 y 1, con tres o cuatro decimales. Esto es, se producirán diez
números al azar, pero se hará que su valor esté entre 1 y 100 (porque la población
tiene 100 datos) multiplicando por 100 y redondeando al entero más cercano. Por
ejemplo, enseguida se eligen al azar dos valores de la población:
Se toma entonces el valor del dato 50: 55.2 kilogramos.
• I • ^ " 1: 0.426 U?1100 !_J 42.6; dato: 43.
El valor del dato 43 es 54.6 kilogramos.
Si un dato se repite, no se toma, se obtiene otro número aleatorio. Esta es una
muestra sin remplazo. Este procedimiento no es tendencioso, depende sólo del
azar.
Junto con algunos de tus compañeros, contesta, resuelve y comenta lo que se te
pide en las siguientes actividades. En caso de duda, revisa el contenido o consulta
a tu profesor(a).
H Determinen las principales diferencias entre una población y una muestra.
O Los siguientes números representan el número de llamadas telefónicas rea
lizadas diariamente desde el teléfono de la familia Bau, en los últimos dos
meses, desde que tiene el teléfono:
3, 5, 7,2, 5, 7, 8, 5,4, 7, 5, 3, 2, 6, 8, 3 ,1 , 3 ,4 , 0, 5, 4, 3, 2, 2 ,1 , 0, 6, 7, 8,
2, 5, 4, 6, 7, 3 ,1 , 0, 4, 3, 5 ,6, 8, 3, 2, 0 , 1 , 4 , 5 ,6, 3, 2, 2, 2 , 1 , 4 , 5, 2, 3, 2.
Don Isaac Bau, el padre, quiere saber cuántas llamadas en promedio se
hacen por día; para ello, decide tomar una muestra de tamaño 6 para esti
mar el valor del promedio.
j j¡] ¿Cuál es la variable que se observa?
[b] ¿Cuántos elementos tiene la población?
\J] Tomen una muestra aleatoria de estos datos mediante un muestreo uti
lizando números aleatorios.
: 0.496 (J3 100 | j j 49.6; dato: 50.
Actividades de aprendizaje
Q M U E S T R A DUDOSA
En un censo económico, se pregunta a los empresarios sobre el promedio de
las ganancias netas mensuales en los últimos cinco años. La pequeña em
presa Aléctrica, que comercializa material eléctrico, posee las estadísticas
que se muestran en la siguiente tabla, que corresponden a los últimos 60
meses, aunque tienen datos desde hace 20 años.
Uti l idad neta mensua l en miles de pesos de la empresa Aléctrica por los úl t imos 60
meses (2000-2004; datos ordenados del menor al mayor por co lumna)
0.17 1.85 2.90 6.18 7.85 10.68 12.75 16.58 i 1
20.34 i
28.38
0.25 1.87 3.22 6.33 8.32 10.84 14.15 16.77 20.39 34.21
0.40 2.00 3.55 6.44 9.17 10.96 14.64 18.23 22.45 35.96
0.51 2.35 3.57 6.84 9.85 11.02 15.77 18.27 24.83 39.17
0.71 2.49 4.33 7.06 10.01 11.70 15.82 18.39 25.55 48.67
0.79 2.50 4.60 7.54 10.67 11.97 ] 1
15.89 18.63 27.42 80.71
Para obtener un promedio de ingresos mensuales, el gerente de la empre
sa duda en utilizar todos los datos. Él concluye que usar como muestra los
primeros 30 será conveniente.
H ¿Cuál es la población? Defínanla.
[b] ¿Cuántas mediciones tiene la población de la empresa?
0 ¿Cuál es la variable que se quiere conocer en el censo?
[3 La muestra que quiere utilizar el gerente, ¿sería representativa? ¿Por qué?
0 Aproximadamente, de acuerdo con los datos, ¿cuál sería un valor de los
ingresos en el centro de ellos que podría representarlos como promedio?
O M U E S T R A A L E A T O R I A DE TORTUGAS
Un grupo de biólogos desea estimar la longitud de las tortugas gigoteas ele
gantes adultas (mayores de 5 años) que habitan en el lago de Chápala y sus
inmediaciones. Para ello, deciden tomar una muestra representativa de la
población. Los hábitos de las tortugas implican que unas se concentran fre
cuentemente en los alrededores del lago, en ríos y riachuelos o en el lago
mismo. La razón es de 1 a 3; o sea, se sabe que aproximadamente una de
cada cuatro tortugas viven en los ríos. Se ha concluido que para los fines
prácticos deseados, una muestra de tamaño 100 es suficiente. Los investiga-
Longitudes en centímetros de muestras de tor tugas gigoteas elegantes
adul tas (Lago de Chápala; datos ordenados por habitat, del menor
al mayor por co lumna)
H A B I T A T
L A G O D E C H Á P A L A Ríos
18.94 23.03 24.19 ! 25.33 ¡ 26.38 20.25 ¡ 23.97
20.50 23.22 24.22 25.37 | 26.38 20.83 | 24.23
20.60 23.37 24.23 25.45 | 26.40 21.79 | 24.31
21.11 23.58 24.24 25.47 ] 26.45 22.17 ¡ 24.62
21.79 23.63 24.33 ! 25.58 ¡ 26.65 22.27 | 25.15
21.93 23.69 24.37 ¡ 25.62 ¡ 26.91 22.73 ] 25.16
22.38 23.70 24.50 ! 25.65 ¡ 27.08 22.82 ¡ 2.5.39
22.44 23.77 24.79 ¡ 25.85 | 27.19 22.98 | 25.91
22.53 23.78 25.05 ¡ 25.86 ¡ 27.20 23.20 ¡ 25.95
22.55 23.88 25.14 ¡ 26.10 ¡ 27.45 23.28 | 27.47
22.78 23.89 25.14 ¡ 26.15 ¡ 27.80 23.30 ¡
22.81 23.96 25.25 26.21 ¡ 27.87 23.61 ¡
22.88 23.98 25.28 ¡ 26.21 | 28.01 23.67 ¡
22.95 24.02 25.28 | 26.22 ¡ 28.10 23.69 \
23.01 24.12 25.33 | 26.31 ¡ 28.49 23.96 ¡
H ¿Cuál es la pregunta de los investigadores?
\b\ ¿Cuál es la variable que se estudia?
00 ¿Cuál es la población? Defínanla,
[d] ¿De qué tamaño es la muestra?
H ¿Cuál es el elemento de la muestra?
|Tj ¿Es probable que la muestra sea representativa de la población? ¿Por
qué?
[el Cuando se localiza una tortuga, ¿puede predecirse su tamaño con exac
titud? ¿Por qué?
dores toman entonces las medidas de 25 tortugas en ríos y 75 en el lago, lo
calizadas al azar. Obtienen los resultados que se muestran en de la tabla si
guiente.
[El ¿En qué habitat parece haber mayor variación en las longitudes de las
tortugas? ¿Cómo lo sabes?
[TI ¿Cuál es la longitud promedio de las tortugas que viven en el lago?
[TI ¿Cuál es la longitud promedio de las tortugas que habitan en los ríos?
[k] ¿Cuál es la longitud mayor de 50% de las tortugas más pequeñas que vi
ven en el lago?
D] Del total de la muestra de las tortugas más pequeñas que viven en los
ríos, ¿cuál es la longitud mayor de 50%?
@ ¿Cuáles tortugas parecen tener en general mayor longitud?
1.1.6 I Dato e información
Para obtener conclusiones en una situación estadística acerca del comportamiento
de una población bajo estudio, se usan datos, generalmente numéricos. Los datos
numéricos que estudia la estadística corresponden a alguna o varias variables o
características que definen una población de interés y, desde luego, se distinguen
porque varían, esto es, los resultados numéricos que se obtienen no son iguales.
Por este motivo, deben organizarse para comprender su comportamiento.
Dato: Es un símbolo (palabra, oración, número, imagen, olor, color, etcétera)
utilizado para llegar a una conclusión; en estadística, generalmente los datos
son numéricos.
Un proceso lleva del dato —que surge en una investigación y en un contexto— a
la información. Ésta se obtiene buscando, racionalmente, relaciones entre las pre
guntas que dieron lugar a la investigación, a las representaciones de los datos y su
significado en el contexto. Cuando se encuentran esas relaciones se obtiene una
conclusión, es decir, la información.
Información: Es una conclusión que se extrae mediante la representación de
un conjunto de datos o mediciones del comportamiento de un fenómeno en un
contexto.
La información representa un estado de comprensión acerca del fenómeno es
tudiado. Las palabras, los datos calculados u organizados y representados en tablas
o gráficos, permiten un eficiente proceso de reflexión para llegar a las conclusiones
y comunicar con eficiencia sus significados.
• Ejemplo 1.25
Juan se traslada de su casa a la escuela en camión urbano. En una esquina ve pinta
das en la pared las letras OCT, y luego la palabra "Nedes". Estos signos no tienen
significado para él. Son meros datos sin sentido. Él no encuentra en ellos propósito
alguno.
• Ejemplo 1.26
Juan estudia la materia de geometría analítica. Su maestra le pide que investigue
qué significa la palabra "asíntota". Él se dirige a la biblioteca y encuentra una defi
nición y un gráfico que representa una asíntota. Ambos, la definición y el gráfico,
son datos porque le ayudan a obtener una conclusión, información, acerca de lo
que se le pide conocer.
I Actividades de aprendizaje
Resuelve o contesta lo que se te pide en los siguientes ejercicios. Puedes reunirte
con algunos de tus compañeros para trabajar.
O Establece las diferencias entre dato e información y coméntalas con tus
compañeros de grupo.
Q SIGNOS, DATOS E I N F O R M A C I Ó N
Un día Silvia observa varios signos que llaman su atención. Algunos de ellos
son los siguientes:
• Unas letras dibujadas sobre la tapa de una libreta: MEM. Ella tiene una
amiga de nombre María Esparza Muñoz.
• Un letrero a la entrada de la biblioteca que dice: "No entrar con alimentos".
• Unas flechas que sabe que la conducen a una escalera de emergencia.
• 23 /02 /05 .
» Una fórmula: A = ttR2.
H ¿Por qué éstos pueden ser datos para Silvia? Explica.
Qj] ¿Qué información puede sacar de las letras MEM dibujadas sobre la tapa
de la libreta?
OO ¿Qué información puede extraer de la fórmula?
Q En la siguiente tabla se observa la asistencia diaria a 12 conferencias que se
dictaron en El Colegio de México en abril de 2005. Las primeras seis se reali
zaron a las 18:00 horas; las otras, a las 20:00 horas. Las impartieron las mis
mas personas en ambos horarios. Se desea saber si el horario afectó la con
currencia.
Asistencia a 12 conferencias en El Colegio de México (abril de 2005)
Conferencia 1 ¡ 2 ¡ 3 ¡ 4 ¡ 5 6 ¡ 7 | 8 9 10 11 12
Asistencia 90 ¡ 100 ¡ 108 ¡ 100 | 105 85 ¡ 200 ¡ 120 170 145 165 130
H ¿Cuántos datos relativos a la asistencia se tienen?
¡b¡ ¿Cómo pudo efectuarse la medición acerca de la asistencia a cada confe
rencia?
0 El hecho de que las primeras seis conferencias se hayan efectuado a las
18:00 horas, ¿es un dato? ¿Por qué? ¿Para quién?
[d] ¿El horario afecta la asistencia? ¿Por qué? ¿Cómo se obtiene la conclu
sión?
R E D O N D E O D E C I F R A S
Los datos numéricos se adquieren mediante la experimentación, la observación cir
cunstancial de un fenómeno o en archivos; son producto de mediciones o conteos
y su representación depende de la exactitud o precisión requerida para resolver un
problema. De tal manera que aunque en la medición o los cálculos se pueden lograr
cifras con muchos decimales,, no siempre es necesario utilizarlos todos para conse
guir un resultado correcto. El redondeo y el uso de cifras significativas son una
práctica común en el cálculo.
Ejemplifiquemos el redondeo de cifras con la siguiente situación. En el año 1969
el Apolo XI trasladó a la Luna a los primeros hombres. Antes, en 1957, el Sputnik I
fue el primer satélite artificial que orbitó la Tierra, y por lo tanto fue el primer obje
to construido por el hombre en vencer la atracción terrestre. Para que una nave es
pacial abandone la atmósfera es necesario conocer la velocidad de escape del obje
to. Esa velocidad debe calcularse con exactitud y precisión. Ahora bien, ¿cuántos
decimales se requiere tomar en los cálculos de la velocidad de escape para que la
nave abandone la Tierra?
En el cálculo de dicha velocidad interviene el número ir, que corresponde a las
veces que cabe el diámetro en el perímetro de una circunferencia. Se sabe que TT es
un número irracional —no puede escribirse como el cociente de dos números en
teros—, lo cual significa que después del punto decimal sigue una infinidad de
dígitos sin un patrón. Enseguida aparece el número ir con sus primeras 65 cifras
decimales:
3.14159265358979323846264338327950288419716939937510582097494459230.. . .
Esta pasmosa cifra se suele redondear a diezmilésimos como ir = 3.1416 (el signo =
se lee: "aproximadamente igual a"), lo que permite calcular bastante bien la veloci
dad de escape de cualquier nave espacial, su recorrido alrededor de la Luna y su
regreso a la Tierra. El área de cualquier círculo también se puede calcular usando
TT = 3.1416, con un error despreciable.
Analicemos otra situación. Una jefa de enfermeras calcula el tiempo que tarda
una de sus colaboradoras en colocar un suero. Con un cronómetro digital tomó
una muestra aleatoria de 10 colocaciones, y obtuvo los resultados siguientes, dados
en minutos.
1.344,1.786,1.658,1.675,1.260, 2.000,1.389,1.437,1.550,1.890
Para calcular el tiempo promedio, redondeó los datos, primero al centesimo más
cercano y después al décimo, como se muestra a continuación:
Tabla 1.12 Redondeo de cifras a centesimos y a décimos
DATOS 1.344 1.786 1.658 1.675 1.260 2.000 1.389 1.437 1.550 1.890
R E D O N D E O A
C E N T E S I M O S 1.34 1.79 1.66 1.68 1.26 2.00 1.39 1.44 1.55 1.89
R E D O N D E O A
D É C I M O S 1.3 1.8 1.7 1.7 1.3 2.0 1.4 1.4 1.6 1.9
Ella calculó el promedio de cada uno de estos tres conjuntos de datos. ¿Qué re
sultados obtuvo?
Redondear: Es aproximar un número a una cifra entera o decimal al respectivo
entero o decimal que produce el menor error.
El redondeo de cifras numéricas se realiza de la siguiente manera:
1) Si los decimales que se tienen que redondear terminan en 4 o en un número me
nor, hasta 1, se deja la cifra anterior como está.
a Ejemplo!.27
1.43 = 1.4; 2.502 = 2.50.
2) Si los decimales terminan en 6 o en un número mayor, hasta 9, se incrementa en
una unidad la cifra anterior.
° Ejemplo 1.28
12.6 = 13; 4.209 = 4.21.
3) Si los decimales terminan en 5 se incrementa en una unidad la cifra anterior si
ésta es impar, y se deja la misma si ésta es par.
° Ejemplo 1.29
79.835 = 79.84; 79.845 = 79.84.
Para el redondeo de cantidades enteras se siguen las mismas reglas. Enseguida
se dan ejemplos de redondeo de cantidades enteras.
° Ejemplo 1.30
3459 a decenas: 3460.
Q Ejemplo 1.31
289 504 a centenas: 289 500.
° Ejemplo 1.32
340453 a millares: 340000.
I Actividades de aprendizaje
Realiza los siguientes redondeas de cifras trabajando con algún compañero. Com
prueben sus respuestas con las de otros. En caso de duda, revisen nuevamente la
sección anterior sobre redondeo de números o consulten a su profesor(a).
Q 8.08 a décimos
Q 34.984 a centesimos
O 0.4395 a milésimos
• 70.0345 a milésimos
Q 0.0984 a centesimos
• 10985 adecenas
• 2098 a centenas
• 349056 a centenas
El 200 455 a unidades de millar
03 398 432 a decenas de millar
E R R O R D E R E D O N D E O
En la década de 1960 Edward Lorenz, un meteorólogo del Tecnológico de Mas-
sachussets, investigó por medio de una simulación en computadora el efecto que
tiene el redondeo de cifras en la predicción del clima. Utilizó determinadas condi
ciones numéricas iniciales relacionadas a la temperatura ambiente y a la velocidad
del viento. En lugar de usar cifras con muchos decimales en las ecuaciones, esto es,
cifras con mucha precisión, las redondeó a dos decimales. Lorenz iba a comparar el
efecto del redondeo en la evolución de la predicción del clima con un patrón del
clima.
El resultado que obtuvo fue sorprendente (véase la figura 1.10). En los primeros
días los resultados de la predicción diferían poco del patrón, lo que significaba la
posibilidad de efectuar buenos vaticinios acerca del clima; sin embargo, posterior
mente "explotaron" las variables y la traza pronosticada se alejó mucho de la del
patrón.
Un redondeo, tan aparentemente insignificante, había tenido un efecto devasta
dor en los resultados. La conclusión era que no importara cuántos decimales usara,
tarde o temprano la predicción fallaría.
Temperatura
->• Tiempo
Figura 1.10
Separación del pronóstico
del clima respecto del patrón
(efecto del redondeo)
El error del redondeo se mide por la diferencia siguiente:
Error = Número redondeado — Número exacto.
Si el signo del error es positivo, se ha redondeado por exceso, si es negativo, por de
fecto.
I Actividades de aprendizaje
Trabaja con un compañero y resuelvan el siguiente ejercicio.
D El encargado de una ladrillera ha tomado la temperatura máxima en grados
centígrados a que han estado expuestos para su cocción los ladrillos de 12
diferentes lotes. Los datos son los siguientes:
135.83,143.75,120.67,130.09,118.51,105.81,
107.34,128.46,130.14,102.97,140.32,138.56.
[~a] Redondeen las cantidades a décimos.
[b] ¿Cuáles se han redondeado por exceso y cuáles por defecto?
0 Obtengan la suma de los datos originales y la de los datos redondeados.
¿En qué cantidad difieren? ¿Cuál es el porcentaje del error respecto a la
suma de cantidades originales?
Figura 1.11
Condensador de Millikan
Otra forma de obtener datos estadísticos es mediante experimentos. Por ejem
plo, a principios del siglo x x , el físico Robert A. Millikan (1868-1953) efectuó el lla
mado experimento de la gota de aceite para calcular la carga eléctrica del electrón.
Repitió el experimento muchas veces, obtuvo datos numéricos y utilizó métodos
estadísticos para llegar a sus resultados.
El experimento requirió un aparato con dos placas paralelas, entre las cuales
Millikan creó un campo eléctrico vertical que eliminaba o restablecía (véase la figu
ra 1.11). En la placa superior había unos orificios pequeños por los cuales pasaban
pequeñas gotas de aceite, enviadas desde un atomizador, que se cargaban eléctri
camente al friccionarse con la boquilla. Al eliminar el campo eléctrico, las gotas
c a í a n .
carga positiva....
0
energía eléctrica ..
radiación ionizante -•
lampara
fe
eat
1 3
gotas de aceite
atomizador
....-.„.. gotas de aceite
..... microscopio
carga negativa
Millikan midió la velocidad de muchas gotas que caían entre las placas. Al repe
tir el experimento con diferentes gotas, pudo tomar varias medidas numéricas; ob
tuvo el promedio "de todos los datos individuales de los voltajes necesarios para
equilibrar las diversas gotas y de los tiempos de caída cuando el campo eléctrico
era desconectado". Millikan usó los hechos en una muestra para producir sus re
sultados.
Experimento: Es una actividad de observación ordenada y generalmente repe
titiva de la que se obtienen datos. En un experimento se suelen controlar facto
res que influyen en los resultados, sobre la base de alguna hipótesis.
El experimento realizado por Millikan fue uno de los primeros en la física del si
glo xx que permitió introducir la estadística inferencial como método para obte
ner conclusiones. La estadística inferencial estudia las características de una po
blación (parámetros) a partir de los datos de una muestra (estadísticos). Millikan
realizó una inferencia a partir de unos cuantos datos de una muestra cuyos valores
de las mediciones ocurrían al azar (no podía predeterminar los resultados). Los
métodos estadísticos que conducen a una inferencia implican generalmente el uso
de datos de experimentos aleatorios.
Experimento aleatorio: Es un experimento que al repetirlo y observarlo bajo
idénticas condiciones no es posible predecir un resultado con exactitud.
1.1.7 | Parámetro y estadístico
Hace miles de años que se practican censos de poblaciones humanas. Los primeros
fueron en la antigüedad en Babilonia, Egipto yjordania; después, durante el Imperio
Romano. Se efectuaban para definir y aplicar impuestos a los hombres, reclutarlos
para la guerra, repartirles la tierra o forzarlos a trabajar. A partir del siglo x v n los
censos también se aplicaron al comercio, la agricultura, la ganadería y la industria.
El censo moderno implica la total enumeración de una población, a fin de en
tender su constitución plena y las tendencias de la sociedad. La idea de Graunt,
"servir para el buen gobierno", adquirió sentido en el conteo total de poblaciones.
Cuando se toma un censo, de personas o cosas, la información que se obtiene es
absoluta: contiene toda la información de interés. Los resultados numéricos que se
obtienen de un censo, ya sea como totales o promedios, se llaman parámetros. En
cambio, cuando se toma una muestra de la población se parcializan los resultados
y no se conocen los valores absolutos. A los resultados numéricos que se consiguen
de una muestra se les llama estadísticos.
Parámetro: Es el resultado de un cálculo que se obtiene de un censo. Esto es, al
utilizar todos los datos de una población.
Estadístico: Es un cálculo numérico que resulta de los datos de una muestra.
a Ejemplo 1.3 3
Se desea conocer el ingreso mensual promedio de las familias de donde provienen
los 30 estudiantes becados de la carrera de técnico en computación de un CBTis de
la ciudad de Tapachula. Se levanta una encuesta que se aplica a sus padres y se ob
tienen los datos que se muestran en la tabla 1.13.
Tabla 1.13 Ingresos mensuales, en pesos, de las famil ias
de 30 estudiantes de un CBTis de Tapachula, Chiapas
(datos ordenados ascenden temente por co lumna)
1034.46 1181.47 1250.13 I
1418.75 1
1521.01 1 ~
1521.01
1049.88 1 202.37 1292.84 1460.25 1526.42 1526.42
1073.01 1203.77 1313.85 1462.12 1546.09 1546.09
1155.57 1 217.59 1360.48 1465.84 1552.89 1552.89
1172.87 1238.82 1 370.48 1495.60 1 557.24 1 557.24
La población estudiada se puede definir así: Los ingresos mensuales en pesos de
las familias de las que provienen los 30 estudiantes becados de la carrera de técnico
en computación del CBTis.
1) La población consta de 30 estudiantes, es finita y muy pequeña.
2) Los ingresos mensuales mayor ($1557.24) y menor ($1034.46) son parámetros,
pues corresponden a la población estudiada.
3) El ingreso promedio mensual o media aritmética por familia es un parámetro
porque se utilizan todos los datos de la población. Su valor es
.. Suma de los 30 ingresos mensuales Promedio = — = 1361.048 pesos por mes.
4) La variable de estudio es la característica que se estudia de la población: los in
gresos mensuales en pesos por familia.
5) El elemento de muestreo es cada familia de la que se adquiere el dato de su in
greso.
1.1.8 | La variación y los problemas de la estadística descriptiva
e inferencial
Los contenidos que se han abordado hasta este punto, como los de población,
muestra, medición, parámetro, variable y estadístico conforman conceptos con los
que se estudia y obtiene información en una situación estadística, cuyos compo
nentes esenciales son:
1) Una pregunta acerca del fenómeno.
2) La toma de una muestra o censo de la población asociada con el fenómeno de
interés.
3) El análisis de los datos.
4) La conclusión o inferencia acerca de la población.
La estadística inferencial y la estadística descriptiva se relacionan en el momen
to del análisis de los datos. La estadística descriptiva provee a la inferencia de me
dios tabulares, gráficos y numéricos que permiten construir conjeturas provisiona
les y apoyar a las inferencias. Los instrumentos de la estadística descriptiva son
medios de análisis de datos con alta variación.
La conclusión estadística que se obtiene del estudio de la variación de los datos
de una población es la descripción numérica o gráfica: al conocer toda medida en
una población automáticamente se conocen los parámetros y la forma como se dis
tribuyen los datos. Sin embargo, cuando se parte de una muestra que se toma al
azar de una población y se deducen conclusiones generales mediante el estudio de
los números y gráficos relacionados con la variación de los datos en esa muestra
utilizando la teoría de probabilidad, se entra al terreno de la estadística inferencial:
se plantean inferencias o conclusiones probables acerca de los parámetros de la po
blación o de la forma como se distribuyen los datos que la conforman utilizando
unos pocos datos muéstrales.
Inferencia estadística: Consiste en producir una conclusión probable acerca de
una característica de una población sobre la base de una muestra.
En consecuencia, una inferencia estadística no concluye en una verdad absolu
ta, como las que se obtienen por medio de la deducción matemática; sus conclusio
nes, al apoyarse en las posibilidades que dictan los datos en una muestra, implican
sólo resultados probables. Esto puede intuirse observando el proceso de la inferen
cia según se resume en el esquema de la figura 1.12.
Figura 1.12
El problema de la
estadística inferencial
P R E G U N T A A C E R C A D E U N A
P O B L A C I Ó N
P R O B A B I L I D A D : I N F E R E N C I A ,
G E N E R A L I Z A C I Ó N
P O B L A C I Ó N : P A R Á M E T R O S
M U E S T R A : E S T A D Í S T I C O S
Una analogía acerca del significado de inferencia de tipo estadístico es la si
guiente. Galileo Galilei, al observar los cielos con el primer telescopio que fue usa
do con ese fin, descubrió que no sólo el Sol y la Luna son esféricos, sino que Júpiter
y sus cuatro lunas también lo son, al igual que Marte y Venus. Todos estos cuerpos
celestes pertenecen a las clases de los soles, planetas y las lunas en el Universo. Él
descubrió además que la Vía Láctea está llena de estrellas, tan lejanas que no podía
ver su forma geométrica. Con la muestra de Galileo —unos pocos cuerpos celes
tes— se puede inferir que es probable que en el Universo los soles, los planetas y las
lunas sean esféricos. Esta conclusión es probable y no absoluta, porque no hemos
visto todos los cuerpos celestes de esas clases en el universo: cabe la posibilidad de
que existan planetas no esféricos (lo cual sería un contraejemplo).
Figura 1.13 Fobos, una de las
lunas de Marte, presenta una
forma muy irregular
Por otra parte, cuando se hace una inferencia o inducción en matemáticas, se
obtiene un resultado absoluto o verdadero siempre. Contrasta lo siguiente con la
situación anterior. Un matemático estudia la adición
1 + 1 + I + 2 4 8 16
Esta es una especie de muestra de fracciones que se suman. Al matemático le es
imposible escribirlas todas, pues la adición tiene infinidad de sumandos. Sin em
bargo, él idea una manera de calcular esa suma: construye un cuadrado de lado
igual a 1, como se ve en la figura 1.14, y lo parte en cada una de las fracciones de la
adición.
1 6
Figura 1.14
De esta manera, el valor de la suma de la serie sólo puede ser
2 4 8 16
Este resultado es inobjetable y absoluto, no hay contraejemplo posible. Es una ver
dad matemática.
En el proceso de resolución de un problema estadístico, la descripción es impor
tante porque al narrar el comportamiento de los datos de una muestra se obtienen
hipótesis. Con ello se implica el descubrimiento. Por consiguiente, el problema de
la estadística descriptiva es diseñar medios de descripción de los datos que facili
ten la producción de hipótesis e información.
Describir: Es representar mediante el lenguaje las peculiaridades que se obser
van en un conjunto de datos numéricos o en un gráfico.
El promedio más usado en estadística se llama media aritmética. Por este moti
vo, la media aritmética de un conjunto de datos es llamada el promedio y se define
como sigue:
Suma de los valores de los datos Media aritmética = x =
Total de datos
valor 1 + valor 2 + . . . + valor n
n
El objetivo es percibir si los valores se parecen o no.
I Actividades de aprendizaje
Es conveniente que el grupo se distribuya en equipos para realizar las siguientes
actividades.
D E S T I M A C I Ó N D E L P R O M E D I O DIARIO DE E X P O R T A C I O N E S
De las exportaciones mexicanas a los Estados Unidos de Norteamérica que
pasan generalmente por la frontera vía terrestre, se considera la población
de 360 exportaciones del año 2004, que representan ingresos a la aduana
mexicana en millones de dólares por día. Los datos se distribuyeron al azar
en la siguiente tabla. Cada columna representa una muestra al azar de tama
ño 30 de las exportaciones.
Monto en millones de dólares de las exportaciones mexicanas a los Estados Unidos
de América (2004)
DATO ¡ 1-30 3 1 - 6 0 6 1 - 9 0 91 -120 121- 151-
1 1
1 8 1 -
1 1
211- 2 4 1 - 2 7 1 - 3 0 1 - 3 3 1 -DATO ¡ 1-30 3 1 - 6 0 6 1 - 9 0 91 -120
150 180 2 1 0 2 4 0 270 3 0 0 3 3 0 3 6 0
1 314.66 300 .99 304.91 335.26 324.70 331.90 344.74 338.23 322.56 323.18 3 0 9 . 0 4 338.14
2 312.36 285.19 325.40 321.93 311.93 308.38 340.06 302.01 322.23 312.42 327.74 291.11
3 318.28 309.07 317.22 316.51 312.48 313.45 316.32 338.49 315.66 295.92 301.04 335.34
4 297.82 338.64 304.08 330.75 303.96 347.91 293.12 316.74 335.24 353.29 311.70 338.57
5 293.03 344.79 313.39 342.16 302.56 331.99 316.66 299 .92 355.50 343.94 322.71 323.35
6 323.05 292.57 297.36 335.73 325.62 261.12 310.76 294.35 324.18 30573 323.22 353.20
7 316.44 303.28 334.05 298.04 296.62 310.27 348.30 317.04 324.91 312.92 351.41 287.74
8 314.76 318.42 332.36 338.93 336.32 331.56 310.72 287.78 327.61 320.55 321.95 324.72
9 344.28 324.64 336.38 324.31 314.77 336.77 300.46 305.02 368.92 362.10 332.67 326.84
1 0 ¡ 325.34 297.02 295.18 331.91 1 1
331.86 1 1
282.05 308.76 289.83 314.25 1
310.66 1
339.59 1 1
295.36
Continúa
Monto en millones de dólares de las exportaciones mexicanas a los Estados Unidos
de Norteamérica (2004) [Concluye]
DATO 1-30 31-60 61-90 91-120 121-150
151-180
181-210
211-240
241-270
271-300
301-330
331-360
303.65 323.98 321.34 341.51 320.50 358.06 327.24 344.98 306.77 331.69 329.74 305.88
1 2 305.65 311.82 333.20 330.51 337.81 340.02 293.59 360.49 321.87 300.89 285.87 324.68
13 332.65 356.77 333.44 316.51 308.91 312.50 308.82 303.02 334.35 333.Í 349.34 337.79
14 339.98 327.43 321.81 298.30 313.58 284.00 344.87 292.70 329.74 309.49 305.02 302.69
15 302.26 345.23 320.23 337.53 324.55 319.76 313.52 304.53 306.97 310.10 314.15 329.98
16 316.09 316.45 355.14 331.35 304.44 308.47 279.94 311.69 312.07 308.09 334.54 301.65
17 313.32 321.49 338.72 334.29 330.11 316.44 329.37 313.57 311.54 334.80 317.94 302.49
288.77 291.69 361.23 314.69 301.96 292.81 278.27 318.79 279.23 333.80 346.28 336.34
19 302.01 298.23 305.67 319.23 281.66 324.51 310.67 321.79 344.04 302.97 330.47 343.98
20 313.21 307.78 333.90 355.18 345.14 334.05 304.85 301.30 282.89 324.11 318.63 323.64
21 301.61 343.49 300.53 294.08 295.64 318.15 313.12 291.45 349.69 317.38 325.33 305.67
22 303.98 327.96 334.84 315.12 323.47 317.20 322.57 334.57 305.82 336.55 315.03 338.25
23 289.65 330.68 305.23 310.34 308.45 316.82 313.48 315.28 339.14 277.68 321.70 313.64
24 303.60 324.04 332.41 343.00 340.80 300.54 321.80 304.39 314.82 312.79 316.25 316.55
25 300.06 323.40 327.28 334.27 308.22 288.61 281.59 332.73 339.43 314.73 325.47 305.60
26 316.52 315.73 365.82 334.86 358.75 296.16 312.57 334.00 323.79 301.34 346.96 311.93
27 311.33 325.15 281.47 299.67 322.56 338.82 335.33 335.75 353.12 307.16 348.53 317.50
323.18 276.61 308.95 285.58 312.77 297.68 307.30 336.18 289.88 320.50 327.22 307.22
29 341.74 291.10 307.22 293.70 318.98 309.01 302.80 336.98 319.48 357.62 331.41 306.06
30 317.42 310.11 308.06 335.52 317.49 318.93 340.96 312.95 334.75 321.88 356.15 339.04
[a] Estimen un valor promedio diario en dólares de esas exportaciones en el
año 2004 por medio de una muestra aleatoria de tamaño 30. Usen nú
meros aleatorios para elegir los datos.
[b] Obtengan el dato mayor y el dato menor de la muestra trabajada.
0 Comparen los resultados encontrados. ¿Son los resultados parecidos?
¿Existe variación en los resultados? ¿A qué puede deberse lo anterior?
Expliquen.
[U ¿Se puede decir que las muestras son representativas de la población?
¿Por qué?
[e ] ¿Cuál es el elemento de muestreo?
|T| ¿Cuál es la población? Defínanla.
[U ¿Cuántas medidas tiene la población?
§3 Las 360 mediciones de las exportaciones mexicanas a los Estados Unidos de
Norteamérica en el año 2004 se muestran enseguida, resumidas en un gráfi
co llamado histograma de frecuencias.
H I S T O G R A M A D E F R E C U E N C I A S : E X P O R T A C I O N E S M E X I C A N A S
70
50
30
261.1232 279.0885 297.0538 315.0191 332.9845 350.9498 368.9151
270.1059 288.0712 306.0365 324.0018 341.9671 359.9324
Exportaciones: Millones de dólares/día
[a] Según esta figura, un promedio como el que calcularon para los 360 datos
en la población es de unos 315 millones de dólares por día. Compárenlo
con el encontrado por ustedes. ¿Se parece? Calculen el error relativo.
¡b] Describan el comportamiento de la variación de las exportaciones apo
yándose en la guía siguiente.
> ¿Cuáles son los datos mayor y menor encontrados?
> ¿Qué distancia hay entre esos datos?
> ¿Dónde son mayores las frecuencias? Observen la figura.
> ¿Dónde son menores las frecuencias?
> ¿Dónde se ubica el promedio aproximado de las exportaciones (315
millones)?
> ¿Entre cuáles valores se dan las frecuencias mayores?
En estadística, los fenómenos que se estudian están sujetos a variación de los
datos. Aun así, a partir de ellos se espera obtener una conclusión, que es la infor
mación sobre la variable del fenómeno investigado. Esta conclusión se compone
Deducción: Es una cadena de razones lógicas apoyadas en una o varias pre
misas para obtener una conclusión cierta.
1.1.9 | Posibilidad y evento
Para comprender el significado de los términos posibilidad y evento, como se usan
en estadística y probabilidad, consideremos los siguientes tres ejemplos.
° Ejemplo 1.34
En un juego cada jugador lanza dos dados, se observa la suma de los puntos y gana
quien obtiene la suma mayor. Algunos de los eventos que pueden suceder son:
A: "Cae una suma igual a 4".
B: "Cae una suma igual a 7".
C: "Caen 12 puntos".
Un evento imposible es:
D: "Caen 15 puntos".
a Ejemplo 1.35
En el siglo x i x , el astrónomo Urbain Le Verrier (1811-1877) estudió el desplaza
miento del planeta Urano y encontró algunas perturbaciones que le sugirieron que
era posible la existencia de un planeta cercano a aquél, el cual influía en su trayec
toria. En 1846 predijo que ese planeta existía, determinó su posición y ese mismo
año varias observaciones astronómicas lo ubicaron en el lugar predicho.
•° Ejemplo 1.3 6
En la República mexicana existe un corredor volcánico que va del occidente al
oriente. Es posible que alguno de esos volcanes haga erupción. Actualmente el vol
cán de Colima está en actividad. Un evento posible al respecto es:
"El volcán de Colima hará erupción en el año 2008".
con premisas que son hechos referenciales de la población estudiada, las cuales se
relacionan lógicamente para establecer las deducciones de un fenómeno. Por lo
que la estadística inferencial y la estadística descriptiva permiten realizar deduc
ciones e inferencias de un fenómeno estudiado por medio de datos.
De estos tres ejemplos, se identifica como característica común "la posibilidad"
de que ocurra un evento. En el primer ejemplo no se puede predecir quién obten
drá la suma mayor; en el segundo, las leyes de la física clásica predecían la existen
cia de una masa que provocaba el fenómeno observado (las perturbaciones en el
desplazamiento del planeta Urano), quizás otro planeta; en el tercero, un volcán en
actividad es posible que colapse.
Posible: Es aquello que puede ocurrir en relación a un fenómeno.
En cuanto al término evento, éste es muy importante en la estadística y la proba
bilidad: se refiere a aquello que es posible que ocurra cuando se estudia un fenóme
no y permite concentrar la atención de un investigador, En el Diccionario de la len
gua española, de la Real Academia Española, se define como "hecho imprevisto, o
que puede acaecer", esto es, algo posible. Para nuestros propósitos, se relaciona a
un suceso posible en un experimento.
Evento: Es algo que puede o no suceder en el ámbito de un experimento o de
una investigación.
A c t i v i d a d e s g e n e r a l e s 1.1
A continuación se plantean diversas actividades de aprendizaje con la finalidad
de que reafirmes tus conocimientos adquiridos sobre el tema de variables y sus
representaciones. En el primer grupo de actividades se incluyen ejercicios de
asociación de situaciones y conceptos. En el segundo, se plantean situaciones
para las cuales debes identificar una respuesta conceptual verosímil de varias
posibles. El tercer grupo de actividades se compone de varias situaciones esta
dísticas prácticas en diferentes contextos, con datos que te permitirán aplicar
una combinación de los conceptos aprendidos. Haz lo que se te pide en cada
grupo de actividades. Si tienes alguna duda, acude con tus compañeros o con tu
maestro(a).
I. Situaciones y conceptos
En cada uno de los casos siguientes, relaciona los campos ly2. En el campo 1 se
describen situaciones, cada una de las cuales se asocia con alguno de los con
ceptos estadísticos dados en el campo 2. En la columna de respuestas, anota en
tre los paréntesis la letra correspondiente al concepto relacionado a la situación
planteada. Sólo darás una respuesta para cada situación.
R E S P U E S T A C A M P O 1 C A M P O 2
( )
( )
I a 1 Juan obtiene, usando un recipientey una
regla,y haciendo un cálculo, una medida en
milímetros de la lluvia que cae en el mes de
julio en Poza Rica, Veracruz, para comparar
con la lluvia que caerá en ese mismo mes el
próximo año.
QT] La población consta de 100000 bacterias én
un cultivo. María sólo toma 120 de ellas.
0 José redactó la conclusión que obtuvo sobre
los datos recogidos en su investigación.
[d] La presión arterial en los ancianos mayores
de 65 años.
A. Información
B. Muestra
C-Variable
D. Medida
E. Medición indirecta
R E S P U E S T A C A M P O 1 C A M P O 2
( ) 0 En un experimento se mide con cronómetro
el t iempo de reacción en segundos de una
sustancia química al ponerla en contacto
con el agua. Se redondean los datos y se
obtiene la diferencia entre el número
redondeadoy el número exacto.
[~b] Un investigador midió todos los datos de
una población y observó el valor del dato
mayor.
0 En un experimento, un laboratorista
observó "la cantidad en gramos obtenida
del residuo X"
[d] Un técnico laboratorista calculó el
porcentaje de sodio en una muestra de
sangre.
A. Evento
B. Estadístico
C. Error relativo
D. Dato numérico
E. Parámetro
R E S P U E S T A C A M P O ! C A M P O 2
( )
[a ] En una encuesta se incluyó la pregunta
sobre el color de los ojos. La variable se mide
en escala:
[•b] En una investigación se estudia la densidad
de la población de aves por kilómetro
cuadrado en Valle de Bravo. Esta variable se
rrflde en escala:
0 A Lourdes se le pide que establezca el nivel
de la cultura de salud pública en el estado
de Colima. La variable que se va a estudiar
se mide en escala:
[d] Se propone medir la intensidad de una
relación entre individuos en un grupo social,
partiendo de—5 hasta 5, tomando cualquier
valor. Esta variable se mide en escala:
A. Ordinal
B. Numérica
C. De relación
D. Nominal
E. De intervalo
•
R E S P U E S T A C A M P O 1 C A M P O 2
( ) Se midió la temperatura en cada uno de 20 A. Elemento de
¡ pacientes que integran una muestra. Cada muestreo
uno de ellos es un:
B. Error aleatorio
( ) El estudio de la venta de gas licuado en cada
i expendio arrojó: 23 0 00 i, 19 500 € y 27 0 00 L C. Error sistemático
! Cada una de estas cantidades es un:
! D. Dato
( ) ¡Ln Para su investigación, un científico repitió el
i fenómeno bajo estudio controlando tres E. Experimento
! factores: humedad, presión y altura;
! observó con cuidado los resultados. Se trata
de un:
( ) ¡E Un investigador hizo mediciones con un
! reloj que se atrasaba 7/100 de segundo cada
¡
minuto. Cometió entonces un:
ta
R E S P U E S T A ¡ C A M P O 1 ¡ C A M P O 2
( ) J0 La distancia entre dos estrellas se obtiene 1 A. Medición directa
¡ por:
' B. Medición aleatoria
( ) ¡LE Un juez deportivo utiliza la cinta de medir
i para determinar la longitud del salto de un i C. Medición indirecta
! atleta. Su medición es una: !
¡ i D. Medición
( ) |0 Mediante sorteo, para no emitir un juicio i característica
! tendencioso, se seleccionó un animal cuyo !
! peso se prefirió registrar en kilogramos. Se !
! obtuvo una:
!
II. Situaciones y planteamientos
A continuación se presentan cuestiones que pondrán en duda tu aprendizaje.
Debes reflexionar cuál de las cuatro proposiciones, relacionadas con la situa
ción, es verosímil. Subraya la que elijas.
O En su investigación, Carlos tomó una muestra de los ingresos diarios en pesos
en las tiendas escolares de 50 escuelas primarias en Campeche. En todas ellas
el ingreso es de $2800.00.
0 La muestra es representativa de la población.
0 Los datos recogidos son aleatorios.
0 El evento "en cada una de las 50 tiendas los ingresos diarios son de $2 800.00"
es improbable.
0 Debe usar la estadística inferencial para obtener una conclusión correcta.
O Georgina explicó en su conferencia el proceso de investigación estadística que
siguió para obtener su conclusión, la cual, a partir de una muestra muy peque
ña, generalizaba los resultados a una población grandísima. Sus explicaciones
acerca de por qué la generalización era válida fueron aceptadas.
0 Sus conjeturas eran correctas.
0 Su defensa se basó en la estadística descriptiva.
0 Aplicó técnicas de la estadística inferencial.
0 Su conclusión era exacta.
ü Cuando Juan lanzó una moneda al aire 100 veces para divertirse, no se trataba
de un experimento aleatorio porque:
[a ] Esto es una investigación, pero no un experimento.
[~bl No hay una pregunta y una intención planteadas.
[JJ Todo experimento aleatorio se refiere a fenómenos en los cuales no se pue
de predecir un resultado.
[U NO se sabe si los resultados se comportarán con una proporción exacta.
Q Cuando se divide 2 entre 7, todas las cifras decimales que se obtienen no son
aleatorias, porque:
H No aparecen todos los dígitos.
[b] Empiezan con un dígito par.
[JJ Ninguna es aleatoria.
[d] Se puede predecir cualquiera de las cifras decimales del cociente de esta
división.
O Susana, que es modista, tiene problemas porque las 100 blusas "untadas" al
cuerpo que le pidieron no han satisfecho a sus dientas por la forma en que les
quedan en la parte de la cintura. Le han dicho que siempre comete un error
sistemático.
1 a 1 Toma medidas sobre la blusa que llevan puesta.
¡b] Cambia de cinta de medir.
UJ Las dientas van a que se les tomen medidas el día que les da la gana,
[dj No cobra lo que le deben.
O Se tiene una población de datos: 0 ,1 , 2, 3, 4, 5, 6, 7, 8, 9. Neeman escribe los nú
meros en papeletas iguales, introduce éstas en un sombrero, y toma a la suerte
dos de ellas. Obtiene 0 y 3.
[a ] La muestra no es aleatoria ni representativa porque los números son de los
más pequeños.
[b] La muestra es tendenciosa.
UJ La muestra debe ser desechada y se debe tomar otra hasta que sea repre
sentativa.
[d] La muestra es aleatoria y representativa porque el proceso seguido es alea
torio, como el de una lotería.
Q Al trabajar tecleando en la computadora, Sheviit, quien se dedica a transcribir :
largos documentos legales, se equivoca. Ella determina que los errores que co- ;
mete son de tipo aleatorio porque: ;
[a ] La computadora es de un modelo antiguo. :
fbl Son escasos y no repetitivos. :
0 Trabaja de noche. •
[d] La luz de la lámpara es insuficiente. :
O El número de granos de arena en la Tierra es una variable que se puede medir
porque: •
[a ] Basta contarlos.
|~b~| Mediante las mediciones de una muestra se puede obtener una medida in- •
directa. •
UJ Se puede redondear su número. :
[d] Se conoce la longitud y profundidad de las playas de todo el mundo. ;
III. Contextos y conceptos
Las siguientes actividades implican la aplicación de los diferentes conceptos es- ;
tudiados y aprendidos en este tema. Lo ideal es trabajar en equipo. Reúnete con '•
algunos de tus compañeros de grupo para realizar el trabajo. '.
D En un centro experimental agropecuario del estado de Guanajuato se crían
cerdos. Se separa una carnada de 30 de ellos en dos grupos, A y B. A los cerdos ;
del grupo A se les prepara un alimento especial que se supone puede engordar- •
los mucho más en 6 meses, sin alterar las propiedades alimenticias ni el sabor :
de su carne. A los del grupo B se les da el alimento habitual. El científico que :
estudiará el efecto del alimento diseña un procedimiento de investigación y ;
plantea las siguientes preguntas antes de iniciar el estudio, las cuales tú debes ;
contestar. •
[a ] ¿Cuál es la pregunta que se debe plantear acerca del proceso que voy a es- :
tudiar?
0 ¿Cuál es la variable de interés respecto a cada grupo de cerdos? '•
UJ ¿Cuáles son las poblaciones bajo estudio? :
[~d~l ¿Qué otras componentes características serán necesarias después en la in- :
vestigación? '•
0 ¿Es éste un experimento? ¿Por qué? :
II El precio de los combustibles y aceites para embarcaciones pesqueras es un
factor importante en los gastos que se realizan en cada temporada de pesca. El
dueño de una embarcación en Sonora quiere estimar el gasto, en pesos, de
energéticos y lubricantes para su salida en la próxima temporada. Se va de pes
ca todas las veces que puede. En la siguiente tabla se muestra el registro de los
gastos en pesos de combustible y aceites en las últimas 6 temporadas.
1 . , 2 3 A 5 • • 6
3 600 3790 3 980 4200 4400 I
4490
[a ] ¿Cuál es la variable bajo estudio?
QT] ¿Cuál es la unidad de la variable bajo estudio?
[JJ ¿En qué escala se mide la variable?
[dj Los datos del dueño de la embarcación, ¿corresponden a una muestra?
¿Por qué?
H ¿Por qué se les llama datos a estos números que representan gastos en
combustibles y aceite?
[71 ¿De qué tipo y densidad es la variable bajo estudio?
[J] Analiza los datos. Aproximadamente, ¿cuántos pesos gastará el pescador
en aceites y combustible en la próxima temporada?
fü En un centro meteorológico en el estado de Veracruz, se mide la velocidad del
viento en kilómetros por hora. Antes de la llegada de un huracán en un mes de
septiembre, las 10 mediciones máximas son las que se muestran a continua
ción.
65.05 ¡ 68.59 ¡ 69.92 ¡ 73.76 ¡ 78.87 ¡ 78.94 ¡ 83.75 ¡ 89.85 ¡ 92.08 ¡ 95.57
¿Qué se pregunta el investigador si obtiene datos como éstos?
¿Para qué podrían ser útiles estos datos?
¿Cuál es el elemento de la muestra?
¿Serán estas velocidades representativas de cualesquiera velocidades de los
vientos antes de la llegada de un huracán a cualquier costa? ¿Por qué?
¿En qué escala se mide la variable? ¿Por qué?
En este caso, ¿cuál es la diferencia entre un dato y la información que se
obtiene?
Q La familia Castilla se cambió a su nueva casa en la ciudad de Oaxaca a princi
pios del año 2002. El señor Castilla sospecha que se gastó más agua potable en
el año 2003. Para comparar los consumos mensuales de agua potable en me
tros cúbicos en su casa habitación correspondientes a los años 2002 y 2003, los
anota como se muestran en la siguiente tabla
\ M e s j
Año \ i
E F M
1
A M J J
i : 1
A
i ; n
S O
_ , N
i
D
2002 ¡ 30 33 36 40 41 45 48 38 38 36 35 33
2003 ¡ 32 34 40 50 52 57 57 42 38 36 36 32
[a ] ¿Cuál es la variable que estudia el señor Castilla? ¿En qué escala se mide?
QT] Para los fines del señor Castilla, los datos de cada año, ¿son una población
o una muestra? ¿Por qué?
[JJ Describe la población que estudia el señor Castilla.
[d] El señor Castilla suma los metros cúbicos de agua gastados cada año. Cada
uno de esos nuevos números, ¿es un estadístico o un parámetro? ¿Por qué?
H Observa el comportamiento del consumo. ¿Qué información o conclusión
puede extraer el señor Castilla de los datos que posee?
UJ ¿Cuáles razones pueden darse a los resultados observados?
[jfj ¿Cuál es la diferencia entre dato e información?
H En el centro comercial Meridian en la ciudad de Mérida, el supervisor del área
de lácteos revisa en el sistema computarizado el nivel de inventario al fin de
semana de toda la leche que sé vende en el establecimiento. Para la leche en
envase de cartón, las últimas 10 semanas arrojaron los siguientes datos en li
tros, considerando las 4 marcas a la venta: A, B, C y D.
1200 | 1540 ¡ 1470 ¡ 1300 ¡ 1100 ¡ 1350 ¡ 1290 ¡ 1320 ¡ 1370 ¡ 1050
H ¿Cuál es la población que se estudia? Defínela.
HD Construye otra definición de la población que se tiene que estudiar, con un
menor grado de generalidad.
U] Construye otra definición de la población que se tiene que estudiar, con un
mayor grado de generalidad.
[3 ¿Cuál es el inventario promedio semanal (media aritmética) de la leche en
envase de cartón? ¿Es este dato un estadístico o un parámetro? ¿Por qué?
H ¿Qué tipo de medición practica el supervisor? ¿Directa? ¿Indirecta? Explica.
[JJ ¿Cuan posible es el evento "El inventario semanal de leche en envase de
cartón está por debajo de los 1100 litros"? ¿Por qué?
O La administración de una mina de plata en el estado de Hidalgo practica una
; encuesta a sus 800 trabajadores. Se les piden datos sobre cuestiones relacionadas
; con su trabajo. La encuesta tiene varias preguntas; entre ellas, las siguientes.
: 1) Edad: I 1 años.
; 2) Estado civil
| C A S A D O | | S O L T E R O j ¡ V I U D O ~| | D I V O R C I A D O |
: 3) ¿Tiene hijos?
: LID S
: 4) Si contestó afirmativamente a la pregunta anterior, ¿cuántos hijos tiene?
: 5) ¿Cuál es el estado de las instalaciones de seguridad? | E X C E L E N T E S | [ B U E N A S | | R E G U L A R E S | | M A L A S |
: 6) La capacitación en materia de seguridad es
; j E X C E L E N T E [ | B U E N A | j R E G U L A R | | M A L A ~|
: [ a ] ¿Es éste un experimento o una investigación? Indaga y explica cuáles son
• las diferencias o coincidencias de ambos conceptos.
: [b] ¿Se estudia la población o una muestra? Explica.
: [Jj Ochenta y cinco por ciento de los trabajadores contestaron que sí tienen
'• hijos. ¿Es éste un parámetro o un estadístico? ¿Por qué?
: 0 ¿De qué tipo y densidad es la variable "número de hijos"?
fe] ¿En qué escala se mide la variable "estado civil"?
: [JJ ¿En qué escala se mide la variable "la capacitación en materia de seguridad
: es..."?
: D El ingreso per cápita de México en el año 2004 fue de aproximadamente 2 040
'• dólares estadunidenses. Esto es, cada habitante del país ingresó en promedio
: esa cantidad de dólares al país ese año. Esta cantidad, ¿cuántas cifras significa-
; tivas tiene? ¿Por qué?
• O Los representantes del Instituto Nacional para la Evaluación de la Educación
: ( I N E E ) practican exámenes de conocimientos y habilidades a estudiantes de
: tercer grado de secundaria en toda la República mexicana, para conocer su ni-
: vel de aprovechamiento. Un día llegaron a una secundaria en una ciudad del
; estado de San Luis Potosí, y le indicaron al director que debían aplicar un exa-
• men a 30 de los estudiantes de tercer grado. Para ello, tomaron las listas de los
: grupos y seleccionaron a 30 estudiantes mediante un sorteo. En todas las se-
: cundarias donde el I N E E practica exámenes se procede así. Los puntajes que
; obtuvieron los 30 jóvenes seleccionados, en una escala de 0 a 10, se dan ordena
dos del menor al mayor en la siguiente tabla.
2.26 4.26 4.63 1
5.41 i
5.79 6.23
3.25 4.40 5.06 5.41 5.81 6.32
3.65 4.49 5.12 5.54 5.88 6.35
3.93 4.53 5.17 5.63 5.99 6.53
4.04 4.53 5.39 5.64 6.18 6.62
[a ] ¿Los datos obtenidos son los de una población o los de una muestra? ¿Por
qué?
[£] ¿El I N E E practica un experimento aleatorio? ¿Por qué?
| ~ c ~ | ¿Qué información quieren conocer los investigadores del I N E E ?
[d] Los datos obtenidos en esta secundaria, ¿les permitirán conocer lo que
buscan?
[el ¿Cuáles fueron la mayor y la menor calificación? ¿Son parámetros o esta
dísticos? ¿Por qué?
[JJ La medición hecha, ¿fue directa o indirecta? ¿Por qué?
\W\ ¿Cuántas cifras significativas tienen las calificaciones?
[h] ¿De qué tipo y densidad es la variable que se mide? ¿Por qué?
[JJ Redondea las calificaciones a décimos.
|T| ¿La muestra tomada es representativa de los estudiantes de esa secunda
ria? ¿Por qué?
Los siguientes datos son mediciones del peso en gramos de 10 papas tomadas
al azar de diferentes sacos de un cargamento procedente de Pinos, Zacatecas, y
puede ser comprado por un comerciante. Las papas se seleccionaron para te
ner idea de su peso y consistencia física (buena, regular, mala).
148.54 ¡ 166.80 ! 159.62 ! 140.81 175.79 165.00 149.36 156.94
(Jl ¿Cuáles son las variables que observa el comerciante?
[bl ¿En qué tipo de escala se mide cada variable?
(JJ ¿De qué tipo y densidad son las variables que se observan?
[di ¿Cuál es el elemento de la muestra y qué dato proporciona?
[jfj ¿Cuántas cifras significativas tiene cada dato? ¿Por qué?
[JJ Redondea los pesos a décimos y ordénalos del menor al mayor,
[el ¿Cuál es el rango de los pesos de las papas (rango = dato mayor—dato menor)?
QTJ Si los datos son una muestra representativa de todas las papas, ¿cuan posi
ble es que existan en gran cantidad papas de 140 gramos? ¿Por qué?
ÍU ¿Qué es una muestra representativa?
BU El diámetro de la base de un poste de concreto para cableado eléctrico debe ser
igual a 30 cm ± 0.5 cm. Toda remesa de postes se revisa, antes de enviarla al
cliente, mediante un muestreo de 10% de los postes y se mide su diámetro. Si
más de tres postes sobrepasan o tienen menor diámetro que el esperado, se re
visan otros 20 postes del mismo lote; si nuevamente se encuentran tres o más
postes fuera del rango establecido, se revisa todo el lote de 200 postes. Los da
tos obtenidos de una muestra son los siguientes.
30.06 29.98 29.61 1 i
29.94 i
30.44
28.53 29.98 29.80 29.48 30.60
29.78 - 29.48 30.12 30.13 30.37
30.15 29.97 29.71 30.25 29.72
0 ¿Cuál es la medida de la incertidumbre máxima esperada?
[~b~l ¿Cuál es la medida del error relativo esperado?
0 ¿La medición es directa o indirecta? ¿Por qué?
0 ¿Qué información es la importante para tomar una decisión?
0 ¿Deberán revisarse otros 20 postes? ¿Por qué?
0 Redondea las cantidades y determina ahora cuántos postes no cumplen las
especificaciones. Obten una conclusión al respecto.
0 Calcula el error de redondeo de los cuatro datos en la primera columna.
0 ¿La variable que se estudia es continua o discreta? ¿Por qué?
ES El dueño de un puesto de revistas en el centro de la ciudad de Morelia registra
las ventas semanales en pesos de las últimas 10 semanas por concepto de pe
riódicos y revistas. Los datos se muestran en la siguiente tabla.
Semana i 1 2 3 4 5 6 7 8 * 9 10
Ventas
revistas ($) ! 9 800 8 600 8 900 6700 9 600 7900 8700 5 600 9 300 8 600
Ventas
periódicos ($) ¡ 7500 7650 7350 7430 7680 7550 7590 7670 7 620 7540
0 ¿Cuáles variables estudia* el dueño del negocio?
0 ¿Qué tipo de variables son? ¿Y por su densidad?
0 Define las dos poblaciones que observa el dueño del local.
0 Escribe una historia de las ventas observadas para cada caso.
0 ¿Cuáles ventas muestran más variación? ¿A qué crees que se deba? Da dos
razones.
0 De acuerdo con los datos, ¿cuántas cifras significativas tiene cada serie de
datos? ¿Por qué?
13 El gerente de una gasolinera lleva un registro de las ventas diarias de gasolina
en litros. Las ventas de la última semana, las cuales se muestran en la tabla si
guiente, fueron superiores a las de otras semanas.
Día i 1 i 2 3 j 4 5 r
6 7
Ventas | 3 590.28 ¡ 4 678.95 j 1 , z
3 998.24 ¡ 4005.74 3 880.63 6792.67 5824.33
0 Redondea los datos a décimas.
0 Calcula el error de redondeo para cada dato, y explica si se redondeó por
exceso o por defecto.
0 ¿Es posible que suceda el evento "Las ventas del día son mayores de 6 800
litros"? ¿Por qué? ¿Cuál es la base de tu respuesta?
[d i ¿Es posible el evento "Las ventas semanales son menores de 28 000 litros"?
¿Por qué? Justifica tu respuesta.
Q En el laboratorio de química de una escuela se utiliza un termómetro analógi
co para medir temperaturas. La encargada sabe que da medidas con 0.5°C de
más. En una práctica, se calentó un litro de agua durante 4 minutos y se tomó
la temperatura con ese termómetro. El experimento se repitió 8 veces. Los da
tos obtenidos se muestran a continuación.
Experimento
Temperatura (°C) 59.67
2 ' :
60.03 59.49 58.64 59.39 60.18 59.10 60.08
0 Calcula las temperaturas reales.
Experimento 1 2 3 4 5 6 " ' • : '7 ' 8
Temperatura (°C)
0 ¿Qué tipo de error ocurre en las observaciones hechas con el termómetro?
0 ¿Qué factores en el laboratorio pueden incidir en la variación de las medi
ciones, que sean causa de errores aleatorios? Menciona tres de ellos.
0 Observa los datos. ¿Crees que varían mucho? ¿Cuál puede ser la causa?
0 Según su densidad, ¿de qué tipo es la variable?
0 ¿En qué escala se mide la variable?
Ü3 Un biólogo mide con un instrumento de alta precisión la longitud en milíme
tros de 12 hormigas podadoras, tomadas al azar de una colonia en estudio, la
cual ha sido alimentada con una bacteria poseedora de un gen que se supone
puede reducir la talla. Las mediciones se registran en la siguiente tabla.
i
4.200 i 1
3.980 4.210 4.500 i 1
4.034 4.109
4.408 3.990 4.004 4.305 4.220 4.209
0 ¿Cuántas cifras significativas tienen los resultados de las mediciones? ¿Por qué?
HO ¿Cuál es el promedio, o media aritmética, del tamaño de las hormigas? Re
cordemos que
suma de las mediciones Media aritmética = x -
número de mediciones
Respeta las reglas de operación estudiadas y da el resultado.
0 ¿Qué tipo de medición realizó el biólogo?
0 Redondea las mediciones a centésimas, y vuelve a calcular la media aritmé
tica de las longitudes. Compara los dos resultados y explica lo que ocurre.
0 La longitud promedio de las hormigas, antes de alimentarlas con la bacte
ria, era de 4.3 cm. ¿Qué inferencia puede hacerse al respecto? En promedio,
¿ha disminuido la longitud de las hormigas?
UJ Días después, el biólogo midió dos hormigas más; obtuvo los datos en milé
simas y los redondeó a centésimas: 4.23 cm y 4.04 cm. ¿Cuáles pudieron ser
los datos que obtuvo en milésimas?
E3 En un experimento físico, se mide la masa de 5 protones para aproximarla a su
valor de masa promedio.
1.58 X 1 0 " 2 4 ¡ 1.61 X 1 0 " 2 4 ¡ 1.63 X 1 0 - 2 4 ¡ 1.59 X 1 0 ~ 2 4 ¡ 1.60 X 1 0 ~ 2 4
0 ¿Cuántas cifras significativas tiene cada medida?
0 ¿Cuál es la masa promedio estimada de los protones?
0 ¿Qué tipo de medición debió hacerse para obtener la masa de cada protón
en la muestra?
Eü El volumen de un pequeño robot en forma de prisma rectangular, construido
en un centro de investigación en robótica en la ciudad de México, es una varia
ble que ocurre al azar. Las medidas de los lados de uno de ellos, en milímetros,
son: 0.052, 0.0405 y 0.03876.
0 ¿Cuántas cifras significativas posee cada una de las medidas?
0 ¿Cuál es el volumen del robot?
SQ Estudiantes de medicina de una universidad en Aguascalientes miden la velo
cidad en metros por minuto del caminar en ancianos mayores de 65 años que
hacen ejercicio diariamente en diferentes parques públicos de la ciudad, a dife
rentes horas del día y en distintas estaciones del año. Además, les practican un
estudio médico. Los resultados de 40 paseos de otros tantos ancianos se mues
tran en la tabla siguiente.
51.5 55.1 58.5 60.7 61.9 63.5 64.5 67.3
52.8 55.6 58.6 60.8 62.1 63.7 65.4 68.6
54.0 56.7 58.7 61.1 62.2 63.9 65.9 68.8
54.0 58.1 59.0 61.4 62.6 64.1 66.0 69.6
54.8 58.1 60.6 61.6 63.2 64.3 66.7 69.9
0 ¿Qué elementos conforman la muestra?
0 ¿Cuál es la población en estudio? Defínela de nuevo reduciendo su grado
de generalidad.
0 ¿La muestra es representativa de la población? ¿Por qué?
0 Redefine la población, esta vez con menor grado de generalidad.
0 ¿Para qué podría ser útil la información recabada?
0 ¿En qué escala de medición se mide la variable estudiada?
0 Si se calcula la velocidad promedio, ¿cuántas cifras significativas tendrá?
¿Por qué?
0 De acuerdo con los datos, ¿cuan posible es el evento "La velocidad prome
dio en una caminata en los ancianos mayores de 65 años es menor a 50
metros por hora"?
13 El tiempo de vida promedio en segundos de diferentes partículas de la física se
muestra en la siguiente tabla. (Tomada de R. Resnick y D. Halliday (1989), Físi
ca, Editorial Continental, México, p. 604.)
Muón 2.197 X 1 0 " 6
Lambda 2.578 X 1 0 - 1 0
Omega 1.3 X 1 0 " 1 0
Compara mediante un cociente la vida de las diferentes partículas y escribe
los resultados con las cifras significativas que correspondan.
La estadística es una ciencia que crea métodos para estudiar el comporta
miento de conjuntos de datos, especialmente su variación. Esos datos proce
den de poblaciones o de muestras. Cuando provienen de una población, se
efectuó un censo. Los resultados numéricos obtenidos de los datos numéri
cos se llaman parámetros.
La estadística descriptiva es la que se ocupa de crear procedimientos para re
presentar y describir masas de datos numéricos con variación; la estadística
inferencial tiene como objetivo obtener conclusiones acerca de una población
con base en las mediciones de una muestra. Los resultados numéricos que
provienen de muestras se llaman estadísticos.
La información es un producto de los datos; es una conclusión que se obtiene a
partir de las medidas de una muestra o de una población, o bien de gráficos o
esquemas que las resumen. De esta manera, distinguimos dato de información.
Los experimentos permiten obtener mediciones y datos de otros tipos. Los
aleatorios se distinguen porque no es posible predecir un resultado al efec
tuarlos. Estos experimentos proporcionan a la estadística su valor, porque las
mediciones que de ellos se obtienen tienen variabilidad. La observación en un
experimento o en una investigación se refiere a una o varias variables.
Las variables son características que se miden y pueden asumir diferentes va
lores. En un experimento las variables pueden controlarse. Por su tipo son
cualitativas o cuantitativas. Por su densidad son discretas o continuas. La
medición de las variables se hace utilizando una escala. Las más comunes son
nominal, ordinal, de intervalo, y de razón.
La medición y la representación de las medidas aproximadas es sumamente
importante porque determinan la calidad de la información (conclusiones).
Al medir se cometen errores, por lo que ninguna medición es exacta. Hay dos
tipos de errores de una medida: sistemáticos y aleatorios. El error de una me
dición se define como
Error = número redondeado — número exacto.
En la ciencia, la notación sistematizada de una medida es convencional: se
representa por cifras significativas. Éstas determinan cómo se realizan las
operaciones de multiplicación y división de mediciones. Una cifra significati
va es relativa a la precisión del instrumento de medición.
Las operaciones de suma y resta dependen de las cifras decimales en las can
tidades. El resultado se redondea a la cantidad de decimales de la cifra con
menos decimales.
Lo que es posible cuando se observa un fenómeno se llama evento. Los even
tos son importantes en la estadística porque permiten enfocar la atención de
un investigador en una posibilidad particular.
Distribuciones de frecuencias
1.2.1 I Toma de datos
Los datos estadísticos generalmente son numéricos. Con ellos se realiza el estudio
de situaciones variadas en los más diversos campos de la ciencia y la tecnología.
Dicho estudio se refiere a situaciones en las cuales es indispensable obtener infor
mación confiable para tomar decisiones certeras, las cuales en gran medida se pro
ducen gracias a que los datos se organizan en tablas o gráficos. Para emprender el
estudio de la organización de los datos en tablas, tomemos como referencia la si
guiente situación.
El número de pasajeros por viaje en una línea de camiones que va de Jalapa a (Driza
ba es una variable cuyo comportamiento quiere conocer el gerente de la línea. Para
ello, observó al azar 90 viajes y tomó los datos en bruto (véase la tabla 1.14). Luego
los organizó por orden ascendente, como se muestra en la tabla 1.15. Con esos da
tos construyó una tabla de distribución de frecuencia (tabla 1.16), en la que los da
tos numéricos fueron organizados por clases. (Observa los elementos que se utili
zaron para construir la tabla 1.16; te servirá como referencia en la sección 1.2.3,
sobre clasificación de datos.)
Tabla 1.14 Número de pasajeros por viaje (datos en bruto)
21 26 31 28 31 25 26 28 29
22 25 25 28 30 27 31 30 30
22 31 30 32 33 31 20 30 26
23 30 24 28 25 27 24 30 26
24 24 28 29 25 30 32 26 26
24 27 26 26 25 30 30 35 24
24 28 31 29 24 30 25 33 27
24 27 27 29 28 30 25 30 22
25 25 34 23 28 26 24 25 .27
25 25 29 33 24 30 28 25 26