INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A...

57
Este documento ha sido generado para facilitar la impresión de los contenidos. Los enlaces a otras páginas no serán funcionales. ¿Por qué utilizamos la estadística en investigación comercial? ¿Hemos pensado alguna vez cuantas veces al año se suena la nariz una persona?, ¿Sabemos cuánto tiempo dedicamos a la semana a pasar el aspirador?, ¿Conoces que Holanda importa el 52 % de la flor cortada de fuera de la Unión Europea? Realmente podemos pensar que eso no le importa a nadie, pero la cosa cambia si nos ponemos por un momento en la piel del director de marketing de una empresa de pañuelos de papel, de una empresa de filtros para aspirador o de un importador de flores. Pensemos que vamos a crear un hotel en Isla Paraíso. Aquí tenemos 10 millones de euros para gastar como queramos. Adelante, ya podemos edificar el hotel, vamos a darle el dinero a una constructora y a pedirle que nos hagan el hotel. A los cinco minutos ha venido el director de la constructora y me ha hecho un par de preguntas que me han hecho reflexionar. ¿Cuántas habitaciones quiere para el hotel?,¿De cuántas estrellas?. La verdad es que no tengo ni idea, ¿Cómo podemos averiguarlo?, probemos a contar con información. Me interesa conocer el mercado: Qué tipo de cliente viaja a una isla como la nuestra, qué tipo de hotel prefiere, cuánto gasta durante su estancia, cómo contrata su viaje, etc.. A las empresas les interesa estudiar su mercado, para poder adaptar su oferta a las necesidades del mismo Supongamos que hemos sido capaces de conseguir la información que necesitamos. ¿hemos terminado? Me temo que esto únicamente es el principio, ahora llega el momento cumbre, hay que tomar la decisión. Consideremos que hemos decidido construir un hotel de tres estrellas con cien habitaciones. La empresa constructora ha realizado su trabajo en un tiempo record y nos acaba de entregar nuestro hotel perfectamente equipado. El personal ya ha sido contratado con antelación y estamos en condiciones de recibir a nuestros primeros clientes. Todavía no hemos terminado con la búsqueda de información, ahora es necesario saber si los clientes han quedado satisfechos de su estancia. A las empresas les interesa conocer el nivel de satisfacción de sus clientes Los primeros datos son bastante positivos: El primer mes hemos tenido una ocupación media del 60 %, sabemos que uno de cada tres clientes ha quedado muy satisfecho, que el 40 % piensan repetir sus próximas vacaciones y que el gasto medio por cliente ha sido de 200 € a la semana. La estadística nos ha ayudado a obtener y presentar estos datos. Página 1 de 57 ¿Por qué utilizamos la estadística en investigación comercial? 14/04/2008 http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

description

FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING - INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL

Transcript of INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A...

Page 1: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

Este documento ha sido generado para facilitar la impresión de los contenidos.

Los enlaces a otras páginas no serán funcionales.

¿Por qué utilizamos la estadística en investigación comercial?

¿Hemos pensado alguna vez cuantas veces al año se suena la nariz una persona?, ¿Sabemos cuánto tiempo dedicamos a la semana a pasar el aspirador?, ¿Conoces que Holanda importa el 52 % de la flor cortada de fuera de la Unión Europea?

Realmente podemos pensar que eso no le importa a nadie, pero la cosa cambia si nos ponemos por un momento en la piel del director de marketing de una empresa de pañuelos de papel, de una empresa de filtros para aspirador o de un importador de flores.

Pensemos que vamos a crear un hotel en Isla Paraíso.

Aquí tenemos 10 millones de euros para gastar como queramos. Adelante, ya podemos edificar el hotel, vamos a darle el dinero a una constructora y a pedirle que nos hagan el hotel.

A los cinco minutos ha venido el director de la constructora y me ha hecho un par de preguntas que me han hecho reflexionar. ¿Cuántas habitaciones quiere para el hotel?,¿De cuántas estrellas?.

La verdad es que no tengo ni idea, ¿Cómo podemos averiguarlo?, probemos a contar con información.

Me interesa conocer el mercado: Qué tipo de cliente viaja a una isla como la nuestra, qué tipo de hotel prefiere, cuánto gasta durante su estancia, cómo contrata su viaje, etc..

A las empresas les interesa estudiar su mercado, pa ra poder adaptar su oferta a las necesidades del mismo

Supongamos que hemos sido capaces de conseguir la información que necesitamos. ¿hemos terminado?

Me temo que esto únicamente es el principio, ahora llega el momento cumbre, hay que tomar la decisión.

Consideremos que hemos decidido construir un hotel de tres estrellas con cien habitaciones. La empresa constructora ha realizado su trabajo en un tiempo record y nos acaba de entregar nuestro hotel perfectamente equipado. El personal ya ha sido contratado con antelación y estamos en condiciones de recibir a nuestros primeros clientes.

Todavía no hemos terminado con la búsqueda de información, ahora es necesario saber si los clientes han quedado satisfechos de su estancia.

A las empresas les interesa conocer el nivel de sat isfacción de sus clientes

Los primeros datos son bastante positivos:

El primer mes hemos tenido una ocupación media del 60 %, sabemos que uno de cada tres clientes ha quedado muy satisfecho, que el 40 % piensan repetir sus próximas vacaciones y que el gasto medio por cliente ha sido de 200 € a la semana.

La estadística nos ha ayudado a obtener y presentar estos datos.

Página 1 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 2: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

La estadística busca características generales de u n colectivo y prescinde de las particulares de cada elemento.

Cuando la estadística encuentra regularidades en el comportamiento del colectivo, nos servirán para describir el fenómeno y para realizar predicciones.

Para saber más: http://www.aiteco.com/satisfac.htm http://www.servicevalley.net/rootes/showprod.asp? codProd=147&categID=102&subcatID=102

http://www.asifal.org/Satisfaccion_al_Cliente.htm

Autoevaluación

Responder con verdadero o falso: La estadística busca características particulares de cada elemento y prescinde de las generales de un colectivo.

a) Verdadero

b) Falso

Estadística aplicable a la Investigación Comercial

Conceptos básicos de estadística descriptiva

Para comprender mejor los conceptos vamos a utilizar un ejemplo casi real.

La Isla Paraíso está situada en el archipiélago de Nirvana en el Océano Atlántico. Goza de una temperatura estable durante todo el año, lo que la convierte en un enclave maravilloso, tanto para vivir como para pasar una temporada de vacaciones.

En la isla viven 100.000 habitantes dedicados, en su mayoría, a actividades vinculadas al turismo y a la fabricación de objetos de bambú.

� Población

� Muestra

� Tamaño muestral

Estadística aplicable a la Investigación Comercial

Universo y Población

Cuando queremos obtener información la primera pregunta que debemos responder es ¿de qué elementos quiero extraer la información?, esta pregunta no resulta tan fácil de responder como puede parecer.

En estadística se denomina Universo al conjunto de e lementos u objetos de los cuales se quiere obtener información.

Aquí el término elementos tiene un significado mucho más amplio que el usual, ya que puede referirse a personas, cosas, actos, áreas geográficas e incluso al tiempo.

Página 2 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 3: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

Si nos fijamos en alguna o algunas de las características de los elementos del Universo nos aparecerá un nuevo concepto "la Población ", que es el que recogerá todas esas informaciones que queremos obtener.

En estadística se denomina Población al conjunto de d atos referidos a todos y cada uno de los elementos del Universo.

Por ejemplo:

� Si estudiamos al Universo "habitantes de isla Paraíso" podremos estudiar:

� La Población: edades de los habitantes de isla Paraíso.

� La Población: alturas de los habitantes de isla Paraíso.

� Etc....

� Si estudiamos al Universo "flautas fabricadas" podremos investigar:

� La Población: la calidad de las flautas de bambú fabricadas.

� La Población: los tipos de flautas de bambú fabricadas.

� Etc...

� Si queremos saber sobre el Universo "turistas" podremos investigar:

� La Población: nivel de satisfacción de los turistas que visitan la isla.

� La Población: edades de los turistas que visitan la isla.

� Etc...

Vayamos a la práctica.

¿Es fácil de definir la población?

La respuesta es que no siempre es fácil definir correctamente la población ya que debe estar perfectamente definida en el tiempo o/y en el espacio .

Por ejemplo, para estudiar la edad de los habitantes habrá que especificar a que año nos referimos: Habitantes de la isla en el año 2003.

Si vamos a medir la calidad de las flautas de bambú será necesario detallar qué tipo de flauta y el período en el que se hayan fabricado.

Una población puede ser finita e infinita.

Cuando la Población es infinita, y es complicado realizar un estudio en ella por no poder acceder a todos los datos, nos aparece un nuevo concepto estadístico "La Muestra " que explicaremos en la pregunta siguiente.

Autoevaluación

Se estudian las horas semanales que dedica a investigación un Departamento especializado. Indicar cual es el universo y cual la población de las siguientes afirmaciones:

a) Se recogen todos los datos de todas las características del Departamento especializado.

Elige una opción...

b) Se recogen los datos correspondientes a las horas semanales que dicho Departamento le dedica a investigación Elige una opción...

Estadística aplicable a la Investigación Comercial

Página 3 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 4: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

Muestra

Podemos estar pensando que obtener información es un proceso demasiado complicado. ¿Cuánto tiempo podemos tardar en preguntar algo a todos los españoles?; si queremos saber el recorrido de los clientes en un hipermercado ¿Tenemos que seguirlos a todos?; para comprobar si los pastelillos de una fábrica tienen la calidad deseada ¿hay que probarlos todos?

Evidentemente hay ocasiones en las hay que obtener la información de un número de elementos inferior al de la población, en estos caso hablamos de muestra.

Muestra: es un subconjunto de la población o parte representativa de la misma.

La información que obtengamos de la muestra debe servir para conocer a la población, por ello es importante utilizar una muestra que represente a la población.

Diremos que una muestra es representativa cuando lo s datos estudiados de la Población se cogen al azar.

Para que la muestra represente a la población y sea de utilidad estadística, deben reunirse ciertos requisitos para la selección de los datos como vemos.

¿Cuándo interesa recurrir a una muestra? Casi siempre.

Compensa utilizar una muestra en los siguientes casos:

� Si la población tiene un tamaño muy grande o infinito y, en consecuencia, es imposible observar a todos sus elementos.

Por ejemplo, si queremos analizar la calidad del agua que fluye por el cauce del río Casto (único en nuestra isla), es imposible estudiar cada gota de agua.

� Si el coste de realizar una observación exhaustiva es muy alto.

Por ejemplo, si hay que visitar a los habitantes que viven en los pequeños poblados de muy difícil acceso. (aunque debe de entrar alguno en la muestra) .

� Si el tiempo de recolección de datos es muy extenso. Por ejemplo, si queremos preguntar a los turistas que visitaron la isla en los últimos cuatro años.

� Si la observación de los elementos es destructiva.

Por ejemplo, si queremos estudiar si están sabrosos los helados de una partida destinada a la venta en hoteles, no podríamos probarlos todos porque los destruiríamos.

En otros casos es interesante estudiar todos los elementos que componen la población, en estos casos hablamos de un censo.

Autoevaluación

¿Cuál de las siguientes afirmaciones no es correcta?: Compensa recurrir a una muestra si:

a) La población tiene un tamaño muy grande o infinito.

b) El coste de realizar una observación exhaustiva es muy alto.

c) El tiempo de recolección de datos es muy pequeño.

Página 4 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 5: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

d) La observación de los elementos es destructiva.

Es importante cuando utilizamos una muestra que sea representativa

a) Verdadero

b) Falso

Estadística aplicable a la Investigación Comercial

Tamaño de la muestra

Pensemos en lo curioso que puede llegar a ser la estadística.

Antonio y Arturo son dos amigos que han pasado juntos toda su vida, pero a Antonio le han ido francamente bien las cosas y a Arturo le han ido bastante mal.

Antonio tiene un valioso patrimonio: dos casas, cuatro coches, ocho locales comerciales, y cuarenta tiendas, su único problema es que ha dedicado todo su tiempo a su trabajo y sigue soltero a sus cuarenta años. Arturo se casó a los veinte años, tuvo cuatro hijos, se separó y ha vuelto a casarse y lo han despedido de todos sus empleos.

Si usamos la estadística podemos afirmar que cada amigo tiene una casa, dos coches, cuatro locales comerciales y veinte tiendas. También veremos que cada uno tiene dos hijos y se ha casado una única vez.

¿Qué ha pasado?

Los elementos de la población (Antonio y Arturo) son bastante diferentes y al calcular la media de sus posesiones lo único que conseguimos es que ninguno de los dos quede representado.

Podemos pensar, si esto ha ocurrido con dos personas, ¿Qué ocurrirá con poblaciones de mayor tamaño?, o peor aún, ¿Qué ocurrirá si en vez de preguntar a toda la población recurrimos a una muestra?.

La respuesta a todo esto también la tiene la estadística. Hay que usar la técnica adecuada a cada situación.

Vamos a centrarnos en el tamaño de la muestra .

Ya hemos dicho que para que podamos utilizar de manera útil la información extraída de una muestra esta debe ser representativa, y por lo tanto útil.

Para que una muestra sea representativa debe de reflejar las similitudes y diferencias encontradas en la población, y ejemplificar las características de la misma. Cuando decimos que una muestra es representativa indicamos que reúne aproximadamente las características de la población que son importantes para la investigación.

Cuando una muestra tiene el tamaño adecuado y sus e lementos han sido seleccionado correctamente los resultados obtenidos representan a la población.

¿Existe un tamaño de muestra ideal para cualquier investigación?

Página 5 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 6: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

La respuesta es no, en cada caso tendremos que calcular cuál es el tamaño muestral adecuado. Sí existe, y se calcula a través de una formula matemática dependiendo de lo que estemos estudiando.

¿Qué debemos tener en cuenta para calcular el tamaño óptimo de la muestra?

Para calcular el tamaño de la muestra hay que considerar:

� El tipo de parámetro que queramos extraer o estimar y del tipo de estadístico que vamos a emplear. Es distinto el tamaño muestral necesario para calcular una media que para calcular una proporción.

� Hay que considerar la tasa de respuesta . Si suponemos que algunos elementos no van a contestar es interesante sobredimensionar la muestra para que al final tengamos el número de datos que necesitamos.

� El tipo de muestreo que vamos a utilizar.

Desde luego hay que tener en cuenta una cosa, si el tamaño de la muestra es superior al necesario, las conclusiones también son válidas, por ello siempre es preferible pecar por exceso que por defecto, es decir, en caso de duda hay que elegir el tamaño de la muestra mayor.

Para saber más: http://www.uniovi.es/~Psi/REMA/v3n1/a2/p3.html http://www.seh -lelha.org/tamuestra.htm

Autoevaluación

Una muestra representa a la población cuando tiene el tamaño adecuado y sus elementos han sido seleccionados correctamente

a) Verdadero

b) Falso

En caso de dudas, con respecto al tamaño de la muestra es preferible es preferible elegir el tamaño de la muestra menor.

a) Verdadero

b) Falso

Estadística aplicable a la Investigación Comercial

Elementos de la población

Hemos comentado que en estadística el término población sirve para referirse a multitud de cosas: personas, objetos, actos, áreas geográficas e incluso al tiempo.

Estos elementos pueden ser de dos tipos: los cuantitativos y los cualitativos.

Los elementos cuantitativos se denominan variables y pueden ser descritos mediante números, como, por ejemplo, la edad, el número de hijos, el salario, etc.

Todas las personas tienen edad, pero cada una tendrá una diferente, por lo tanto cada observación proporcionará un número. Estos

números son los valores de la variable.

Los elementos cualitativos se llaman atributos y se describen mediante palabras, como la profesión, la nacionalidad o el estado civil. No se pueden medir mediante números.

Página 6 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 7: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

Tampoco los atributos aparecen de manera constante en todos los elementos, por ejemplo si miramos la profesión habrán economistas, profesores, abogados, fontaneros, etc.

Las distintas formas de presentación del atributo se denominan modalidades .

Los elementos cuantitativos se denominan variables y pueden ser descritos mediante números y los elementos cualitativos se llaman atributos y se describen mediante palabras

Para saber más: http://cursos.itam.mx/mendoza/t02.pdf

Autoevaluación

En estadística el elemento población solo sirve para referirse a personas.

a) Verdadero

b) Falso

Los elementos cualitativos se denominan atributos y se describen mediante palabras.

a) Verdadero

b) Falso

Indicar si son variable/atributo los siguientes elementos de una población:

a) La edad.

Elige una opción...

b) La profesión.

Elige una opción...

c) La nacionalidad.

Elige una opción...

d) El número de hijos

Elige una opción...

e) El sueldo

Elige una opción...

Estadística aplicable a la Investigación Comercial

Variable estadística

Una variable es cualquier elemento de la población que puede ser descrito mediante números.

Existe una importante clasificación de las variables distinguiendo los diferentes valores que puede tomar, así se puede diferenciar entre variables discretas y continuas:

Variables discretas: sólo pueden tomar valores enteros (1, 4, -5, etc) y no puede tomar ningún valor comprendido entre ellos. Por ejemplo, el número de empleados de una empresa es una variable discreta, que podrá tomar los valores 0, 1, 2, 3, 4, 5, etc. , nunca encontraremos una organización en la que trabajen 8,4 empleados. También serán variables discretas el número de miembros de la familia, el número de automóviles de la familia, el número de

Página 7 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 8: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

productos que puede transportar un vehículo etc.

Variables discretas : son las que pueden tomar cualquier valor comprendido entre un intervalo. Por ejemplo, la altura de una persona puede ser 1,83 metros, 2,05 metros, etc.

Las variables discretas sólo pueden tomar valores e nteros y las variables continuas pueden tomar cualquier valor comprendido entre un interval o

Si somos un poco exigente todas las variables son discretas, por ejemplo, la velocidad de un coche pasa de 100 a 101 kilómetros a la hora, por lo que podemos hablar de variable discreta, pero si intentamos medir la velocidad de un fórmula 1 exigiremos mucha más precisión en la medida y hablaremos de 100,456 kilómetros a la hora.

La diferencia entre variable discreta y continua de pende de la precisión del instrumento de medida que se utilice.

También podemos clasificar las variables en función del número de características que se estudien, así podemos distinguir entre: Variables unidimensionales, bidimensionales y multidimensionales.

� Variables unidimensionales : sólo recogen información sobre una característica (por ejemplo: edad de los habitantes de isla Paraíso).

� Variables bidimensionales : recogen información sobre dos características de la población (por ejemplo: edad y altura de los habitantes de la isla).

� Variables multidimensionales : recogen información sobre tres o más características (por ejemplo: edad, altura y peso de los habitantes de la isla).

Autoevaluación

Indicar si son continua/discreta las siguientes variables:

a) El número de alumnos de un Instituto

Elige una opción...

b) El peso de los alumnos de un Instituto

Elige una opción...

c) La distancia en kilómetros, que los alumnos recorren cada día para llegar al Instituto

Elige una opción...

d) El número de hermanos de los alumnos de un Instituto

Elige una opción...

Las variables discretas pueden tomar cualquier valor comprendido entre un intervalo, mientras que las continuas solo pueden tomar valores enteros.

a) Verdadero

b) Falso

Estadística aplicable a la Investigación Comercial

Atributos

Los atributos miden una cualidad y únicamente se pueden representar por palabras ya que no pueden medirse numéricamente.

Cada respuesta de una variable cualitativa que se pueda obtener en los diferentes individuos representa una cualidad de dicho individuo.

Página 8 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 9: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

Los ejemplos típicos de atributos son:

El sexo , cuyas posibles repuestas son masculino y femenino.

La nacionalidad , que puede tomar muchísimas respuestas: español, italiano, francés, ...

El nivel de instrucción , que también puede tomar múltiples valores:

Cada repuesta posible de un atributo se denomina mo dalidad, nivel o categoría

Cosas importante cuando trabajemos con atributos:

� Se deben definir los niveles de cada variable cualitativa de tal manera que cada individuo de la población pertenezca a una única categoría. Esto se expresa diciendo que las categorías son mutuamente excluyentes .

� Se deben definir los niveles de cada variable cualitativa de tal manera que cada individuo de la población pertenezca siempre a alguna de las categorías definidas. Esto se expresa diciendo que la lista de categorías es exhaustiva .

No todas las variables cualitativas son iguales, podemos hacer dos grupos según si existe o no un orden preestablecido de los niveles o respuestas de la variable, distinguiremos:

� Variables nominales , si no existe un orden jerárquico en las categorías de la variable cualitativa. Lo importante es comprobar que no existe ninguna categoría de mayor nivel que otra. Por ejemplo el sexo, la causa de una reclamación, la localización de un establecimiento, etc.. son todas variables nominales.

� Variables ordinales , si existe un orden entre los niveles asociados a la variable.

Por ejemplo, la "calidad de atención al cliente",puede tener las categorías de: baja, media, alta y excelente, "el nivel socioeconómico" que puede tomar las modalidades de: alto, medio o bajo. En ambos casos vemos que se puede apreciar el orden entre ellas.

Las variables cualitativas pueden ser nominales, si no existe un orden jerárquico en las categorías de la variable, u ordinales cuando exist e un orden entre los niveles de la variable

Otro caso especial de atributo son las denominadas variables dicotómicas, que son las que presentan únicamente dos categorías, una de las cuales representa éxito o presencia de una característica y la otra representa fracaso o ausencia de la característica

Por ejemplo, si el objetivo del estudio es analizar si los turistas que llegan a la isla se han vacunado o no contra la fiebre amarilla. Esta variable es dicotómica pues únicamente admite las respuestas de "si" o "no".

Autoevaluación

¿Cuál de las siguientes afirmaciones es la correcta?: Cuando trabajamos con atributos, se deben definir los niveles de cada variable cualitativa de tal manera que:

a) Cada individuo de la población pertenezca siempre a todas las categorías definidas.

b) Cada individuo de la población pertenezca a una sola categoría.

c) Las dos son correctas.

d) Ninguna es correcta.

Las variables cualitativas son nominales si no existe un orden jerárquico en las categorías, mientras que son ordinales si existe un orden entre los niveles asociados a la variable.

a) Verdadero

b) Falso

Página 9 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 10: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

Estadística aplicable a la Investigación Comercial

Distribución de frecuencias

Los tipos de distribución de frecuencia que existen en función del número de características que estudiemos son:

� Distribuciones unidimensionales: cuando estudiemos sólo una característica. Por ejemplo: número de miembros de la familia.

� Distribuciones bidimensionales : cuando estudiemos dos características en la muestra. Por ejemplo: Los miembros de la familia y el nivel de ingresos familiares mensuales.

� Distribuciones enedimensionales : cuando estudiemos "n" características en la muestra. Por ejemplo: el número de miembros de la familia, el nivel de ingreso de la familia mensual, gastos mensuales de la familia...

Comenzaremos por las unidimensionales que son las más simples y a través de ellas conoceremos los conceptos más básicos.

Vamos a conocer un poco mejor a los habitantes de la isla Paraíso (Universo):

Estamos especialmente interesados en saber cual es el número de miembros que componen cada una de las familias que viven en la isla (Población).

Hemos contratado a Ufano y a Fausto, dos jóvenes isleños muy trabajadores y con un gran interés por aprender. Ellos van a ayudarnos a realizar la investigación.

Hemos calculado que con una muestra de 1000 familias obtendremos la información que deseamos, y les hemos dado instrucciones para que elijan al azar aquellas a las que se va a preguntar.

El trabajo ha sido duro, pero con una gran ilusión lo han culminado y han recogido los datos que me presentan de la siguiente manera:

3, 5, 6, 2, 4, 6, 7, 7, 1, 6, 7, 5, 4, 3, 4, 5, 3, 2, 4, 6, 7, 5, 3, 3, 4, 2, 3, 5, 6, 2, 4, 6, 7, 7, 1, 6, 7, 5, 4, 3, 4, 5, 3, 2, 4, 6, 7, 5, 3, 3, 4, 2, 3, 5, 6, 2, 4, 6, 7, 7, 1, 6, 7, 5, 4, 3, 4, 5, 3, 2, 4, 6, 7, 5, 3, 3, 4, 2, 3, 5, 6, 2, 4, 6, 7, 7, 1, 6, 7, 5, 4, 3, 4, 5, 3, 2, 4, 6, 7, 5, 3, 3, 4, 2 ....................................

¿Qué nos dicen estos datos?

La verdad es que los valores presentados de esta manera poco o nada nos dicen sobre qué valores puede tomar la variable (Campo de variabilidad). Pero si observamos y agrupamos los valores vemos que la variable X puede tomar los siguientes valores.

X = {1, 2, 3, 4, 5, 6, 7}

Debemos clasificar los datos y presentar la información de manera que sea clara, concisa y ordenada, viendo cuantas veces sale o se repite cada valor de la variable.

Llamaremos distribución de frecuencias al conjunto ordenado de valores de la variable con sus correspondientes frecuencias.

Pero os preguntaréis ¿Qué es una frecuencia ?

La frecuencia es el número de veces que se presenta cada valor de la variable.

En este caso se nos ocurre presentar la información en una tabla que tenga dos columnas:

� La primera columna contiene los distintos valores de la variable

� La segunda columna presenta las veces que se aparece cada valor en la muestra utilizada (Frecuencia).

Tamaño de la familia (Variable) Número de veces que ha aparecido el valor (Frecuencia)

1 100

Página 10 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 11: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

Ahora nos resulta muy fácil analizar la información y con un simple vistazo a la tabla podemos hacernos una idea clara de cómo son las familias de isla Paraíso.

Entre otras cuestiones vemos rápidamente que:

� Lo más frecuente es encontrar familias con 4 o cinco miembros

� Es muy raro hallar familias con un hijo único

100/ 1.000 = 0,1.

� El máximo número de miembros de una familia es 7

Existen dos tipos de frecuencias las absolutas y las relativas, hablaremos a continuación de ellas.

2 150

3 40

4 230

5 300

6 150

7 30

Total 1000

Estadística aplicable a la Investigación Comercial

La frecuencia absoluta

En la tabla anterior hemos incluido el número de veces que se ha repetido cada valor en la muestra, a ello le llamaremos Frecuencia absoluta .

La frecuencia absoluta es el número de veces que ap arece un valor de la variable en la muestra estudiada

La frecuencia absoluta puede ser de dos tipos: ordinaria y acumulada.

� La frecuencia absoluta ordinaria es la que hemos visto hasta ahora, número de veces que se presenta cada valor de la variable. La llamaremos ni

�La frecuencia absoluta acumulada sería número de veces que se presenta cada valor de la variable y la de los valores anteriores a él. La llamaremos Ni

Vamos a utilizar la terminología estadística para ir acostumbrándonos a ella:

� Llamaremos x1, x2, x3, ............., xn a los distintos valores de la variable.

�Llamaremos n1, n2, n3, ............., nn a las veces que aparece cada valor de la variable.

�Llamaremos N1, N2, N3, .......... Nn a las veces que aparece cada valor de la variable más la de los valores anteriores a él. ( lo entenderéis muy bien el ejemplo)

La principal atracción de Isla Paraíso es un espectáculo de danza que atrae tanto a los turistas como a los nativos. Usemos como muestra un ejemplo en el que estudiaremos el número de veces mensuales que asiste una persona a presenciar la danza.

x i(Variable) n i(Frecuencia absoluta ordinaria) N i(Frecuencia absoluta acumulada)

x1

n1 N1= n1

x2 n2 N2= n1 + n2

x3 n3 N3= n1 + n2 + n3

... ... ...

... ... ...

... ... ...

xn nn

Nn = n1 + n2 + n3 +...+ Nn

Página 11 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 12: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

Los resultados obtenidos los encontramos en la siguiente tabla:

Si sumamos las frecuencias absolutas: 6 + 10 +12 + 8 + 6 + 2 el resultado es 44 que coincide con el tamaño de la muestra.

Recuerda "La suma de todas las frecuencias absolutas ordinarias nos da el tamaño muestral". En estadística se denomina por la letra "n"

n = Se han estudiado a 44 personas.

De las cuales ¿Qué diríamos?

Hay 6 personas que no han asistido Ninguna vez a las danzas populares, 10 personas que han asistido 1 sola vez, 12 personas han asistido 2 veces, y así sucesivamente.

¿Cuántas personas han asistido como máximo a la danza 3 veces? Para responder a esta pregunta tenemos a la frecuencia acumulada, que nos dirá que han sido 36 personas las que como máximo han asistido al espectáculo.

Como veis, lo más importante son las interpretaciones que podemos dar sobre esta tabla (todavía incompleta).

Autoevaluación

La tabla nos muestra el resultado de una encuesta hecha a 50 familias, sobre el número de personas activas dentro de cada una.

Se pide:

Asistencia a la danza n i Ni

0 6 6

1 10 16

2 12 28

3 8 36

4 6 42

5 2 44

Total 44 = n No se suman todas

Xi (Variable) n i (Frecuencia absoluta ordinaria)

Ni (Frecuencia absoluta acumulada)

f i (Frecuencia relativa ordinaria)

Fi (Frecuencia relativa acumulada)

1 16 16 0,32 0,32

2 20 36 0,4 0,72

3 9 45 0,18 0,9

4 5 50 0,1 1

Total 50 1

Indicar cuál es el universo, la población y la muestra de las siguientes alternativas:

a) Número de personas activas en todas las familias

Elige una opción...

b) Número de personas activas en 50 familias

Elige una opción...

c) Todas las personas con todas sus características (número de hijos, número de miembros, ingresos mensuales,....) Elige una opción...

¿Cuál es el tamaño muestral?

a) 40

b) 50

c) 60

Página 12 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 13: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

¿Cuántas familias tienen dos personas activas?

a) 30

b) 36

c) 20

¿Cuántas tienen como máximo tres personas activas?

a) 45

b) 6

c) 36

Estadística aplicable a la Investigación Comercial

Frecuencia relativa

Vamos a volver a nuestro ejemplo de la asistencia al espectáculo de danza. Ahora nos interesa saber que proporción de la población no asiste nunca a esa distracción. Para calcularlo basta con dividir el número de personas de la muestra que nunca asisten (6) entre el total de personas que formó la muestra (44) siendo el resultado de 0.14, es decir 14 de cada 100 habitantes de la isla no asisten nunca a la danza.

La frecuencia relativa es el porcentaje de veces qu e se presenta cada valor de la variable.

La frecuencia relativa al igual que la absoluta tiene dos tipos de frecuencia: la ordinaria y la acumulada.

La frecuencia relativa ordinaria es el porcentaje d e veces que se presenta cada valor de la variable. Y la representaremos por la letra "f".

Se calcula fi = ni / n

La frecuencia relativa acumulada es el porcentaje d e veces que aparece cada valor de la variable y el de los valores anteriores a él. Y la r epresentaremos por la letra "F".

Se calcula Fi = Ni / n

Si calculamos la proporción del resto de valores tendremos los resultados que aparecen en la tabla.

Ya por fin tenemos el cuadro completo, esto es lo que se denomina Distribución de frecuencias

Asistencia a la danza Frecuencia absoluta ordinaria F recuencia absoluta acumulada Frecuencia relativa ordinaria

Frecuencia relativa acumulada

0,00 6,00 6,00 0,1363 0,1363

1,00 10,00 16,00 0,2272 0,3636

2,00 12,00 28,00 0,2727 0,6363

3,00 8,00 36,00 0,1818 0,8181

4,00 6,00 42,00 0,1363 0,9545

5,00 2,00 44,00 0,0454 1

Total 44,00 ≈≈≈≈ 1

Xi (Variable) n i (Frecuencia absoluta ordinaria)

Ni (Frecuencia absoluta acumulada)

f i (Frecuencia relativa ordinaria)

Fi (Frecuencia relativa acumulada)

x1 n1 N1 f1 F1

x2 n2 N2 f2 F2

Página 13 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 14: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

La fórmula que permite el cálculo de la frecuencia relativa es:

f1 = n1/n; f2 = n2/n; ...; fn = nn/n

F1 = N1/n; F2 = N2/n; ...; Fn = Nn/n

Lógicamente la suma de todas las frecuencias relativas ordinarias será 1, y la última frecuencia relativa acumulada también será 1 (Porque es la suma de todas ellas).

La frecuencia relativa también se puede calcular en porcentajes, para ello basta con multiplicar la frecuencia relativa fi o Fi por 100 %. Esto nos será útil a la hora de interpretar, ya que estaremos siempre hablando de porcentajes.

Por ejemplo, el porcentaje de personas que no asisten a la danza es:

0,1363 x 100% = 13,63%

Diremos que de 100 personas sólo 14 aproximadamente no asisten a la danza.

Si preguntamos, ¿Qué porcentaje de personas asiste como máximo a la danza dos veces?

La respuesta será: 0,6363 x 100% = 63,63%

Diremos que de 100 personas como máximo 64 asisten a la danza dos veces.

Autoevaluación

La tabla nos muestra el resultado de una encuesta hecha a 50 familias, sobre el número de personas activas dentro de cada una.

x3 n3 N3 f3 F3

... ... ... ... ...

... ... ... ... ...

... ... ... ... ...

xn nn Nn = n fn Fn = 1

Total n 1

Xi (Variable) n i (Frecuencia absoluta ordinaria)

Ni (Frecuencia absoluta acumulada)

f i (Frecuencia relativa ordinaria)

Fi (Frecuencia relativa acumulada)

1 16 16 0,32 0,32

2 20 36 0,4 0,72

3 9 45 0,18 0,9

4 5 50 0,1 1

Total 50 1

¿Qué porcentaje de familias tienen una sola persona activa?

a) 36%

b) 42%

c) 32%

¿Qué porcentaje de familias tienen como máximo dos personas activas?

a) 36%

b) 72%

c) 40%

Estadística aplicable a la Investigación Comercial

Página 14 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 15: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

Distribuciones de frecuencias agrupada y sin agrupa r

Vamos a ver tres situaciones diferentes:

a.- Deseamos conocer cuantas horas trabajan al día los cinco curanderos de la isla.

Los resultados los podemos incluir en la siguiente tabla:

Como el número de observaciones es pequeño se aprecia con claridad las horas que trabaja cada curandero.

Si el número de observaciones es pequeño lo podemos representar en una tabla con una única columna

b.- Queremos saber ahora cuantas personas trabajan de cada una de las familias de la isla.

Si queremos presentar los resultados en una tabla de una columna nos encontraríamos con una tabla larguísima y resultaría imposible analizar e interpretar los resultados. Ahora tenemos que encontrar algún método para representar la información.

El método no es otro que el de incluir los distintos valores y representarlos junto a sus frecuencias.

Si la muestra es de 200 familias

Ahora también podemos analizar con comodidad los datos.

Si el número de observaciones es grande y el número de valores es pequeño lo podemos representar en una tabla con dos columnas: una con los valores y otra con sus frecuencias

c.- Queremos conocer los ingresos de cada familia.

Si intentamos usar una tabla con una columna también sería demasiado larga y si queremos usar una tabla con dos columnas, una con los valores y otra con las frecuencias nos ocurrirá lo mismo. ¿Qué nos ocurre?, exactamente lo mismo, la tabla es demasiado larga porque es muy difícil que coincidan los ingresos de dos familias.

Horas de trabajo diario de los curanderos de isla P araíso

8

7

6

9

8

Personas que trabajan Número de familias

0,00 10,00

1,00 50,00

2,00 60,00

3,00 30,00

4,00 10,00

5,00 40,00

total 200,00

Página 15 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 16: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

Solución:

Habrá que agrupar aquellas familias que tengan ingresos similares.

Los grupos de valores se llaman clases . Una vez definidas las clases procedemos a obtener la frecuencia de cada clase.

Presentada la información de esta manera podemos analizarla con comodidad.

Si el número de observaciones es grande y el número de valores también es elevado tendremos que agrupar los valores en clases.

¿Existe alguna diferencia entre agrupar los valores y no agruparlos?

La respuesta es sí, si agrupamos los valores perdemos parte de la información y es imposible volver a construir los datos originales.

Pero cuando empleamos en una encuesta una pregunta como ésta, lo normal es plantearla en forma de intervalo para que a las personas les sea fácil de contestar, aunque por ello se pierda información

Por ejemplo:

¿Cambiaría algo la tabla si hay 100 familias con ingresos de 901 € y pasan a ingresar 1099 €?

La respuesta es no, la tabla sigue siendo la misma.

¿Podemos saber cuantas familias ingresan 535 €?

La respuesta vuelve a ser negativa, solo conocemos que 300 familias cobran entre 500 y 700 €.

Si agrupamos los valores incurrimos en errores de ag rupamiento

Autoevaluación

Ingresos familiares mensuales Número de familias

De 0 a 300 € 100

De 301 a 500 € 500

De 501 a 700 € 300

De 701 a 900 € 200

De 901 a 1100 € 100

De 1101 a 1500 € 800

Total 2000

¿Cuál de las siguientes afirmaciones es la correcta?: Es conveniente agrupar los valores de la variable en intervalos, llamados clases, cuando:

a) El número de observaciones es pequeño.

b) El número de observaciones es grande y el número de valores pequeño.

c) El número de observaciones es grande y el número de valores también es elevado.

Si agrupamos los valores en clases perdemos parte de la información y por tanto incurrimos en errores de agrupamiento.

a) Verdadero

b) Falso

Página 16 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 17: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

Estadística aplicable a la Investigación Comercial

Representaciones gráficas

A veces nos resulta muy cómodo representar gráficamente la información, para poder hacernos rápidamente una idea de la información. Otras veces es interesante realizar los gráficos para comprobar si hemos calculado bien la medida.

Vamos a ver los tipos de gráficos que más se usan para presentar un informe de una investigación: el diagrama de barras y el diagrama de sectores.

Existen otros tipos de gráficos, que se usan menos al realizar el informe, pero que en estadística, o en algún tipo de presentaciones es útil, como son:

� Histograma : se utiliza para representar las distribuciones de frecuencia de valores agrupados y su naturaleza es la misma que el diagrama de barras.

� El diagrama acumulado y el polígono acumulado : se utilizan para representar en los dos tipos de distribuciones a la frecuencia acumulada, y normalmente sirve para comprobar si hemos calculado bien las medidas de posición.

� El pictograma : es otro medio de representación de las distribuciones de frecuencia. Consiste en tomar como unidad un símbolo arbitrario (un dibujito) para el que debemos fijar previamente el valor que le asignamos como tal unidad. Este tipo de gráfico queda muy bonito en una presentación de un informe, pero no es muy utilizado.

� Diagramas de Barras

� Diagramas de Sectores

� Representación Gráfica de la Frecuencia Acumulada

Autoevaluación

Una representación gráfica es la forma de representar gráficamente la información recogida.

a) Verdadero

b) Falso

La diferencia entre un histograma y un diagrama de barras es que este se utiliza para representar las distribuciones de frecuencias de valores agrupados y el histograma para valores sin agrupar.

a) Verdadero

b) Falso

Página 17 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 18: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

¿Cuál de las siguientes afirmaciones es la correcta?: El diagrama de barras consiste en levantar para cada valor de la variable, una barra cuya altura sea:

a) Su frecuencia absoluta.

b) Su frecuencia relativa.

c) Su frecuencia acumulada.

d) Cualquiera de las tres.

Estadística aplicable a la Investigación Comercial

Diagrama de barras

Los valores expresados en la tabla de frecuencias pueden ser representados en dos ejes para obtener una visión gráfica de la forma de la distribución de los valores.

El diagrama de barras consiste en levantar, para cad a valor de la variable, una barra cuya altura sea su frecuencia absoluta

Indicamos los distintos valores en el eje horizontal, y las frecuencias absolutas en el eje vertical.

Como veis nos da una visión sobre los valores que más veces se presentan, en este caso diríamos que lo más habitual en las personas estudiadas es que asistan dos veces a la danza. Este tipo de gráfico sólo se puede utilizar cuando estamos estudiando una distribución de frecuencias unidimensional sin agrupar.

Estadística aplicable a la Investigación Comercial

Diagrama de sectores

Esta modalidad consiste en dividir un círculo en tantos sectores circulares como valores podamos observar. Cada sector deber ser proporcional a la frecuencia absoluta de su valor.

Página 18 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 19: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

Este gráfico es de la misma naturaleza que el diagrama de barras; A cada frecuencia absoluta u relativa ordinaria le correspondería una porción del sector, es decir, una superficie del circulo; la suma de todas esas frecuencias corresponderá con el área o superficie total del circulo, es decir, 360º.

En otras ocasiones es interesante presentar la información acumulando los datos, en esos casos hablamos de frecuencia absoluta acumulada .

Con la frecuencia acumulada obtenemos el número de observaciones correspondientes a cada valor y a todos los anteriores.

Esta frecuencia absoluta acumulada únicamente puede usarse con variables medibles y con valores que pueden ser ordenados.

En cada casilla de la frecuencia acumulada tenemos los valores menores o iguales que cada xi.

Asistencia a la danza Frecuencia absoluta Frecuencia acumulada

0 6 6

1 10 16

2 12 28

3 8 36

4 6 42

5 2 44

Total 44 44

Estadística aplicable a la Investigación Comercial

Representación gráfica de la frecuencia acumulada

Para representar gráficamente la frecuencia acumulada también se puede utilizar el diagrama de barras, pero ahora la altura de la barra equivale a la frecuencia acumulada.

Página 19 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 20: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

Estadística aplicable a la Investigación Comercial

Las medidas

¿Qué es lo que estamos buscando?

Puedes pulsar en algunos de los términos de este esq uema para acceder al apartado correspondiente.

Algunas veces interesa llevar esa reducción al grado máximo y sustituir todos los valores observados por un solo.

Podemos encontrar esta afirmación:

Los habitantes de isla Paraíso son bastante altas ya que el hombre medio mide 1,81 metros y la mujer media 1,71 metros.

Lógicamente habrá algún nativo que mida 1,55 y será bajito, pero habrá otro que mida 2 metros y sea exageradamente alto.

La idea de promedio implica variación, no tiene sentido calcular el promedio de algo invariante, por ejemplo, es absurdo comentar que los habitantes de isla Paraíso tienen dos piernas, dos brazos y una única nariz.

Qué le vamos a exigir a un promedio. Si va a sustituir al conjunto de observaciones de la población debe cumplir la condición de que sea representativo , es decir, que represente la tendencia del resto de las observaciones.

Página 20 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 21: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

Si el promedio va a ser representativo debe cumplir, por lo menos, que esté comprendido entre los valores extremos de la variable.

Sería curioso que en la isla no hubiese nadie con una estatura superior a 1,81 metros y ese fuera el promedio que lo representa.

Para saber más: http://thales.cica.es/rd/Recursos/rd99/ed99 -0278-01/est_des3.html

Estadística aplicable a la Investigación Comercial

Medidas básicas de posición

Estas medidas básicas nos van a suministrar información de la serie de datos que estamos analizando. Pueden existir infinitos promedios pero vamos a ver aquí a los más habituales

Las medidas pueden ser de tres tipos:

� Medidas de tendencia central , que intentan resumir la información calculando valores medios.

� Medidas de posición , que informan sobre cómo se distribuyen los valores.

� Medidas de dispersión , que indican si los valores se encuentran más o menos concentrados ,o más o menos dispersos

Autoevaluación

Las medidas de tendencia central miden si los valores se encuentran más o menos concentrados, mientras que las medidas de dispersión intentan resumir la información calculando valores medios.

a) Verdadero

b) Falso

Con las medidas de dispersión comprobamos la representatividad de las medidas de tendencia central.

a) Verdadero

b) Falso

Las medidas de tendencia central no tienen que ser representativas del resto de las observaciones.

a) Verdadero

b) Falso

Estadística aplicable a la Investigación Comercial

Medidas de tendencia central

Las medidas de tendencia central buscan un número que represente la distribución. Las principales medidas de tendencia central son la media, la mediana y la moda

� Media aritmética simple.

� Media aritmética ponderada.

Página 21 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 22: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

� Mediana.

� Moda.

Estadística aplicable a la Investigación Comercial

Media aritmética simple

Es una de las medidas más importantes cuando es representativa. Se representa por la letra " ". Es la más utilizada, por lo que cuando se habla de media se habla de ella, así que nosotros vamos a mantener esa denominación.

La media es número que se obtiene al dividir el número de observaciones por el número de ellas.

Nos va a indicar el valor medio de la serie de datos.

La media aritmética simple es el valor de la variab le que será el centro de gravedad de la distribución.

Por ejemplo, si queremos calcular la media de horas trabajadas por los curanderos de la isla

horas de trabajo diario que realizan los curanderos de la isla.

Como vemos, la media aritmética es un valor de la variable que viene dado en la misma unidad de medida de la variable, pero que posiblemente sea un valor no observable.

Recordemos que cuando trabajamos con distribuciones agrupadas perdemos información y es imposible conocer cual es el valor correspondiente a cada elemento.

¿Podemos calcular la media en este caso?

Si, podemos calcular la media aritmética pero esta no será exacta, llevará cierto error.

Veamos como se calcula utilizando nuestra tabla relativa a los ingresos familiares.

Pensemos un momento: ¿Qué valor representa mejor a los que ingresan entr e 300 y 500 €?

Lógicamente podemos pensar que 400, el valor medio, es el que corre menor riesgo de equivocarse.

Este valor que representa a cada clase lo denominamos marca de clase, es decir, es el valor medio de cada intervalo .

Horas de trabajo diario de los curanderos de isla P araíso

8

7

6

9

8

Página 22 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 23: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

La fórmula que sirve para calcularla es:

Con nuestros datos tenemos:

847,5€

Cada familia de la isla ingresa por término medio 847,5 € mensuales.

Autoevaluación

Ingresos familiares mensuales Número de familias n i x i (Marcas de clase) x in i

De 0 a 300 € 100 150 15000

De 300 a 500 € 500 400 20000

De 500 a 700 € 300 600 180000

De 700 a 900 € 200 800 160000

De 900 a 1100 € 100 1000 100000

De 1100 a 1500 € 800 1300 1040000

Total 2000

Supongamos que un alumno de formación profesional a distancia ha sacado las siguientes calificaciones en las tareas de la unidad 1 del módulo de Investigación comercial:

¿Cuál será la media aritmética simple?

Tarea número 1......... 5

Tarea número 2......... 6

Tarea número 3......... 5

Tarea número 4......... 8

Tarea número 5......... 9

a) 5.8

b) 7.3

c) 6.6

d) 6.3

Estadística aplicable a la Investigación Comercial

Media aritmética ponderada

Recordemos que una de las fuentes principales ocupaciones de los habitantes de isla Paraíso es la fabricación y comercialización de Flautas de bambú.

Existen tres variedades de flautas y el precio de las mismas se fija en función del peso del bambú utilizado.

� Flauta ganga: que lleva 100 gramos de bambú y se vende a 6€.

� Flauta tradicional: que necesita 200 gramos de bambú y se vende a 15€.

� Flauta portentosa: que requiere 350 gramos de bambú y se comercializa a 30 €.

Si deseamos calcular el precio medio al que se vende el bambú que se usa para elaborar las flautas podemos calcular el precio medio de las flautas y ver que:

Página 23 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 24: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

, el precio medio de las flautas se fija en 17 €

También podemos considerar que es importante contemplar el bambú que incorpora cada flauta y podemos calcular la media aritmética ponderada.

En este caso vemos con más claridad que el precio medio al que se vende las flautas teniendo en cuenta el bambú que poseen es de 21,7 €.

Esta media aritmética ponderada la hemos calculado multiplicando cada valor de la variable por un número que expresa su mayor o menor importancia en el conjunto de valores. Estos números se llaman pesos o ponderaciones .

Autoevaluación

Si el alumno anterior sacara un 10 en el examen de la unidad y suponiendo que a las tareas le damos una importancia o ponderación del 80% y a la nota del examen de un 20%, ¿cuál será la media aritmética ponderada de la unidad 1?:

6.36

7.28

7.53

8.34

Estadística aplicable a la Investigación Comercial

Mediana

La media aritmética es el promedio o estadístico que más se utiliza, pero tiene un grave inconveniente, pues se puede ver influida por los valores extremos que se aparten del resto de los datos.

Recordemos que si hay dos personas, una de ellas se bebe dos vasos de agua y la otra ninguno la media dice que cada uno se ha tomado un vaso.

Si los valores extremos condicionan el valor de la media, esta puede perder representatividad.

La mediana es un parámetro que intenta solventar el inconveniente que puede derivarse de los valores extremos.

La mediana es el valor de la serie de datos que se sitúa justamente en el centro de la muestra (un 50% de valores son inferiores y otro 50% son superiores).

La mediana es el valor de la variable que acumula e l 50% de la masa de frecuencia

Para calcular la mediana tendremos que ver primero si estamos en una distribución agrupada o sin agrupar, y aun así tendremos dos casos a tener en cuenta:

Primer caso: Cuando existe una frecuencia relativa acumulada igual 0,50

Página 24 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 25: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

Segundo caso: Cuando no existe una frecuencia relativa acumulada igual a 0,50, esto quiere decir, que hay una menor y otra mayor a 0,50.

En función de estos casos aplicaremos una formula u otra.

Si retomamos la tabla relativa a las horas de trabajo de los curanderos y calculamos la mediana. (estamos en una distribución sin agrupar).

Estamos en una distribución de frecuencia unidimensional sin agrupar y en donde no hay un valor de Fi = 0,5

La formula aplicar es la siguiente si no existe un Fi = 0,5 existirá una que sea menor F2 = 0,4 y uno que sea mayor F3 = 0,6, el valor de la variable que corresponde al mayor es la mediana.

Me = 8

Interpretemos: En el 50% de los curanderos trabajan como máximo 8 horas diarias.

Utilicemos la tabla que recoge los datos de asistencia a los espectáculos de danza, un poco cambiados.

Seguimos en una distribución de frecuencia unidimensional no agrupada, pero estamos en el caso de que existe un Fi = 0,5

En este caso cogemos el valor de la variable que corresponde con 0,5 y el valor siguiente a esa variable, los sumamos y los dividimos entre 2.

Interpretación: El 50% de las personas estudiadas han asistido como máximo 2 veces y media a la danza.

Aquí podemos aproximar a dos.

Cuando estamos calculándola en las distribuciones de frecuencia de valores de la variable agrupados, varía.

Autoevaluación

Horas de trabajo diario de los curanderos de isla Paraíso

n i Ni f i Fi

6 1 1 0,2 0,2

7 1 2 0,2 0,4

8 1 3 0,2 0,6

8 1 4 0,2 0,8

9 1 5 0,2 1

Asistencia a la danza n i Ni f i Fi

0 4 4 0,0909 0,0909

1 8 12 0,1818 0,2727

2 10 22 0,2272 0,5

3 12 34 0,2727 0,7727

4 8 42 0,1818 0,9545

5 2 44 0,0454 1

Total 44 ≈ 1

¿Cuál de las siguientes afirmaciones no es correcta?:

a) La media tiene el inconveniente de verse influida por los valores extremos.

b) La mediana puede solventar el inconveniente derivado de los valores extremos.

c) La mediana es el valor de la serie tal que el 40% de los valores son inferiores a ella y el 60% restante son superiores.

Página 25 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 26: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

Estadística aplicable a la Investigación Comercial

Moda

La moda es un término que se usa coloquialmente para expresar lo que viste la mayoría de las personas, o lo que más gusta a la mayoría de la gente y ese significado es muy similar al del término estadístico.

La moda es el valor de la variable que más se repite en la muestra.

La moda es el valor de la variable más frecuente en la muestra estudiada.

Su cálculo es extremadamente fácil ya que únicamente es necesario buscar el valor de la variable que tiene la frecuencia absoluta ordinaria más frecuente.

En la tabla de asistencia a la danza vemos que 2 veces tiene la mayor frecuencia con 12 observaciones, o sea,

Mo = 2 veces de asistencia al espectáculo de danza.

Hay veces que hay dos valores que presentan la máxima frecuencia, en estos caso hablamos de distribuciones bimodales. De la misma manera encontramos distribuciones trimodales y multimodales.

Autoevaluación

Estudiamos en unos estudiantes el número de hermanos que poseen y obtuvimos la siguiente tabla:

La Moda es el valor de la variable que más se repite.

a) Verdadero

b) Falso

Número de hermanos Número de alumnos

0 3

1 6

2 5

3 3

4 1

5 1

6 1

Responder a las siguientes cuestiones: ¿Cuál es el número medio de hermanos que tienen los estudiantes?

a) 2

b) 1

c) 3

¿Cuál es el número más normal (moda) de hermanos entre los estudiantes?

a) 1

b) 2

c) 3

Página 26 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 27: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

¿Cuál es el número de hermanos que tienen como máximo el 50% de los alumnos? (Para contestar debes realizar la columna correspondiente a la frecuencia relativa acumulada y calcular la mediana).

a) El 50% de los estudiantes tienen como máximo un hermano

b) El 50% de los estudiantes tienen como máximo dos hermanos

c) El 50% de los estudiantes tienen como máximo tres hermanos.

Estadística aplicable a la Investigación Comercial

Medidas de posición

Son los valores de la variable que acumulan una determinada masa de frecuencia. ¿Os suena esta definición? Pues sí, se parece a la definición que hemos dado de mediana, ya que ésta es una medida también de posición.

Su forma de calcularse es la misma que la de la mediana lo único que cambiaríamos sería el porcentaje a buscar. Existen otros promedios que pueden ser característicos de la distribución pero que no son los valores centrales.

Los más usuales son los que dividen la muestra en tramos iguales.

Cuartiles

|_25%__|__50%__|__75%__|_100%_|

q1q2q3

Son 3 valores que dividen a una serie de datos, orde nada de forma creciente o decreciente, en cuatro tramos iguales, de manera que en cada uno de ellos se encuentra el 25 % de los resultados.

q1 = es aquel valor de la variable que acumula el 25 % de la masa de frecuencia.

q2= es aquel valor de la variable que acumula el 50% de la masa de frecuencia. (la mediana) q3= es aquel valor de la variable que acumula el 75 % de la masa de frecuencia.

Deciles

Dividen a la masa de frecuencia en diez partes

|_10%_|_20%_|_30%_|_40%_|_50%_|_60%_|_70%_|_80%_|_90%_|_100%|

d1d2d3d4d5.............d9

d1= valor de la variable que acumula el 10 % de la masa de frecuencia.

d2= valor de la variable que acumula el 20% de la masa de frecuencia. d5= valor de la variable que acumula el 50% de la masa de frecuencia. (mediana y cuartil segundo) d9= valor de la variable que acumula el 90% de la masa de frecuencia.

Son 9 valores que dividen a una serie de datos, ordenada de forma creciente o decreciente, en diez tramos iguales, de manera que en cada uno de ellos se encuentra el 10 % de los resultados.

Percentiles

Divide la masa de frecuencia en cien partes.

Página 27 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 28: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

p1= valor de la variable que acumula el 1% de la masa de frecuencia.

Etc...

p10= d1= valor de la variable que acumula el 10% de la masa de frecuencias.

Etc...

p50= d5=q2= Me= valor de la variable que acumula el 50% de la masa de frecuencia.

Etc..

p99= valor de la variable que acumula el 99% de la masa de frecuencias.

Son 99 valores que dividen a una serie de datos, ordenada de forma creciente o decreciente, en cien tramos iguales, de manera que en cada uno de ellos se encuentra el 1 % de los resultados

Por ejemplo:

Vamos a calcular los tres cuartiles de la asistencia a danza.

El primer cuartil:

Buscamos una frecuencia relativa acumulada que sea igual a 0,25. Como no existe miramos en la tabla y vemos una que es un poco más pequeña 0,14 y otra que es un poco más grande 0,36. Según la fórmula explicada en la mediana será aquel valor de la variable que corresponda a la frecuencia mayor luego.

q1= 1

Interpretación: el 25 % de personas asisten como máximo 1 vez a la danza.

Al calcular el cuartil segundo y tercero pasa igual ya que no existen frecuencias relativas iguales a 0,5 y 0,75 así que corresponderá a aquel valor de la variable que corresponda a la frecuencia un poco mayor que las expuestas, así tendremos que:

El segundo cuartil es 2.

Interpretación: el 50% de las personas estudiadas asisten a la danza dos veces como máximo.

El tercer cuartil es 3.

Interpretación: el 75% de las personas estudiadas asisten a la danza tres veces como máximo.

Autoevaluaci ón

Asistencia a la danza Frecuencia absoluta Frecuencia acumulada Frecuencia relativa Frecuencia relativa acumulada

0 6 6 0,14 0,14

1 10 16 0,23 0,36

2 12 28 0,27 0,64

3 8 36 0,18 0,82

4 6 42 0,14 0,95

5 2 44 0,05 1,00

Total 44 44 1,00 1,00

¿Cuál de las siguientes afirmaciones no es correcta?

a) Los cuartiles son tres valores que dividen a la distribución de tal forma que en cada uno de ellos se encuentra el 25% de los resultados.

Página 28 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 29: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

b) Los deciles son 10 valores que dividen a la distribución de manera que en cada uno de ellos se encuentra el 10% de los resultados

c) Existen otros promedios que dividen la muestra en tramos iguales, siendo los más usuales, los cuartiles, los deciles y los percentiles

Estadística aplicable a la Investigación Comercial

Medidas de dispersión

¿Podrá la estadística solucionar el problema de que si una persona tiene dos coches y otra ninguno, la estadística dice que cada persona tiene un coche?. La media es la misma que si cada uno tiene su propio coche, y la situación es radicalmente distinta.

Afortunadamente la respuesta es sí. Para solucionarlo existen las medidas de dispersión que nos indican si los valores se encuentran próximos o alejados a las medidas de tendencia central, es decir, nos indicará la representatividad.

Las medidas de dispersión analizan si los valores s e encuentran más o menos dispersos, o más o menos concentrados con respecto a las medidas de tendencia central.

Las medidas de dispersión más utilizadas son:

� Varianza

� Desviación típica

Autoevaluación

Las medidas de dispersión (varianza y desviación típica) nos indican si los valores se encuentran próximos o alejados de la media, mediana o moda.

a) Verdadero

b) Falso

Las medidas de tendencia central nos indican la representatividad de las medidas de dispersión.

a) Verdadero

b) Falso

Estadística aplicable a la Investigación Comercial

Rango o recorrido

Recordemos que los curanderos de la isla trabajaban por término medio 7,6 horas.

Página 29 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 30: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

Podemos preguntarnos, ¿Todos ellos trabajan alrededor de ese tiempo o unos trabajan mucho y otros pocos?. El rango nos ayuda a resolver esa cuestión.

El curandero que más trabaja lo hace 9 horas y el que menos 6 horas, la diferencia entre esos valores es el rango, que en este caso es 3 horas.

El recorrido o rango mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor más bajo y el valor más elevado.

Estadística aplicable a la Investigación Comercial

Varianza

Se nos puede ocurrir calcular las distancias de cada valor a la media, que llamaremos desviaciones y para ello vamos a presentar una tabla que las incluya.

Podemos ver que las distancias con positivas en unos casos y negativas en otros, lo que indica que algunos valores superan la media y otros se quedan por debajo.

Pasemos ahora a sumar todas las desviaciones.

¿Qué ocurre? La suma de las distancias es 0. Esto es lógico las distancias por exceso se compensan con las distancias por defecto. ¿Qué podemos hacer?

Si las elevamos al cuadrado todos los valores serán positivos, y en eso consiste la varianza.

La varianza mide la distancia existente entre los v alores reales y la media

La varianza se calcula sumando todas las desviaciones elevadas al cuadrado y dividiéndolas entre el tamaño de la muestra.

En nuestro ejemplo:

S2 = [(8 - 7,6)2 + (7 - 7,6)2 + (6 - 7,6)2 + (9 - 7,6)2 + (8 - 7,6)2] / 5 = 1,04

La varianza siempre va a ser positiva y mayor que cero.

Cuanto mayor sea la varianza mas alejados de la media están los valores, y cuanto más se aproxime a cero más próximo a la media estarán los valores reales.

La varianza siempre será mayor que cero.

Mientras más se aproxima a cero, más concentrados están los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, más dispersos están.

Horas de trabajo diario de los curanderos de isla P araísoDistancia a la media (Xi- ) ; = 7,6

8 0,4

7 - 0,6

6 -1,6

9 1,4

8 0,4

Página 30 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 31: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

Estadística aplicable a la Investigación Comercial

Desviación típica

Es otra medida de dispersión, que se utiliza debido a que la varianza puede presentar problemas de interpretación, ya que aunque viene expresada en las mismas unidades de medida que la media estas están elevadas al cuadrado y se calcula como raíz cuadrada de la varianza.

La desviación típica es la raíz cuadrada de la vari anza

Luego la varianza mide la bondad de la media aritmética a través de la desviación típica que será la que se interprete.

En nuestro ejemplo:

= 1, 01

¿Cómo interpretamos el resultado de la desviación típica?

1. Sumamos y restamos la desviación típica a la media y obtenemos los siguientes valores: 7,6 + 1,01 = 8,61 y 7,6 - 1,01 = 6,59 2. Interpretamos:Las horas que por término medio trabajan los curanderos de la isla oscilan entre 6,59 y 8,61. 3. Si queréis saber que porcentaje de desviación existe hay que calcular el Coeficiente de Variación de Pearson (V).

Que es igual a dividir la desviación típica por la media aritmética, el resultado lo multiplicamos por cien.

V = 13,28 % es la dispersión de los valores de la variable con respecto a la media, luego esta media es bastante representativa de esa muestra.

Para saber más: http://www.noticiasdot.com/publicaciones/2002/0302/ 0403/ noticias0403/040302 -10.htm http://mail.udlap.mx/~tesis/udlap/lps/magana_m_a/ca pitulo3.pdf

http://www.ince.mec.es/hf/anx1.htm

Autoevaluación

En las pruebas de Selectividad los alumnos de un centro obtuvieron los siguientes resultados:

Se pide:

Puntuación Número de alumnos

0 3

1 7

2 10

3 15

4 23

5 18

6 15

7 9

8 5

¿Cuál es el recorrido?

Página 31 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 32: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

a) 5

b) 8

c) 4

¿Cuál sido la nota media de Selectividad en el centro?

a) 4.25

b) 5.34

c) 6.23

¿Cuál es la desviación típica?

a) 0.98

b) 2.34

c) 1.94

¿Cuál ha sido la nota más frecuente entre los alumnos en Selectividad?

a) 4

b) 6

c) 3

Estadística aplicable a la Investigación Comercial

Distribuciones bidimensionales

Intentemos responder a una sencilla cuestión, ¿Está gordo un hombre que pesa 80 kg?.

La respuesta siempre es depende .

Depende de la altura de la persona, si mide 1,35 metros estará bastante gordo, sin embargo, si mide 1,98 metros estará muy delgado.

Este es el concepto de variable bidimensional, que consiste en estudiar simultáneamente dos características de los elementos de la población.

En cada elemento medimos los dos valores y la variable está formada por la pareja de valores.

En cada persona medimos su altura, luego medimos su peso y los dos valores forman la variable bidimensional.

La variable bidimensional son dos letras (X, Y) que r epresentan las dos características de una observación.

Las distribuciones bidimensionales son aquellas en las que se estudian de cada elemento del universo dos variables al mismo tiempo. Es el conjun to de valores de la variable bidimensional con sus correspondientes frecuencias.

Página 32 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 33: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

Por ejemplo, estamos interesados en conocer si el tamaño de la vivienda en isla Paraíso está relacionado con el número de miembros de la familia.

La tabla que hemos visto es cuando se presenta cada par de valores una sola vez y hay pocos pares.

También puede ocurrir que haya pocos pares de valores pero que se repitan con cierta frecuencia y entonces tendremos.

Supongamos que en el ejemplo anterior hemos estudiado una muestra de 100 familias y el resultado que nos sale es el siguiente:

Si el número de elementos observados es muy alto se utiliza una tabla de correlación para representar la información obtenida, que presenta la forma siguiente:

Las "x" representan los valores de una de las variables y las "y" los valores de la otra variable. En cada intersección de una valor de "x" y un valor de "y" se recoge el número de veces que dicho par de valores se ha presentado conjuntamente (frecuencia absoluta ordinaria) y a veces se recoge el porcentaje de veces que se ha presentado cada par de valores en tantos por uno (frecuencia relativa ordinaria).

En nuestro ejemplo las "x" serán el tamaño de la familia y las "y" el número de habitaciones de la vivienda.

La interpretación de la información es muy simple.

En cada casilla se coloca el número de veces que se ha repetido cada pareja de valores. Podemos ver que 200 son las familias de un único miembro y con una única habitación, o que hay 365 familias con tres miembros y que disponen de dos habitaciones en su vivienda.

Autoevaluación

Tamaño de la familia Tamaño de la vivienda (en m 2)

0 100

1 150

3 200

4 120

6 150

4 200

5 130

Tamaño de la familia Tamaño de la vivienda (en m 2)

n i

0 100 22

1 150 25

3 200 23

4 120 12

6 150 10

4 200 5

5 130 3

X/Y y1 y2 ........ yn

x1 n1,1 n1,2 ...... n1,n

x2 n2,1 n2,2 n2,n

.........

Xn nn,1 nn,2 nn,n

Tamaño de la familia Número de habitaciones 1 2 3 4

1 200 134 251 12

2 120 254 362 125

3 45 365 124 255

4 136 85 268 85

5 245 96 111 43

¿Cuál de las siguientes afirmaciones es la correcta?

Página 33 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 34: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

Si queremos observar simultáneamente, la edad y la altura de cada uno de los elementos de una población o muestra, la variable es:

a) Unidimensional

b) Bidimensional

c) Las dos son correctas

d) Ninguna es correcta

A partir de la tabla de correlación que aparece en la pregunta, indicar:

¿Cuántas familias de cuatro miembros disponen de una habitación en su vivienda?

a) 255

b) 136

c) 85

¿Qué porcentaje representan dichas familias sobre el total?

a) 4.10

b) 18.23

c) 5.28

d) 4.93

Estadística aplicable a la Investigación Comercial

Tipos de distribuciones bidimensionales

Si el número de valores de las dos variables es reducido no es necesario agrupar las variables, pero si una de las variables (o las dos) presenta muchos valores diferentes, y cada uno de ellos se presenta pocas veces, será deseable agrupar los valores.

Podemos distinguir:

� Distribuciones de frecuencia de valores de la varia ble sin agrupar

� Distribuciones de frecuencia de valores agrupados

� Distribuciones marginales

� Distribuciones condicionadas

Estadística aplicable a la Investigación Comercial

Distribuciones de frecuencia de valores de la varia ble sin agrupar

Son las distribuciones donde las dos variables presentan un número reducido de valores.

Por ejemplo, el caso que hemos expuesto relativo al tamaño de la familia y al número de habitaciones de la vivienda.

Página 34 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 35: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

Estadística aplicable a la Investigación Comercial

Distribuciones de frecuencia de valores agrupado

Son aquellas distribuciones donde algún valor (o los dos) presenta muchos valores diferentes, y cada uno de ellos se presenta pocas veces.

En este caso habrá que proceder a agrupar los valores. Con la consiguiente pérdida de información, ya que para calcular los estadísticos tendremos que hacerlo con las marcas de clase, que como ya sabéis son los valores medios de los intervalos.

Por ejemplo:

Deseamos medir la relación existente entre la edad de los habitantes de la isla y sus ingresos.

En este caso ambas variables tienen muchos valores posibles lo que obligará a agruparlas a las dos.

Los resultados obtenidos los presentamos en una tabla de correlación.

*(miles de € al mes)

El inconveniente de la agrupación es que se produce una pérdida de información, pero a cambio podemos interpretar los datos con facilidad.

Autoevaluación

Edad (años)/Ingresos* 0- 0,5 0,5-1 1-2 2-5

0-20 230 233 126 15

21-35 20 134 257 333

36-50 145 222 85 81

51-65 222 134 168 25

66-100 145 258 91 8

Con los datos ofrecidos en la tabla de correlación de la distribución de frecuencias de valores agrupados de la correspondiente pregunta, contestar a las siguientes cuestiones:

¿Cuántos habitantes de la Isla, con una edad comprendida entre los 36 y 50 años (ambos inclusive) ganan entre 500 y 1.000 euros mensuales?:

a) 225

b) 233

c) 222

d) 333

Estadística aplicable a la Investigación Comercial

Distribuciones marginales

Consideran la distribución de una de las variables, olvidándose de la otra. Con lo que nos aparece una distribución unidimensional, como las que hemos estudiado anteriormente y a las cuales les podemos calcular las medidas aprendidas.

Nos aparecen dos distribuciones marginales la de X y la de Y.

Página 35 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 36: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

Vayamos a los ejemplos:

En el primero no hay duda cuales son las distribuciones marginales.

Distribución marginal de X

Distribución marginal de Y

Podríamos calcular la media, varianza y desviación típica, que serían las medidas más importantes.

= 3,28 3,91 = 1,97

Interpretémoslas:

El tamaño medio de familia en la muestra estudiada en isla paraíso es de 3 personas aproximadamente con una variación de 2 arriba o abajo

= 150 = 1.257,14 = 35,45

Interpretémoslas:

El tamaño medio de la vivienda de las familias estudiadas en isla paraíso es de 150 m2 con una variación con respecto a la media de más o menos 35 m2

En la tabla de correlación también es muy fácil

Comprobémoslo

Yj = Tamaño de la familia

Xi = Número de habitaciones en la vivienda

En la tabla de correlación hemos creado una nueva fila en donde se recogerá las veces que se presenta cada valor de la variable X, al cual llamaremos Hi.

También crearemos una columna nueva que recogerá las veces que se presenta cada valor de la variable Y, al cual llamaremos Gj.

Tamaño de la familia ni

0 1

1 1

3 1

4 2

5 1

6 1

Totales 7

Tamaño de la vivienda (en m 2) ni

100 1

120 1

130 1

150 2

200 2

Totales 7

Xi/Yj 1 2 3 4 Gj

1 200 134 251 12 597

2 120 254 362 125 861

3 45 365 124 255 789

4 136 85 268 85 574

5 245 96 111 43 495

Hi 746 934 1116 520 3316

Página 36 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 37: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

Ellos nos servirán para hacer las distribuciones marginales, en los cuales calcularemos los estadísticos más importantes.

Distribución marginal de X

= 2,42 ≈1 ≈.1

Interpretemos: el número medio de habitaciones por vivienda varía de una a tres, en la muestra estudiada.

Distribución marginal de Y

= 2,85 = 1,72 = 1,31

Interpretemos: el tamaño medio de las familias estudiadas varía de dos a cuatro personas aproximadamente.

Autoevaluación

En nuestro ejemplo las "x" serán el tamaño de la familia y las "y" el número de habitaciones de la vivienda.

Xi Hi Xi *Hi X2* Hi

1 746 746 746

2 934 1868 3736

3 1116 3348 10044

4 520 2080 8320

3316 8042 22846

Yj Gj Yj *Gj Y2* Gj

1 597 597 597

2 861 1722 3444

3 789 2367 7101

4 574 2296 9184

5 495 2475 12375

3316 9454 32701

Tamaño de la familia Número de habitaciones 1 2 3 4

1 200 134 251 12

2 120 254 362 125

3 45 365 124 255

4 136 85 268 85

Construir la distribución marginal de las variables "x" y contestar a las siguientes preguntas:

¿Cuál es la media de la variable "x"

a) 2.51

b) 1.89

c) 3.01

¿Cuál es la desviación típica?

a) 0.94

b) 0.88

c) 0.97

Página 37 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 38: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

Estadística aplicable a la Investigación Comercial

Distribuciones condicionadas

Es una distribución que se obtiene manteniendo fija una variable y considerando los valores que toma la otra con sus correspondientes frecuencias. Y nos explican como se distribuye una variable según los valores de la otra.

Son de dos tipos la de X/Y y la de Y/X.

Habrá tantas distribuciones X/Y como valores distintos de Y.

Habrá tantas distribuciones de Y/X como valores distintos de X.

Estas distribuciones son unidimensionales y podremos calcular todos los estadísticos estudiados.

Por ejemplo:

Si tenemos la siguiente tabla de correlación

Distribución condicionada de X/ Y= 4

Distribución condicionada de Y / X=3

Autoevaluación

A partir de la tabla de correlación correspondiente a la autoevaluación de la pregunta: Distribuciones marginales , construir la tabla de la distribución condicionada de X/Y = 2 y contestar a las siguientes cuestiones:

Yj \ Xi 3 5 7 Gj

2 2 5 2 9

4 5 10 5 20

6 2 3 2 7

Hi 9 18 9 36

X / Y = 4 n i

3 5

5 10

7 5

Y / X = 3 n i

2 2

4 5

6 2

¿Cuál es la media?

a) 2.57

b) 3.09

c) 2.44

¿cuál es la desviación típica?

a) 0.95

b) 0.93

c) 0.90

Página 38 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 39: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

Estadística aplicable a la Investigación Comercial

Covarianza

Si queremos medir la relación que existe entre dos variables tenemos que usar la covarianza.

La covarianza es una medida del grado de asociación entre dos variables.

Para calcular la covarianza utilizaremos esta formula práctica:

En nuestro ejemplo:

Es diferente la manera de calcularlo en función de que tengamos una tabla de correlación o no, calculémoslo en una tabla de correlación que es donde puede ser un poco más complicado.

La columna que vamos a representar en verde la vamos a ir calculando poco a poco aquí para que vayáis viendo como se hace.

A parte ya habíamos calculado:

= 2,42 ≈1 ≈1

= 2,85 = 1,72 = 1,31

Luego sólo nos queda aplicar la formula práctica y tendremos:

Sxy = 22708 / 3316 - (2,42 * 2,85) = -0.0489

Este sería el resultado de la covarianza.

En el primer ejemplo: El tamaño familiar medio es de 3,28 miembros y el tamaño medio de la vivienda es de 150 m2

Xi/Yi 1 2 3 4 Gi X* Y* n ij

1 200 134 251 12 597 1269

2 120 254 362 125 861 4428

3 45 365 124 255 789 6501

4 136 85 268 85 574 5800

5 245 96 111 43 495 4710

Hi 746 934 1116 520 3316 22708

1*200*1+ 1*134*2+1*251*3+1*12*4= 200+268+753+48= 1269

2*120*1+2*254*2+2*362*3+2*125*4= 240+1016+2172+1000= 4428

3*45*1+3*365*2+3*124*3+3*255*4= 135+2190+1116+3060= 6501

4*136*1+4*85*2+4*268*3+4*85*4= 544+680+3216+1360= 5800

5*245*1+5*96*2+5*111*3+5*43*4= 1225+960+1665+860= 4710

22708

Página 39 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 40: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

Se realizamos los cálculos para la covarianza obtenemos que:

Sxy = 3580 / 7 - (3.28 * 150) = 19.42

Esta medida nos será útil para los cálculos que haremos a continuación.

X Y X * Y

0 100 0

1 150 150

3 200 600

4 120 480

6 150 900

4 200 800

5 130 650

Estadística aplicable a la Investigación Comercial

La relación entre variables: correlación y regresió n.

El objetivo más importante del estudio de las distribuciones bidimensionales es el ver la relación que existe entre las variables X e Y.

Puedes pulsar en algunos de los términos de este esq uema para acceder al apartado correspondiente.

Autoevaluación

Responder con regresión/correlación

Aquella medida que permite obtener el valor de una variable cuando se da el valor de la otra a través de una función matemática se llama

a) Regresión

b) Correlación

Aquella medida que permite saber la dependencia entre las dos variables que forman la variable bidimensional se llama:

a) Regresión

b) Correlación

Página 40 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 41: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

Estadística aplicable a la Investigación Comercial

La correlación

La correlación nos sirve para medir la intensidad de la relación entre dos variables.

La relación o dependencia entre las variables se va ha denominar "covariación ". Existen cinco tipos de covariaciones:

Dependencia causal unilateral: Cuando una de las va riables influye en la otra, pero no viceversa.

Ejemplo: La lluvia caída influye en el rendimiento del trigo, pero el rendimiento del trigo no va a influir en lo que va ha caer de lluvia.

Interdependencia: Cuando las variables se influyen mutuamente.

Ejemplo: El precio depende de la cantidad demandada, y la cantidad demandada depende del precio.

Dependencia indirecta: Cuando la influencia de una tercera variable "Z" hace variar a X e Y en el mismo o contrario sentido, puede aparecer una de pendencia entre ellas que realmente no existe directamente.

Ejemplo: El nivel de vida influye en el consumo de gasolina y en la talla de los soldados, y debido a esto se observa que la talla aumenta cuando aumenta el consumo de gasolina, y viceversa.

Concordancia: Aun sabiendo que X e Y son independient es, queremos conocer si existe una concordancia en sus variaciones.

Ejemplo: Valoración de dos jueces en un concurso de belleza.

Dependencia casual: Cuando se observa una dependenc ia entre dos variables sin que exista ningún vínculo ni directo, ni indirecto entre ellas , se llega a la conclusión de que es casual o accidental.

Ejemplo: Si estudiamos por una casualidad la talla de los soldados y el consumo de gasolina y nos da por casualidad una relación de interdependencia.

La correlación mide la dependencia entre las dos va riables que forman la variable bidimensional, a través del coeficiente de correlac ión que nos dará la clase y el grado de covariación entre ellas.

Autoevaluación

Indicar en los siguientes casos que tipo de covariación (Dependencia causal unilateral/ Interdependencia/Dependencia Indirecta/Concordancia/Dependencia causal), existe entre las dos variables:

a) El precio depende de la cantidad ofrecida y la cantidad ofrecida depende del precio.

Elige una opción...

b) El nivel de vida influye en el nivel de estudios y en la talla de la población y debido a esto observamos que la talla aumenta cuando aumenta el nivel de estudio y viceversa Elige una opción...

Página 41 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 42: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

Estadística aplicable a la Investigación Comercial

Cálculo de la correlación

Para medir la correlación podemos usar el coeficiente de correlación lineal, al que llamaremos "r"

Su fórmula es:

en el que:

� Sxy= la covarianza de x e y

�Sx = Desviación típica de x

�Sy= desviación típica de y

En nuestro ejemplo que relaciona el tamaño de la familia y el tamaño de la vivienda el coeficiente de correlación es:

Interpretación:

Los valores que puede tomar el coeficiente de correlación "r" están siempre comprendidos entre - 1 y 1. Si nos sale un valor diferente nos hemos equivocado en algún cálculo

-1 < r < 1

Autoevaluación

Los valores que puede tomar el coeficiente de correlación están siempre comprendidos entre cero y uno.

a) Verdadero

b) Falso

Estadística aplicable a la Investigación Comercial

Interpretación del coeficiente de correlación

Del coeficiente de correlación tenemos que interpretar dos cosas:

En primer lugar : El signo o clase (positivo o negativo)

Si el coeficiente de correlación es positivo ( r > 0) hablamos de correlación lineal positiva, y significa, que cuando sube el valor de una variable también sube el de la otra, y viceversa, cuando el valor de una variable baja el de la otra también.

Por ejemplo: A mayores ingresos familiares mayor

Página 42 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 43: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

es el gasto en ropa, cuantos más kilómetros recorra un vendedor mayor es el gasto de mantenimiento del vehículo, etc...

Si el coeficiente de correlación es negativo ( r > 0) hablamos de correlación lineal negativa, y significa, que cuando sube el valor de una variable baja el valor de la otra.

Por ejemplo: Cuanto más gasta una familia menor es su tasa de ahorro, cuanto mayor es el gasto de mantenimiento en un automóvil menor es el número de averías que sufre, etc.

En segundo lugar: El grado de relación , que como norma general la vamos a interpretar de la siguiente forma:

Por supuesto esto es a modo indicativo, dependerá del tipo de fenómeno que se estudie y el criterio con el que se trabaje. Pero os ayudará en un principio a interpretar.

Interpretemos el ejemplo anterior: el resultado de "r" era 0,27

Luego diremos que la relación o covariación es positiva y poco significativa.

Positiva : Que cuanto mayor es el tamaño de la familia, mayor será la superficie de la vivienda, y viceversa.

Poco significativa : en la muestra estudiada esta relación o covariación tiene poca fuerza, se relacionan débilmente.

r > 0 La correlación es positiva

0 < r < 0,5 Positiva y poco significativa.

0,5 < r < 0,7 Positiva y significativa.

r > 0,7 Positiva y muy significativa.

r < 0 La correlación es negativa

-0,5 < r < 0 Negativa y poco significativa.

-0,7 < r < -0,5 Negativa y significativa.

r < -0,7 Negativa y muy significativa.

Estadística aplicable a la Investigación Comercial

El valor de la correlación (en valor absoluto)

Si la correlación se aproxima a 1 hablamos de correlación fuerte , cuanto más cerca de 1 o -1 se encuentre el coeficiente, más fuerte será la correlación.

Si la correlación se aproxima a 0 hablamos de correlación débil .

Ejemplos:

Relación entre altura y peso de los habitantes de la isla:

r = 0,95 significa que la correlación es directa y fuerte, es decir, hay una gran relación entre las dos variables y cuando sube la altura también lo hace el peso.

En nuestro ejemplo que relaciona el tamaño de la familia y el tamaño de la vivienda el coeficiente de correlación:

r = 0,23 significa que la correlación es directa pero débil, es decir, el tamaño de la familia explica muy mal el tamaño de la vivienda, aunque su relación es positiva.

Relación entre tamaño de la familia de turistas y tiempo de permanencia en la isla.

Página 43 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 44: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

r = -0,85 significa que la correlación es inversa y fuerte, es decir, la relación entre ambas variables es muy alta pero a medida que crece el tamaño de la familia se reduce el tiempo de estancia en la isla.

Una correlación fuerte no garantiza que exista una relación de causa-efecto entre las dos variables pues el resultado puede deberse únicament e a la casualidad

Autoevaluación

Cuando sube el valor de una variable y baja el valor de la otra, hablamos de correlación lineal negativa.

a) Verdadero

b) Falso

Una correlación fuerte garantiza siempre que existe una relación de causa-efecto entre las dos variables

a) Verdadero

b) Falso

Estadística aplicable a la Investigación Comercial

La regresión

Intentemos representar las parejas de valores del tamaño de la familia y el tamaño de la vivienda.

Para hacerlo tomamos un par de ejes rectangulares y colocamos en cada uno de ellos una variable.

Cada pareja de valores se representa por un punto y, por eso, el resultado de colocarlos todos se denomina nube de puntos . Diagrama que aparece en las distribuciones bidimensionales.

Podemos también intentar trazar una recta que muestre la tendencia de la nube de puntos:

Página 44 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 45: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

Esa recta que hemos trazado se denomina recta de regresión .

¿Cuál es la ventaja de la recta de regresión?

Nos va a permitir estimar cual será el tamaño de la vivienda si conocemos el tamaño de la familia.

¿Cómo lo haremos?

Supongamos que queremos estimar cual será el tamaño de la vivienda de una familia compuesta por dos miembros. Trazamos una línea recta hasta la recta de regresión que parta de un tamaño familiar igual a 2 y comprobaremos cual es el valor que toma la variable tamaño de vivienda en ese punto.

Vemos que el valor que corresponde es 100, así podemos estimar que el tamaño de una vivienda para una familia de dos miembros será de 100 m2.

Técnicamente la regresión nos sirve para estimar el valor de una variable cuando damos el valor de la otra variable.

La regresión permite obtener el valor de una variab le cuando se da el valor de la otra a través de una función matemática.

Luego la regresión considerada en un amplio sentido, lo que busca es una "línea" o "función matemática" que exprese sin irregularidades la relación entre las dos variables.

Existen muchos tipos de funciones matemáticas a aplicar, y cogeremos una u otra en función a la forma que tenga en la gráfica la nube de puntos.

Nosotros solo estudiaremos el caso de la Regresión lineal.

Para representar a la nube de puntos podemos usar una gran variedad de líneas: parábolas, curvas, rectas, etc.

Página 45 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 46: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

Cuando la línea de regresión es una recta se denomi na regresión lineal

¿Cuál es la mejor recta de regresión?

Es aquella que haga mínimas las distancias entre los puntos reales y los de la recta. Podemos estudiar la regresión lineal de Y/ X.- en donde obtendremos valores medios de Y en función de valores determinados de X.

La ecuación de una recta es:

y = A + Bx

A y B son las incógnitas de un sistema de dos ecuaciones:

En esas ecuaciones no se ha tenido en cuenta la frecuencia, ya que el ejemplo abajo considerado la frecuencia de presentación de los pares de valores siempre es uno. Pero en el caso de que exista frecuencia las ecuaciones serían las siguientes:

Si hacemos una ciertas operaciones con esas ecuaciones tendremos que:

Que como veis serán más fáciles de usar en cualquier tipo de distribución bidimensional.

Donde:

� n = número de elementos estudiados, es decir, número de parejas de valores

�xi= valores de la variable x

�yi = valores de la variable y

Vamos a calcular la recta de regresión del tamaño de la familia y el tamaño de la vivienda.

Sustituyendo en la fórmula:

7 A + 23 B = 1050 23 A + 103 B = 3580

Tamaño de la familia (x) Tamaño de la vivienda en m 2 (y) X2 Xy

0 100 0 0

1 150 1 150

3 200 9 600

4 120 16 480

6 150 36 900

4 200 16 800

5 130 25 650

Total=23 Total=1050 Total=103 Total=3580

Página 46 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 47: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

Resolviendo el sistema:

A = 134,42 B = 4,74

Con lo que la recta de regresión es:

y = 134,42 + 4,74 x

Vamos a calcular ahora cuantos metros suponemos que tendrá la vivienda de una familia con dos miembros.

Sustituimos la x por 2:

y = 134,42 + 4,74*2 y = 143,9 m2

Ya hemos podido estimar que una vivienda de una familia con dos miembros tendrá 143,9 m2.

Por último tendríamos que estudiar si esta recta representa correctamente la relación entre las variables, para ello se tiene que calcular "el coeficiente de determinación ", que en el caso de la regresión lineal es

R2=r20≤ R2≤ 1

Si R2 = 0 No se ha explicado nada con este modelo y si R2 = 1 el ajuste es perfecto.

Calculémoslo en el caso que nos ocupa:

R2 = (0.27)2 = 0.07. Como veis esta muy próximo a cero luego este modelo matemático no explica la relación entre estas dos variables, no es válido.

Si quisiéramos ahora calcular la otra recta de regresión, la de X/ Y, sería casi igual cambiaríamos donde hay Y por X, y por supuesto todo lo que esta relacionado con una y otra también. El coeficiente de determinación no varía.

Para saber más: http://www.fisterra.com/material/investiga/regre_li neal_simple /regre_lineal_simple.htm

Estadística aplicable a la investigación de mercados

Distribuciones multidimensionales

Vamos a intentar predecir cuantas veces cenará una familia en el restaurante de un hotel de isla Paraíso.

Antes tendremos que calcular de qué factores depende: supongamos que hemos decidido que las veces que cena un familia en el restaurante depende de:

� Número de miembros de la familia

� Renta de la familia

� Número de excursiones que contrata la familia durante su estancia en la isla.

Queremos explicar una variable (número de cenas) y disponemos de otras tres variables explicativas.

¿Qué podemos hacer?

Podemos intentar elegir la variable que explica mejor el número de cenas que realiza una familia en el restaurante y usar las técnicas que conocemos para una distribución bivariante.

Página 47 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 48: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

En este caso perderemos la información que nos pueden aportar las otras dos variables.

¿Podemos intentar explicar el número de cenas usando las tres variables?

La respuesta es sí.

Estamos ante una distribución multivariante en la que una variable viene explicada por varias variables.

Cuando estudiamos de manera simultánea más de dos v ariables, nos encontramos ante una distribución multivariante.

En la actualidad, está muy de moda el análisis multivariante, ya que permite aproximarse mejor a la explicación del funcionamiento de las variables.

Algunos ejemplos.

� Cuando un consumidor compra un producto tiene en cuenta al precio, la marca, su ubicación en el establecimiento, etc.

� Si plantamos un campo la cosecha depende de la temperatura, el nivel de riego, la cantidad de abono, etc.

� El gasto de una familia depende de su nivel de ingresos, del número de miembros, de su estilo de vida, etc.

Al igual que ocurre con las distribuciones unidimensionales y bidimensionales, las distribuciones multidimensionales pueden estar formadas por variables de diferentes tipos: cualitativas y/o cuantitativas.

Autoevaluación

Si estudiamos las notas de los alumnos del curso de Investigación y estas dependen del número de horas que trabaja fuera de casa, del nivel de estudios y de la edad, nos encontramos ante una distribución multivariante.

a) Verdadero

b) Falso

¿Cuál de las siguientes afirmaciones no es correcta? Estamos ante una distribución multivariante cuando:

a) Una variable viene explicada por otra variable.

b) Una variable viene explicada por más de dos variables.

c) Estudiamos de manera simultánea más de dos variables.

Estadística aplicable a la Investigación Comercial

La regresión multivariante

Vamos a intentar responder a la cuestión relativa al número de cenas, considerando las tres variables independientes. Estamos ante una regresión múltiple.

La regresión multivariante consiste en intentar pre decir el valor de una variable a partir del conocimiento de varias variables en función de una curva matemática.

La filosofía con la que funciona la regresión múltiple es la misma que explicamos para la regresión bivariante, es decir, se intenta reducir al máximo la distancia entre los valores teóricos y los valores reales.

Página 48 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 49: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

La fórmula que me permite calcular la regresión es:

y = a + bx + cz + dw

Siendo:

� y = Predicción del número de cenas por familia

� a = número constante de cenas independiente del tamaño familiar, de la renta familiar y del número de excursiones contratadas.

� b = cambio en el número de cenas provocado por un cambio unitario en el número de miembros de la familia.

� x = tamaño de la familia

� c = cambio en el número de cenas provocado por un cambio unitario en el nivel de renta familiar

� z = renta de la familia

� d = cambio en el número de cenas provocado por un cambio unitario en el número de excursiones contratadas por la familia.

� w = excursiones contratadas por la familia.

Para el cálculo de la regresión múltiple y es conveniente usar programas informáticos.

Para saber más: http://www.spss.com/es/productos/profesionales/regr esion.pdf

Estadística aplicable a la Investigación Comercial

La correlación multivariante

El concepto de correlación también coincide con el de las distribuciones bidimensionales y mide el grado de relación entre la variable independiente y la variable explicada.

Si usamos una variable explicativa adicional debe mejorar la predicción de la variable.

¿Qué pasa si están correlacionadas dos variables independientes?

En este caso parte del poder predictivo de la variable ya ha sido explicado por la otra.

Podemos pensar que el número de excursiones contratadas está relacionada con la renta familiar, a este fenómeno se denomina colinealidad.

La colinealidad es la correlación entre dos variabl es independientes y la multicolinealidad es la correlación entre tres o más variables independient es

Interesa usar variables independientes que tengan una colinealidad baja.

Es deseable usar variables independientes muy correl acionadas con la variable independiente y muy poco correlacionadas entre sí.

Autoevaluación

Si queremos estudiar el número de veces que salen a cenar la pareja y esta la relacionamos con la renta familiar y el número de hijos, a este fenómeno se le denomina colinealidad.

a) Verdadero

b) Falso

Página 49 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 50: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

Estadística aplicable a la Investigación Comercial

¿Qué es la probabilidad?

Vamos a responder a una serie de cuestiones:

¿Qué tiempo va a hacer esta tarde en isla Paraíso?, ¿Cuántos cliente entrarán esta tarde en el restaurante del hotel?, ¿Qué numero tocará esta tarde en el cupón de la ONCE?.

Podemos responder que va a hacer sol y la temperatura será de 28 Grados, que entrarán 57 clientes y que el número premiado será el 00056, pero alguien nos puede hacer la pregunta mágica ¿Seguro?.

Desgraciadamente la respuesta debe ser que no estamos seguros, pero también podemos intentar medir el grado en el que las afirmaciones pueden llegar a ser ciertas, es decir, podemos calcular la probabilidad de que algo ocurra.

La probabilidad mide la frecuencia con la que se pr oduce un suceso determinado

¿Cómo podemos medir la probabilidad?

El método más usado es calcular el cociente entre los casos favorables y los casos posibles.

P(un suceso) = Casos favorables / casos posibles

En el caso del cupón:

Todos los números tienen la misma probabilidad de salir:

Casos favorables: Tenemos un único número, así que hay 1 caso favorable

Casos posibles: hay 100.000 números diferentes.

P(salga el número 00056)= 0,00001

La probabilidad toma valores comprendidos entre 0 y 1

� Si el valor de la probabilidad es 0 significa que es imposible que el suceso se produzca.

� Si el valor de la probabilidad es 1 indica que el suceso se producirá con toda certeza.

� Si el valor de la probabilidad se aproxima a 1 significa que es bastante probable que ocurra, si se acerca a 0 manifiesta que es poco probable.

Hay una joven que ha entrado en el paritorio para tener un hijo y se acaba de escuchar el llanto que indica que el bebé acaba de nacer. En isla Paraíso no está demasiado avanzada la medicina y se desconoce el sexo del recién nacido. ¿Es niño o niña?.

En este momento ambos sucesos son iguales de probables, es decir, la probabilidad de que sea niño es de 0,5, exactamente igual que la probabilidad de que sea niña, también 0,5.

Si sumamos ambas probabilidades la suma es 1. Esto es válido para todas las situaciones, si p es la probabilidad de que ocurra un suceso y q la probabilidad del suceso contrario:

p + q = 1 , o lo que es igual, q = 1 - p

Página 50 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 51: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

Si en vez de dos sucesos posibles son tres, cuatro, o más, la suma de las probabilidades de los diferentes sucesos complementarios también será 1.

La suma de las probabilidades de todos los sucesos complementarios es 1

En nuestro país nos gusta hablar en tantos por cientos, por ello solemos expresar las probabilidades en %. En vez de decir con una probabilidad de 0,9 solemos decir con una probabilidad del 90 %.

Autoevaluación

El método más usado para calcular la probabilidad es calcular el cociente entre los casos posibles y los casos favorables.

a) Verdadero

b) Falso

¿Cuál es la probabilidad de que al tirar un dado nos salga un 6?

a) 2/6

b) 1/6

c) 6/6

Estadística aplicable a la Investigación Comercial

Conceptos fundamentales del muestreo

Ya sabemos que hay veces en las hay que obtener la información de un número de elementos inferior al de la población, en estos caso hablamos de muestra. ¿Para qué nos sirve la información obtenida de la muestra?

La información que obtengamos de la muestra va servir para conocer a toda la población, por ello es importante utilizar una muestra que represente a la población.

Si una muestra representa de la manera deseada a la población decimos que es una muestra representativa.

También hemos de saber que para que la muestra sea adecuada y sea de utilidad estadística, es necesario cumplir ciertos requisitos para la selección de los elementos.

Desgraciadamente, por muy bien que una muestra represente a la población, cometeremos algún error al obtener la información, pues vamos a obtener conclusiones de una realidad a partir de observaciones de sólo una parte de ella. Este error se denomina error de muestreo .

Estadística aplicable a la Investigación Comercial

Los errores en el muestreo

Supongamos que hemos utilizado una muestra, y hemos calculado que el porcentaje de familias de isla Paraíso que viven de la fabricación de flautas de bambú es del 30 %.

Página 51 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 52: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

Como la muestra es representativa, es muy posible que el verdadero valor esté muy próximo al 30 % pero también es muy difícil que sea exactamente del 30 %, es decir, estamos cometiendo un error.

La diferencia entre el valor obtenido de la muestra y el valor real, pero desconocido, de la población se denomina error.

Los errores de un muestreo son de dos tipos: errores aleatorios y errores sistemáticos.

El error aleatorio proviene del propio proceso de muestreo, por el mero hecho de usar una muestra aleatoria.

Este error lo podemos controlar, aunque no podemos hacer que desaparezca.

Supongamos que en nuestra investigación hemos calculado que el porcentaje de familias que viven de la fabricación de flautas es del 30 %, con un error de más menos 3 % y con un nivel de confianza del 98 %.

¿Qué significa esto?

Significa que el auténtico valor de la población se encuentra entre un 27 % y un 33 % (30 % mas/menos 3%) con una probabilidad de un 98 %.

Ahora podemos preguntarnos, ¿de qué depende el error y el nivel de confianza?

Depende básicamente del tamaño de la muestra que usemos. A mayor tamaño muestral menor error, de hecho, si preguntamos a toda la población el error desaparecerá.

Planteemos otra pregunta. ¿A cuantas personas hay que estudiar para conocer el número de piernas que tienen los habitantes de la isla?

Seguramente si observamos únicamente a una persona podremos concluir que todos los habitantes tienen dos piernas.

Esto es así porque en relación al número de piernas los habitantes de la isla son homogéneos.

En conclusión, podemos afirmar que el error será menor cuanto más homogénea sea la población.

El error aleatorio depende del tamaño de la muestra y de si la población es homogénea o heterogénea.

El error sistemático o sesgo , es todo error que sea distinto del aleatorio.

Puede provenir de multitud de causas, por ejemplo:

� Errores al anotar el resultado. La persona se equivocó de casilla

� Errores al contestar. La persona tiene mala memoria, o nos miente.

� Errores al redactar la pregunta. La persona no entiende la pregunta.

� Si la muestra no es representativa porque la persona se niega a responder.

Autoevaluación

¿Cuál de las siguientes afirmaciones es correcta?

Si estudiamos las notas de los alumnos de Investigación comercial con una muestra y en nuestra investigación nos sale que el 70% de los alumnos han aprobado, con un error de más, menos cuatro y con un nivel de confianza del 98%, significa que...

a) el auténtico valor de la población se encuentra entre un 70% y un 98%, con una probabilidad del 98%.

b) El autentico valor de la población se encuentra entre un 66% y un 74%, con una probabilidad de un 98%.

c) Ninguna es correcta

Página 52 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 53: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

Estadística aplicable a la Investigación Comercial

Tipos de muestreo

Existen varios procedimientos que podemos usar cuando queremos extraer una muestra de la población.

Habitualmente se suelen hacer dos grandes grupos de métodos de muestreo:

� Métodos de muestreo probabilísticos, en los que la selección de la muestra se realiza usando un procedimiento aleatorio.

� Métodos de muestreo no probabilísticos, en los que para seleccionar la muestra se usan medios no aleatorios.

Métodos de muestreo probabilísticos

Los métodos de muestreo probabilísticos son aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de la muestra y, consiguientemente, todas las posibles muestras de tamaño n tienen la misma probabilidad de ser elegidas.

Sólo estos métodos de muestreo probabilísticos nos aseguran la representatividad de la muestra y por ello son los más recomendables.

Hay distintos tipos de muestreo probabilísticos:

� Muestreo aleatorio simple

� Muestreo sistemático

� Muestreo aleatorio estratificado

� Muestreo por conglomerados

� Muestreo por etapas: Consiste en trabajar en varias etapas, eligiendo en cada una de ellas el método de muestreo probabilístico más adecuado.

Métodos de muestreo no probabilísticos

En ellos no todos los elementos de la población tienen la misma probabilidad de se elegidos. La muestra deja de ser representativa y, en consecuencia, no son recomendables. Hay distintos tipos:

� Muestreo por cuotas: Consiste en seleccionar un número de individuos que cumple unas ciertas condiciones, por ejemplo, 30 hombres de 30 a 50 años que vivan en Cuenca. Después se elige a las primeras personas que cumplan esa condición.

� Muestreo opinático o intencional: Se usa en la muestra grupos que los expertos consideran típicos. Por ejemplo, en los sondeos electorales se suelen usar ciertas zonas.

� Muestreo casual o incidental: El investigador elige los individuos de la población que le resultan más convenientes. Por ejemplo, los profesores utilizan a sus alumnos.

� Muestreo de bola de nieve: Una vez que se localiza a un individuo se le pide que nos lleve hasta otros y así hasta conseguir una muestra suficiente. Por ejemplo, si queremos hacer un muestreo de aficionados al aeromodelismo.

Autoevaluación

Indicar que tipo de muestreo, probabilístico/no probabilístico, se han utilizado en los siguientes casos, para elegir la muestra:

a) Seleccionar a un número de individuos que cumplen una condición y elegir a los primeros que la cumplan.

Elige una opción...

b) Se le asigna un número a cada individuo de la población y después se utiliza un medio mecánico para elegir los sujetos Elige una opción...

c) Se divide los grupos por estratos en función de sus características y se usa el muestreo aleatorio simple dentro de cada estrato. Elige una opción...

Estadística aplicable a la Investigación Comercial

Página 53 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 54: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

Muestreo aleatorio simple

Se eligen al alzar el número de elementos necesarios para completar el tamaño de muestra requerido.

El procedimiento empleado es el siguiente: 1) se asigna un número a cada individuo de la población y 2) a través de algún medio mecánico (bolas dentro de una bolsa, tablas de números aleatorios, números aleatorios generados con una calculadora u ordenador, etc) se eligen los sujetos.

Es un método muy simple pero es poco práctico si el tamaño de la población es muy grande.

Estadística aplicable a la Investigación Comercial

Muestreo sistemático

Es una variedad del aleatorio simple, muy útil cuando tenemos un listado de la población, la guía telefónica, etc..

El procedimiento consiste en coger a los individuos de k en k, siendo k el el resultado de dividir el tamaño de la población entre el tamaño de la muestra: k=N/n.

Se debe comenzar por un elemento elegido al azar anterior a la primera k

Estadística aplicable a la Investigación Comercial

Muestreo aleatorio estratificado

Hay veces que podemos encontrar grupos en la población que presentan características homogéneas. Por ejemplo, los cosméticos usados por las mujeres son distintos a los de los hombres.

Estos grupos se denominan estratos, y se usa un muestreo aleatorio simple dentro de cada estrato.

Estadística aplicable a la Investigación Comercial

Muestreo por conglomerados

Se eligen grupos de elementos, llamados conglomerados, y todos los elementos entran a formar parte de la muestra. Hay que seleccionar un número de conglomerados que permita alcanzar el tamaño de la muestra necesario.

Página 54 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 55: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

Estadística aplicable a la Investigación Comercial

Diseño de muestreo

El diseño de muestreo consiste en seguir una serie de pasos para intentar que la muestra sea representativa.

Un buen diseño es fundamental para que la muestra s ea representativa.

Los pasos que hay que seguir son:

1.- Definir la población:

Hay que definir correctamente la población objetivo, para lo que hay que tener en cuenta el objetivo de la investigación.

Por ejemplo: Si queremos estudiar la actitud hacia las maquinillas de afeitar usaremos a los varones mayores de 15 años.

2.- Determinar el método de muestreo:

Intentaremos que sea probabilístico y tendremos en cuenta las características de la población y la manera que usaremos para recoger la información.

Por ejemplo, si vamos a usar entrevistas personales nos interesa que los individuos estén agrupados, para poder así reducir el esfuerzo y el coste.

3.- Determinar el tamaño de la muestra:

Hay que buscar el equilibrio entre el coste de usar una muestra grande y la fiabilidad de los resultados obtenidos.

Para calcular el tamaño de la muestra hay que conocer el parámetro que queremos calcular, y hay que decidir el error que estamos dispuestos a asumir y el nivel de confianza con el que deseamos obtener la información.

4.- Selección material de la muestra:

Hay que elegir a los que formarán parte de la muestra y posteriormente habrá que localizarlos físicamente.

5.- Diseñar la solución a la falta de respuesta.

A menudo es imposible obtener la información del individuo elegido para participar el la muestra: no quiere responder, no se le localiza, no sabe responder, etc.

Esta falta de respuesta puede introducir un sesgo importante, por ejemplo si queremos medir la actitud hacia las drogas, suelen negarse a responder los que tienen una actitud positiva hacia las mismas.

Para saber más: http://www.ine.es/proyectos/eet0203/proy_eet0203.pd f http://www.ine.es/docutrab/epa02_infortec/epa_02_in forme_tecnico.pdf

Autoevaluación

¿Cuál de las siguientes afirmaciones es la correcta? Los pasos a seguir para un buen diseño de muestro son:

a) Definir la muestra, determinar el método del muestreo, determinar el tamaño, selección material de la muestra, diseñar la solución a la falta de respuesta.

b) Definir la población, definir la muestra, determinar el método del muestreo, selección material de la muestra, diseñar la solución a la falta de respuesta.

c) Definir la población, determinar el método del muestreo, determinar el tamaño, selección material de la muestra, diseñar la solución a la falta de respuesta.

Página 55 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 56: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

Estadística aplicable a la Investigación Comercial

El muestreo aleatorio simple

Es un muestreo probabilístico en el que todos los elementos tienen la misma probabilidad de entrar a formar parte de la muestra.

Es difícil de aplicar pues hay que localizar previamente a todos los elementos.

Vamos a usar el muestreo aleatorio simple para explicar algunos conceptos de muestreo.

Un parámetro es un valor que describe de manera resumida la población, por ejemplo, la media o la proporción.

Un estimador es un valor que intenta estimar el valor de un parámetro de la población.

Veamos el proceso con un ejemplo:

Queremos saber el consumo medio de cocos al mes de los habitantes de la isla.

Conocemos los siguientes datos:

� Población: 100.000 habitantes

� Error que estamos dispuestos a admitir = más menos 2 cocos

� Nivel de confianza: 95,5 %

Hay que calcular el tamaño de la muestra, para lo que usaremos la fórmula:

donde:

� S2 , es la varianza, en nuestro caso será 4,2

� K, viene determinado por el nivel de confianza. Al ser 95,5 % implica que k = 2

� e , es el error

� N , el tamaño de la población

� n , es el tamaño de la muestra

� = 4,19

En nuestro caso conseguimos que una muestra sea representativa con 5 elementos. Ahora elegimos al azar a 5 personas, que nos responden que su consumo de cocos es de 23, 26, 27, 22, 25. El consumo medio de cocos al mes en la muestra es de 24,6 cocos. (es un estimador).

Podemos estimar que el consumo medio mensual de la población es de 24, 6 cocos.

De otra manera podemos decir que con una confianza del 95,5 % el consumo mensual de cocos de los habitantes de la isla se sitúa entre 22,6 cocos y 26,6 cocos.

Autoevaluación

¿Cuál de las siguientes afirmaciones es la correcta? En el muestreo probabilístico:

a) Todos los elementos no tienen la misma probabilidad de entrar a formar parte de la muestra

b) Es difícil de aplicar pues hay que buscar anticipadamente todos los elementos.

Página 56 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...

Page 57: INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING

El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no funcionarán.

c) Es fácil de aplicar por que todos los elementos tienen la misma probabilidad de ser localizados

Estadística aplicable a la Investigación Comercial

Selección real de las unidades de la muestra

Si estamos usando un muestreo probabilístico es imprescindible que las unidades muestrales sean elegidas al azar, para ello podemos utilizar cualquier procedimiento como usar dados, extraer bolas, etc. Desgraciadamente estas técnicas son poco operativas.

Veamos cuales son los procedimientos que más se usan:

Usar números aleatorios:

Consiste en numerar las unidades y después obtener números de manera aleatoria, usando un ordenador o una calculadora.

Seleccionar los elementos de manera sistemática:

Se trata de utilizar el muestreo sistemático.

Usar un muestreo por etapas:

Cuando no disponemos de un fichero de los elementos podemos usar inicialmente otros niveles de agregación, por ejemplo, si queremos elegir una muestra de discotecas podemos usar inicialmente un listado de municipios (fácil de localizar) y en una segunda etapa elaborar un listado de discotecas únicamente para las localidades seleccionadas.

Seleccionar números de teléfonos:

Se puede usar un muestreo sistemático y luego sustituir la última cifra por un número aleatorio.

Selección de rutas aleatorias:

Sirve para localizar de forma aleatoria viviendas en un municipio. Y hay que seguir una serie de pasos.Se obtienen al azar los puntos de inicio.

Se le indica al entrevistador la ruta a seguir: ande hacia la izquierda, tuerza la segunda calle a la derecha, etc.

Los edificios elegidos son aquellos que coincidan con los números fijados en la hoja de ruta.

Hay que detallar también las instrucciones para seleccionar la vivienda de cada edificio.

Para saber más: http://www.fimestic.es/Institucional/ElObservador/Ob ervador2002/con6 -0.htm

Estadística aplicable a la Investigación Comercial

Página 57 de 57¿Por qué utilizamos la estadística en investigación comercial?

14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...