Introducción a Las Simulaciones Probabilísticas en Excel

10
Introducción a las Simulaciones Probabilísticas en Excel Puede utilizar las distribuciones de probabilidad para gestionar la incertidumbre acerca de sus supuestos al crear simulaciones en Excel. Así es cómo se hace. (*) por Charley Kyd, MBA Microsoft Excel MVP, 2005-2014 El Padre de Informes Dashboard de hoja de cálculo Antes, cuando he creado modelos y pronósticos para los empleadores, sabía que mis resultados iban a estar mal, y yo no tenía forma práctica de expresar ningún grado de incertidumbre en mis resultados. Por ejemplo, si yo pronosticaba ganancias por un período, mi hoja de cálculo utilizaba un número para mi pronóstico de las ventas en un periodo, otro número para mi previsión de los gastos operativos, otro número para el porcentaje de mi costo de mercancías vendidas, y asi sucesivamente. Yo sabía que cada número que se predijo en mi pronóstico probablemente aterrizaría en algún valor entre un mejor de los casos y el peor de los casos ... probablemente determinado por una distribución normal, como se muestra en este gráfico de Excel.

description

Traducción libre del ingles para ejercicio en Excel sobre Simulaciones

Transcript of Introducción a Las Simulaciones Probabilísticas en Excel

Page 1: Introducción a Las Simulaciones Probabilísticas en Excel

Introducción a las Simulaciones Probabilísticas en ExcelPuede utilizar las distribuciones de probabilidad para gestionar la incertidumbre acerca de sus supuestos al crear simulaciones en Excel. Así es cómo se hace. (*)

por Charley   Kyd, MBA Microsoft Excel MVP, 2005-2014 El Padre de Informes Dashboard de hoja de cálculo

Antes, cuando he creado modelos y pronósticos para los empleadores, sabía que mis resultados iban a estar mal, y yo no tenía forma práctica de expresar ningún grado de incertidumbre en mis resultados.

Por ejemplo, si yo pronosticaba ganancias por un período, mi hoja de cálculo utilizaba un número para mi pronóstico de las ventas en un periodo, otro número para mi previsión de los gastos operativos, otro número para el porcentaje de mi costo de mercancías vendidas, y asi sucesivamente.

Yo sabía que cada número que se predijo en mi pronóstico probablemente aterrizaría en algún valor entre un mejor de los casos y el peor de los casos ... probablemente determinado por una distribución normal, como se muestra en este gráfico de Excel.

Pero mis modelos ofrecen ninguna manera para mí para incluir tales probabilidades. Y ellos ofrecieron ninguna manera de evaluar o reducir mi grado de incertidumbre sobre mi pronóstico final.

Y también, durante mis años como consultor de Excel, vi muchos modelos y pronósticos creados por los usuarios de hojas de cálculo de todo el mundo. Y en todo ese tiempo, nunca vi un modelo, o de pronóstico que podría haberlo hecho mejor.

Page 2: Introducción a Las Simulaciones Probabilísticas en Excel

Escriba "simulaciones"

Desde entonces, me he dado cuenta de que la mayoría de los modelos de Excel y los pronósticos son en realidad una forma de simulación.

Wikipedia nos dice que una simulación es la imitación de la operación de un proceso en el mundo real o sistema en el tiempo.

El acto de simular algo, Wikipedia explica, en primer lugar se requiere que se elabore un modelo. Este modelo representa las características clave o comportamientos de un sistema o proceso. El modelo representa el sistema en sí, y la simulación representa el funcionamiento del sistema en el tiempo.

En general, hay dos tipos de modelos: deterministas y probabilísticos.

Deterministas modelos que utilizan números específicos para los valores asumidos, incluidas las relaciones.

Probabilísticos modelos (o "estocásticos") se basan en números al azar, generalmente extraídos de una distribución normal.

Desde esta perspectiva, el tipo de simulación que se preparó para mis empleadores, y el tipo que vi en otras empresas era una simulación determinista.

Por otro lado, lo que deberíamos haber estado usando era una simulación probabilística. Esto habría permitido que especificáramos nuestro grado de incertidumbre acerca de cada una de nuestras suposiciones, y que también nos han ayudado a evaluar nuestra incertidumbre acerca de los resultados finales.

Creo que es tiempo pasado para los usuarios de Excel para reducir nuestra dependencia de las simulaciones deterministas. Es hora de empezar a utilizar simulaciones probabilísticas en nuestro trabajo.

Dos tipos de simulaciones probabilísticasHablando libremente, podemos dividir simulaciones probabilísticas en dos tipos, tabular y ampliado.

Simulaciones Tabulares

Con simulaciones tabulares, se crea todo el modelo en varias celdas en una fila de una hoja de cálculo. Y algunas de estas células incluyen números aleatorios.

Para crear la simulación, se copia la fila de fórmulas debajo de sus columnas para muchos miles de filas. Y entonces, para analizar la simulación, se analizan los muchos resultados diferentes generados por esos números aleatorios en cada fila de la tabla de simulaciones.

Page 3: Introducción a Las Simulaciones Probabilísticas en Excel

Por ejemplo, supongamos que su empresa pone un número variable de anuncios en línea cada mes, que generan un número variable de visitantes a su sitio web. Y supongamos que se necesita un número variable de visitantes para generar cada venta de una cantidad variable.

Así que en varias celdas de una fila, se puede simular un mes de actividad, utilizando números aleatorios para definir cada grado de variabilidad. Usted puede copiar esas fórmulas por sus columnas para crear una tabla con miles de posibles resultados. Y entonces, usted analizaría la tabla para determinar cuáles serían sus ventas promedio por un período, y como podría ser la variable de estimación.

Simulación Ampliada

El enfoque ampliado es diferente. En este enfoque, se crea un modelo que puede ser tan detallado como le gustaría que fuera. Usted podría utilizar tantas filas en tantas hojas como usted desea para su modelo.

Típicamente, esto se conoce como un análisis de Monte Carlo.

Pero a diferencia de la mayoría de los modelos creados en Excel, el análisis de Monte Carlo usaría números aleatorios para generar hipótesis clave.

Por ejemplo, si sus mejores posibles ventas de un mes serían 120, y sus peor posibles ventas serían 80, tendrá que utilizar un número aleatorio que elegir entre esos límites. O si su costo más alto posible de las ventas sería del 40% y su costo más bajo posible, sería 30%, tendrá que utilizar otro número aleatorio que elegir entre esos límites.

Con este enfoque, el modelo le da un pronóstico revisado cada vez que se vuelve a calcular el libro.

Usted fácilmente puede volver a calcular este modelo tantas veces como quiera y capturar los resultados de cada cálculo ... automáticamente. Y usted puede hacerlo sin necesidad de programación. Te voy a mostrar cómo hacerlo en mi próximo artículo, Cómo crear modelos de Monte Carlo y pronósticos Usando las tablas de Excel de datos.

Pero por ahora, vamos a profundizar en un ingrediente fundamental de ambos tipos de simulaciones: números aleatorios. En primer lugar, te voy a mostrar el método obvio, que rara vez se debe utilizar para sus simulaciones. A continuación te voy a mostrar el método que debe utilizar la mayor parte del tiempo.

Dos funciones de números aleatorios de ExcelExcel ofrece dos funciones que generan números aleatorios ...

RAND () devuelve un número aleatorio entre 0 y 1. RANDBETWEEN (abajo, arriba) devuelve un entero aleatorio entre la parte inferior y

superior argumentos.

Page 4: Introducción a Las Simulaciones Probabilísticas en Excel

Ambas funciones devuelven resultados que tienen la misma oportunidad de aparecer en cualquier lugar entre los límites inferior y superior.

Para ilustrar esto, he copiado la función RAND () y pegado a 10.000 celdas en una columna. Yo he agrupado sus valores en 10 grupos en bandejas de igual tamaño, a continuación, he creado un histograma que muestra cuántas veces un valor apareció en cada bandeja.

El gráfico de la izquierda muestra los resultados después que apreté F9 por primera vez para volver a calcular mi libro. La primera columna de la primera tabla muestra que RAND genera un valor entre 0 y .10 colindan 1010 veces en esas 10.000 filas. Y la última columna en ese gráfico muestra que RAND genero un valor entre 0,9 y 1,0 aproximadamente 990 veces. Y el otro gráfico muestra los resultados después apreté F9 de nuevo.

Como se puede ver, los resultados para cada columna se agrupan alrededor de 1.000, que es parte igual de cada columna de los resultados.

Si hubiera utilizado RANDBETWEEN en lugar de RAND, habría visto un patrón similar.

El problema de usar ya sea RAND o RANDBETWEEN para sus simulaciones es que queremos que los resultados se vean mas o menos como este gráfico de Excel.

Es decir, una vez que se definen los límites de nuestros supuestos, por lo general queremos que los números al azar sean de ponderación central.

Entonces, ¿cómo podemos hacer esto? ¿Cómo podemos devolver un número aleatorio de una distribución normal?

Page 5: Introducción a Las Simulaciones Probabilísticas en Excel

Números aleatorios de una distribución normalPara devolver un número aleatorio de una distribución normal, nos basamos principalmente en la función NORM.INV, que utiliza esta sintaxis:

= NORM.INV (probabilidad, media, desv_estándar)

El argumento de probabilidad es fácil de especificar. Las probabilidades tienen valores de cero a uno, al igual que la función RAND genera. Por lo tanto, si podemos encontrar la manera de calcular la media y la desviación estándar, podemos utilizar esta fórmula para devolver un número aleatorio de una distribución normal:

= NORM.INV (RAND (), Media, desv_estándar)

Si usted es una superestrella en estadística, usted no tendrá ningún problema en el cálculo de la media y la desviación estándar de los datos para su uso en esta fórmula. Pero si usted es como la mayoría de nosotros los usuarios de Excel, es necesario un enfoque más sencillo. Aquí está...

Eche una mirada a este gráfico de Excel. La zona de color azul claro es dentro de una desviación estándar de la media.

Como la primera etiqueta debajo de la gráfica ilustra, esa zona de azul claro representa alrededor del 68% de la superficie total.

En conjunto, las áreas de luz y de color azul medianas muestran lo que hay dentro de dos desviaciones estándar de la media. Y la segunda etiqueta debajo del gráfico muestra que esto representa aproximadamente el 95% de la superficie total.

Así que pensar en lo que eso significa. Suponga que su previsión inicial muestra que las ventas próximos meses serán 100. Pero si tu trabajo dependiera de ello, ¿qué crees que sus estimaciones mejor de los casos y el peor de los casos podrían ser para esas ventas? Después de que usted realmente piensa de él, digamos que usted estima que las ventas podrían ser tan alto como 120 y tan bajo como 70.

Page 6: Introducción a Las Simulaciones Probabilísticas en Excel

Esos dos números definen los límites exteriores de las zonas azules medianas en la figura. Es decir, su estimación dice que hay una probabilidad del 95% que las ventas reales serán entre 70 y 120.

Y por lo tanto...

Su media es la media de 120 y 70, que es 95 en este caso. Su desviación estándar es la diferencia entre 120 y 70, dividido por 4 desviaciones

estándar, que es 12,5 en este caso.

Por lo tanto, aquí está su fórmula para devolver un número aleatorio de una distribución normal con una media de 95 y una desviación estándar de 12.5:

= NORM.INV (RAND (), 95,12.5)

Ahora vamos a ver si esta fórmula nos da los resultados que esperamos.

Comprobación de los resultados con un histogramaLas dos figuras siguientes no son de lujo, pero que cuentan una historia que es necesario entender si crea modelos de Excel o previsiones.

Esta cifra calcula cuánto éxito la fórmula anterior devuelve los números de una distribución normal. He aquí cómo configurarlo ...

Introduzca esta fórmula en la celda de muestra:

A1:   = NORM.INV (RAND (), 95,12.5)

Page 7: Introducción a Las Simulaciones Probabilísticas en Excel

Queremos copiar este celda de la columna a la celda A10000. Aquí está una manera rápida de hacer esto:

1. Copia la celda A1.2. Pulse la tecla de función F5 para iniciar el diálogo Ir a.3. En el cuadro de edición de referencia, introduzca A10000, a continuación, pulse

Intro para seleccionar células A10000.4. Mantenga presionada las teclas Ctrl y Shift, a continuación, pulse la tecla de flecha

hacia arriba, que seleccionará todas las células de A10000 través de A1.5. Presione Ctrl + V para pegar la celda A1 a las celdas seleccionadas.

Las celdas de la columna C muestran los valores mínimos y máximos en la columna A. Introduzca las fórmulas en las celdas que se muestran:

C2:  = MIN ($ A $ 1: $ A $ 10000) C3:   = MAX ($ A $ 1: $ A $ 10000)

Columna D muestra nueve números para usar como una guía visual. Introduzca cualquier manera que usted desea.

La primera fórmula en la celda E2 mera referencia al valor min:

E2:   = C2

La siguiente fórmula calcula el valor mínimo más una novena parte de la distancia entre los valores mínimos y máximos:

E3:   = E2 + ($ C $ 3- $ C $ 2) / 9

Copie la fórmula en la celda E3 hacia abajo como se muestra. Observe que la celda E11 es igual al valor máximo en la celda C3.

Configuración de los datos para el histograma

Columna F contiene los datos que mostraremos en nuestro nuevo histograma. Usaremos la función FRECUENCIA para generarlo.

Para ello, primero seleccione el rango F3: F11, a continuación, escriba esta fórmula en la barra de fórmula:

= FRECUENCIA (A1: A10000, E3: E11)

Ahora matriz de introducir esta fórmula. Es decir, mantenga pulsada la tecla Ctrl y Shift y luego presione Intro.

Después de hacerlo, usted debe tener un patrón similar a los datos que se muestran en la figura anterior. Es decir, las células en el medio de las fórmulas en la columna F debe mostrar los números mucho más grandes que las células en cada extremo.

Page 8: Introducción a Las Simulaciones Probabilísticas en Excel

Cree el histograma

El paso final de la prueba es para crear el histograma, que se muestra aquí.

Para ello, asegúrese de que la F3 gama: F11 todavía se selecciona, a continuación, elija Insertar, Gráficas, gráfico de columnas, Columna agrupada.

Después de hacerlo, Excel creará un gráfico un tanto como éste. Si está utilizando Excel 2007 o 2010, su carta no puede incluir un título.

Por supuesto que podría hacer esta tabla se vea mejor, pero eso no es necesaria para el ensayo. El gráfico demuestra fácilmente que hemos hecho lo que queríamos mediante la combinación de las funciones NORM.INV y RAND: Ahora tenemos una manera de volver números aleatorios de una distribución normal.

En mi próximo artículo, que estará disponible en varias semanas, te voy a mostrar cómo construir sobre esta base para crear simulaciones probabilísticas utilizando el método de Monte Carlo.

*Traducción libre por: Edgard J. Ramirez G.