Tesis I -Pronostico de Ventas 2

41
Universidad Tecnológica Del Perú –filial Arequipa Facultad De Ingeniería Carrera Profesional Ingeniería de Sistemas e Informática Análisis e implantación de un Sistema de Producción que emplea una herramienta Data Mining para el pronóstico de producción en la empresa de calzados “DUKE S.A.C.” Arequipa, 2015 Presentado por: Ventura Mamani Wily Curso: Seminario de Tesis I Décimo Ciclo Profesor asesor: Ing. Adin Sánchez Sánchez

description

una tesis para poder guiarse

Transcript of Tesis I -Pronostico de Ventas 2

Universidad Tecnológica Del Perú –filial Arequipa Facultad De Ingeniería

Carrera Profesional Ingeniería de Sistemas e Informática

Análisis e implantación de un Sistema de Producción que emplea una

herramienta Data Mining para el pronóstico de producción en la empresa

de calzados “DUKE S.A.C.” Arequipa, 2015

Presentado por:Ventura Mamani Wily

Curso: Seminario de Tesis IDécimo Ciclo

Profesor asesor: Ing. Adin Sánchez Sánchez

Arequipa – Perú2015

1. TÍTULO DE LA INVESTIGACIÓN

DISEÑO E IMPLEMENTACIÓN DE UN SISTEMA DE PRONÓSTICO DE

VENTAS PARA TABLEROS SAC UTILIZANDO REDES NEURONALES

FRENTE A LA EXPERIENCIA DE LOS VENDEDORES AREQUIPA

AÑO-2015.

2. PROBLEMA DE INVESTIGACIÓN

2.1. Descripcion del ProblemaLa prediccion de ventas en la empresas ha sido una de las tareas mas

importantes puesto que las empresas nesecitan conocer los productos

que son mas vendidos o menos vendidos en un determinado tiempo

para evitar exeso o escases de productos, pero hasta ahora muchas de

las empresas llevan este control mediante algunas herramientas o la

experiencia de los vendedores. Se utilizan pronosticos en diferentes

areas de la empresa como ventas, compras, produccion, etc.

Sinembargo un error en la predicción podría dejar a una empresa sin la

materia prima o los insumos suficientes para su produccion o podria

dejarle con un inventario demasiado grande, en cualquier situacion un

pronóstico erroneo disminuye las utilidades de la empresa.

En la actualidad las consecuencias anteriores representan un grave

problema para muchas empresas ya que los pronosticos de ventas se

deben hacer para miles de productos.

2.2. Formulación del problema

“DISEÑO E IMPLEMENTACIÓN DE UN SISTEMA DE

PRONÓSTICO DE VENTAS PARA TABLEROS SAC UTILIZANDO

REDES NEURONALES FRENTE A LA EXPERIENCIA DE LOS

VENDEDORES AREQUIPA AÑO-2015”

2.2.1 Interrogantes de Investigación

Interrogante General:

¿Será factible diseñar e implementar un sistema de

pronóstico de ventas para TABLEROS SAC utilizando

redes neuronales frente a la experiencia de los

vendedores?

Interrogantes Específicas:

¿Cómo son las variables que permiten cuantificadas los

productos para el pronóstico?

¿Cuál es la arquitectura de la red neuronal más apropiada

para el pronóstico de ventas?

¿Cómo es la técnica de redes neuronales en la predicción

de ventas?

¿Cómo es la experiencia de venta de los vendedores en la

predicción de ventas?

¿Qué diferencias existen entre las técnicas que permitan

descubrir la predicción de ventas?

3. Objetivos de la Investigación

3.1. Objetivo general

Diseñar e implementar un sistema de pronóstico de ventas para

TABLEROS SAC utilizando redes neuronales frente a la

experiencia de los vendedores Arequipa año- 2015.

3.2. Objetivos Específicos

Identificar las variables que permiten cuantificadas los productos

para el pronóstico.

Desarrollar la arquitectura de la red neuronal más apropiada para

el pronóstico de ventas.

Aplicar la técnica de redes neuronales para la predicción de

ventas

Determinar la experiencia de venta de los vendedores en la

predicción de ventas.

Comparar las técnicas que permitan descubrir la predicción de

ventas.

4. Justificación y delimitación de la investigación

4.1. Justificación de la investigaciónLa estimación del comportamiento futuro de algunas variables puede

realizarse utilizando diversas técnicas de pronóstico. Cada una de las

técnicas de proyección tiene una aplicación de carácter especial que

hace de su selección un problema de decisión influido por diversos

factores, como por ejemplo, la validez y disponibilidad de los datos

históricos, la precisión deseada del pronóstico, el costo del

procedimiento, los beneficios del resultado, los periodos futuros que se

desee pronosticar y el tiempo disponible para hacer el estudio entre

otros [Sapag Chain, 2010].

Las empresas actualmente no conoce la cantidad exacta y precisa de los

productos para vender en una determinada temporada, generándose en

ocasiones perdidas en la empresa. Muchas empresas cometen errores

pronosticando sus ventas esto podría dejar a la empresa desabastecida

o sobrepasar la materia prima o productos.

Se necesita un buen pronóstico de para optimizar la planeación de

ventas por tal motivo muy importante realizar un estudio para determinar

un acertado pronóstico de ventas para la empresa TABLEROS SAC

utilizando una de las diferentes técnicas que nos ayudan a predecir

furutas ventas, como es la tecnica de Redes Neuronales.

4.2. Delimitación de la investigación

El presente estudio se realizará acerca de la demanda del sector

Comercial de venta de productos de Ferreteria y servicio de cortes

especiales y canteado en Perú, especificamente para una empresa

distribuidora localizada en la ciudad de Arequipa, El pronostico se llevará

a cabo para la linea de productos de Ferreteria.

La empresa en la que se desarrolla el estudio y las pruebas es

TABLEROS SAC, en un tiempo determinado de Abril a Diciembre del

Año 2015.

2. Marco Teórico

2.1. Redes Neuronales Artificiales

2.1.1. Introducción

Si tuviéramos que definir la principal característica que nos separa del resto de

animales seguramente, la gran mayoría de nosotros, responderíamos la

capacidad de raciocinio. Esta capacidad nos ha permitido desarrollar una

tecnología propia de tal manera que, en estos momentos, esta tecnología se

orienta a descubrir su origen. ¿Cómo funciona el cerebro? ¿Se pueden

construir modelos artificiales que lo emulen? ¿Se pueden desarrollar máquinas

inteligentes? Todas estas preguntas han conducido a un rápido desarrollo de

un campo multidisciplinar del conocimiento conocido como Inteligencia Artificial

(I.A.). Este campo se podría dividir en dos clases que podríamos definir como

“macroscópico” y microscópico”.

En el primero de ellos se intenta modelizar el funcionamiento del cerebro en

base a reglas del tipo “si ocurre esto entonces...”, el nombre de macroscópico

se debe a que no se toma en cuenta en ningún momento la estructura interna

del cerebro sino que modeliza su comportamiento en base a un funcionamiento

que podríamos definir como global. En la segunda aproximación se parte de la

estructura que presenta el cerebro de tal forma que se construyen modelos que

tienen en cuenta dicha estructura. De esta forma aparecen “neuronas

artificiales” que se combinan entre sí para formar “estructuras multicapas” que,

a su vez, pueden combinarse para formar “comités de expertos”, etc. Esta

forma de combinación recuerda la estructura en niveles del cerebro. Esta

aproximación de la I.A conocida como redes neuronales ha sufrido, en los

últimos años, un incremento espectacular en publicaciones, aplicaciones

comerciales, número de congresos celebrados, etc.

2.1.2. REDES NEURONALES

Las redes neuronales artificiales (RN) son sistemas paralelos para el

procesamiento de la información, inspirados en el modo en el que las redes de

neuronas biológicas del cerebro procesan información.

2.1.3. VENTAJAS DE LAS REDES NEURONALES

Acabamos de ver el desarrollo histórico de los sistemas conexionistas; se ha

comprobado que, es una ciencia multidisciplinar donde ingenieros, psicólogos,

médicos, matemáticos y físicos teóricos han aportado algún elemento a estas

teorías, pero, ¿por qué ese interés en estos sistemas? ¿qué tienen en especial

frente a otros que podríamos denominar clásicos? en definitiva ¿qué cosas

nuevas nos ofrecen?

Al principio de este capítulo se ha comentado que la potencia computacional de

una red neuronal deriva, principalmente, de su estructura de cálculo distribuido

paralelo. Esta estructura le permite la resolución de problemas que necesitarían

gran cantidad de tiempo en ordenadores “clásicos”. Pero aparte de este hecho

aparecen otras propiedades que las hacen especialmente atractivas para ser

usadas en una gran cantidad de problemas prácticos:

a) Son sistemas distribuidos no lineales: Una neurona es un elemento no

lineal por lo que una interconexión de ellas (red neuronal) también será

un dispositivo no lineal. Esta propiedad permitirá la simulación de

sistemas no lineales y caóticos, simulación que, con los sistemas

clásicos lineales, no se puede realizar.

b) Son sistemas tolerantes a fallos Una red neuronal, al ser un sistema

distribuido, permite el fallo de algunos elementos individuales (neuronas)

sin alterar significativamente la respuesta total del sistema. Este hecho

las hace especialmente atractivas frente a los computadoras actuales

que, por lo general, son sistemas secuenciales de tal forma que un fallo

en uno de sus componentes conlleva que el sistema total no funcione.

c) Adaptabilidad: Una red neuronal tiene la capacidad de modificar los

parámetros de los que depende su funcionamiento de acuerdo con los

cambios que se produzcan en su entorno de trabajo (cambios en las

entradas, presencia de ruido, etc...). Con respecto a la capacidad de

adaptación hay que tener en cuenta que ésta no puede ser tampoco

excesivamente grande ya que conduciría a tener un sistema inestable

respondiendo a pequeñas perturbaciones. Este es el problema conocido

como el dilema plasticidad-estabilidad.

e) Establecen relaciones no lineales entre datos. Las redes neuronales

son capaces de relacionar dos conjuntos de datos mediante relaciones

complejas.

f) Posibilidad de implementación en VLSI: Esta posibilidad permite que

estos sistemas puedan ser aplicados en sistemas de tiempo real,

simulando sistemas biológicos mediante elementos de silicio.

Todas estas ventajas hacen el uso de las redes neuronales especialmente

atractivo en un gran número de aplicaciones. Sin embargo antes de enunciar

algunas (¡no todas!) de estas aplicaciones pasaremos a describir los diferentes

modelos que nos podemos encontrar.

En el campo de las redes neuronales se conoce con el nombre de arquitectura

la forma en la que se unen los diferentes elementos, neuronas, mediante una

serie de conexiones, pesos sinápticos. En principio podemos distinguir tres

niveles, en cuanto a arquitectura se refiere, que los podemos definir como:

Microestructura: Este nivel hace referencia al elemento más pequeño: la

neurona. Este es el nivel más pequeño pero no por ello es el menos

importante; aquí se fijan características tan importantes como la función

de activación que se explicará a continuación.

Mesoestructura: Una vez sobrepasado el nivel neuronal llegamos a este

nivel donde se fija la forma de conexión y la disposición de los

elementos explicados anteriormente.

Macroestructura: Las diferentes redes planteadas en el nivel anterior se

pueden combinar entre sí para dar estructuras mayores alcanzándose

mejores prestaciones.

Veamos más detenidamente todos estos niveles.

2.1.4. ARQUITECTURAS NEURONALES

Los elementos básicos comentados anteriormente se pueden conectar entre sí

para dar lugar a las estructuras neuronales o modelos conexionistas que

podríamos clasificar de diferentes formas según el criterio usado. Así se

tendría:

2.1.4.1Según el número de capas

Redes neuronales monocapas Se corresponde con la red neuronal más

sencilla ya que se tiene una capa de neuronas que proyectan las

entradas a una capa de neuronas de salida donde se realizan diferentes

cálculos. La capa de entrada, por no realizar ningún cálculo, no se

cuenta de ahí el nombre de redes neuronales con una sola capa. Una

aplicación típica de este tipo de redes es como memorias asociativas.

Redes neuronales multicapa Es una generalización de la anterior

existiendo un conjunto de capas intermedias entre la entrada y la salida

(capas ocultas). Este tipo de red puede estar total o parcialmente

conectada.

2.1.4.2. Según el tipo de conexiones

Redes neuronales no recurrentes. En esta red la propagación de las señales se

produce en un sentido solamente, no existiendo la posibilidad de

realimentaciones.

Lógicamente estas estructuras no tienen memoria.

Redes neuronales recurrentes. Esta red viene caracterizada por la existencia

de lazos de realimentación. Estos lazos pueden ser entre neuronas de

diferentes capas, neuronas de la misma capa o, más sencillamente, entre una

misma neurona. Esta estructura recurrente la hace especialmente adecuada

para estudiar la dinámica de sistemas no lineales. La siguiente figura

representa el esquema de una red recurrente.

2.1.4.3. Según el grado de conexión

Redes neuronales totalmente conectadas. En este caso todas las

neuronas de una capa se encuentran conectadas con las de la capa

siguiente (redes no recurrentes) o con las de la anterior (redes

recurrentes).

Redes parcialmente conectadas. En este caso no se da la conexión total

entre neuronas de diferentes capas.

Estas estructuras neuronales se podrían conectar entre sí para dar lugar a

estructuras mayores: estamos en el nivel de la mesoestructura. Esta conexión

se puede llevar a cabo de diferentes formas siendo las más usuales las

estructuras en paralelo y jerárquicas.

En la primera estructura se plantea un “consenso” entre las diferentes redes

para obtener la salida mientras que en la estructura jerárquica existen redes

subordinadas a otras que actúan como elementos centrales en la salida final de

la red.

2.1.5. Parámetros de la red

Según [Pino02] se consideran ciertos parámetros para la elaboración de la red.

A continuación, se mencionan las más importantes:

Topología de la red. La topología de la red considera la cantidad y

definición de las variables de entrada y salida del sistema a desarrollar,

así como el modelo de red a utilizar, los más comunes son el perceptrón

multicapa, los mapas kohonen, etc., así mismo se define la cantidad de

neuronas y las funciones de activación en cada capa de la red neuronal.

A continuación, se mencionan los parámetros necesarios para la red.

Wij: Peso correspondiente de las neurona i hacia la neurona j

Wjk: Peso correspondiente de las neurona j hacia la neurona k

N: Número de neuronas en la capa de entrada

O: Número de neuronas en la capa oculta

Y: Número de neuronas en la capa de salida

Algoritmo de aprendizaje. Los algoritmos más comunes utilizados en el

desarrollo de las redes neuronales son el backpropagation y todas sus

variantes.

El algoritmo presenta dos fases que son las siguientes:

- Fase de Aprendizaje o Entrenamiento

- Fase de Recuerdo

La idea es actualizar los pesos de la capa escondida por lo cual se

retropropaga el error hacia las capa intermedia.

2.2. Red Backpropagation

2.2.1. Introducción

Durante muchos años no se obtuvo ningún tipo de éxito en el diseño de

algoritmos de entrenamiento de redes multicapa. A partir de la comprobación

de la severa limitación de los sistemas de una capa, el mundo de la

computación neuronal entró en un obscurecimiento y abandono casi general

durante dos décadas.

La invención del algoritmo Backpropagation ha desempeñado un papel vital en

el resurgimiento del interés de las redes neuronales artificiales.

Backpropagation es un método de entrenamiento de redes multicapa. Su

potencia reside en su capacidad de entrenar capas ocultas y de este modo

supera las posibilidades restringidas de las redes de una única capa.

El concepto básico de Backpropagation fue presentado en 1974 por Paul

Werbos e independientemente reinventado por David Parker en 1982, y

también presentado en 1986 por Rumelhart, Hinton y Willians. La duplicidad de

esfuerzos y trabajos es frecuente en cualquier disciplina, y más en el mundo de

las ANN debido a su naturaleza interdisciplinaria.

2.2.2. Arquitectura de la Red Backpropagation

Las entradas se muestran a la izquierda, y a la derecha se encuentran

unidades que reciben la salida de la unidad procesadora situada en el centro

de la figura.

La unidad procesadora se caracteriza por realizar una suma ponderada de las

entradas llamada Sj, presentar una salida aj y tener un valor δj asociado que se

utilizará en el proceso de ajuste de los pesos. El peso asociado a la conexión

desde la unidad i a la unidad j se representa por wji, y es modificado durante el

proceso de aprendizaje.

Unidad Procesadora Básica Backpropagation.

Normalmente, la Backpropagation utiliza tres o más capas de unidades

procesadoras. La Figura (5.2) muestra la topología backpropagation típica de

tres capas. La capa inferior es la capa de entrada, y se caracteriza por ser la

única capa cuyas unidades procesadoras reciben entradas desde el exterior.

Sirven como puntos distribuidores, no realizan ninguna operación de cálculo.

Las unidades procesadoras de las demás capas procesan las señales como se

indica en la figura. La siguiente capa superior es la capa oculta, y todas sus

unidades procesadoras están interconectadas con la capa inferior y con la capa

superior. La capa superior es la capa de salida que presenta la respuesta de la

red.

Red Backpropagation completamente interconectada.

2.2.3. Algoritmo de Entrenamiento

Las redes Backpropagation tienen un método de entrenamiento supervisado. A

la red se le presenta parejas de patrones, un patrón de entrada emparejado

con un patrón de salida deseada. Por cada presentación los pesos son

ajustados de forma que disminuya el error entre la salida deseada y la

respuesta de la red.

El algoritmo de aprendizaje backpropagation conlleva una fase de propagación

hacia adelante y otra fase de propagación hacia atrás. Ambas fases se realizan

por cada patrón presentado en la sesión de entrenamiento.

2.2.4. Propagación hacia Adelante.

Esta fase de propagación hacia adelante se inicia cuando se presenta un

patrón en la capa de entrada de la red. Cada unidad de la entrada se

corresponde con un elemento del vector patrón de entrada. Las unidades de

entrada toman el valor de su correspondiente elemento del patrón de entrada y

se calcula el valor de activación o nivel de salida de la primera capa. A

continuación las demás capas realizarán la fase de propagación hacia adelante

que determina el nivel de activación de las otras capas.

La unidad procesadora j obtiene la cantidad Sj según la ecuación (5.1)

Sj = Σi ai wji ec.(5.1)

y genera la salida o nivel de activación según la ecuación (5.2)

Salida = f(Sj) ec.(5.2)

La función f es una función umbral genérica, entre las que cabe destacar la

función Sigmoid y la función Hiperbólica.

El valor de la salida de la unidad j es enviado o transmitido a lo largo de todas

las conexiones de salida de dicha unidad.

La Figura muestra la fase de propagación hacia adelante.

Fase de Propagación hacia Adelante.

Conviene indicar que las unidades procesadoras de la capa de entrada no

realizan ninguna operación de cálculo con sus entradas, ni operaciones con

funciones umbrales, sólo asumen su salida como el valor del correspondiente

elemento del vector de entrada.

Por otro lado, algunas redes backpropagation utilizan unidades llamadas bias

como parte de cualquiera de las capas ocultas y de la capa de salida. Estas

unidades presentan constantemente un nivel de activación de valor 1. Además

esta unidad está conectada a todas las unidades de la capa inmediatamente

superior y los pesos asociados a dichas conexiones son ajustables en el

proceso de entrenamiento. La utilización de esta unidad tiene un doble objetivo,

mejorar las propiedades de convergencia de la red y ofrecer un nuevo efecto

umbral sobre la unidad que opera.

2.2.5. Propagación hacia Atrás.

Una vez se ha completado la fase de propagación hacia adelante se inicia la

fase de corrección o fase de propagación hacia atrás. Los cálculos de las

modificaciones de todos los pesos de las conexiones empiezan por la capa de

salida y continua hacia atrás a través de todas las capas de la red hasta la

capa de entrada. Dentro de los tipos de ajuste de pesos se puede clasificar dos

grupos, ajuste de unidades procesadoras de la capa de salida y ajuste de

unidades procesadoras de las capas ocultas.

Ajuste de Pesos de la Capa de Salida: el ajuste de estos pesos es

relativamente sencillo debido a que existe y se conoce el valor deseado para

cada una de las unidades de la capa de salida. Cada unidad de la capa de

salida produce un número real como salida y se compara con el valor deseado

especificado en el patrón del conjunto de entrenamiento.

A partir del resultado de la comparación se calcula un valor de error δj, según la

ecuación (5.3) para cada unidad de la capa de salida.

δj = (tj _ aj) f_(Sj) ec.(5.3)

siendo tj el valor de salida deseado y f_ la derivada de la función umbral f

La Figura muestra el cálculo de los valores δj de las unidades de la capa de

salida.

Cálculo de los valores δj de la Capa de Salida.

Ajuste de Pesos de las Capas Ocultas: estas capas no tienen un vector de

salidas deseadas y por tanto no se puede seguir el método de propagación de

error mencionado en el caso de unidades procesadoras de la capa de salida. El

valor de error calculado para este tipo de unidades procesadoras se obtiene a

partir de la ecuación (5.4).

δj = [Σkδk wkj] f_(Sj) ec.(5.4)

La Figura representa la obtención del valor δj para las unidades de las capas

ocultas.

Cálculo de los valores δj de las Capas Ocultas.

El ajuste de los pesos asociados a las conexiones se realiza a partir del valor ?

de cada unidad de proceso. Cada peso es ajustado según la ecuación (5.5)

conocida como la regla ? generalizada (Rumelhart y McClelland 1986)

Δwji = η δj ai ec.(5.5)

La variable η es el coeficiente de aprendizaje. Este coeficiente, normalmente

entre 0.25 y 0.75 refleja el grado de aprendizaje de la red. Algunas veces este

coeficiente es modificado de un valor inicial alto a valores progresivamente

menores durante la sesión del entrenamiento con el objetivo de lograr un mejor

aprendizaje.

Convergencia: en el proceso de entrenamiento o aprendizaje de la

Backpropagation es frecuente medir cuantitativamente el aprendizaje mediante

el valor RMS (Root Mean Square) del error de la red. Esta medida refleja el

modo en el que la red está logrando respuestas correctas; a medida que la red

aprende, su valor RMS decrece.

Debido a que los valores de salida de la red y los valores de salidas deseadas

son valores reales, es necesario definir un parámetro de corte o un valor

umbral del valor RMS del error de la red que permita decir que la red se

aproxima a la salida deseada y considerar que la respuesta es correcta.

La convergencia es un proceso en el que el valor RMS del error de la red

tiende cada vez más al valor 0. La convergencia no siempre es fácil de

conseguirla porque a veces el proceso puede requerir un tiempo excesivo o

bien porque la red alcanza un mínimo local y deja de aprender.

2.2.6. VENTAJAS E INCONVENIENTES

La principal ventaja de la Backpropagation es su capacidad genérica de mapeo

de patrones. La red es capaz de aprender una gran variedad de relaciones de

mapeo de patrones. No requiere un conocimiento matemático de la función que

relaciona los patrones de la entrada y los patrones de salida. La

Backpropagation sólo necesita ejemplos de mapeo para aprender. La

flexibilidad de esta red es aumentada con la posibilidad de elegir número de

capas, interconexiones, unidades procesadoras, constante de aprendizaje y

representación de datos. Como resultado de estas características la red

Backpropagation es capaz de participar con éxito en una amplia gama de

aplicaciones.

El mayor inconveniente es el tiempo de convergencia. Las aplicaciones reales

pueden llegar a tener miles de ejemplos en el conjunto de entrenamiento y ello

requiere días de tiempo de cálculo. Además la backpropagation es susceptible

de fallar en el entrenamiento, es decir, la red puede que nunca llegue a

converger.

Existe una variedad de técnicas desarrolladas para disminuir el tiempo de

convergencia y evitar los mínimos locales. El término de "momentum" se utiliza

para aumentar la velocidad del proceso de convergencia. Otra forma de

mejorar la convergencia se basa en la variación del parámetro de aprendizaje η

comenzando con valores altos y adquiriendo progresivamente valores más

pequeños. Entre las técnicas utilizadas para evitar los mínimos locales

destacan cambiar la red, cambiar el conjunto de entrenamiento y añadir ruido

aleatorio a los pesos.

2.3 Antecedentes

Título: Sistema de pronóstico de la demanda de productos farmacéuticos

basado en redes neuronales

Autores: Eybi Gil Zavaleta, Enith Rodríguez Collas

Año: 2010

Procedencia: Universidad Nacional Mayor de San Marcos Lima-Perú

Resumen: La supervivencia en los negocios altamente competitivos de hoy

requiere una visión precisa de la demanda para poner en marcha los planes de

producción, inventario, distribución y compra dentro de las empresas; el sector

farmacéutico no es la excepción, pues los efectos de las temporadas,

promociones, cambios de precios, publicidad, productos con bajo o alto nivel de

movimiento y datos atípicos en general afectan en la determinación de la

misma. En este contexto, pronosticar por arriba de la demanda tiene entre sus

consecuencias el excesivo inventario de fármacos, obsolescencia o caducidad,

y por otro lado, pronosticar por debajo de la demanda tiene como consecuencia

la pérdida de las ventas y un posible incremento en los costos. Por lo

mencionado, el tema se centra en el desarrollo de un sistema que usa las

técnicas de redes neuronales artificiales para el pronóstico de la demanda de

productos.

En este trabajo se propone el uso de una red neuronal (Perceptrón multicapa)

para el pronóstico de la demanda de productos farmacéuticos, la cual realizará

su fase de aprendizaje con el algoritmo backpropagation que brinda una taza

de error de 3.57% en el mejor caso encontrado; su implementación se

desarrollará bajo la tecnología de MATLAB para la construcción de la red

neuronal y del lenguaje JAVA para el diseño de la interfaz gráfica de usuario.

Título: Pronósticos en el mercado de derivados utilizando redes neuronales y

modelos ARIMA una aplicación al Cete de 91 días en el MexDer.

Autor: Iván Cruz Torres

Año: 2008

Procedencia: Universidad Nacional Autónoma de México

Resumen: El objetivo de esta tesis es proponer un modelo que permita

pronosticar la tendencia de la serie del futuro del Cete de 91 días en el MexDer

con vencimiento en diciembre de 2008, aplicando redes neuronales y series de

tiempo, y comparar los pronósticos obtenidos de esta forma con los que se

obtendría con un modelo ARIMA tradicional, con el fin de conocer que modelo

ajusta mejor los datos dentro de muestra y que modelo pronostica mejor los

datos fuera de muestra.

La principal aportación es demostrar que el modelo propuesto basado en redes

neuronales es capaz de obtener buenas aproximaciones tanto en el ajuste

como en el pronóstico, además de observar que, en este caso en particular, la

aproximación resulta mejor que la generada por medio de la metodología

ARIMA. Así también, la tesis contiene una propuesta metodológica para la

aplicación de las redes neuronales a las series de tiempo financieras.

Este trabajo se divide en dos partes: Parte I, Marco teórico. Series de tiempo y

redes neuronales, en donde se establecen las bases teóricas para el desarrollo

de la tesis. Parte II. Desarrollo y aplicación del modelo propuesto y,

comparación con la metodología ARIMA, en la cual se muestran las hipótesis

de la investigación, su desarrollo y los resultados obtenidos, a partir de los

cuales se presentan las conclusiones y algunas propuestas para futuras

investigaciones.

Título: Predicción del consumo de éxtasis a partir de redes neuronales

artificiales

Autor: Alfonso Palmer Pol

Procedencia: Universidad de las Islas Baleares España

Resumen: El propósito del presente estudio fue mostrar cómo una red neuronal

artificial (RNA) puede ser útil para predecir el consumo de éxtasis (MDMA).

Más específicamente, se trata de desarrollar una red neuronal del tipo

backpropagation capaz de discriminar entre quién consume éxtasis y quién no,

a partir de las respuestas dadas por los sujetos a un cuestionario. La muestra

estaba compuesta por 148 consumidores y 148 no consumidores de éxtasis.

Se explican las diferentes fases llevadas a cabo para desarrollar la RNA:

selección de las variables relevantes y preprocesamiento de los datos, división

de la muestra en grupo de entreno, validación y test, entreno y evaluación del

modelo de red, y análisis de sensibilidad. La eficacia de la RNA entrenada fue

del 96.66%. El área bajo la curva ROC (Receiver operating characteristic) fue

de 0.99440.0055 SE. Por otra parte, se pretende mostrar que las RNA no

representan una “caja negra”, sino que pueden dar información acerca del

grado de influencia que tiene cada variable predictora sobre el consumo de

éxtasis.

Título: Comparación de predicción basada en redes neuronales contra métodos

estadísticos en el pronóstico de ventas

Autores: Edgar Augusto Ruelas Santoyo y José Antonio Laguna González

Año: 2013

Procedencia: México

Resumen: La intención del presente artículo es realizar la comparación y

selección de un método para pronosticar las ventas de forma eficiente y que

beneficie a organizaciones que ofrecen sus productos al mercado ya que los

pronósticos de ventas son datos de entrada a diferentes áreas de la empresa y

de ser imprecisos pueden generar gastos para la organización. El caso de

estudio en este artículo fue llevado a cabo dentro de la empresa Productos

Frugo S.A. de C.V., dedicada a la comercialización de productos alimenticios.

Los métodos y metodologías utilizados y posteriormente comparados al

pronosticar las ventas de la empresa antes mencionada son: Método de Hold,

Winters, la metodología Box Jenkins (ARIMA) y una Red Neuronal Artificial. Los

resultados muestran que la red neuronal artificial obtuvo un mejor desempeño

logrando el menor error cuadrático medio, de esta forma es posible establecer

un panorama adecuado para el uso de la inteligencia artificial dentro de la

industria.

Título: Evaluación de pronósticos del tipo de cambio utilizando redes

neuronales y funciones de pérdida asimétricas

Autores: Munir Andres Jalil y Martha Misas

Año: 2007

Procedencia: Universidad Nacional de Colombia

Resumen: Se comparan especificaciones lineales y no lineales (estas últimas

expresadas en redes neuronales artificiales) ajustadas a la variación porcentual

diaria del tipo de cambio utilizando para ello funciones de costo tradicionales

(simétricas) y funciones de pérdida asimétricas. Los resultados muestran que

las redes neuronales permiten obtener mejores pronósticos con ambos tipos de

funciones de costos. Sin embargo, es de anotar que cuando se evalúan los

pronósticos con funciones asimétricas, el modelo no lineal supera ampliamente

a su contraparte lineal.

Título: Metodología para calcular el Pronóstico de Ventas y una medición de su

precisión en una Empresa Farmacéutica: Caso de Estudio

Autor: GABRIELA GARDUÑO GARCÍA

Año: 2011

Procedencia Instituto Politécnico Nacional México

Resumen: En el presente trabajo se propone una metodología para el cálculo

del Pronóstico de Ventas de una empresa de Sector Farmacéutico que

contribuya a disminuir el abastecimiento excesivo que generalmente existe en

la compañía y con esto minimizar los costos, como el de almacenamiento de

productos terminados y materiales. Para lo cual, se evaluaron y compararon

diferentes métodos cuantitativos de pronósticos, resultando ser el Método

Winters el que mejor precisión ofrece para el cálculo del pronóstico de ventas

de la empresa de estudio.

La metodología propuesta tiene la particularidad de aplicarse a problemas de

pronósticos en industrias farmacéuticas en donde la base de datos no está

constituida de una cantidad considerable de observaciones para poder aplicar

otras técnicas de series de tiempo como los modelos ARIMA. En el trabajo se

presenta una técnica para realizar recorridos de evaluación en los parámetros

del método de Winters, de tal forma que en lugar de realizar una sola

evacuación como lo hacen los paquetes estadísticos, se genera un recorrido de

100,000 generaciones de los parámetros distribuidas en un hipercubo

(hypercube). En cada terna se emplea el método de Winters y al final se elige

la terna que da menor medida de dispersión entre los valores pronosticados y

los valores reales.

Además, el modelo propuesto permite calcular el riesgo que existe en

situaciones extremas de ventas con la finalidad de fortalecer el análisis y

evaluación de los pronósticos obtenidos a través de la metodología propuesta

como apoyo para la toma de decisiones de la organización.

2.2.4. Hipótesis

El diseño e implementación de un sistema que utilice la técnica de redes

neuronales artificiales es posible obtener un pronóstico de ventas más

aceptado comparado con la experiencia de los vendedores.

Variable Dependiente

Pronostico de ventas Indicadores

Ajuste de la cantidad de productos

Cantidad de Bienes o Servicios

Compradores o Consumidores

Disposición a adquirir el producto o servicio

Capacidad de pago

Precio dado

Variable Independiente

Redes Neuronales Indicadores

Peso correspondiente de las neuronas

Número de neuronas en la capa de entrada

Número de neuronas en la capa oculta

Número de neuronas en la capa de salida

Diagrama de Flujo:

Proceso del Area de Ventas

Flujo de Procesos del Proyecto

2.2.5. Estudio de Factibilidad

2.2.5.1. Factibilidad Técnica

Requerimiento de Software

Windows 8.1

Office 2010 (Word, Excel)

Antivirus NOD 32

Netbeans 8.0

Matlab 9.0

Requerimiento de Hardware

Motherboard GIGABITE S2H DDR3 VD/SN/NW Micro-ATX

Procesador Intel Core I5- 3.06 GHz, 4MB Total Intel Smart Cache,

LGA1156, 32nm.

Memoria KINGTON 4 GB DDR3-1333MHz PC 3-10600 Exp. A 16

GB

Disco Duro de 1TB (7200 RPM) s-Ata. SEAGATE

Grabador de DVD 24X RE-Writer Negro Dual layer-LG

Lector de Memorias 5 en 1

Mouse óptico de dos botones y scroll GENIUS

Teclado en Español Multimedia

Monitor LED 18.5” LG o SAMSUNG

Tarjeta de Video Pci Express Integrado

Tarjeta de sonido incorporado de 8 canales

Tarjeta de Red 10/100/1000 Incorporada

Estabilizador de 100W

Case ATX- Doble tobera BOOMER

Requerimiento de Personal

Jefe de Proyecto

Analista

Diseñador

Programador

2.2.5.2. Factibilidad Operativa

Configuración de nuevas Redes

Configuración de los parámetros solicitados por la red

Configuración de los pesos de la red

Entrenar nuevas Redes

Pronosticar la venta de los productos por temporada

2.2.5.3. Factibilidad Económica

COSTOS DE MATERIAL DE OFICINA Y PAPELERIA

GASTOS GENERALES COSTO (S/. )

Material de oficina 50.00

Papel 30.00

Tóner de impresora 120.00

TOTAL 200.00

COSTOS DE PERSONAL

RECURSOS HUMANOS COSTO (S/. ) 5 Meses

Jefe de Proyecto es el

Programador2000.00

Diseñador 1500.00

Analista 1500.00

TOTAL 5000.00

COSTOS DE HARDWARE Y SOFTWARE

HARDWARE COSTO (S/. )

Computadora Personal 1590.60

SOFTWARE

Sistema operativo

Windows 8.1

500.00

Office 2010 313.97

Nod 32 44.62

Matlab 10.0 280.35

Netbeans Java 0.00

TOTAL 2729.54

TOTAL GENERAL 7929.54

2.2.5.4. Análisis Costo Beneficio

Beneficios Tangibles:

Espacios de Almacenes Disponibles S/. 1200.00

Productos necesarios y disponibles para las ventas S/. 500.00

Reducción de tiempo en el pronóstico S/. 200.00

TOTAL S/. 1900.00

Beneficios Intangibles:

Hacer un óptimo uso de los espacios disponibles en el área de

almacén, reduciendo espacios ocupados innecesarios.

1º - 8º mes 9ºmes 10ºmes 11ºmes 12ºmes 13º mes

Costo

S/. 7929.54

Beneficios

(S/.)

1900.

00 1900.00 1900.00 1900.00 1900.00

Costo/Beneficio

(S/.)

6029.

54 4129.54 2229.54 329.54 -1570.46

Conocimiento de los productos pronosticados en el tiempo.

2.2.5.5. Costo/Beneficio.