Tesis I -Pronostico de Ventas 2
-
Upload
wily-ventura -
Category
Documents
-
view
28 -
download
3
description
Transcript of Tesis I -Pronostico de Ventas 2
Universidad Tecnológica Del Perú –filial Arequipa Facultad De Ingeniería
Carrera Profesional Ingeniería de Sistemas e Informática
Análisis e implantación de un Sistema de Producción que emplea una
herramienta Data Mining para el pronóstico de producción en la empresa
de calzados “DUKE S.A.C.” Arequipa, 2015
Presentado por:Ventura Mamani Wily
Curso: Seminario de Tesis IDécimo Ciclo
Profesor asesor: Ing. Adin Sánchez Sánchez
Arequipa – Perú2015
1. TÍTULO DE LA INVESTIGACIÓN
DISEÑO E IMPLEMENTACIÓN DE UN SISTEMA DE PRONÓSTICO DE
VENTAS PARA TABLEROS SAC UTILIZANDO REDES NEURONALES
FRENTE A LA EXPERIENCIA DE LOS VENDEDORES AREQUIPA
AÑO-2015.
2. PROBLEMA DE INVESTIGACIÓN
2.1. Descripcion del ProblemaLa prediccion de ventas en la empresas ha sido una de las tareas mas
importantes puesto que las empresas nesecitan conocer los productos
que son mas vendidos o menos vendidos en un determinado tiempo
para evitar exeso o escases de productos, pero hasta ahora muchas de
las empresas llevan este control mediante algunas herramientas o la
experiencia de los vendedores. Se utilizan pronosticos en diferentes
areas de la empresa como ventas, compras, produccion, etc.
Sinembargo un error en la predicción podría dejar a una empresa sin la
materia prima o los insumos suficientes para su produccion o podria
dejarle con un inventario demasiado grande, en cualquier situacion un
pronóstico erroneo disminuye las utilidades de la empresa.
En la actualidad las consecuencias anteriores representan un grave
problema para muchas empresas ya que los pronosticos de ventas se
deben hacer para miles de productos.
2.2. Formulación del problema
“DISEÑO E IMPLEMENTACIÓN DE UN SISTEMA DE
PRONÓSTICO DE VENTAS PARA TABLEROS SAC UTILIZANDO
REDES NEURONALES FRENTE A LA EXPERIENCIA DE LOS
VENDEDORES AREQUIPA AÑO-2015”
2.2.1 Interrogantes de Investigación
Interrogante General:
¿Será factible diseñar e implementar un sistema de
pronóstico de ventas para TABLEROS SAC utilizando
redes neuronales frente a la experiencia de los
vendedores?
Interrogantes Específicas:
¿Cómo son las variables que permiten cuantificadas los
productos para el pronóstico?
¿Cuál es la arquitectura de la red neuronal más apropiada
para el pronóstico de ventas?
¿Cómo es la técnica de redes neuronales en la predicción
de ventas?
¿Cómo es la experiencia de venta de los vendedores en la
predicción de ventas?
¿Qué diferencias existen entre las técnicas que permitan
descubrir la predicción de ventas?
3. Objetivos de la Investigación
3.1. Objetivo general
Diseñar e implementar un sistema de pronóstico de ventas para
TABLEROS SAC utilizando redes neuronales frente a la
experiencia de los vendedores Arequipa año- 2015.
3.2. Objetivos Específicos
Identificar las variables que permiten cuantificadas los productos
para el pronóstico.
Desarrollar la arquitectura de la red neuronal más apropiada para
el pronóstico de ventas.
Aplicar la técnica de redes neuronales para la predicción de
ventas
Determinar la experiencia de venta de los vendedores en la
predicción de ventas.
Comparar las técnicas que permitan descubrir la predicción de
ventas.
4. Justificación y delimitación de la investigación
4.1. Justificación de la investigaciónLa estimación del comportamiento futuro de algunas variables puede
realizarse utilizando diversas técnicas de pronóstico. Cada una de las
técnicas de proyección tiene una aplicación de carácter especial que
hace de su selección un problema de decisión influido por diversos
factores, como por ejemplo, la validez y disponibilidad de los datos
históricos, la precisión deseada del pronóstico, el costo del
procedimiento, los beneficios del resultado, los periodos futuros que se
desee pronosticar y el tiempo disponible para hacer el estudio entre
otros [Sapag Chain, 2010].
Las empresas actualmente no conoce la cantidad exacta y precisa de los
productos para vender en una determinada temporada, generándose en
ocasiones perdidas en la empresa. Muchas empresas cometen errores
pronosticando sus ventas esto podría dejar a la empresa desabastecida
o sobrepasar la materia prima o productos.
Se necesita un buen pronóstico de para optimizar la planeación de
ventas por tal motivo muy importante realizar un estudio para determinar
un acertado pronóstico de ventas para la empresa TABLEROS SAC
utilizando una de las diferentes técnicas que nos ayudan a predecir
furutas ventas, como es la tecnica de Redes Neuronales.
4.2. Delimitación de la investigación
El presente estudio se realizará acerca de la demanda del sector
Comercial de venta de productos de Ferreteria y servicio de cortes
especiales y canteado en Perú, especificamente para una empresa
distribuidora localizada en la ciudad de Arequipa, El pronostico se llevará
a cabo para la linea de productos de Ferreteria.
La empresa en la que se desarrolla el estudio y las pruebas es
TABLEROS SAC, en un tiempo determinado de Abril a Diciembre del
Año 2015.
2. Marco Teórico
2.1. Redes Neuronales Artificiales
2.1.1. Introducción
Si tuviéramos que definir la principal característica que nos separa del resto de
animales seguramente, la gran mayoría de nosotros, responderíamos la
capacidad de raciocinio. Esta capacidad nos ha permitido desarrollar una
tecnología propia de tal manera que, en estos momentos, esta tecnología se
orienta a descubrir su origen. ¿Cómo funciona el cerebro? ¿Se pueden
construir modelos artificiales que lo emulen? ¿Se pueden desarrollar máquinas
inteligentes? Todas estas preguntas han conducido a un rápido desarrollo de
un campo multidisciplinar del conocimiento conocido como Inteligencia Artificial
(I.A.). Este campo se podría dividir en dos clases que podríamos definir como
“macroscópico” y microscópico”.
En el primero de ellos se intenta modelizar el funcionamiento del cerebro en
base a reglas del tipo “si ocurre esto entonces...”, el nombre de macroscópico
se debe a que no se toma en cuenta en ningún momento la estructura interna
del cerebro sino que modeliza su comportamiento en base a un funcionamiento
que podríamos definir como global. En la segunda aproximación se parte de la
estructura que presenta el cerebro de tal forma que se construyen modelos que
tienen en cuenta dicha estructura. De esta forma aparecen “neuronas
artificiales” que se combinan entre sí para formar “estructuras multicapas” que,
a su vez, pueden combinarse para formar “comités de expertos”, etc. Esta
forma de combinación recuerda la estructura en niveles del cerebro. Esta
aproximación de la I.A conocida como redes neuronales ha sufrido, en los
últimos años, un incremento espectacular en publicaciones, aplicaciones
comerciales, número de congresos celebrados, etc.
2.1.2. REDES NEURONALES
Las redes neuronales artificiales (RN) son sistemas paralelos para el
procesamiento de la información, inspirados en el modo en el que las redes de
neuronas biológicas del cerebro procesan información.
2.1.3. VENTAJAS DE LAS REDES NEURONALES
Acabamos de ver el desarrollo histórico de los sistemas conexionistas; se ha
comprobado que, es una ciencia multidisciplinar donde ingenieros, psicólogos,
médicos, matemáticos y físicos teóricos han aportado algún elemento a estas
teorías, pero, ¿por qué ese interés en estos sistemas? ¿qué tienen en especial
frente a otros que podríamos denominar clásicos? en definitiva ¿qué cosas
nuevas nos ofrecen?
Al principio de este capítulo se ha comentado que la potencia computacional de
una red neuronal deriva, principalmente, de su estructura de cálculo distribuido
paralelo. Esta estructura le permite la resolución de problemas que necesitarían
gran cantidad de tiempo en ordenadores “clásicos”. Pero aparte de este hecho
aparecen otras propiedades que las hacen especialmente atractivas para ser
usadas en una gran cantidad de problemas prácticos:
a) Son sistemas distribuidos no lineales: Una neurona es un elemento no
lineal por lo que una interconexión de ellas (red neuronal) también será
un dispositivo no lineal. Esta propiedad permitirá la simulación de
sistemas no lineales y caóticos, simulación que, con los sistemas
clásicos lineales, no se puede realizar.
b) Son sistemas tolerantes a fallos Una red neuronal, al ser un sistema
distribuido, permite el fallo de algunos elementos individuales (neuronas)
sin alterar significativamente la respuesta total del sistema. Este hecho
las hace especialmente atractivas frente a los computadoras actuales
que, por lo general, son sistemas secuenciales de tal forma que un fallo
en uno de sus componentes conlleva que el sistema total no funcione.
c) Adaptabilidad: Una red neuronal tiene la capacidad de modificar los
parámetros de los que depende su funcionamiento de acuerdo con los
cambios que se produzcan en su entorno de trabajo (cambios en las
entradas, presencia de ruido, etc...). Con respecto a la capacidad de
adaptación hay que tener en cuenta que ésta no puede ser tampoco
excesivamente grande ya que conduciría a tener un sistema inestable
respondiendo a pequeñas perturbaciones. Este es el problema conocido
como el dilema plasticidad-estabilidad.
e) Establecen relaciones no lineales entre datos. Las redes neuronales
son capaces de relacionar dos conjuntos de datos mediante relaciones
complejas.
f) Posibilidad de implementación en VLSI: Esta posibilidad permite que
estos sistemas puedan ser aplicados en sistemas de tiempo real,
simulando sistemas biológicos mediante elementos de silicio.
Todas estas ventajas hacen el uso de las redes neuronales especialmente
atractivo en un gran número de aplicaciones. Sin embargo antes de enunciar
algunas (¡no todas!) de estas aplicaciones pasaremos a describir los diferentes
modelos que nos podemos encontrar.
En el campo de las redes neuronales se conoce con el nombre de arquitectura
la forma en la que se unen los diferentes elementos, neuronas, mediante una
serie de conexiones, pesos sinápticos. En principio podemos distinguir tres
niveles, en cuanto a arquitectura se refiere, que los podemos definir como:
Microestructura: Este nivel hace referencia al elemento más pequeño: la
neurona. Este es el nivel más pequeño pero no por ello es el menos
importante; aquí se fijan características tan importantes como la función
de activación que se explicará a continuación.
Mesoestructura: Una vez sobrepasado el nivel neuronal llegamos a este
nivel donde se fija la forma de conexión y la disposición de los
elementos explicados anteriormente.
Macroestructura: Las diferentes redes planteadas en el nivel anterior se
pueden combinar entre sí para dar estructuras mayores alcanzándose
mejores prestaciones.
Veamos más detenidamente todos estos niveles.
2.1.4. ARQUITECTURAS NEURONALES
Los elementos básicos comentados anteriormente se pueden conectar entre sí
para dar lugar a las estructuras neuronales o modelos conexionistas que
podríamos clasificar de diferentes formas según el criterio usado. Así se
tendría:
2.1.4.1Según el número de capas
Redes neuronales monocapas Se corresponde con la red neuronal más
sencilla ya que se tiene una capa de neuronas que proyectan las
entradas a una capa de neuronas de salida donde se realizan diferentes
cálculos. La capa de entrada, por no realizar ningún cálculo, no se
cuenta de ahí el nombre de redes neuronales con una sola capa. Una
aplicación típica de este tipo de redes es como memorias asociativas.
Redes neuronales multicapa Es una generalización de la anterior
existiendo un conjunto de capas intermedias entre la entrada y la salida
(capas ocultas). Este tipo de red puede estar total o parcialmente
conectada.
2.1.4.2. Según el tipo de conexiones
Redes neuronales no recurrentes. En esta red la propagación de las señales se
produce en un sentido solamente, no existiendo la posibilidad de
realimentaciones.
Lógicamente estas estructuras no tienen memoria.
Redes neuronales recurrentes. Esta red viene caracterizada por la existencia
de lazos de realimentación. Estos lazos pueden ser entre neuronas de
diferentes capas, neuronas de la misma capa o, más sencillamente, entre una
misma neurona. Esta estructura recurrente la hace especialmente adecuada
para estudiar la dinámica de sistemas no lineales. La siguiente figura
representa el esquema de una red recurrente.
2.1.4.3. Según el grado de conexión
Redes neuronales totalmente conectadas. En este caso todas las
neuronas de una capa se encuentran conectadas con las de la capa
siguiente (redes no recurrentes) o con las de la anterior (redes
recurrentes).
Redes parcialmente conectadas. En este caso no se da la conexión total
entre neuronas de diferentes capas.
Estas estructuras neuronales se podrían conectar entre sí para dar lugar a
estructuras mayores: estamos en el nivel de la mesoestructura. Esta conexión
se puede llevar a cabo de diferentes formas siendo las más usuales las
estructuras en paralelo y jerárquicas.
En la primera estructura se plantea un “consenso” entre las diferentes redes
para obtener la salida mientras que en la estructura jerárquica existen redes
subordinadas a otras que actúan como elementos centrales en la salida final de
la red.
2.1.5. Parámetros de la red
Según [Pino02] se consideran ciertos parámetros para la elaboración de la red.
A continuación, se mencionan las más importantes:
Topología de la red. La topología de la red considera la cantidad y
definición de las variables de entrada y salida del sistema a desarrollar,
así como el modelo de red a utilizar, los más comunes son el perceptrón
multicapa, los mapas kohonen, etc., así mismo se define la cantidad de
neuronas y las funciones de activación en cada capa de la red neuronal.
A continuación, se mencionan los parámetros necesarios para la red.
Wij: Peso correspondiente de las neurona i hacia la neurona j
Wjk: Peso correspondiente de las neurona j hacia la neurona k
N: Número de neuronas en la capa de entrada
O: Número de neuronas en la capa oculta
Y: Número de neuronas en la capa de salida
Algoritmo de aprendizaje. Los algoritmos más comunes utilizados en el
desarrollo de las redes neuronales son el backpropagation y todas sus
variantes.
El algoritmo presenta dos fases que son las siguientes:
- Fase de Aprendizaje o Entrenamiento
- Fase de Recuerdo
La idea es actualizar los pesos de la capa escondida por lo cual se
retropropaga el error hacia las capa intermedia.
2.2. Red Backpropagation
2.2.1. Introducción
Durante muchos años no se obtuvo ningún tipo de éxito en el diseño de
algoritmos de entrenamiento de redes multicapa. A partir de la comprobación
de la severa limitación de los sistemas de una capa, el mundo de la
computación neuronal entró en un obscurecimiento y abandono casi general
durante dos décadas.
La invención del algoritmo Backpropagation ha desempeñado un papel vital en
el resurgimiento del interés de las redes neuronales artificiales.
Backpropagation es un método de entrenamiento de redes multicapa. Su
potencia reside en su capacidad de entrenar capas ocultas y de este modo
supera las posibilidades restringidas de las redes de una única capa.
El concepto básico de Backpropagation fue presentado en 1974 por Paul
Werbos e independientemente reinventado por David Parker en 1982, y
también presentado en 1986 por Rumelhart, Hinton y Willians. La duplicidad de
esfuerzos y trabajos es frecuente en cualquier disciplina, y más en el mundo de
las ANN debido a su naturaleza interdisciplinaria.
2.2.2. Arquitectura de la Red Backpropagation
Las entradas se muestran a la izquierda, y a la derecha se encuentran
unidades que reciben la salida de la unidad procesadora situada en el centro
de la figura.
La unidad procesadora se caracteriza por realizar una suma ponderada de las
entradas llamada Sj, presentar una salida aj y tener un valor δj asociado que se
utilizará en el proceso de ajuste de los pesos. El peso asociado a la conexión
desde la unidad i a la unidad j se representa por wji, y es modificado durante el
proceso de aprendizaje.
Unidad Procesadora Básica Backpropagation.
Normalmente, la Backpropagation utiliza tres o más capas de unidades
procesadoras. La Figura (5.2) muestra la topología backpropagation típica de
tres capas. La capa inferior es la capa de entrada, y se caracteriza por ser la
única capa cuyas unidades procesadoras reciben entradas desde el exterior.
Sirven como puntos distribuidores, no realizan ninguna operación de cálculo.
Las unidades procesadoras de las demás capas procesan las señales como se
indica en la figura. La siguiente capa superior es la capa oculta, y todas sus
unidades procesadoras están interconectadas con la capa inferior y con la capa
superior. La capa superior es la capa de salida que presenta la respuesta de la
red.
Red Backpropagation completamente interconectada.
2.2.3. Algoritmo de Entrenamiento
Las redes Backpropagation tienen un método de entrenamiento supervisado. A
la red se le presenta parejas de patrones, un patrón de entrada emparejado
con un patrón de salida deseada. Por cada presentación los pesos son
ajustados de forma que disminuya el error entre la salida deseada y la
respuesta de la red.
El algoritmo de aprendizaje backpropagation conlleva una fase de propagación
hacia adelante y otra fase de propagación hacia atrás. Ambas fases se realizan
por cada patrón presentado en la sesión de entrenamiento.
2.2.4. Propagación hacia Adelante.
Esta fase de propagación hacia adelante se inicia cuando se presenta un
patrón en la capa de entrada de la red. Cada unidad de la entrada se
corresponde con un elemento del vector patrón de entrada. Las unidades de
entrada toman el valor de su correspondiente elemento del patrón de entrada y
se calcula el valor de activación o nivel de salida de la primera capa. A
continuación las demás capas realizarán la fase de propagación hacia adelante
que determina el nivel de activación de las otras capas.
La unidad procesadora j obtiene la cantidad Sj según la ecuación (5.1)
Sj = Σi ai wji ec.(5.1)
y genera la salida o nivel de activación según la ecuación (5.2)
Salida = f(Sj) ec.(5.2)
La función f es una función umbral genérica, entre las que cabe destacar la
función Sigmoid y la función Hiperbólica.
El valor de la salida de la unidad j es enviado o transmitido a lo largo de todas
las conexiones de salida de dicha unidad.
La Figura muestra la fase de propagación hacia adelante.
Fase de Propagación hacia Adelante.
Conviene indicar que las unidades procesadoras de la capa de entrada no
realizan ninguna operación de cálculo con sus entradas, ni operaciones con
funciones umbrales, sólo asumen su salida como el valor del correspondiente
elemento del vector de entrada.
Por otro lado, algunas redes backpropagation utilizan unidades llamadas bias
como parte de cualquiera de las capas ocultas y de la capa de salida. Estas
unidades presentan constantemente un nivel de activación de valor 1. Además
esta unidad está conectada a todas las unidades de la capa inmediatamente
superior y los pesos asociados a dichas conexiones son ajustables en el
proceso de entrenamiento. La utilización de esta unidad tiene un doble objetivo,
mejorar las propiedades de convergencia de la red y ofrecer un nuevo efecto
umbral sobre la unidad que opera.
2.2.5. Propagación hacia Atrás.
Una vez se ha completado la fase de propagación hacia adelante se inicia la
fase de corrección o fase de propagación hacia atrás. Los cálculos de las
modificaciones de todos los pesos de las conexiones empiezan por la capa de
salida y continua hacia atrás a través de todas las capas de la red hasta la
capa de entrada. Dentro de los tipos de ajuste de pesos se puede clasificar dos
grupos, ajuste de unidades procesadoras de la capa de salida y ajuste de
unidades procesadoras de las capas ocultas.
Ajuste de Pesos de la Capa de Salida: el ajuste de estos pesos es
relativamente sencillo debido a que existe y se conoce el valor deseado para
cada una de las unidades de la capa de salida. Cada unidad de la capa de
salida produce un número real como salida y se compara con el valor deseado
especificado en el patrón del conjunto de entrenamiento.
A partir del resultado de la comparación se calcula un valor de error δj, según la
ecuación (5.3) para cada unidad de la capa de salida.
δj = (tj _ aj) f_(Sj) ec.(5.3)
siendo tj el valor de salida deseado y f_ la derivada de la función umbral f
La Figura muestra el cálculo de los valores δj de las unidades de la capa de
salida.
Cálculo de los valores δj de la Capa de Salida.
Ajuste de Pesos de las Capas Ocultas: estas capas no tienen un vector de
salidas deseadas y por tanto no se puede seguir el método de propagación de
error mencionado en el caso de unidades procesadoras de la capa de salida. El
valor de error calculado para este tipo de unidades procesadoras se obtiene a
partir de la ecuación (5.4).
δj = [Σkδk wkj] f_(Sj) ec.(5.4)
La Figura representa la obtención del valor δj para las unidades de las capas
ocultas.
Cálculo de los valores δj de las Capas Ocultas.
El ajuste de los pesos asociados a las conexiones se realiza a partir del valor ?
de cada unidad de proceso. Cada peso es ajustado según la ecuación (5.5)
conocida como la regla ? generalizada (Rumelhart y McClelland 1986)
Δwji = η δj ai ec.(5.5)
La variable η es el coeficiente de aprendizaje. Este coeficiente, normalmente
entre 0.25 y 0.75 refleja el grado de aprendizaje de la red. Algunas veces este
coeficiente es modificado de un valor inicial alto a valores progresivamente
menores durante la sesión del entrenamiento con el objetivo de lograr un mejor
aprendizaje.
Convergencia: en el proceso de entrenamiento o aprendizaje de la
Backpropagation es frecuente medir cuantitativamente el aprendizaje mediante
el valor RMS (Root Mean Square) del error de la red. Esta medida refleja el
modo en el que la red está logrando respuestas correctas; a medida que la red
aprende, su valor RMS decrece.
Debido a que los valores de salida de la red y los valores de salidas deseadas
son valores reales, es necesario definir un parámetro de corte o un valor
umbral del valor RMS del error de la red que permita decir que la red se
aproxima a la salida deseada y considerar que la respuesta es correcta.
La convergencia es un proceso en el que el valor RMS del error de la red
tiende cada vez más al valor 0. La convergencia no siempre es fácil de
conseguirla porque a veces el proceso puede requerir un tiempo excesivo o
bien porque la red alcanza un mínimo local y deja de aprender.
2.2.6. VENTAJAS E INCONVENIENTES
La principal ventaja de la Backpropagation es su capacidad genérica de mapeo
de patrones. La red es capaz de aprender una gran variedad de relaciones de
mapeo de patrones. No requiere un conocimiento matemático de la función que
relaciona los patrones de la entrada y los patrones de salida. La
Backpropagation sólo necesita ejemplos de mapeo para aprender. La
flexibilidad de esta red es aumentada con la posibilidad de elegir número de
capas, interconexiones, unidades procesadoras, constante de aprendizaje y
representación de datos. Como resultado de estas características la red
Backpropagation es capaz de participar con éxito en una amplia gama de
aplicaciones.
El mayor inconveniente es el tiempo de convergencia. Las aplicaciones reales
pueden llegar a tener miles de ejemplos en el conjunto de entrenamiento y ello
requiere días de tiempo de cálculo. Además la backpropagation es susceptible
de fallar en el entrenamiento, es decir, la red puede que nunca llegue a
converger.
Existe una variedad de técnicas desarrolladas para disminuir el tiempo de
convergencia y evitar los mínimos locales. El término de "momentum" se utiliza
para aumentar la velocidad del proceso de convergencia. Otra forma de
mejorar la convergencia se basa en la variación del parámetro de aprendizaje η
comenzando con valores altos y adquiriendo progresivamente valores más
pequeños. Entre las técnicas utilizadas para evitar los mínimos locales
destacan cambiar la red, cambiar el conjunto de entrenamiento y añadir ruido
aleatorio a los pesos.
2.3 Antecedentes
Título: Sistema de pronóstico de la demanda de productos farmacéuticos
basado en redes neuronales
Autores: Eybi Gil Zavaleta, Enith Rodríguez Collas
Año: 2010
Procedencia: Universidad Nacional Mayor de San Marcos Lima-Perú
Resumen: La supervivencia en los negocios altamente competitivos de hoy
requiere una visión precisa de la demanda para poner en marcha los planes de
producción, inventario, distribución y compra dentro de las empresas; el sector
farmacéutico no es la excepción, pues los efectos de las temporadas,
promociones, cambios de precios, publicidad, productos con bajo o alto nivel de
movimiento y datos atípicos en general afectan en la determinación de la
misma. En este contexto, pronosticar por arriba de la demanda tiene entre sus
consecuencias el excesivo inventario de fármacos, obsolescencia o caducidad,
y por otro lado, pronosticar por debajo de la demanda tiene como consecuencia
la pérdida de las ventas y un posible incremento en los costos. Por lo
mencionado, el tema se centra en el desarrollo de un sistema que usa las
técnicas de redes neuronales artificiales para el pronóstico de la demanda de
productos.
En este trabajo se propone el uso de una red neuronal (Perceptrón multicapa)
para el pronóstico de la demanda de productos farmacéuticos, la cual realizará
su fase de aprendizaje con el algoritmo backpropagation que brinda una taza
de error de 3.57% en el mejor caso encontrado; su implementación se
desarrollará bajo la tecnología de MATLAB para la construcción de la red
neuronal y del lenguaje JAVA para el diseño de la interfaz gráfica de usuario.
Título: Pronósticos en el mercado de derivados utilizando redes neuronales y
modelos ARIMA una aplicación al Cete de 91 días en el MexDer.
Autor: Iván Cruz Torres
Año: 2008
Procedencia: Universidad Nacional Autónoma de México
Resumen: El objetivo de esta tesis es proponer un modelo que permita
pronosticar la tendencia de la serie del futuro del Cete de 91 días en el MexDer
con vencimiento en diciembre de 2008, aplicando redes neuronales y series de
tiempo, y comparar los pronósticos obtenidos de esta forma con los que se
obtendría con un modelo ARIMA tradicional, con el fin de conocer que modelo
ajusta mejor los datos dentro de muestra y que modelo pronostica mejor los
datos fuera de muestra.
La principal aportación es demostrar que el modelo propuesto basado en redes
neuronales es capaz de obtener buenas aproximaciones tanto en el ajuste
como en el pronóstico, además de observar que, en este caso en particular, la
aproximación resulta mejor que la generada por medio de la metodología
ARIMA. Así también, la tesis contiene una propuesta metodológica para la
aplicación de las redes neuronales a las series de tiempo financieras.
Este trabajo se divide en dos partes: Parte I, Marco teórico. Series de tiempo y
redes neuronales, en donde se establecen las bases teóricas para el desarrollo
de la tesis. Parte II. Desarrollo y aplicación del modelo propuesto y,
comparación con la metodología ARIMA, en la cual se muestran las hipótesis
de la investigación, su desarrollo y los resultados obtenidos, a partir de los
cuales se presentan las conclusiones y algunas propuestas para futuras
investigaciones.
Título: Predicción del consumo de éxtasis a partir de redes neuronales
artificiales
Autor: Alfonso Palmer Pol
Procedencia: Universidad de las Islas Baleares España
Resumen: El propósito del presente estudio fue mostrar cómo una red neuronal
artificial (RNA) puede ser útil para predecir el consumo de éxtasis (MDMA).
Más específicamente, se trata de desarrollar una red neuronal del tipo
backpropagation capaz de discriminar entre quién consume éxtasis y quién no,
a partir de las respuestas dadas por los sujetos a un cuestionario. La muestra
estaba compuesta por 148 consumidores y 148 no consumidores de éxtasis.
Se explican las diferentes fases llevadas a cabo para desarrollar la RNA:
selección de las variables relevantes y preprocesamiento de los datos, división
de la muestra en grupo de entreno, validación y test, entreno y evaluación del
modelo de red, y análisis de sensibilidad. La eficacia de la RNA entrenada fue
del 96.66%. El área bajo la curva ROC (Receiver operating characteristic) fue
de 0.99440.0055 SE. Por otra parte, se pretende mostrar que las RNA no
representan una “caja negra”, sino que pueden dar información acerca del
grado de influencia que tiene cada variable predictora sobre el consumo de
éxtasis.
Título: Comparación de predicción basada en redes neuronales contra métodos
estadísticos en el pronóstico de ventas
Autores: Edgar Augusto Ruelas Santoyo y José Antonio Laguna González
Año: 2013
Procedencia: México
Resumen: La intención del presente artículo es realizar la comparación y
selección de un método para pronosticar las ventas de forma eficiente y que
beneficie a organizaciones que ofrecen sus productos al mercado ya que los
pronósticos de ventas son datos de entrada a diferentes áreas de la empresa y
de ser imprecisos pueden generar gastos para la organización. El caso de
estudio en este artículo fue llevado a cabo dentro de la empresa Productos
Frugo S.A. de C.V., dedicada a la comercialización de productos alimenticios.
Los métodos y metodologías utilizados y posteriormente comparados al
pronosticar las ventas de la empresa antes mencionada son: Método de Hold,
Winters, la metodología Box Jenkins (ARIMA) y una Red Neuronal Artificial. Los
resultados muestran que la red neuronal artificial obtuvo un mejor desempeño
logrando el menor error cuadrático medio, de esta forma es posible establecer
un panorama adecuado para el uso de la inteligencia artificial dentro de la
industria.
Título: Evaluación de pronósticos del tipo de cambio utilizando redes
neuronales y funciones de pérdida asimétricas
Autores: Munir Andres Jalil y Martha Misas
Año: 2007
Procedencia: Universidad Nacional de Colombia
Resumen: Se comparan especificaciones lineales y no lineales (estas últimas
expresadas en redes neuronales artificiales) ajustadas a la variación porcentual
diaria del tipo de cambio utilizando para ello funciones de costo tradicionales
(simétricas) y funciones de pérdida asimétricas. Los resultados muestran que
las redes neuronales permiten obtener mejores pronósticos con ambos tipos de
funciones de costos. Sin embargo, es de anotar que cuando se evalúan los
pronósticos con funciones asimétricas, el modelo no lineal supera ampliamente
a su contraparte lineal.
Título: Metodología para calcular el Pronóstico de Ventas y una medición de su
precisión en una Empresa Farmacéutica: Caso de Estudio
Autor: GABRIELA GARDUÑO GARCÍA
Año: 2011
Procedencia Instituto Politécnico Nacional México
Resumen: En el presente trabajo se propone una metodología para el cálculo
del Pronóstico de Ventas de una empresa de Sector Farmacéutico que
contribuya a disminuir el abastecimiento excesivo que generalmente existe en
la compañía y con esto minimizar los costos, como el de almacenamiento de
productos terminados y materiales. Para lo cual, se evaluaron y compararon
diferentes métodos cuantitativos de pronósticos, resultando ser el Método
Winters el que mejor precisión ofrece para el cálculo del pronóstico de ventas
de la empresa de estudio.
La metodología propuesta tiene la particularidad de aplicarse a problemas de
pronósticos en industrias farmacéuticas en donde la base de datos no está
constituida de una cantidad considerable de observaciones para poder aplicar
otras técnicas de series de tiempo como los modelos ARIMA. En el trabajo se
presenta una técnica para realizar recorridos de evaluación en los parámetros
del método de Winters, de tal forma que en lugar de realizar una sola
evacuación como lo hacen los paquetes estadísticos, se genera un recorrido de
100,000 generaciones de los parámetros distribuidas en un hipercubo
(hypercube). En cada terna se emplea el método de Winters y al final se elige
la terna que da menor medida de dispersión entre los valores pronosticados y
los valores reales.
Además, el modelo propuesto permite calcular el riesgo que existe en
situaciones extremas de ventas con la finalidad de fortalecer el análisis y
evaluación de los pronósticos obtenidos a través de la metodología propuesta
como apoyo para la toma de decisiones de la organización.
2.2.4. Hipótesis
El diseño e implementación de un sistema que utilice la técnica de redes
neuronales artificiales es posible obtener un pronóstico de ventas más
aceptado comparado con la experiencia de los vendedores.
Variable Dependiente
Pronostico de ventas Indicadores
Ajuste de la cantidad de productos
Cantidad de Bienes o Servicios
Compradores o Consumidores
Disposición a adquirir el producto o servicio
Capacidad de pago
Precio dado
Variable Independiente
Redes Neuronales Indicadores
Peso correspondiente de las neuronas
Número de neuronas en la capa de entrada
Número de neuronas en la capa oculta
Número de neuronas en la capa de salida
2.2.5. Estudio de Factibilidad
2.2.5.1. Factibilidad Técnica
Requerimiento de Software
Windows 8.1
Office 2010 (Word, Excel)
Antivirus NOD 32
Netbeans 8.0
Matlab 9.0
Requerimiento de Hardware
Motherboard GIGABITE S2H DDR3 VD/SN/NW Micro-ATX
Procesador Intel Core I5- 3.06 GHz, 4MB Total Intel Smart Cache,
LGA1156, 32nm.
Memoria KINGTON 4 GB DDR3-1333MHz PC 3-10600 Exp. A 16
GB
Disco Duro de 1TB (7200 RPM) s-Ata. SEAGATE
Grabador de DVD 24X RE-Writer Negro Dual layer-LG
Lector de Memorias 5 en 1
Mouse óptico de dos botones y scroll GENIUS
Teclado en Español Multimedia
Monitor LED 18.5” LG o SAMSUNG
Tarjeta de Video Pci Express Integrado
Tarjeta de sonido incorporado de 8 canales
Tarjeta de Red 10/100/1000 Incorporada
Estabilizador de 100W
Case ATX- Doble tobera BOOMER
Requerimiento de Personal
Jefe de Proyecto
Analista
Diseñador
Programador
2.2.5.2. Factibilidad Operativa
Configuración de nuevas Redes
Configuración de los parámetros solicitados por la red
Configuración de los pesos de la red
Entrenar nuevas Redes
Pronosticar la venta de los productos por temporada
2.2.5.3. Factibilidad Económica
COSTOS DE MATERIAL DE OFICINA Y PAPELERIA
GASTOS GENERALES COSTO (S/. )
Material de oficina 50.00
Papel 30.00
Tóner de impresora 120.00
TOTAL 200.00
COSTOS DE PERSONAL
RECURSOS HUMANOS COSTO (S/. ) 5 Meses
Jefe de Proyecto es el
Programador2000.00
Diseñador 1500.00
Analista 1500.00
TOTAL 5000.00
COSTOS DE HARDWARE Y SOFTWARE
HARDWARE COSTO (S/. )
Computadora Personal 1590.60
SOFTWARE
Sistema operativo
Windows 8.1
500.00
Office 2010 313.97
Nod 32 44.62
Matlab 10.0 280.35
Netbeans Java 0.00
TOTAL 2729.54
TOTAL GENERAL 7929.54
2.2.5.4. Análisis Costo Beneficio
Beneficios Tangibles:
Espacios de Almacenes Disponibles S/. 1200.00
Productos necesarios y disponibles para las ventas S/. 500.00
Reducción de tiempo en el pronóstico S/. 200.00
TOTAL S/. 1900.00
Beneficios Intangibles:
Hacer un óptimo uso de los espacios disponibles en el área de
almacén, reduciendo espacios ocupados innecesarios.
1º - 8º mes 9ºmes 10ºmes 11ºmes 12ºmes 13º mes
Costo
S/. 7929.54
Beneficios
(S/.)
1900.
00 1900.00 1900.00 1900.00 1900.00
Costo/Beneficio
(S/.)
6029.
54 4129.54 2229.54 329.54 -1570.46
Conocimiento de los productos pronosticados en el tiempo.
2.2.5.5. Costo/Beneficio.