Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

38
La analítica de textos más precisa con MeaningCloud Multiplica la exactitud de tu analítica de texto con nuestras herramientas de personalización Webinar Daedalus / MeaningCloud, 12 de mayo de 2015

Transcript of Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

Page 1: Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

La analítica de textos más precisa con MeaningCloud

Multiplica la exactitud de tu analítica de texto con nuestras herramientas de personalización

Webinar Daedalus / MeaningCloud, 12 de mayo de 2015

Page 2: Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

Introducción

Presentador

Logística

Enviar preguntas de texto

“Levantar la mano” para hablar

Publicaremos enlace a webinar grabado

Antonio Matarranz

Director Comercial

Page 3: Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

Agenda

Analítica de texto. Exactitud, precisión y cobertura

Recursos lingüísticos personalizados para mejorar la exactitud

Herramientas de personalización de MeaningCloud

Conclusiones y preguntas

Page 4: Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

Analítica de texto

Extraer significado “actuable” de contenido no estructurado Automatización de tareas típicamente manuales

OpinionesTemasHechos

Conceptos

Organizaciones

Personas

Análisis

Semántico

Relaciones

Page 5: Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

¿Qué precisión tiene todo esto?

La precisión es “relativa”

Las personas no tenemos una precisión del 100%

Tests con analistas humanos: acuerdo 85-95%

Además de precisión, cobertura (recall)

Alta precisión Alta cobertura

Alta precisión Baja cobertura

Baja precisión Alta cobertura

Identificado por algoritmo

Page 6: Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

Exactitud: precisión y cobertura

Precisión y cobertura están inversamente relacionadas

Buscar compromiso

Los requisitos dependen de la aplicación

Monitorización de marca en medios sociales: alta precisión, baja cobertura

Lucha antiterrorista: alta cobertura, baja precisión

Page 7: Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

Estado del arte en analítica de texto

Medidas de precisión

Extracción de topics (ej.: entidades): 70-85%

Clasificación: 70-80%

Análisis de sentimiento: 60-70%

La mejora de calidad depende de la adaptación de las herramientas y recursos a la aplicación/tarea

Page 8: Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

MeaningCloud: API semánticas en la nube

Regístrate y úsalo GRATIS en http://www.meaningcloud.com

Page 9: Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

APIs MeaningCloud Análisis de sentimiento Global A nivel de aspecto

Clasificación Modelos estándar

Extracción de topics Entidades Conceptos Fechas Direcciones Cantidades económicas Expresiones temporales …

https://www.meaningcloud.com/es/demos/analisis-de-medios/

Page 10: Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

MeaningCloud: recursos estándar

Ontodaedalus (ontología) 437 tipos de entrada

78 temáticos

250.000+ lemas/idioma

https://www.meaningcloud.com/developer/documentation/ontodaedalus

Page 11: Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

MeaningCloud: recursos estándar

Modelos de clasificación estándar

IPTC: noticias

Business Reputation: reputación corporativa

EuroVoc: administración pública

IAB (pronto): publicidad

https://www.meaningcloud.com/developer/resources/models

Page 12: Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

Un ejemplo práctico

Recorrido por las herramientas de personalización de MeaningCloud

Page 13: Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

Escenario VoC / Customer Insights

Redes sociales, foros

Verbatims encuestas

Interacciones Contact Center: voz, email…

Estructurar y extraer significado

¿Qué empresas/ marcas mencionan?

¿De qué están hablando?

¿Cuál es su opinión?

Análisis

Insights

Page 14: Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

Opiniones

La frase “¡Tiene el tipo de interés más alto del mercado!” es…

Positiva, si habla de depósitos

Negativa, si habla de hipotecas

Recursos lingüísticos específicos mejoran la exactitud

Menciones

Nombres de bancos y entidades financieras, p. ej.: Santander, BBVA

Nombres de productos, p. ej.: Cuenta Naranja, Libreta Estrella…

Temas

Ejemplo: análisis de las opiniones de clientes de un banco

Productos

Pasivo

Cuenta

Depósito

Activo

Crédito

Hipoteca

Canal

Oficina

Teléfono

Internet

Page 15: Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

Qué vamos a hacer

Diccionario Banca

Nombres de bancos, nombres de productos (entidades)

Nombres de productos genéricos, p.ej.: hipoteca (conceptos)

Modelos de clasificación

Modelo Canales: teléfono, web…

Modelos de sentimiento (avance)

Page 16: Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

Herramientas de personalización MeaningCloud

Page 17: Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

Diccionarios personales

Page 18: Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

Creando un nuevo diccionario

Posibilidad de importar diccionario desde fichero

Page 19: Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

Creando una nueva entidad

Alias: NO es necesario introducir explícitamente alias “inmediatos”( ej.: tildes), motor genera variantes

Usa tu propia ontología

Posible incorporar información semántica adicional

Page 20: Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

Diccionario resultante

Entidades

Conceptos

Page 21: Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

La ontología que se deriva del diccionario

Page 22: Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

Importación de diccionarios

La mejor manera de incorporar a MeaningCloud un diccionario preexistente

Forma Alias ID Atributos de Información semántica

Page 23: Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

Resultado: las APIs identifican topics del diccionario

Identifica información semántica Producto: Cuenta Nómina Tipo: Cuenta corriente Banco: ING

Page 24: Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

Modelos de clasificación personales

Page 25: Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

Creando un nuevo modelo

Posibilidad de importar modelo desde fichero

Page 26: Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

Definiendo una categoría: enfoque híbrido

Basado en Reglas

Basado en Entrenamiento

Se puede optar por uno de los enfoques o combinarlos,

según la aplicación

Page 27: Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

Definiendo una categoría: entrenamiento

Se alimenta con textos de entrenamiento precodificados

Basado en tecnología machine learning

Page 28: Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

Definiendo una categoría: reglas

Términos que

Aumentan la relevancia

Disminuyen la relevancia

Son imprescindibles

Están prohibidos

Page 29: Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

Cómo mejorar precisión y cobertura aplicando reglas + entrenamiento

Estadístico Basado en reglas Híbrido

Ventajas Muy rápido si ya tienes

textos etiquetados

Buenos resultados para

textos largos

No hay falsos positivos

Muy buenos

resultados para

casuísticas limitadas

Se puede poner en marcha

fácilmente a partir de textos

de ejemplo

No necesita definición

exhaustiva de reglas

Desventajas “Caja negra”

Falsos positivos difíciles

de corregir

Sesgo en resultados

según entrenamiento

Costoso partiendo

desde cero

Falsos negativos según

la calidad de las reglas

Escala con dificultades

Requiere conocimiento

exhaustivo de dominio

Page 30: Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

Modelo resultante

Page 31: Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

Importación de modelos

La mejor manera de incorporar a MeaningCloud un modelo

preexistente

Page 32: Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

Resultado: las APIs clasifican según el modelo

Justifica la relevancia de la clasificación en función de los términos que parecen

Page 33: Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

Aplicación al Análisis de Sentimiento

Page 34: Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

Sentimiento: uso de diccionarios personales de entidades y conceptos

Polaridad asociada a la entidad Cuenta Nómina

Page 35: Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

Diccionarios personalizados de Sentimiento (PRONTO)

No todos los términos tienen la misma polaridad en todos los dominios

Ej.: en el dominio de artículos de lujo “barato” no tiene necesariamente una polaridad positiva (como en otros dominios)

En modelo de Sentimiento para dominio Lujo: “barato” N

Un mismo término puede tener distintas polaridades, según el contexto

Tenemos esta funcionalidad en pruebas. Si quieres participar en la beta privada envía un email a [email protected]

Término Contexto Polaridad

cerrar Bolsa, marcador NEUTRO

cerrar Contrato, compraventa P

cerrar Empresa N

Page 36: Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

Conclusiones

¿Cómo mejorar la exactitud?

Herramientas gráficas

Posibilidad de incorporar tus diccionarios y modelos

Amplia cobertura: menciones, temas, opiniones…

Usuarios autónomos

La mayor exactitud al alcance de tu mano

Page 37: Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

Democratizando la extracción de significado

Análisis semántico de alta calidad

Combinación optimizada de tecnologías

Recursos semánticos actualizados continuamente

APIs de alto nivel, ej.: reputación corporativa…

Personalización al dominio del cliente: clasificación, diccionarios, sentimiento

Asequible y sin riesgos

Tecnología madura y probada

Posible probar y usar Gratis (40.000 peticiones/mes)

Pago por uso

Sin compromisos ni permanencias

Planes comerciales a partir de 99 $/mes

Para desarrolladores y

usuarios no técnicos

Add-in para Excel

APIs servicios web estándar

Plug-ins y SDKs para diversos entornos y lenguajes

Plug-and-play

OpinionesTemasHechos

Conceptos

Organizaciones

Personas

Relaciones

Page 38: Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar

¡Muchas gracias por vuestra atención!

Preguntas, sugerencias, etc.

Antonio Matarranz

Director Comercial

[email protected]

Daedalus, S.A.

Tel: +34 913324301

http://www.meaningcloud.com

http://www.daedalus.es