Structuring unstructured information

29
“Estructurando Información Desestructurada” como tarea para la Escucha Activa

Transcript of Structuring unstructured information

Page 1: Structuring unstructured information

“Estructurando Información Desestructurada”

como tarea para la Escucha Activa

Page 2: Structuring unstructured information

consulting, s.a.

auto

ritas

2

El mundo tenológico era

solitario

Page 3: Structuring unstructured information

consulting, s.a.

auto

ritas

3

y aunque podía ser divertido

Page 4: Structuring unstructured information

consulting, s.a.

auto

ritas

4

no había COMUNICACIÓN

real

...y los humanos NECESITAMOS comunicarnos!!

Page 5: Structuring unstructured information

consulting, s.a.

auto

ritas

5

Entonces nació la Web

El 16/02/1991 Tim Berners Lee

presentaba su proyecto World

Wide Web

Mike Sendall, directivo del CERN,

catalogaba la propuesta como

“Vage, but exciting”

Page 6: Structuring unstructured information

consulting, s.a.

auto

ritas

6

a partir de la red Internet

Page 7: Structuring unstructured information

consulting, s.a.

auto

ritas

7

y todo el mundo creo su propia

página Web

Page 8: Structuring unstructured information

consulting, s.a.

auto

ritas

8

Pero seguía sin haber

COMUNICACIÓN real

Page 9: Structuring unstructured information

consulting, s.a.

auto

ritas

9

Se comenzó a hablar de una nueva actitud

Page 10: Structuring unstructured information

consulting, s.a.

auto

ritas

10

CONSUMER

PRODUCER

germinándose la Web 2.0

Consume contenidos, es la gran mayoría.Puede ser productor a su vez, pero en otro lugar y momento. Puede comentar contenidos

Crea contenidos, páginas Web, y aunque puede responder a comentarios, no crea conversación. Suele ser consumidor, pero en otro lugar y momento

PROSUMER

Crea y consume contenidos, participa, colabora, comparte, genera conversación.La Web 2.0 se construye de manera colaborativa entre las personas, en Blogs, Wikis, Foros, Redes Sociales... que mantienen una premisa antropológica común, la necesidad humana de COMUNICARSE

1.0

2.0

Page 11: Structuring unstructured information

consulting, s.a.

auto

ritas

11

y empezándose a hablar de la

Web 3.0

“La Web 3.0 es la Web 2.0 sin barreras” Tim Berners Lee

3.0

Page 12: Structuring unstructured information

consulting, s.a.

auto

ritas

12

Surgen nuevos conceptos, ahora

posibles

Page 13: Structuring unstructured information

consulting, s.a.

auto

ritas

13

como la Escucha Activa

“Active Listening: more than just paying attention” Kathryn Robertson

Page 14: Structuring unstructured information

consulting, s.a.

auto

ritas

14

¿escuchar todo lo que se dice en la

Web?

• > 500 millones de usuarios de Facebook

• > 150 millones de usuarios de Twitter

• > 90 millones de Webs• > 150 millones de blogs• aprox. 1000 exabytes anuales

EXCESO DE INFORMACIÓN DESESTRUCTURADA

Page 15: Structuring unstructured information

consulting, s.a.

auto

ritas

15

Todo problema conlleva una oportunidad

Aprendizaje Automático: Para

inferir nuevos modelos a partir de

los datos existentes, para

dotar de inteligencia a

nuestras aplicaciones

Natural Language Processing:

Porque el contenido textual de la Web está escrito en el lenguaje humano

Data Mining: Para identificar patrones válidos, novedosos,

potencialmente útiles y

deseablemente comprensibles a

partir de los datos

Page 16: Structuring unstructured information

consulting, s.a.

auto

ritas

16

y una forma nueva de gestionar

Page 17: Structuring unstructured information

consulting, s.a.

auto

ritas

17

Veamos un ejemplo

150.000.000+

Media de edad 38,4

Usuarios

45%

0 - 12 13 - 17 18 - 34 35 - 49 50+

Sexo 47% vs 53% 47% 53%

Page 18: Structuring unstructured information

consulting, s.a.

auto

ritas

18

en un pequeño territorio

Page 19: Structuring unstructured information

consulting, s.a.

auto

ritas

19

se habla de muchos temas

Page 20: Structuring unstructured information

consulting, s.a.

auto

ritas

20

unos muy hablados, otros muy relevantes

Qué temas tienen más

influencia en la gente

Qué temas importan a más

gente

Page 21: Structuring unstructured information

consulting, s.a.

auto

ritas

21

y con diferentes curvas de

crecimiento

Cuándo y en qué debemos

actuar

Qué temas son emergentes y qué temas son

sustituidos

Page 22: Structuring unstructured information

consulting, s.a.

auto

ritas

22

y lo hacen miles de usuarios

13/5/2011

0

67,5

135

202,5

270

MurderersShow

nerea_beleber

tuitrafico_feed

Page 23: Structuring unstructured information

consulting, s.a.

auto

ritas

23

unos que hablan mucho, otros que

son muy escuchados

@kicorangel

Tweets: 2.519Followers: 248

True reach: 122

@ladygaga

Tweets: 850Followers: 10.619.808

True reach: 3.767.356

Page 24: Structuring unstructured information

consulting, s.a.

auto

ritas

24

en múltiples idiomas

Inglésestoy sin internet ¬¨¬¨ fuuuuck!!!

Finlandés... euskocaja, como euskolabel, euskotren, euskomueble... XDDD

PortuguésFlowah Powah!

AlemánVierrrrrrrrrrrrnes, egunon!!

Page 25: Structuring unstructured information

consulting, s.a.

auto

ritas

25

y desde diferentes

ubicaciones

Page 26: Structuring unstructured information

consulting, s.a.

auto

ritas

26

y aunque hay meta-datos

Biografía Localización Idioma

TIME LINE

Page 27: Structuring unstructured information

consulting, s.a.

auto

ritas

27

los problemas son múltiples

Biografía Localización Idioma

• No se rellena• No contiene

información significativa

• No se corresponde con la realidad de sus intereses

• No se rellena• Se rellena con

una ubicación falsa

• Se actualiza con la posición GPS

• Ambigüedad de ubicación

• No se rellena• Se deja por

defecto EN• Se rellena con

info. falsa• Se escribe en

diferentes idiomas

La terminología utilizada dista de cualquier lengua oficial. PSEUDO-ARGOT

TL

Page 28: Structuring unstructured information

consulting, s.a.

auto

ritas

y hay que resolverlos con

R&D

Recuperación y almacenamiento

Recuperación de información desde múltiples fuentes de datos, heterogéneas, con restricciones técnicas y legales, almacenamiento de grandes cantidades de información, indexación y búsqueda. Escalabilidad

ClusterAgrupación de contenidos, identificación de temas a partir del cluster de terminología, procesamiento translingüístico. Identificación de coherencia conversacional

Influencia

Tendencia

Identificación de influenciadores, cálculo de la influencia, tipología de influenciador

Identificación de trending topics, ajuste de la distribución de la evolución de la tendencia, detección de hot themes

ClasificaciónClasificación de la información, determinación de idioma, tipo de fuente, origen y, a ser posible, sugerencia de sentimiento

Page 29: Structuring unstructured information

consulting, s.a.

auto

ritas

“Estructurar la información desestructurada existente en la

Web, nos permite tratarla y descubrir conocimiento útil para la

Escucha Activa”

29

Francisco Manuel Rangel Pardo

CTO - Autoritas Consulting@kicorangel