Cerca d’informació a Internet: implicacions jurídiques

26
Cerca d’informació a Internet: implicacions jurídiques Julià Minguillón Universitat Oberta de Catalunya Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril

description

 

Transcript of Cerca d’informació a Internet: implicacions jurídiques

Page 1: Cerca d’informació a Internet: implicacions jurídiques

Cerca d’informació a Internet: implicacions jurídiques

Julià Minguillón

Universitat Oberta de Catalunya

Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC

Page 2: Cerca d’informació a Internet: implicacions jurídiques

Taula de continguts• Què és això de la World Wide Web?• El concepte d’enllaç• Estadístiques de la web• Cercant i endreçant informació• Motors de cerca• Problemes• Responsabilitats• Debat: implicacions jurídiques

J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC

Page 3: Cerca d’informació a Internet: implicacions jurídiques

La World Wide Web

1989-1990(Sir) Tim Berners-Lee proposa un

mecanisme per compartir documents entre ordinadors enllaçant-se uns amb els altres

J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC

Page 4: Cerca d’informació a Internet: implicacions jurídiques

La World Wide Web

1990-1993Desenvolupament dels protocols

necessaris per a compartir documents:

• HyperText Transfer Protocol (HTTP)

• HyperText Markup Language (HTML)J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC

Page 5: Cerca d’informació a Internet: implicacions jurídiques

La World Wide Web

1993-1994Apareixen els primers web sites

(llocs), pàgines web i navegadors:

• What’s new

• NCSA MosaicJ. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC

Page 6: Cerca d’informació a Internet: implicacions jurídiques

El concepte d’enllaç• Cada document HTML (o recurs) en un

servidor té un identificador:

http://<servidor>/<cami>/<document>

• El llenguatge HTML permet enllaçar documents creant un graf dirigit (A → B)

• El client (navegador) permet “navegar” d’un document a l’altre

J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC

Page 7: Cerca d’informació a Internet: implicacions jurídiques

Estadístiques

1993Uns pocs centenars de llocs

199410000 llocs

J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC

Page 8: Cerca d’informació a Internet: implicacions jurídiques

Estadístiques

Avui> 200000000 llocs web

> 20000000000 pàgines web

> 1800000000 usuaris (26.6%)

400% creixement (2000-2009)

J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC

Page 9: Cerca d’informació a Internet: implicacions jurídiques

Accés a la informació

EstratègiesBrowsing

Searching

J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC

Page 10: Cerca d’informació a Internet: implicacions jurídiques

Browsing

• La web no té una pàgina inicial

• Organització jeràrquica:–Per tema

–Per idioma / àrea geogràfica

http://www.dmoz.org/

J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC

Page 11: Cerca d’informació a Internet: implicacions jurídiques

Searching

Motors de cercaTres fases:

– Web crawler

– Creació de l’índex

– Gestor de consultesJ. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC

Page 12: Cerca d’informació a Internet: implicacions jurídiques

Web crawlers

• Sistemes automàtics que visiten sistemàtica i repetidament un lloc, obtenint l’estructura i el contingut del mateix → web surfers

• Tot site té una pàgina inicial

• Si està enllaçat, s’hi pot accedir!

J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC

Page 13: Cerca d’informació a Internet: implicacions jurídiques

Limitacions

• Accés protegit per paraula clau

• Ús de CAPTCHAs

• Tipus de recurs / document

• Cerca en profunditat / amplada

• Temps entre visites consecutives

• Protocol d’exclusió / inclusióJ. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC

Page 14: Cerca d’informació a Internet: implicacions jurídiques

Protocol d’exclusió

• Fitxer robots.txt• Ha de ser públic

• No obliga, només indica

• Revela informació sensible!

Google hack: intitle:index.of robots.txt

J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC

Page 15: Cerca d’informació a Internet: implicacions jurídiques

Problemes

• Els cercadors permeten trobar informació sensible

• El contingut i els seus enllaços són coses diferents

• Els usuaris poden enllaçar cap a informació sensible / continguts

J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC

Page 16: Cerca d’informació a Internet: implicacions jurídiques

Amagant i trobant informació

• Ús de paraules clau “secretes”:pron,p0rn

4udio, 4ud10

• Fitxers 0day

• Enllaços HTML-like a enllaços P2P

J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC

Page 17: Cerca d’informació a Internet: implicacions jurídiques

Problemes

• Enllaços trencats / permanents• Versions prèvies (cache)• Vulnerabilitats del programari• Patrons de navegació (cas AOL)

Model opt-outJ. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC

Page 18: Cerca d’informació a Internet: implicacions jurídiques

Canvi de paradigma

Web 2.0D’un model productor-consumidor a un

altre on tots els usuaris “creen” i comparteixen contingut

J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC

Page 19: Cerca d’informació a Internet: implicacions jurídiques

Més problemes 2.0

• Un usuari A pot afegir un enllaç en el blog de B com a comentari a un post apuntant a un contingut sensible en un servidor de C

• Un usuari A penja (i etiqueta) una foto on apareix un usuari B; un altre usuari C (amic del primer) té accés

J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC

Page 20: Cerca d’informació a Internet: implicacions jurídiques

“Futurs” problemes 3.0

• Amb cerques contextualitzades serà possible esbrinar moltes coses dels usuaris:–On treballa

–Per on es mou

–Què consumeix

–Quin tipus d’amics téJ. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC

Page 21: Cerca d’informació a Internet: implicacions jurídiques

Privacitat dels usuaris

• Privacitat vs personalització

• Opt-in vs Opt-out

• Egosurfing

Alguns usuaris canviarien la seva privacitat per una “piruleta”!

J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC

Page 22: Cerca d’informació a Internet: implicacions jurídiques

Responsabilitats

• Qui crea / penja el contingut

• Qui l’enllaça públicament

• Qui re-publica l’enllaç / contingut

• Qui permet trobar-lo

• Qui pot eliminar-lo

• ...J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC

Page 23: Cerca d’informació a Internet: implicacions jurídiques

Responsabilitats

• Usuaris finals

• Proveïdors de serveis

• Cercadors

• Agregadors

• Xarxes socials

• DesenvolupadorsJ. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC

Page 24: Cerca d’informació a Internet: implicacions jurídiques

Debat

• La responsabilitat és principalment de qui penja el contingut

• Els proveïdors (cercadors) són responsables d’eliminar l’accés si són requerits

• El servei de caché dels cercadors és realment necessari?

J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC

Page 25: Cerca d’informació a Internet: implicacions jurídiques

Referències

http://en.wikipedia.org/wiki/World_Wide_Web

http://news.netcraft.com/archives/web_server_survey.html

http://www.internetworldstats.com/stats.htm

http://www.worldwidewebsize.com/

http://www.googleguide.com/google_works.html

http://en.wikipedia.org/wiki/Robots_Exclusion_Standard

http://www.hackersforcharity.org/ghdb/

http://w2.eff.org/Privacy/AOL/exhibit_d.pdf

J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC

Page 26: Cerca d’informació a Internet: implicacions jurídiques

Gràcies!

• Contacte:

Julià Minguillón

[email protected]

CC-BY-NC-SA

http://www.slideshare.net/jminguillonaJ. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC