Cerca d’informació a Internet: implicacions jurídiques
-
Upload
julia-minguillon -
Category
Technology
-
view
467 -
download
0
description
Transcript of Cerca d’informació a Internet: implicacions jurídiques
Cerca d’informació a Internet: implicacions jurídiques
Julià Minguillón
Universitat Oberta de Catalunya
Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
Taula de continguts• Què és això de la World Wide Web?• El concepte d’enllaç• Estadístiques de la web• Cercant i endreçant informació• Motors de cerca• Problemes• Responsabilitats• Debat: implicacions jurídiques
J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
La World Wide Web
1989-1990(Sir) Tim Berners-Lee proposa un
mecanisme per compartir documents entre ordinadors enllaçant-se uns amb els altres
J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
La World Wide Web
1990-1993Desenvolupament dels protocols
necessaris per a compartir documents:
• HyperText Transfer Protocol (HTTP)
• HyperText Markup Language (HTML)J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
La World Wide Web
1993-1994Apareixen els primers web sites
(llocs), pàgines web i navegadors:
• What’s new
• NCSA MosaicJ. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
El concepte d’enllaç• Cada document HTML (o recurs) en un
servidor té un identificador:
http://<servidor>/<cami>/<document>
• El llenguatge HTML permet enllaçar documents creant un graf dirigit (A → B)
• El client (navegador) permet “navegar” d’un document a l’altre
J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
Estadístiques
1993Uns pocs centenars de llocs
199410000 llocs
J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
Estadístiques
Avui> 200000000 llocs web
> 20000000000 pàgines web
> 1800000000 usuaris (26.6%)
400% creixement (2000-2009)
J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
Accés a la informació
EstratègiesBrowsing
Searching
J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
Browsing
• La web no té una pàgina inicial
• Organització jeràrquica:–Per tema
–Per idioma / àrea geogràfica
http://www.dmoz.org/
J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
Searching
Motors de cercaTres fases:
– Web crawler
– Creació de l’índex
– Gestor de consultesJ. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
Web crawlers
• Sistemes automàtics que visiten sistemàtica i repetidament un lloc, obtenint l’estructura i el contingut del mateix → web surfers
• Tot site té una pàgina inicial
• Si està enllaçat, s’hi pot accedir!
J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
Limitacions
• Accés protegit per paraula clau
• Ús de CAPTCHAs
• Tipus de recurs / document
• Cerca en profunditat / amplada
• Temps entre visites consecutives
• Protocol d’exclusió / inclusióJ. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
Protocol d’exclusió
• Fitxer robots.txt• Ha de ser públic
• No obliga, només indica
• Revela informació sensible!
Google hack: intitle:index.of robots.txt
J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
Problemes
• Els cercadors permeten trobar informació sensible
• El contingut i els seus enllaços són coses diferents
• Els usuaris poden enllaçar cap a informació sensible / continguts
J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
Amagant i trobant informació
• Ús de paraules clau “secretes”:pron,p0rn
4udio, 4ud10
• Fitxers 0day
• Enllaços HTML-like a enllaços P2P
J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
Problemes
• Enllaços trencats / permanents• Versions prèvies (cache)• Vulnerabilitats del programari• Patrons de navegació (cas AOL)
Model opt-outJ. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
Canvi de paradigma
Web 2.0D’un model productor-consumidor a un
altre on tots els usuaris “creen” i comparteixen contingut
J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
Més problemes 2.0
• Un usuari A pot afegir un enllaç en el blog de B com a comentari a un post apuntant a un contingut sensible en un servidor de C
• Un usuari A penja (i etiqueta) una foto on apareix un usuari B; un altre usuari C (amic del primer) té accés
J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
“Futurs” problemes 3.0
• Amb cerques contextualitzades serà possible esbrinar moltes coses dels usuaris:–On treballa
–Per on es mou
–Què consumeix
–Quin tipus d’amics téJ. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
Privacitat dels usuaris
• Privacitat vs personalització
• Opt-in vs Opt-out
• Egosurfing
Alguns usuaris canviarien la seva privacitat per una “piruleta”!
J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
Responsabilitats
• Qui crea / penja el contingut
• Qui l’enllaça públicament
• Qui re-publica l’enllaç / contingut
• Qui permet trobar-lo
• Qui pot eliminar-lo
• ...J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
Responsabilitats
• Usuaris finals
• Proveïdors de serveis
• Cercadors
• Agregadors
• Xarxes socials
• DesenvolupadorsJ. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
Debat
• La responsabilitat és principalment de qui penja el contingut
• Els proveïdors (cercadors) són responsables d’eliminar l’accés si són requerits
• El servei de caché dels cercadors és realment necessari?
J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
Referències
http://en.wikipedia.org/wiki/World_Wide_Web
http://news.netcraft.com/archives/web_server_survey.html
http://www.internetworldstats.com/stats.htm
http://www.worldwidewebsize.com/
http://www.googleguide.com/google_works.html
http://en.wikipedia.org/wiki/Robots_Exclusion_Standard
http://www.hackersforcharity.org/ghdb/
http://w2.eff.org/Privacy/AOL/exhibit_d.pdf
J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
Gràcies!
• Contacte:
Julià Minguillón
CC-BY-NC-SA
http://www.slideshare.net/jminguillonaJ. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC