Bajar Web Completa Wget
-
Upload
joel-omar-burgos-palacios -
Category
Documents
-
view
223 -
download
0
Transcript of Bajar Web Completa Wget
7/24/2019 Bajar Web Completa Wget
http://slidepdf.com/reader/full/bajar-web-completa-wget 1/1
BAJAR WEB COMPLETA
GNU Wget es una herramienta de software libre que permite la descarga de contenidos desde
servidores web de una forma simple. Su nombre deriva de World Wide Web (w), de !obtener" (en
ingl#s get), esto quiere decir$ obtener desde la WWW.
%ctualmente soporta descargas mediante los protocolos &'', &''S '.
*ntre las caracter+sticas ms destacadas que ofrece wget est la posibilidad de fcil descarga de
mirrors (espe-os) comple-os de forma recursiva, conversin de enlaces para la visuali/acin decontenidos &'01 localmente, soporte para pro2ies3
*s cierto que e2isten otras aplicaciones que nos audan a reali/ar este tipo de labores como
httrac4 o incluso e2tensiones para irefo2 como Scrapboo4, pero nada como la sencille/ de un
terminal $5
&aciendo la magia
0e result curioso en la pel+cula$ 'he Social Networ4, como el persona-e de 0ar467uc4erberg usala frase$ 8Un poco de wget mgico8, cuando se dispon+a a descargar las fotos para acemash es
cierto, wget permite hacer magia con los parmetros adecuados.
9eamos un par de e-emplo, comencemos con el uso sencillo de la herramienta.
Para bajar una página:
:; $ wget http://blog.paginaquedeseenbajar.net/con-el-terminal-bajar-un-sitio-web-completo-con-wget
Para bajar el sitio completo de forma recursiva, incluyendo imágenes y otros tipos de datos:
=> $ wget -r http://blog. paginawebquedeseenbajar .net/
< aqu+ viene la magia. =omo bien nos e2plican en el art+culo de HumanOS, muchos sitios verifican
la identidad del navegador para aplicar diversas restricciones. =on Wget podemos burlar esto de
la siguiente forma$
:; wget -r -p -U Mozilla http://blog. bajarpaginaweb .net/
> tambi#n podemos hacer pausa entre cada pgina, a que de lo contrario el due?o del sitio puede
darse cuenta que e estamos ba-ando el sitio completamente con Wget
:;wget --wait=2 --limit-rate=2! -r -p -U Mozillahttp://blog.desdelinu".net/