Descargar sitio completo con WebHTTrack

Después de colocar el problema planteado en el post sobre wget en el foro Ubuntu-es, apenas tuve que esperar unas horas para que Ketk me diese una solución parcial (gracias, Ketk). Parcial porque, efectivamente, con Webhttrack pude descargar sitios completos de wordpress con todos sus objetos; pero aún no sé si esto es posible hacerlo con wget. En cualquier caso, es muy interesante conocer de WebHTTrack.
WebHTTrack es una aplicación que nos permite la descarga a un directorio local de parte o de todo un sitio web (directorios, imágenes, pdfs, etc.) para poder estudiarlo posteriormente sin conexióna internet. El programa distingue entre enlaces internos (dirigidos a contenidos en el mismo web) y externos (dirigidos a otros sitios), adaptando los primeros y dejando intactos los segundos.
Su manejo es, en realidad, muy sencillo y consiste básicamente en 4 pasos:
1) Seleccionar el idioma (está en español)


2) Poner el nombre del proyecto (nombre del sitio en nuestro disco)


3) Seleccionar la(s) url(s)


4) Comenzar el proceso de descarga

Hay que prestar atención a lo que se nos dice en el manual de httrack en Manualinux: debemos llevar cuidado de elegir la opción correcta a la hora de continuar un proyecto interrumpido (por ejemplo, porque apagamos el PC) dado que, en caso contrario, podría borrarnos toda la información bajada hasta el momento. En caso de que interrumpamos un proyecto, lo correcto al reanudarlo es la opción “Continuar con proyecto interrumpido“. Esta opción NO es correcta cuando el Sitio o Sitios Web de los que se creó el proyecto, han desaparecido, o se ha borrado de ellos información importante que queremos conservar.

Webhttrack se encuentra en los repositorios de ubuntu, por lo que puede instalarse fácilmente desde synaptic o desde una terminal.

Anuncios

3 pensamientos en “Descargar sitio completo con WebHTTrack

  1. ¿Es tan así de simple? A mí me llevó a la tumba usar ello para bajar mi blog entero. Más abrió enlaces de redes sociales y nada más el index.html de mi sitio.
    ¿Podrías ser más específico con qué opciones lo ejecutaste? O, ¿con qué versión trabajaste?
    De todas maneras, gracias por la información.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s