[Html] ¿Cómo descargar el directorio HTTP con todos los archivos y subdirectorios tal como aparecen en la lista de archivos / carpetas en línea?



Answers

Pude hacer que esto funcionara gracias a esta publicación que utiliza VisualWGet . Funciono muy bien para mi. La parte importante parece ser verificar el indicador -recursive (ver imagen).

También se encontró que la bandera de -no-parent es importante, de lo contrario, intentará descargar todo.

Question

Hay un directorio HTTP en línea al que tengo acceso. Intenté descargar todos los subdirectorios y archivos a través de wget. Pero, el problema es que cuando wget descarga subdirectorios, descarga el archivo index.html que contiene la lista de archivos en ese directorio sin descargar los archivos ellos mismos. ¿Hay alguna manera de descargar los subdirectorios y archivos sin límite de profundidad (como si el directorio que deseo descargar fuera solo una carpeta que quiero copiar a mi computadora)?




wget -r -np -nH --cut-dirs=3 -R index.html http://hostname/aaa/bbb/ccc/ddd/

Del man wget

'-r' '--recursive' Active la recuperación recursiva. Ver descarga recursiva, para más detalles. La profundidad máxima predeterminada es 5.

'-np' '--no-parent' No ascienda nunca al directorio padre al recuperar recursivamente. Esta es una opción útil, ya que garantiza que solo se descargarán los archivos debajo de cierta jerarquía. Vea Límites basados ​​en el directorio, para más detalles.

'-nH' '--no-host-directories' Desactiva la generación de directorios con el prefijo del host. Por defecto, al invocar Wget con '-r http://fly.srk.fer.hr/ ' se creará una estructura de directorios que comenzará con fly.srk.fer.hr/. Esta opción deshabilita tal comportamiento.

'--cut-dirs = number' Ignorar los componentes del directorio de números. Esto es útil para obtener un control preciso sobre el directorio donde se guardará la recuperación recursiva.

Tome, por ejemplo, el directorio en ' ftp://ftp.xemacs.org/pub/xemacs/ '. Si lo recuperas con '-r', se guardará localmente en ftp.xemacs.org/pub/xemacs/. Si bien la opción '-nH' puede eliminar la parte de ftp.xemacs.org/, aún está atascado con pub / xemacs. Aquí es donde '--cut-dirs' es útil; hace que Wget no "vea" los componentes del directorio remoto de números. Aquí hay varios ejemplos de cómo funciona la opción '--cut-dirs'.

Sin opciones -> ftp.xemacs.org/pub/xemacs/ -nH -> pub / xemacs / -nH --cut-dirs = 1 -> xemacs / -nH --cut-dirs = 2 ->.

--cut-dirs = 1 -> ftp.xemacs.org/xemacs/ ... Si solo quiere deshacerse de la estructura del directorio, esta opción es similar a una combinación de '-nd' y '-P'. Sin embargo, a diferencia de '-nd', '--cut-dirs' no pierde con los subdirectorios, por ejemplo, con '-nH --cut-dirs = 1', un subdirectorio beta / se colocará en xemacs / beta, como uno esperaría




Links