viernes, 13 de julio de 2012

descargar todos los links

para descargar una página y todos sus links de primer nivel, basta con hacer:

#!/bin/bash -x
read -p "indique directorio raíz " RAIZ
curl $RAIZ >/tmp/raiz.html
sed -e 's/="/ /g
   s/="/ /g
   s/">/ /g
   s/"/ /g
   s/</ /g   ' /tmp/raiz.html >> raiz.html
for i in $(cat raiz.html|tr ' ' '\n'|grep http); do wget $i; done