Search

Search
- Search

Récupérer les pdf d’un site

par Gwenaël Cléon|Publié 21 mars 2015

Supposons que l’on veuille récupérer tous les fichiers pdf en lien sur une page web. Il existe un outil magique pour ce genre d’opérations : wget. La commande est très simple :

 wget http://www.page_pleine_de_pdf.html -r -l 1 -A pdf

Remarque : sous linux, wget est installé par défaut. Sous Mac OS X il faut l’installer soit en compilant les sources, soit en récupérant un package précompilé par exemple ici (en fait OSX intègre un autre outil similaire : curl).

Laissez un commentaire Annuler la réponse