Ripper des sites Web avec HTTrack Website Copier

HTTRack est un porgramme gratuit pour Windows et divers systèmes d'exploitation basés sur Unix que vous pouvez utiliser pour copier le contenu d'un site Web sur votre système local. Il vous permet de télécharger toutes les pages et informations d'un site Web sur le système local. Ceci est communément appelé l'extraction de sites Web. Bien que ce soit sa plus grande force, vous pouvez également l'utiliser pour télécharger rapidement une seule page d'un site Web ou une catégorie à la place.

C'est un programme destiné aux utilisateurs expérimentés et à ceux qui n'hésitent pas à passer du temps à explorer toutes les options qu'il propose. Il offre de nombreuses options de configuration qui peuvent sembler intimidantes au début, mais si vous passez par cette phase initiale, vous apprécierez certainement ce qu'il a à offrir. La plupart des paramètres sont facultatifs et vous aident à gérer des sites Web de cas spéciaux qui utilisent beaucoup de scripts, des pages générées dynamiquement ou nécessitent une authentification.
Une question qui peut se poser est de savoir pourquoi vous voudriez déchirer un site Web sur votre système local? Il y a plusieurs raisons à cela. Vous souhaitez peut-être rendre le contenu du site disponible pour la navigation hors ligne. Cela peut être utile si un PC sur lequel vous avez besoin d'informations n'a pas de connexion Internet, ou du moins pas de connexion permanente. Cela peut également être utile si vous savez ou craignez qu'un site puisse être mis hors ligne dans un proche avenir. Le programme peut vous aider à conserver les informations en les téléchargeant toutes sur votre système.Vous pouvez enfin l'utiliser pour créer une sauvegarde locale de votre propre site, même s'il existe généralement d'autres options disponibles à cet égard.Enregistrement de sites Web sur l'ordinateur local



httrack

  1. Une fois que vous avez installé l'application, lancez-la et cliquez sur Suivant sur le premier écran.
  2. Nommez votre projet et attribuez-lui une catégorie (facultatif). Je vous recommande d'utiliser le nom du site ici.
  3. Le chemin de base est l'emplacement où le site Web sera stocké. Assurez-vous que vous disposez de suffisamment d'espace Web sur le lecteur. Cliquez ensuite sur suivant.
  4. Vous pouvez désormais saisir une ou plusieurs adresses Web dans un formulaire que vous souhaitez traiter. Vous pouvez également charger un fichier texte contenant une liste d'URL dans le programme.
  5. L'action définit ce que vous voulez que le programme fasse avec les URL. L'action par défaut consiste à télécharger des sites Web, mais vous pouvez la modifier pour mettre à jour un téléchargement existant, tester des liens sur le site et une variété d'autres. Habituellement, télécharger des sites Web est le bon choix ici.
  6. Cliquez sur définir les options pour définir les préférences. Ceci est important et ne doit pas être ignoré.
  7. Les onglets de préférences importants sont les limites, que vous utilisez pour définir la profondeur maximale de mise en miroir (en fonction des liens que le programme suivra), et les règles d'analyse que vous pouvez utiliser pour inclure ou exclure certains liens ou types de données.
  8. Je vous recommande de consulter également les autres onglets ici pour avoir une compréhension de base des fonctionnalités du programme. La plupart peuvent cependant être conservés à leurs niveaux par défaut.
  9. Vous pouvez ajuster les paramètres de connexion à la page suivante. Ici, vous pouvez par exemple choisir d'éteindre le PC lorsque vous avez terminé ou de déconnecter la connexion Internet.

Le site HTTrack propose un guide étape par étape que vous pouvez utiliser pour connaître le programme et le cœur de ses fonctionnalités. Cela devrait suffire à déchirer votre premier site Web. HTTrack est disponible pour Windows et Unix, Linux et BSD.



La meilleure façon de démarrer avec HTTrack est de consulter le manuel publié sur le site qui vous guide dans la copie de votre premier site Web à l'aide du programme. Vous pouvez également consulter nos tutoriels sur le sujet, par exemple comment enregistrer des sites Web sur votre disque dur ou comment déchirer la plupart des sites Web.

Conseils

  1. Le programme génère un fichier journal chaque fois qu'il exécute une opération. Utilisez-le pour rechercher des erreurs et des problèmes et ajuster le projet en conséquence.
  2. Vous pouvez télécharger des versions 32 bits ou 64 bits pour Windows à partir du site Web du développeur. Le programme est également disponible en version portable. Assurez-vous d'exécuter WinHTTrack.
  3. Le programme prend en charge le protocole https (SSL).
  4. L'option «obtenir des fichiers à proximité des liens» vous permet de télécharger des fichiers hébergés sur des sites Web tiers sans configurer le programme pour qu'il explore également ces sites tiers.