Scraping PagesPro

Salut, j’ai déjà vu le sujet passé dans le forum, mais il n’y avait aucun élément de réponse concret.

Voilà ma requête, j’aimerais avoir un peu d’aide pour scraper ce site là : https://www.pagespro.com/recherche/auto/Paris%20(75)/toiture

L’idéal serait d’extraire pour chaque résultat les données présent en 2nd pagination (donc les données qui s’affiche quand on clique sur une entreprise) :

  • Le nom de l’entreprise
  • Le numéro de téléphone-
  • Le site web
  • L’adresse -
  • Le numéro de siret (présent en bas de page pour certain résultats)-

Le problème que je retrouve c’est qu’il y’a un lien qui mène à la fiche détaillé qu’une fois sur trois et c’est la ou je bloque.

Voilà vous savez tout :slight_smile:

Hello Elyes !

Tu utilises quoi pour scraper ?
Avec du Octoparse ou une solution similaire tu pourrais extraire les liens de chaque page pro et ensuite aller chercher la data qui t’intéresse page par page.
C’est pas le scrap le plus compliqué à réaliser mais c’est jouable :slight_smile:

le site est moyennement interessant, on la scrape et y a que 70 k sociétés, et en volume peu on un site web, en vrai c’est pas hyper interessant. c’est quoi ton objectif

Justement ça m’arrange si peu ont un site web, c’est pour proposer de la création de site web

J’avais pas tester octoparse, j’y jetterais un coup d’œil merci !