[Workflow] - Opportunité de scraping : agences web qui ferment

Hello l’équipe,

J’ai une agence web en client, spécialisée Prestashop, qui m’a fait part du fait que 3 ou 4 agences concurrentes étaient en train d’arrêter Presta et il me demande si on arrive facilement à scrap ces boîtes.

Le workflow ce serait quoi selon vous ? un Bardeen avec un booléen Google > rechercher l’entreprise sur lkd > choper les personas en prospect > La Growth Machine ? Ou est-ce que vous avez d’autres astuces ? merci :slight_smile:

Comment tu fais pour savoir qu’une agence arrête prestashop ?

1 Like

Pardon c’est mal formulé

Je connais le nom des agences qui arrêtent prestashop, donc l’idée c’est de sourcer tous les sites presta que ces agences ont réalisé jusqu’à aujourd’hui (en général ils ont mis une mention « fait par xxx » en bas du site ou dans les mentions légales) pour que mon client puisse « reprendre » la maintenance qui ne sera plus assurée

1 Like

Helloo @Pierro_Marketo

Dans ce cas c’est easy, ça revient à ce que j’expliquais dans une discussion précédente aujourd’hui concernant les sites Solocal.

Si le site a été crée par exemple par : Réalisé par Agence Prestashop.com et il y a ce Footprint dans le Footer/mentions légales.

Tu peux remonter les sites en tapant dans Google " Réalisé par Agence Prestashop.com"

Pour scraper tous les résultats c’est simple, tu peux le faire avec instant data scraper ou comme la dit @Brice :

Avec un outils comme Outscraper, ScrapingBee ou Piloterr, tu vas pouvoir récupérer tous les résultats.

Pour trouver ensuite les dirigeants => Go SocieteInfo, en uploadant la liste des sites web.

Tu peux checker aussi du coté de Pharow il enrichit les Urls de site :wink:

2 Likes

Royal, au top. Et est-ce que tu aurais une solution pour n’afficher qu’une seule page du site où il y a cette mention ? car parfois je me retrouve avec des résultats où toute la page est un seul site fait par cette agence

Ou alors je scrap tout et je nettoie après ? :unamused:

1 Like

Tu aimerais quelle page ?

Et c’est quoi le footprint comme ça je regarde pour toi si tu veux ?

En fait je me suis mal exprimé, j’aimerais n’avoir que des résultats uniques, genre si il y a 1500 résultats il y a 1500 sites

Pour le footprint mon client est pas chaud de donner les noms mais en gros oui c’est « site créé par xx, site maintenu par xx » et c’est soit dans le footer donc n’importe quel page soit dans les mentions légales

@Pierro_Marketo : en complément du message de Jérôme, tu peux aussi utiliser SerpAPI pour récupérer facilement tous les résultats de recherche sur Google, à partir d’une requête booléenne optimisée comme dit précédemment. L’outil est ultra puissant pour récupérer n’importe quel type de contenu sur Google (search, map, local, ads, etc)

3 Likes

Ahhh excellent ca je connaissais pas !

Tu sais le paramètre qu’il faut utiliser pour ne sortir qu’un résultat par site ?

1 Like

Tu utilises des outils d’automation comme Make ?

Yes :+1: make zapier n8n

Quand tu utilises l’API, tu vas récupérer un array de résultats, et tu isoles/filtres pour récupérer uniquement la position 0 dans ton array pour récupérer le 1er résultat qui est censé être le plus fiable grâce à la reco de Google Search

Tu peux essayer en ciblant 1 page précise. Ca ne fonctionnera pas ds 100% des cas par contre.

Par exemple, une page mentions légales: "site réalisé par " inurl:mentions-legales - Google Suche

1 Like

Hello @Pierro_Marketo,

Si la SERP n’est pas concluante, y aussi la fameuse technique de se déclarer salarié dans la boîte cible sur Linkedin pour récupérer les personnes qui follow (si les entreprises cibles y sont).

Ce sera toujours ça de pris même s’il y a du déchet (je l’ai déjà fait pour un client).

:warning: Il faut changer de structure avant de souscrire à Sales Nav, on ne peut pas changer plusieurs fois de structure cible (le listing ne s’actualise pas).

1 Like

Si je comprends bien le gros plus de SerpAPI c’est d’avoir la connection API pour le mettre dans Make après c’est ça?

1 Like

Yes et de pouvoir scraper facilement les différents environnements de Google : Search, Maps, Local, Ads, etc avec pas mal de paramètres de recherche personnalisables. Et tu peux faire la même chose sur Yahoo, Bing, etc. Toute la doc est disponible ici > Google Search Engine Results API - SerpApi