Scrap les entreprises qui ont un site web fait par solocal et les enrichir

Salut, je cherche à scraper tous les sites web faits par Solocal et les enrichir par la suite avec le nom du dirigeant, le nom de l’industrie, le nom de l’entreprise, le site web et le profil LinkedIn personnel des décisionnaires pour ensuite prospecter.

Idéalement, j’aimerais le faire via des workflows gratuits.

à ma disposition j’ai instant data scraper + apollo.io + Linkedin Sales nav version d’essai.

Des idées ?

Salut, je cherche à scraper tous les sites web faits par Solocal et les enrichir par la suite avec le nom du dirigeant, le nom de l’industrie, le nom de l’entreprise, le site web et le profil LinkedIn personnel des décisionnaires pour ensuite prospecter.

Idéalement, j’aimerais le faire via des workflows gratuits.

à ma disposition j’ai instant data scraper + apollo.io + Linkedin Sales nav version d’essai.

Des idées ?

Hello,

Tu peux le faire en 1 clic avec Pharow !

Il y a un filtre pour cela :

3 Likes

Helloo,

Comme la dit Flavien avec Pharow tu peux le faire en deux cliques (scraping + enrichissement) donc super cool et pratique mais tu n’as que 6700 résultats au total. (Mais déjà de quoi faire)

De mon coté je le fais avec un footprint qui est laissé sur chaque site Solocal dans le footer et j’ai pu en sortir + de 300K.

Il suffit de taper « réalisé par solocal » et après tu scrap avec Instant data ou alors de mon coté je fais un scraper sur Automa pour tout aspirer et enrichir par la suite les urls de site avec Contactfinder.io par exemple.

Voila voila :wink:

3 Likes

Salut @H-Ash !
J’aime ce genre de challenge :+1:

J’ai trouvé un site solocal. Exemple: https://www.foralab.fr

Si tu regardes dans ses mentions legales, tu vois ca:

Bingo !

Maintenant tu sais que Solocal se mentionne lui meme ds les mention légales :wink:

Donc tu peux utiliser google pour scraper tous les sites, et rechercher les pages dont le texte contient « Ce site a été conçu et réalisé par Solocal » :slight_smile:

Pour ca, tu dois utiliser la recherche google suivante:

"Ce site a été conçu et réalisé par Solocal" ← avec des guillemets.

Ca donne ca => Rechercher tous les sites SoLocal

Screenshot 2024-02-20 at 18.19.48

Pour scraper tout ca, tu vas ensuite devoir découper ta requetes (parce que google ne retourne que 100 pages de résultats) en ajoutant des mots comme une ville, un metier…ou ce que tu veux.

Avec un outils comme Outscraper, ScrapingBee ou Piloterr, tu vas pouvoir récupérer tous les résultats.

Pour trouver ensuite les dirigeants => Go SocieteInfo, en uploadant la liste des sites web

giphy

3 Likes

La version sous stéroïdes by @jerome.Rossat :joy::fire:

2 Likes

Haha tu m’as tué @Guillaume.Albisetti :joy:

@H-Ash : en complément de tout ce qui a été dit, tu peux aussi utiliser SerpAPI pour récupérer facilement tous les résultats de recherche sur Google, à partir d’une requête booléenne optimisée comme dit précédemment. L’outil est ultra puissant pour récupérer n’importe quel type de contenu sur Google (search, map, local, ads, etc)

1 Like

SerpAPI est couteux, en alternative il y a Autom (même archi que Piloterr) pour scraper les SERP Google/Bing/Brave (dont les rich_snippet): https://www.autom.dev . J’ai déjà vu des dev faire le use-case sur Solocal ^^

1 Like

Au lieu de s’embêter avec le footprint, si je ne me trompe pas, tous ceux qui ont un site Solocal sont référencés sur : https://www.pagespro.com/.

Pour ton exemple @Brice :

https://www.pagespro.com/fiches/RlBSVEpAQF4

Il y a même le mail/tel/siret.

Et le sitemap de pagespro est ici :

https://www.pagespro.com/statics/pagespro/sitemaps/fd/pagespro_sitemap_index_fd.xml

2 Likes

merci Camille, je peux les scrapes si ca interesse du monde et les mettre sur rocket, je finis le back du clone de pharow, pour pas défocus dans 3 semaines vous l’avez via l’app de rocket

2 Likes

Et oui les meilleurs viennent de gh…

1 Like

c’est pas du nocode, l’élite, les commandos, enfaite non le no-life pas beau , hate de voir la gruge arriver

Tellement plus simple :rofl:

Tellement TROP simple !! Comment ils peuvent lister leurs clients et leurs mails aussi simplement. Vive pages jaunes.

2 Likes

Ils ont un rythme de réunions c’est tout ce que je peux dire :joy:

Salut Charles, est-t-il possible d’échanger à propos du scraping du site PagesPro ? Car ca fait un p’tit moment que j’essaie avec les moyens (assez faibles) que j’ai en ma possession mais je bloque.

Salut Elyes,

En tout honnêteté page pro a pas trop de contenu :

de mémoire : 70 k lignes … 30 k sociétés avec des url et c’est pas hyper propre ( pas mal d’infos pas bonnes), j’ai tout jeté, ma data de mes Saas sont de meilleurs qualités.

Ah d’accord je vois, merci quand même, puis-je avoir le nom de tes Saas car je suis actuellement à la recherche d’un moyen de leadsourcer des prospect sans sites web (voir avec des sites web médiocres comme Solocal) pour leur proposer de la création de site web.