Académies Françaises - Listes de diffusion et dorking

Hello tout le monde !! Petit sujet pour les malins et malines du forum

J’ai une colonne sheets avec tous les noms de domaine des académies françaises. Il existe pour chaque académie un site en sous-domaine qui répertorie les listes de diffusion de ces académies, avec des contacts directs pour certains types de profs etc.

Exemple :

Les urls de ces listes de diffusion diffèrent pour chaque académie mais c’est presque toujours les mêmes patterns, avec quelques différences dans les URLs

Est-ce que c’est faisable de faire tourner une automation Clay ou un autre script qui teste toutes les URL’s jusqu’à trouver celle qui contient toutes les listes de diffusion ? et ensuite les scrap avec Claygent ou Python ?

Hâte d’avoir vos avis malins

Pour la partie 2 (scrap + enrich custom des urls)
J’ai un truc à te faire tester :wink:

On en parle en DM si tu veux, @Pierro_Marketo ?

1 Like

@Guillaume.Albisetti tu peux m’en faire profiter
j’ai regardé vite fait les url, a scrapé ca prend 5 min montre en main, il doit y’avoir une vingtaine d’académie, en gros en 2h00, c’est fait, mais si tu as un process automatique ca m’interesse