Qualification Hotels

Hello le Play

Actuellement avec un client nous souhaitons cibler les hôtels parisiens :

  • 4/ 5 étoiles
  • Savoir s’ils ont un spa ou pas

Je sais bien que c’est compliqué d’obtenir ces informations via outils, mais peut-être existe-t-il des listes ou annuaires à scraper ?

Scrap.io ne semble pas fournir la qualif de 4 ou 5 étoiles. Si ?

Avez-vous des idées ou pistes ?

Merci par avance les players

Hello @Iker,

C’est le type d’infos très facile à récupérer en faisant de l’auto-crawling de website avec une sur-couche IA.

On a fait ça récemment pour un client dans le cadre d’une presta plus globale.

Mais on le fait pas en mode presta unique (je devance un peu ta prochaine question :wink:)

Je pense que tu dois pouvoir apprendre à faire ça en NO Code ou trouver un freelance qui sait le faire sans trop de difficulté…

tu veux dire que je sors la liste exhaustive via scrap ou pharow et ensuite crawl et qualif via Clay ?

Voilà comment nous l’avons fait :

  1. Scrap target leads (à partir de Sales Nav)
  2. Auto-crawl des company website (via N8n + ChatGpt 4)

En clair dans le workflow N8n on crée un prompt dans lequel on va demander à l’IA de regarder sur les websites si {data/info spécifique} est présente/mentionnée sur les sites crawlés.

Dans ton cas ça ferait un truc du genre :

« regarde dans la liste des websites URL si l’hôtel à 4 ou 5 étoiles et si il dispose d’un SPA »

1 Like

kdo les copains ca fait longtemps :heart:

ca prend littéralement 1 min sur l’un de mes saas, “rechercher un mot clé”

4 Likes

incroyable ! Merci Charles ! C’est Rocketlead que tu as utilisé ?

1 Like

Merci, ça fait plaisir Éloïse !
Oui, avec Rocketlead, mais ce travail n’est pas unique.
Sociétéinfo, Pharow… le font aussi, et en plus, ils ont l’intégration LGM. :wink:

Comme le dit Guillaume, on fait principalement du custom.

La méthode de travail que j’utiliserais pour tout ratisser, si quelqu’un lit ce post et qu’il doit industrialiser le processus :
On stocke tout le contenu d’un site web (en gros, on a une bibliothèque d’environ 4 millions de sites web et pas loin de 150 millions de pages).
On met les mots dans un Elasticsearch ou similaire, puis on effectue des requêtes (bien sûr, après avoir rattaché le contenu au site web correspondant).
Ensuite, on procède à des calculs d’espaces de mots, exclusions, inclusions.

Nous, on est l’équipe sans IA (enfin, sur ce coup-là, c’est nous l’oracle). Cela permet deux choses : d’avoir des coûts réduits (en plus, c’est bon pour l’écologie) et de résister à l’IA, un peu comme Astérix résiste aux romains. On essaie aussi de faire travailler notre cerveau au maximum avant de tomber dans la boite de pandore (c’est comme lire une carte routière, on arrive au même résultat qu’avec un GPS, on fait travailler notre cerveau mais on perd un chouille de temps, mais si un jour le gps ne fonctionne pas on est bien content).

Voilà ce que ça donne : une API pour un client qu’on n’a jamais sortie en SaaS, faute de temps.


( ca requete directement le mot spa, il faut creer une regle plus complexe)

2 Likes

Merci pour le partage du workflow @Guillaume.Albisetti
Pharow ou scrap.io me semble plus fiable en terme d’exhaustivité de l’audience par rapport à Sales Nav.
Pourquoi pars-tu de sales nav alors que sur le sujet hotelerie ?

Merciiiii @Charles_Camille
Peux-tu partager l’accès à mail@ikermorales.com ?

Societeinfo ou Pharow n’ont pas l’info sur le nombre d’étoile et si spa ou pas.
Pourquoi dis-tu que le font?

ils ont la recherche sémantique, tu peux croiser les infos ( alors oui c’est un peu complexe et long )

Ahah ok je comprends enfin.

Merci pour tes conseils.
Merci pour le fichier aussi, il cible toute la france mais c’est super cool cette liste de 500.

Je vais faire un test sur Paris et France et vous tiens au courant.
@Guillaume.Albisetti y compris.

@Eloise ca donne envie de revenir :wink:

1 Like

Je n’ai jamais dit qu’il fallait que tu partes de SN pour ton use case…

Je t’ai juste partagé ce que nous avions fait pour notre client (qui n’est pas dans l’hôtellerie)…

Ce qu’il fallait retenir c’était l’approche crawling avec N8n+ IA


Pharow, Societeinfo, etc., sont loin d’être exhaustifs en termes de volume de Data/total du marché adressable, bien qu’ils soient de très bons outils.

Ah pardon je pensais qu’il était dans l’hotellerie, d’ou ma confusion.
J’avais bien compris la couche crawl+IA

Merci @Guillaume.Albisetti

Hello,
J’ai déjà eu ce use case (étoiles uniquement), j’ai utilisé Booking pour la recherche et Apify pour scraper les boites.

Bonne chance !

1 Like

Pas con l’approche Booking !
:clap: @Clotilde_Mares !

1 Like

super @Clotilde_Mares et en plus ya bien le filtre SPA :slight_smile:

1 Like

Salut, j avais eut le cas avec une boîte qui voulait identifier les hôtels 3/4* avec un label ou une gamme de produits bio :

Le dataset est complet avec les étoiles + site web

  • Enrichissement avec clay : clay agent pour scraper et analyser le site web et detecter une mention

  • Pour les hotels ok avec clay
    - recupere le linkedin si existe puis les employés et enrichissement contact
    - recupere les infos de contacts génériques

En feedback : dans l’hôtellerie on a quand meme du passer par du contact générique car peu present en ligne en récupérant le nom du gérant

1 Like

Propre merci @laurent_rousset

génial cette liste ! merci pour le partage :v: