Mis à jour le 3 juillet 2026 · Relu et vérifié par Damien Hernandez
PerplexityBot : definition, role et bonnes pratiques SEO
PerplexityBot est le robot d’exploration de Perplexity, le moteur de reponse IA. Il indexe les contenus web pour alimenter les reponses citees de Perplexity, sans usage d’entrainement : Perplexity declare ne pas entrainer de modeles de fondation. En SEO, bloquer PerplexityBot retire un site des reponses de Perplexity, a l’inverse du blocage d’un bot d’entrainement.
A retenir
- PerplexityBot alimente l’index de reponse de Perplexity, pas l’entrainement de modeles (documentation Perplexity). Consequence : le bloquer retire un site des reponses citees, la ou bloquer GPTBot ou ClaudeBot ne touche que l’entrainement.
- Les requetes de PerplexityBot ont augmente de 157 490 % entre mai 2024 et mai 2025. C’est la plus forte croissance de tous les crawlers observes (Cloudflare, juillet 2025).
- En aout 2025, Cloudflare a documente des crawlers furtifs non declares contournant les blocages pour le compte de Perplexity. Perplexity a conteste ces conclusions. Cloudflare l’a retire de son programme de bots verifies (Cloudflare, aout 2025).
Comment fonctionne PerplexityBot ?
PerplexityBot explore le web pour construire l’index qui nourrit les reponses citees de Perplexity. Le robot s’identifie par la chaine User-Agent PerplexityBot/1.0 et Perplexity publie ses plages d’adresses IP dans un fichier JSON dedie, ce qui permet de verifier l’authenticite des visites. Selon la documentation Perplexity, PerplexityBot respecte le robots.txt, avec une limite notable : meme bloque, le domaine, le titre et un court resume factuel d’une page peuvent rester indexes. Perplexity opere un second agent, Perplexity-User, declenche quand un utilisateur demande la lecture d’une URL precise. La documentation assume que le robots.txt ne s’applique generalement pas a Perplexity-User, la requete etant traitee comme une action utilisateur. Point de vigilance : les pare-feu applicatifs (WAF) classent parfois ces agents comme scrapers malveillants et les bloquent silencieusement.
Pourquoi PerplexityBot est important pour le SEO ?
PerplexityBot pose une equation differente des bots d’entrainement. D’un cote, Perplexity affiche l’economie la plus favorable aux editeurs : son ratio crawl/trafic renvoye est le plus bas des grandes plateformes IA, sous 200 pages explorees par visite referee depuis septembre 2025 (Cloudflare, decembre 2025). Perplexity recompense aussi le SEO classique : pres d’une citation sur trois provient de pages du top 10 Google, la proportion la plus elevee des assistants IA etudies (Ahrefs, aout 2025). De l’autre cote, la confiance est entamee. L’investigation Cloudflare d’aout 2025 a observe des requetes hors plages IP declarees, sous User-Agent generique imitant Chrome, sur des dizaines de milliers de domaines. Consequence pratique : pour Perplexity plus que pour tout autre acteur, un blocage fiable passe par le serveur ou le WAF, pas seulement par le robots.txt.
| Critere | PerplexityBot | Perplexity-User |
|---|---|---|
| Role | Indexation du web pour les reponses citees de Perplexity | Lecture d’une URL a la demande d’un utilisateur |
| Robots.txt | Respecte selon la documentation Perplexity | Ne s’applique generalement pas, requete traitee comme humaine |
| Effet d’un blocage | Disparition des reponses citees de Perplexity | Page illisible lors des demandes directes d’utilisateurs |
Testez gratuitement le score d’extractibilite de vos chunks
PerplexityBot respecte-t-il le robots.txt ?
Officiellement oui : la documentation Perplexity declare que PerplexityBot honore les directives du robots.txt. Dans les faits, l’investigation Cloudflare d’aout 2025 a documente des crawlers furtifs non declares accedant a des contenus bloques, via des IP hors plages officielles et des User-Agents generiques. Perplexity a conteste ces conclusions. La position prudente : considerer le robots.txt comme un signal d’intention et doubler tout blocage critique d’une regle serveur ou WAF.
Faut-il bloquer PerplexityBot sur son site ?
Pour la plupart des sites, non. PerplexityBot n’alimente aucun entrainement de modele et conditionne la presence dans les reponses citees de Perplexity, un canal de visibilite qui renvoie du trafic. Le blocage se justifie pour les contenus payants ou exclusifs. Dans ce cas, ajoutez User-agent: PerplexityBot puis Disallow: / au robots.txt, et completez par une regle serveur, le robots.txt seul ne garantissant pas l’etancheite.
Exemple concret de configuration PerplexityBot
PerplexityBot doit etre autorise quand l’objectif est d’apparaitre dans les reponses citees de Perplexity. Exemple : un site de conseil peut laisser PerplexityBot crawler ses pages publiques de lexique, d’expertise et de services, tout en bloquant ses contenus premium ou confidentiels au niveau serveur. Cette configuration garde la visibilite GEO sur les contenus ouverts, sans exposer les espaces qui ne doivent pas servir de sources.
User-agent: PerplexityBot
Allow: /lexique-seo/
Allow: /consultant-seo/
Disallow: /contenus-premium/
Disallow: /espace-client/
Erreur frequente observee en audit
Cas reel. En audit GEO, l’erreur frequente consiste a traiter PerplexityBot comme un bot d’entrainement classique. Le site bloque PerplexityBot dans le robots.txt pour “se proteger de l’IA”, puis s’etonne de ne jamais apparaitre dans Perplexity. PerplexityBot alimente l’index de reponse, pas l’entrainement de modeles. La correction consiste a autoriser PerplexityBot sur les contenus publics a citer, puis a proteger les contenus sensibles avec des regles serveur, WAF ou authentification.
Termes lies

Damien Hernandez · Consultant SEO senior, 15 ans d’experience (Accor, Louvre Hotels, Infopro Digital). Specialiste SEO technique et GEO (optimisation pour les moteurs generatifs).