Chunk : definition, role et bonnes pratiques SEO

Mis a jour le 2 juillet 2026 · Relu et verifie par Damien Hernandez

Chunk : definition, role et bonnes pratiques SEO

Un chunk, ou passage autosuffisant, est un segment court d’un contenu web, comprehensible sans lire le reste de la page. C’est l’unite que les moteurs IA recuperent, notent et citent, a la place de la page entiere. En SEO, la qualite des chunks conditionne la selection d’un contenu comme source dans les reponses generees.

A retenir

  • Le critere central d’un chunk est l’autosuffisance : extrait seul de la page, le passage reste exploitable. Les praticiens SEO convergent vers 150 a 300 mots, sans standard officiel. La recherche nuance ce repere. Les petits chunks (64 a 128 tokens) optimisent les reponses factuelles, les grands (512 a 1024 tokens) le contexte (arXiv, analyse multi-datasets, 2025).
  • Les moteurs IA raisonnent en extraits, pas en pages. Perplexity decrit la recuperation d’environ 26 000 extraits par requete, soit 130 000 tokens. Objectif : saturer la fenetre de contexte du modele pour limiter les hallucinations (Jesse Dwyer, Perplexity, via Search Engine Journal).
  • Le sujet divise. Google juge le chunking peu durable comme strategie (John Mueller et Danny Sullivan, podcast Search Central). Les mesures disent l’inverse. Les sections de 120 a 160 mots recoivent 70 % de citations ChatGPT en plus que celles de moins de 50 mots (SE Ranking, 2026).

Comment fonctionne un chunk ?

Un chunk est l’unite de traitement des systemes de recuperation IA. Quand un moteur genere une reponse, il ne lit pas les pages de haut en bas : il decoupe les contenus en segments, transforme chaque segment en vecteur numerique (embedding), puis recupere les segments les plus proches semantiquement des sous-requetes du query fan-out. Cette logique descend de l’architecture des Transformers, qui analysent le texte par fenetres de quelques centaines de tokens, et prolonge le passage ranking que Google applique depuis 2021 a la recherche classique. Les titres H2 et H3 jouent un role structurant : beaucoup de systemes les utilisent comme delimiteurs naturels de chunks, et le titre est souvent inclus dans le segment qu’il coiffe, ce qui ancre semantiquement tout le passage. Un titre formule en question precise augmente donc la probabilite de recuperation du chunk correspondant.

Pourquoi le chunk est important pour le SEO ?

Le chunk est devenu l’unite de competition des moteurs IA : le query fan-out recupere des chunks, le grounding injecte des chunks, la citation recompense un chunk. La selection est rude : seules 15 % des pages recuperees par ChatGPT apparaissent dans les reponses finales (Search Engine Land, 2026). Une page peut donc ranker en SEO classique et rester invisible pour l’IA si ses passages ne survivent pas a l’extraction. Cinq proprietes font un chunk extractible. L’entite principale nommee dans la premiere phrase, jamais un pronom. Un fait verifiable, chiffre et source quand le sujet le permet. Des phrases courtes, une affirmation par phrase. Zero reference au reste de la page, ni comme vu plus haut ni pronom a referent distant. Et une seule idee par chunk : un paragraphe qui melange definition, exemple et nuance a un centre semantique flou, donc un score de recuperation faible. Le debat sur la durabilite de la pratique existe, mais l’argument operationnel tient : structurer en passages autonomes va dans le sens des systemes d’extraction, y compris du passage ranking de Google, et ne peut pas nuire.

CritereChunk autosuffisantParagraphe de transition
Reference au contexteAucune, entite nommee et idee completePronoms et renvois au reste de la page
Densite factuelleFait precis, chiffre, date, source nommeeGeneralites et liaisons narratives
Valeur pour l’IARecuperable et citable tel quelEcarte au scoring, centre semantique flou

Testez gratuitement le score d’extractibilite de vos chunks

Quelle est la taille ideale d’un chunk ?

Il n’existe pas de taille officielle, mais les recommandations des praticiens convergent entre 150 et 300 mots, soit environ 200 a 400 tokens. En dessous, le passage manque de contexte pour etre compris seul. Au-dela, il risque d’etre tronque ou dilue au decoupage. La regle pratique prime sur le comptage : un chunk couvre une idee complete, formulee en phrases courtes, avec l’entite et le fait principal en tete.

Le decoupage en chunks est-il vraiment utile pour le SEO ?

Le sujet divise la communaute SEO. Google a declare que le chunking n’etait pas une strategie durable (John Mueller et Danny Sullivan, podcast Search Central), les IA decoupant deja les contenus automatiquement. Le terrain observe l’inverse d’un gadget : de meilleures reprises dans les reponses IA, un impact positif sur le SEO classique et une lisibilite humaine accrue. La position raisonnable : des sections autonomes et claires servent tous les systemes, avec ou sans le mot chunking.

Exemple concret de chunk SEO

Un chunk SEO doit pouvoir etre extrait sans perdre son sens. Exemple faible : “Cette methode permet d’ameliorer les performances du site et de corriger les problemes les plus frequents.” Exemple autosuffisant : “Un audit de crawl identifie les pages explorees par Googlebot, les URLs bloquees, les erreurs HTTP, les redirections inutiles et les pages orphelines afin de comprendre comment le budget de crawl est consomme.” Le second passage nomme l’entite, precise le perimetre et reste exploitable hors contexte.

Erreur frequente observee en audit

Cas reel. En audit de contenus, l’erreur frequente consiste a croire qu’un paragraphe bien ecrit est automatiquement un bon chunk. Un paragraphe peut etre fluide pour un lecteur humain, mais inutilisable pour une IA s’il commence par “cette approche”, “ce point” ou “dans ce cas”. Une fois extrait, le passage perd son sujet. La correction consiste a reecrire chaque chunk avec l’entite en premiere phrase, une idee unique, un contexte suffisant et aucune dependance avec le paragraphe precedent.

Termes lies

Damien Hernandez, consultant SEO senior

Damien Hernandez · Consultant SEO senior, 15 ans d’experience (Accor, Louvre Hotels, Infopro Digital). Specialiste SEO technique et GEO (optimisation pour les moteurs generatifs).

En savoir plus · LinkedInLinkedIn de Damien Hernandez