Balise noindex

Définition : qu’est-ce qu’une balise noindex ?

Toutes les pages d’un site ne sont pas bonnes à indexer et à afficher dans les résultats de recherche. Il est donc important de contrôler la prise en compte de certaines de vos pages par Google. C’est pourquoi la balise noindex est utilisée par de nombreux webmasters.

Cette balise permet d’indiquer à Google les pages à ne pas indexer ni à afficher dans les résultats de recherche. Elle peut être complétée par une balise “dofollow” ou “nofollow”, qui permettent, quant à elle, d’indiquer aux moteurs de recherche s’ils doivent, ou non, suivre les liens présents sur la page.

img

Intérêt des balises noindex en SEO

La balise noindex joue un rôle très important en SEO. En effet, elle permet de protéger votre site des pages qui pourraient le pénaliser, en empêchant leur référencement. En outre, une telle balise n’empêche pas pour autant Google de suivre les liens sur la page si vous ajoutez une balise dofollow dans le code de votre page. Elle est donc très utilisée en SEO pour optimiser au maximum le référencement d’un site et de ses pages.

Les différentes méthodes pour ajouter une balise noindex dans une page

Il existe différentes méthodes pour intégrer une balise noindex dans une page. Aucune n’est très compliquée, il s’agit simplement de choisir celle la plus adaptée à votre site web.

Dans le header

Il est possible d’insérer une balise noindex directement dans la section head de votre page, à condition d’avoir accès à son code source. Cette balise se présente sous la forme suivante : “meta name=”robots” content=”noindex”.

En outre, si vous souhaitez appliquer votre balise noindex à un moteur de recherche en particulier, il vous suffit de remplacer le terme “robots” par le nom du robot en question, comme, par exemple, “Googlebot”.

Dans l’en-tête HTTP

La deuxième méthode consiste à insérer votre balise noindex dans l’en-tête HTTP de votre page. Cette méthode est généralement utilisée pour les documents PDF, Powerpoint, Word, ou tout autre document ne contenant pas de code HTML. Il vous suffit d’insérer dans l’en-tête HTTP de la page la formule suivante :

HTTP/1.1 200 OK
(…)
X-Robots-Tag: noindex
(…)

Les directives Nofollow et Follow

Vous pouvez ajouter à votre balise noindex des directives permettant d’indiquer à Google s’il peut ou non suivre les liens présents sur la page.

Si vous souhaitez empêcher les moteurs de recherche de suivre les liens sur votre page, utilisez la balise nofollow. Au niveau du code, cela se présentera sous la forme suivante : “meta name=”robots” content=”noindex, nofollow”.

De même, si vous souhaitez autoriser le suivi de ces liens, utilisez alors la balise follow. Votre code sera alors de la forme suivante : “meta name=”robots” content=”noindex, follow”.

Quand utiliser une balise noindex ?

Lorsqu’un robot crawler se rend sur un site, il en visite toutes les pages, sauf en cas d’indications précises dans le fichier robots.txt. Ainsi, si aucune indication concernant l’indexation des pages n’est ajoutée, alors il risque d’indexer tout votre site. Or, certaines de vos pages n’ont aucun intérêt en termes de SEO, et risquent d’impacter négativement votre référencement. Il est donc intéressant, dans le cadre de votre stratégie SEO, de limiter l’indexation de vos pages à certaines d’entre elles afin de privilégier la qualité à la quantité. Voici quelques-uns de ces types de pages dont il est intéressant d’empêcher l’indexation.

img

Pour les moteurs de recherche internes

Il est courant d’intégrer un moteur de recherche interne à votre site web afin d’y faciliter la navigation des internautes, et ainsi améliorer l’expérience utilisateur. Mais les pages associées à ce moteur de recherche interne ne présentent généralement aucun intérêt particulier en termes de SEO. C’est pourquoi il est intéressant d’en empêcher l’indexation.

Pour les contenus pauvres ou dupliqués

Un des principaux critères pris en compte par Google dans son classement des résultats de recherche est la qualité du contenu proposé. Or, les recherches à facettes, la page panier, les filtres de tri, ou autres fonctionnalités que l’on retrouve couramment sur les sites de e-commerce ont tendance à provoquer la création de nombreuses pages à pauvre contenu ou dupliquées.

Il est donc intéressant, dans le cadre de votre stratégie SEO, d’empêcher l’indexation de telles pages grâce à la balise noindex.

Pour les fichiers PDF

Dans certains sites, des fichiers PDF sont intégrés. Ce type de pages n’a aucun intérêt en termes de SEO. En effet, généralement, les fichier PDFs contiennent du contenu protégé par des droits d’auteur, ou encore des livres blancs destinés uniquement à vos clients ou prospects. Il est donc intéressant d’intégrer une balise noindex dans l’en-tête HTTP de ces fichiers pour en empêcher l’indexation.

Pour les pages de compte client

Finalement, le dernier type de page dont il est intéressant d’empêcher l’indexation sont les pages liées aux comptes clients. Ce sont généralement des pages de connexion, de mot de passe oublié, de création de compte, donc des pages non seulement de faible contenu, mais dont le peu de contenu présent est peu intéressant en termes de SEO. La balise noindex est donc souvent utilisée pour en empêcher l’indexation.