Qu'est-ce qu'une URLÂ ?Â
Une URL, ou Uniform Resource Locator, est l'adresse utilisée pour accéder à des ressources sur internet, comme des sites web, des images ou des vidéos. Elle sert de moyen pour accéder à ces ressources via le réseau internet. Une URL contient les informations nécessaires qui indiquent au navigateur ou à l'application la maniÚre de récupérer la ressource souhaitée.
Les URL constituent le fondement technique de l'internet tel qu'on le connaßt aujourd'hui. Lorsque l'on connecte deux URL entres elles on créé un lien. L'invention de ces liens (hypertexte pour les intimes) est l'idée deTim Berners-Lee que certains surnomment "le pÚre d'internet".
Ces liens tissent une toile d'oĂč internet tire son nom (le web), ils sont aussi Ă l'origine du succĂšs de Google qui a Ă©tĂ© le premier Ă intĂ©grer cette information dans son algorithme via le dĂ©sormais cĂ©lĂšbre PageRank.
Pourquoi les URLÂ sont importantes pour le SEOÂ ?
Les URL sont Ă votre SEO ce que votre carte d'identitĂ© est Ă votre personne.Â
- Elle identifient votre contenu : il existe une et une seule URL pour chaque contenu présent sur internet
- Elle authentifie ce contenu : vous ĂȘtes le propriĂ©taire du domaine, par voie de consĂ©quence ce contenu est le vĂŽtre (sauf dans le cas d'un hack ou d'un cas de typosquatting)
=>Â TODO : typosquatting
=> TODO : hacking
Ces deux qualitĂ©s sont apprĂ©ciĂ©es des moteurs de recherche et plus particuliĂšrement des crawlers.Â
Il faut bien comprendre que chaque URLÂ est unique, donc une URL ou un paramĂštre c'est une page de plus Ă crawler pour les moteurs de recherche.Â
=>Â TODO : trailing slash
=>Â TODO : www vs domaine nu
Cette opération étant coûteuse pour les crawlers une recommandation courante en SEO consiste à ne pas créer plus d'URL que de pages utiles. On appelle ça le budget de crawl.
Pour se faire il faut pour chaque URL créée :
- S'assurer que son contenu est utile
- Qu'elle n'a pas de page en doublon
- Qu'elle ne fait pas concurrence Ă une autre page sur le mĂȘme sujet
=>Â TODO : duplication
Le cycle de vie d'une URL
Une URL ça vit dans le temps :
- Une modification dans le backoffice
- Une erreur humaine
- Un bug
- Un produit qui n'est plus disponible
- Un script qui modifie les pages
- etc...
Par conséquent il est possible qu'une URL à un instant T n'existe plus à un instant T+1. Dans ce cas les serveur vont (sauf exception) retourner des codes de réponses spécifiques pour indiquer des changements : ce sont les fameuses 404 ou 301.
⚠En savoir plus sur : les codes de réponse HTTP
C'est quoi une bonne URLÂ ?Â
â
Documentation officielle de Google sur les URL
Les composants d'une URL
- Schéma (ou protocole) : il indique la méthode utilisée pour accéder à une ressource. Les exemples courants incluent 'http', 'https', 'ftp', etc. Le schéma est suivi de ://
- Le HTTP n'est pas encrypté, les informations circulent donc librement sur le réseau et quelqu'un de mal intentionné peut facilement les consulter
- A contrario le HTTPS est lui encryptĂ© et sĂ©curisĂ©. Reconnaissable Ă sont verrou đ vert, aujourd'hui une vaste majoritĂ© d'internet utilise se protocole.
- Sous-domaine : C'est une extension du domaine principal. Il est facultatif et précÚde souvent le domaine principal pour spécifier différentes sections ou services d'un site web. Exemple : "blog" dans "blog.exemple.com"
- On parle domaine nu lorsque qu'il n'y a pas de sous domaine, il est tout à fait possible d'accéder à une URL sans sous-domaine.
- On peut ajouter autant de sous-domaine que l'on veut, ainsi 2024.blog.baptiste-wallerich.fr est un nom de domaine tout Ă fait valide
- Domaine : identifie de façon unique le site web. Il est suivi d'une extension de domaine qui peut indiquer la nature ou l'origine géographique de la ressource, comme .com pour commercial, .org pour organisation, .fr pour la France...
- Les extensions génériques sont regroupée sous le terme GTLD pour Generic Top Level Domains
- Les extensions de pays sont regroupée sous le terme CCTLD pour Country Code Top Level Domains
- Chemin d'accÚs : AprÚs le domaine, le chemin indique l'emplacement spécifique de la ressource sur le serveur. Il est souvent structuré comme une hiérarchie de dossiers séparés par des barres obliques '/'.
- ParamĂštres de requĂȘte : ils commencent toujours par un point d'interrogation '?' et sont souvent utilisĂ©s pour spĂ©cifier des options ou des filtres. Ils sont constituĂ©s de paires clĂ©-valeur sĂ©parĂ©es par des signes Ă©gal =. Chaque paire est sĂ©parĂ©e par un signe &.
- Fragment (parfois appelé ancre) : facultative et précédée d'un diÚse #, l'ancre fait référence à une section spécifique d'une URL.
â
D'un point de vue purement technique le chemin d'accĂšs (4) et les paramĂštres de la requĂȘte (5) sont identiques : on les regroupe souvent sous le terme "slug"
â
Exemple d'une URL décomposée
â
Discussions