DĂ©butant
#
Technique

Les URL

👉 Sommaire de l'article

Qu'est-ce qu'une URL ? 

Une URL, ou Uniform Resource Locator, est l'adresse utilisée pour accéder à des ressources sur internet, comme des sites web, des images ou des vidéos. Elle sert de moyen pour accéder à ces ressources via le réseau internet. Une URL contient les informations nécessaires qui indiquent au navigateur ou à l'application la maniÚre de récupérer la ressource souhaitée.

Les URL constituent le fondement technique de l'internet tel qu'on le connaßt aujourd'hui. Lorsque l'on connecte deux URL entres elles on créé un lien. L'invention de ces liens (hypertexte pour les intimes) est l'idée deTim Berners-Lee que certains surnomment "le pÚre d'internet".

Ces liens tissent une toile d'oĂč internet tire son nom (le web), ils sont aussi Ă  l'origine du succĂšs de Google qui a Ă©tĂ© le premier Ă  intĂ©grer cette information dans son algorithme via le dĂ©sormais cĂ©lĂšbre PageRank.

Pourquoi les URL sont importantes pour le SEO ?

Les URL sont à votre SEO ce que votre carte d'identité est à votre personne. 

  • Elle identifient votre contenu : il existe une et une seule URL pour chaque contenu prĂ©sent sur internet
  • Elle authentifie ce contenu : vous ĂȘtes le propriĂ©taire du domaine, par voie de consĂ©quence ce contenu est le vĂŽtre (sauf dans le cas d'un hack ou d'un cas de typosquatting)
=> TODO : typosquatting
=> TODO : hacking

Ces deux qualités sont appréciées des moteurs de recherche et plus particuliÚrement des crawlers. 

Il faut bien comprendre que chaque URL est unique, donc une URL ou un paramÚtre c'est une page de plus à crawler pour les moteurs de recherche. 

=> TODO : trailing slash
=> TODO : www vs domaine nu

Cette opération étant coûteuse pour les crawlers une recommandation courante en SEO consiste à ne pas créer plus d'URL que de pages utiles. On appelle ça le budget de crawl.

Pour se faire il faut pour chaque URL créée :

  • S'assurer que son contenu est utile
  • Qu'elle n'a pas de page en doublon
  • Qu'elle ne fait pas concurrence Ă  une autre page sur le mĂȘme sujet
=> TODO : duplication

Le cycle de vie d'une URL

Une URL ça vit dans le temps :

  • Une modification dans le backoffice
  • Une erreur humaine
  • Un bug
  • Un produit qui n'est plus disponible
  • Un script qui modifie les pages
  • etc...

Par conséquent il est possible qu'une URL à un instant T n'existe plus à un instant T+1. Dans ce cas les serveur vont (sauf exception) retourner des codes de réponses spécifiques pour indiquer des changements : ce sont les fameuses 404 ou 301.

✹ En savoir plus sur : les codes de rĂ©ponse HTTP

C'est quoi une bonne URL ? 

Reco Mon avis Celui de Google La priorité que j'y accorde
Avoir le mot clĂ© dans l'URL C'est toujours bien de l'avoir mais je ne changerai pas une URL a posteriori pour ça. Ils disent depuis longtemps que c'est marginal. đŸ”„
Avoir des URL qui changent peu dans le temps Changer ses URL c'est prendre le risque de faire des 404. Mois ça bouge mieux je me porte. Google dĂ©teste le changement. A titre d'exemple un changement de toutes les URL d'un site, mĂȘme bien opĂ©rĂ©, peut impacter le SEO Ă  la baisse pendant des mois (TODO : cas client /w Renault)  đŸ”„đŸ”„đŸ”„
Avoir des URL courtes Inutile Ă  mon avis. Aujourd'hui on ne tape que rarement une URL, on les copie / colle : courtes ou longues ça ne change pas grand chose. đŸ”„
Avoir des _ dans les URL Je n'aime pas prendre le risque de changer toutes URL pour si peu donc en rĂšgle gĂ©nĂ©rale je ne le fais pas. Ils disent qu'ils prĂ©fĂšrent les -  đŸ”„
Avoir une URL qui reflĂšte mon arborescence / fil d'Ariane Pratique pour l'utilisateur pour se situer mais aujourd'hui le fil d'Ariane rempli ce rĂŽle et c'est lui qui s'affiche dĂ©sormais dans les SERP  đŸ”„đŸ”„
Reprendre le contenu du <h1> dans l'URL C'est l'idĂ©al car ça dĂ©crit souvent bien la page, mieux que le <title> qui est souvent pensĂ© pour attirer les clics dans les SERP đŸ”„đŸ”„

‍

Documentation officielle de Google sur les URL

Les composants d'une URL

  1. Schéma (ou protocole) : il indique la méthode utilisée pour accéder à une ressource. Les exemples courants incluent 'http', 'https', 'ftp', etc. Le schéma est suivi de ://
    1. Le HTTP n'est pas encrypté, les informations circulent donc librement sur le réseau et quelqu'un de mal intentionné peut facilement les consulter
    2. A contrario le HTTPS est lui encryptĂ© et sĂ©curisĂ©. Reconnaissable Ă  sont verrou 🔒 vert, aujourd'hui une vaste majoritĂ© d'internet utilise se protocole.
  2. Sous-domaine : C'est une extension du domaine principal. Il est facultatif et précÚde souvent le domaine principal pour spécifier différentes sections ou services d'un site web. Exemple : "blog" dans "blog.exemple.com"
    1. On parle domaine nu lorsque qu'il n'y a pas de sous domaine, il est tout à fait possible d'accéder à une URL sans sous-domaine.
    2. On peut ajouter autant de sous-domaine que l'on veut, ainsi 2024.blog.baptiste-wallerich.fr est un nom de domaine tout Ă  fait valide
  3. Domaine : identifie de façon unique le site web. Il est suivi d'une extension de domaine qui peut indiquer la nature ou l'origine géographique de la ressource, comme .com pour commercial, .org pour organisation, .fr pour la France...
    1. Les extensions génériques sont regroupée sous le terme GTLD pour Generic Top Level Domains
    2. Les extensions de pays sont regroupée sous le terme CCTLD pour Country Code Top Level Domains
  4. Chemin d'accÚs : AprÚs le domaine, le chemin indique l'emplacement spécifique de la ressource sur le serveur. Il est souvent structuré comme une hiérarchie de dossiers séparés par des barres obliques '/'.
  5. ParamĂštres de requĂȘte : ils commencent toujours par un point d'interrogation '?' et sont souvent utilisĂ©s pour spĂ©cifier des options ou des filtres. Ils sont constituĂ©s de paires clĂ©-valeur sĂ©parĂ©es par des signes Ă©gal =. Chaque paire est sĂ©parĂ©e par un signe &.
  6. Fragment (parfois appelé ancre) : facultative et précédée d'un diÚse #, l'ancre fait référence à une section spécifique d'une URL.

‍

D'un point de vue purement technique le chemin d'accĂšs (4) et les paramĂštres de la requĂȘte (5) sont identiques : on les regroupe souvent sous le terme "slug"

‍

Exemple d'une URL décomposée

Une URL de fnac.com passée au crible

‍

hola ! Tu es en avance

S'inscrire sur la liste d'attente

Rendu

Les rendus de nos sorciers

Lorem ipsum dolor sit amet, consectetur adipiscing elit.

DĂ©poser le rendu
Auteur
Date
Jane Doe
Position, Company Name
Mise en ligne le
10 Jan. 2023

Discussions