le référencement et le positionnement stratégique des sites Web
Transcription
le référencement et le positionnement stratégique des sites Web
STEPHANE PERES © NPC MEDIA Création – Octobre 2009 Dossier sous contrat Creative Commons avec citation de l’auteur. Utilisation commerciale non autorisée. SOMMAIRE 1. INTRODUCTION ................................................................................................................ 2 2. LE RÉFÉRENCEMENT : COMMENT ÇA MARCHE ? ..................................................... 3 A. B. C. D. RÉFÉRENCEMENT VERSUS POSITIONNEMENT ............................................................................................................. 3 LIENS NATURELS VERSUS LIENS SPONSORISÉS ............................................................................................................ 5 LES RÈGLES D’OR À RESPECTER LORS D’UN RÉFÉRENCEMENT..................................................................................... 8 LES PAGES SATELLITES : UN SPAM À ÉVITER ! ........................................................................................................... 12 3. PRÉSENTATION DES MOTEURS DE RECHERCHES ET ANNUAIRES .................... 13 A. B. PRINCIPE DE FONCTIONNEMENT D’UN MOTEUR DE RECHERCHE............................................................................. 13 PRINCIPE DE FONCTIONNEMENT D’UN ANNUAIRE................................................................................................... 14 4. LE RÉFÉRENCEMENT NATUREL .................................................................................. 16 A. B. I. PRÉPARATION ET OPTIMISATION DES PAGES DU SITE .............................................................................................. 16 Méthodologie à adopter ...................................................................................................................... 16 II. Les principaux critères pour optimiser son site pour Google ............................................................. 20 III. Optimisation des sites dynamiques..................................................................................................... 30 I. II. C. D. LE SUIVI DU RÉFÉRENCEMENT : QUELLE « MESURE » POSSIBLE DE L’EFFICACITÉ DU RÉFÉRENCEMENT ? ................. 31 Un peu de marketing : le retour sur investissement ........................................................................... 31 Google Analytics : un outil de mesure efficace ................................................................................... 32 LES CONTRAINTES ET OBSTACLES AU RÉFÉRENCEMENT .......................................................................................... 33 COMMENT NE PAS ÊTRE RÉFÉRENCÉ ? ..................................................................................................................... 35 5. LE RÉFÉRENCEMENT PAYANT..................................................................................... 37 A. I. II. B. MISE EN ŒUVRE D’UNE CAMPAGNE DE LIENS SPONSORISÉS ET POSITIONNEMENT PUBLICITAIRE .......................... 37 Les AdWords, qu’est-ce que c’est et comment ça marche ? ............................................................... 37 Caractéristiques fondamentales de Google AdSence......................................................................... 40 COMBIEN COÛTE UN RÉFÉRENCEMENT EFFICACE ? ................................................................................................. 41 6. CONCLUSION .................................................................................................................. 42 7. TABLE DES ANNEXES .................................................................................................... 43 8. BIBLIOGRAPHIE & WEBOGRAPHIE ............................................................................ 46 9. GLOSSAIRE....................................................................................................................... 48 Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? SOMMAIRE 1 1. INTRODUCTION L’audience du web a rapidement évolué en quelques dizaines d’années en passant du stade de réseau marginal utilisé par quelques chercheurs à celui de moyen de communication incontournable. Elle est à ce jour supérieur à la plupart des média classiques. L’augmentation incessante du nombre d’internautes va de pair avec celle du contenu disponible sur la toile. Dans cette jungle d’informations, la bonne visibilité d’un site internet est devenue beaucoup plus difficile à assurer. En effet, un site en ligne n’est pas obligatoirement visité, ni même indexé par les moteurs de recherche ! Il est donc indispensable de développer sa visibilité pour le faire connaître auprès des internautes. L’objectif de ce dossier est de le rendre potentiellement accessible aux millions d’internautes qui utilisent régulièrement ces outils à des fins de recherche. Il faut savoir que 25 % des visites générées sur un site Web résultent d’une requête dans un moteur de recherche ou d’un annuaire, ce qui souligne l’importance de figurer en bonne position au sein de ces outils. Le référencement est désormais un enjeu majeur pour les entreprises car c’est aussi une des principales sources de trafic pour un site qui de plus se révèle être la plus économique à terme. Si l’objectif principal du référencement est la visibilité, quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Afin de répondre à cette problématique, nous aborderons en un premier temps les bases du référencement (définition, enjeux, fonctionnement des moteurs de recherche et des annuaires Web …). Nous verrons ensuite les atouts exceptionnels du référencement naturel permettant d’optimiser la place du site au sein des réponses fournies par les moteurs de recherche pour des mots clés (requêtes des internautes) importants pour l’activité de l’entreprise et traduisant un besoin pour une offre adaptée. Ce dossier est particulièrement centré sur ce sujet, car il s’agit de la meilleure méthode à long terme. De nombreuses indications et astuces y seront présentées afin d’optimiser le site pour une meilleure visibilité sur les principaux moteurs de recherche. A l’inverse, du référencement naturel, nous répondrons à la question : comment ne pas être référencé dans les moteurs de recherche ? Enfin, le référencement payant ne sera pas oublié, puisqu’il s’agit d’une stratégie incontournable et complémentaire, dans la plupart des cas, du référencement naturel. Ce dossier prendra pour exemples les sites Web que j’ai pu développer au cours de l’apprentissage, notamment les sites Web suivants : www.imagejuridique.com www.normand-bodard.com www.bea-avocats.com www.stasiassocies.com www.lucilecardonnet.com www.bellemine.com ) ainsi que mon site Web www.npc-media.com . (Les termes techniques comportant un astérisque sont définis dans le glossaire). Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? /Introduction 2 2. LE RÉFÉRENCEMENT : COMMENT ÇA MARCHE ? A. RÉFÉRENCEMENT VERSUS POSITIONNEMENT Le premier constat que nous pouvons remarquer est qu’il n’existe pas de définition exacte du mot “référencement” dans les principaux dictionnaires français, du moins dans le domaine du Web. Or, dans un dossier consacré au référencement, il est nécessaire de bien définir les termes employés, parfois de façon impropre ou erronée par de nombreux acteurs du domaine. Commençons avec le terme de « référencement » que nous pourrons définir par « l’ensemble des techniques qui permettent d’indexer un site web dans les moteurs de recherche ou dans les annuaires ». Prenons pour exemple la grande distribution. Lorsqu’on circule dans les rayons d’un supermarché on remarque que les produits qu’on recherche sont « référencés » par le magasin. En d'autres termes, ils sont «trouvables ». Cependant, ils sont noyés dans la multitude des produits exposés, tous rangés de la même manière dans les alignements de rayonnages. Une technique efficace de mise en évidence de certains produits consiste à les positionner au niveau des yeux du consommateur ce qui les rend plus visibles, ou de les placer en « tête de gondole » (pour reprendre un terme marketing). Ces produits sont alors stratégiquement positionnés et donc plus facilement « trouvables » par les clients potentiels. Ils sont ainsi bien « positionnés 1 ». De même pour le référencement d’un site Web : lorsque qu’un site sera « présent » dans les bases de données d'un moteur ou d'un annuaire, on dira qu'il est « référencé ». Cette première étape de mise en œuvre du processus de gain de visibilité est indispensable mais pas suffisante. Disons qu'il est « prêt à être vu » ... Un travail préliminaire d’optimisation de ce référencement sera nécessaire (il sera détaillé dans les prochaines parties de ce dossier). Pour la deuxième étape, il faudra mettre en « tête de gondole » le site Web en le positionnant le plus judicieusement dans les résultats de recherche, en particulier pour les mots-clés ou expressions essentielles se rapportant au domaine d’activités de l’entreprise. 1 Le positionnement d'un site web est la place qu’il occupe dans les pages de résultats d’un moteur sur une expression-clé définie. Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Le référencement : comment ça marche ? 3 La troisième étape, souvent oubliée par les webmasters, consiste à vérifier que le positionnement est efficace, par l’évaluation du trafic généré grâce aux efforts d'optimisation. En effet, un produit placé en tête de gondole n’est pas obligatoirement plus vendu. L’emplacement de la gondole, le nombre et le type de client qui circulent, l’apparence graphique du produit qui le démarquera de la concurrence sont autant d’éléments qui ont aussi une incidence. En d'autres termes, il ne servira à rien d'être bien positionné sur des mots-clés que les internautes ne saisissent pas ou sur des moteurs de recherche que personne n'utilise ... On considère souvent que l’objectif d'un bon positionnement est d'apparaître dans les trois premières pages de résultats des outils de recherche tels que « Google » ou « Bing », soit entre la première et la trentième position. Il s'agit effectivement là d'une étape importante qu'il ne faudra jamais dépasser. Un classement en 30e position sur un mot-clé correspond à un trafic quasi nul car rares sont les internautes qui recherchent au-delà de la troisième page. Mais être dans les trente premiers résultats n'est pas toujours satisfaisant, loin de là. Il est possible d’apparaître uniquement dans les dix premiers liens affichés, soit dans la première page de résultats. Ce qui est évidemment plus difficile selon les mots-clés choisis, notamment avec les termes génériques, comme par exemple « actualité ». Néanmoins, être placé dans la première page de Google est une visibilité garantie et un retour sur investissement assuré. Plus difficile encore est d’être au-dessus de la « ligne de flottaison». Cela signifie que votre lien sera visible dans la fenêtre du navigateur web de l'internaute sans que celui-ci ait à utiliser l'ascenseur. Par exemple, en résolution 1024 x 768 pixels (encore utilisée à l'heure actuelle dans les entreprises) ou encore en 1280 x 800 / 1280 x 1024, une page de résultats de Google pour l’expression « communication juridique » (en référence à la création du site « Image Juridique » détaillé dans le rapport d’activités) apparaît comme sur la capture d’écran ci-dessous – (voir figure 2-1). Ligne de flottaison Figure 2-1 : Page de résultats de Google en résolution 1280 x 800 sous Google Chrome 3.0 Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Le référencement : comment ça marche ? 4 Le navigateur affiche ainsi un lien sponsorisé (intitulé « liens commerciaux » que nous verrons en détails par la suite) en entête de page, puis seulement six liens naturels du moteur en dessous. Le but principal sera alors d’apparaitre dans cette zone de six premiers liens (dont le nombre peut grimper à sept ou huit si aucun lien commercial n'est affiché dans la zone droite de la page), ceci afin de rendre la situation meilleure. Le nombre de liens ainsi affichés au-dessus de la ligne de flottaison dépend : du type d'information connexe affichée par le moteur selon la requête (plans de Google Maps ou dépêches d'actualité, exemples d'images répondant à la recherche, etc.), de la présence ou non de liens sponsorisés, du nombre de liens sponsorisés affichés par le moteur avant les résultats naturels. B. LIENS NATURELS VERSUS LIENS SPONSORISÉS Dans ce dossier, nous allons parler de positionnement dans les pages des résultats des moteurs de recherche. De ce fait, il est important de définir clairement sur quelles zones de ces pages de résultats nous allons nous pencher. Voici une page de résultats (voir figure 2-2) pour le moteur de recherche Google France pour l’ensemble du mot-clé « image juridique » : Les zones 1 et 2 sont occupées par des liens sponsorisés, ou liens commerciaux, baptisés « AdWords » chez Google et qui sont des zones publicitaires payées par des annonceurs selon un système d'enchères avec paiement au clic (ex : CPC*, CPM* …). Si ces zones ne font pas spécifiquement partie intégrante d'une stratégie de référencement dit « naturel », le système du lien sponsorisé (référencement payant) en est complémentaire mais ne sera que rapidement évoqué dans ce dossier qui se consacre principalement au référencement dit « naturel ». La zone 3 représente, elle, ce que l'on appelle, les liens naturels, qui sont fournis par l'algorithme de pertinence du moteur de recherche. Ils n'ont donc rien à voir avec la publicité affichée dans les zones ci-dessus. C'est donc dans cet espace que nous allons essayer de positionner nos pages. Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Le référencement : comment ça marche ? 5 De plus, tous les moteurs de recherche majeurs proposent sur leurs pages de résultats cette dualité liens sponsorisés-liens naturels. On peut remarquer que sur les figures 1-2 et 1-3 (captures d’écran effectuées en début septembre), sur les moteurs de recherche de Google et Bing (nouveau moteur de recherche par Microsoft, remplaçant « Live Search » et intégrant les algorithmes de Yahoo), principaux concurrents de Google à l'heure actuelle, les résultats sont également proposés en trois zones distinctes : les liens sponsorisés (zones 1 et 2) et liens naturels (zone 3). On remarque que le site « Image Juridique » est assez bien placé sur Google avec cet ensemble de mots-clés (nous y reviendrons …). La comparaison entre les moteurs se fera au niveau de la clarté de différenciation des deux zones : certains outils indiquent clairement ce qui est de la publicité et ce qui ne l'est pas, d'autres semblent moins enclins à marquer une différence nette entre les deux zones, et ce pour des raisons de profits essentiellement (l’internaute, croyant avoir à faire à un lien naturel, clique en fait sur une publicité...). 1 2 3 Figure 2-2 : Page de résultats de Google pour l’ensemble de mot-clé « agence + communication + droit » Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Le référencement : comment ça marche ? 6 1 2 3 Figure 2-3 : Page de résultats de Bing pour l’ensemble de mot-clé « agence + communication + droit » Afin d’être le mieux placé, il existe une règle dont le but est de placer son site dans le « triangle d'or » (voir figure 2-4) des pages de résultats. En effet, selon une étude menée par les sociétés Enquiro et Dit-It.com en collaboration avec la société EyeTool spécialisée dans les systèmes d'eye-tracking (analyse des mouvements de l'œil), l'œil de l'internaute explore en priorité un « triangle d'or » (source : www.prweb.com), situé en haut à gauche des pages de résultats de Google. Ainsi, il est possible d'indiquer un taux de visibilité pour chaque rang des liens proposés par le moteur de recherche. Figure 2-4 : Le « triangle d’or » sur la page de résultats de Google. Trois type de zones sont présentées (voir les détails ci-dessous). Plus la zone est de couleur chaude, plus elle est regardé par l’internaute. 1 5 8 Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? • • • • • • positions 1,2 et 3 position 4 position 5 positions 6 et 7 positions 8 et 9 position 10 Le référencement : comment ça marche ? 100 % 85 % 60 % 50 % 30 % 20 % 7 En outre, si le but principal est la visibilité, ce sont les trois premières places qu’il faudra viser, ce qui n’est pas évident compte tenu de la forte concurrence sur certains mots-clefs. Un bon positionnement reposera sur le nombre de résultats mais également sur l’aspect concurrentiel du mot-clé choisi. Certains mots-clés génériques sont plutôt onéreux, dans la majorité des cas il est plutôt judicieux de réserver un couple de motsclés ou une expression. En effet, la situation ne sera pas la même pour un mot-clé peu concurrentiel comme par exemple « quetzalx » que par rapport à des requêtes comme « agence web ». Sur ce type d'expression, de nombreuses agences de communication multimédia tentent d'être bien positionnées car les enjeux commerciaux qui en dépendent sont énormes dans ce secteur. Enfin, il est évident que le choix du positionnement se fera en fonction du client et du budget de ce dernier, le référencement naturel étant toujours moins cher que le référencement payant. Des positions intermédiaires peuvent tout à fait être envisagées : dans le « triangle d'or » pour certains termes, sur la première page pour d'autres et enfin dans les trente premiers résultats pour certaines expressions moins importantes. C. LES RÈGLES D’OR À RESPECTER LORS D’UN RÉFÉRENCEMENT Notre objectif étant la visibilité, il est donc nécessaire de suivre quelques règles de base que nous pouvons résumer par le schéma ci-contre : nom de domaine Trafic sur le site Figure 2-5 : Les étapes pour améliorer la visibilité sur Internet Echanges de lien Une meilleure visibilité sur Internet Respect des normes Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Le référencement : comment ça marche ? 8 LE NOM DE DOMAINE Le choix du nom de domaine* est très important est doit être étudié pour le référencement. Ainsi il est préférable de prendre des termes générique comme par exemple « agence » ou « cabinet » pour la réalisation d’un site d’un cabinet d’avocat. Il est bien évident qu’il est possible de prendre le nom de l’entreprise comme URL afin de refléter au mieux cette dernière et être facilement reconnaisable par les clients (par exemple : www.imagejuridique.com ou www.quetzalx.fr ), mais cela n’est pas préférable pour le référencement naturel. LE TRAFIC DU SITE La popularité d’un site n’est pas dûe qu’au référencement, d’autres éléments doivent être pris en compte (voir figure 2-6), comme les liens pointant vers le site Web (liens avec le site) mais aussi les internautes qui vont saisir l’url du site directement depuis leurs navigateur Web (un accès direct avec le nom du site). L’objectif sera donc d’équilibrer l’ensemble. Figure 2-6 : Moyenne des sources de trafic sur un panel de site Web, selon Google Analytics Des campagnes d’emailing ou encore la mise en place d’encarts publicitaires favorisent et instaurent de nouvelles sources de trafic. Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Le référencement : comment ça marche ? 9 LES ÉCHANGES DE LIENS Il est indispensable de favoriser les liens croisés entre les sites, toujours dans le but d’améliorer le référencement naturel mais aussi le « PageRank »*. Le principe est de faire un lien vers un site externe, ce dernier fera un lien retour* vers le notre. Un exemple ? Voici le schéma afin de résumer la situation. Site A Lien externe Site B Site B Lien externe Site A Figure 2-7 : Méthode des liens croisés Pour que l’échange de lien soit efficace auprès de Google, il est donc nécessaire de demander un lien retour* au site partenaire. RESPECT DES NORMES Les pages web doivent respecter les normes du consortium W3C* (chargées de réguler l'usage des langages de programmation web). Google accordera peu d’importance au site ne respectant pas les règles du W3C (ce qui pourra avoir une influence sur la note PageRank* du site Web). Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Le référencement : comment ça marche ? 10 MÉTHODOLOGIE & DÉMARCHE L’expérience dans le domaine du référencement démontre que la méthode en « amélioration continue » est une bonne solution afin de structurer la démarche. (Voir figure 2-8) Figure 2-8 : Un bon référencement avec la méthode en amélioration continue Source : http://www.referencementweb.com/referencement/methode.htm Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Le référencement : comment ça marche ? 11 D. LES PAGES SATELLITES : UN SPAM À ÉVITER ! Tout d’abord, il est peut être nécessaire de rappeler en quoi consiste une page satellite ! Il s’agit d’une page optimisée sur un ou plusieurs mots clés et qui redirige vers un contenu adapté à ce mot clé (souvent sur la page d'accueil). Elle n'est à priori pas visible à l'utilisateur. Pourquoi est-ce que je déconseille d'utiliser des pages satellites ? Voici quelques arguments : Les principaux moteurs de recherche considèrent les pages satellites comme du spam. Ainsi dans la charte de qualité de Google, nous pouvons lire : « Évitez les pages satellites (doorway) créées exclusivement pour les robots de moteur de recherche ». Il est notable que de nombreux abus ont été constatés dans ce type de technique, et les moteurs ont, petit à petit, de moins en moins apprécié ce type de page et l'ont fait savoir de façon de plus en plus explicite dans leurs pages d'aide. De plus, les pages satellites sont facilement détectables par les moteurs de recherche et peuvent ainsi être repoussées vers le bas des pages de résultats pour préserver la pertinence des résultats. Ces arguments nous semblent suffisants pour bien réfléchir avant de mettre en place une stratégie basée sur les pages satellites. La situation, à mon avis, est similaire à celle des balises « meta* », il y a quelques années de cela, dont le déclin s'est effectué en plusieurs étapes. Que peut-on en conclure ? Tout simplement que les pages satellites sont devenues une technique à haut risque qu’il faut abandonner, puisqu'elles sont clairement considérées comme du spam par les moteurs de recherche. Nous pouvons d’ailleurs constater que depuis 2009, les agences Web n’y ont plus recours. La conclusion est donc évidente : il ne faut plus utiliser de page satellite. L'unique bon référencement valable est bien celui qui repose sur l'optimisation à la source du site web lui-même, sans information cachée dans les pages et sans page satellite. D’autres techniques comme les « fermes de liens* » sont aussi à proscrire. (Voir partie 4 : le référencement naturel) Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Le référencement : comment ça marche ? 12 3. PRÉSENTATION DES MOTEURS DE RECHERCHES ET ANNUAIRES A. PRINCIPE DE FONCTIONNEMENT D’UN MOTEUR DE RECHERCHE Bien que les moteurs de recherche tels que Google ou Bing semblent très simples d'utilisation, leur fonctionnement est en réalité très complexe et élaboré. De même, le processus « humain » d'indexation dans les annuaires doit être connu pour mieux référencer son site Web. Comprendre le fonctionnement d’un moteur de recherche permettra une approche en la matière pour la partie 4 de ce dossier. Un moteur de recherche est un ensemble d’algorithmes parcourant le Web en indexant automatiquement les pages visitées. Trois étapes sont indispensables à son fonctionnement : le rassemblement d’informations (ou crawl) grâce à des robots (spiders ou encore le terme crawlers), l’indexation des données collectées et la construction d'une base de données de documents, que l’on dénomme l’« index », le traitement des requêtes, notamment avec un procédé d'interrogation de l’index et de classement des résultats en fonction de critères de pertinence suite à la saisie de mots-clés par l'internaute. Plusieurs étapes sont nécessaires au bon fonctionnement d'un moteur de recherche. En premier lieu des robots explorent le Web de lien en lien et récupèrent des informations (phase de crawl). Ces informations sont ensuite indexées par des moteurs d'indexation, les termes répertoriés enrichissant un index régulièrement mis à jour (base de données des mots contenus dans les pages). Enfin, une interface de recherche permet de restituer des résultats aux utilisateurs en les classant par ordre de pertinence. Les « crawlers » ou « spiders » Les « spiders » sont des programmes de navigation visitant en permanence les pages web et leurs liens en vue d’indexer leurs contenus. Ils parcourent les liens hypertextes entre les pages et reviennent périodiquement visiter les pages retenues pour prendre en compte les éventuelles modifications. Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Présentation des moteurs de recherches et annuaires 13 Un « spider » est donc un algorithme très simple mais redoutablement efficace. Son mode d’action se fait en deux temps : lire des pages web et stocker leur contenu sur les espaces de stockage du moteur, déceler les liens dans ces pages et les suivre pour identifier de nouvelles pages web. La technique est simple : le spider trouve une page, la sauvegarde, détecte les liens qu'elle contient, se rend aux pages de destination de ces liens, les sauvegarde, y détecte les liens, etc … Mais parcourir le Web ne suffit pas. En effet, lorsqu'un spider arrive sur une page, il commence par vérifier qu'il ne la connaît pas déjà. S'il la connaît, il contrôle si la version découverte est plus récente que celle qu'il possède déjà... En cas de réponse positive, il supprime l'ancienne version et la remplace par la nouvelle. L'index se met ainsi automatiquement à jour. Dans le processus de développement d’un site Web, il est donc important de créer des liens Web interne et externe. Actuellement, les moteurs de recherche se basent principalement sur les mots clefs et les couples de mots clés, mais la donne pourrait changer d’ici début novembre 2009, avec l’arrivé d’un nouvel algorithme de recherche dénommé « Wolfram Alpha », mis au point par Stephen Wolfram et racheté par Microsoft. Ce moteur se distinguerait de ses concurrents en proposant à l'internaute de poser une question précise et d'obtenir une réponse calculée à partir une base de connaissances. Ce moteur sémantique posséderait aujourd'hui plusieurs millions de données de différentes natures et présentés d’une nouvelle manière totalement différente de la présentation actuelle des pages de résultats de Google, ce qui nous obligerait (nous développeur) de revoir notre méthodologie et astuces pour le référencement. B. PRINCIPE DE FONCTIONNEMENT D’UN ANNUAIRE Le fonctionnement de ces outils est différent de celui des moteurs de recherche que nous avons étudiés précédemment. Ce qui les différencie des moteurs tels Google ou Bing est qu'ils n'effectuent aucune recherche sur le contenu des documents, des pages ou encore des sites référencés. Ils proposent simplement, une collection de fiches descriptives des sites qu'ils référencent. Ils présentent, dans une hiérarchie de catégories et sous-catégories diverses, le contenu du Web au travers de ces sites décrits par un nom et un descriptif de quelques mots. La recherche se fait en descendant une hiérarchie qui balaie des thèmes allant du plus général au plus précis, et qui fournit en dernier lieu, une liste de sites représentatifs du domaine présenté, quel que soit le niveau de l'arborescence atteint. Nous avons donc affaire ici à une base de données de liens pointant vers d'autres sites du Web, ces liens étant classés et décrits de façon hiérarchique. Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Présentation des moteurs de recherches et annuaires 14 L'annuaire* ne dispose que de très peu d'éléments sur le site, tels que : son nom (titre), son adresse (URL), un descriptif du site, rédigé par ses documentalistes, la catégorie dans laquelle le site est inscrit. Il est indispensable de savoir que l'annuaire n'effectue à aucun moment une recherche en texte intégral dans le contenu des pages qui constituent le site, comme le ferait un moteur. Il ne prend en compte que les fiches descriptives des sites que contient sa base de données. La structure des pages Web de notre site (titre, texte, balises « meta », etc.) n'est à aucun moment prise en compte par l'algorithme de classement. Elle ne joue en tout cas aucun rôle lors de l'inscription ou de l'affichage des résultats pour une requête par mots-clés sur le contenu de l'annuaire. Les annuaires sont plutôt pensés pour une utilisation professionnelle. En effet, il faut savoir que pour être inscrit sur ces outils, il faut le demander. Le processus est exactement le contraire de ce que nous connaissons dans le domaine de la téléphonie. Quand un opérateur de télécommunications installe une ligne téléphonique chez vous, vous êtes automatiquement inscrit dans l'annuaire. Si vous ne souhaitez pas l'être, vous devez demander à être inscrit sur une liste rouge. Sur Internet, comme souvent, c'est l'inverse : lorsque vous créez votre site web, vous n'êtes inscrit dans aucun annuaire par défaut. Vous êtes en liste rouge dès le départ. Prenons un exemple : afin d’être inscrit sur l’annuaire « Dmoz », il faut tout d'abord choisir la catégorie où l'on veut apparaître et cliquer sur un lien de type « Ajouter un site » ou « Soumettre un site ». Il faudra par la suite donner le plus d’informations générales sur notre site. Enfin, l’administrateur de l’annuaire validera ou non l’inscription de notre site en fonction du respect de la charte Figure 3-1 : l’annuaire Dmoz en version Française de qualité. (voir figure 3-1) Il est également important de préciser que le trafic généré par les annuaires est aujourd'hui très faible. La grande majorité du trafic est à l'heure actuelle générée par les moteurs de recherche. Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Présentation des moteurs de recherches et annuaires 15 4. LE RÉFÉRENCEMENT NATUREL Le référencement naturel répond au besoin de se positionner sur le long terme à un coût relativement bas, en effet 33 % des webmasters privilégient le référencement naturel à l’achat de liens sponsorisés et 20 % affirment se baser uniquement sur l’optimisation et l’indexation de leurs pages sur les moteurs de recherche. A. PRÉPARATION ET OPTIMISATION DES PAGES DU SITE I. Méthodologie à adopter Afin d’être efficace, il sera nécessaire de mettre en place une méthodologie. Voici une trame chronologique des actions à mener : 1. Définir les objectifs de positionnement désirés, 2. Choisir des mots clés pertinents, 3. Choisir de préférence un moteur de recherche et/ou annuaire à prendre en compte, 4. Optimisation ou mise à jour des pages du site en fonction de ces mots-clés et des critères de pertinence des moteurs, 5. Soumission du site auprès des index de moteur de recherche et/ou des annuaires, 6. Contrôle du positionnement et/ou du trafic (notamment avec l’outil Google Analytics que nous verrons en détails par la suite) généré par les outils de recherche, 7. Suivre régulièrement les phases de positionnement et prévoir des correctifs à faire éventuellement pour obtenir de meilleurs résultats. Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Le référencement naturel 16 Préparation au référencement Plusieurs étapes sont obligatoires avant de débuter tout travail d’optimisation, voici les quatre principales à retenir (voir figure 4-1) : 1 2 Les mots clés Le design 3 4 La pertinence Les règles de Google Figure 4-1 : les 4 étapes obligatoires Étape 1 : les mots clés Le choix des mots clés est extrêmement important, ils doivent avoir de l’intérêt auprès des internautes et être techniquement capables de les positionner dans les pages Web. Il est préférable de déterminer les mots clefs en fonction de sa cible et des objectifs marketings désirés, afin d’espérer un retour sur investissement (voir figure 4-2). Figure 4-2 : L’importance des mots clés est un enjeu pour le référencement du site Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Le référencement naturel 17 Le plus simple est de chercher dans les outils de statistiques du site les mots clés tapés par les visiteurs. Associée à ces statistiques, la visite des sites concurrents permettra d’ajouter de nouvelles expressions, grâce à la consultation des méta-tags et titres de pages disponibles dans le code source. Du point de vue du codage, les mots clefs accentués devront se référer au codage XHTML*. A titre d’exemple : le « é » devra s’inscrire « é ; », le « è » s’écrira « è ; » etc … Il existe plusieurs sites sur Internet donnant l’ensemble des codages ou encore des logiciels tels que Adobe Dreamweaver écrivent directement les codes correspondants. Trouver des mots-clés pertinents est l’une des étapes les plus importantes. Yahoo Search Marketing propose un outil permettant de générer des mots-clefs en fonction d’un mot-clé générique que nous saisirons, synthétisant au mieux l’activité ou la compétence de l’entreprise. Ci-dessous (voir figure 4-3) nous pouvons voir que pour une recherche sur le couple de mots « agence communication », nous avons une multitude de synonymes avec comme particularité notable l’importance du nombre de recherches par mois. Figure 4-3 : « Overture » de Yahoo Search Marketing (capture réalisée en septembre 2009) L’outil « Overture » de Yahoo Search Marketing est disponible à l’adresse suivante : signup31.marketingsolutions.yahoo.com/signupui/signup/addKeywords.do Il est important de notifier que les moteurs de recherche accordent moins d’importance aux mots-clefs qu’auparavant. Actuellement, Google ne prend en compte que les 15 premiers mots clefs présents dans le champ « keywords »*. Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Le référencement naturel 18 Étape 2 : le design et l’accessibilité du site Quelques conseils doivent être respectés : Éviter d’utiliser des couleurs décalées (voir figure 4-4), Proposer un contenu basé sur l’activité du site, Créer une navigation claire et utiliser les « SiteMaps » (plan du site). Le trafic aura moins d’impact si la page Web n’a pas de valeur ajoutée ! Figure 4-4 : à gauche un site visuellement raté – à droite un site avec un aspect visuel étudié Étape 3 : la pertinence du site et des contenus Quelques conseils doivent être respectés : Choisir un nom de domaine* « pertinent », Nommer les fichiers « images » (ex : dsc001.jpg <=> image-juridique.jpg) Éviter des pages dont le contenu est trop semblable. Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Le référencement naturel 19 Étape 4 : Vérifier la bonne conformité du site avec les « guidelines » des moteurs Quelques conseils doivent être respectés : Éviter les textes et liens cachés … et les pages satellites, Faire le site en Anglais et en Français, Ajouter un menu « Liens » et « Plan du site ». II. Les principaux critères pour optimiser son site pour Google Zone chaude 1 : optimisation de la balise <TITRE> Le titre d’une page est affiché en haut de la fenêtre du navigateur Internet lors de la consultation d’un site (voir figure 4-5). Par exemple ici pour le site www.normand-bodard.com : Figure 4-5 : Titre de la page d’accueil du site de NORMAND-BODARD sous Internet Explorer 8 Dans le code HTML des pages Web, le titre se situe entre les balises <TITLE> (début de titre) et </TITLE> (fin de titre). Les balises de titre doivent être placées le plus haut possible dans la page. Voici le code source de la page d’accueil du site de NORMAND-BODARD : <!DOCTYPE html PUBLIC "-//W3C//DTD "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd"> XHTML 1.0 Strict//EN" <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="fr" lang="fr"> <head> <title>Xavier Normand Bodard, avocat au Barreau de Paris – BATONNAT 2008</title> … … </head> Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Le référencement naturel 20 Nous pouvons remarquer que dans le code le titre de la page d’accueil doit contenir au moins le nom de votre entreprise, entité, organisme ou association et doit de préférence décrire en quelques mots son activité. Un titre bien optimisé propose au moins plus de dix mots dans son libellé (les mots vides comme « le », « la », « à », « aux », etc … n’étant pas comptabilisés dans ce total). De plus, toutes les pages du site doivent recevoir un titre différent et conforme à leur contenu (on retrouvera le même mot clé à la fois dans le titre que dans le contenu). Bien sûr on évitera les expressions banales comme « Bienvenue », « Page d’accueil » etc … qui sont vides de sens aussi bien pour l’internaute que pour les moteurs de recherche. Dernier point : il vaut mieux parfois mettre en ligne plusieurs petites pages qui proposent une thématique unique, décrite par un titre performant. Zone chaude 2 : optimisation des « métabalises » Les « métabalises* » ont moins d’importances de nos jours, cependant cela apporte beaucoup d’informations non négligeable pour les outils de recherche. Ainsi, il ne faut pas négliger la métabalise « description » pour mieux présenter la page (permet d’indiquer au moteur de recherche une phrase de résumé du contenu de la page). Cette balise permet donc de mieux maitriser la présentation de la page proposée à l’internaute. Voici le code source des balises « méta du site » du site de campagne de NORMAND-BODARD. La balise « description » doit contenir environ 200 caractères afin d’être efficace. <meta http-equiv="Content-type" content="text/html ; charset=utf-8" /> <meta name="Description" content="Élection 2008 au bâtonnat de Paris Xavier Normand-Bodard est candidat au poste de Bâtonnier" /> - Une autre balise importante est celle des « keywords », son but est de fournir des mots-clés supplémentaires aux moteurs de recherche. Cette balise à perdu beaucoup de son intérêt car trop d’abus ont été constatés. <meta name="keywords" lang="fr" content="xavier normand bodard, avocat au Barreau de Paris, élections 2008, barreau de Paris 2008, normand bodard, bâtonnat 2008, avocats bâtonnat 2008, bâtonnat 2008 avocats, bâtonnier, cabinet d'avocats, avocats parisiens, justice, carte judiciaire, nouveaux champs d'activités, Ensemble faisons avancer la profession" /> A noter qu’il est nécessaire d’indiquez la langue utiliser pour les keywords (ex : lang= “fr” pour le français, lang= “en” pour l’anglais …). Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Le référencement naturel 21 Zone chaude 3 : optimisation du texte visible Après le titre des pages Web, il est nécessaire d’optimiser leur texte visible qui représente le deuxième critère « on page » le plus important pour les moteurs de recherche en général et pour Google en particulier. Une page optimisée pour le Web doit au minimum contenir 100 mots, mais la première partie d’un texte est primordiale. Les outils de recherche privilégient également les mots qui sont mis en exergue dans les pages Web. Ainsi il est judicieux d’utiliser la balise <STRONG> plutôt que la balise <B> pour mettre en exergue certains mots. Par exemple : <strong> Activités syndicales et associatives </strong> Autre possibilité importante de mise en valeur du contenu : les balises de titre <Hn> (de <H1> à <H6>). Si un mot est compris entre des balises <H1> et </H1> (plus haut niveau de hiérarchie), il aura un poids important pour le classement du document pour ce terme. Par exemple : <h1> Le rôle social de l'Ordre : Agir à tous les niveaux </h1> Les moteurs prennent ‘ils en compte les feuilles de style ? Il semblerait que la plupart des outils de recherche ne prennent pas encore en compte les feuilles de style (CSS). Zone chaude 4 : les « URL » des pages du site L’intitulé des adresses (URL) des pages est également un facteur très important pour les moteurs de recherche, depuis le nom de domaine jusqu’au nom de la page. Il est essentiel de disposer de son propre nom de domaine* (les hébergements tels que les pages perso orange ou free sont à proscrire). Idéalement, le nom de domaine d’un site doit contenir un ou plusieurs mots décrivant au mieux ce que le site propose comme contenu. La présence d’un mot clé générique de recherche dans le nom de domaine d’un site est bien souvent un critère déterminant pour le classement dans les pages de résultat. Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Le référencement naturel 22 Prenons l’exemple d’un site que j’ai développé, celui d’un cabinet d’avocat à Paris : www.bea-avocats.com . Le mot clé « avocats » est directement dans l’url. Comme nous pouvons le remarquer l’url dispose d’un trais d’union entre « bea » et « avocats », alors noms composés avec ou sans tirets ? Le nom de domaine contenant les mots séparés par un tiret est à privilégier, étant donné que les tirets séparent les différents mots (le tiret est considéré comme un espace par Google), le site sera plus réactif pour les moteurs de recherche sur les requêtes comme « avocats » que pour « beaavocats » Il faut savoir aussi que des mini-sites valent mieux qu’un grand portail généraliste, de même les sous-domaines augmentent la visibilité du site Web. Pour conclure sur cette « zone chaude », l’url d’un site doit être pensé et étudié pour le référencement, mais il doit rester simple et mnémotechnique. Zone chaude 5 : lien et réputation Les liens entrants Afin de garantir une meilleure visibilité, la meilleure façon réside dans une bonne gestion des liens entrants* (les « backlinks* ») et sortants*. Ainsi, il est préférable de soigné les textes de ces liens. Google est parti du constat suivant : pour connaitre les éléments clés qui caractérise une page, il suffit d’analyser ce qu’en disent les autres personnes sur le Web ! Par ailleurs, ce critère étant externe au site, les abus sont moins fréquents que peut l’être la répétition d’un mot-clé sur une page. Voici trois cas de liens vers la même page, mais n’ayant pas le même texte de lien : CAS 1 : à éviter Le site de l’agence <b>Image Juridique</b> <a href="http://www.imagejuridique.com/prestations.php "> cliquez ici </a> → Ce lien est le plus mauvais, car Google ou Bing associeront le site d’Image Juridique avec le terme « cliquez ici ». De plus, l’attribut « title » à été omis, ce dernier donne des informations complémentaires sur le lien. Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Le référencement naturel 23 CAS 2 : lien correct Le site de <a href="http://www.imagejuridique.com/prestations.php " title="Agence Image Juridique"> www.imagejuridique.com </a> → Le deuxième lien n’est pas très efficace car les mots sont collés (Google ou Bing ne peuvent pas distinguer les mots « image » et « juridique »dans le mot « imagejuridique »). CAS 3 : excellent lien Le site de <a href="http://www.imagejuridique.com/prestations.php " title="Agence Image Juridique"> l’agence Image Juridique – voir nos prestations </a> → Ce lien est celui qui améliore le plus le positionnement du site d’image juridique pour la requête « agence juridique » ou « agence juridique prestations ». URL absolue ou relative Concernant les liens internes*, il existe deux possibilités au niveau de l’écriture de l’URL, à savoir : Il est possible d’utiliser un lien en URL absolue comme : <a href="http://www.imagejuridique.com/experience.php Expérience</a> " title=" Notre expérience"> Ou bien un lien en URL relative comme : <a href=" experience.php " title="Notre expérience"> Expérience </a> Conclusion : Cela ne change rien pour les robots d’indexation qui convertissent automatiquement toutes les URL en URL absolues. Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Le référencement naturel 24 Le PageRank Le « PageRank » est un algorithme propriétaire (Voir figure 4-6) du moteur de recherche Google qui a pour but de donner une note au site en question. Cette note de 0 à 10 est révélatrice de l’indice de popularité du site (par exemple : PR 3, PR 4, etc …). Plus la note est élevée et plus Google visitera le site fréquemment. Entre 0 et 2 == aucun travail de SEO Entre 2 et 4 == en bonne voie Entre 5 et 7 == Très bonne visibilité Entre 7 et 10 == + de 100000 Visiteurs/jour Figure 4-6 : l’algorithme de Google se base sur plusieurs critères afin de donné une note. Pour améliorer le « PageRank » d’une page, voici quelques recommandations d’ordre général : Placez des liens depuis vos autres sites Web, Demandez à vos partenaires et amis d’en placer sur leurs sites respectifs, Créez du contenu suffisamment attrayant pour que d’autres webmasters fassent naturellement des liens retour*, Inscrivez votre site dans de nombreux annuaires généralistes comme par exemple « Dmoz », Faites des échanges de liens, Faire en sorte que les internautes reviennent sur votre site régulièrement en créant du contenu à valeur ajoutée (articles et communiqués de presse de qualité, inscription au flux RSS*), Achetez des campagnes publicitaires vous fournissant des liens, Communiquez l’adresse de votre site sur les réseaux sociaux tels que Twitter ou Facebook (par exemple les pages de fans) ou sur vos cartes de visite. Cette liste n’est pas exhaustive … Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Le référencement naturel 25 Le « PageRank » est basé sur le concept de site « amis », comme nous le montre ce petit dessin fort sympathique en figure 4-7. Figure 4-7 : Illustration du « PageRank » Source : www.i.zdnet.com/blogs/pagerank.png Le « PageRank » en images CAS 1 : A (de PR 2) pointe vers B Le site B profite toujours des 100 % de capacité de vote de A. Cependant le PR 2 du site A est très faible et ne fera que très peu augmenter le PR du site B. A noter aussi, que cela ne fera pas descendre le PR du site B. Site A PR 2 100 % Site B CAS 2 : A (de PR 7) pointe vers B La page A, qui dispose d’un PR de 7 va fortement influencer sur le PR du site B et le faire augmenter en proposant un lien retour*. De plus, A ne dispose que d’un seul lien vers B, ce dernier en profite donc à 100%. Site A PR 7 Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? 100 % Site B Le référencement naturel 26 CAS 3 : A (de PR 9) pointe vers B Dans cet exemple le site A dispose d’un très fort PR de 9. Le site B et C en seront donc bénéficiaires. Cependant, les « gains » seront séparés en deux étant donné qu’il existe maintenant deux liens sortants*. Site A PR 9 50 % Site B 50 % Site C Actuellement, le « PageRank » a beaucoup perdu de sa notoriété. En effet, il ne s’agit pas d’un critère essentiel pour être bien positionné dans les pages de résultats de Google. Zone chaude 6 : le SiteMaps Le « SiteMaps » est un fichier externe au format XML* qui a pour fonction de recenser toute les URL d’un site Web. Cela permet aux outils de recherche tels que Google de gagner beaucoup du temps et d’être plus efficaces. Les SiteMaps sont particulièrement utiles dans les cas suivants : le site intègre du contenu dynamique toutes les pages du site n'ont pas été détectées par Google bot* lors du processus d'exploration (les pages présentant du contenu AJAX ou des images par exemple) le site est récent et seuls quelques liens permettent d'y accéder. Google bot explore le Web en suivant les liens entre les différentes pages le site contient de nombreuses pages de contenu mal reliées entre elles ou pas reliées du tout Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Le référencement naturel 27 Prenons l’exemple de mon site Web : www.npc-media.com Voici le code XML nécessaire pour la création du SiteMaps « googlemap1.xml » : <?xml version="1.0" encoding="UTF-8" ?> <urlset xmlns="http://www.google.com/schemas/sitemap/0.84"> <url> <loc>http://www.npc-media.com</loc> </url> <url> <loc>http://www.npc-media.com/accueil.php</loc> </url> <url> <loc>http://www.npc-media.com/actualisation.php</loc> </url> <url> <loc>http://www.npc-media.com/archives.php</loc> </url> <url> <loc>http://www.npc-media.com/cdrom.php</loc> </url> <url> <loc>http://www.npc-media.com/contact.php</loc> </url> <url> <loc>http://www.npc-media.com/design.php</loc> </url> … … </urlset> Pour soumettre un « SiteMaps » à Google il suffit de se rendre sur le service Web « outils pour webmasters » de Google (il faudra auparavant créer un compte gratuit chez Google) https://www.google.com/webmasters/tools/home?hl=fr, puis cliquer sur « Ajouter un site ». Après l’étape de validation du site, vous aurez à votre disposition des options supplémentaires (les fameux outils pour les webmasters) et notamment la possibilité d’envoyer un SiteMaps. (voir figure 4-8). Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Le référencement naturel 28 Figure 4-8 : Concrétisation d’un SiteMaps dans les résultats Google pour le site npc-media.com Après quelques mois et en fonction de la popularité de votre site (notamment le PR), Google créera une meilleure présentation de votre site directement dans les résultats Google (les liens du menu seront directement accessibles). (voir figure 4-9) Figure 4-9 : Concrétisation d’un SiteMaps dans les résultats Google pour le site www.npc-media.com Capture effectuée en Août 2009 Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Le référencement naturel 29 III. Optimisation des sites dynamiques A contrario d’une page statique qui est toujours affichée de la même manière, une page dynamique affiche des informations différentes selon le contexte, le contenu provenant en général d’une base de données. Les pages dynamiques sont donc caractérisées par des URL complexes qui ne sont pas prises en compte par les moteurs de recherche (URL exotiques). Par exemple : index.php?page=accueil Le but sera alors de simplifier les URL notamment avec la méthode de l’URL Rewriting*. La première étape consiste à vérifier si cette méthode est compatible avec l’hébergeur. La seconde étape consistera à rédiger les règles de réécriture dans un fichier dénommé « .htaccess ». Voici la syntaxe du fichier « .htaccess » du site www.npc-media.com (extrait) : # Le serveur doit suivre les liens symboliques : Options +FollowSymlinks # Activation du module de réécriture d'URL : RewriteEngine on # Règles de réécriture d'URL : RewriteRule ^accueil\.php$ /index.php?page=accueil [L] RewriteRule ^info\.php$ /index.php?page=info [L] RewriteRule ^devis_carte\.php$ index.php?page=devis_carte [L] RewriteRule ^devis_forfaitaire\.php$ index.php?page=devis_forfaitaire [L] RewriteRule ^plaquette_npc-media\.php$ index.php?page=plaquette_npc-media [L] RewriteRule ^archives\.php$ index.php?page=archives [L] # RewriteRule ^web\.php$ /index.php?page=web [L] RewriteRule ^realisations_web\.php$ /index.php?page=realisations_web [L] RewriteRule ^prestations_web\.php$ /index.php?page=prestations_web [L] RewriteRule ^referencement_web\.php$ index.php?page=referencement_web [L] RewriteRule ^design\.php$ /index.php?page=design [L] RewriteRule ^actualisation\.php$ /index.php?page=actualisation [L] RewriteRule ^evolution\.php$ /index.php?page=evolution [L] …… Ce fichier est à mettre à la racine du serveur. Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Le référencement naturel 30 B. LE SUIVI DU RÉFÉRENCEMENT : QUELLE « MESURE » POSSIBLE DE L’EFFICACITÉ DU RÉFÉRENCEMENT ? I. Un peu de marketing : le retour sur investissement Comment mesurer efficacité d’une campagne de référencement naturel ? Toutes les informations nécessaires sur les retombées d’un bon référencement naturel sont fournies par deux outils statistiques : L'outil d'analyse d'audience de votre site : il mesure le trafic Web du site, la part de nouveaux visiteurs, l'origine géographique des internautes, les jours et les horaires durant lesquels ils sont plus nombreux, le pourcentage entre le référencement naturel et commercial... Le meilleur outil d’analyse d’audience gratuit est Google Analytics (voir la partie 4.B.2), mais d’autres outils comme ceux de XiTi sont aussi valables L'outil « Google pour webmaster » : il indique le nombre de liens pointant vers votre site, le nombre de pages indexées par les moteurs... Comment calculer le retour sur investissement d’un site ? Répertorier les moteurs de recherche sur lequel vous souhaitez suivre l'évolution de votre référencement naturel (en tenant compte du fait que Google représente 90% des requêtes) et monter un tableau pour chacun d'entre eux. Dans la 1ère colonne de votre tableau de bord sur le référencement naturel, lister tous les mots clés pour lesquels votre site est optimisé. Il ne vous reste plus qu'à introduire les variables temps et chiffre d'affaires en 1ère ligne pour calculer le retour sur investissement de votre référencement naturel. Il est aussi possible de surveiller les informations aidant au référencement naturel fournies par votre outil Google pour webmaster (Mots-clés, navigateur utilisé par les Internautes, etc …) Source : www.clubic.com Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Le référencement naturel 31 II. Google Analytics : un outil de mesure efficace Google Analytics est une solution professionnelle d'analyse d'audience Internet qui fournit des indications précieuses sur la fréquentation du site Web (voir figure 4.10) et son efficacité en termes de marketing. Il comporte des fonctionnalités performantes, flexibles et faciles à utiliser qui permettent aujourd'hui de consulter et d'analyser les données de trafic (voir annexe 1 et 2 : présentation des outils). Google Analytics permet d’aider à la rédaction des annonces afin de mieux cibler. Cet outil est gratuit, il suffit de s’y inscrire et d’installer le code JavaScript (Le code est donné par Google, mais n’est pas valid W3C) valid W3C, sur le site Web : <!-- Code d'Analyse d'audience --> <script type="text/javascript"> var gaJsHost = (("https:" == document.location.protocol) ? "https://ssl." : "http://www."); document.write(unescape("%3Cscript src='" + gaJsHost + "googleanalytics.com/ga.js' type='text/javascript'%3E%3C/script%3E")); </script> <script type="text/javascript"> var pageTracker = _gat._getTracker("UA-4465473-1"); pageTracker._initData(); pageTracker._trackPageview(); </script> <!-- Fin du code --> Figure 4-10 : Vue d’ensemble du trafic du site www.normand-bodard.com sur Google Analytics. Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Le référencement naturel 32 C. LES CONTRAINTES ET OBSTACLES AU RÉFÉRENCEMENT Une page Web doit être réactive et lisible par les moteurs de recherches. Cependant certaines technologies sont problématiques pour les robots et les algorithmes de pertinence de Google. Les liens images Il est préférable d’utiliser des liens textuels aux liens imagés pour une meilleure optimisation des pages (les images ne sont pas lisibles). Le JavaScript Le JavaScript est un langage de programmation non reconnu par les moteurs de recherche (Les fichier « .js » sont tout simplement ignorés par Google). Le JavaScript est donc à utiliser avec modération et dans des cas précis. Les formulaires Des liens externes ou internes peuvent être proposés sous la forme de formulaires et notamment des menus déroulants, case à cocher, etc … Google aura bien du mal à suivre les liens dans un menu déroulant. Pourquoi ? Tout simplement car les moteurs de recherche sont incapables de remplir un formulaire et de les valider automatiquement ! De plus, en utilisant des formulaires, il faudra envisager la réécriture des URL (l’URL rewriting*). Le format Flash De la même manière que pour le JavaScript, les moteurs aiment peu le Flash. Début 2009, Google a annoncé que le Flash sera bientôt un format compréhensible par les algorithmes de la firme de Moutain View (Google), cependant on attend toujours le ténor du référencement dans ce domaine !!! On retiendra donc que tout les éléments (textes, photos, musique, etc …) présents dans une animation Flash sont ignorés par les moteurs. Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Le référencement naturel 33 Pourquoi certains sites concurrents en Flash sont-ils bien référencer ? Par défaut, les sites entièrement en Flash (Full Flash) ne sont pas référencés. Mais il existe des méthodes légales auprès de Google afin de pallier ce problème. Il faut savoir que la balise <NOSCRIPT> peut contenir des textes, des liens etc … Le site de la société Belle Mine (www.bellemine.com) est un bon exemple d’un site en Full Flash. L’astuce pour un référencement consiste à écrire un code. Figure 4-5 : Un site Web en technologie « Full Flash »: www.bellemine.com Voici ce code permettant de lire le Flash*, mais aussi d’incorporer le contenu dans la page XHTML : <script type="text/javascript"> AC_FL_RunContent('codebase','http://download.macromedia.com/pub/shockwave/cabs/flas h/swflash.cab#version=9,0,28,0','width','900','height','550','src','bellemine','quality','high','plugi nspage','http://www.adobe.com/shockwave/download/download.cgi?P1_Prod_Version=Sho ckwaveFlash','wmode','transparent','movie','bellemine' ); //end AC code </script> <noscript><p> <object classid="clsid:D27CDB6E-AE6D-11cf-96B8-444553540000" codebase="http://download.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#versi width="900" height="550" title="Belle Mine"> <param name="movie" value="bellemine.swf" /> <param name="quality" value="best" /> <param name="wmode" value="transparent" /> </object></p> on=9,0,28,0" <h1><strong>Belle mine Maria Bouanane</strong>, <strong>conseil en innovation produits & services</strong></h1> <p>Avec <strong>belle mine</strong>, donnez une <strong>nouvelle jeunesse à vos produits</strong> ! Belle mine, c’est une <strong>agence conseil en innovation</strong> qui vous aide à voir et penser autrement vos <strong>marchés</strong> pour créer une mine d’idées <strong>stratégiques et créatives</strong>.</p> // ce texte n’est pas visible </noscript> Enfin les sites Full Flash (à part pour certains cas, comme les sites événementiels) sont une aberration, il est plus judicieux de créer des blocks Flash indépendants les uns des autres dans une page XHTML. Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Le référencement naturel 34 D. COMMENT NE PAS ÊTRE RÉFÉRENCÉ ? Et si le but était de ne pas être référencé sur Google ! Cette question est partie d’un souhait des graphistes (notamment un qui travaille avec nous ;) ) à ne pas vouloir être référencés, ces derniers veulent en effet que leur portfolio reste « secret ». Le but étant pour eux de donner l’URL du site seulement aux intéressés. De même, en général, certaines zones demeurent réservées à certains internautes (accès privé par login / mot de passe par exemple). Alors comment dire à Google qu’une page ou un ensemble de pages, voire un site en entier, ne doit pas être indexé ? Voici quelques astuces : Le fichier Robots .txt Le fichier robots.txt est un fichier texte classique permettant de dire ce qui est visible et ce qui n’est pas visible aux moteurs de recherche. Dès que Google Bot* arrive pour la première fois sur un site il va chercher le fichier robots.txt sur le serveur avant d’effectuer des actions. Si le fichier n’est pas présent sur le serveur, Google Bot lira le site en entier, puisqu’aucune recommandation ne lui est faite. Quel est la structure du fichier robots.txt ? Le contenu d’un fichier classique est le suivant : User-agent: * // signifie que l’accès est accordé à tous les agents. Disallow: /perso/ // signifie que le robot n’ira pas exploré le dossier « perso ». Disallow: /espace_client/ Disallow: /temporaire/index.html/ Disallow: /photos_produits-beta/ …… …… Ce fichier est aussi accessible depuis les services « outils pour webmasters » de Google Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Le référencement naturel 35 Création d’un espace privé La création d’un espace privé (ou espace client) permet d’interdire aux moteurs de recherche de lire le contenu d’un répertoire. En outre, cela permet aussi de créer un espace privé ou seules les personnes authentifiées pourront y accéder. Pour cela, il est nécessaire de créer deux fichiers : « .htaccess » et « .htpasswd ». Ces fichiers sont à créer avec des éditeurs de textes basic tels que « bloc-notes » de Windows ou « Notepad ++ ». Le fichier « .htaccess » contiendra le code suivant : AuthUserFile /homez.184/joailler/www/private/.htpasswd /* correspond au informations sur l’hébergement. Afin de connaitre cette information, il est nécessaire de créer un fichier « documentroot.php » que nous placerons à la racine du serveur, avec le code suivant : <?php echo "DocumentRoot".$_SERVER['DOCUMENT_ROOT']; ?> */ AuthGroupFile /dev/null AuthName "Accès Restreint" AuthType Basic <Limit GET POST> require valid-user </Limit> Le fichier .htpasswd contiendra le code suivant : ab:fpJpdXq46xqA // « ab » correspond au login et « fpJpdXq46xqA » correspond au mot de passe encodé et crypté. Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Le référencement naturel 36 5. LE RÉFÉRENCEMENT PAYANT Le référencement payant répond au besoin de se positionner immédiatement en fonction d’un budget fixé sur un ou plusieurs mot-clé/expression. Il s’agit donc d’une méthode afin de se démarquer de la concurrence comme nous avons pu le voir dans les premières parties de ce dossier. En outre, cela permet d’avoir plusieurs avantages comme : une localisation géographique précisée, une proposition automatique par Google des mots clés, une apparition immédiate sur Google, une proposition d’affichage sur le « réseau de contenu ». A. MISE EN ŒUVRE D’UNE CAMPAGNE DE LIENS SPONSORISÉS ET POSITIONNEMENT PUBLICITAIRE I. Les AdWords, qu’est-ce que c’est et comment ça marche ? « AdWords* » est le nom commercial donné par Google aux liens sponsorisés, donc à la publicité présente sur les pages de résultats. La règle est simple, l’annonceur qui a indiqué l’enchère la plus haute est placé dans les premières positions. Le système des liens sponsorisé repose sur deux concepts : Un paiement au clic appelé CPC* (coût par clic) par opposition au CPM (coût par mille) : l’annonceur ne paie que si son annonce est cliquée, pas si elle est affichée sans être cliquée (comme beaucoup de régies publicitaires). Chaque clic reviendra au moins à 0,01€. Le coût réel dépendra donc du prix des mots-clés et du positionnement de vos annonces. Vos dépenses pourront donc être totalement maîtrisées puisque vous pourrez choisir les coûts par clics maximum que vous êtes prêts à payer ainsi que votre budget quotidien. Un système d’enchères pour déterminer le placement des liens les uns par rapport aux autres : l’annonceur qui propose le meilleur CPC (qui payera le plus cher au clic) est donc classé premier. Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Le référencement payant 37 Google classe les liens « AdWords » aussi en fonction de la popularité au clic (Quality Score). C'est-à-dire que l’annonceur qui paiera le plus cher au CPC mais dont l’annonce n’est pas souvent cliquée n’est pas forcément classé premier. En effet, le « Quality Score » est de plus en plus pris en compte par Google pour déterminer le positionnement des annonces, le but étant de cibler au mieux afin de contenter les internautes. Pour résumer, la figure 5.1 nous montre les 4 étapes à prendre en compte pour la mise en place de liens commerciaux : Des mots clés Un coût par mots clés : CPC* Un budget quotidien Liens commerciaux Etablir heure et lieu géographique Figure 5-1 : Les campagnes de liens commerciaux Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Le référencement payant 38 Référencement naturel ou référencement payant ? De nombreuses personnes se posent la question. Un petit tableau comparatif des deux solutions s’impose en figure 8-2. SEO ADWORDS - Pérennité - Présence immédiate - Présence sur tous les moteurs de recherche - Sélection géographique - Le coût - Suivi de conversion - Le train de référencement - Le coût - Résultat au bout de 3 mois - Budget => Présence Figure 8-2 : Comparaison entre le référencement naturel (SEO) et le référencement payant (AdWords) Enfin, il faut savoir que le référencement payant est une manière de forcer son positionnement (mais aussi d’avoir un référencement immédiat) et que passé cette campagne de liens sponsorisés, il ne vous restera que le référencement naturel. Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Le référencement payant 39 II. Caractéristiques fondamentales de Google AdSence Google AdSence* est le nom du programme d’affiliation publicitaire de Google. Le principe est simple : il permet à chaque webmaster de site Web de diffuser des annonces publicitaires au format texte ou illustré, en fonction du contenu et du thème de la page concerné. Par exemple, si la page parle d’agence de communication sur Paris, il sera normal de retrouver des publicités en adéquation avec le thème. Le webmaster du site touchera des revenus sur les publicités seulement si l’internaute clique dessus. Il est possible de personnaliser les publicités (couleurs, design, etc …) afin que l’intégration sur le site soit parfaite. Les webmasters qui fournissent un espace publicitaire aux annonceurs, par l'intermédiaire de Google, peuvent percevoir, soit un revenu pour mille impressions de page, soit un revenu pour chaque clic d'un visiteur du site sur une annonce. Le revenu au clic dépend du montant que l'annonceur est prêt à donner pour cela, défini évidemment au moment ou il fournit l'annonce. Google AdSense utilise la technologie JavaScript. Par conséquent, les annonces ne s'affichent pas quand le JavaScript est désactivé sur le navigateur de l'internaute. En outre, il existe également des systèmes bloquant les publicités, comme des extensions pour navigateur ou des logiciels spécifiques. Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Le référencement payant 40 B. COMBIEN COÛTE UN RÉFÉRENCEMENT EFFICACE ? Tout dépendra bien évidement de la nature du projet et du temps passé au référencement. Cela peut donc être très variable. Certaines offres basiques (environ 30 à 100 €) que l’on peut trouver sur Internet comprennent quelques conseils et outils, mais cela reste un suivi très simple et … peu efficace. D’autres offres plus élaborées, avec des conseils sur les choix des mots-clés, un travail d’optimisation des pages ou encore la réalisation d’un rapport détaillé de l’audience peuvent coûter plusieurs milliers d’euros. En règle générale une prestation de base coûtera entre 700 et 3 000 € TTC par an. Certains sites proposent des référencements gratuits, ce qui probablement conviendra parfaitement pour votre site perso. Des sociétés proposent également des référencements optimisés aussi bien pour Google que pour Bing (des différences sont notables en termes de référencement sur les deux moteurs). Enfin, pour toute démarche, sachez qu’il est absolument impossible de garantir en référencement naturel un positionnement sur un mot-clé ou une expression pour un ou plusieurs moteurs de recherche. Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Le référencement payant 41 6. CONCLUSION Le référencement naturel est un travail à très long terme, puisqu'il doit s'opérer tout au long de la vie du site Internet. Les algorithmes des moteurs de recherche évoluent sans cesse, donc les résultats que vous obtiendrez ne seront jamais définitivement acquis (à titre d’exemple, le PageRank peut varier en fonction de plusieurs critères, ou encore de nouvelles pages optimisées peuvent venir modifier une situation que l’on croyait établie). Gardez aussi à l'esprit que Google apprécie un comportement naturel et peut pénaliser (temporairement ou non) tout abus. Par exemple, si votre site obtient 10 000 liens externes en quelques jours, cela ne va pas paraître naturel. Il faut acquérir des liens progressivement. Il en est de même pour une répétition exagérée d'une expression sur une page, mots clés cachés (texte blanc sur fond blanc par exemple), etc. Il n'est toutefois pas possible d'avoir une vue d'ensemble de la meilleure manière possible de positionner une page en première page de résultats des moteurs de recherche, les critères sont trop nombreux, changeants, et la majorité des éléments pris en compte par les algorithmes des moteurs est inconnue. Enfin, il est préférable de valoriser les contenus à valeur ajoutée (articles rédigés par vos soins et non ceux du site concurrent, photos, etc …). De manière générale, un site avec un « vrai » contenu et bien pensé pour les visiteurs sera en général bien référencé. En outre, nous avons présenté différentes techniques d'optimisations et outils permettant d'améliorer à la fois la pertinence et la notoriété. En conclusion, le référencement est un « métier » à part entière, les techniques évoluant, il faut toujours se maintenir à jour (par exemple : le flash risque d’être un contenu bientôt lisible, les astuces ne seront donc plus valable). Seules les méthodes restent. Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? /Conclusion 42 7. TABLE DES ANNEXES ANNEXES Annexe n°1 : Google Analytics : l’outil idéal pour l’analyse Annexe n°2 : Google Analytics : l’outil idéal pour l’analyse (P2) Les annexes sont classées par ordre d’apparition. Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Table des annexes 43 Annexe n°1 : Google Analytics : l’outil idéal pour l’analyse Il est possible d’obtenir des graphiques détaillés du nombre de visite. Il est possible d’obtenir un camembert des sources du trafic. Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? /annexes 44 Annexe n°2 : Google Analytics : l’outil idéal pour l’analyse (Partie 2) Avec la « vue d’ensemble », on peut connaître la où les internautes ont cliqués. Il est possible de connaître les résolutions les plus utilisées pour le site www.npc-media.com Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? /annexes 45 8. BIBLIOGRAPHIE & WEBOGRAPHIE Bibliographie ANDERRUTHY Jean-Noël, Google AdWords, Analytics et AdSense - Générez plus de trafic sur votre site, Paris, Éditions ENI, Collection « Objectif solutions », 2009. ANDRIEU Olivier, Réussir son référencement Web, Paris, Éditions Eyrolles, 2007. ANDRIEU Olivier, DUFFEZ Olivier, Google : Trucs de pros, Paris, Éditions Micro Application, Collection « Dossier Micro Application », 2004. CANIVET Isabelle, Bien Rédiger pour le Web - Les Clés du Référencement naturel, Paris, Éditions Eyrolles, Collection « Accès libre », 2007. MICHELI Régis, PASCAL Albericci, Les Clés du Référencement sur le Web, Paris, Éditions « Books on Demand », 2009. PRAT Marie, Référencement de votre site Web ; Google et autres moteurs de recherche, Paris, Éditions ENI, Collection « Objectif solutions », 2007. Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Bibliographie & Webographie 46 Webographie Site de « Comment ça marche ? », Qu'est-ce que le référencement ? (consulté le 09 avril 2009) http://www.commentcamarche.net/contents/web/referencement.php3 [en ligne]. Site de « Google », Centre d'aide Administrateur Web (consulté entre le 15 et 20 février 2009) http://www.google.com/support/webmasters/bin/answer.py?answer=35769 [en ligne]. Site de « Google AdWords », Centre de Google AdWords (consulté entre le 10 et 20 mars 2009) https://adwords.google.com/support/?hl=fr [en ligne]. Site de « Google Analytics », Centre d'aide de Google Analytics (consulté le 10 et 15 mars 2009) http://www.google.com/support/googleanalytics/?hl=fr-FR [en ligne]. Site de « Knol – Google », Le référencement naturel (consulté le 20 mars 2009) http://knol.google.com/k/frdric-gaye/le-rfrerencement-naturel/1r994iwtcmcnq/2# [en ligne]. Site de « QuetzalX », Le référencement de votre site Web (consulté entre le 02 et 05 avril 2009) http://www.quetzalx.fr/referencement_web.php [en ligne]. Site « Référencement Web.com », Guides du Référencement Web (consulté le 02 avril 2009) http://www.referencementweb.com/guides-referencement-web [en ligne]. Conférence MNATZAKANIAN Armen, entreprise Web-ISI, « initiation au référencement », mai 2008 Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Bibliographie & Webographie 47 9. GLOSSAIRE AdWords Les adwords sont des annonces publicitaires ciblées proposées par Google et diffusée sur les pages de résultats Google, sur les sites partenaires de Google, sur les sites personnels et le webmail de Google avec le système des adsenses. C'est une solution pour obtenir rapidement de la visibilité sur le web. Annuaire L’annuaire est un outil pour améliorer la visibilité. L'annuaire (ex : l’annuaire Dmoz) est un outil de recherche qui organise le classement de site en fonction de rubriques et de catégories. Les annuaires jouent un rôle essentiel dans le référencement d'un site internet. Un annuaire se présente comme un répertoire constitué de rubriques et de sous rubriques et qui recense des liens. Il existe des annuaires entièrement automatisés et des annuaires soumis à validation manuelle. Dans le premier cas, le webmaster soumet son site via un formulaire. Une vérification humaine est faite avant ajout dans la base de données de l'annuaire. Dans le deuxième cas de figure, le site est stocké dans une base de données de l'annuaire en attente d'indexation. Les annuaires offrent de la visibilité aux sites répertoriés et améliorent leur trafic. AdSence Les adsenses sont des annonces contextualisées de textes, d'images ou de vidéos destinées aux webmasters désireux de mettre en place sur leur site les annonces publicitaires des affiliés adwords. Le système adsense est un programme qui choisit de façon automatique les annonces à diffuser sur vos pages selon le contexte sémantique de ces dernières. Backlink Un « backlink », est un lien entrant*. Tous les liens qui pointent sur une page web en provenance d'une autre page web, que ce soit d'une page ayant le même nom de domaine (lien entrant interne) ou un nom de domaine différent (lien entrant externe), sont considérés comme des backlinks. Les backlinks peuvent provenir d'un annuaire, de blogs*, de forum... Dans l'univers du SEO* (Search engine optimisation), la visibilité d'un site passe par la mise en place d'une stratégie de netlinking et notamment par la création de liens entrants (backlinks) vers les pages du site. La valeur d'un backlink est évaluée à partir de la qualité des pages d'où ils proviennent. Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Glossaire 48 Blog Un blog ou web blog est un site web constitué de billets publiés à intervalles plus ou moins réguliers. Les publications gérées par des systèmes de gestion de contenu sont simples et peuvent être faites en temps réel, la ligne éditoriale est choisie par le blogueur. Ces billets sont répertoriés par ordre chronologique. On retrouve divers type d'articles sur les blogs corporate : • des articles d'actualités avec une analyse, un avis argumenté qui donne une valeur ajoutée à l'information. Il peut s'agir d'actualités sont vous avez l'exclusivité ou reprises sur d'autres sources d'information, • des articles de fond documentés sur un sujet général ou concernant votre secteur d'activité, • des tutoriaux qui mettent en avant votre expertise, • des enquêtes ou des sondages, • des comptes rendu d'un salon, d'une conférence, • des vidéos, • des articles en réponses à d'autres blogs. CPC CPC ou coût par clic. Le Coût par clics désigne un mode de rémunération qui consiste à payer une tierce personne au nombre de clics enregistrés. Contrairement au CPM*, l’annonceur ne paie que si l’internaute clique sur son espace publicitaire (bandeau ou lien). CPM CPM ou coût pour mille. Unité de mesure du coût d’une bannière publicitaire qui établit un coût pour l’affichage de mille espaces publicitaires sur une page Web sans que celui-ci soit cliqué par l’internaute. Cet indicateur permet d’évaluer et de comparer les tarifs publicitaires des différents sites en fonction du nombre de pages avec publicité vues. Un CPM de 25 euros signifie alors : “l’annonceur paye 25 euros chaque fois que son espace publicitaire est affiché 1 000 fois sur une page Web”. Cross linking Le « cross linking » désigne des liens issus d'un site externe. Le cross linking participe à la notion de popularité. Il s'agit d'une opération qui vise à développer le nombre de liens hypertextes pointant vers un site à partir d'autres sites dont le contenu et le public correspondent à la cible visée par le premier. La position de votre site dans les pages de résultats dépend de l'analyse de la qualité et la pertinence des liens entrants sur vos pages. Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Glossaire 49 Ferme de liens Une « ferme de liens » traduction littérale de l'anglais « link farm » est une technique considérée comme du spam et qui vise à augmenter l'importance d'un site en exploitant le page ranking défini par les moteurs de recherche. Dans une ferme de liens, plusieurs sites font des liens réciproques les uns vers les autres dans le but d'augmenter artificiellement leur classement dans les pages de résultats des moteurs de recherche. Ces échanges de liens n'ont souvent aucune cohérence ou pertinence par rapport aux thématiques abordées sur les dits sites. L'accroissement de la popularité d'un site au moyen de fermes de liens est considéré par les moteurs de recherche comme un référencement abusif. Flash (Flash AS3) Logiciel conçu par Macromedia (racheté par Adobe). Il permet de créer des animations graphiques et technologiques plus interactives pour les sites Web (ex : bannière animée, vidéo en streaming …). Fraude au clic Action qui consiste à générer des clics manuellement ou automatiquement sur les liens publicitaires d’un site concurrent. La fraude au clic est une action qui consiste à générer des clics manuellement ou automatiquement sur les liens publicitaires d'un site concurrent de manière à dépenser tout le budget d'une campagne d'achat de mots clés très rapidement ou pour augmenter les revenus publicitaires d'un site web. En 2008, des statistiques (source : Click Forensics) montrent que plus de 23 % de la fraude au clic est générée par des botnet (machines zombies). Google Trends Google Trends est un outil gratuit élaboré par Google qui permet de comparer et d'analyser l'utilisation de mots clés dans les requêtes faites sur Google. Lancé en 2006, Google Trends offre aujourd'hui plusieurs applications utiles pour le référencement de sites web : • la suggestion de mots clés pertinents, • les sujets à la mode sur une période donnée, • la comparaison de mots clés. Google trends indique quels mots clés sont les plus recherchés et sous quelle forme (singulier/pluriel, accentué ou non...), • des liens vers des articles d'actualités en rapport avec les mots-clés analysés, • un accès aux archives conservées dans la base de données • la possibilité de comparer jusqu'à 5 mots clés : volume de recherche... • la possibilité d'effectuer une recherche précise en utilisant «», • une analyse géolocalisée des requêtes des internautes. Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Glossaire 50 Google Bot Google Bot est un robot d'indexation du moteur de recherche Google qui parcourent les pages du web afin de les classifier dans son index. Google Bot est un logiciel qui explore et analyse de manière automatique le web. Google Bot analyse la structure du contenu page par page en identifiant des balises HTML ce qui lui permet de repérer les mots ou expressions importants dans une page (notamment les mots placés entre <h1>expressions clés</h1>). Ce traitement de l'information associé à d'autres critères est un élément qui permet à Google Bot de fournir des résultats pertinents aux internautes. Google Bot consulte en permanence le web de façon à reconstruire sans cesse son index. A partir de PR* 5 Google Bot visite régulièrement les pages. A partir de PR 6 les pages sont visités quotidiennement en général. Placer un lien dans une page à PR élevé est donc un moyen efficace de booster le référencement de nouvelles pages. Google Analytics Google Analytics est une solution gratuite proposée par Google qui permet l'analyse quotidienne des statistiques d'un site. Cet outil permet aux éditeurs d'avoir une vue globale sur le trafic généré sur leur site. Google Analytics permet d'identifier : • le nombre de visite, • la provenance des visite (moteur de recherche, annuaire, ...), • le comportement des utilisateurs d'un site, • les pages d'entrées sur le site, • les pages de sortie, • les marchés géographiques porteurs, • la rentabilité des mots clés dans une campagne adwords. Google Dance La Google dance correspond à une période récurrente de quelques jours au cours de laquelle Google met à jour le classement des pages de son index et change son algorithme. Cette période se traduit par une variation possible des positions d'une page sur un même mot clé dans les pages de résultats. La Google dance influe donc sur le nombre de pages indexées d'un site et sur son page rank. Google actualise son index environ une fois par mois. La Google dance peut durer de quelques heures à quelques jours. Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Glossaire 51 Indice de Popularité L'indice de popularité d'un site est calculé à partir du nombre de pages qui ont mis en place un lien entrant vers ce même site. En d'autres termes, plus le site comporte de liens entrants en provenance de pages ellesmêmes populaires, plus il est doté d'un indice de popularité élevé. Cette donnée est prise en compte par certains moteurs dans leurs classements de pertinence. Plus l'indice de popularité est élevé et meilleur est le classement dans les pages de résultats des moteurs. L'indice de popularité le plus réputé est celui du moteur de recherche Google : le PageRank. Il est aujourd'hui souvent associé au Trust rank destiné à mesurer la crédibilité des pages web. Alors que le page rank s'appuie sur des éléments quantitatifs, le trust rank privilégie les liens qualitatifs en provenance de sites considérés comme faisant référence. JavaScript JavaScript est un langage de programmation de scripts principalement utilisé pour les pages Web interactives. Keyword Keyword est le terme anglais qui désigne le «mot clé». La sélection de keyword est essentielle dans une stratégie d'optimisation d'un site. Ce choix influe à lui seul sur le positionnement du site. Le choix d'un Keyword répond à deux exigences : • l'intérêt du positionnement : le mot clé est-il souvent saisi lors des recherches des internautes • la faisabilité du positionnement : le positionnement du keyword est possible c'est-à-dire que le mot clé n'est pas trop concurrentiel. Il existe de nombreux outils permettant de rechercher des mots clés. L'un des plus fiable : Google AdWords* qui propose des idées de Keyword et fournit des tendances de volumes de recherche. Keyword Stuffing Le keyword stuffing consiste à insister trop lourdement dans les « meta tags » et dans le contenu visible de la page sur les mots clés que l'on souhaite mettre en avant. D'ailleurs, l'abus d'utilisation de mots clés dans les métadonnées pourrait expliquer pourquoi les moteurs ne prennent plus en compte les métas description et keyword dans le positionnement d'une page. Il existe plusieurs techniques de keyword stuffing : • le texte caché soit derrière une image, soit dans une couleur identique au fond d'écran, l'utilisation de la balise «noscript» • la répétition excessive de mots clés qui génèrent beaucoup de trafic mais qui n'ont rien à voir avec les thématiques du site sur lequel ils sont placés. Depuis 2005, les moteurs de recherche repèrent ces techniques et les sanctionnent. Ils utilisent aujourd'hui des techniques de reconnaissance Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Glossaire 52 thématique. Les sites qui utilisent le keyword stuffing pour générer du trafic sur leur page et pour doper leur positionnement sont susceptibles d'être blacklistés, c'est-à-dire expulsés des index des moteurs de recherche. Lien entrant Un lien entrant est un lien qui provient d'une autre page web, qu'il s'agisse d'une page appartenant au même site, c'est alors un lien entrant interne, ou d'une page en provenance d'un autre site, lien entrant externe. Le lien entrant est aussi appelé backlink. La plupart des moteurs de recherche (Google ou autres) évaluent si un site internet est populaire et pertinent par le nombre et la qualité des liens entrants qui pointent vers ce site internet. Les liens entrants sont déterminants dans le positionnement d'un site. Ils peuvent : • Attirer des internautes : en effet, plus vous possédez de liens entrants vers votre site internet, plus vous avez de chances d'augmenter votre taux de visibilité, ces liens représentant une porte d'entrée supplémentaire sur votre site. • Favoriser le référencement naturel : le fait d'être la cible de liens entrants en provenance de sites pertinents augmente significativement votre indice de popularité. Lien externe Le lien externe renvoie vers un site extérieur. Les liens externes sont déterminants pour le positionnement d'un site dans les pages de résultats. En effet, plus un site possède de liens externes, c'est-à-dire de liens entrants en provenance d'un autre site, plus les moteurs de recherche vont considérer que ce site est populaire et pertinent. Pour que ces liens externes soient efficaces, ils doivent : • provenir de sites abordant un même sujet ou en rapport avec votre activité, • provenir de sites ayant un page rank égal ou supérieur, • être faits sur du texte contenant les mots clés du site vers lequel ils pointent. Pour être correctement suivi par les crawlers, les liens doivent être en dur, par exemple : <a href= "nom-de-page.html ">nom de la page</a>. Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Glossaire 53 Lien interne Un lien interne est un lien qui relie deux pages d'un même site. Le lien interne renvoie vers une autre partie d'un site ou vers une autre partie de la page que l'on est en train de lire. Les liens internes doivent apporter un éclairage, une valeur ajoutée à l'information transmise aux lecteurs. Ils participent et facilitent la navigation sur un site. Ils sont souvent utilisés comme sommaire pour les pages un peu longues de façon à distinguer nettement les diverses parties d'un dossier. Pour des questions relatives à la lisibilité d'une page, il est préférable de ne pas abuser des liens dans le corps du texte. Lien sortant Un lien sortant est un lien qui conduit de votre site internet à un autre. Utilisés à bon escient, ils apportent une valeur ajoutée à l'information que l'utilisateur recherche. L'importance de la mise en place de liens sortants dans une stratégie de référencement n'est pas négligeable. Lien retour Les liens retours ou backlinks en anglais sont des liens qui pointent vers une page web. Ils sont également appelés liens entrants*, liens arrivants ou inlinks. Le nombre de liens retours sur une page est un indicateur de popularité et de pertinence de la page. Les liens retours sont l'un des critères importants qui déterminent le classement d'une page. Marketing viral Le marketing viral repose sur la facilité et la rapidité de la transmission de l'information sur le web. Il s'agit d'une technique marketing qui vise à multiplier la cible par le transfert de l'information d'internaute en internaute. Le marketing viral permet de faire la promotion d'un produit ou d'un service avec peu de moyens économiques. Il est souvent associé au « buzz marketing ». Meta Description La balise meta description est placée dans l'en-tête du code source de la page. C'est une balise HTML. Par exemple : <meta name="description" content="Imagejuridique - 11, rue aux Ours 75003 Paris France - Tél / Fax : 01 45 24 43 49 - Communication des professions juridiques et judiciaires, conseils juridiques" /> Cette balise n'est plus prise en compte par les moteurs de recherche pour le positionnement d'un site. La balise meta description doit toutefois être renseignée. En effet, c'est le contenu textuel de cette métadonnée qui apparait dans les pages de résultats de recherche. Si la balise meta description n'est pas renseignée, c'est une concaténation du texte visible de la page qui apparait dans la page de résultats. Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Glossaire 54 Nom de domaine Le nom de domaine est lié à la notion d'adresse IP (Internet Protocol) qui est l'adresse identifiant un ordinateur ou un serveur connecté à un réseau. Cette adresse étant une suite de chiffre peu mémorisable, le nom de domaine a été créé. Le nom de domaine, à l'instar de l'adresse IP, n'est pas attaché à une machine et peut donc changer de propriétaire. Le nom de domaine est composé du nom du site et d'une extension qui correspond soit au type d'activité (.com, .net, .info...) soit au nom du pays dans lequel le site est hébergé (.fr, .uk, .de...). Le choix du nom de domaine est important. Il est effectivement délicat d'en changer sous peine de perdre des positions difficilement acquises et du trafic généré par sa notoriété. PHP PHP (acronyme récursif pour PHP : Hypertext Preprocessor), est un langage de scripts libre principalement utilisé pour produire des pages web dynamiques via un serveur HTTP, mais pouvant également fonctionner comme n'importe quel langage interprété de façon locale, en exécutant les programmes en ligne de commande. Quality score Le « quality score » est un indice de performance accordé à une page en fonction de sa pertinence. Il permet de définir le rang des annonces publicitaires affichées dans les pages de résultats. RSS RSS désigne une famille de formats XML*. Ce standard est utilisé pour obtenir les mises à jour d'information dont la nature change fréquemment. Pour les recevoir, l'utilisateur doit s'abonner aux flux, ce qui lui permet de consulter rapidement les dernières mises à jour sans avoir à se rendre sur le site. Search Engine Optimization (SEO) SEO est l’acronyme de Search Engine Optimization. En français on parle d’optimisation du référencement. Il s’agit en effet de mettre en œuvre un ensemble de techniques pour améliorer son référencement et donc son positionnement dans les moteurs de recherches. Soumission Action de soumettre l’URL d’un site ou d’une page Web à un outil de recherche pour être pris en compte dans l’index. Les pages peuvent être également prises en compte sans soumission par un moteur par la visite spontanée et régulière de son robot d’indexation. Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Glossaire 55 Soumission payante Principe par lequel la soumission à un outil de recherche est rendue payante. Dans le cadre d’une offre de soumission payante, l’outil de recherche s’engage sur les délais de prise en compte de la demande mais ni sur l’acceptation de la soumission et du positionnement du site. Taux de rebond Pourcentage de visiteurs qui ont consulté qu’une page d’un site et qui l’ont quitté. Le taux de rebond désigne un pourcentage de visiteurs qui ont consulté qu'une page d'un site et qui l'ont quitté rapidement sans poursuivre leur lecture sur d'autres pages. Le taux de rebond est un bon indicateur de l'intérêt que les visiteurs accordent à un site. Un taux de rebond élevé peut toutefois être interprété de diverses manières. Il peut notifier : • • • URL Rewriting l'insatisfaction d'un visiteur. Dans ce cas, le webmaster doit travailler à la fois l'ergonomie du site, le design, la qualité du contenu qui doit répondre à des critères de pertinence par rapport à la requête, le fait que l'utilisateur a trouvé immédiatement l'information qu'il recherchait, un clic sur un lien externe. L’URL rewriting est une technique consistant à faire réécrire (par le serveur Web) sous forme plus simple des URL complexes. C’est le cas des pages dynamiques pour lesquelles le serveur traduit à la volée l’URL simplifiée en URL initiale. Par exemple les liens vers la page produit.php?type=1.php peuvent être transformés en liens vers produit_1.htm, grâce au serveur ce sera transparent pour l’internaute, et surtout pour les moteurs de recherche qui ont ainsi des adresses de pages plus simples à parcourir… ce qui améliore souvent le référencement des pages dynamiques. XHTML XHTML est un langage de balisage servant à l'écriture de pages du World Wide Web. Conçu à l'origine comme le successeur de HTML, XHTML se fonde sur la syntaxe définie par XML, plus récente et plus simple que la syntaxe définie par SGML sur laquelle repose HTML. Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Glossaire 56 W3C Le World Wide Web Consortium, abrégé par le sigle W3C, est un organisme de normalisation fondé en octobre 1994 pour promouvoir la compatibilité des technologies du World Wide Web telles que HTML, XHTML*, XML*, RDF, CSS*, PNG, etc. . Le W3C n'émet pas des normes au sens européen, mais des recommandations à valeur de standards industriels. XML XML (eXtensible Markup Language) est un langage informatique de balisage générique. Le World Wide Web Consortium (W3C*), promoteur de standards favorisant l'échange d'informations sur Internet, recommande la syntaxe XML pour exprimer des langages de balisages spécifiques. De nombreux langages respectent la syntaxe XML : XHTML*, SVG etc. Si l’objectif principal du référencement est la visibilité quels sont les outils et les méthodes permettant d’atteindre cet objectif ? Glossaire 57