Trouver des ressources pédagogiques sur internet

Les moteurs de recherche

Définition

Un moteur de recherche est une application permettant de retrouver des ressources (pages web, forums Usenet, images, vidéo, fichiers, etc.) associées à des mots quelconques.

Certains sites web offrent un moteur de recherche comme principale fonctionnalité ; on appelle alors moteur de recherche le site lui-même (Google Video par exemple est un moteur de recherche vidéo).

Les parties d'un moteur de recherche

Un moteur de recherche se divise en trois parties :

  • Le robot, spider, ou web crawler, est un programme qui se promène sur le web, repère et visite des pages html. Il lit le contenu de la page, repère les liens vers d'autres pages (la profondeur de l'arborescence est limitée pour ne pas partir dans tous les sens), et il revient voir la page avec une certaine périodicité, pour voir s'il y a eu des changements.

  • L'indexation : un autre programme stocke les données collectées par le robot (chez Google, c'est le Googlebot), et les données envoyées par les webmasters (important pour les requêtes particulières ou sujets très spécialisés), qui peuvent poster leurs mots clefs. Les mots les plus fréquemment utilisés de chaque page, ainsi que les mots du titre ou d'autres parties significatives de la page sont épluchés, avec des mises à jour périodiques là encore.

  • L'interface de recherche, la partie web qui traite les requêtes selon une syntaxe propre à chaque moteur, nous y reviendrons pour Google. La requête est adressées à l'index, qui propose des réponses sous forme de liens vers des pages html, en fonction d'un ordre de pertinence dont l'algorithme, là encore varie d'un moteur à l'autre.

Les critères de pertinence

La plupart du temps, on peut classer, par ordre d'importance :

  • Le nombre de liens sur d'autres sites qui pointent vers la page que vous recherchez, plus on fais de liens vers un site, plus il est important aux yeux de google.

  • La présence des mots clefs dans le titre, l'en-tête (avec les meta tags, mots laissés par les webmasters pour que le robot les collecte), et le contenu de la page.

  • La position des mots clefs dans la page, le haut de page a toujours plus de succès, car c'est ce que nous lisons ou ce qui s'affiche en premier.

  • Le nombre d'occurrences (apparitions) des mots clés.

  • L'indice de popularité, c'est à dire le nombre de liens qui pointent vers la page.

Cela pose le problème des sites "isolés", sur lesquels aucun lien venant d'autres pages ou sites web ne pointent...

RemarqueLe "Deep web"

Une grande partie du net n'est pas indexé par les moteurs de recherche, cela correspond à la partie non-accessible et non indexée, certains types de fichiers (flash par exemple), les liens que n'ont pas scannés les robots, les sites trop récents, les bases des données interrogeables uniquement en interne (bibliothèques par exemple), les pages dynamiques (générées par des scripts) les pages protégées par mot de passe, ou les pages interdites aux robots d'indexation (par les webmasters, en indiquant des exclusions dans le fichier robots.txt).

Sans oublier les liens morts...

ComplémentVidéo : Les moteurs de recherche

Les-moteurs-de-rechercheInformationsInformations[1]

ComplémentLe fonctionnement des moteurs de recherche

Les moteurs de recherche - FonctionnementInformationsInformations[2]
Fonctionnement du moteur de rechercheInformationsInformations[3]

Les principaux moteur de recherche

Google

Google est tout simplement le plus grand et le plus populaire des moteurs de recherche.

L'admission d'un site web à l'index de Google est gratuite.

Google a le meilleur taux de satisfaction des usagers, le meilleur taux de croissance économique, et sa part du marché augmente de jour en jour. Aussi, l'influence qu'il a sur d'autres moteurs de recherche en fait l'une des cibles principales des stratégies de référencement.

Son algorithme est fortement influencé par le nombre et la qualité des citations (ou liens entrants) dont dispose un site web.

Le succès qu'a obtenu Google en incluant ce facteur (PageRank) à son algorithme fait en sorte que de plus en plus de moteurs de recherche adoptent aussi ce facteur.

Exalead

Quand on parle d'Exalead, on fait référence à un logiciel servant à fournir des informations aux entreprises et/ou à les mettre en ligne. Il s'agit d'un éditeur de logiciels français créé en 2000 qui fonctionne comme un moteur de recherche.

Grâce à Exalead, vous serez en mesure de retrouver beaucoup plus rapidement ce que vous recherchez sur la toile en partant de la barre de recherche qui se trouve sur la page d'accueil.

On compte deux types de recherche sur Exalead : la recherche web (pour tout ce qui a trait aux sites web, documents Word etc.) et la recherche d'images qui, comme son nom l'indique s'oriente vers les photos, dessins, icones etc. D'autres fonctionnalités sont également disponibles, comme c'est le cas pour l'option « type de recherche » qui vous donne l'occasion de procéder à une recherche phonétique si l'orthographe du terme recherché vous échappe.

Bing

Bing est un moteur de recherche créé par Microsoft et sorti en juin 2009. Il s'agit d'un moteur de recherche très utilisé et qui est le principal concurrent de Google, même si celui-ci reste globalement en situation de quasi-monopole dans le monde.

Bing est un produit de Microsoft, il est donc très lié à certains outils de la firme. C'est le moteur de recherche par défaut sur les différentes versions du navigateur web Internet Explorer, ce qui explique en partie l'importance qu'il a pu prendre ses dernières années. Microsoft le présente comme un moteur de recherche plus abouti que Google.

Il propose plusieurs services différents :

  • de la recherche sur le web ;

  • de la recherche d'images ;

  • de la recherche de vidéos ;

  • de la recherche sur des cartes (Bing Maps) ;

  • ...

Qwant

Qwant est un moteur de recherche français créé en 2013 qui annonce ne pas tracer ses utilisateurs, pour garantir la vie privée, et qui se veut neutre dans l'affichage des résultats.

Son originalité réside dans le fait qu'il propose lors d'une même recherche plusieurs types de résultats : sites web classiques, sites marchands, sites d'actualité ou encore réseaux sociaux.

Le but de Qwant est d'ailleurs d'afficher « Tout le web sur une seule page Qwant », de proposer « une nouvelle vision du web ». Par ailleurs, à l'instar du moteur de recherche DuckDuckGo, un des objectifs principaux de Qwant est le respect de la vie privée de ses utilisateurs, ce que le site réalise en ne traçant pas ses utilisateurs.

ComplémentLa guerre des moteurs de recherche, la véritable histoire d'internet (vidéo)

La guerre des moteurs de recherche, la véritable histoire d'internet
  1. Source : https://www.canal-u.tv/video/c2i/les_moteurs_de_recherche_module_2_3.15660

  2. Source : https://youtu.be/asA45WDpbsQ

  3. Source : https://youtu.be/pMywV9ZLS4M

PrécédentPrécédentSuivantSuivant
AccueilAccueilImprimerImprimer Projet ProSoTIC - Maxime Duquesnoy Paternité - Pas d'Utilisation Commerciale - Partage des Conditions Initiales à l'IdentiqueRéalisé avec Scenari (nouvelle fenêtre)