Google Search n'a empiré qu'après la mort de "Googlewhacks"
Agence web » Actualités du digital » Google Search n'a empiré qu'après la mort de « Googlewhacks »

Google Search n'a empiré qu'après la mort de « Googlewhacks »

Google est de loin le moteur de recherche le plus dominant de la planète, avec une part énorme du marché des moteurs de recherche. Ce n'est cependant pas parce que la recherche Google est dominante. En fait, l'inverse est vrai; La qualité de la recherche Google a empiré de plus en plus, et il est possible d'identifier le moment où tout s'est mal passé.

Dans le bon vieux temps, Google était un moteur de recherche lexical

Google Search n'a pas toujours été horrible. À l'époque, il a fait exactement ce qu'il était censé faire. Vous entreriez dans une requête de recherche et Google chercherait les mots clés exacts de votre requête de recherche sur Internet. Il ne rendrait que les résultats qui contenaient les mots clés que vous avez recherchés.

Ceci est connu sous le nom de recherche lexicale. La recherche lexicale n'essaie pas de comprendre votre intention; Il essaie simplement de correspondre aux mots spécifiques que vous entrez dans votre requête. Si vous tapez la « hauteur de l'Everest » dans un moteur de recherche lexical, il ne suppose pas que vous voulez probablement connaître la hauteur du mont Everest. Il cherche simplement des pages Web qui ont les mots « Everest » et « Height » sur eux.

La plupart des pages Web qui contiennent des informations sur la hauteur du mont Everest auront les mots «Everest» et «hauteur» sur eux quelque part, de sorte que les résultats de cette requête de recherche dans un moteur de recherche lexical seront presque toujours utiles. Vous pourriez obtenir le résultat étrange qui contenait ces mots mais qui était totalement sans rapport avec la montagne, mais vous avez toujours été assuré d'obtenir des résultats qui contenaient vos mots clés quelque part.

La recherche lexicale a rendu Googlewhacks possible

La façon dont Google travaillait comme un moteur de recherche lexical signifiait que vous pouviez vous divertir en essayant de trouver Googlewhacks. Un Googlewhack était une requête de recherche Google contenant exactement deux mots de dictionnaire valides qui, lorsqu'ils sont entrés sans devis, n'ont renvoyé qu'un seul résultat. En d'autres termes, le jeu devait essayer de trouver une combinaison de deux mots qui ne sont apparus que sur une seule page à travers l'intégralité d'Internet.

Par exemple, certains anciens googlewhacks comprenaient des « scallywags ambidextrous », « squirreling Dervises » et « tatal fétichisé ». Googlewhacks avait tendance à être de courte durée, car l'action d'en publier une que vous aviez trouvée en ligne signifierait qu'une deuxième page Web contiendrait désormais ces deux mots, et le Googlewhack ne serait plus valide.

Le comédien britannique Dave Gorman a obtenu un livre entier et un spectacle de scène de Googlewhacks. La prémisse était qu'il voulait créer une chaîne de 10 Googlewhacks, où le propriétaire du site Web où chaque Googlewhack a été trouvé devrait trouver le prochain Googlewhack dans la chaîne. Il a voyagé dans toute l'Amérique, l'Europe, l'Australie et la Chine, rencontrant des hôtes Web et devenant un peu fou. Si vous n'avez pas lu le livre, cela vaut vraiment la peine de vérifier L'aventure Google de Dave Gorman.

Googlewhacks est vraiment mort lorsque Google a changé comment cela a fonctionné

Alors que de plus en plus de gens recherchaient Googlewhacks, ils sont devenus plus difficiles à trouver, car les ajoutant à la liste de Google découverts les a instantanément supprimés de l'existence. Cependant, l'âge du Googlewhack a vraiment pris fin lorsque Google a fondamentalement changé le fonctionnement de son moteur de recherche.

Google s'est éloigné de la recherche lexicale et a plutôt commencé à se concentrer sur la recherche sémantique, c'est-à-dire lorsqu'un moteur de recherche essaie de comprendre l'intention derrière une requête plutôt que de simplement rechercher des mots clés. Il a commencé en 2012 avec l'introduction du graphique de connaissances. Il s'agit d'une énorme base de données d'informations que Google utilise pour connecter des mots dans les requêtes de recherche dans « des choses, pas des chaînes ».

L'exemple que Google a donné au lancement était la requête « Taj Mahal ». Un moteur de recherche lexical chercherait le mot « Taj » et chercherait également le mot « Mahal ». En utilisant le graphique de connaissances, cependant, il est possible de comprendre que ces deux mots se réfèrent à une chose spécifique, que ce soit le célèbre monument ou le musicien du même nom.

En 2013, Google a présenté son nouvel algorithme de colibri. Cet algorithme de recherche s'est concentré sur le traitement du langage naturel et a essayé de déterminer l'intention de la requête de recherche plutôt que de simplement correspondre aux mots clés.

C'est à ce stade que le Googlewhack est vraiment mort, car lorsque vous tapez deux mots dans un moteur de recherche sémantique, il ne cherche pas de pages contenant ces deux mots clés exacts. Il cherche ce qu'il pense que ces deux mots signifient. Une recherche de « armadillo fétichisé » donne soudainement des résultats qui sont beaucoup moins innocents que le google d'origine.

Depuis lors, Google Search a empiré de plus en plus

Google est passé à la recherche sémantique dans le but d'améliorer la recherche. Malheureusement, c'est loin d'être le cas; Google Search est maintenant loin, bien pire qu'auparavant, et la qualité des résultats de la recherche continue de se détériorer. Si vous utilisez un peu de recherche Google, vous vous êtes presque certainement retrouvé frustré par la difficulté de faire en sorte que Google renvoie des résultats utiles pour des requêtes même apparemment simples.

Le problème est que Google a pris les choses trop loin. Lorsque vous entrez maintenant une requête de recherche, l'algorithme est si déterminé à rechercher ce qu'il pense que vous vouliez dire qu'il changera activement votre requête de recherche en autre chose.

Une partie de cela se produit dans les coulisses, mais une grande partie est frottée directement sur votre visage. J'ai récemment vu un mème qui était en anglais mais qui contenait le mot suédois « Solidaritetsersättning ». J'ai googlé le mot pour savoir ce que cela signifiait, mais Google a décidé que je ne voulais pas vraiment savoir ce que signifiait ce mot; Ce que je voulais réellement rechercher, ce sont les deux mots distincts « Solidaritet » et « Ersättning », avec la page en haut des résultats déclarant fièrement que « ce sont des résultats pour Solidaritet Ersattning ».

Selon Google Translate, ces mots se traduisent séparément par «solidarité» et «remplacement», lorsque le mot dans son ensemble signifie en fait «paiement de solidarité». Google cherchait maintenant quelque chose de différent de ce que j'avais explicitement demandé, et c'est quelque chose que cela fait beaucoup.

Si vous pensez que placer votre requête de recherche en guillemets résoudre le problème, détrompez-vous. J'ai mis des citations autour du seul mot « Solidaritetsersättning » et j'ai essayé à nouveau. Encore une fois, Google a ignoré mon intention claire de rechercher ce mot spécifique et m'a donné des résultats pour les deux mots distincts, dont aucun n'était utilisé.

Les jours où les résultats de recherche Google étaient pour vous plutôt que Google me manque

C'est incroyablement frustrant lorsque Google Search ignore activement des parties clés de votre requête pour vous apporter des résultats complètement hors de propos. Tant de fois, je vois des résultats sur la première page qui ont l'un des mots les plus importants de la requête frappé en dessous du résultat, indiquant que le résultat est pour une requête reformulée qui a omis le mot crucial. Ce n'est vraiment pas une surprise lorsque ces résultats de recherche se révèlent, alors être complètement inutiles.

Tout cela fait ressortir mon côté cynique. Pourquoi les résultats de recherche Google deviennent-ils pires plutôt que meilleurs? Y a-t-il une raison au-delà de la loi que les bons services technologiques deviennent toujours empirés?

Si Google Search réécrit nos requêtes en arrière-plan, il n'y a rien pour l'empêcher de transformer ces requêtes en celles qui sont susceptibles de générer plus de bénéfices. Google fait de l'argent des annonceurs qui paient pour que leurs annonces apparaissent aux côtés des résultats de recherche pour des mots clés spécifiques, et certains mots clés valent bien plus que d'autres. Se pourrait-il que Google reforme nos requêtes de recherche pour ne pas améliorer nos résultats de recherche (parce qu'ils ne le sont clairement pas) mais plutôt pour rendre la requête plus rentable?

C'est une pure spéculation, et je ne dis pas que c'est certainement ce qui se passe. Google Search pourrait tout simplement être pire parce que Internet est devenu tellement plus grand, ou parce que ses algorithmes ne sont tout simplement pas aussi bons qu'avant. Seul Google le sait vraiment.


Nous avons toujours tendance à regarder en arrière sur le passé avec des lunettes de couleur rose, mais dans le cas de Google Search, il est indéniable que c'est bien, bien pire qu'auparavant. Le concept derrière l'utilisation de la recherche sémantique au lieu de la recherche lexicale a peut-être été bonne au départ, mais il est parti si loin dans l'autre sens qu'il est presque impossible d'amener Google à rechercher ce que vous voulez réellement. Malheureusement, il ne semble pas que cela changera de si tôt, donc nous sommes tous en train de rêver du bon vieux temps où le Googlewhack était encore une chose.

★★★★★