On sait désormais les raisons de l’accord avec l’AFP et AP (ainsi qu’avec la Canadian Press et UK’s Press Association). Google News annonce aujourd’hui qu’il hébergera lui même les dépêches d’agences mettant ainsi fin aux polémiques. Mais derrière l’annonce se cache une petite bombe: en retour Google va filtrer les mêmes dépêches d’agences qu’il référencait jusqu’à présent sur les sites medias. En clair tous les sites qui doivent leur référencement aux flux continus de dépêches vont recevoir une vilaine claque.

MAJ 19h30 : visiblement c’est parti, premier exemple en Une de Google…
afp-google3.gif
J’ai peut être l’esprit tordu mais je sens dans le communiqué de Google une ironie mordante:

« Starting today, Google News users will be able to quickly and easily find original stories from news publishers and go directly to the original source, including stories from some of the top news agencies in the world. This new approach not only enhances the experience for users, it also gives proper recognition to journalists and publishers who work hard to break the news. »

Je traduis pour les anglophobes: « Chers journalistes vous nous bassinez avec la qualité et bien on vous les coupe et on va voir ce que vous avez dans le ventre » (traduction approximative). Bien vu. En clair en nettoyant l’index des centaines de duplications de dépêches aspirées ça et là Google News affirme pouvoir mettre en valeur la production originale des différents medias. Mathématiquement ça se tient le contenu original se retrouvant moins « dilué » dans la profusion de dépêche mais cela pourrait provoquer une onde de choc inattendue.

Je publie ici tous les mois le Google News Report (sauf depuis juin pour cause de probleme technique sur l’outil de mesure) qui classe les sources d’information de Google News. J’ai plusieurs fois signalé le problème: beaucoup de sites medias doivent leurs positions dominantes sur Google News aux dépêches d’agence diffusées par centaines chaque jour. Le moteur interprète la récurrence de la même info comme une marque d’importance ce qui donne un bonus aux sources. Ce qu’ont aussi parfaitement compris de nombreux sites de référenceurs. Ce qu’on sait moins c’est qu’une très grosse partie des articles de sites medias ne sont pas accessibles à Google, une fois les dépêches filtrées le stock réellement pris en compte pourrait se réduire à la portion congrue. Bref les statistique du prochain mois pourraient être saignantes.

La grande inconnue : Google News va-t-il identifier les articles basés sur la réécriture partielle des dépêches (un vieux truc largement employé pour s’approprier l’information à peu de frais)? A priori Google explique que les dépêches filtrées resteront tout de même référencées mais apparaîtront dans un classement secondaire pour permettre aux lecteurs de « découvrir les enrichissements et infos supplémentaires apportés par les sites medias ». Si Google ne parvient pas à identifier les simili-articles je parie sur une vague de réécriture de titres de dépêches…

« Users will also have the option to click to see all other copies of that article, wherever it has been published, giving them additional opportunities to click through to those publishers’ websites and see extra content, background, and analysis from publishers. »

Google continuera bien entendu à référencer et afficher normalement les articles originaux des sites d’information. L’initiative est je dois dire salutaire mais à mon avis il reste encore à faire le nettoyage des sources d’information dans l’index de Google News et clarifier les critères d’intégration.

> Lire l’article tout frais sur Leschos.fr: « Google News élimine les articles de presse copiant les dépêches d’agences« 
> L’article de Paidcontent sur le même sujet

L’explication ici à 19h because info sous embargo. Préparez le pop-corn…
Bing c’est l’heure …

Suivre

Recevez les nouvelles publications par mail.