Google news publie les dépêches d’agences et filtre les contenus de la presse

On sait désormais les raisons de l’accord avec l’AFP et AP (ainsi qu’avec la Canadian Press et UK’s Press Association). Google News annonce aujourd’hui qu’il hébergera lui même les dépêches d’agences mettant ainsi fin aux polémiques. Mais derrière l’annonce se cache une petite bombe: en retour Google va filtrer les mêmes dépêches d’agences qu’il référencait jusqu’à présent sur les sites medias. En clair tous les sites qui doivent leur référencement aux flux continus de dépêches vont recevoir une vilaine claque.

MAJ 19h30 : visiblement c’est parti, premier exemple en Une de Google…
afp-google3.gif
J’ai peut être l’esprit tordu mais je sens dans le communiqué de Google une ironie mordante:

« Starting today, Google News users will be able to quickly and easily find original stories from news publishers and go directly to the original source, including stories from some of the top news agencies in the world. This new approach not only enhances the experience for users, it also gives proper recognition to journalists and publishers who work hard to break the news. »

Je traduis pour les anglophobes: « Chers journalistes vous nous bassinez avec la qualité et bien on vous les coupe et on va voir ce que vous avez dans le ventre » (traduction approximative). Bien vu. En clair en nettoyant l’index des centaines de duplications de dépêches aspirées ça et là Google News affirme pouvoir mettre en valeur la production originale des différents medias. Mathématiquement ça se tient le contenu original se retrouvant moins « dilué » dans la profusion de dépêche mais cela pourrait provoquer une onde de choc inattendue.

Je publie ici tous les mois le Google News Report (sauf depuis juin pour cause de probleme technique sur l’outil de mesure) qui classe les sources d’information de Google News. J’ai plusieurs fois signalé le problème: beaucoup de sites medias doivent leurs positions dominantes sur Google News aux dépêches d’agence diffusées par centaines chaque jour. Le moteur interprète la récurrence de la même info comme une marque d’importance ce qui donne un bonus aux sources. Ce qu’ont aussi parfaitement compris de nombreux sites de référenceurs. Ce qu’on sait moins c’est qu’une très grosse partie des articles de sites medias ne sont pas accessibles à Google, une fois les dépêches filtrées le stock réellement pris en compte pourrait se réduire à la portion congrue. Bref les statistique du prochain mois pourraient être saignantes.

La grande inconnue : Google News va-t-il identifier les articles basés sur la réécriture partielle des dépêches (un vieux truc largement employé pour s’approprier l’information à peu de frais)? A priori Google explique que les dépêches filtrées resteront tout de même référencées mais apparaîtront dans un classement secondaire pour permettre aux lecteurs de « découvrir les enrichissements et infos supplémentaires apportés par les sites medias ». Si Google ne parvient pas à identifier les simili-articles je parie sur une vague de réécriture de titres de dépêches…

« Users will also have the option to click to see all other copies of that article, wherever it has been published, giving them additional opportunities to click through to those publishers’ websites and see extra content, background, and analysis from publishers. »

Google continuera bien entendu à référencer et afficher normalement les articles originaux des sites d’information. L’initiative est je dois dire salutaire mais à mon avis il reste encore à faire le nettoyage des sources d’information dans l’index de Google News et clarifier les critères d’intégration.

> Lire l’article tout frais sur Leschos.fr: « Google News élimine les articles de presse copiant les dépêches d’agences »
> L’article de Paidcontent sur le même sujet

16 réflexions sur “Google news publie les dépêches d’agences et filtre les contenus de la presse

  1. Pingback: Google News… des news, stay tuned « vaporware

  2. Le duel : alors maintenant qui va repomper le mieux les dépêches ? Les journalistes formés à l’Ecrit-Google ou les site de piles SEO ?

    A moins que les premiers embauchent les seconds, AdWords sera t-il bientôt le noeud de la sélection ? Nous sommes sur un site Médias très connu ici, y a t-il des lecteurs anonymes qui parlent de leurs réunions avec Google ? 😉

    Sur le même sujet :

    La vidéo sur GN :
    http://actu.abondance.com/2007/08/de-la-vido-dans-google-news.html

    A quand une vidéo enflammée au-dessus de Wikipedia ?
    http://www.google.fr/search?q=grece

  3. « Google News va-t-il identifier les articles basés sur la réécriture partielle des dépêches (un vieux truc largement employé pour s’approprier l’information à peu de frais)? »
    Eh-eh ! J’adore ton franc-parler.

    Pour la traduc, tu as été soft :-).

  4. Pour une bonne nouvelle, c’est une bonne nouvelle. Et pour tenter peut-être d’apporter un élément sur la question du « batonnage » de dépèches, autrement la pseudo réécriture sans info aditionnelle ni mise en perspective, je renvoi à un post que j’avais publié il y a quelques mois. Google avait alors déposé le brevet d’un moteur de recherche de similarité: http://www.samsa.fr/2007/01/11/un-moteur-de-similarite-la-recherche-de-la-valeur-ajoutee-informative/

  5. Bonjour Emmanuel,
    pour le ton mordant, tu as toujours un temps d’avance sur les RP (de Google ou d’ailleurs). On trouve dans le communiqué – »This new approach (…) gives proper recognition to journalists and publishers who work hard to break the news.”– une réponse aux griefs reprochés par Copiepresse (cf. affaire news.google.be).

    Du point de vue pratique, l’intégration des dépêches d’agences de presse répond aussi à un dédoublonnement que l’on retrouvait souvent dans les Google News.

    Cela va certainement faire du tort (en termes de fréquentation) aux petits sites, mais pas aux importants sites de médias (je ne cite pas de nom) qui disposent déjà d’équipes journalistiques dont tout ou partie de l’activité consiste à faire du bâtonnage (réécriture) de dépêches, et pas qu’une simple retouche du titre. L’objectif de ce bâtonnage étant justement de faire apparaître dans les Google News des infos provenant d’agence de presse, dont la publication en ligne telle quelle aurait été filtrée par Google News, alors en procès avec les agences de presse.

    Nul doute que les titres qui font du journalisme maison, ceux s’adonnant au bâtonnage, et enfin ainsi qui ont une approche multimédia/référencement de l’information, vont gagner des parts de marchés dans cette redistribution des cartes.

    Incidemment, cela risque de grignoter du chiffre d’affaire aux agences de presse qui, si elles ne devraient pas trop souffrir au niveau des flux délivrés aux groupes de médias, risquent de sentir un ralentissement de la demande de leur solution de journal en ligne qu’elles vendent aux sites web.

  6. Merci Philippe, Jean-Pierre, pour ces précisions. Je ne sais pas s’il y aura des dégâts mais je ne crois pas que l’ensemble du trafic qui se reportera sur les pages de dépêches publiées par Google ira se répercutera en deuxieme clic sur les sites d’éditeurs. On se retrouve plus pres du modèle Yahoo avec captation et rétention au moins partielle du trafic. Lequel est perdu pour les éditeurs.

    Maintenant certains articles auront peut être plus de chance de remonter. Quant au bâtonnage même si Google a les moyens de comparer les similitudes je doute de l’efficacité de la chose. A suivre..

  7. Dans votre articles vous mentionnez l’article des Echos qui termine par:

    « Aujourd’hui, 23% des connexions sur leMonde.fr proviennent de Google News selon les chiffres de Nielsen du mois de juillet. Ce chiffre est de 20% pour le site du Figaro, 13% pour le Nouvel Observateur et 5,4% pour LesEchos.fr »

    Le journaliste ne confond-il pas l’ensemble des visites provenant du moteur de recherche « Google » avec la partie provenant des pages « Google news » ? Qu’en pensez-vous?

  8. Vittoz, je ne puis hélas donner ces chiffres et je ne sais quelles sont les sources de l’auteur (je lui demanderai à l’occasion). Ce que je peux dire c’est que cela ne correspond pas aux données en ma possession. Par exemple le chiffre que je vois pour le Monde est supérieur si l’on prend Google et inférieur si l’on prend Google News. Idem pour le Figaro. Google News est en revanche sous estimé si l’on prend le Nouvel Obs et Les Echos. Le classement n’est pour autant pas modifié.

    Enfin les mesures sous Nielsen en ma possession ne sont pas données en « visites » mais en part d' »audience » c’est à dire de visiteurs uniques ce qui rend par exemple impossible à comparer à ce que l’on voit avec nos outils de mesure interne (qui est encore différent).
    Peut-être a-t-il eu des données en visites, je ne sais comment.

  9. Pingback: Baromètre Google News France pour août 2007 « ecosphere

  10. Je ne suis pas persuadé que la perte de clients pour la solution « journal en ligne » de l’afp (5K/mois) soit problèmatique dans la mesure où il n’est pas improbable de voir quelques adsenses apparaître d’ici peu sur les dépèches hebergées par Google.. Le deal reserve peut être encore quelques pépites 😉

  11. Pingback: ressources_info_11092007 « RessourcesESPO

  12. Pingback: Baromètre Google News France pour septembre 2007 « ecosphere

Répondre à Jean-Pierre Govekar Annuler la réponse.