NYTimes.com: décollage réussi

décembre 10, 2007

On dirait bien que je me suis planté sur les conséquences du passage à la gratuité du NYTimes. J’estimais l’impact modéré mais selon les données de Comscore publiées par Techcrunch la hausse semble très nette avec un gain de plus de 4M de visiteurs uniques entre octobre 2006 et octobre 2007 soit + 27% (je préfere comparer à l’année passée que par rapport au mois d’aout peu significatif puisque ce mois est traditionnellement faible).

Malheureusement à ce stade impossible d’en dire plus sans pouvoir accéder au détail de la répartition du trafic ou aux données site centric (la mesure interne au site que seul le NYTimes peut communiquer). Toutefois par recoupement (je n’en dis pas plus mais si j’en juge à des stats auxquelles j’ai accès) je constate qu’une part importante du trafic est généré par des requêtes de recherche internes au site, des requêtes dont la structure de l’URL se retrouve massivement au sein du service d’archives du NYTimes (dans les "topics" sur topics.nytimes.com , par exemple ici). Ce qui confirmerait l’impact multiplicateur des archives. Notez en bas de page les "related ads" présentées également comme des requêtes de moteur interne et qui appellent en fait des pubs Google, ce qui laisse supposer la création d’une infinité de pages référençables même sans contenu du NYTimes. Visiblement rien n’a été laissé au hasard côté SEO…

> Sur le même  sujet lire aussi le billet sur Media Café

Le dernier classement des sources de Google News France pour le mois de novembre 2007.  Le serveur gérant les données de ce rapport a connu quelques pannes en novembre, difficile de savoir si le classement s’en trouve modifié. Signalons l’arrivée de Silicon.fr, la baisse de Challenges, la montée de France2 et la bonne tenue de Journal Chretien (si Dieu se mêle de SEO il faudra revoir le mode de calcul du pagerank) et d’Agoravox. Le top des amis de Reuters n’est pas modifié et l’AFP confirme sa position dans le top 10.

Signalons aussi la montée en puissance régulière de l’Equipe.fr de la 40eme position à la 30eme preuve que l’équipe du web est parvenue à surmonter ses problèmes de référencement causés par des choix techniques contraignants (on en avait discuté par téléphone en septembre - bravo les gars!).

 

Top 50 des sources Google News France
rank 01/11/07 01/10/07
1 Le Monde Le Monde
2 Le Figaro Le Figaro
3 Libération Libération
4 nouvelobs.com nouvelobs.com
5 TF1 Challenges
6 L’Express L’Express
7 Journal Chrétien TF1
8 20minutes.fr AFP
9 AgoraVox Le journal du dimanche en ligne
10 AFP Actualités News Environnement
11 Actualités News Environnement 20minutes.fr
12 Challenges Journal Chrétien
13 Le journal du dimanche en ligne La Tribune.fr
14 France 2 Le Point
15 L’Orient-Le Jour AgoraVox
16 La Tribune.fr Courrier International
17 Silicon.fr Radin Rue
18 RFI Romandie.com
19 Romandie.com Les Échos
20 PC Inpact Europe 1
21 Le Point PC Inpact
22 Les Échos RFI
23 l’Humanité Clubic
24 Courrier International France 2
25 Europe 1 EuroNews
26 Clubic L’Orient-Le Jour
27 Sports.fr l’Humanité
28 Radin Rue NaturaVox
29 France Soir Goal.com
30 L’Equipe.fr RTL Info.be
31 Goal.com Les Infos
32 ZDNet Paris Match
33 EuroNews La Presse Canadienne
34 La Presse Canadienne Sports.fr
35 Sport365.fr Boursorama
36 Sport 24 XINHUA
37 Boursorama ZDNet
38 Metro France Sport365.fr
39 Reuters.fr France Soir
40 Eurosport L’Equipe.fr
41 XINHUA Cyberpresse
42 EasyBourse.com Silicon.fr
43 Le Petit Journal Metro France
44 Sport.fr Vnunet.fr
45 France24 Reuters.fr
46 Come4News Afrik.com
47 Football.fr Boursier.com
48 Foot Mercato.net 01net
49 01net Couleur France
50 Boursier.com Radio-Canada

Je rappelle que ce classement correspond à une mesure de la visibilité des titres d’actu des différentes sources en Une de Google News France. Le calcul tient compte des différents emplacement en Une et de la durée d’affichage des titres pour en tirer une note. Cela ne signifie nullement qu’il s’agit d’un classement correspondant au trafic réellement généré sur chaque site mais c’est une bonne mesure du potentiel des uns et des autres.

On sait désormais les raisons de l’accord avec l’AFP et AP (ainsi qu’avec la Canadian Press et UK’s Press Association). Google News annonce aujourd’hui qu’il hébergera lui même les dépêches d’agences mettant ainsi fin aux polémiques. Mais derrière l’annonce se cache une petite bombe: en retour Google va filtrer les mêmes dépêches d’agences qu’il référencait jusqu’à présent sur les sites medias. En clair tous les sites qui doivent leur référencement aux flux continus de dépêches vont recevoir une vilaine claque.

MAJ 19h30 : visiblement c’est parti, premier exemple en Une de Google…
afp-google3.gif
J’ai peut être l’esprit tordu mais je sens dans le communiqué de Google une ironie mordante:

"Starting today, Google News users will be able to quickly and easily find original stories from news publishers and go directly to the original source, including stories from some of the top news agencies in the world. This new approach not only enhances the experience for users, it also gives proper recognition to journalists and publishers who work hard to break the news."

Je traduis pour les anglophobes: "Chers journalistes vous nous bassinez avec la qualité et bien on vous les coupe et on va voir ce que vous avez dans le ventre" (traduction approximative). Bien vu. En clair en nettoyant l’index des centaines de duplications de dépêches aspirées ça et là Google News affirme pouvoir mettre en valeur la production originale des différents medias. Mathématiquement ça se tient le contenu original se retrouvant moins "dilué" dans la profusion de dépêche mais cela pourrait provoquer une onde de choc inattendue.

Je publie ici tous les mois le Google News Report (sauf depuis juin pour cause de probleme technique sur l’outil de mesure) qui classe les sources d’information de Google News. J’ai plusieurs fois signalé le problème: beaucoup de sites medias doivent leurs positions dominantes sur Google News aux dépêches d’agence diffusées par centaines chaque jour. Le moteur interprète la récurrence de la même info comme une marque d’importance ce qui donne un bonus aux sources. Ce qu’ont aussi parfaitement compris de nombreux sites de référenceurs. Ce qu’on sait moins c’est qu’une très grosse partie des articles de sites medias ne sont pas accessibles à Google, une fois les dépêches filtrées le stock réellement pris en compte pourrait se réduire à la portion congrue. Bref les statistique du prochain mois pourraient être saignantes.

La grande inconnue : Google News va-t-il identifier les articles basés sur la réécriture partielle des dépêches (un vieux truc largement employé pour s’approprier l’information à peu de frais)? A priori Google explique que les dépêches filtrées resteront tout de même référencées mais apparaîtront dans un classement secondaire pour permettre aux lecteurs de "découvrir les enrichissements et infos supplémentaires apportés par les sites medias". Si Google ne parvient pas à identifier les simili-articles je parie sur une vague de réécriture de titres de dépêches…

"Users will also have the option to click to see all other copies of that article, wherever it has been published, giving them additional opportunities to click through to those publishers’ websites and see extra content, background, and analysis from publishers."

Google continuera bien entendu à référencer et afficher normalement les articles originaux des sites d’information. L’initiative est je dois dire salutaire mais à mon avis il reste encore à faire le nettoyage des sources d’information dans l’index de Google News et clarifier les critères d’intégration.

> Lire l’article tout frais sur Leschos.fr: "Google News élimine les articles de presse copiant les dépêches d’agences"
> L’article de Paidcontent sur le même sujet

Le dernier classement Google news report pour le mois de mai 2007 . Pas de mouvements très significatifs mis à part le JDD qui continue sa progression . En période d’élections les généralistes se taillent les meilleures parts du gâteau. Les référenceurs sont toujours là.

Top 50 des sources Google News France
rank 01/05/07 01/04/07
1 Le Figaro Le Figaro
2 nouvelobs.com L’Express
3 L’Express Le Monde
4 Libération nouvelobs.com
5 Le Monde Libération
6 TF1 TF1
7 Boursorama Boursier.com
8 Romandie.com Boursorama
9 Le Point Le Point
10 Boursier.com Romandie.com
11 France 2 France 2
12 Le journal du dimanche en ligne Cyberpresse
13 Cyberpresse PC Inpact
14 20minutes.fr Clubic
15 Radio-Canada Radio Suisse Romande
16 7sur7 20minutes.fr
17 PC Inpact Radio-Canada
18 Clubic Le journal du dimanche en ligne
19 Le Revenu Canoë
20 Canoë RTBF
21 Radio Suisse Romande l’Humanité
22 France 3 7sur7
23 RTBF XINHUA
24 Le Temps (Abonnement) France 3
25 Les Échos Le Vif/L’Express
26 ZDNet Journal Chrétien
27 Francebourse.com L’Orient-Le Jour
28 Journal Chrétien Le Revenu
29 Europe 1 ZDNet
30 AgoraVox Les Échos
31 RTL.fr Actualités News Environnement
32 Sport365.fr AgoraVox
33 La Tribune.fr Le Matin.ma
34 L’Orient-Le Jour Référencement Internet-Web
35 Actualités News Environnement Radin Rue
36 RFI Courrier International
37 Radin Rue Le Temps (Abonnement)
38 Sports.fr Football.fr
39 Eurosport – TF1 Sports.fr
40 XINHUA Francebourse.com
41 Le Matin.ma RFI
42 Tele News Aujourd’hui Le Maroc
43 Tribune de Genève Sport365.fr
44 Football.fr La Croix
45 Le Soleil Eurosport – TF1
46 Référencement Internet-Web La Tribune.fr
47 01net Europe 1
48 Vnunet.fr RTL.fr
49 Aujourd’hui Le Maroc 01net
50 Sport.fr Le Devoir (Abonnement)

J’aime bien le mot de Jean Guitton : "être dans le vent c’est avoir un destin de feuille morte". C’est un peu ce que m’inspire le débat "écrire pour Google" qui sort peu à peu du cercle des pros du web pour interroger les pratiques des journalistes et des medias en général. Maintenant que publier sur le web est une affaire sérieuse et que le coût d’acquisition du lecteur monte en flêche, l’optimisation des sites web en vue de leur référencement dans les moteurs de recherche est devenue une question de micro-chirurgie. Choisir ses mots pour coller aux préférences de Google fait partie de la stratégie et certains quotidiens US n’hésitent plus à former leurs journalistes et secrétaires de rédaction pour s’assurer des bonnes pratiques.

Jeff Mignon a réouvert le débat, poursuivi par Philippe Couve qui voit déjà les limites de l’exercice. Il a d’ailleurs bien raison. Je ne reprendrai pas l’ensemble du débat bien résumé par Jeff mais j’y apporte quelques nuances. Clairement le rédacteur doit garder à l’esprit qu’un titre informatif doit désormais obligatoirement comporter les mots clés qui désignent l’essentiel du contenu de l’article. Rien de nouveau, je l’ai déjà dit, par rapport à ce qui est enseigné dans les écoles de journalistes disons simplement que les titres "à la libé" plein de bons mots risquent en effet d’expédier votre article dans le purgatoire du web, c’est à dire dans les bas fond de l’index de Google. Disons qu’une bonne part se joue en général dans l’articulation du titre et du chapo puis par la densité et la cohérence du texte.

Ca c’est la préhistoire des conseils en matière de SEO (Search Engine Optimization). Reste que désormais certains ont fait du moyen, rendre visible son article, une fin en soi. Certains petits champion du blog s’empressent ainsi de pondre des billets ineptes mais composés des bons mots clés dès qu’une polémique surgit sur le Web afin de capter l’audience. Appliqué à l’industrie des medias celà signifie qu’on peut être tenté de choisir ses sujets et ses mots à partir de l’analyse des mots clés les plus populaires. Et ça marche…

Malheureusement…

Toutefois c’est un calcul de court terme qui peut rapidement détourner une stratégie éditorial de ce qui devrait être sa vraie préoccupation: non seulement capter l’attention du lecteur mais l’informer et assumer sur la durée un angle et un positionnement éditorial. Bref non nous n’écrivons pas pour Google mais pour un lecteur. Encore faut-il apprendre à s’habiller correctement… C’est toute la nuance entre attirer une audience passagère et la fidéliser. C’est la grande question des prochaines années pour les medias d’information, pour leur survie. L’audience de Google est en effet sous certains aspects totalement fictive et les instruments de mesure, instituts de sondage, créent cette fiction en leur attribuant une cohérence qu’elle n’a pas. C’est le vrai sens de ma critique de l’étude Ipsos sur les blogs, une audience dispersée qui navigue au hasard du web n’a jamais fait un media.

Pour revenir à des arguments plus prosaïques, coller aux mots clés les plus populaires de Google c’est prendre le risque de s’épuiser et de devenir "obsolète" rapidement à mesure que passe l’actualité. Rester informatif et couvrir sur la durée l’essentiel des thématiques propre à son secteur c’est au contraire être prêt quand l’actualité cristalise un événement.

Je prends un exemple récent que j’ai observé sur le site lesechos.fr. Il y a quelques semaines l’actualité politique s’est focalisée autour de la société civile immobilière ("SCI") de Ségolène et de l’ISF. Evidemment un quotidien d’actualité financière est naturellement à traiter ces thèmes en profondeur ce qui n’est pas le cas des medias généralistes. Des sujets par ailleurs habituellement austères, destinés à un public spécialisé ou concerné. Le résultat se passe de commentaire (voir ici et ) , la présence d’un contenu riche et naturellement référencé a permis de générer un large flux d’audience alors que la grande majorité des autres médias ont du, je l’ai vérifié le jour même, acheter massivement les mots clés "SCI" et "ISF" pour se positionner sur les pages de résultats. Bonne affaire au final pour Google.

Moralité: vive le référencement naturel et les sujets traités en profondeur, sur la durée. D’ailleurs les pros du SEO vous le diront, Google aime les contenus qui durent…
Les lecteurs aussi.

> Lire aussi le billet de Jean-Marie Le Ray qui analyse très finement la technique d’optimisation de lécriture. 

Suivre

Recevez les nouvelles publications par mail.