Ca couine sérieusement sur les blogs d’experts à propos de l’évaluation du nombre d’abonnés aux flux RSS. Des chiffres popularisés par l’outil de mesure Feedburner et son petit compteur affiché par de nombreux blogs et Google Reader qui affiche désormais ce type de données. J’avais déjà signalé il y a un an des problèmes liés à l’émergence de nouvelles plateformes d’agrégation RSS comme Netvibes qui avaient bousculé les stats de feedburner. Cette fois le problème relève moins du problème technique que de la gonflette involontaire.

En clair on découvre des variations brutales ou des évolutions stratosphériques qui touchent souvent des blogs déjà très populaires. Parmi plusieurs causes possibles la promotion artificielle des flux RSS de ces blogs dans des "packages" préchargés ou mis en avant lors de l’inscription aux services de type Google Reader.  Une pratique qui n’a rien de scandaleuse (au contraire elle donne une prime aux blogs les plus populaires) mais qui génère une audience artificielle qui ne consulte pas, en réalité, le contenu des flux. Peter Cashmore, auteur du site Mashable.com, démontre   la corrélation entre l’inflation des stats et la présence des flux RSS concernés dans les packages promotionnels mais surtout il explique que les sites ayant redirigés leurs flux via d’autres instruments de mesure ont vu fondre leur "nombre d’abonnés".

Une démonstration qui montre que les stats ne correspondent pas à une mesure d’usage réelle mais qui surtout tend à prouver que les instruments de mesure ne détectent pas l’absence d’utilisation de ces flux. Une situation qui m’étonne un peu car jusqu’à présent j’ai pu observer des périodes de croissance et de décroissance du nombre d’abonnés ce qui tendait à prouver que la mesure était élastique. Certes personne n’a jamais affirmé que l'"abonnement" à un flux valait pour usage. Apres tout personne ne demande à l’abonné d’un magazine s’il le lit. Sauf qu’il le paye…

Comme tout le monde je m’interroge sur l’absence de corrélation entre une nombre vertigineux d’abonnés aux flux RSS et l’absence d’un niveau d’audience du site proportionnel. Par exemple Techcrunch France affiche plus de 120 000 abonnés aux flux RSS mais Nielsen Netratings est presque incapable de détecter l’audience du site web ce qui suppose un nombre de visiteurs uniques inférieur au minimum requis par la méthode du panel (soit moins de 30 000 alors que l’audience du blog de Loïc Lemeur est détectée régulièrement, même au delà du seuil de validité fixé à 100 000 visiteurs uniques, ceci avec 25000 abonnés). Pour être complet il faut signaler que Techcrunch propose l’intégralité de ses contenus dans le flux RSS ce qui peut expliquer au moins partiellement le manque de report sur le site.

Il ne s’agit pas de remettre en cause ici la qualité de tel ou tel blog puisque précisément les variations semblent toucher les blogs plus visibles et les plus connus  (Henri et Ouriel s’interrogent sur 2803.com et Techcrunch) mais il faut bien s’inquiéter de la fiabilité de la mesure et son utilisation en matière de communication commerciale.

Pour mémoire la question de la certification de la mesure d’audience du RSS a été posée à l’OJD début 2007, une commission spécialisée à laquelle j’ai participé a conclu à l’impossibilité de certifier une telle mesure. En cause le manque de fiabilité des instruments de mesure et les biais trop facilement exploitables de ce qui n’est qu’un instrument de type push media. En clair seule la mesure du trafic "entrant" vers le site web est sérieusement exploitable (et encore, elle est gonflée par l’effet des moteurs de recherche qui indexent les flux).

Pour info : le flux RSS d’Ecosphere compte plus de 1300 abonnés selon Feedburner mais la plateforme WordPress.com génère un second flux RSS d'"origine" qui comptait entre 500 et 800 abonnés supplémentaires. A cause du manque de fiabilité des mesures WordPress a récemment renoncé à diffuser l’audience des flux RSS, pour ces raisons je n’affiche pas la mesure, forcément partielle de Feedburner.

On sait désormais les raisons de l’accord avec l’AFP et AP (ainsi qu’avec la Canadian Press et UK’s Press Association). Google News annonce aujourd’hui qu’il hébergera lui même les dépêches d’agences mettant ainsi fin aux polémiques. Mais derrière l’annonce se cache une petite bombe: en retour Google va filtrer les mêmes dépêches d’agences qu’il référencait jusqu’à présent sur les sites medias. En clair tous les sites qui doivent leur référencement aux flux continus de dépêches vont recevoir une vilaine claque.

MAJ 19h30 : visiblement c’est parti, premier exemple en Une de Google…
afp-google3.gif
J’ai peut être l’esprit tordu mais je sens dans le communiqué de Google une ironie mordante:

"Starting today, Google News users will be able to quickly and easily find original stories from news publishers and go directly to the original source, including stories from some of the top news agencies in the world. This new approach not only enhances the experience for users, it also gives proper recognition to journalists and publishers who work hard to break the news."

Je traduis pour les anglophobes: "Chers journalistes vous nous bassinez avec la qualité et bien on vous les coupe et on va voir ce que vous avez dans le ventre" (traduction approximative). Bien vu. En clair en nettoyant l’index des centaines de duplications de dépêches aspirées ça et là Google News affirme pouvoir mettre en valeur la production originale des différents medias. Mathématiquement ça se tient le contenu original se retrouvant moins "dilué" dans la profusion de dépêche mais cela pourrait provoquer une onde de choc inattendue.

Je publie ici tous les mois le Google News Report (sauf depuis juin pour cause de probleme technique sur l’outil de mesure) qui classe les sources d’information de Google News. J’ai plusieurs fois signalé le problème: beaucoup de sites medias doivent leurs positions dominantes sur Google News aux dépêches d’agence diffusées par centaines chaque jour. Le moteur interprète la récurrence de la même info comme une marque d’importance ce qui donne un bonus aux sources. Ce qu’ont aussi parfaitement compris de nombreux sites de référenceurs. Ce qu’on sait moins c’est qu’une très grosse partie des articles de sites medias ne sont pas accessibles à Google, une fois les dépêches filtrées le stock réellement pris en compte pourrait se réduire à la portion congrue. Bref les statistique du prochain mois pourraient être saignantes.

La grande inconnue : Google News va-t-il identifier les articles basés sur la réécriture partielle des dépêches (un vieux truc largement employé pour s’approprier l’information à peu de frais)? A priori Google explique que les dépêches filtrées resteront tout de même référencées mais apparaîtront dans un classement secondaire pour permettre aux lecteurs de "découvrir les enrichissements et infos supplémentaires apportés par les sites medias". Si Google ne parvient pas à identifier les simili-articles je parie sur une vague de réécriture de titres de dépêches…

"Users will also have the option to click to see all other copies of that article, wherever it has been published, giving them additional opportunities to click through to those publishers’ websites and see extra content, background, and analysis from publishers."

Google continuera bien entendu à référencer et afficher normalement les articles originaux des sites d’information. L’initiative est je dois dire salutaire mais à mon avis il reste encore à faire le nettoyage des sources d’information dans l’index de Google News et clarifier les critères d’intégration.

> Lire l’article tout frais sur Leschos.fr: "Google News élimine les articles de presse copiant les dépêches d’agences"
> L’article de Paidcontent sur le même sujet

Pause

juillet 16, 2007

Pause roupillon une quinzaine de jours. Ca se passe en famille et en Crête. Chers Google et Yahoo et LVMH merci de respecter cette période sainte et de ne rien acheter…
Si SFR le veut bien je passerai quelques photos sur Flicker.

Ciao

MAJ de Crete: finalement SFR veut pas. Pas de connexion internationale pendant une semaine – ma faute- ensuite je decouvre l absence de 3G ou meme de GPRS. Adieu Flicker pour le moment.

Le dernier classement Google news report pour le mois de mai 2007 . Pas de mouvements très significatifs mis à part le JDD qui continue sa progression . En période d’élections les généralistes se taillent les meilleures parts du gâteau. Les référenceurs sont toujours là.

Top 50 des sources Google News France
rank 01/05/07 01/04/07
1 Le Figaro Le Figaro
2 nouvelobs.com L’Express
3 L’Express Le Monde
4 Libération nouvelobs.com
5 Le Monde Libération
6 TF1 TF1
7 Boursorama Boursier.com
8 Romandie.com Boursorama
9 Le Point Le Point
10 Boursier.com Romandie.com
11 France 2 France 2
12 Le journal du dimanche en ligne Cyberpresse
13 Cyberpresse PC Inpact
14 20minutes.fr Clubic
15 Radio-Canada Radio Suisse Romande
16 7sur7 20minutes.fr
17 PC Inpact Radio-Canada
18 Clubic Le journal du dimanche en ligne
19 Le Revenu Canoë
20 Canoë RTBF
21 Radio Suisse Romande l’Humanité
22 France 3 7sur7
23 RTBF XINHUA
24 Le Temps (Abonnement) France 3
25 Les Échos Le Vif/L’Express
26 ZDNet Journal Chrétien
27 Francebourse.com L’Orient-Le Jour
28 Journal Chrétien Le Revenu
29 Europe 1 ZDNet
30 AgoraVox Les Échos
31 RTL.fr Actualités News Environnement
32 Sport365.fr AgoraVox
33 La Tribune.fr Le Matin.ma
34 L’Orient-Le Jour Référencement Internet-Web
35 Actualités News Environnement Radin Rue
36 RFI Courrier International
37 Radin Rue Le Temps (Abonnement)
38 Sports.fr Football.fr
39 Eurosport – TF1 Sports.fr
40 XINHUA Francebourse.com
41 Le Matin.ma RFI
42 Tele News Aujourd’hui Le Maroc
43 Tribune de Genève Sport365.fr
44 Football.fr La Croix
45 Le Soleil Eurosport – TF1
46 Référencement Internet-Web La Tribune.fr
47 01net Europe 1
48 Vnunet.fr RTL.fr
49 Aujourd’hui Le Maroc 01net
50 Sport.fr Le Devoir (Abonnement)

C’est parti! La souscription pour l’abonnement e-paper des Echos est ouverte. Je teste l’iLiad, la version d’iRex, depuis une semaine. C’est le modèle compatible Wi-Fi à écran large (format 21 x 15,5 cm),  sous OS Linux. Le principe du e-paper c’est la technologie de l’encre électronique qui imite le rendu de l’encre sur papier pour un meilleur confort de lecture. Je dois dire que le résultat est assez étonnant. L’aspect mat de l’écran tactile est très reposant et je me suis surpris à plonger dans la lecture sans effort. Le test du métro à l’heure de pointe est concluant, on peut lire son quotidien préféré dans un espace de 50 cm2, on tourne les pages d’une simple pression du pouce. Le geste est naturel, la sensation est curieuse. L’édition complète des Echos occupe 165 pages pour 8 Mo pour le moment mais nous allons réduire la pagination en optimisant le contenu. Le modèle que j’ai en main n’est plus un prototype, on dispose désormais d’un OS traduit en français et mis à jour.

Une fois connecté au PC, il se comporte comme une clé USB, j’ai pu charger des documents PDF et des flux RSS chez Mobipocket (le reader est intégré) et quelques romans du côté de la bibliothèque du projet Gutenberg. Résultat impeccable même si l’affichage en caractères ASCII de ces derniers reste un peu rustique. Le premier test d’autonomie me donne 4h sans interruption avec quelques essais de connexion Wi-Fi (gourmands en énergie). D’après d’autres utilisateurs l’autonomie peut atteindre les 10h. Côté Wi-Fi il détecte les sources environnantes, le modèle à ma disposition reconnaît la techno de chiffrement WEP utilisée pour sécuriser les réseaux sans fil mais pas encore celle de type WPA. Un patch va y remédier dans les prochaines semaines.

Voilà pour les premières impressions de prise en main, j’attends pour bientôt le second modèle type Ganaxa plus petit (A5) à l’autonomie accrue mais sans Wi-Fi. A suivre..

> Le guide de référence de l’iLiad (PDF en français !)
> Pour s’abonner c’est ici (livraison d’ici 5 à 8 semaines)
> Pour en savoir plus sur le papier électronique: le blog incontournable de Bruno Rives

Quelques photos sur le vif:

 epaper1.jpg

epaper-lesechos-2.jpg  Le gribouillage est autorisé façon ardoise magique (la machine enregistre les notes)

epaper-lesechos-3.jpg

 epaper-lesechos-4.jpg

 epaper-lesechos-5.jpg

Petite révolution sur la plate-forme WordPress.com (sur laquelle est publiée ce blog): la création et l’hébergement des blogs reste gratuit mais une forme de paiement à l’acte vient de faire son apparition. Il s’agit très exactement de proposer aux utilisateurs de WordPress.com de payer pour accéder à des fonctions avancées de gestion du blog, en particulier les fonctions de personnalisation avancée. En pratique on paye via Paypal pour obtenir des crédits avec lesquels on active telle ou telle fonction. La première fonction proposée concerne la possibilité d’éditer sa feuille de style.

Pour ma part j’attends avec impatience la possibilité d’éditer une partie du code des pages pour intégrer les scripts de mon choix ou tout simplement des marqueurs pour auditer l’audience… 

Cliquer sur l’image pour élargir…

wordpress-cpa1.gif

 Pour en savoir plus sur le blog de WordPress.com

Suivre

Recevez les nouvelles publications par mail.