Cartographie de la blogosphere francophone du livre

Un petit poster sur la thématique "blogs livres". J'aime plutôt bien le rendu, une sélection assez serré de blogs (une grosse centaines de sites, le volume que je vise aussi), un effet cluster qui permet de s'y retrouver assez rapidement, d'accélérer la navigation; et quelques sites inclassables, passerelles mis en valeur.

Cela ressemble assez à ce vers quoi j'aimerais que Feedsmap tende. Mais construire ce genre de représentation automatiquement n'est pas aisé. Pour y parvenir je suis en train de connecter mes traitements avec R pour pouvoir travailler un peu la construction de la carte moi même et en particulier travailler sur la clustering des blogs. Je commence à travailler sur les algorithmes de visualisation débouchant des travaux de Raftery, Hoff,... sur l'espace social latent.

Pour le moment j'ai juste essayé quelques trucs simples, en particulier l'utilisation de différentes versions de multidimensional scaling sur la matrice de distances construite à partir du graph (la distance utilisée correspond au plus court chemin entre deux nœuds).

Voila par exemple ce que l'on peut obtenir en deux trois lignes de R sur le graph de mes flux perso. Le multidimensional scaling est utilisé pour construire la spatialisation 2d du graph; un modèle de mélange est ensuite utilisé sur cet espace pour obtenir les clusters.

Il reste du boulot pour en faire quelques chose de bien mais R me semble en tout cas être une piste intéressante pour la partie analyse, enrichissement de données.

No comments:

Post a Comment