Map of french book blogs


A poster on "book blogs". I like this : a short selection ( ~ 100, the same amount I'try to visualize), a cluster effect, (which structure the space) and few bridge blogs that are highlighted.

It's look like I want to do. But building such a representation automatically is no so easy. To handle that I'm trying to connect my perl scripts with R to work on the map construction by my self. And particularly on the automatic clustering. I work on algorithm from Raftery, Hoff,... on social latent space.

For the moment, I've only try some simple thinks such asy multidimensional scaling (MDS) using the shortest path distance of the graph.

You can obtain something like that with as few as 3 lines of R. MDS is used to position node; mixture model being then use to find the cluster.



It's just a try and there is a lot to do to have something good enough bur it seems to me that R suited well for what I want to do.

reprise toute douce et moteur de recherche de feeds

Un petit billet après une longue pose. J'ai en effet délaissé quelque peu ce petit projet pour m'occuper de mes autres moutons. J'espère pouvoir dégager de nouveau un peu de temps pour continuer prochainement.

Je n'ai donc pas fait grand chose depuis mon dernier billet qui date d'un mois !!! Et je n'ai donc pas grand chose a raconter. Je me contenterait donc de relayer grâce à ce billet l'annonce d'un nouveau moteur que j'ai rapidement essayé et qui m'a parut intéressant feedsmil.

Ce moteur m'intéresse tout d'abord car il ne s'attaque pas au web mais aux flux et deuxièmement car il propose une interface qui me semble pertinente.



Possibilité de choisir la profondeur à laquelle on envoie le filet de pêche grâce à un double curseur placé sous la boite de recherche et possibilité d'affiner les résultats toujours à l'aide de curseur associé a des expressions extraite de l'analyse des résultats obtenus, cela ne doit surement pas être pertinent tout le temps, mais pourquoi pas.

A short post after a big pause.

A short post after a big pause. I've neglected this little project since a while for doing other stuff. I hope to have a some time to work on this in the following month.

I've done anything since my last post, one month ago !!! And I've therefore nothing to tell on the project. I will therefore only relay the launch of a new search engine, that I've rapidly tested and found interesting feedsmil.

This search engine is interesting because it has an interesting starting point, It does not index web-pages but RSS feeds and furthermore the interface is also a little bit new.



You can choose the depth at which you send our fish-net thanks to a double cursor under the search box. You can also refined the results thanks to other cursor linked to sentences extracted from the current search results. I thinks this sentences are not alway meaningfull, but why not.

blog bd

Une carte d'une grosse communauté : bds, illustrations ... (full screen):



alt : blogs bd

comics blogs

A map of a big community : european comics, drawings ... (full screen):



alt : blogs bd

sauvons l'université

Le milieu universitaire s'agite, et le net reflète cette agitation. J'ai donc réalisé une petite carte des sites militants dans ce domaine en partant de quelques sites bien connus. J'ai modifié le code qui génère la carte, comme vous pouvez le constater. C'est en phase de test j'en reparlerai donc plus tard. (full screen):



alt : reformes

Cartographie de la blogosphere francophone du livre

Un petit poster sur la thématique "blogs livres". J'aime plutôt bien le rendu, une sélection assez serré de blogs (une grosse centaines de sites, le volume que je vise aussi), un effet cluster qui permet de s'y retrouver assez rapidement, d'accélérer la navigation; et quelques sites inclassables, passerelles mis en valeur.

Cela ressemble assez à ce vers quoi j'aimerais que Feedsmap tende. Mais construire ce genre de représentation automatiquement n'est pas aisé. Pour y parvenir je suis en train de connecter mes traitements avec R pour pouvoir travailler un peu la construction de la carte moi même et en particulier travailler sur la clustering des blogs. Je commence à travailler sur les algorithmes de visualisation débouchant des travaux de Raftery, Hoff,... sur l'espace social latent.

Pour le moment j'ai juste essayé quelques trucs simples, en particulier l'utilisation de différentes versions de multidimensional scaling sur la matrice de distances construite à partir du graph (la distance utilisée correspond au plus court chemin entre deux nœuds).

Voila par exemple ce que l'on peut obtenir en deux trois lignes de R sur le graph de mes flux perso. Le multidimensional scaling est utilisé pour construire la spatialisation 2d du graph; un modèle de mélange est ensuite utilisé sur cet espace pour obtenir les clusters.

Il reste du boulot pour en faire quelques chose de bien mais R me semble en tout cas être une piste intéressante pour la partie analyse, enrichissement de données.