2e prix du concours Géovisualisation et cartographies dynamiques. Édition 2015
La nécessité de développer nos capacités à représenter rapidement et de façon interactive les réseaux est liée à la prolifération des données massives numériques. C’est dans ce contexte, afin d’aider à se représenter les phénomènes de réseaux, sur les réseaux eux-mêmes, qu’est conçue la suite logicielle Topogram (figure 1).
Objectifs et contextes de développement
Topogram est une suite logicielle en ligne d’analyse et de visualisation permettant d’analyser différentes dimensions d’un jeu de données au sein d’un même espace de représentation : graphe d’organisation sémantique des contenus, réseaux dynamiques des relations entre entités du corpus et cartographie de l’évolution spatio-temporelle. Utilisable dans un navigateur, Topogram propose une interface pour, d’une part, extraire et traiter des éléments sélectionnés au sein de jeux de données fournis par l’utilisateur, et, d’autre part, appliquer différents procédés de visualisation : ligne de temps, graphes de réseaux de mots ou d’entités et projections des réseaux sur des cartes. Les technologies à l’œuvre au sein de Topogram permettent l’édition collaborative en temps réel de graphes de taille importante.
L’ensemble des entités observées sont organisées selon une structure commune qui offre une navigation aux multiples entrées : sélection d’une plage temporelle, d’une zone géographique précise, d’un mot ou d’un élément précis d’un graphe. Chaque sélection effectuée dans l’une des entrées met à jour le reste de l’espace d’affichage, permettant une étude transversale des phénomènes observés dans leurs dimensions sémantiques, relationnelles et spatio-temporelles. Les figures et les résultats obtenus lors de l’exploration et des traitements successifs via l’interface peuvent ensuite être exportés en différents formats (png, svg ou csv). Ce dispositif a connu son origine dans un développement expérimental ayant eu lieu lors d’un travail doctoral sur l’analyse de la diffusion des mèmes Internet (contenus dits “viraux”) sur les réseaux sociaux en Chine (Renaud, 2014 ; Renaud, Fernandez, Puel, 2014).
La réécriture du projet a été motivée par des besoins spécifiques en Sciences Humaines et Sociales : enquêtes sociologiques (confrontation des enquêtés à des données institutionnelles spatialisées, afin d’amender ou de compléter ces dernières), construction de réseaux sociaux à partir d’informations partielles transmises par de nombreux témoins, sélection d’indicateurs pertinents pour produire des cartes à partir de données surabondantes (cas de l’internet) ou lacunaires (histoire des universités en Europe).
D’autres cadres d’application -notamment le journalisme digital ou la veille- nous semblent aussi susceptibles de pouvoir bénéficier des avancées de Topogram, c’est pourquoi une de nos exigences premières au regard des développements concerne la généricité des méthodes et modèles implémentés.
Intégralement développé en code ouvert (open source), le projet est ouvert à contributions et à suggestions.
Topogram, réseaux sémantiques et spatio-temporels
Repris et amélioré, Topogram est aujourd’hui disponible sous la forme d’une application open-source1 composée de trois éléments importants :
- une bibliothèque d’analyse en Python2 chargée d’extraire des éléments précis au sein d’un ou plusieurs jeux de données et de les exporter vers
- un serveur web3 faisant la communication entre les résultats formatés et
- le moteur de visualisation Javascript (ReactJS, Meteor, et cytoscape.js). Pilotée dans le navigateur, cette application peut être déployée sur un serveur local (pour un usage particulier ou une démonstration) ou utilisée comme service web depuis Internet (notamment pour un usage collaboratif sur de larges jeux de données).
Topogram est aujourd’hui en développement actif. Les prochaines évolutions concerneront l’enrichissement des modèles de visualisations et de traitement des corpus.
Une séquence de publication sur Topogram se découpe comme suit :
Import/analyse
On importe deux fichiers CSV, le premier contenant les nœuds du réseau, le second contenant les liens entre ces nœuds. À chaque nœud et/ou lien peuvent être affectés des propriétés facultatives (données temporelles, données discrètes, type…). Une fois cette opération effectuée, on accède directement à la visualisation (figure 2). Les différentes données ajoutées aux nœuds et aux liens permettent, le cas échéant, d’utiliser des filtres, des méthodes de tri spécifiques.
Visualisation
Ayant pour finalité de maximiser l’heuristique visuelle, Topogram propose différentes options de mise en forme de chacun de ses paramètres, de façon à faciliter la lisibilité des grands graphes. Différentes fonctionnalités d’édition en ligne permettent d’affiner le graphe, de le corriger, de le compléter, de le commenter et de l’annoter.
Des modèles par défaut de visualisation et de tri des données sont disponibles, permettant de se faire simplement une idée sur le jeu de données, que l’on peut affiner ensuite à l’aide de “règles de visualisation”. Il est à noter que l’utilisation du logiciel nécessite de garder un œil critique sur la visualisation produite et de se demander si celle-ci est valide ou résulte d’un abus de l’usage de l’outil (figures 3, 4, 5, 6).
Web (publication/partage/collaboration)
Topogram est construit sur une plate-forme meteor implémentant nativement l’accès multi-utilisateur concurrent aux ressources. C’est pourquoi il possible de collaborer sur la même version d’un document, de partager une visualisation qui semble pertinente sous ses formats natifs – via l’application Topogram – ou via des exports SVG, PNG, PDF.
Dans le cadre de la thèse de Grégory Bahde financée par la Région Rhône-Alpes, Topogram permettra de visualiser des échanges inter-universitaires à partir de données fournies par Renater, l’opérateur du réseau de l’Enseignement et de la Recherche, après une première agrégation des jeux de données.
Clément Renaud a dernièrement produit une étude sur les coopérations entre recherche et culture en Rhône-Alpes, financée par la Région Rhône-Alpes.
Plusieurs études et sites sont aujourd’hui en cours de réalisation impliquant l’usage de tout ou partie du code source de Topogram.
Bibliographie
Renaud C. (2014). Conception d’un outil d’analyse et de visualisation des mèmes Internet. ParisTech Telecom. En ligne
Renaud C., Fernandez V., Puel G. (2014). « Les mèmes du web chinois : analyse des modes de propagation à partir d’outils de SNA et de visualisation ». In AIM Conference 2014, Aix-en-Provence.
Retrouver les lauréats de l’édition 2015 du concours Géovisualisation et cartographie dynamique.
Notes
1. | ⇧ | Site officiel de l’application : topogram.io |
2. | ⇧ | Code disponible : github.com/topogram/topogram |
3. | ⇧ | Code disponible : github.com/topogram/topogram-server et github.com/topogram/topogram-client |