R est une « suite intégrée [permettant] la manipulation, le calcul et la présentation graphique [de données statistiques] ».
Comme l’indique sa fiche sur Framasoft, R un « outil d’analyse statistique et graphique ». Qui plus est, il est non seulement libre (d’où sa présence sur Framasoft), mais aussi gratuit, et il fonctionne avec n’importe système d’exploitation (avec éventuellement une interface graphique comme RStudio).
De façon plus complète (et pour reprendre la présentation du logiciel sur son site d’origine), « R est une suite intégrée [permettant] la manipulation, le calcul et la présentation graphique [de données statistiques] ».
Autrement dit, il s’empare de séries statistiques plus ou moins complexes et il en tire des graphiques (aussi plus ou moins complexes), des calculs (moyenne, écarts-type…), mais aussi des cartes (choroplètes et autres) grâce à des fonds vectoriels provenant de l’IGN, d’OpenStreetMap, avec un résultat très professionnel. R est surtout destiné aux chercheurs — il a été conçu pour cela — qui utilisent des séries très longues et très nombreuses, en sciences humaines par exemples, et les scripts enregistrés (oui, il y a un peu de code là-dedans) permettent de refaire les manœuvres rapidement. Mais il commence à déborder ce cadre professionnel, comme les exemples ci-dessous le montreront.
R peut également nous concerner en tant qu’enseignants. Imaginons des séries trouvées sur le site de l’INSEE, de la FAO ou ailleurs : on se retrouve avec une centaine de départements, trente milliers de communes, environ deux cents pays… Mais avec des dizaines de colonnes de données sur n’importe quoi. Eh bien, R est capable d’extraire la ou les colonnes qui vous intéressent, et d’en tirer la substantifique moelle, pour peu qu’on sache y faire.
Je ne connaissais pas R avant le début novembre, mais, en passant sur Framasoft, j’ai eu l’œil attiré par un encart concernant un livre (un « framabook », puisque c’est publié par Framasoft) : R et Espace , avec en sous-titre Traitement de l’information géographique. Il est écrit par une équipe de chercheurs de Paris, réunis au sein du groupe ÉlémentR. Le livre est très clair, bien écrit. J’en ai lu une partie (sur la cartographie, évidemment), et c’est abordable : on peut faire les exercices à l’aide des données qui sont fournies en ligne, et les réussir facilement, ce qui prouve que R peut être manipulé sans guère de problème. Peu à peu, on comprend à quoi servent les lignes de code (le script), le langage n’étant pas très hermétique (« print » pour publier, par exemple). Un conseil : il y a deux cents pages environ, mais ce n’est pas une raison pour se précipiter (comme je l’ai fait) sur la partie cartographie (avant-dernier chapitre) ; la manipulation de certaines données demandent que l’on commence par le début, sous peine d’avoir quelques déboires.
Pour les plus pressés, trois recommandations en une dizaine de pages (et il y en a d’autres en français, et beaucoup plus en anglais), qui permettront d’utiliser R très rapidement avec de premiers résultats très encourageants (ce qui est évidemment un piège, puisqu’on est incité à aller de l’avant…) :
- Renaud Lancelot, « Faire une carte avec R ». On trouve cet écrit sur le forum du Groupe des utilisateurs du logiciel R, qui propose non seulement de l’aide, mais aussi des fiches (très) pratiques, des liens, des conseils pour savoir où récupérer les données (séries, fonds de carte, images), etc. ;
- Baptiste Coulmont, « La Cartographie avec R » (voir aussi son blog, avec le billet « Début de cartographie avec R ») ;
- sur le site Quanti, « Cartographier avec R » (site tenu par certains des auteurs de R et Espace).
Cela constituera une bonne base de départ, qui vous permettra de mieux suivre (et tirer parti) du manuel d’ÉlémentR.
Une idée de ce qu’on peut faire avec R ? Parmi les réalisations possibles (mais il en est d’autres) :
- une carte des voies romaines aux alentours de Metz (mais on peut très bien choisir un autre secteur : je l’ai par exemple fait pour la région comprise entre Reims et Bavai : voir ci-dessous). Son auteur est un amateur d’histoire ;
- le même a recréé la carte de la campagne de Russie (ce n’est pas le seul) réalisée par Charles Minard en 1869, qui permet de voir le parcours des armées napoléoniennes mais aussi la réduction des effectifs au fur et à mesure de leur périple. Autrement dit, une carte de flux proportionnels à l’importance des pertes (ou des survivants), ce qui permet d’avoir une idée des possibilités offertes par R, avec quoi on pourrait refaire d’autres réalisations de Minard ;
- le site Carnet néocartographique offre toute une palette de cartes une carte par points, des anamorphoses, des cartes animées là (aux deux-tiers de la page) ou ici, des cartes avec des points et des flux (autre exemple : ici) une autre présentant des discontinuités, et d’autres exemples…
R demande un certain apprentissage et une pratique régulière (comme LaTeX, par exemple), mais les résultats sont tels que cela vaut l’investissement. Enfin, il faut savoir que les scripts peuvent être enregistrés, et qu’il suffit d’actualiser ses données statistiques pour avoir des graphiques et des cartes à jour.