vendredi 23 mars 2012

Souvenir de collège.

Le vendredi c'est permis.



Au collège, j'ai eu une période "cubes" pendant laquelle je dessinais des cubes à la règle et au stylo-plume, à longueur de feuilles à petits carreaux. Des cubes simples, des cubes empilés, des cubes en pyramide. Des cubes en trompe-l'œil parfois, comme ce classique aux arêtes mal croisées.

Je travaillais en perspective cavalière : ma démarche était mille fois plus géométrique qu'esthétique. (Obsession ?) Je me souviens que cet élan s'est interompu tout net pour être remplacé par une recherche sur les courbes : la trigonométrique a été une révélation poétique, c'était le temps de ma première calculatrice graphique.

En quelque sorte, ma découverte d'un tableur des années plus tard n'a finalement été qu'une nouvelle voie pour mes épanchements mathématico-graphiques.

jeudi 22 mars 2012

Donnée par département Vs donnée pour 1000 habitants (par département).

La dissemblance des courbes de ces deux derniers jours m'a amené à vouloir les mettre en parallèle.

C'est ce que je fais ici : j'ai "remis le graphe à l'endroit" (abscisses à l'horizontale, ordonnées à la verticale) et je suis passé en courbes plutôt qu'en histogramme pour ne pas brouiller les croisements.

Surtout, j'ai remplacé chaque point de chaque série par son rapport à la moyenne de la série, multiplié par 100. Exemple avec la deuxième série, celle "pour 1000 habitants" : la moyenne nationale est de 45 ; donc le premier point, qui vaut initialement 108, est remplacé par 108 / 45 x 100 = 240.

Cela permet de "poser" les deux courbes sur leurs moyennes respectives, en plaçant ces moyennes à 100.

(Les abscisses sont plus que jamais masquées : les départements sont dans des ordres différents. En fait, on ne garde ici que l'ordre des items selon chacune des séries.)

Lecture : on peut voir dans cette mise en parallèle une représentation de la conclusion qu'on tirait lundi quant à la différence de "gravité suggérée" par ces deux séries de données. Si l'on regarde le nombre (brut) de faits constatés par département, la courbe est chaotique et les disparités sont fortes. En revanche, cette donnée rapportée à la population donne lieu à une répartition bien plus lisse et plus proche de l'horizontale.


source :
données cartographiées mercredi 14 et jeudi 15 mars 2012 sur ce blog.

mercredi 21 mars 2012

Faits constatés pour 1000 habitants, par département - une autre représentation.

Dans le même esprit qu'hier, je reprends ici les données cartographiées vendredi. Et je me pose la même question : si on choisissait de faire autre chose qu'une carte ?

Je fais des regroupements comme hier (par 19 ou 20 départements), et je n'affiche pas les abscisses. La courbe n'a pas du tout le même profil qu'hier : on a ici une courbe en S. L'asymptote à l'origine est nettement moins marquée que dans le graphe d'hier, et il y a ce changement de convexité "au milieu"...


source :
données cartographiées mercredi 14 et jeudi 15 mars 2012 sur ce blog.

mardi 20 mars 2012

Faits constatés en 2010, par département - une autre représentation.

Je reprends ici les données cartographiées jeudi dernier. Et si on avait choisi de faire autre chose que des cartes ?

Pour faire un classement, on peut utiliser un histogramme en barres. C'est moins visuel que la carte mais ça matérialise mieux non seulement la hiérachie des valeurs mais aussi la disparité et/ou l'homogénéité des groupes.

J'ai effectué ici les regroupements de base évoqués hier : par 19 départements (20 pour le dernier). En revanche je n'ai pas repris le même dégradé de couleurs : sur les plus petites valeurs, on ne verrait rien.

Je n'explicite pas les abscisses : cela aurait un sens sur un top 10 ou un top 20. Mais l'intérêt ici est davantage sur la forme de la courbe avec ses deux asymptotes.



source :
données cartographiées mercredi 14 et jeudi 15 mars 2012 sur ce blog.

lundi 19 mars 2012

Flagrant délit... d'insuffisance cartographique !

Je reviens sur les deux cartes de la semaine dernière.

Je parlais vendredi de cette limite d'une représentation cartographique : la profondeur des tranches n'est pas une chose évidente ! Bien sûr, la légende affiche explicitement les bornes de chacune. Mais prendre la mesure de leurs profondeurs respectives demande un certain effort d'abstraction. Or la facilité de visualisation que propose une carte est précisément l'inverse de cet effort-là, n'est-ce pas ?

Regardons donc aujourd'hui de plus près l'amplitude de ces tranches.

Mais avant cela, quelques mots sur la manière dont les tranches sont constituées. L'idée de départ est de regrouper les départements dans cinq ensembles d'effectifs identiques. Comme il y a 96 départements (de 01 à 95, la Corse en comptant 2), cela fait idéalement quatre groupes de 19 et un groupe de 20. À partir de cette idée de base, j'effectue un ajustement sur les bornes : pour chaque limite entre deux tranches, au lieu de prendre pour borne la médiane des deux valeurs voisines, je prends pour borne un arrondi à deux chiffres significatifs. L'ambition de cet ajustement est de donner une légende lisible ! Mais en conséquence, il peut y avoir des valeurs de la tranche du dessus qui passent dans la tranche du dessous : je tiens évidemment compte de ces passages pour la répartition définitive. (Je reviendrai un jour plus en détail sur ce traitement, dans mon blog Excel.)

Comme on travaille ici sur une population assez nombreuse (plusieurs dizaines d'items) et sur des plages de valeurs assez larges, ces ajustements portent en général sur un nombre réduit d'items : au lieu de 19 ou 20 départements par groupe, j'en ai parfois entre 17 et 23. La différence est faible et le gain de lisibilité sur la légende est grand. Par exemple, la tranche du milieu pour la carte de jeudi dernier est "15 000 - 27 000" au lieu de "14 816 - 26 599". C'est plus lisible.

Revenons à notre question d'amplitude. Le graphe ci-dessous met en parallèle la plage de valeurs de ces deux cartes en alignant leurs minimums et leurs maximums respectifs, et en échelonnant les limites des tranches. Comme je le disais jeudi, la tranche supérieure est de loin la plus large dans les deux cas. Mais dans le second, la tranche inférieure n'est pas négligeable non plus, alors qu'elle est minuscule dans le premier cas. Et globalement, les tranches semblent plus "harmonieuses" dans le second cas que dans le premier.

L'une des conclusions qu'on peut en tirer tient à le différence de "gravité suggérée" par ces données. Le nombre de faits constatés varie certes dans un rapport de 1 à 115 entre la Lozère (2 081) et Paris (238 856). Mais si l'on relative (littéralement) ceci au nombre d'habitants, on n'a jamais qu'un rapport de 1 à 6 entre la Creuse (167 faits pour 1000 habitants) et Paris (encore, hum, avec 1085 faits pour 1000 habitants).

Je tâcherai de trouver d'autres données par département pour les mettre en rapport avec ces chiffres. Je pense au taux d'urbanisation notamment.



source :
données cartographiées mercredi 14 et jeudi 15 mars 2012 sur ce blog.