Sondage

Dans le but de faire une évaluation de la pertinence de ce blogue et pour mieux répondre à vos désir, j’aimerais vous proposer le sondage suivant. Vous pouvez aussi laisser vos commentaires généraux, bons ou mauvais dans la section commentaires disponible en bas complètement de la page.

 

 

Publicités

Créativité versus lisibilité

Présenter des données dans un graphique est un art. Chez le présentateur, il existe souvent une tentation d’être créatif et d’illustrer les informations d’une manière inattendue ou nouvelle. On espère de cette manière intéresser le lecteur et lui donner envie d’explorer le résultat de son travail.

Quand cela est réussi, le lecteur en ressort gagnant: il a compris rapidement une grande masse d’informations dans un format nouveau qui a créé l’étincelle suffisante pour lui faire apprécier ce travail.

Un exemple de créativité intéressant

Le «meilleur graphique de tous les temps» selon certains. Cliquez sur l’image pour en voir les multiples détails. Auteur: Charles Minard (domaine public) (source)

Prenons pour exemple l’image ci-dessus, qui est appelée par certains «le meilleur graphique de tous les temps». Il s’agit d’une représentation fort créative d’une très grande quantité de données expliquant la campagne désastreuse de Napoléon 1er en Russie. On y voit en beige la marche de l’armée vers Moscou sur la carte de l’Europe. La taille de la colonne est proportionnelle à la taille de l’armée et se réduit au fur et à mesure des pertes humaines et des batailles.

À Moscou, Napoléon a subi la défaite et dut rebrousser chemin vers la France. La bande noire illustre cette retraite dans l’espace, la réduction de la largeur étant encore proportionnelle à la taille de l’armée à ce moment. Un autre facteur important dans l’échec de cette offensive fut la rigueur extrême de l’hiver qu’ont vécu les soldats lors de leur retour. Le bas du graphique montre la chute de la température extérieure au fur et à mesure du retour vers l’Empire français. On peut donc voir sur cette représentation visuelle plusieurs variables illustrées de belle façon (la position géographique en deux dimensions, la taille de l’armée à chaque moment et la température extérieure). C’est une utilisation intelligente et créative d’une représentation graphique. Vous pouvez en apprendre plus sur ce graphique particulier en écoutant les explications d’un mathématicien dans ce vidéo (en anglais) sur Youtube.

Un autre exemple à étudier

J’aimerais maintenant vous proposer un exercice de lecture de graphique. Dans le vidéo qui suit, regardez le diagramme présenté et consignez par écrit vos impressions quant aux données qui y sont présentées.

L’objectif est de vous laisser seulement quelques secondes pour aller chercher les informations essentielles du graphique, les points tournants et les grandes tendances qu’on peut en tirer puis que vous les inscriviez sur une feuille. Comme la lecture d’informations visuelles dans les médias est généralement faite rapidement, sans aller en profondeur, le vidéo vous présentera le graphique pendant quelques secondes. Faites jouer le vidéo une seule fois avant d’écrire vos conclusions et continuez ensuite votre lecture de cet article pour vérifier votre analyse. Si vous en avez envie, partagez avec tout le monde ce que vous avez inscrit sur votre papier dans les commentaires de l’article, tout en bas de la présente page.

Un contre-exemple illustrant les dérives possibles

Analysons maintenant le résultat de votre observation en faisant ressortir les informations essentielles du tracé que vous avez regardé. On verra qu’inversement à l’exemple du «meilleur graphique jamais produit», pécher par excès de créativité amène parfois ceux qui présentent des données à aller à l’encontre des différentes conventions qui permettent au lecteur de bien saisir les informations.

Dans le premier graphique, la première lecture donne l'impression que le nombre d'avortements va en croissant dû à l'inversement de l'axe horizontal. J'ai déjà traité cet exemple dans un billet précédent.
Dans le premier graphique, la première lecture donne l’impression que le nombre d’avortements va en croissant dû à l’inversement de l’axe horizontal. J’ai déjà traité cet exemple dans un billet précédent.

J’ai déjà rappelé dans un billet précédent que la lecture de tous les graphiques se fait de gauche vers la droite pour la variable de l’axe horizontal. Ainsi, si on présente le temps comme variable indépendante (qui est généralement présentée sur l’axe horizontal), on mettra la période de temps la proche du début des temps (peu importe où vous le fixez) complètement à gauche et, au fur et à mesure qu’on se déplacera vers la droite, on se rapprochera de la valeur la plus éloignée du début des temps. C’est une convention sociale valable dans la plupart des pays dans lesquels la langue principale se lit de gauche à droite. C’est assurément le cas en Amérique et en Europe. Ainsi, dans une publication s’adressant à des lecteurs de cette partie du monde, on présentera les données dans l’ordre croissant en partant de la gauche vers la droite. Aller à l’encontre de cette convention peut entraîner une mauvaise compréhension des données. Pire encore, cela peut carrément induire le lecteur en erreur et le tromper dans son analyse. Dans l’exemple qu’on peut voir à droite, j’avais attribué cette erreur à une volonté de mal faire.

Dans l’exemple que vous venez de voir, il existe aussi une erreur de ce type. Cependant, elle ne se trouve pas sur l’axe horizontal, mais bien sur l’axe vertical. En effet, il semble que la personne qui fait le graphique a choisi d’exprimer sa créativité en mettant l’axe horizontal au-dessus du graphique avec les valeurs sur l’axe augmentant au fur et mesure qu’on s’éloigne vers le bas. Ce choix est assez difficile à comprendre… En allant à l’encontre de la convention disant que l’axe vertical pointe généralement vers le haut, le créateur du graphique rend difficile la lecture de l’information importante du graphique.

À la lumière de ce qui vient d’être dit, je vous invite à retourner lire ce que vous avez écrit suite au visionnement du vidéo. Les points sautant aux yeux, lors d’une première lecture rapide sont les suivants:

  • La ligne va vers le haut à partir de 1990 jusqu’en 2000;
  • Elle se stabilise entre 2000 et 2005;
  • Une nouvelle loi est introduite en 2005 (ce point est mis en valeur par du texte dans le graphique);
  • La ligne s’est mise à descendre pour prendre une hauteur bien au dessous de ce qui avait existé au début des années deux mille

Devant ces observations, vous avez sûrement conclu que le nombre de meurtres avait tranquillement augmenté jusqu’à l’introduction  de la nouvelle loi puis était redescendu à un niveau plus bas. Rien n’est plus faux. Comme l’axe vertical est inversé, on devrait plutôt conclure tout l’inverse:

  • Entre 1990 et 2005, le nombre de morts dû aux armes à feu a diminué pour se stabiliser autour de 500 par année;
  • En 2005, la nouvelle loi a introduit la possibilité d’utiliser la force pour défendre sa position lorsqu’on fait face à un acte criminel ou que sa sécurité est menacée. Cette loi permet donc au citoyen ordinaire d’utiliser la force pour intervenir lorsqu’une personne est en train de commettre un acte criminel ou de mettre en danger dudit citoyen (législation du type « stand your ground« ). Dans la plupart des législations, le citoyen ordinaire a l’obligation de tenter de fuir le danger et contacter les autorités compétentes si possible avant d’utiliser la force pour se défendre (législation du type « duty to retreat« );
  • Cette mesure semble avoir été la cause d’une augmentation du nombre de décès liés aux armes à feu (du moins, ce nombre a augmenté drastiquement après l’introduction de la loi).

Observez à nouveau le graphique à la lumière de cette nouvelle information.

florida gun deaths
Un nouveau regard sur le graphique changera probablement votre analyse. Source: Buisness Insider (C’est à cet endroit qu’on trouve une analyse du graphique. Tel qu’indiqué, il semble qu’il ait été fait par un certain C. Chan pour le compte de l’agence de presse Reuters)

À mon avis, cette erreur est due à un excès de créativité plus qu’à une volonté réelle de tromper puisqu’un article dans lequel cette image est présentée propose une analyse juste et sensée des données. Ainsi, on ne tente pas de manipuler les données pour dire autre chose que ce qu’on peut observer dans le graphique lorsqu’on le lit correctement. Note amusante, le site a tout de même pris la peine de présenter une nouvelle version du graphique avec l’axe horizontal dans l’autre sens, indiquant ainsi qu’ils avaient probablement réalisé que la présentation pouvait influencer la compréhension des lecteurs. D’ailleurs, après une observation plus profonde, on peut s’imaginer que le fameux C. Chan, créateur du graphique, avait choisi les couleurs dans le graphique sciemment. Maintenant qu’on a l’information cruciale sur l’axe vertical, le choix de la couleur rouge pour la zone au-dessus de la ligne brisée paraît plus logique. Ce rouge est donc associé à la section représentant le nombre de morts.

Que peut-on retirer de cet exercice? En gros, que la créativité est une bonne chose et que l’innovation permet parfois de rendre plus facile, captivante ou efficace la transmission d’informations. Cependant, dans certaines situations, l’excès de créativité et la contravention aux conventions sociales peut avoir comme conséquence de rendre problématique l’acte de partage de la connaissance et même peut entraîner des erreurs chez la personne qui interprète les données. Il faut donc s’assurer, lorsqu’on crée une infographie, que le lecteur pourra correctement aller à l’essentiel ce qu’on veut lui apprendre. Pour ce faire, il faut revisiter son travail, une fois complété, avec les yeux du profane. Aller à l’encontre des conventions sociales est un pari risqué. Jouez-y avec prudence.

Merci à Jean-Sébastien Turcotte de m’avoir transmis l’image des morts par arme à feu floridiennes.

Sondages, sondages, sondages

La Première ministre Pauline Marois a été défaite, tel que prévu par Si la tendance se maintient, par Philippe Couillard et le Parti Libéral du Québec. Crédit photo: Benoît Levac, CC BY-SA 3.0 (source)

Un collègue m’a transmis un lien vers un site d’analyse des données statistiques (Si la tendance se maintient) entourant la campagne électorale québécoise qui vient de se terminer. Malgré le fait que l’élection soit terminée, je pense qu’il est intéressant d’aller jeter un œil à cette page pour voir tout l’imposant traitement de données qui a été fait et à la fine analyse qui y a été publiée. Le post-mortem faisant la comparaison entre les prédictions faites le jour avant l’élection et les résultats de celle-ci est très détaillé et explique bien la raison de plusieurs différences entre les prévisions et la réalité.

Il sera fort intéressant de suivre ce site s’il est de nouveau actif lors de l’élection canadienne de l’an prochain. J’espère que vous avez pu utiliser vos connaissances de méthodes quantitatives pour user de votre droit de vote et que vous avez fait valoir votre voix.

Merci à Vincent pour le lien.

 

Comme quoi il est parfois pertinent de répéter

On m’a de nouveau transmis une nouvelle qui contenait un graphique à axe tronqué un peu trompeur. Dernièrement, FOX News a rapporté le niveau d’enrôlement au nouveau programme d’assurance-santé obligatoire américain surnommé « Obamacare ». L’affaire a fait un bruit suffisant pour que la chaîne télévisuelle rectifie son erreur.

Contexte

Comme la politique américaine n’est pas un sujet toujours très suivi au Canada, prenons le temps de donner quelques explications pour comprendre la nouvelle. L' »Obamacare » est une des lois-phares du programme politique qui a mené à l’élection de Barack Obama en 2008. Cette loi, adoptée en 2010 mais dont les principales implications ont pris effet l’an dernier, oblige la plupart des citoyens américains à se procurer une assurance-santé privée s’ils n’en possèdent pas déjà une fournie par leur employeur. En contrepartie de cette obligation, le gouvernement interdit aux compagnies d’assurance de refuser un demandeur à cause ses « conditions préexistantes » (par exemple, une personne atteinte du diabète ou de problèmes cardiaques aurait beaucoup de difficulté à se trouver une assurance sans cette clause). Aussi, le gouvernement versera des subventions aux familles à bas revenu qui auraient de la difficulté à s’offrir de telles couvertures. Vous pouvez en apprendre beaucoup plus sur le sujet sur Wikipédia ou sur le site du gouvernement américain à ce sujet (en anglais). Sur FOX News, le principal acteur de cette histoire, je pense qu’on peut dire sans raccourci que c’est un média de droite qui est généralement en désaccord avec les politiques du gouvernement Obama ou démocrates en général. Par exemple, on dit sur Wikipédia, « Fox News Channel est réputée pour favoriser les positions politiques conservatrices (source) ».

Ce qui s’est passé

Donc, dans un bulletin de nouvelles, FOX News a présenté un graphique pour montrer l’adhésion au programme de l' »Obamacare » au 27 mars 2014 en comparaison avec la cible fixée par le gouvernement fédéral à atteindre le 31 mars 2014. On imagine que la chaîne voulait souligner que la cible ne serait probablement pas atteinte. En effet, au 27 mars 2014, il y avait 6M (6 millions) d’inscriptions alors que la cible était de 7,066M d’inscriptions. Or, pour illustrer ce fait, le graphique présenté n’avait pas d’axe vertical pour illustrer la hauteur des rectangles (en nombre d’inscriptions) et cet axe absent était visiblement tronqué puisque la différence d’aire entre les deux rectangles n’était pas du tout proportionnelle à différence numérique entre les deux valeurs représentées.

L’image présentée par FOX News originalement. Source: J’ai pris l’image ici, mais le droit d’auteur doit appartenir à FOX News. J’utilise cette image pour des fins de critique ou éducationnelles tel que permis par la loi.

Suite à cette diffusion, « les internets » (autre article en anglais) se sont fâchés et plusieurs critiques ont souligné le fait que ce graphique était trompeur puisqu’il donnait l’impression que la différence entre la valeur au 27 mars et la cible était très importante. En effet, sur le graphique, on voit une différence de 5 barres horizontales de hauteur sur une hauteur de 8 au total pour l’objectif gouvernemental (\frac{5}{8}=62,5\%)  alors qu’elle ne représentait qu’une différence de 15,1% (\frac{1,066M}{7,066M}=15,1\%).

Voyant que la chose semblait faire boule de neige, la chaîne de nouvelle s’est excusée et a publié un nouveau graphique qui représentait mieux la réalité. On peut voir le segment des excuses du présentateur au bas de cet article.

Le nouveau graphique. Source: J’ai pris l’image ici, mais le droit d’auteur doit appartenir à FOX News. J’utilise cette image pour des fins de critique ou éducationnelles tel que permis par la loi.

 

J’ai l’impression d’être un perroquet

Oui, pour qu’un message passe, il faut le répéter, encore et encore. C’est ce que je fais. Utiliser des graphiques avec des axes tronqués, C’EST (généralement) MAL. Le faire dans le but d’exagérer une tendance, c’est encore pire. Dans le cas actuel, assez de personnes se sont mobilisées pour refuser cet mauvaise représentation et, rendons ce qui est dû, FOX News a eu l’honnêteté de reconnaître son erreur et de la corriger.

Répétons le message tous en chœur: « Il ne faut pas utiliser d’axes tronqués. Il faut présenter les données objectivement et laisser le lecteur réfléchir. Il faut refuser les représentations fautives et ne pas les accepter comme prémisses à des arguments ».

N’hésitez pas à partager plus bas vos commentaires ou d’autres graphiques un peu croches que vous pourriez rencontrer. Aussi, abonnez-vous à ce blog pour être avisé quand je publie des nouveaux billets. Pour ce faire, cliquez sur le bouton « Suivre » qui se trouve en bas à droite de la page et inscrivez votre adresse courriel!

Source

On peut lire la nouvelle originale ici (en anglais) et merci à Geneviève de l’avoir partagée avec moi.