Présenter des données, quel calvaire…

Dans mon cégep, certains étudiants qui se destinent aux communications et au journalisme sont appelés à suivre le cours de méthodes quantitatives généralement offert aux étudiants de sciences humaines. Ces étudiants me demandent souvent pourquoi ils doivent suivre ce cours, ce que ça leur apportera. La réponse que je leur donne est toujours la même.

Dans le cadre de votre pratique professionnelle, vous serez appelés à présenter ou commenter des données et vous devrez avoir les compétences nécessaires pour poser un jugement critique sur celles-ci.

Pour illustrer cette réalité, j’aimerais présenter ici deux exemples d’articles publiés par des médias québécois sérieux et qui comptent, à mon avis, des erreurs importantes au niveau de la présentation des données.

Les CPE, le privé et la qualité

Dans son édition de septembre 2018, le magazine L’Actualité présente un dossier sur les garderies et la qualité des services qu’ils offrent. Pour illustrer la situation, le magazine publie le graphique suivant à la page 60.CPE Qualité L'actualité sept 2018On y voit une représentation de la distribution de la classification de la qualité, dans différents types d’établissements. Je vous invite, avant de continuer la lecture, à écrire sur un papier votre première impression à la vue de ce graphique. En particulier, comparez les CPE et les garderies non subventionnées en ce qui a trait à la qualité.

Maintenant, regardez de plus près. Vous verrez que la catégorie « un service d’excellente qualité » n’est pas présentée dans le graphique des deux types de garderies non subventionnées, ce qui fausse complètement la comparaison naturelle que font les humains: comment se comparent la première catégorie d’un graphique avec la première catégorie d’un autre graphique.

Une fois ce problème révélé, la différence entre les CPE et les garderies saute aux yeux. Alors que seuls 2% des CPE offrent un service de faible qualité ou inférieur, c’est respectivement 41 et 36% des garderies non subventionnées pour bambins et pour les plus grands qui sont dans ces catégories. Gageons que vous n’aviez pas écrit cela sur votre papier.

La participation aux élections, version cartographique

Le 21 septembre 2018, en préparation pour les élections, le journal Le Devoir a publié sur sa plateforme web un article portant sur les taux de participations des différentes circonscriptions aux élections de 2014.

L’enjeu est important: la participation des Québécois aux élections est en déclin depuis plusieurs années et il est intéressant de se demander où ce déclin est le plus marqué. Le Devoir a tenté de représenter cette situation en plus de proposer une analyse statistique de corrélation entre différentes variables et le taux de participation dans une circonscription.

Si l’idée était bonne, à mon avis, l’exécution a été déficiente. Vous pouvez visiter l’article en suivant ce lien et revenir lire ma critique plus tard.

 

2018-09-21 10_29_55-Vos voisins ont-ils voté_ _ Le Devoir
La section choisie a une couleur mauve foncé (au moins 90% de participation selon l’échelle présentée en haut à droite) mais la participation se la section est à 66,67%. Le taux de participation de la section (66.67%) ne comprend pas le vote par anticipation alors que le taux de la circonscription (77,15%) le comprend. On ne peut comparer ces valeurs.

Allons-y point par point.

1) La carte interactive est intéressante mais la représentation des données est incompréhensible. L’échelle dit que le mauve foncé représente une participation plus élevée que la moyenne de 71,3%, or je ne suis pas arrivé à trouvé une seule section de vote mauve foncée pour laquelle le taux de participation dans la section était supérieur à 70%. En plus, le taux de participation final dans les circonscriptions comprend le vote par anticipation alors que ce n’est pas le cas dans les sections, ce qui rend la comparaison entre ces deux données impossible [ce qui est étrange sachant qu’elles sont présentées côte à côte dans les fenêtres].

2) Les nuages de points présentés sont assez mauvais. D’abord, leur titre ne respecte pas la convention utilisée à peu près partout dans le monde selon laquelle le titre se formule « variable dépendante (sur l’axe vertical) selon variable indépendante (sur l’axe horizontal) ». Par exemple, le premier nuage de points devrait s’appeler « Le taux de chômage selon la participation à l’élection » et non l’inverse. Ensuite, les axes ne sont pas nommés. Cela rend la lecture confuse, particulièrement si les deux variables représentées s’expriment en pourcentage. Le graphique « La participation selon l’obtention d’un diplôme universitaire » est un bon exemple de cette confusion, sans compter que la mesure utilisée pour « l’obtention d’un diplôme universitaire » n’est pas définie.

3) L’analyse de corrélation n’est pas appuyée par des mesures. Si la corrélation semble assez claire entre le taux de chômage et le taux de participation (quoi qu’assez surprenante, à mon humble avis), il n’en est pas de même pour d’autres paires de variables. Par exemple, j’ai montré le graphique représentant le taux de participation et le taux de diplomation à deux collègues et, entre trois enseignants en mathématique, aucun n’aurait dit qu’il existait une corrélation entre ces variables. Notons que l’article affirme que c’est le cas.

Le journalisme de données est à la mode ces temps-ci. Cependant, il faut réfléchir profondément à la méthodologie choisie pour présenter et analyser les données. À défaut de le faire, on risque de créer de la confusion, de mal informer le public ou de faire perdre du sens à la situation analysée. À mon humble avis, c’est le cas ici; l’exécution déficiente de cette analyse fait passer l’article à côté d’un vrai bon sujet de discussion et d’une réflexion posée sur les enjeux sous-jacents.

Présenter et interpréter des données, une compétence essentielle pour le communicateur d’aujourd’hui et de demain

La réalité, c’est qu’on ne peut pas passer à côté. Je vois mal comment on pourrait évoluer dans la sphère politique ou dans les médias sans posséder une minimale capacité à décortiquer des données statistiques ou à les représenter visuellement. C’est une compétence qui permet d’avoir un discours cohérent avec ce que l’on présente.

C’est pour cette raison qu’il est essentiel que nos journalistes et politiciens reçoivent une bonne formation à ce niveau et puissent évoluer dans notre monde où la donnée deviendra de plus en plus importante dans la sphère publique.

 

Note: Merci à François Gagnon de m’avoir montré le graphique de L’Actualité.

Publicités

Un autre blog intéressant

Un ami m’a fait part d’un article qui référait à un blogue assez similaire au mien. JunkCharts présente des graphiques tirés des médias, leurs erreurs fondamentales et propose généralement un nouveau graphique plus acceptable. Le site est en anglais mais assez facilement lisible. À consulter.

Ça se passe ici: http://junkcharts.typepad.com/junk_charts/

Créativité versus lisibilité

Présenter des données dans un graphique est un art. Chez le présentateur, il existe souvent une tentation d’être créatif et d’illustrer les informations d’une manière inattendue ou nouvelle. On espère de cette manière intéresser le lecteur et lui donner envie d’explorer le résultat de son travail.

Quand cela est réussi, le lecteur en ressort gagnant: il a compris rapidement une grande masse d’informations dans un format nouveau qui a créé l’étincelle suffisante pour lui faire apprécier ce travail.

Un exemple de créativité intéressant

Le «meilleur graphique de tous les temps» selon certains. Cliquez sur l’image pour en voir les multiples détails. Auteur: Charles Minard (domaine public) (source)

Prenons pour exemple l’image ci-dessus, qui est appelée par certains «le meilleur graphique de tous les temps». Il s’agit d’une représentation fort créative d’une très grande quantité de données expliquant la campagne désastreuse de Napoléon 1er en Russie. On y voit en beige la marche de l’armée vers Moscou sur la carte de l’Europe. La taille de la colonne est proportionnelle à la taille de l’armée et se réduit au fur et à mesure des pertes humaines et des batailles.

À Moscou, Napoléon a subi la défaite et dut rebrousser chemin vers la France. La bande noire illustre cette retraite dans l’espace, la réduction de la largeur étant encore proportionnelle à la taille de l’armée à ce moment. Un autre facteur important dans l’échec de cette offensive fut la rigueur extrême de l’hiver qu’ont vécu les soldats lors de leur retour. Le bas du graphique montre la chute de la température extérieure au fur et à mesure du retour vers l’Empire français. On peut donc voir sur cette représentation visuelle plusieurs variables illustrées de belle façon (la position géographique en deux dimensions, la taille de l’armée à chaque moment et la température extérieure). C’est une utilisation intelligente et créative d’une représentation graphique. Vous pouvez en apprendre plus sur ce graphique particulier en écoutant les explications d’un mathématicien dans ce vidéo (en anglais) sur Youtube.

Un autre exemple à étudier

J’aimerais maintenant vous proposer un exercice de lecture de graphique. Dans le vidéo qui suit, regardez le diagramme présenté et consignez par écrit vos impressions quant aux données qui y sont présentées.

L’objectif est de vous laisser seulement quelques secondes pour aller chercher les informations essentielles du graphique, les points tournants et les grandes tendances qu’on peut en tirer puis que vous les inscriviez sur une feuille. Comme la lecture d’informations visuelles dans les médias est généralement faite rapidement, sans aller en profondeur, le vidéo vous présentera le graphique pendant quelques secondes. Faites jouer le vidéo une seule fois avant d’écrire vos conclusions et continuez ensuite votre lecture de cet article pour vérifier votre analyse. Si vous en avez envie, partagez avec tout le monde ce que vous avez inscrit sur votre papier dans les commentaires de l’article, tout en bas de la présente page.

Un contre-exemple illustrant les dérives possibles

Analysons maintenant le résultat de votre observation en faisant ressortir les informations essentielles du tracé que vous avez regardé. On verra qu’inversement à l’exemple du «meilleur graphique jamais produit», pécher par excès de créativité amène parfois ceux qui présentent des données à aller à l’encontre des différentes conventions qui permettent au lecteur de bien saisir les informations.

Dans le premier graphique, la première lecture donne l'impression que le nombre d'avortements va en croissant dû à l'inversement de l'axe horizontal. J'ai déjà traité cet exemple dans un billet précédent.
Dans le premier graphique, la première lecture donne l’impression que le nombre d’avortements va en croissant dû à l’inversement de l’axe horizontal. J’ai déjà traité cet exemple dans un billet précédent.

J’ai déjà rappelé dans un billet précédent que la lecture de tous les graphiques se fait de gauche vers la droite pour la variable de l’axe horizontal. Ainsi, si on présente le temps comme variable indépendante (qui est généralement présentée sur l’axe horizontal), on mettra la période de temps la proche du début des temps (peu importe où vous le fixez) complètement à gauche et, au fur et à mesure qu’on se déplacera vers la droite, on se rapprochera de la valeur la plus éloignée du début des temps. C’est une convention sociale valable dans la plupart des pays dans lesquels la langue principale se lit de gauche à droite. C’est assurément le cas en Amérique et en Europe. Ainsi, dans une publication s’adressant à des lecteurs de cette partie du monde, on présentera les données dans l’ordre croissant en partant de la gauche vers la droite. Aller à l’encontre de cette convention peut entraîner une mauvaise compréhension des données. Pire encore, cela peut carrément induire le lecteur en erreur et le tromper dans son analyse. Dans l’exemple qu’on peut voir à droite, j’avais attribué cette erreur à une volonté de mal faire.

Dans l’exemple que vous venez de voir, il existe aussi une erreur de ce type. Cependant, elle ne se trouve pas sur l’axe horizontal, mais bien sur l’axe vertical. En effet, il semble que la personne qui fait le graphique a choisi d’exprimer sa créativité en mettant l’axe horizontal au-dessus du graphique avec les valeurs sur l’axe augmentant au fur et mesure qu’on s’éloigne vers le bas. Ce choix est assez difficile à comprendre… En allant à l’encontre de la convention disant que l’axe vertical pointe généralement vers le haut, le créateur du graphique rend difficile la lecture de l’information importante du graphique.

À la lumière de ce qui vient d’être dit, je vous invite à retourner lire ce que vous avez écrit suite au visionnement du vidéo. Les points sautant aux yeux, lors d’une première lecture rapide sont les suivants:

  • La ligne va vers le haut à partir de 1990 jusqu’en 2000;
  • Elle se stabilise entre 2000 et 2005;
  • Une nouvelle loi est introduite en 2005 (ce point est mis en valeur par du texte dans le graphique);
  • La ligne s’est mise à descendre pour prendre une hauteur bien au dessous de ce qui avait existé au début des années deux mille

Devant ces observations, vous avez sûrement conclu que le nombre de meurtres avait tranquillement augmenté jusqu’à l’introduction  de la nouvelle loi puis était redescendu à un niveau plus bas. Rien n’est plus faux. Comme l’axe vertical est inversé, on devrait plutôt conclure tout l’inverse:

  • Entre 1990 et 2005, le nombre de morts dû aux armes à feu a diminué pour se stabiliser autour de 500 par année;
  • En 2005, la nouvelle loi a introduit la possibilité d’utiliser la force pour défendre sa position lorsqu’on fait face à un acte criminel ou que sa sécurité est menacée. Cette loi permet donc au citoyen ordinaire d’utiliser la force pour intervenir lorsqu’une personne est en train de commettre un acte criminel ou de mettre en danger dudit citoyen (législation du type « stand your ground« ). Dans la plupart des législations, le citoyen ordinaire a l’obligation de tenter de fuir le danger et contacter les autorités compétentes si possible avant d’utiliser la force pour se défendre (législation du type « duty to retreat« );
  • Cette mesure semble avoir été la cause d’une augmentation du nombre de décès liés aux armes à feu (du moins, ce nombre a augmenté drastiquement après l’introduction de la loi).

Observez à nouveau le graphique à la lumière de cette nouvelle information.

florida gun deaths
Un nouveau regard sur le graphique changera probablement votre analyse. Source: Buisness Insider (C’est à cet endroit qu’on trouve une analyse du graphique. Tel qu’indiqué, il semble qu’il ait été fait par un certain C. Chan pour le compte de l’agence de presse Reuters)

À mon avis, cette erreur est due à un excès de créativité plus qu’à une volonté réelle de tromper puisqu’un article dans lequel cette image est présentée propose une analyse juste et sensée des données. Ainsi, on ne tente pas de manipuler les données pour dire autre chose que ce qu’on peut observer dans le graphique lorsqu’on le lit correctement. Note amusante, le site a tout de même pris la peine de présenter une nouvelle version du graphique avec l’axe horizontal dans l’autre sens, indiquant ainsi qu’ils avaient probablement réalisé que la présentation pouvait influencer la compréhension des lecteurs. D’ailleurs, après une observation plus profonde, on peut s’imaginer que le fameux C. Chan, créateur du graphique, avait choisi les couleurs dans le graphique sciemment. Maintenant qu’on a l’information cruciale sur l’axe vertical, le choix de la couleur rouge pour la zone au-dessus de la ligne brisée paraît plus logique. Ce rouge est donc associé à la section représentant le nombre de morts.

Que peut-on retirer de cet exercice? En gros, que la créativité est une bonne chose et que l’innovation permet parfois de rendre plus facile, captivante ou efficace la transmission d’informations. Cependant, dans certaines situations, l’excès de créativité et la contravention aux conventions sociales peut avoir comme conséquence de rendre problématique l’acte de partage de la connaissance et même peut entraîner des erreurs chez la personne qui interprète les données. Il faut donc s’assurer, lorsqu’on crée une infographie, que le lecteur pourra correctement aller à l’essentiel ce qu’on veut lui apprendre. Pour ce faire, il faut revisiter son travail, une fois complété, avec les yeux du profane. Aller à l’encontre des conventions sociales est un pari risqué. Jouez-y avec prudence.

Merci à Jean-Sébastien Turcotte de m’avoir transmis l’image des morts par arme à feu floridiennes.

Comme quoi il est parfois pertinent de répéter

On m’a de nouveau transmis une nouvelle qui contenait un graphique à axe tronqué un peu trompeur. Dernièrement, FOX News a rapporté le niveau d’enrôlement au nouveau programme d’assurance-santé obligatoire américain surnommé « Obamacare ». L’affaire a fait un bruit suffisant pour que la chaîne télévisuelle rectifie son erreur.

Contexte

Comme la politique américaine n’est pas un sujet toujours très suivi au Canada, prenons le temps de donner quelques explications pour comprendre la nouvelle. L' »Obamacare » est une des lois-phares du programme politique qui a mené à l’élection de Barack Obama en 2008. Cette loi, adoptée en 2010 mais dont les principales implications ont pris effet l’an dernier, oblige la plupart des citoyens américains à se procurer une assurance-santé privée s’ils n’en possèdent pas déjà une fournie par leur employeur. En contrepartie de cette obligation, le gouvernement interdit aux compagnies d’assurance de refuser un demandeur à cause ses « conditions préexistantes » (par exemple, une personne atteinte du diabète ou de problèmes cardiaques aurait beaucoup de difficulté à se trouver une assurance sans cette clause). Aussi, le gouvernement versera des subventions aux familles à bas revenu qui auraient de la difficulté à s’offrir de telles couvertures. Vous pouvez en apprendre beaucoup plus sur le sujet sur Wikipédia ou sur le site du gouvernement américain à ce sujet (en anglais). Sur FOX News, le principal acteur de cette histoire, je pense qu’on peut dire sans raccourci que c’est un média de droite qui est généralement en désaccord avec les politiques du gouvernement Obama ou démocrates en général. Par exemple, on dit sur Wikipédia, « Fox News Channel est réputée pour favoriser les positions politiques conservatrices (source) ».

Ce qui s’est passé

Donc, dans un bulletin de nouvelles, FOX News a présenté un graphique pour montrer l’adhésion au programme de l' »Obamacare » au 27 mars 2014 en comparaison avec la cible fixée par le gouvernement fédéral à atteindre le 31 mars 2014. On imagine que la chaîne voulait souligner que la cible ne serait probablement pas atteinte. En effet, au 27 mars 2014, il y avait 6M (6 millions) d’inscriptions alors que la cible était de 7,066M d’inscriptions. Or, pour illustrer ce fait, le graphique présenté n’avait pas d’axe vertical pour illustrer la hauteur des rectangles (en nombre d’inscriptions) et cet axe absent était visiblement tronqué puisque la différence d’aire entre les deux rectangles n’était pas du tout proportionnelle à différence numérique entre les deux valeurs représentées.

L’image présentée par FOX News originalement. Source: J’ai pris l’image ici, mais le droit d’auteur doit appartenir à FOX News. J’utilise cette image pour des fins de critique ou éducationnelles tel que permis par la loi.

Suite à cette diffusion, « les internets » (autre article en anglais) se sont fâchés et plusieurs critiques ont souligné le fait que ce graphique était trompeur puisqu’il donnait l’impression que la différence entre la valeur au 27 mars et la cible était très importante. En effet, sur le graphique, on voit une différence de 5 barres horizontales de hauteur sur une hauteur de 8 au total pour l’objectif gouvernemental (\frac{5}{8}=62,5\%)  alors qu’elle ne représentait qu’une différence de 15,1% (\frac{1,066M}{7,066M}=15,1\%).

Voyant que la chose semblait faire boule de neige, la chaîne de nouvelle s’est excusée et a publié un nouveau graphique qui représentait mieux la réalité. On peut voir le segment des excuses du présentateur au bas de cet article.

Le nouveau graphique. Source: J’ai pris l’image ici, mais le droit d’auteur doit appartenir à FOX News. J’utilise cette image pour des fins de critique ou éducationnelles tel que permis par la loi.

 

J’ai l’impression d’être un perroquet

Oui, pour qu’un message passe, il faut le répéter, encore et encore. C’est ce que je fais. Utiliser des graphiques avec des axes tronqués, C’EST (généralement) MAL. Le faire dans le but d’exagérer une tendance, c’est encore pire. Dans le cas actuel, assez de personnes se sont mobilisées pour refuser cet mauvaise représentation et, rendons ce qui est dû, FOX News a eu l’honnêteté de reconnaître son erreur et de la corriger.

Répétons le message tous en chœur: « Il ne faut pas utiliser d’axes tronqués. Il faut présenter les données objectivement et laisser le lecteur réfléchir. Il faut refuser les représentations fautives et ne pas les accepter comme prémisses à des arguments ».

N’hésitez pas à partager plus bas vos commentaires ou d’autres graphiques un peu croches que vous pourriez rencontrer. Aussi, abonnez-vous à ce blog pour être avisé quand je publie des nouveaux billets. Pour ce faire, cliquez sur le bouton « Suivre » qui se trouve en bas à droite de la page et inscrivez votre adresse courriel!

Source

On peut lire la nouvelle originale ici (en anglais) et merci à Geneviève de l’avoir partagée avec moi.

La dette, ce truc difficile à mettre en graphique

Hier, le gouvernement Marois déposait un budget, action qui mène généralement à de beaux graphiques. Le Soleil est lui aussi tombé dans le piège des graphiques chronologique à axe vertical coupé.

Un autre graphique de dette un peu tout croche...
Un autre graphique de dette un peu tout croche… Source: Le Soleil du 21 février 2014, p.29

Encore une fois, une augmentation de la dette d’environ 10% (de 192G$ à 212G$) à ressemble à une augmentation de 300% (quatre fois plus haut). Certains diront que j’exagère en soulignant ce problème encore et encore. J’aimerais me défendre en disant que les journaux réussissent à faire passer pour extraordinaires des choses qui ne le sont pas et c’est dérangeant. Une dette qui augmente de 10% en cinq ans est une dette tout à fait normale à 2% d’intérêt par année sur laquelle on ne fait aucun remboursement. Dans un contexte où le gouvernement s’engage vers le déficit-zéro pendant une période où la croissance économique n’est pas certaine, le maintient de la dette sans remboursement est une situation tout à fait normale. Cependant, en présentant les choses de cette façon, on donne l’impression que le gouvernement est en train de dépenser frénétiquement.

Le jour où les journaux cesseront ce sensationnalisme, j’arrêterai de les critiquer. Je crains bien qu’on voit encore quelques graphiques du genre ici…

Merci à Jérôme Lemay de m’avoir transmis ce graphique.

Une petite vite pour mes étudiants en communication

Certains étudiants de mes cours de méthodes quantitatives se destinent au domaine des communications et me demandent régulièrement pourquoi ils doivent suivre un cours de statistique. La réponse est bien simple: « Parce que, comme communicateur, vous serez amenés à transmettre des données chiffrées qui devront être compréhensibles pour le grand public. »

Voyons un exemple. Hier, je naviguais sur le site de nouvelles de Radio-Canada.ca et un titre a attiré mon attention : Choc démographique au Québec : pénurie de main-d’œuvre à l’horizon. Ce genre d’article est souvent intéressant puisqu’il présente plusieurs données statistiques qui peuvent être analysées. J’ai été très content de remarquer que ces données étaient présentées dans un graphique. J’ai été aussi vite déçu par la présentation de ce graphique.

Ce qu'il ne faut pas faire quand on est communicateur... (Inspiration: XKCD)
Ce qu’il ne faut pas faire quand on est communicateur…
(Inspiration: XKCD)

Allez le voir, il est au milieu de la page! J’aimerais le présenter ici mais ce n’est pas possible. Il faut noter que j’ai visité le site avec ma tablette ce qui ne permettait pas de voir les étiquettes attachées à chaque rectangle. J’avais donc un graphique sans aucune donnée. En le revisitant ce matin, j’ai réalisé qu’on pouvait obtenir les données en passant la souris sur le graphique. Le concepteur du site n’a pas pensé à la portabilité, mais ce n’est pas l’objet de ce blogue. Il faut surtout remarquer que le graphique n’est accompagné d’aucun axe ou information qui permet de comprendre l’ordre de grandeur des données seulement en le regardant. Sans ces indications, impossible de comprendre rapidement l’information présentée dans ce graphique. C’est mal…

Ainsi, la réponse à la questions de mes étudiants en communication se trouve là; même si on ne produit pas les tableaux et graphiques ou les données dans le cadre d’une étude en sciences humaines, nous devrons les présenter ou les interpréter pour leur donner un sens dans le cadre de nos activités professionnelles. Il est donc primordial d’avoir une formation de base dans le domaine statistique pour comprendre le monde qui nous entoure et qui devient de plus en plus rempli de nombres et de données. C’est d’ailleurs aussi vrai pour la plupart d’entre nous qui aspirons à comprendre le monde dans lequel nous vivons.

Retour au jeu : les réponses

Dans mon dernier billet, je vous proposais de jouer à un jeu en identifiant les erreurs dans le graphique suivant. Rappelons-le, ce graphique a été utilisé lors de la campagne électorale d’un parti politique municipal pour parler de la dette de la ville de Québec. Tel que je le disais, l’objectif n’est pas ici de discourir sur la dette de la ville ou de prendre parti dans l’enjeu. L’essentiel, c’est de démontrer qu’il faut être alerte lorsqu’on nous présente des données pour identifier les sources d’informations qui sont utiles pour former un jugement et celles qui devraient être ignorées. Ce graphique fait clairement partie de la deuxième catégorie.

Cette image a circulé beaucoup sur Facebook et dans les médias pendant la campagne électorale. Je ne sais pas elle a été préparée par qui mais je sais qu'elle a été présentée officiellement par un parti politique
Cette image a circulé beaucoup sur Facebook et dans les médias pendant la campagne électorale. Je ne sais pas par qui elle a été préparée mais je sais qu’elle a été présentée officiellement par un parti politique

Les réponses

1. L’axe vertical est tronqué, sans indication de ce fait. Ceci est problématique car ça peut induire le lecteur en erreur lorsqu’il jette un oeil au graphique. En effet, une augmentation de la dette de 1G$ (un milliard de dollars) à 1,2G$ donnera l’impression dans ce graphique d’un doublement de la dette par la différence de hauteur  (donc une augmentation de 100% de la dette) alors qu’elle n’a augmentée que de 20% ( \frac{1,2 -1,0}{1,0}=20\% ). Pour éviter ce problème, il aurait été mieux de faire commencer l’axe vertical à 0 ou, minimalement, d’indiquer une coupure d’axe.

2. Les données présentées au dessus de chaque bande ne sont pas consistantes dans leur grandeur. Dans le temps du maire Lalier et de la mairesse Boucher, on voit des nombres qui sont de l’ordre de 100M$ (représentés à une hauteur de 1G$ sur le graphique) alors que sous Labeaume, les nombres sont de l’ordre de 1G$. Donc, soit il s’agit d’une erreur d’écriture dans le graphique, soit il y a eu un changement majeur dans le calcul de la dette (qui rend inutile de présenter ces données dans un graphique), soit la dette a augmenté de 1G$ entre les mandats de Mme. Boucher et M. Labeaume. Dans tous les cas, il y a un problème avec les données.

3. La hauteur des bandes pour chaque année ne correspond pas aux graduations de l’axe vertical. Par exemple, en 2009, on lit au dessus de la bande une dette de 1,493 G$ alors que la hauteur de la bande est située bien en dessous de 1,4G$. C’est une erreur majeure qui brise la capacité à comparer les données en comparant les hauteurs des bandes. D’ailleurs, entre l’année 2010 et 2011 on voit une diminution dans la dette indiquée en nombre au-dessus de la bande et une augmentation dans la hauteur des bandes. Vous y comprenez quelque chose?

4. Les flèches qui montrent la progression sont un peu surprenantes. D’abord, si on se fie aux données et aux affirmations du graphique, il semble que sous Mme. Boucher, la dette a augmenté de 270 M$ alors que la flèche semble indiquer que la diminution continue jusqu’à son mandat. Aussi la flèche représentant le mandat de M.Labeaume semble indiquer une rapide augmentation jusqu’à la fin du mandat alors qu’on voit une stabilisation de la dette dans les dernières années. La flèche est donc trompeuse sur l’allure réelle de l’augmentation. D’ailleurs, je vous invite à faire vos recherches pour déterminer si M. Labeaume n’avait pas annoncé un tel comportement.

5. La source des données est, disons-le, minimale. Dans le monde d’aujourd’hui, presque toutes les données publiques sont disponibles dans un fichier publié sur Internet. Il faudrait au moins qu’on indique où trouver les données pour une vérification personnelle. Ceci est particulièrement important quand les données du graphiques paraissent louches…

6. Un ami à qui j’ai présenté le graphique m’a fait remarqué que les données du maire Labeaume ont été mises en rouge alors que celles des autres ont été mises dans des couleurs plus subtiles. Cela met l’emphase sur ces données. Ce n’est pas nécessairement une mauvaise chose mais ce n’est pas une présentation neutre des données invitant le lecteur à faire une analyse objective de celles-ci.

7. Sur le plan de ce qu’on dit généralement en classe de méthodes quantitatives, on ne voit pas de titre identifiant clairement les données présentées dans les axes. Le titre n’est pas des plus conformes aux normes.

Ce qu’il faut retenir

Ce graphique est un très mauvais graphique. Quand on veut inviter le citoyen à réfléchir sur des enjeux et à prendre position, il faut lui présenter les chiffres objectivement pour le laisser juger. On peut lui suggérer des interprétations des données et choisir celles qui font particulièrement l’affaire du message qu’on essaie de passer. Cependant, quand on lui présente des mauvais graphiques et qu’on l’invite à tirer des mauvaises conclusions, on fausse le débat.

À nouveau, je vous invite à être critique par rapport aux graphiques et tableaux qu’on vous présente et aux conclusions qu’on en tire. Si vous les jugez pertinents, tenez-en compte lors de la formation de votre jugement. Si vous ne les considérez pas pertinents, refusez de les utiliser pour débattre et soulignez-le à vos opposants. De cette façon, on assainira le débat public en le recentrant sur des arguments valables.

Aussi, prenons le temps de féliciter Félipe, Vincent et Élise qui ont bien travaillé pour trouver des erreurs dans le graphique. Bien sûr, n’hésitez pas à commenter les articles ou à poser des questions dans les commentaires pour faire vivre ce blogue. Soyez sûr que j’y répondrai.

Rectifions, pour le plaisir

Question de s’amuser un peu, j’aimerais vous inviter à regarder le graphique suivant et à le comparer avec celui qui fait l’objet de ce billet. Essentiellement, j’ai repris les données inscrites au-dessus des bandes du diagramme d’origine en supposant qu’elles étaient correctes et qu’il y avait eu un problème de virgules dans les valeurs pour le maire Lalier et la mairesse Boucher pour créer une nouvelle image plus fidèle et objective.

En gros, j’ai utilisé les données suivantes pour faire le graphique.

\begin{tabular}{|l|l|l|l|l|l|l|l|l|l|l|l|l|}  \hline  Ann\'ee & 2001 & 2002 & 2003 & 2004 & 2005 & 2006 & 2007 & 2008 & 2009 & 2010 & 2011 & 2012 \\ \hline  Dette & 952 & 955 & 934 & 925 & 906 & 880 & 1149,6 & 1257,0 & 1493,1 & 1522,0 & 1501,9 & 1565,2 \\ \hline  \end{tabular}

Voici le résultat.

Graphique dette

Il est indéniable que la dette a effectivement augmentée sous le maire Labeaume. Cependant, contrairement à ce que semble dire le premier graphique, cette augmentation n’est pas si impressionnante et, surtout, s’est relativement stabilisée au cours des dernières années. De plus, il est intéressant de se rappeler que madame Boucher est décédée au milieu de son mandat, en 2007 et que M. Labeaume a été élu pour la première fois en décembre 2007. Aussi, quelques recherches vous rappelleront que, pendant la campagne électorale qui l’a menée à la mairie de la ville en 2005, Mme. Boucher avait annoncé qu’elle allait augmenter la dette et avait été élue sur ce programme (source). Il est donc assez audacieux d’attribuer la dette de la ville pour l’année 2007 au maire actuel alors que celui-ci a été en poste pour exactement un mois cette année. J’ai donc corrigé le graphique en indiquant que l’année 2007 était attribuable à madame Boucher. Cela change aussi le constat à faire en regardant le graphique.