Comme quoi il est parfois pertinent de répéter

On m’a de nouveau transmis une nouvelle qui contenait un graphique à axe tronqué un peu trompeur. Dernièrement, FOX News a rapporté le niveau d’enrôlement au nouveau programme d’assurance-santé obligatoire américain surnommé « Obamacare ». L’affaire a fait un bruit suffisant pour que la chaîne télévisuelle rectifie son erreur.

Contexte

Comme la politique américaine n’est pas un sujet toujours très suivi au Canada, prenons le temps de donner quelques explications pour comprendre la nouvelle. L' »Obamacare » est une des lois-phares du programme politique qui a mené à l’élection de Barack Obama en 2008. Cette loi, adoptée en 2010 mais dont les principales implications ont pris effet l’an dernier, oblige la plupart des citoyens américains à se procurer une assurance-santé privée s’ils n’en possèdent pas déjà une fournie par leur employeur. En contrepartie de cette obligation, le gouvernement interdit aux compagnies d’assurance de refuser un demandeur à cause ses « conditions préexistantes » (par exemple, une personne atteinte du diabète ou de problèmes cardiaques aurait beaucoup de difficulté à se trouver une assurance sans cette clause). Aussi, le gouvernement versera des subventions aux familles à bas revenu qui auraient de la difficulté à s’offrir de telles couvertures. Vous pouvez en apprendre beaucoup plus sur le sujet sur Wikipédia ou sur le site du gouvernement américain à ce sujet (en anglais). Sur FOX News, le principal acteur de cette histoire, je pense qu’on peut dire sans raccourci que c’est un média de droite qui est généralement en désaccord avec les politiques du gouvernement Obama ou démocrates en général. Par exemple, on dit sur Wikipédia, « Fox News Channel est réputée pour favoriser les positions politiques conservatrices (source) ».

Ce qui s’est passé

Donc, dans un bulletin de nouvelles, FOX News a présenté un graphique pour montrer l’adhésion au programme de l' »Obamacare » au 27 mars 2014 en comparaison avec la cible fixée par le gouvernement fédéral à atteindre le 31 mars 2014. On imagine que la chaîne voulait souligner que la cible ne serait probablement pas atteinte. En effet, au 27 mars 2014, il y avait 6M (6 millions) d’inscriptions alors que la cible était de 7,066M d’inscriptions. Or, pour illustrer ce fait, le graphique présenté n’avait pas d’axe vertical pour illustrer la hauteur des rectangles (en nombre d’inscriptions) et cet axe absent était visiblement tronqué puisque la différence d’aire entre les deux rectangles n’était pas du tout proportionnelle à différence numérique entre les deux valeurs représentées.

L’image présentée par FOX News originalement. Source: J’ai pris l’image ici, mais le droit d’auteur doit appartenir à FOX News. J’utilise cette image pour des fins de critique ou éducationnelles tel que permis par la loi.

Suite à cette diffusion, « les internets » (autre article en anglais) se sont fâchés et plusieurs critiques ont souligné le fait que ce graphique était trompeur puisqu’il donnait l’impression que la différence entre la valeur au 27 mars et la cible était très importante. En effet, sur le graphique, on voit une différence de 5 barres horizontales de hauteur sur une hauteur de 8 au total pour l’objectif gouvernemental (\frac{5}{8}=62,5\%)  alors qu’elle ne représentait qu’une différence de 15,1% (\frac{1,066M}{7,066M}=15,1\%).

Voyant que la chose semblait faire boule de neige, la chaîne de nouvelle s’est excusée et a publié un nouveau graphique qui représentait mieux la réalité. On peut voir le segment des excuses du présentateur au bas de cet article.

Le nouveau graphique. Source: J’ai pris l’image ici, mais le droit d’auteur doit appartenir à FOX News. J’utilise cette image pour des fins de critique ou éducationnelles tel que permis par la loi.

 

J’ai l’impression d’être un perroquet

Oui, pour qu’un message passe, il faut le répéter, encore et encore. C’est ce que je fais. Utiliser des graphiques avec des axes tronqués, C’EST (généralement) MAL. Le faire dans le but d’exagérer une tendance, c’est encore pire. Dans le cas actuel, assez de personnes se sont mobilisées pour refuser cet mauvaise représentation et, rendons ce qui est dû, FOX News a eu l’honnêteté de reconnaître son erreur et de la corriger.

Répétons le message tous en chœur: « Il ne faut pas utiliser d’axes tronqués. Il faut présenter les données objectivement et laisser le lecteur réfléchir. Il faut refuser les représentations fautives et ne pas les accepter comme prémisses à des arguments ».

N’hésitez pas à partager plus bas vos commentaires ou d’autres graphiques un peu croches que vous pourriez rencontrer. Aussi, abonnez-vous à ce blog pour être avisé quand je publie des nouveaux billets. Pour ce faire, cliquez sur le bouton « Suivre » qui se trouve en bas à droite de la page et inscrivez votre adresse courriel!

Source

On peut lire la nouvelle originale ici (en anglais) et merci à Geneviève de l’avoir partagée avec moi.

Publicités

Une petite vite pour mes étudiants en communication

Certains étudiants de mes cours de méthodes quantitatives se destinent au domaine des communications et me demandent régulièrement pourquoi ils doivent suivre un cours de statistique. La réponse est bien simple: « Parce que, comme communicateur, vous serez amenés à transmettre des données chiffrées qui devront être compréhensibles pour le grand public. »

Voyons un exemple. Hier, je naviguais sur le site de nouvelles de Radio-Canada.ca et un titre a attiré mon attention : Choc démographique au Québec : pénurie de main-d’œuvre à l’horizon. Ce genre d’article est souvent intéressant puisqu’il présente plusieurs données statistiques qui peuvent être analysées. J’ai été très content de remarquer que ces données étaient présentées dans un graphique. J’ai été aussi vite déçu par la présentation de ce graphique.

Ce qu'il ne faut pas faire quand on est communicateur... (Inspiration: XKCD)
Ce qu’il ne faut pas faire quand on est communicateur…
(Inspiration: XKCD)

Allez le voir, il est au milieu de la page! J’aimerais le présenter ici mais ce n’est pas possible. Il faut noter que j’ai visité le site avec ma tablette ce qui ne permettait pas de voir les étiquettes attachées à chaque rectangle. J’avais donc un graphique sans aucune donnée. En le revisitant ce matin, j’ai réalisé qu’on pouvait obtenir les données en passant la souris sur le graphique. Le concepteur du site n’a pas pensé à la portabilité, mais ce n’est pas l’objet de ce blogue. Il faut surtout remarquer que le graphique n’est accompagné d’aucun axe ou information qui permet de comprendre l’ordre de grandeur des données seulement en le regardant. Sans ces indications, impossible de comprendre rapidement l’information présentée dans ce graphique. C’est mal…

Ainsi, la réponse à la questions de mes étudiants en communication se trouve là; même si on ne produit pas les tableaux et graphiques ou les données dans le cadre d’une étude en sciences humaines, nous devrons les présenter ou les interpréter pour leur donner un sens dans le cadre de nos activités professionnelles. Il est donc primordial d’avoir une formation de base dans le domaine statistique pour comprendre le monde qui nous entoure et qui devient de plus en plus rempli de nombres et de données. C’est d’ailleurs aussi vrai pour la plupart d’entre nous qui aspirons à comprendre le monde dans lequel nous vivons.

Retour au jeu : les réponses

Dans mon dernier billet, je vous proposais de jouer à un jeu en identifiant les erreurs dans le graphique suivant. Rappelons-le, ce graphique a été utilisé lors de la campagne électorale d’un parti politique municipal pour parler de la dette de la ville de Québec. Tel que je le disais, l’objectif n’est pas ici de discourir sur la dette de la ville ou de prendre parti dans l’enjeu. L’essentiel, c’est de démontrer qu’il faut être alerte lorsqu’on nous présente des données pour identifier les sources d’informations qui sont utiles pour former un jugement et celles qui devraient être ignorées. Ce graphique fait clairement partie de la deuxième catégorie.

Cette image a circulé beaucoup sur Facebook et dans les médias pendant la campagne électorale. Je ne sais pas elle a été préparée par qui mais je sais qu'elle a été présentée officiellement par un parti politique
Cette image a circulé beaucoup sur Facebook et dans les médias pendant la campagne électorale. Je ne sais pas par qui elle a été préparée mais je sais qu’elle a été présentée officiellement par un parti politique

Les réponses

1. L’axe vertical est tronqué, sans indication de ce fait. Ceci est problématique car ça peut induire le lecteur en erreur lorsqu’il jette un oeil au graphique. En effet, une augmentation de la dette de 1G$ (un milliard de dollars) à 1,2G$ donnera l’impression dans ce graphique d’un doublement de la dette par la différence de hauteur  (donc une augmentation de 100% de la dette) alors qu’elle n’a augmentée que de 20% ( \frac{1,2 -1,0}{1,0}=20\% ). Pour éviter ce problème, il aurait été mieux de faire commencer l’axe vertical à 0 ou, minimalement, d’indiquer une coupure d’axe.

2. Les données présentées au dessus de chaque bande ne sont pas consistantes dans leur grandeur. Dans le temps du maire Lalier et de la mairesse Boucher, on voit des nombres qui sont de l’ordre de 100M$ (représentés à une hauteur de 1G$ sur le graphique) alors que sous Labeaume, les nombres sont de l’ordre de 1G$. Donc, soit il s’agit d’une erreur d’écriture dans le graphique, soit il y a eu un changement majeur dans le calcul de la dette (qui rend inutile de présenter ces données dans un graphique), soit la dette a augmenté de 1G$ entre les mandats de Mme. Boucher et M. Labeaume. Dans tous les cas, il y a un problème avec les données.

3. La hauteur des bandes pour chaque année ne correspond pas aux graduations de l’axe vertical. Par exemple, en 2009, on lit au dessus de la bande une dette de 1,493 G$ alors que la hauteur de la bande est située bien en dessous de 1,4G$. C’est une erreur majeure qui brise la capacité à comparer les données en comparant les hauteurs des bandes. D’ailleurs, entre l’année 2010 et 2011 on voit une diminution dans la dette indiquée en nombre au-dessus de la bande et une augmentation dans la hauteur des bandes. Vous y comprenez quelque chose?

4. Les flèches qui montrent la progression sont un peu surprenantes. D’abord, si on se fie aux données et aux affirmations du graphique, il semble que sous Mme. Boucher, la dette a augmenté de 270 M$ alors que la flèche semble indiquer que la diminution continue jusqu’à son mandat. Aussi la flèche représentant le mandat de M.Labeaume semble indiquer une rapide augmentation jusqu’à la fin du mandat alors qu’on voit une stabilisation de la dette dans les dernières années. La flèche est donc trompeuse sur l’allure réelle de l’augmentation. D’ailleurs, je vous invite à faire vos recherches pour déterminer si M. Labeaume n’avait pas annoncé un tel comportement.

5. La source des données est, disons-le, minimale. Dans le monde d’aujourd’hui, presque toutes les données publiques sont disponibles dans un fichier publié sur Internet. Il faudrait au moins qu’on indique où trouver les données pour une vérification personnelle. Ceci est particulièrement important quand les données du graphiques paraissent louches…

6. Un ami à qui j’ai présenté le graphique m’a fait remarqué que les données du maire Labeaume ont été mises en rouge alors que celles des autres ont été mises dans des couleurs plus subtiles. Cela met l’emphase sur ces données. Ce n’est pas nécessairement une mauvaise chose mais ce n’est pas une présentation neutre des données invitant le lecteur à faire une analyse objective de celles-ci.

7. Sur le plan de ce qu’on dit généralement en classe de méthodes quantitatives, on ne voit pas de titre identifiant clairement les données présentées dans les axes. Le titre n’est pas des plus conformes aux normes.

Ce qu’il faut retenir

Ce graphique est un très mauvais graphique. Quand on veut inviter le citoyen à réfléchir sur des enjeux et à prendre position, il faut lui présenter les chiffres objectivement pour le laisser juger. On peut lui suggérer des interprétations des données et choisir celles qui font particulièrement l’affaire du message qu’on essaie de passer. Cependant, quand on lui présente des mauvais graphiques et qu’on l’invite à tirer des mauvaises conclusions, on fausse le débat.

À nouveau, je vous invite à être critique par rapport aux graphiques et tableaux qu’on vous présente et aux conclusions qu’on en tire. Si vous les jugez pertinents, tenez-en compte lors de la formation de votre jugement. Si vous ne les considérez pas pertinents, refusez de les utiliser pour débattre et soulignez-le à vos opposants. De cette façon, on assainira le débat public en le recentrant sur des arguments valables.

Aussi, prenons le temps de féliciter Félipe, Vincent et Élise qui ont bien travaillé pour trouver des erreurs dans le graphique. Bien sûr, n’hésitez pas à commenter les articles ou à poser des questions dans les commentaires pour faire vivre ce blogue. Soyez sûr que j’y répondrai.

Rectifions, pour le plaisir

Question de s’amuser un peu, j’aimerais vous inviter à regarder le graphique suivant et à le comparer avec celui qui fait l’objet de ce billet. Essentiellement, j’ai repris les données inscrites au-dessus des bandes du diagramme d’origine en supposant qu’elles étaient correctes et qu’il y avait eu un problème de virgules dans les valeurs pour le maire Lalier et la mairesse Boucher pour créer une nouvelle image plus fidèle et objective.

En gros, j’ai utilisé les données suivantes pour faire le graphique.

\begin{tabular}{|l|l|l|l|l|l|l|l|l|l|l|l|l|}  \hline  Ann\'ee & 2001 & 2002 & 2003 & 2004 & 2005 & 2006 & 2007 & 2008 & 2009 & 2010 & 2011 & 2012 \\ \hline  Dette & 952 & 955 & 934 & 925 & 906 & 880 & 1149,6 & 1257,0 & 1493,1 & 1522,0 & 1501,9 & 1565,2 \\ \hline  \end{tabular}

Voici le résultat.

Graphique dette

Il est indéniable que la dette a effectivement augmentée sous le maire Labeaume. Cependant, contrairement à ce que semble dire le premier graphique, cette augmentation n’est pas si impressionnante et, surtout, s’est relativement stabilisée au cours des dernières années. De plus, il est intéressant de se rappeler que madame Boucher est décédée au milieu de son mandat, en 2007 et que M. Labeaume a été élu pour la première fois en décembre 2007. Aussi, quelques recherches vous rappelleront que, pendant la campagne électorale qui l’a menée à la mairie de la ville en 2005, Mme. Boucher avait annoncé qu’elle allait augmenter la dette et avait été élue sur ce programme (source). Il est donc assez audacieux d’attribuer la dette de la ville pour l’année 2007 au maire actuel alors que celui-ci a été en poste pour exactement un mois cette année. J’ai donc corrigé le graphique en indiquant que l’année 2007 était attribuable à madame Boucher. Cela change aussi le constat à faire en regardant le graphique.

Reprise des activités: au jeu!

Les étudiants reviennent au travail, la session commence, il est temps de se remettre à l’écriture de ce blogue! Pour entreprendre la session, j’aimerais proposer un jeu. En espérant que vous n’hésiterez pas à y participer.

Mise en contexte

Les périodes électorales sont des moments charnière dans le déroulement de la vie publique. Pendant une période de temps plus ou moins longue (tout dépendant de l’enjeu et du niveau de gouvernement), les candidats feront appel aux électeurs pour qu’ils les appuient. Pour ce faire, ils utilisent toutes sortes de procédés pour convaincre leur destinataire de les préférer à leurs opposants. Ces stratégies peuvent s’appuyer sur les sentiments, les principes et toutes sortes d’autres choses. Cependant, la plupart du temps, on s’adresse à la raison de l’électeur en lui présentant des arguments justifiant la position du parti ou en démontant celle des candidats adverses. Quand on le fait, on fait souvent appel à des arguments qui tiennent du raisonnement mathématique, économique ou logique.

C’est aussi dans cette période que l’électeur doit faire preuve de logique, de raison et aussi d’émotion pour prendre une décision. Pour vous préparer pour les prochaines élections, j’aimerais vous proposer ce jeu visant à identifier les erreurs de présentation, les incongruités et les mauvaises interprétations qui apparaissent dans un graphique qui a circulé lors de la dernière campagne électorale à Québec. J’ai été particulièrement choqué par le fait que ce graphique ait été utilisé pour faire valoir un point et qu’on lui ait donné de la valeur intrinsèque en tant que démonstration alors qu’il s’agit d’un très mauvais graphique. Au-delà de cela, l’enjeu en est un qu’il convient de discuter avec de bons arguments, d’un côté comme de l’autre.

L’objectif ici n’est pas de vous faire adopter une position par rapport à l’enjeu qui est discuté dans le graphique. L’objectif fondamental est de vous faire réfléchir à l’importance de bien analyser les données qui nous sont présentées dans les médias et les débats public et de vous inviter à ne pas tenir compte des mauvais arguments lorsque vous vous préparez à faire un choix électoral.

Consignes

Observez le graphique suivant et essayez de déterminer un problème pouvant causer des erreurs d’interprétation. Une fois un problème identifié, inscrivez votre réponse dans la section des commentaires de cet article. Tous les aspects du graphique peuvent faire partie de la révision, sans se limiter aux évidences.

Dans mon billet de la semaine prochaine, je reviendrai sur les différentes réponses données, ajouterai les miennes et conclurai sur quelques conseils pour ceux qui veulent soutenir leur discours avec des graphiques et pour ceux qui doivent utiliser des graphiques pour se faire un avis.

Amusez-vous bien!

 

Cette image a circulé beaucoup sur Facebook et dans les médias pendant la campagne électorale. Je ne sais pas elle a été préparée par qui mais je sais qu'elle a été présentée officiellement par un parti politique
Cette image a circulé beaucoup sur Facebook et dans les médias pendant la campagne électorale. Je ne sais pas elle a été préparée par qui mais je sais qu’elle a été présentée officiellement par un parti politique. Je ne peux mettre le crédit photo et l’utilise à titre de critique uniquement.

Attention, ce billet contient une image graphique…

L’utilisation d’un graphique pour illustrer un phénomène est une pratique classique. Le graphique permet souvent de transmettre une grande quantité d’informations en un minimum d’espace et rend un texte plus vivant. Le graphique permet aussi de faire ressortir des tendances, de mettre l’accent sur des phénomènes particuliers. La schématisation des données est élément essentiel dans la publication scientifique et permet aux rédacteurs d’articles scientifique et d’actualité de présenter de façon intéressante le résultat de leurs recherches.

C’est d’ailleurs ce qu’a fait le Journal de Québec dans son édition du 11 novembre dernier. En effet, dans un dossier titré «Des Québécoises forcées de se faire avorter au É.-U» occupant les pages 4 et 5 du journal, on nous explique que des patientes québécoises désirant se faire avorter doivent se rendre aux États-Unis parce que leur grossesse est si avancée que les médecins québécois refusent d’en faire l’interruption. Sans faire la critique de cette situation, observons les chiffres présentés dans l’article. Consigne: en quelques coups d’œil, résumez dans votre tête le contenu des deux graphiques suivant.

Sans titre
Étudions le graphique suivant présenté dans l’article.

Je parie que vous en avez retenu que le nombre d’avortements pratiqués aux États-Unis a largement augmenté et le nombre d’avortements pratiqués au Québec a largement chuté dans les dernières années. C’est tout à fait normal, c’est effectivement l’impression que donne ce graphique. Mais, au-delà de l’impression, que disent vraiment ces graphiques? Approfondissons.

Prenons d’abord le deuxième graphique. Il est mauvais mais vraiment moins mauvais que le premier (que nous nous garderons pour le dessert). Dans ce deuxième graphique, on voit la variation du nombre avortements faits entre 2008 et 2011. Le problème fondamental du graphique vient du fait que l’axe vertical n’est pas identifié et est coupé. Mettons les choses au clair : il ne faut jamais présenter un graphique chronologique (présentant des données qui varient dans le temps) sans axe vertical identifiant les valeurs et il très peu recommandé d’en couper les axes.

Ne pas respecter cette dernière consigne peut rendre la variation relative de la hauteur des bandes trompeuse. Par exemple, comparez visuellement la deuxième et la troisième barre du graphique : la première est deux fois plus grande que la seconde, ce qui semble indiquer qu’il y a eu deux fois moins d’avortements en 2010 par rapport à 2009. Or, quand on fait le calcul, on se rend compte qu’il y a eu une baisse de seulement 1,4% entre les deux années (\frac{26497-26197}{26497}=-0,014=-1,4\% ).

Le graphique montre une modification drastique due à son axe tronqué alors qu’en réalité la tendance est presque négligeable. En fait, la bonne interprétation que vous devriez tirer de ces chiffres est que le nombre d’avortements est relativement stable au Québec, interprétation qui n’est pas du tout évidente au premier coup d’œil (sans regarder les chiffres).

Maintenant, observons le premier graphique. Disons-le clairement, si un étudiant me présentait un tel graphique, il entendrait parler de moi longtemps (et c’est publié dans un journal sérieux…) Depuis au moins l’Antiquité, toutes les langues dérivées du grec et du latin se lisent et s’écrivent de gauche à droite. Demandez à un enfant de vous dessiner une ligne des nombres ou une frise historique et il tracera une flèche dont l’origine est à gauche et l’extrémité fléchée est à droite. La personne qui a conçu ce graphique a choisi de défier cette convention presque universelle. Si je supposais la mauvaise fois des gens, je dirais que ce graphique a été conçu pour nous tromper. En renversant la présentation, on fait dire exactement le contraire de ce que disent les données.

Si vous êtes comme moi, en regardant rapidement ce graphique, vous vous êtes dit: «Oh la la, le nombre d’avortements faits aux États-Unis a beaucoup augmenté dernièrement!» Vous avez fait cette analyse parce que vous avez regardé les nombres d’interruptions de grossesse de gauche à droite, comme pour tous les graphiques qui vous sont présentés dans la vie (même le deuxième graphique de notre exemple!). Or, la réalité est toute autre en fait. Le nombre d’avortements pratiqués aux États-Unis a beaucoup diminué, de 69% plus précisément (\frac{12-42}{42}=-69\% ). Difficile de ne pas penser que cette présentation a été faite pour donner l’impression que le phénomène s’aggrave, justifiant de s’en indigner dans un article. Dans les faits, si les chiffres sont corrects, la tendance est totalement inverse et on peut penser que la situation pourrait se régler d’elle-même.

De façon plus générale, on peut aussi mettre en perspective les chiffres présentés dans l’article. En 2011, 26 248 avortements ont eu lieu. De ce nombre, environ une vingtaine ont dû être effectués du côté américain parce qu’ils ont été refusés au Québec. On parle donc de moins de 1 avortement sur 1000 qui doit être fait à l’étranger. Est-ce une situation alarmante? Assez pour justifier un article aussi noir? Je ne le crois pas, surtout considérant que la tendance est à la baisse depuis 4 ans.

Présenter des données dans un graphique est une chose très positive lorsque cela est bien fait. Cependant, lorsqu’on le fait mal, on peut induire ses lecteurs en erreur en présentant un vision erronée. Comme rédacteur, il faut faire attention d’illustrer ses textes au moyen de graphiques bien construits, facilitant la lecture et présentant l’information de façon juste. Comme lecteur, je vous invite à toujours porter un regard critique sur les données illustrées, particulièrement dans le cas où un axe est absent ou tronqué. Cette vigilance vous sauvera probablement régulièrement d’être enfirouapé par un graphique trompeur.

La semaine prochaine, je compléterai la formation sur le test du khi-carré avec un exemple tiré de l’actualité.