Utilisation de la loi normale – Classe inversée

Dans le cadre du cours de méthodes quantitatives, les étudiants sont invités à découvrir comment faire des calculs avec la table de la loi normale par eux-mêmes dans le confort de leur foyer, à la manière de la classe inversée.

Ici, vous trouverez une série de six vidéos qui présenteront comment utiliser la loi normale dans le contexte du cours de méthodes quantitatives. Chaque capsule présentera un cas particulier d’utilisation de la loi normale. Après chacune des capsules, une série d’exercices sera proposée en lien avec le contenu de la capsule. À la fin, une série d’exercices mélangés viendra consolider les acquis. Suite au visionnement des vidéos, un atelier sera fait en classe pour s’assurer que chaque étudiant a bien compris les notions.

Voici la liste des capsules. Sur chaque page, vous trouverez une fenêtre d’écoute de la capsule, un lien vers la série d’exercice idoine et des liens vers les capsules précédentes et suivantes.

 

Tous les exercices et capsules liés à cette page sont publiés sous licence libre et peuvent être utilisés dans d’autres cours. Si vous comptez le faire, je serais heureux de le savoir en recevant un courriel ici

Publicités

Créativité versus lisibilité

Présenter des données dans un graphique est un art. Chez le présentateur, il existe souvent une tentation d’être créatif et d’illustrer les informations d’une manière inattendue ou nouvelle. On espère de cette manière intéresser le lecteur et lui donner envie d’explorer le résultat de son travail.

Quand cela est réussi, le lecteur en ressort gagnant: il a compris rapidement une grande masse d’informations dans un format nouveau qui a créé l’étincelle suffisante pour lui faire apprécier ce travail.

Un exemple de créativité intéressant

Le «meilleur graphique de tous les temps» selon certains. Cliquez sur l’image pour en voir les multiples détails. Auteur: Charles Minard (domaine public) (source)

Prenons pour exemple l’image ci-dessus, qui est appelée par certains «le meilleur graphique de tous les temps». Il s’agit d’une représentation fort créative d’une très grande quantité de données expliquant la campagne désastreuse de Napoléon 1er en Russie. On y voit en beige la marche de l’armée vers Moscou sur la carte de l’Europe. La taille de la colonne est proportionnelle à la taille de l’armée et se réduit au fur et à mesure des pertes humaines et des batailles.

À Moscou, Napoléon a subi la défaite et dut rebrousser chemin vers la France. La bande noire illustre cette retraite dans l’espace, la réduction de la largeur étant encore proportionnelle à la taille de l’armée à ce moment. Un autre facteur important dans l’échec de cette offensive fut la rigueur extrême de l’hiver qu’ont vécu les soldats lors de leur retour. Le bas du graphique montre la chute de la température extérieure au fur et à mesure du retour vers l’Empire français. On peut donc voir sur cette représentation visuelle plusieurs variables illustrées de belle façon (la position géographique en deux dimensions, la taille de l’armée à chaque moment et la température extérieure). C’est une utilisation intelligente et créative d’une représentation graphique. Vous pouvez en apprendre plus sur ce graphique particulier en écoutant les explications d’un mathématicien dans ce vidéo (en anglais) sur Youtube.

Un autre exemple à étudier

J’aimerais maintenant vous proposer un exercice de lecture de graphique. Dans le vidéo qui suit, regardez le diagramme présenté et consignez par écrit vos impressions quant aux données qui y sont présentées.

L’objectif est de vous laisser seulement quelques secondes pour aller chercher les informations essentielles du graphique, les points tournants et les grandes tendances qu’on peut en tirer puis que vous les inscriviez sur une feuille. Comme la lecture d’informations visuelles dans les médias est généralement faite rapidement, sans aller en profondeur, le vidéo vous présentera le graphique pendant quelques secondes. Faites jouer le vidéo une seule fois avant d’écrire vos conclusions et continuez ensuite votre lecture de cet article pour vérifier votre analyse. Si vous en avez envie, partagez avec tout le monde ce que vous avez inscrit sur votre papier dans les commentaires de l’article, tout en bas de la présente page.

Un contre-exemple illustrant les dérives possibles

Analysons maintenant le résultat de votre observation en faisant ressortir les informations essentielles du tracé que vous avez regardé. On verra qu’inversement à l’exemple du «meilleur graphique jamais produit», pécher par excès de créativité amène parfois ceux qui présentent des données à aller à l’encontre des différentes conventions qui permettent au lecteur de bien saisir les informations.

Dans le premier graphique, la première lecture donne l'impression que le nombre d'avortements va en croissant dû à l'inversement de l'axe horizontal. J'ai déjà traité cet exemple dans un billet précédent.
Dans le premier graphique, la première lecture donne l’impression que le nombre d’avortements va en croissant dû à l’inversement de l’axe horizontal. J’ai déjà traité cet exemple dans un billet précédent.

J’ai déjà rappelé dans un billet précédent que la lecture de tous les graphiques se fait de gauche vers la droite pour la variable de l’axe horizontal. Ainsi, si on présente le temps comme variable indépendante (qui est généralement présentée sur l’axe horizontal), on mettra la période de temps la proche du début des temps (peu importe où vous le fixez) complètement à gauche et, au fur et à mesure qu’on se déplacera vers la droite, on se rapprochera de la valeur la plus éloignée du début des temps. C’est une convention sociale valable dans la plupart des pays dans lesquels la langue principale se lit de gauche à droite. C’est assurément le cas en Amérique et en Europe. Ainsi, dans une publication s’adressant à des lecteurs de cette partie du monde, on présentera les données dans l’ordre croissant en partant de la gauche vers la droite. Aller à l’encontre de cette convention peut entraîner une mauvaise compréhension des données. Pire encore, cela peut carrément induire le lecteur en erreur et le tromper dans son analyse. Dans l’exemple qu’on peut voir à droite, j’avais attribué cette erreur à une volonté de mal faire.

Dans l’exemple que vous venez de voir, il existe aussi une erreur de ce type. Cependant, elle ne se trouve pas sur l’axe horizontal, mais bien sur l’axe vertical. En effet, il semble que la personne qui fait le graphique a choisi d’exprimer sa créativité en mettant l’axe horizontal au-dessus du graphique avec les valeurs sur l’axe augmentant au fur et mesure qu’on s’éloigne vers le bas. Ce choix est assez difficile à comprendre… En allant à l’encontre de la convention disant que l’axe vertical pointe généralement vers le haut, le créateur du graphique rend difficile la lecture de l’information importante du graphique.

À la lumière de ce qui vient d’être dit, je vous invite à retourner lire ce que vous avez écrit suite au visionnement du vidéo. Les points sautant aux yeux, lors d’une première lecture rapide sont les suivants:

  • La ligne va vers le haut à partir de 1990 jusqu’en 2000;
  • Elle se stabilise entre 2000 et 2005;
  • Une nouvelle loi est introduite en 2005 (ce point est mis en valeur par du texte dans le graphique);
  • La ligne s’est mise à descendre pour prendre une hauteur bien au dessous de ce qui avait existé au début des années deux mille

Devant ces observations, vous avez sûrement conclu que le nombre de meurtres avait tranquillement augmenté jusqu’à l’introduction  de la nouvelle loi puis était redescendu à un niveau plus bas. Rien n’est plus faux. Comme l’axe vertical est inversé, on devrait plutôt conclure tout l’inverse:

  • Entre 1990 et 2005, le nombre de morts dû aux armes à feu a diminué pour se stabiliser autour de 500 par année;
  • En 2005, la nouvelle loi a introduit la possibilité d’utiliser la force pour défendre sa position lorsqu’on fait face à un acte criminel ou que sa sécurité est menacée. Cette loi permet donc au citoyen ordinaire d’utiliser la force pour intervenir lorsqu’une personne est en train de commettre un acte criminel ou de mettre en danger dudit citoyen (législation du type « stand your ground« ). Dans la plupart des législations, le citoyen ordinaire a l’obligation de tenter de fuir le danger et contacter les autorités compétentes si possible avant d’utiliser la force pour se défendre (législation du type « duty to retreat« );
  • Cette mesure semble avoir été la cause d’une augmentation du nombre de décès liés aux armes à feu (du moins, ce nombre a augmenté drastiquement après l’introduction de la loi).

Observez à nouveau le graphique à la lumière de cette nouvelle information.

florida gun deaths
Un nouveau regard sur le graphique changera probablement votre analyse. Source: Buisness Insider (C’est à cet endroit qu’on trouve une analyse du graphique. Tel qu’indiqué, il semble qu’il ait été fait par un certain C. Chan pour le compte de l’agence de presse Reuters)

À mon avis, cette erreur est due à un excès de créativité plus qu’à une volonté réelle de tromper puisqu’un article dans lequel cette image est présentée propose une analyse juste et sensée des données. Ainsi, on ne tente pas de manipuler les données pour dire autre chose que ce qu’on peut observer dans le graphique lorsqu’on le lit correctement. Note amusante, le site a tout de même pris la peine de présenter une nouvelle version du graphique avec l’axe horizontal dans l’autre sens, indiquant ainsi qu’ils avaient probablement réalisé que la présentation pouvait influencer la compréhension des lecteurs. D’ailleurs, après une observation plus profonde, on peut s’imaginer que le fameux C. Chan, créateur du graphique, avait choisi les couleurs dans le graphique sciemment. Maintenant qu’on a l’information cruciale sur l’axe vertical, le choix de la couleur rouge pour la zone au-dessus de la ligne brisée paraît plus logique. Ce rouge est donc associé à la section représentant le nombre de morts.

Que peut-on retirer de cet exercice? En gros, que la créativité est une bonne chose et que l’innovation permet parfois de rendre plus facile, captivante ou efficace la transmission d’informations. Cependant, dans certaines situations, l’excès de créativité et la contravention aux conventions sociales peut avoir comme conséquence de rendre problématique l’acte de partage de la connaissance et même peut entraîner des erreurs chez la personne qui interprète les données. Il faut donc s’assurer, lorsqu’on crée une infographie, que le lecteur pourra correctement aller à l’essentiel ce qu’on veut lui apprendre. Pour ce faire, il faut revisiter son travail, une fois complété, avec les yeux du profane. Aller à l’encontre des conventions sociales est un pari risqué. Jouez-y avec prudence.

Merci à Jean-Sébastien Turcotte de m’avoir transmis l’image des morts par arme à feu floridiennes.

Sur l’importance de bien choisir sa question

René Lévesque a souvent reçu des critiques sur la formulation de la question référendaire de 1980. Il pourrait certainement témoigner de l’importance de bien choisir sa question… Image : Bouchcl, CC BY-SA 3.0.

En 2009-2010, le gouvernement libéral de Jean Charest était en pleine négrociation de la nouvelle convention collective avec l’ensemble des employés de la fonction publique québécoise. La négociation était à son plus fort et les forces cherchaient des arguments pour justifier leurs demandes et leur position.

Comme le gouvernement provincial est financé par les contribuables québécois, il pouvait être intéressant de savoir quelle était la positions de ceux-ci sur les négociations. Advenant le cas que les syndicats recevaient un fort appui de la population, il aurait été difficile de maintenir la ligne dure pour en venir à une entente avantageuse pour le gouvernement. Inversement, si la population était fortement derrière le gouvernement, il aurait pu se fier sur cet appui pour imposer une convention collective austère, tel qu’il le souhaitait.

C’est dans ce contexte que l’Institut économique de Montréal et Léger Marketing ont publié un sondage fait auprès de 1000 Québécois sur les négociation entre le secteur public et le gouvernement (consulter en ligne : http://www.iedm.org/files/sondage0310_fr_0.pdf ). Sorti le 3 mars 2010, ce rapport de sondage faisait état des résultats de trois questions. On peut lire la méthodologie du sondage dans la seconde page du rapport. On y apprend entre autre qu’il ne s’agit pas d’un sondage probabiliste et qu’il a été mené auprès d’internautes. Dans un autre billet, je pourrai revenir sur la notion de sondage probabiliste.

Ce sur quoi je voudrais attirer votre attention c’est plutôt les conclusions du rapport et les questions sur lesquelles ces affirmations sont basées. En titre de la page consacrée à la première question du sondage, on lit:

La grande majorité des Québécois soutiennent la position du gouvernement Charest dans les négociations avec les syndicats des employés de la fonction publique.

L’affirmation est forte et il convient d’étudier les bases de cette conclusion. Voici la question qui a été posée au internautes pour en arriver à dire que le gouvernement recevait l’appui de 7 Québécois sur 10.

Dans ses négociations avec les syndicats des employés de la fonction publique, le gouvernement Charest devrait-il:

a) accepter intégralement les demandes syndicales (dont une augmentation salariale de 11,25% sur 3 ans), et augmenter les impôts afin de financer ces demandes comme le suggère la CSN ?

b) exiger que les augmentations octroyées soient liées à des gains de productivité des fonctionnaires et à une diminution générale des coûts de fonctionnement du gouvernement ?

c) Ne sait pas.

Hmmm… Je l’avoue, je suis moi-même membre de la fonction publique et, devant cette question, j’ai de la difficulté à choisir raisonnablement la première option plutôt que la seconde. Donc, imaginez le contribuable moyen devant cette question.

Quand on veut savoir l’opinion d’une population sur une question, il faut absolument choisir une formulation la plus neutre possible qui permet au sondé d’exprimer réellement son opinion. Ici, aucun payeur de taxe ne choisira l’option qui aura un effet sur les impôts qu’il paiera. De plus, comment peut-on être contre la vertu qui est présentée dans la deuxième réponse proposée? Comment peut-on refuser qu’une augmentation de salaire des fonctionnaires se traduise par une diminution générale des coût de fonctionnement du gouvernement? Cette question et ces réponses sont tellement réductrices de l’enjeu qu’il n’est pas possible pour le répondant de choisir correctement et la formulation des questions lui indique clairement qu’il devrait choisir la seconde option.

Aussi, il faut que l’ensemble des positions possibles soient proposées dans les choix de réponses d’une question de sondage. Dans le cas qui nous intéresse ici, il n’y a aucune solution mitoyenne proposée. Pour que les choix de réponse soient un peu plus exhaustifs par rapport aux retours possibles. Le sondé qui voudrait répondre quelque chose comme « augmenter un peu le salaire des employés de l’État sans que cela ait un effet sur les impôts des contribuables » ou « trouver une solution qui conviendrait aux deux parties » n’ont aucune catégorie qui leur convient réellement.

Finalement, ces choix de réponse sont en fait ce qu’on appelle un faux dilemme. Aucun des acteurs de la négociation ne souhaitait réellement les résultats nommés par les options qui sont présentées. Les syndicats demandaient une augmentation de leur salaire, le gouvernement souhaitait limiter le plus possible cette augmentation. La partie syndicale ne peut garantir que l’augmentation du salaire de ses membres mènera à une augmentation de la productivité et ne s’opposerait certainement pas à ce que cela se réalise. Inversement, le gouvernement peut accepter une augmentation du salaire de ses employés sans avoir à augmenter les impôts. Il pourrait réduire les dépenses en coupant dans ses programmes pour atteindre ce résultat. Ainsi, les résultats énoncés avec chacune des positions ne sont pas liés avec le choix de solution qui les précèdent.

Au-delà des considérations sur la formulation de la question, la conclusion tirée de l’étude statistique des réponses est assez outrageuse. Avec une question aussi biaisée, il est assez audacieux d’en tirer qu’une majorité des Québécois supportent le gouvernement. Le processus est équivalent, à mon sens, à poser la question « Que préférez-vous : le brocoli ou le gâteau au chocolat? » et d’en tirer la conclusion que les Québécois préfèrent les aliments gras et sucrés par rapport aux légumes. C’est une conclusion sans intérêt qui généralise beaucoup trop la réalité décrite par la question et ses résultats.

Il faut donc réfléchir à une question plus neutre qui permettrait de savoir réellement l’opinion de la population québécoise. Dans le contexte, il est vrai que cela est difficile à faire puisque l’enjeu tient plus de l’idéologie que d’une lecture raisonnée des enjeux de la négociation. Il serait très difficile de mettre en contexte la position de chaque partie de la négociation sans en caricaturer un peu la teneur et revenir à une question qui dirait « Augmenter les salaires des fonctionnaires ou pas? ». La longueur de la question serait aussi problématique à limiter puisqu’il faudrait expliquer de façon neutre la position des deux parties. Simplement, on aurait tout de même pu poser la question suivante:

À la lumière de ce que vous savez sur la négociation qui a lieu entre les syndicats de la fonction publique et le gouvernement, quelle partie obtient votre support?

a) Le gouvernement;

b) la partie syndicale;

c) ne sait pas.

Cette question aurait au moins l’avantage de ne pas orienter la réponse des répondants et permettrait d’affirmer de quel côté va le support des Québécois. Cependant, elle risquerait probablement de recevoir un fort taux de réponses « ne sait pas » puisqu’une infime partie des personnes sondées sont réellement au courant des positions des deux parties.

Bref, la question qui a été posée était biaisée et ne permettait pas de tirer la conclusion qui est énoncée. De plus, il faut savoir que les journaux rapportent généralement les conclusions d’un sondage et non pas les questions et le réponses obtenues dans l’étude. Il est donc très important d’aller consulter les sources des conclusions pour pouvoir poser un regard critique efficace sur ces affirmations. De plus, il est absolument nécessaire de se questionner sur les méthodologies qui ont été utilisées pour réaliser le sondage. Dans un autre billet, j’expliquerai pourquoi, dans ce cas précis et dans bien d’autres cas, il faudrait remettre encore plus en doute les résultats du sondage à cause de la méthodologie utilisée.

Malheureusement, cette publication sera la dernière avant le temps des fêtes. C’est avec plaisir que je reprendrai l’écriture au début de la prochaine session. Sans vous faire de promesses, j’aimerais continuer à expliquer les principaux principes de méthodes quantitatives à l’aide d’exemples concrets. J’explorerai aussi la possibilité de faire des entrevues avec des acteurs du milieu qui nous expliqueront la place des méthodes quantitatives dans leur pratique. Peut-être verrons-nous aussi la publication de billets écrits par des collègues ou de mes étudiants. D’ici là, n’hésitez pas à me faire parvenir vos idées et vos commentaires pour améliorer ce blog. Au plaisir de vous voir en janvier!