L’évaluation des élèves et les effets secondaires des stéréotypes. Intervention d’André Tricot à l’université d’automne du SNUipp (ToutEduc)

23 octobre 2019

Évaluation : seule la multiplication des tâches peut donner une idée approximative du niveau des élèves (André Tricot, université d’automne du SNUIPP)

Évaluation "non intrusive" et en limitant les notes, comme cela se fait notamment en maternelle où est privilégiée l’observation, multiplication des tâches et des modalités d’évaluations, faire en sorte que celles-ci soient rapportées à des objectifs, faire systématiquement du feedbak, utiliser cette évaluation avant tout "comme moteur de progrès et de motivation" pour les élèves... Ce n’est non pas une, mais un ensemble de modalités d’évaluation qu’encourage à mettre en œuvre en classe André Tricot, professeur de psychologie cognitive, spécialiste des apprentissages, de l’université Paul Valéry de Montpellier. Le chercheur intervenait sur le thème de l’évaluation des productions des élèves dans le cadre de l’université d’automne du SNUIPP, qui s’est tenue du 18 au 20 octobre 2019 à Port-Leucate. Pour André Tricot, qui a appuyé sa présentation sur divers travaux menés dans le monde, multiplier les formes et privilégier l’observation permettraient notamment de déjouer, ou au moins de limiter certains effets secondaires de l’évaluation qui peuvent en modifier les résultats chez les élèves (perte de confiance en soi, poids des stéréotypes...)... et chez les évaluateurs (influencés également). Si le chercheur a pu donner des pistes visant à mettre en place une évaluation efficace pour l’apprentissage des élèves, il invitait avant tout "à la prudence" et "à bien connaître les biais" de ces évaluations.

Ce "plaidoyer" pour faire coexister plusieurs formes d’évaluations se fonde sur un premier constat : une évaluation ne permet pas d’évaluer la maîtrise d’une compétence, mais seulement un fait, une performance à un moment précis. "On ne sait évaluer que ce qu’ils font ou ne font pas, non ce qu’ils maîtrisent ou sont", explique le chercheur qui utilise l’exemple du sportif qui va réaliser une performance à un moment précis mais dont la performance ne dit rien sur ce qu’il est. En illustrant ces propos par des exemples, mais aussi par des exercices que ne réussiront pas tous les participants, il démontre que passer de la performance à la maîtrise, c’est-à-dire "être capable de mettre en œuvre une compétence dans 100 % des situations, même lorsque celle-ci est précise, est extrêment compliqué". Comme appliquer la marque du pluriel dans l’accord sujet-verbe. Compétence qui pourra s’affirmer ou non selon la tâche (dictée, rédaction...), ou encore selon des exceptions (accord avec le verbe avoir...). Des exercices qui montrent que ce n’est pas parce que l’on ne résout pas un problème - donc que l’on ne réussit pas la performance à un moment donné - que l’on n’a pas la compétence.

Les pistes données par le chercheur se fondent quant à elles sur divers travaux de recherche. Des mega-analyses - dont on ne doit pas faire des dogmes néanmoins, surtout dès lors que les valeurs sont inférieures à 0,5, prévient le chercheur - ont par exemple identifié le feedback comme le facteur qui influe le plus dans les progrès, alors qu’a contrario, récompenses (y compris extrinsèques) et punitions comptent parmi les facteurs les moins efficaces. Ce retour doit être "cohérent, informatif", précise le chercheur. "Il faut être capable de dire : voilà ce que tu as fait, voilà en quoi cela correspond ou pas aux attendus, pourquoi et comment faire pour que ça se passe mieux."

Les évaluations ont des effets secondaires qui peuvent modifier les résultats

Rapporter ces évaluations à un objectif, mais aussi y associer des supports vidéo, audio, informatique, contribuent également à améliorer l’apprentissage, dès lors que ces derniers intègrent également le "retour informatif". Ces supports offrent l’avantage "de pouvoir multiplier les évaluations en s’évitant les corrections" - "évidemment seulement dans des domaines simples", nuance encore André Tricot -, de donner un retour immédiat à l’enseignant, et permettent "d’atténuer la menace" car les élèves ont tendance à oublier que "derrière, il y a un humain".

La "menace", en effet, compte parmi les "effets secondaires" de ces évaluations, que des travaux ont également mis en avant et qui justifient aussi les pistes proposées par le chercheur : ce sont les effets dus à la peur de l’évaluation ou encore au poids de stéréotypes de genre, ceux induits par le racisme, etc. En 1995, alors que les classements des "plus performants" plaçaient en tête les asiatiques, suivis des blancs, puis des noirs, un universitaire de Stanford, établissement qui compte beaucoup de noirs de très haut niveau, s’est interrogé sur ces résultats et a été à l’origine d’une première expérience qui a permis de vérifier les effets des stéréotypes et d’une surcharge cognitive sur des résultats. Il a soumis 14 problèmes, conçus pour être impossibles à résoudre dans le temps imparti, mais en livrant à des groupes distincts des enjeux différents : à l’un que le test était destiné à mesurer l’intelligence, à l’autre qu’il y avait juste des problèmes à résoudre. Dans le premier cas de figure, les étudiants noirs se sont révélés moins performants que les blancs alors que dans le deuxième cas, ne s’observaient plus "de différences significatives". Les entretiens qui ont suivi ont permis d’expliquer cet effet, important, puisqu’il était du "du simple au double" : face au premier enjeu, quand les étudiants noirs ont compris qu’ils ne termineraient pas, ils se sont focalisés sur ce que l’on allait penser d’eux, les conclusions racistes auxquelles ils risquaient d’être exposés. Or, c’est parce qu’ils ont mobilisé des ressources cognitives pour gérer la menace du stéréotype, que celles-ci n’ont pu être utilisées pour résoudre les problèmes.

Il est possible de désactiver des stéréotypes qui peuvent biaiser l’évaluation

Les mêmes types d’effets ont pu être observés également avec les femmes, ceux des stéréotypes de genre, ou encore avec les élèves considérés comme faibles à l’école qui, eux, subissent "l’effet de désengagement". Plusieurs expériences ont ainsi montré que, pour une même épreuve de résolution d’une figure complexe, selon si elle est présentée comme une épreuve de dessin ou une épreuve de géométrie, les résultats sont nettement différents : entre filles et garçons, entre bons et moins bons, le mot géométrie ayant un impact négatif sur les résultats pour les filles et les moins bons, alors qu’à l’inverse celui d’arts plastiques ramenait leurs résultats au même niveau que les autres. Une vidéo a de la même manière illustré "l’expérience de l’impuissance apprivoisée" : dans une même classe, des élèves à qui avaient été donnés sans qu’ils le sachent deux anagrammes insolubles sur trois, ne résolvaient pas le troisième, pourtant soluble, face à l’autre partie de la classe qui avait réussi les deux premiers problèmes donnés (eux, solubles) et avait confirmé leur succès en levant la main devant les autres, et n’ont eu ensuite aucun problème à résoudre le dernier.

Des travaux menés par Isabelle Régner (Aix-Marseille Université) ont néanmoins montré que des stéréotypes pouvaient "être désactivés". Dans des contextes de non-mixité ou en isolant chaque élève, on ne perçoit plus de différences entre les résultats entre filles et garçons, mais aussi leurs perceptions de meilleurs dans certaines disciplines. Pas question pour autant d’interpréter ces résultats en plaidant pour la non-mixité, prévient le chercheur, ces travaux montrent seulement que ces stéréotypes peuvent être "désactivés, par des petites astuces, temporairement".

Pas si simple d’enlever les "menaces" car il faut que les élèves connaissent l’enjeu de la tâche

De la même manière, on peut produire un modèle de résultats inverse, notamment chez les plus faibles, selon si on évalue l’orthographe dans un contexte de dictée ou en invitant à une prise de notes d’une leçon donnée oralement, le premier contexte se traduisant par un augmentation du nombre d’erreurs. Pour autant, avertit André Tricot, il n’est "pas si simple d’enlever les menaces qui permettent d’éliminer ces biais" car les élèves doivent savoir aussi ce que l’on veut "vérifier" dans la tâche qui leur est donnée.

C’est néanmoins l’ensemble des connaissances produites à ce jour qui font conclure au chercheur que c’est seulement avec "la multiplication des tâches et des modalités de présentation que l’on peut avoir une idée approximative du niveau des élèves". Cette multiplication des formes d’évaluation permet dès lors de prendre en compte le fait que "l’évaluation, comme pratique quotidienne dans la classe, contribue de manière majeure aux apprentissages" à condition qu’il y ait des retours, mais aussi que celle-ci, quand elle est "subie", "active des croyances sur soi, sur les tâches, à propos des croyances d’autrui". La multiplication se justifie d’autant plus, poursuit-il, qu’aujourd’hui "on ne ne sait pas construire des évaluations qui servent des finalités différentes" : valider une compétence, dépister les difficultés, sanctionner, évaluer l’établissement, le système, le dispositif, aider à apprendre, motiver, prendre conscience et réguler son apprentissage...

Camille Pons

Extrait de touteduc.fr du 22.10.19

En haut de la page la sous-rubrique Evaluation (Gén.) et ci-dessous ses 10 récents articles
On peut croiser l’un des mots-clés de la colonne de gauche avec d’autres - Voir l’aide
Rechercher sur le mot tricot

Rubriques

Mots-clés

L’évaluation des élèves et les effets secondaires des stéréotypes. Intervention d’André Tricot à l’université d’automne du SNUipp (ToutEduc)

Répondre à cet article

Dans la même rubrique