Évaluations au niveau du système

Mis à jour le 29 mar 18
FICHE 4

Les évaluations au niveau du système peuvent améliorer l’apprentissage si elles sont conçues pour assurer validité, fiabilité et équité, et si les données sont utilisées pour éclairer un changement systémique.

Les évaluations sommatives réalisées aux niveaux régional, national et international peuvent servir deux objectifs principaux : certifier le niveau scolaire des élèves, et suivre et évaluer l’offre pédagogique et la qualité de l’éducation au niveau systémique. L’élaboration de systèmes d’évaluation globale doit tenir compte des différents objectifs de cette évaluation, ainsi que des principales propriétés du contenu, de la validité, de la fiabilité, de l’assurance qualité et de l’impact.

 

Aspects abordés et commentaires

Qu’est-ce que l’évaluation en matière de suivi des systèmes ? La plupart des systèmes éducatifs recueillent des informations sur l’apprentissage des élèves via des examens régionaux ou nationaux. Toutefois, ces examens sont généralement davantage destinés à la certification et à la sélection des élèves qu’au suivi de la qualité du système éducatif dans son ensemble. Les pays contrôlent de plus en plus la qualité de leur système éducatif via un programme indépendant de tests ou d’enquêtes portant sur des échantillons d’élèves à certains âges et niveaux. Ces évaluations n’ont pas pour but d’attribuer des notes ou d’adresser des commentaires aux élèves. Elles fournissent plutôt des résultats cumulés dont l’objectif est de mesurer les tendances dans le temps.

Parmi ces évaluations destinées au suivi systémique, citons les tests nationaux et régionaux portant sur des sujets spécifiques (par ex. le plan finnois d'évaluation de l'éducation 2012-2015) ; les évaluations réalisées dans les foyers par des citoyens (par ex. les évaluations de l'apprentissage de base menées en Inde, au Pakistan, au Kenya, en Tanzanie, en Ouganda, au Mali et au Sénégal) ; ou les tests scolaires internationaux tels que l’étude Tendances de l'enquête internationale sur les mathématiques et les sciences (TEIMS), le Programme international de recherche en lecture scolaire (PIRLS), le Programme international pour le suivi des acquis des élèves (PISA), les études réalisées par le Laboratoire latino-américain pour l'évaluation de la qualité de l'éducation  (LLECE), le Programme d'Analyse des Systèmes Éducatifs de la CONFEMEN (PASEC), le Consortium de l’Afrique australe et orientale pour le pilotage de la qualité dans l’éducation (SACMEQ) et l’initiative Métrique de l’apprentissage à l’école primaire – Asie du Sud-Est (SEA-PLM). Très différents les uns des autres, ces divers instruments d’évaluation ne représentent en général que peu d’enjeux pour les élèves et leurs écoles. En revanche, pour les gouvernements, les politiques et les responsables politiques, il s’avèrent capitaux et très coûteux. Ainsi, une connaissance approfondie des fonctions, des méthodes et des limitations de chaque type d’évaluation s’avère essentielle pour les planificateurs, dont les décisions reposent sur les résultats à ces tests.

Concevoir une évaluation globale à grande échelle pour assurer le suivi du système ? Pour ce qui est du choix du programme d’évaluation (programme existant ou création d’un programme), les planificateurs doivent se poser une série de questions clés. Les voici : Quel est l’objectif de l’évaluation et comment utilisera-t-on les résultats pour éclairer la pratique ? Quelle discipline (mathématiques, sciences, langue maternelle) ou quel apprentissage fondamental (lecture et écriture, calcul) doit être évalué ? À quelle étape l’évaluation doit-elle avoir lieu et dans quel but ? À quelle fréquence l’évaluation doit-elle être menée ? Quelles procédures de notation et d’administration et quels instruments standardisés doivent être utilisés ? Quels coûts doivent être pris en charge et par qui ? L’évaluation doit-elle porter sur l’ensemble de la population ou sur un échantillon représentatif ? Comment les données concernant le niveau des élèves dans les différentes écoles/régions seront-elles regroupées au niveau systémique ? Quelles autres informations relatives au contexte (ressources des établissements, caractéristiques familiales) doivent être recueillies pour l’analyse des résultats finaux ? Comment les résultats seront-ils analysés, partagés et utilisés ? S’il est impossible de répondre à toutes ces questions ici, il convient de garder à l’esprit quatre points fondamentaux dans tous les processus d’élaboration d’une évaluation : contenu, validité, fiabilité et assurance qualité.

  • Contenu : Le contenu d’une évaluation est déterminé par les aspects les plus importants de l’apprentissage et le niveau et les résultats que l’on attend des élèves. Une bonne compréhension des objectifs éducatifs et des résultats d’apprentissage clairement définis permettront d’identifier le type de tâche à inclure dans l’évaluation ou dans les dossiers de preuves.(6)(11)
  • Validité : La validité globale fait référence à la capacité d’une évaluation à mesurer exactement ce qu’elle se propose de mesurer. Les connaissances ne peuvent pas toutes être décomposées en tâches correspondant aux contraintes de temps et de processus des méthodes courantes d’évaluation globale. Dans l’idéal, les tâches d’évaluation doivent se compléter pour mesurer les connaissances relatives au contexte, aux applications, aux analyses et à la capabilité.(2)
  • Fiabilité : Une mesure fiable produit des résultats cohérents entre les éléments connexes dans le cadre du même test, entre différents cas d’administration de test, et entre les notes attribuées par les différents évaluateurs. La fiabilité d’un système d’évaluation globale repose sur la méthodologie utilisée pour l’échantillonnage des élèves, l’élaboration des instruments d’évaluation, les procédures d’administration et de notation, et les méthodes de collecte et d’analyse de données. La fiabilité implique également une grande cohérence de l’évaluation. Cette dernière doit également être comparable entre les candidats, avec un minimum de biais et d’erreurs de la part des évaluateurs.(11)
  • Assurance qualité : Dans les pays où corruption et népotisme politique continuent à gangréner le contexte social, la transparence et les procédures d’assurance qualité revêtent une importance capitale.(3) En général, plus l’évaluation sommative a de l’importance, plus le système d’assurance qualité doit être rigoureux et ce, grâce à des méthodes telles que la modération interscolaire au niveau de la notation, une double correction, des tests à correction automatique et l’utilisation d’un logiciel spécial pour analyser les résultats entre les cohortes, les écoles et les régions.(8)(16)

Impacts de l’évaluation globale : Aux niveaux national et régional, et au niveau des établissements, les données des évaluations sommatives constituent l’une des plus importantes sources d’information pour l’analyse des performances du système éducatif, le diagnostic des problèmes, les prévisions de tendances dans le temps, la détermination d’une intervention ciblée ou à l’échelle du système, la planification du renforcement des capacités au niveau institutionnel et la formation des enseignants, l’élaboration des programmes, les prévisions budgétaires et la distribution des ressources.(10) Dans de nombreux pays, les données d’évaluation permettent également de responsabiliser les écoles et les professeurs, et d’améliorer leurs performances.(9) Si l’impact sur les enseignants peut s’avérer positif, les motivant à travailler davantage et de façon plus efficace pour préparer l’ensemble de leurs élèves, cette pression peut également devenir néfaste pour l’apprentissage et l’enseignement en limitant notamment le contenu et les méthodes d’enseignement, et en minant le moral des enseignants.(12)(14)

Au niveau des élèves eux-mêmes, l’évaluation globale peut s’avérer constructive lorsque les tâches d’évaluation représentent les résultats d’apprentissage attendus et lorsque les commentaires relatifs aux résultats sont utilisés dans un but formateur (par ex. évaluation sommative + commentaires = évaluation formative).(15) Lorsque les élèves sont impliqués dans les processus d’évaluation, ils comprennent mieux les objectifs de l’apprentissage et sont mieux préparés, d’un point de vue cognitif, à progresser dans l’optique de ces résultats.(4)(5) Toutefois, avec un système éducatif nettement axé sur l’évaluation globale et sur la sélectivité, les élèves font montre d’une forte motivation extrinsèque pour les notes et le statut social, mais d’une faible motivation intrinsèque pour l’apprentissage à plus long terme.(2) En outre, le recours fréquent aux tests et aux examens à fort enjeu risque de favoriser la fraude aux examens et d’inciter les élèves à prolonger leur temps d’apprentissage en se tournant vers les cours particuliers.

 

Intégration et équité

Inégalité et injustice sociale : Les évaluations globales interagissent de façon complexe avec l’injustice, les inégalités, le dénuement au niveau social et autres formes de préjudice.(1) Les élèves défavorisés, qui affichent une faible estime d’eux-mêmes et très peu de confiance, ou qui manquent de motivation et d’engagement, peuvent se laisser démotiver par la pression des tests et des examens. En outre, un mauvais emploi des résultats recueillis par les médias et les politiques peut s’avérer dommageable, puisque renforçant des stéréotypes injustes et inexacts. Des modes d’évaluation sommative plus personnalisés peuvent bénéficier à de nombreux élèves défavorisés, notamment l’élaboration de projets et de dossiers, qui est susceptible de générer des niveaux d’engagement plus élevés.(1)(11)

 

Exemples de politique

  • Finnish [PDF]
  • Uganda [PDF]
  • Netherlands [PDF]
  • SEAMEO Region [PDF]
References and sources
  1. Beets P. and van Louw, T. (2011) Social justice implications of South African school assessment practices, Africa Education Review, 8(2): 302-317
  2. Boud, D. (2000) Sustainable Assessment: Rethinking Assessment for the Learning Society, Studies in Continuing Education, 22:2, 151-167
  3. Bethell , G. and Zabulionis, A. (2012) The evolution of high-stakes testing at the school–university interface in the former republics of the USSR, Assessment in Education: Principles, Policy & Practice, 19:1, 7-25
  4. Carless, D. (2015) Exploring learning-oriented assessment processes. Higher Education, 69(6), 963-976.
  5. Carless, D. (2007) Learning-oriented Assessment: Conceptual Bases and Practical Implications. Innovations in Education and Teaching International, 44(1): 57-66
  6. Harlen, W. (2007) Assessment of Learning. London: SAGE
  7. Harlen, W. (2009) Improving Assessment of Learning and for Learning, Education 3-13: International Journal of Primary, Elementary and Early Years Education, 37(3):247-257
  8. Harlen, W. (2012) On the Relationship between Assessment for Formative and Summative Purposes, In Gardner, J. (Ed.) Assessment and Learning. London: SAGE
  9. Hutchinson, C. and Young, M. (2011) Assessment for Learning in the Accountability Era: Empirical Evidence from Scotland, Studies in Educational Evaluation 37: 62–70
  10. Kellaghan, T., Greaney, V. and Murray T. (2009) Using the Results of a National Assessment of Educational Achievement. Washington DC: The World Bank.
  11. Lau, A.(2015): ‘Formative good, summative bad?’ - A Review of the Dichotomy in Assessment Literature, Journal of Further and Higher Education.
  12. Lee, J. (2008) Is Test-Driven External Accountability Effective? Synthesizing the Evidence from Cross-State Causal-Comparative and Correlational Studies, Review of Educational Research, 78(3): 608-644
  13. R4D. 2015. Bringing Learning to Light: the Role of Citizen-led Assessments in Shifting the Education Agenda. Washington, DC: Results for Development Institute
  14. Stobart, G. and Eggen, T. (2012) High-stakes Testing – Value, Fairness and Consequences, Assessment in Education: Principles, Policy & Practice, 19(1): 1-6
  15. Taras, M. (2010) Assessment for Learning: Assessing the Theory and Evidence. Procedia Social and Behavioral Sciences (2): 3015–3022
  16. Zupanc, D., Urank, M. and Bren, M. (2009) Variability analysis for effectiveness and improvement in classrooms and schools in upper secondary education in Slovenia: Assessment of/for Learning Analytic Tool, School Effectiveness and School Improvement, An International Journal of Research, Policy and Practice, 20(1): 89-122
Mettre en favori

Glossaire

Bibliothèque