Pour améliorer les résultats d'apprentissage, les décideurs doivent savoir ce que les élèves apprennent et ce qui doit être amélioré. L'évaluation de l'apprentissage est un élément essentiel de la mesure des acquis scolaires, de l'évaluation des systèmes éducatifs nationaux et du suivi des progrès vers l'Objectif de développement durable (ODD) 4.
Tests et examens
Les tests en classe peuvent être formatifs ou sommatifs, selon la manière dont les résultats sont utilisés. Les tests formatifs sont diagnostiques et permettent aux enseignants de déterminer les apprentissages en cours afin d'apporter les adaptations nécessaires à leurs programmes d'enseignement. Les évaluations formatives prennent diverses formes, notamment des devoirs, des quiz, des projets et des présentations. Les évaluations sommatives sont réalisées à la fin d'une unité, d'un trimestre ou d'une année, et déterminent si les élèves ont acquis les connaissances et les compétences requises. Les évaluations sommatives sont également utilisées pour obtenir des informations sur l'efficacité d'un programme d'enseignement.
Les examens publics certifient généralement qu'un élève a atteint un certain niveau dans ses études et permettent de passer à l'étape suivante de l'enseignement. Les résultats des examens peuvent également être utilisés pour évaluer si les écoles appliquent le programme scolaire et si les enseignants dispensent un enseignement approprié.
Évaluations à grande échelle
Les évaluations nationales, régionales et internationales à grande échelle peuvent être utilisées pour évaluer les résultats d'un système éducatif à l'aide d'instruments qui fournissent des informations sur les niveaux de réussite des élèves dans des domaines d'apprentissage spécifiques. Les évaluations nationales peuvent être utilisées pour des analyses au niveau du système à l’intérieur d’un pays. Les évaluations régionales et internationales (évaluations transnationales) peuvent être utilisées pour une évaluation comparative entre pays. Elles évaluent généralement un échantillon statistiquement représentatif d'élèves et recueillent des informations générales sur les élèves, les enseignants et l’environnement de l’apprentissage. Ces données peuvent être analysées et mises en corrélation pour éclairer les décisions politiques, comme la raison pour laquelle certains élèves obtiennent de meilleurs résultats que d'autres.
L'Institut de statistique de l'UNESCO (ISU) a identifié neuf évaluations transnationales de l'apprentissage qui répondent aux critères de mesure de l'indicateur 4.1.1 de l'ODD 4, à savoir la proportion d'enfants et de jeunes qui maitrisent au moins les normes d’aptitudes minimales en lecture et en mathématiques (UNESCO-ISU, 2018).
Évaluations internationales à grande échelle
Programme international pour le suivi des acquis des élèves (PISA)
Le programme PISA de l'Organisation de coopération et de développement économiques (OCDE) évalue les compétences et les connaissances des élèves de 15 ans. Tous les trois ans, les élèves d'écoles sélectionnées au hasard passent des tests en lecture, en mathématiques et en sciences, avec un accent supplémentaire sur une matière chaque année d'évaluation. Les tests PISA évaluent dans quelle mesure les élèves peuvent appliquer leurs connaissances à des situations de la vie réelle. Des informations contextuelles sont recueillies au moyen de questionnaires sur les antécédents. En réponse à la perturbation de l'apprentissage pendant la pandémie de COVID-19, les évaluations de 2021 et 2024 ont été reportées à 2022 et 2025, respectivement.
Tendances internationales des études en mathématiques et en sciences (TIMSS)
L'étude TIMSS est menée tous les quatre ans par l'Association internationale pour l'évaluation du rendement scolaire (IEA). L'évaluation mesure les résultats en mathématiques et en sciences en 4e et 8e années. En outre, TIMSS recueille des informations sur le programme scolaire et sa mise en œuvre, les pratiques pédagogiques et les ressources scolaires. Le cycle de tests le plus récent, en 2019, a amorcé une transition vers l'évaluation numérique. Le prochain cycle, en 2023, achèvera cette transition. Pour les pays où les élèves développent encore des compétences fondamentales en mathématiques, l'évaluation TIMSS Numeracy (conçue pour être administrée en 4e, 5e ou 6e année) se concentre sur la mesure des résultats de l'apprentissage en calcul, y compris les connaissances mathématiques fondamentales, les procédures et les stratégies de résolution de problèmes. L'étude TIMSS Advanced mesure les tendances en mathématiques et en physique avancées pour les élèves de dernière année de l'enseignement secondaire.
Programme international de recherche en lecture scolaire (PIRLS)
Le PIRLS évalue la compréhension de l'écrit des élèves et est réalisé par l'IEA tous les cinq ans. Il fournit des données comparables au niveau international sur le niveau de lecture des enfants à la fin de la quatrième année. L'étude recueille en outre des informations sur le soutien à domicile, les pratiques pédagogiques et les ressources scolaires dans chaque pays participant. La transition vers l'évaluation numérique a débuté en 2016. PIRLS Literacy, connu auparavant sous le nom de pré PIRLS, est basé sur la même vision de la compréhension de la lecture que PIRLS mais est conçu pour tester les compétences de base en lecture dans les pays où la plupart des enfants sont encore en train de développer des compétences fondamentales en lecture. PIRLS Literacy peut être administré en 4e, 5e ou 6e année et donne aux pays la possibilité de se comparer au test PIRLS régulier.
Évaluation des aptitudes à la lecture, à l’écriture et au calcul (LaNA)
Le LaNA est une courte évaluation développée par l'IEA qui est administrée à la fin de l'école primaire. LaNA est conçu comme un tremplin dans les pays où il n'est pas possible de mettre en œuvre TIMSS et PIRLS. La participation à LaNA permet de comparer au niveau international les compétences des élèves en matière de lecture et de calcul et constitue un moyen supplémentaire de suivre les progrès accomplis dans la réalisation de l'ODD 4.1.1.
Évaluations régionales de l'apprentissage
Le Consortium d'Afrique australe et orientale pour le pilotage de la qualité de l'éducation (SEACMEQ)
SEACMEQ réunit 16 ministères de l'éducation en Afrique australe et orientale pour partager leurs expériences et leur expertise en matière de suivi et d'évaluation des politiques relatives aux conditions de scolarisation et à la qualité de l'éducation. Les projets de recherche du SEACMEQ évaluent les conditions de scolarisation et les niveaux de performance des élèves et des enseignants en matière de lecture, d'écriture et de calcul, ainsi que les niveaux de connaissances de base en matière de santé.
Programme d'analyse des systèmes éducatifs de la CONFEMEN (PASEC)
Le PASEC est un outil d'évaluation régional pour 14 pays francophones d'Afrique de l'Ouest et d'Asie, réalisé par la Conférence des ministres de l'Éducation des États et gouvernements de la francophonie (CONFEMEN). Il fournit des informations sur les performances des systèmes éducatifs au début et à la fin de l'école primaire. En outre, le PASEC réalise des évaluations comparatives entre ses pays membres. La dernière évaluation a eu lieu en 2019.
Étude régionale comparative et explicative (ERCE)
ERCE est une étude à grande échelle des acquis scolaires coordonnée par le Laboratoire latino-américain d'évaluation de la qualité de l'éducation (LLECE), qui est basé au sein du Bureau régional de l'UNESCO pour l'éducation en Amérique latine et dans les Caraïbes. Initialement axée sur la lecture et les mathématiques, l'approche s'est étendue à d'autres domaines, par exemple les sciences naturelles et l'éducation à la citoyenneté mondiale. Les évaluations LLECE visent en outre à identifier les facteurs associés aux différents niveaux de réussite, tels que le contexte socio-économique, la vie familiale et les questions personnelles, les politiques éducatives et les processus scolaires. Le dernier cycle a eu lieu en 2019.
Métriques de l'apprentissage à l’école primaire en Asie du Sud-Est (SEA-PLM)
SEA-PLM a été développé en partenariat avec l'Organisation des ministres de l'éducation de l'Asie du Sud-Est (SEAMEO), l'UNICEF et le Conseil australien pour la recherche en éducation (ACER). Il vise à renforcer les capacités et à améliorer les résultats scolaires dans les pays d'Asie du Sud-Est. SEA-PLM fournit une approche commune pour évaluer les résultats d'apprentissage en 5e année en lecture, écriture et mathématiques. Administré pour la première fois en 2019, le SEA-PLM a révélé des disparités importantes dans les résultats des élèves dans les six pays participants. Les cycles futurs permettront de suivre les progrès réalisés par rapport aux objectifs régionaux en matière d'éducation ainsi qu'à l'ODD 4.1.1.
Évaluation des aptitudes à la lecture, à l’écriture et au calcul dans les îles du Pacifique (PILNA)
Le PILNA fournit des données sur les résultats en matière de lecture/écriture et de calcul des élèves d'au moins 12 pays insulaires du Pacifique. Le test évalue les élèves qui ont suivi quatre années de scolarité formelle (généralement en quatrième ou cinquième année) et six années de scolarité formelle (généralement en sixième ou septième année). Le Programme d'évaluation et de qualité de l'éducation (EQAP) de la Communauté du Pacifique administre le test. Il a été administré pour la dernière fois en 2018.
Pour permettre la comparabilité entre les évaluations régionales telles que le PASEC et l'ERCE et les évaluations internationales telles que TIMSS et PIRLS, l'ISU a développé la Rosetta Stone pour suivre l'ODD 4.1.1.
Autres évaluations internationales
Le programme PISA pour le développement de l'OCDE vise à encourager l'utilisation des évaluations PISA pour suivre les progrès accomplis vers les objectifs fixés au niveau national pour l'amélioration de l'éducation dans les pays à revenu faible et intermédiaire. Il est également conçu pour suivre les objectifs internationaux en matière d'éducation dans le cadre d'Éducation 2030.
Enquête internationale sur l'enseignement et l'apprentissage (TALIS)
L'enquête TALIS de l'OCDE est une enquête internationale à grande échelle sur le personnel enseignant, les conditions d'enseignement et les environnements d'apprentissage dans les écoles. L'étude vise à fournir des informations comparables concernant les conditions d'enseignement et les environnements d'apprentissage dans les pays participants. Réalisé le plus récemment en 2018, TALIS a mis en évidence la nécessité d'attirer des candidats solides dans la profession d'enseignant, d'élever le statut de la profession d'enseignant et de retenir les éducateurs de grande qualité grâce à la satisfaction au travail et au développement professionnel continu.
Étude internationale sur l'éducation civique et la citoyenneté (ICCS)
Cette étude de l'IEA évalue les élèves à la fin de la 8e année. ICCS rend compte de la connaissance et de la compréhension qu'ont les élèves des concepts et des questions liés au civisme et à la citoyenneté, ainsi que de leurs croyances, attitudes et comportements.
Étude internationale sur la maîtrise des outils informatiques et de la culture de l'information (ICILS)
ICILS est une étude comparative internationale menée par l'IEA. Elle est conçue pour évaluer la capacité des élèves à utiliser l'ordinateur pour rechercher, créer et communiquer afin de participer efficacement à la maison, à l'école, sur le lieu de travail et dans la communauté. L'étude s'adresse aux élèves en 8e année.
Enquêtes auprès des ménages et évaluations menées par les citoyens
L'ODD 4 souligne l'importance de l'apprentissage pour tous et met l'accent sur les populations marginalisées. Les enquêtes auprès des ménages et les évaluations de l'apprentissage menées par les citoyens peuvent atteindre les élèves marginalisés qui ont abandonné ou n'ont jamais intégré le système scolaire formel. Ces enquêtes sont généralement basées sur un échantillon représentatif d'une population.
Réseau PAL (People's Action for Learning)
Le mouvement d'évaluation de l’apprentissage menées par les citoyens a débuté en 2005 en Inde avec le rapport annuel sur le statut de l'éducation (ASER) de Pratham. Le réseau PAL rassemble aujourd'hui des organisations de 15 pays sur trois continents qui mettent en œuvre des évaluations menées par les citoyens des compétences de base des enfants en lecture et en calcul. En 2019, l'outil d'évaluation commune internationale de la numératie (ICAN) a été mis au point pour fournir des données comparables au niveau international afin de suivre les progrès de l'ODD 4.1.1. Une nouvelle initiative d'évaluation commune, à savoir l'évaluation précoce du langage, de la littératie et la numératie (ELANA), est en cours de développement pour cibler les enfants âgés de 4 à 10 ans afin d'évaluer les compétences fondamentales en matière de calcul, le langage oral et la compréhension de la lecture.
Enquêtes Démographiques et de Santé (EDS)
L'EDS est soutenue par l'USAID et collecte, analyse et diffuse des données sur une variété de sujets, notamment les niveaux de réussite scolaire et d'alphabétisation dans plus de 90 pays. Les données sont accessibles à tous et destinées à être utilisées pour la recherche, le plaidoyer et le développement de programmes.
Enquête en grappes à indicateurs multiples (MICS)
Développée par l'UNICEF et réalisée dans 118 pays, MICS fournit des données sur le bien-être des femmes et des enfants. Le sixième cycle de l'enquête, entrepris entre 2017 et 2021, a révélé l'impact néfaste des fermetures d'écoles sur l'apprentissage fondamental pendant la pandémie de COVID-19. L'analyse de l'éducation par MICS pour l'apprentissage et l'équité au niveau mondial (MICS-EAGLE) a été lancée en 2018 et peut être utilisée aux niveaux national, régional et mondial. Son objectif est d'améliorer les résultats d'apprentissage et de traiter les questions d'équité dans l'éducation en comblant les lacunes dans les données pour les indicateurs clés de l'éducation et en améliorant l'utilisation efficace des données par les gouvernements et les parties prenantes de l'éducation.
Outils d'évaluation multinationaux
Évaluation des compétences fondamentales en lecture (EGRA)
EGRA est un outil d'évaluation orale soutenu par l'USAID, conçu pour mesurer les compétences fondamentales en lecture chez les enfants des premières classes. Cette évaluation individuelle est centrée sur l'enfant lui-même. EGRA mesure la reconnaissance des lettres, la lecture de mots simples, la compréhension de phrases et de paragraphes, et la compréhension. Les pays peuvent adapter l'évaluation à leurs langues respectives. EGRA permet d'établir les performances nationales en matière de lecture et le niveau des compétences en lecture des enfants.
Évaluation des compétences fondamentales en mathématiques (EGMA)
L'EGMA, soutenu par l'USAID, mesure les compétences des enfants en calcul et en mathématiques. Il se concentre sur les bases des mathématiques, telles que l'identification des nombres, la discrimination des quantités (plus grand et plus petit), l'identification des nombres manquants, la résolution de problèmes de mots, l'addition et la soustraction, la reconnaissance des formes et l'extension des modèles. L'EGMA aide les enseignants à établir le niveau de compréhension des élèves en ce qui concerne les compétences fondamentales et à identifier les domaines d'amélioration en vue de tâches supplémentaires dans les classes supérieures.
Mesure de la qualité et des résultats de l'apprentissage préscolaire (MELQO)
MELQO est soutenu par l'UNESCO, la Banque mondiale, le Center for Universal Education de la Brookings Institution et l'UNICEF. Elle vise à promouvoir une mesure réalisable, précise et utile du développement et de l'apprentissage des enfants au début de l'école primaire et de la qualité de leur environnement d'apprentissage pré primaire. Les questions sont conçues pour les enfants âgés de 4 à 6 ans.
Collaborations régionales
Réseau sur le suivi de la qualité de l'éducation dans la région Asie-Pacifique (NEQMAP)
Le NEQMAP est une plateforme d'échange de connaissances, d'expériences et d'expertise sur le suivi de la qualité de l'éducation dans la région Asie-Pacifique. Le Bureau régional de l'UNESCO pour l'éducation en Asie et dans le Pacifique fait office de secrétariat du NEQMAP.
Réseau des éducateurs pour la transformation de l'enseignement - l'apprentissage (TALENT)
TALENT sert de plateforme thématique pour soutenir la mise en œuvre du cadre d'action de l'ODD 4 en Afrique occidentale et centrale. Le réseau se concentre sur l'enseignement et l'apprentissage, en accordant une attention particulière à l'alignement des programmes, de la pédagogie et de l'évaluation, ainsi qu'aux questions liées à l'environnement institutionnel pour soutenir un apprentissage efficace. Il est coordonné par le bureau de l'UNESCO à Dakar.
Russia Education Aid for Development (READ) Trust Fund
Supervisé par le Conseil READ, composé de dirigeants de la Russie et de la Banque mondiale, le Fonds fiduciaire READ intervient au niveau mondial et national pour aider les pays à faible revenu à améliorer les résultats d'apprentissage des étudiants en renforçant la conception et la mise en œuvre des systèmes d'évaluation de l'apprentissage. Actuellement dans sa deuxième phase, READ II a trois objectifs, à savoir : (1) renforcer la capacité des pays à évaluer l'apprentissage des élèves et à utiliser ces informations pour améliorer les résultats de l'enseignement et de l'apprentissage ; (2) améliorer ou réformer les programmes d'examens à enjeux élevés qui influencent souvent de manière décisive la progression des élèves vers le niveau supérieur du système éducatif ; et (3) renforcer la formation et le développement professionnel des enseignants dans l'utilisation des pratiques d'évaluation en classe pour soutenir l'enseignement et l'apprentissage. Cette initiative s'appuie sur les objectifs de READ I, qui a créé le Fonds fiduciaire READ, et vise à générer et à partager des connaissances sur les bonnes pratiques éducatives à travers le monde par le biais de rapports analytiques, de boîtes à outils et d'études de cas.
Évaluation pendant et après le COVID
Malgré la difficulté accrue d'évaluer l'apprentissage des élèves pendant COVID-19, le suivi de l'apprentissage et des proxies, tels que l'accès à l'éducation, étaient essentiels pour commencer à mesurer la perte d'apprentissage et accélérer la récupération. Lorsque cela était possible, la collecte de données a été effectuée par SMS ou par téléphone, les attentes en matière d'apprentissage ont été revues, les évaluations à grande échelle ont été reportées et les évaluations formatives et à faible enjeu ont été privilégiées. L'importance de la capacité des enseignants à suivre l'apprentissage des élèves et à communiquer avec eux et leurs familles a été soulignée. Pour l'avenir, les méthodes numériques d'évaluation et de collecte de données ont été privilégiées (Équipe du IIEP Learning Portal, 2021).
IIEP Learning Portal Team. 2021. 'COVID-19 et évaluations des apprentissages : quels enseignements peut-on tirer ?' IIEP Learning Portal, 15 février.
UNESCO-ISU (UNESCO Institut de statistique). 2018. Guide rapide des indicateurs de l'éducation pour l'ODD 4. Montréal: ISU.