Introduction
Pour comprendre les conditions de vie des populations et évaluer les impacts des programmes visant à les améliorer, les gouvernements et les partenaires au développement se sont souvent appuyés sur les enquêtes quantitatives et qualitatives d’échantillon de la population. Cet échantillon porte parfois sur des types d’individus spécifiques, ou est censé représenter l’ensemble de la population. Ces enquêtes sont considérées comme étant le meilleur moyen d’évaluer le bien-être global des populations et les effets éventuels d’un projet donné.
Les ressources d’aide au développement sont limitées et, même si ces enquêtes sont importantes, elles peuvent être très coûteuses. Par exemple, le coût de la réalisation d’une série type d’Enquêtes démographiques et de santé (EDS), même dans un pays de taille moyenne tourne autour d’un million de dollars. Dans les pays très peuplés, comme que la Côte d’Ivoire, ce coût dépasse généralement 1,2 million de dollars (Jerven 2017). Le coût élevé de ces enquêtes justifie le fait qu’elles soient menées ponctuellement (généralement tous les 3 à 5 ans seulement) sur des échantillons représentatifs au niveau national. De plus, ces coûts peuvent être prohibitifs pour les évaluations d’impact potentiel des programmes de développement, où seule une infime part de ces programmes est couverte par les collectes de données d’enquêtes. Ainsi, il apparait crucial de trouver d’autres moyens de recueillir des données de qualité auprès des population, à moindre coût.
Une première suggestion de réduction des coûts des enquêtes est s’appuye sur les données géolocalisées (secondaires) existantes qui sont de plus en plus disponibles, notamment les enquêtes auprès des ménages au niveau national ou dans le cadre d’un projet, les données administratives et les données de télédétection (par satellite et d’autres détecteurs). Ces données peuvent servir à améliorer la précision des estimations effectuées à partir des nouvelles données primaires, réduisant ainsi les tailles des échantillons requises dans le cadre des initiatives de collecte de données et, par conséquent, le coût et l’effort qui y sont liés. De plus, dans les cadres d’évaluation, ces sources de données supplémentaires peuvent, parfois, être utilisées à la place des activités de collecte de données primaires si celles-ci n’existent pas, particulièrement en tant que données de base qui aident à constituer des groupes de comparaison qui sont similaires aux groupes traités.
Cependant, l’utilisation des données secondaires existantes à ces fins pose un certain nombre de difficultés. D’abord, les enquêtes de qualité, telles que les EDS et les Enquêtes par grappes avec indicateurs multiples (MICS), sont disponibles uniquement pour des échantillons de la population. Ces échantillons sont souvent éparpillés dans un pays ou une zone donnée et sont seulement représentatifs à l’échelle nationale. Par conséquent, plusieurs localités d’un pays ne sont pas directement couvertes par une série EDS. Ensuite, les données administratives (telles que les données sur les établissements de santé) et les données de télédétection (telles que l’imagerie satellite) pourraient ne pas saisir les résultats d’intérêt exacts dans une étude donnée, particulièrement dans les secteurs de la santé, de l’éducation et des secteurs sociaux connexes. Cependant, les récents progrès réalisés pour relever ces deux défis permettent d’accéder à des solutions : par exemple, les nouvelles couches interpolées produites par l’Institut pour l'évaluation et les métriques de santé (IHME) fournissent une estimation des principales mesures de santé à l’échelle infranationale, ce qui nous permet de compenser les populations manquantes non couvertes dans les enquêtes par sondage.
Notre objectif est d’aider les évaluateurs, les partenaires techniques et financiers, et les maîtres d'œuvre des projets, à comprendre qu’ils ont la possibilité de combiner plusieurs séries d’enquêtes avec des données spatiales dans le cadre de l’évaluation des projets. Nous présentons les nouvelles méthodes géospatiales qui permettent l’interpolation géospatiale de ces sous-ensembles et leur attachement aux données des enquêtes de collecte des données primaires. Nous stimulons l’efficacité statistique dans les cas les plus courants qui entraînent d’autres options de configuration de ces méthodes. Nous nous concentrons sur les cas où la collecte de données nouvelles et primaires pour les séries de base et de suivi n’est pas réalisable ou n’entre pas dans le budget. Nous procédons, ensuite, à une évaluation globale et une comparaison de la puissance statistique qu’offrent les autres configurations. Dans le cadre de l’application de ces méthodes, nous nous concentrons sur le cas des indicateurs du VIH/SIDA en Côte d’Ivoire, dérivés des données géolocalisées EDS et MCIS, ainsi que sur les couches interpolées de l’Institut pour l'évaluation et les métriques de santé (IHME). Ce cadre est particulièrement important pour notre application car il offre un ensemble de configurations de données et une gamme d’initiatives de développement visant à réduire le VIH/SIDA au sein d’une large population.
Les résultats de nos simulations laissent penser que la combinaison des mesures des résultats de base à partir des surfaces prédites avec des surfaces de suivi tirées des données primaires nouvellement collectées donne une plus grande précision statistique. De toute évidence, ces projets sont plus faciles à réaliser que les autres qui s’appuient sur la collecte des données d’enquêtes de base, ouvrant la porte à beaucoup plus de projets d’évaluation réalisés rétrospectivement. Ces résultats montrent également comment les surfaces prédites nouvellement créées peuvent être utilisées pour aider à récupérer les scénarios « de base manquants » (dans le cas où aucune donnée d’enquête de base n’a été réalisée dans les sites traités et de comparaison) - un aspect important des évaluations d’impact géospatiales.