Kué Gilles Gaba

Data Science, Data Quality, Business Intelligence, CRM, SFE

  Directeur de Projets Indépendant PMO MOA/MOE

Plan de Sondage, Echantillonnage & Traitements statistiques des données

1. Fonction

Directeur de Projet

2. Contexte et objectifs

2.1. Objectif général de l'étude :
Etude quantitative des Opinions (attitudes) et comportements d'une population donnée par rapport à un sujet marketing/commercial spécifique

3. Démarche et méthodologie

3.1. Spécifications du Client
a.
Population à interviewer : Consommateurs (ex. Patients), vendeurs (ex. Pharmacies), prescripteurs (ex. médecins)


b. Sujet marketing/commercial spécifique à aborder


c. Liste des questions à poser lors du sondage :

   - Questions signalétiques
   - Questions d'opinion (attitudes)
   - Questions comportementales


d. Taille de l'échantillon à interviewer

3.2. Plan de sondage
a. Constitution et enrichissement de la base de sondage


b. Sélection des critères de stratification de l'échantillon :

   - Recherche de liens statistiques avec les variables estimées
   - Recherche du meilleur découpage pour chaque variable de stratification retenue


c. Calcul des objectifs de recrutement par strate :
   - Méthode de sondage proportionnelle ou optimale
   - Calcul de la taille de l'échantillon selon les objectifs de précision et de budget


d. Formule mathématique de l'estimateur redressé (et éventuellement de sa variance)


e. Relecture et test du questionnaire proposé par le Client



3.3. Echantillonnage selon le plan de sondage défini :
a. Tirage aléatoire stratifié des individus à partir de la base de sondage

b. Suivi de la représentativité de l'échantillon par rapport aux objectifs du plan de sondage

c. Remplacement des refus par des individus équivalents


3.4. Codification de l'information recueillie.

a. Codification des modalités de réponses

b. Traitement et Codification des questions ouvertes

   - Recensement des termes utilisés
   - Regroupement des termes selon leurs similarités
   - Codification des réponses aux questions ouvertes

c. Re-codification des questions multi-réponses
Traitement des colonnes pour avoir une seule colonne pour chaque question du questionnaire

e. Distinction de codes entre les cas Non-concernés (cf. questions conditionnées) et les Non-réponses

f. Contrôle qualité des données codifiées
   - Contrôles univariés
   - Contrôles multivariés

g. Chargement de la base de données pour le logiciel QUESTION-DATA.

3.5. Traitements statistiques des données collectées et codifiées

a. Calcul des coefficients d'extrapolation des données individuelles brutes (pour chaque estimateur cible) :
   - Mise à jour des statistiques démographiques utiles pour les calculs de coefficients d'extrapolation
   - Redressement post-stratifié tenant compte des probabilités de tirage
   - Calage sur marge, sur les variables clés de publication (notamment des variables démographiques, par cohérence avec les statistiques nationales de référence)

b. Contrôle qualité des estimations extrapolées
   - Définition des niveaux de granularités, où les estimateurs seront contrôlés
   - Contrôles univariés
   - Contrôles multivariés

c. Statistiques descriptives
   - Tri à plat, des réponses question par question
   - Tris croisés avec tests d'association (Khi-deux), entre les réponses aux différentes questions

d. Recherches de corrélations et d'associations entre réponses
   - Variables quantitatives : Calcul de corrélations
   - Variables qualitatives : Tris croisés avec tests d'association (Khi-deux), entre les réponses aux différentes questions

e. Classifications statistiques des individus interviewés
Classifications statistiques des individus interviewés, par rapport aux réponses données à une ou plusieurs questions cibles.
   - Analyse factorielle
   - Classification statistique CAH

f. Typologie des segments homogènes d'individus
   - Recherche de facteurs discriminants entre les segments d'individus
     Tests de Khi-2 entre :
       *informations signalétiques et réponses à l'ensemble des questions
       vs
       *segments homogènes d'individus
   - Caractérisation (typologie) de chaque segment par rapport aux facteurs discriminants

3.6. Remise de la base de données pour le logiciel QUESTION-DATA light

4. Descriptifs des fonctions des intervenants

- Plan de sondage : Statisticien
- Traitements de données : Ingénieurs décisionnels
- Assurance qualité : Inspecteurs Qualité

5. Environnement technique

SAS, Access, VBA

6. Assurance qualité

- Recalculs partiels de résultats
- Vérification de la cohérence des résultats avec le cahier des charges

7. Livrables et formats des livrables

- la base QUESTION avec des variables issues des questionnaires (Format Access)
- le descriptif des champs contenus dans la base question (Format Excel)
- le résultat des tris à plat (Format Excel)
- le résultat des tris à croisés (Format Excel)
- le rapport d'avancement des travaux (Format Excel)

8. Liste des Clients utilisateurs

UNIVERSITÉ PARIS 5 DESCARTES, HAUTE AUTORITÉ DE SANTÉ (HAS)