Kué Gilles Gaba, PhD, Actuaire IA & Economiste

Actuariat & Risk Management, Data Science A.I., Economie

Sondages & Traitements statistiques des données

1. Fonction

Directeur de Projet

2. Contexte et objectifs

2.1. Destinataire de l'étude statistique : Industriel (Direction Marketing, Direction Commerciale, Direction Générale)


2.2. Objectif général de l'étude : Opinions (attitudes) et comportements d'une population donnée par rapport à un sujet marketing/commercial spécifique

3. Démarche et méthodologie

3.1. Spécifications du Client
a. Population à interviewer : Consommateurs (ex. Patients), vendeurs (ex. Pharmacies), prescripteurs (ex. médecins)

b. Sujet marketing/commercial spécifique à aborder

c. Liste des questions à poser lors du sondage :
   - Questions signalétiques
   - Questions d'opinion (attitudes)
   - Questions comportementales

d. Taille de l'échantillon à interviewer

3.2. Plan de sondage
a. Constitution et enrichissement de la base de sondage

b. Sélection des critères de stratification de l'échantillon :
   - Recherche de liens statistiques avec les variables estimées
   - Recherche du meilleur découpage pour chaque variable de stratification retenue

c. Calcul des objectifs de recrutement par strate :
   - Méthode de sondage proportionnelle ou optimale
   - Calcul de la taille de l'échantillon selon les objectifs de précision et de budget

d. Formule mathématique de l'estimateur redressé (et éventuellement de sa variance)

e. Relecture et test du questionnaire proposé par le Client

3.3. Spécification technique du mode d'administration du questionnaire
Administration par téléphone sur système CATI (Computer Assisted Telephone Interviewing).
- Saisie directe des réponses sur ordinateur.
- Automatisation du déroulement du questionnaire (filtres, guidages, …).
- Apparition aléatoire de questions ou blocs de questions.
- Apparition des modalités de réponse en ordre aléatoire.
- Suivi permanent de la structure de l’échantillon réalisé.
- Prises de rendez-vous à jour et heure, avec une présentation de l’adresse à l’heure convenue.

3.4. Recueil des données
- Echantillonnage selon le plan de sondage défini : Tirage aléatoire stratifié des individus à partir de la base de sondage
- Intervention quotidienne d'une équipe d'au moins 10 enquêteurs intervient sous le contrôle permanent d'un superviseur.

3.5. Codification de l'information recueillie

a. Codification des modalités de réponses

b. Traitement et Codification des questions ouvertes
   - Recensement des termes utilisés
   - Regroupement des termes selon leurs similarités
   - Codification des réponses aux questions ouvertes

c. Re-codification des questions multi-réponses
Traitement des colonnes pour avoir 1 seule colonne pour chaque question du questionnaire

d. Distinction de codes entre les cas Non-concernés (cf. questions conditionnées) et les Non-réponses

e. Contrôle qualité des données codifiées
   - Contrôles univariés
   - Contrôles multivariés

f. Chargement de la base de données pour le logiciel QUESTION-DATA.

3.6. Traitements statistiques des données collectées et codifiées

a. Calcul des coefficients d'extrapolation des données individuelles brutes (pour chaque estimateur cible) :
   - Mise à jour des statistiques démographiques utiles pour les calculs de coefficients d'extrapolation
   - Redressement post-stratifié tenant compte des probabilités de tirage

b. Contrôle qualité des estimations extrapolées
   - Définition des niveaux de granularités, où les estimateurs seront contrôlés
   - Contrôles univariés
   - Contrôles multivariés

c. Statistiques descriptives
   - Tri à plat, des réponses question par question
   - Tris croisés avec tests d'association (Khi-deux), entre les réponses aux différentes questions

d. Recherches de corrélations et d'associations entre réponses
   - Variables quantitatives : Calcul de corrélations
   - Variables qualitatives : Tris croisés avec tests d'association (Khi-deux), entre les réponses aux différentes questions

e. Classifications statistiques des individus interviewés
Classifications statistiques des individus interviewés, par rapport aux réponses données à une ou plusieurs questions cibles.
   - Analyse factorielle
   - Classification statistique CAH

f. Typologie des segments homogènes d'individus
  - Recherche de facteurs discriminants entre les segments d'individus
     Tests de Khi-2 entre :
     * informations signalétiques et réponses à l'ensemble des questions
     vs
     * segments homogènes d'individus
  - Caractérisation (typologie) de chaque segment par rapport aux facteurs discriminants


3.7. Remise de la base de données pour le logiciel QUESTION-DATA light

4. Descriptifs des fonctions des intervenants

- Plan de sondage : Statisticien
- Recueil des données : Enquêteurs, Superviseur
- Traitements de données : Ingénieurs décisionnels
- Assurance qualité : Inspecteurs Qualité

5. Environnement technique

SAS, Access, VBA

6. Assurance qualité

- Recalculs partiels de résultats
- Vérification de la cohérence des résultats avec le cahier des charges

7. Livrables et formats des livrables

- la base QUESTION avec des variables issues des questionnaires (Format Access)
- le descriptif des champs contenus dans la base question (Format Excel)
- le résultat des tris à plat (Format Excel)
- le résultat des tris à croisés (Format Excel)
- le rapport d'avancement des travaux (Format Excel)

8. Liste des Clients utilisateurs

UNIPATH, BAYER SANTÉ FAMILIALE, IMS HEALTH, PIERRE FABRE, PFIZER, POLIVE