Kué Gilles Gaba

Data Science, Data Quality, Business Intelligence, CRM, SFE

  Directeur de Projets Indépendant PMO MOA/MOE

Saisies & Traitements statistiques des données de sondage

1. Fonction

Directeur de Projet

2. Contexte et objectifs

2.1. Objectif général de l'étude :
Etude d'Opinions (attitudes) et comportements d'une population donnée par rapport à un sujet marketing/commercial spécifique

3. Démarche et méthodologie

3.1. Spécifications du Client
- Population interviewée : Consommateurs (ex. Patients), vendeurs (ex. Pharmacies), prescripteurs (ex. médecins)
- Lots en papier des questionnaires remplis à saisir

3.2. Saisie des questionnaires papier
- Assurance qualité : Double saisie, par 2 équipes en parallèle.

3.3. Codification de l'information recueillie.

a. Codification des modalités de réponses

b. Traitement et Codification des questions ouvertes
   - Recensement des termes utilisés
   - Regroupement des termes selon leurs similarités
   - Codification des réponses aux questions ouvertes

c. Re-codification des questions multi-réponses
   Traitement des colonnes pour avoir 1 seule colonne pour chaque question du questionnaire

d. Distinction de codes entre les cas Non-concernés (cf. questions conditionnées) et les Non-réponses

e. Contrôle qualité des données codifiées
   - Contrôles univariés
   - Contrôles multivariés

f. Chargement de la base de données pour le logiciel QUESTION-DATA


3.4.Traitements statistiques des données collectées et codifiées


a. Calcul des coefficients d'extrapolation des données individuelles brutes (pour chaque estimateur cible) :
   - Mise à jour des statistiques démographiques utiles pour les calculs de coefficients d'extrapolation
   - Redressement post-stratifié tenant compte des probabilités de tirage
   - Calage sur marge, sur les variables clés de publication (notamment des variables démographiques, par cohérence avec les statistiques nationales de référence)


b. Contrôle qualité des estimations extrapolées
   ° Définition des niveaux de granularités, où les estimateurs seront contrôlés
   ° Contrôles univariés
   ° Contrôles multivariés


c. Statistiques descriptives
   ° Tri à plat, des réponses question par question
   ° Tris croisés avec tests d'association (Khi-deux), entre les réponses aux différentes questions

d. Recherches de corrélations et d'associations entre réponses
   ° Variables quantitatives : Calcul de corrélations
   ° Variables qualitatives : Tris croisés avec tests d'association (Khi-deux), entre les réponses aux différentes questions

e. Classifications statistiques des individus interviewés
Classifications statistiques des individus interviewés, par rapport aux réponses données à une ou plusieurs questions cibles.
   ° Analyse factorielle
   ° Classification statistique CAH

f. Typologie des segments homogènes d'individus
   - Recherche de facteurs discriminants entre les segments d'individus
     Tests de Khi-2 entre :
     * informations signalétiques et réponses à l'ensemble des questions
     vs
     * segments homogènes d'individus
   - Caractérisation (typologie) de chaque segment par rapport aux facteurs discriminants


3.5. Remise de la base de données pour le logiciel QUESTION-DATA light

4. Descriptifs des fonctions des intervenants

4.1. Traitements de données : Ingénieurs décisionnels, Statisticien


4.2. Assurance qualité : Inspecteurs Qualité

5. Environnement technique

SAS, Access, VBA

6. Assurance qualité

- Re-calculs partiels de résultats
- Vérification de la cohérence des résultats avec le cahier des charges

7. Livrables et formats des livrables

- la base QUESTION avec des variables issues des questionnaires (Format Access)
- le descriptif des champs contenus dans la base question (Format Excel)
- le résultat des tris à plat (Format Excel)
- le résultat des tris à croisés (Format Excel)
- le rapport d'avancement des travaux (Format Excel)

8. Liste des Clients utilisateurs

LOGIMED, STALLERGENES