Problème
Le dépouillement et le traitement de questionnaires constituent une partie des activités effectuées par les sociologues. Nous nous intéressons, dans cet exemple, à la conception d'un système automatisé permettant de traiter des questionnaires et de produire des résultats statistiques "classiques" dans ce domaine : tris à plat, tris croisés, comptages à la demande...
Les données de base, utilisées dans cet exemple, sont extraites d'une enquête réalisée en 1993-1994 sur 258 étudiants inscrits en première année de DEUG de sociologie. L'enquête comportait 55 questions.
Le système à développer devra notamment prendre en compte :
- la représentation et le stockage de variables quantitatives et qualitatives
- la représentation le stockage et le traitement de questions à réponses multiples
- la vérification du nombre de réponses théoriques (valeurs possibles) et autorisées (une ou plusieurs) pour chaque question.
Dictionnaire des données
Mnémonique | Libellé |
Age | Age de l'individu interrogé (en années entières) |
Cdrep | Code de la réponse d'un individu à une question |
Fratrie | Nombre de frères et sœurs pour un individu donné |
Lbquest | Libellé de la question |
Lbreponse | Libellé du code numérique représentant la réponse d'un individu à une question |
Lbsexe | Libellé du sexe de l'individu interrogé : Masculin ou Féminin |
Nbrep_aut | Nombre de réponses autorisées pour une question donnée |
Nbrep_th | Nombre de réponses théoriques pour une question donnée |
Numchoix | Numéro du choix de l'individu dans le cas de réponses multiples (toujours 1 si la question est à réponse unique) |
Numind | Numéro de l'individu interrogé |
Numquest | Numéro de la question posée |
Sexe | Code sexe de l'individu interrogé (1 ou 2) |
TypeQ | Type de la question posée (Q: Qualitative, N: Quantitative) |
Schéma des données
Pour un complément d'information sur la démarche de construction du schéma des données se reporter, dans ces pages, à la rubrique Conception BD.
1-DF simples
Individu -> Sexe, Age, Fratrie, Lbsexe
Sexe -> Lbsexe
Numquest -> Lbquest, Nbrep_th, Nbrep_aut, TypeQ
2-Attributs non classés et DF composées
Les attributs Cdrep, Lbreponse et Numchoix n'ont pas été classés dans l'étape précédente, ils interviennent dans des DF composées qui sont les suivantes :
Numquest, Numchoix, Numind -> Cdrep, Sexe, Age, Fratrie, Lbsexe, Lbquest, Nbrep_th, Nbrep_aut, TypeQ
Numquest, Cdrep -> Lbreponse, Lbquest, Nbrep_th, Nbrep_aut, TypeQ
3-Elimination des transitivités
Individu -> Sexe, Age, Fratrie
Sexe -> Lbsexe
Numquest -> Lbquest, Nbrep_th, Nbrep_aut, TypeQ
Numquest, Numchoix, Numind -> Cdrep
Numquest, Cdrep -> Lbreponse
4-Construction des entités et associations
ECHANTILLON(Numind, Sexe, Age, Fratrie)
LIBELLE_SEXE(Sexe, Lbsexe)
QUESTION(Numquest, Lbquest, Nbrep_th, Nbrep_aut, TypeQ)
REPONSE(Numquest, Numchoix, Numind, Cdrep)
LIBELLE_REPONSE(Numquest, Cdrep, Lbreponse)
5-Mise en relation des entités et associations
Entité source | Entité but | Relation sur l'attribut | Type de relation |
ECHANTILLON | LIBELLE_SEXE | Sexe | 1-n |
ECHANTILLON | REPONSE | Numind | 1-n |
QUESTION | LIBELLE_REPONSE | Numquest | 1-n |
QUESTION | REPONSE | Numquest | 1-n |
REPONSE | LIBELLE_REPONSE | Numquest | n-n |
REPONSE | LIBELLE_REPONSE | Cdrep | n-n |
Les deux dernière liaisons du tableau précédent ne sont pas, comme les autres liaisons, des contraintes d'intégrité référencielle mais précisent simplement quels attributs de jointure devront être utilisés pour lier les tables REPONSE et LIBELLE_REPONSE.
6-Schéma des données
La structure de données "optimale" est la suivante (les clés sont en caractères gras) :
Interrogations
Par mesure de simplification, la base de données utilisée dans les questions suivantes n'est composée que d'un sous-ensemble des données de base.
Pour visualiser le contenu de chaque table de la base de données, taper la commande :
SELECT * FROM Nom_de_ table;
dans un cadre comportant le bouton "Exécuter".
Afficher le nombre d'individus ayant répondu, dans le même questionnaire : 1 à la question 1, 2 à la question 2 et 3 à la question 3. (Réponse)
Afficher quel est (en moyenne), le nombre de frères et soeurs d'un individu en fonction de la profession du père de cet individu. La profession du père fait l'objet de la question numéro 3 du questionnaire. (Réponse)
Faire un tri à plat sur la question numéro 2 avec détail des effectifs ventilés par sexe des individus interrogés. (Réponse)
Faire un tri croisé entre les questions numéro 2 et 4. (Réponse)
Donner la répartition (en effectifs) par sexe et âge de la population interrogée. (Réponse)
Donner la répartition (en effectifs) par sexe et numéro de question des individus qui n'ont pas répondu : "Non-réponse". (Réponse)