Accéder au contenu principal
 

 
Le français et les médias : Les habitudes des Québécois

LE FRANÇAIS ET LES MÉDIAS

Les habitudes
des Québécois






ANNEXE A

Le rapport d'échantillonnage
et les résultats
de la cueillette des données







Le Centre de sondage de l'Université de Montréal a mené, pour le Conseil de la langue française, cette recherche qui vise à mesurer l'évolution de l'utilisation du français comme langue de consommation des médias. Le Centre de sondage a assumé toutes les opérations de la recherche en liaison constante avec les représentants du Conseil.

1. Échantillonnage

Tout d'abord, il est important de mentionner que la cueillette des données a été réalisée par entrevues téléphoniques, stratégie qui allait orienter d'une certaine façon notre procédure de sélection ainsi que l'élaboration de notre modèle d'échantillonnage.

Procédure de sélection. Pour commencer, ce sondage visait toutes les personnes de 18 ans et plus résidant au Québec. Nous avons alors cherché à atteindre tous les ménages québécois qui avaient le téléphone1 et dont le numéro pouvait être composé sans passer par le téléphoniste2.

Étant donné ces objectifs, il fallait établir une méthode de sélection qui, sans être trop coûteuse, permettrait de choisir parmi tous les numéros de téléphone existants, qu'ils soient confidentiels3 ou non. La génération aléatoire offrait une solution. Cette méthode, cependant, pouvait devenir onéreuse, surtout dans les zones rurales et semi-urbaines où les échanges (les trois premiers chiffres d'un numéro de téléphone) ne sont pas pleins (tous les numéros possibles d'un échange n'étant pas utilisés). Il fallait donc se lancer dans cette entreprise avec la plus grande circonspection.

Le Centre de sondage a alors constitué une banque de numéros de téléphone valides à partir du Red Book (région de Montréal) et des annuaires téléphoniques qui couvrent l'ensemble du reste de la province. Le Red Book nous a servi à déterminer les échanges et à définir de façon assez précise les séries de numéros qui les constituent. Dans le cas des annuaires, nous avons relevé tous les échanges en usage et constitué des tranches de 1 000 numéros valides en utilisant le quatrième chiffre qui était rencontré dans un certain nombre de pages. Ainsi, nous avons constitué notre banque de numéros de téléphone valides4.




1 Selon Statistique Canada, 96,7 % des Québécois ont le téléphone. [retour au texte]

2 La majorité des numéros ont ainsi été retenus, à l'exception de quelque 1 300 numéros qui sont utilisés par les habitants de huit petites municipalités de l'Abitibi-Témiscamingue et d'un certain nombre d'autres sur les territoires de la Baie-James. [retour au texte]

3 Selon Bell Canada, la proportion des numéros de téléphone confidentiels, pour le territoire couvert par cette compagnie, serait d'environ 6 %. [retour au texte]

4 Cette procédure a été conçue par Victor Tremblay du Centre de sondage. Pour plus d'information, il est possible de consulter le texte suivant : « Sur la génération aléatoire de numéros de téléphone », communication présentée dans le cadre du Congrès des sociétés savantes 1980 par M. Victor Tremblay. [retour au texte]




Il s'agissait, alors, de générer aléatoirement des numéros qui, par la suite, étaient déclarés valides ou non valides (s'ils étaient dans la banque ou non)5. Les numéros valides étaient retenus pour constituer l'échantillon dont nous avions besoin pour atteindre les objectifs que nous nous étions fixés.

Bref, cette procédure avait pour but de représenter tous les ménages qui avaient le téléphone, que leur numéro soit confidentiel ou non, et de réduire les coûts qu'aurait entraînés l'utilisation aveugle d'une génération aléatoire de numéros de téléphone.

Modèle d'échantillonnage. Rappelons que la recherche avait pour objectif de mesurer l'évolution de l'utilisation du français comme langue de consommation des médias. Pour ce faire, et afin de décrire le plus exactement possible la réalité vécue dans certaines grandes régions du Québec, nous avons opté pour un modèle d'échantillonnage stratifié et non proportionnel. En effet, il nous semblait que la population, en consommant l'un ou l'autre média, avait très souvent la possibilité d'utiliser le français ou l'anglais dans la zone Montréal et dans les zones qui longent l'Ontario et les États-Unis (zone frontalière), mais beaucoup moins ailleurs au Québec (zone-province). Nous avons alors suréchantillonné ces deux zones par rapport à la zone-province et tenté ainsi d'obtenir un meilleur éventail de l'utilisation du français dans la consommation des médias qui y a cours.

Ceci dit, il nous apparaît maintenant important de définir un peu mieux les trois grandes zones dont nous venons de parler. La zone Montréal représente tous les numéros de téléphone utilisés dans la région métropolitaine du recensement, ce qui correspond à peu près au contenu des cinq annuaires téléphoniques qui couvrent cette région. La zone frontalière est constituée des numéros de téléphone qui sont attribués à l'ensemble des divisions du recensement longeant l'Ontario et les États-Unis6. La zone-province, quant à elle, regroupe tous les autres numéros de téléphone que nous pouvons retrouver au Québec. Le tableau A-1 présente d'abord le nombre de numéros de téléphone possiblement valides en banque, la fraction d'échantillonnage qui a été retenue pour chacune de ces régions et, enfin, le nombre de numéros de téléphone sélectionnés.




5 Cette génération aléatoire a été rendue possible grâce à André Beauchamp qui a écrit le programme nécessaire à la réalisation de l'opération par ordinateur. [retour au texte]

6 Il s'agit des divisions du recensement de Pontiac, Hull, Papineau, Argenteuil, Huntingdon, Saint-Jean, Missisquoi, Stanstead, Sherbrooke et Gatineau. [retour au texte]





TABLEAU A-1

Échantillonnage des numéros de téléphone, selon les zones




Bref, ce modèle d'échantillonnage devrait nous permettre une meilleure évaluation de la situation dans les zones où il y a plus de difficultés linguistiques.

2. Résultats de la cueillette

La cueillette des données a été réalisée par entrevues téléphoniques d'une durée moyenne de 30 minutes entre le 27 mai et le 20 juillet 1979. Ce travail a été réalisé à partir de nos bureaux situés à Montréal, sous la supervision constante d'une surveillante qui coordonnait et vérifiait le travail de quelque 15 interviewers.

Les résultats obtenus. Dans un premier temps, l'interviewer devait établir la validité du numéro de téléphone à composer. Ainsi, nous avons identifié des numéros où il n'y avait pas de service, des numéros de lignes en dérangement (même s'ils ont été composés plusieurs fois), des numéros non résidentiels (institutions, commerces, bureaux, etc.) et des numéros de résidence secondaire. Le tableau A-2 présente cette première étape, et ce, pour chacune des trois zones.



TABLEAU A-2

Validité des numéros de téléphone,
selon les zones




Dans le cas des numéros valides, l'interviewer devait tenter d'obtenir une entrevue. Dans un premier temps, il dressait la liste des personnes éligibles (18 ans et plus) et choisissait ensuite, à partir d'une grille de sélection, la personne à interviewer. Le questionnaire était alors soumis à la personne sélectionnée.

Les résultats obtenus pour l'ensemble de la province sont reproduits au tableau A-3. Ainsi, nous nous sommes heurtés à un certain nombre de « problèmes de langue », cas où il était impossible de communiquer en français ou en anglais (2,6 %). Nous n'avons pu contacter personne dans 8,8 % des numéros valides et ce, même après cinq tentatives ou plus. Nous avons essuyé un refus de la part de l'interlocuteur du ménage (refus avant d'avoir pu déterminer la personne à interviewer) dans 13,4 % des numéros valides qui ont été composés et un refus de la part de la personne sélectionnée dans 11,4 % des cas. L'entrevue, enfin, n'a pu être réalisée dans 3,9 % des cas, parce que la personne sélectionnée était absente et, dans 3,3 %, parce que cette personne était malade. Avec ces pertes, le taux de réponse s'élève à 56,4 %, un taux de réponse assez faible, mais qui s'explique par la longueur du questionnaire et la période où se sont déroulées les entrevues.



TABLEAU A-3

Résultat de la cueillette pour les numéros de téléphone valides, ensemble de la province




Les tableaux A-4, A-5 et A-6 présentent les mêmes résultats, mais en distinguant les trois zones qui ont été identifiées aux fins de la recherche. Les taux de réponse atteignent 49,8 % à Montréal (tableau A-4), 68,0 % dans la zone frontalière (tableau A-5) et 72,8 % dans la zone-province (tableau A-6).



TABLEAU A-4

Résultat de la cueillette pour les numéros de téléphone valides, zone Montréal




TABLEAU A-5

Résultat de la cueillette pour les numéros de téléphone valides, zone frontalière




TABLEAU A-6

Résultat de la cueillette pour les numéros de téléphone valides, zone-province




Bref, les résultats sont très satisfaisants, compte tenu du fait que la cueillette a été réalisée au début de la période de vacances et dans le voisinage des fêtes de la Saint-Jean et de la Confédération.

3. Pondération

Le modèle d'échantillonnage étant de type non proportionnel, il était nécessaire de pondérer les données recueillies, afin que chaque informateur puisse être estimé à sa juste valeur.

La pondération qui a été utilisée tout au long de notre analyse est très simple. Elle permet à chaque informateur de représenter la portion de la population à laquelle il appartient. Ainsi, elle peut être définie comme suit :

W i = I r x E i
W i : Poids de chaque informateur.
I r : Inverse de la fraction d'échantillonnage propre à chacune des zones.
E i : Nombre de personnes éligibles dans le ménage où l'informateur a été sélectionné.


Cette pondération théorique, par contre, doit être corrigée par le taux de réponse que nous avons obtenu dans chacune des trois zones. Ainsi, le poids théorique de chaque informateur devient :

P i = W i x T r
P i : Poids réel de chaque informateur.
W i : Poids théorique obtenu précédemment.
T r : Inverse du taux de réponse obtenu dans chacune des trois zones.


Le tableau A-7 présente les poids que nous avons déterminés pour les informateurs de chacune des zones.



TABLEAU A-7 Pondération



Pour des raisons pratiques, nous avons ramené notre échantillon pondéré au nombre de questionnaires complétés, soit à 1 493. Cette procédure est fréquemment utilisée dans les sondages, entre autres à cause de la variabilité du niveau de signification de nombreux tests statistiques en fonction de la taille de l'échantillon.

Le tableau A-8 permet de comparer la distribution des questionnaires complétés à celle des effectifs pondérés.



TABLEAU A-8 Résultats de la pondération



4. Degré de précision des données

Le degré de précision des données obtenues s'établit à + 2,6 % pour l'ensemble de la population québécoise dans le cas des résultats les plus hétérogènes.

5. Validation de l'échantillon

Avant de conclure cette annexe, nous tenons à valider, jusqu'à un certain point, l'échantillon des informateurs qui ont participé à cette enquête.

D'abord, il existe une certaine différence selon le sexe, entre la population du recensement et celle de notre échantillon, mais cette différence n'est pas significative. En effet, selon les données du recensement de 1976, la population des 20 ans et plus est composée à 48,6 % d'hommes et à 51,4 % de femmes. Notre échantillon, par contre, nous fournit une population de 46,9 % d'hommes et de 53,1 % de femmes. Il y a donc une distorsion de 1,7 % par rapport à cette distribution, ce qui est en deçà de la limite permise par le degré de précision de ce sondage.

Maintenant, si nous examinons la répartition de la population selon la langue maternelle, nous pouvons remarquer une certaine surreprésentation des francophones et une certaine sous-représentation des anglophones, les allophones étant dans les limites permises par le degré de précision propre à ce sondage.



TABLEAU A-9

Distribution de la population, selon la langue maternelle (en pourcentages)




Si, enfin, nous examinons les deux populations par rapport à l'âge, nous pouvons dire que, pour le sondage, nous avons obtenu une surreprésentation du groupe des 25-34 ans et une sous-représentation du groupe des 65 ans et plus. Les autres groupes se situent dans les limites permises par le degré de précision propre à ce sondage.



TABLEAU A-10

Distribution de la population, selon l'âge
(en pourcentages)




Dans l'ensemble, nous pouvons tout de même considérer les résultats de la cueillette comme très valables. Le taux de réponse est satisfaisant et les distorsions finalement assez mineures.

Comme dans tous les sondages, certains affirmeront que nous aurions pu corriger en utilisant les données du recensement; d'autres, par contre, se montreront très réticents à apporter de telles corrections puisqu'ils n'en contrôleraient pas les effets. En fait, si les distorsions sont mineures, la correction ne modifie pas tellement les résultats d'ensemble. Par contre, quand les biais sont très importants, on peut présumer que la correction impute, à l'ensemble d'un groupe de la population, des caractéristiques spécifiques aux personnes qui ont effectivement répondu. Pour notre part, nous avons donc choisi de ne pas corriger les données obtenues et d'analyser les résultats sans y apporter de tels facteurs de correction.






Annexe B

Table des matières

haut