Accéder au contenu principal
 

 
La situation démolinguistique du Québec

La situation
démolinguistique
du Québec




ANNEXE B

Présentation critique
des informations
contenues dans
les recensements,
concernant les caractéristiques
linguistiques individuelles




Les questions posées aux recensements depuis 1951 permettent d'apprécier l'évolution des caractéristiques linguistiques de la population du Québec et de ses diverses régions. Ces questions portaient d'abord sur la langue maternelle, c'est-à-dire la première langue apprise et encore comprise, de même que sur la connaissance du français et de l'anglais, définie comme l'aptitude d'une personne à soutenir une conversation dans l'une ou l'autre de ces langues. Depuis 1971, une nouvelle question portant cette fois sur la langue le plus souvent parlée à la maison est posée à l'échantillon des ménages choisis pour remplir un questionnaire plus élaboré.

Ces questions et les concepts auxquels elles font référence ne font pas l'unanimité parmi les personnes qui les utilisent dans leurs recherches1. Ainsi, la langue parlée à la maison fait l'objet de critiques parce qu'elle ne rendrait pas compte de la langue la plus importante utilisée par un individu, à la différence par exemple de la langue de travail ou de la langue parlée avec les amis2. On critique également la définition de la langue maternelle (il est stipulé qu'elle doit être encore comprise, ce qui en fait une caractéristique éventuellement variable dans le temps pour un même individu)3. Enfin, la définition de la capacité d'une personne à soutenir une conversation dans une langue donnée paraît subjective à plusieurs4.

Au-delà des critiques générales qui viennent d'être évoquées et qui sont le plus souvent justifiées, des éléments précis liés au processus de collecte et de traitement peuvent également affecter la qualité des informations utilisées ici. C'est sur ceux-ci que nous voulons surtout nous attarder. Décomposant dans toutes ses étapes le processus général de réalisation des recensements, nous identifions ainsi les points suivants :

  • la continuité dans la formulation des questions;
  • les problèmes liés au processus de collecte;
  • le traitement de l'information par Statistique Canada;
  • les erreurs de déclaration;
  • les erreurs de couverture;
  • les problèmes liés aux modes de saisie de l'information;
  • la représentativité de l'échantillon.



1 Pour une discussion plus fouillée des concepts sous-jacents à ces questions, voir : Linda Demers, Évaluation de la qualité des informations ethniques et linguistiques fournies par les recensements canadiens de 1901 à 1976, Montréal, Université de Montréal, Département de démographie, mémoire de maîtrise, 1979, 147 p. [retour au texte]

2 Calvin Veltman, « La politique linguistique québécoise et le comportement des jeunes Québécois d'origine grecque et portugaise ». Cahiers québécois de démographie, vol. 14, n° 1, 1985, pp. 99-108. [retour au texte]

3 Réjean Lachapelle, « Quelques notes à propos de la comparabilité de la composition par langue maternelle aux recensements de 1971 et de 1976 », Cahiers québécois de démographie, vol. 6, n° 3, 1977, pp. 93-136. [retour au texte]

4 Charles Castonguay, « Transferts et semi-transferts linguistiques au Québec d'après le recensement de 1981 », Cahiers québécois de démographie, vol. 14, n° I, 1985, pp. 59-84 ; Calvin Veltman, loc. cit. [retour au texte]




Même si d'un recensement à l'autre la formulation des questions connaît quelques modifications, il ne semble pas que celles-ci soient significatives, surtout pas en regard d'autres éléments dont l'effet paraît beaucoup plus important5. Parmi ces derniers, il faut surtout souligner le changement intervenu en 1971 dans le processus de collecte. En effet, à partir de cette date, les formulaires du recensement ne sont plus remplis par des recenseurs, mais bien plutôt par les personnes recensées elles-mêmes (processus d'autodénombrement). Ce changement a donné lieu à deux phénomènes dont l'ampleur était jusque-là négligeable : un certain nombre de personnes n'ont pas répondu aux questions portant sur la langue (non-réponse) ou ont fourni plus d'une réponse (réponses multiples)6.

Avant 1981, seules des estimations globales de la proportion de ces deux types de réponse sont disponibles (tableau B. l). En 1981, la fréquence de ces « erreurs » de déclaration est mieux connue et paraît s'être réduite, au Québec comme au Canada, par rapport aux recensements précédents au Québec, les non-réponses représentent alors 0,5 % de l'ensemble des réponses à la question relative à la langue maternelle et 0,7 % pour celle de la langue parlée à la maison, toujours plus importante, la proportion des réponses multiples atteint 2,1 % dans le premier cas et 2,0 % dans le second. Même s'ils sont moins nombreux qu'auparavant, ces cas « problématiques », et le traitement dont ils font l'objet par Statistique Canada, soulèvent des questions fondamentales sur le sens qu'il faut leur donner.




5 Linda Demers, op. cit. [retour au texte]

6 Chaque personne est tenue de fournir une réponse unique aux questions concernant les variables linguistiques. Pour la langue parlée à la maison, on précise par exemple en 1981 que si plus d'une langue est parlée, la personne doit déclarer celle qu'elle utilise le plus fréquemment. Cette précision n'apparaît pas pour la langue maternelle qui est la première langue apprise et encore comprise, et donc par définition unique (ce qui n'est cependant peut-être pas toujours le cas). [retour au texte]




Statistique Canada considère clairement ces réponses comme des erreurs, les personnes étant tenues d'indiquer une et une seule réponse aux questions portant sur les variables linguistiques. Certes, une partie de ces réponses résulte vraisemblablement d'erreurs ou d'omissions accidentelles de la part des personnes recensées, mais peut-on raisonnablement les considérer comme telles dans leur ensemble? On en doute, car des situations complexes et transitoires en termes de mobilité linguistique s'accommodent mal de la contrainte de la réponse unique. Les résultats d'autres enquêtes confirment d'ailleurs qu'il s'agit là d'un phénomène répandu7.



Tableau B.1 Proportion (en %) de non-réponses et de réponses multiples aux questions portant sur la langue maternelle et la langue d'usage, Québec et Canada, 1971 à 1981



7 Luc Albert et Brian Harrison, Les données linguistiques des recensements récents au Canada, communication présentée au 52e congrès de l'Association canadienne-française pour l'avancement des sciences (ACFAS), section démographie, Québec, 10-11 mai 1984, tableaux 12 et 13. [retour au texte]




Des données rendues publiques récemment par Statistique Canada concernant les langues déclarées permettent de caractériser les non-réponses et les déclarations multiples selon l'âge, la connaissance du français et de l'anglais, et l'origine ethnique8. Elles indiquent d'abord des différences selon l'âge dans la distribution des réponses ayant dû être traitées les cas de non-réponses sont en effet plus fréquents chez les jeunes de 0 à 14 ans que parmi les autres groupes, ce qui n'est pas le cas des déclarations multiples (tableau B.2).

L'examen des déclarations multiples de type français-anglais, qui constituent le cas le plus fréquent de déclarations multiples traité par Statistique Canada (65 %), révèle une nette surreprésentation des personnes connaissant à la fois le français et l'anglais par rapport aux cas de réponses uniques « français » ou « anglais » (tableau B.3)9. Cette surreprésentation est encore plus prononcée chez les 0-14 ans : alors que respectivement 5 % et 37 % des personnes de langue maternelle unique française ou anglaise de cet âge se déclarent (ou, plutôt, ont été déclarées) bilingues, cette proportion atteint 79 % dans le cas des doubles déclarations français-anglais. Un lien très net apparaît par ailleurs entre le fait de ne pas répondre à la question relative à la langue maternelle et le fait de ne pas répondre à celle portant sur la connaissance du français et de l'anglais, ou de déclarer ne connaître ni le français ni l'anglais.

Le croisement des variables linguistiques avec l'origine ethnique des personnes recensées pose des problèmes de cohérence qui ont déjà été soulevés dans le cas de recensements précédents10 et qui se manifestent à nouveau au recensement de 198111. Ces problèmes apparaissent surtout lorsqu'on examine en les croisant les déclarations de langue maternelle, de langue parlée et d'origine ethnique; aussi sont-ils traités plus spécifiquement dans le chapitre consacré à l'étude de la mobilité linguistique.




8 Dans une étude récente, Charles Castonguay, loc. cit., fait également appel à ce type de données. Voir en outre : Jacques Henripin, « Les Québécois dont la langue est flottante et la mobilité linguistique », Cahiers québécois de démographie, vol. 14, n° 1, 1985, pp. 87-97. [retour au texte]

9 Luc Albert et Brian Harrison, loc. cit., tableau 10. [retour au texte]

10 Charles Castonguay, « Quelques remarques sur les données du recensement de 1971 concernant la langue et l'origine ethnique », Cahiers québécois de démographie, vol. 5, n° 2, 1976, pp. 211-241. [retour au texte]

11 Charles Castonguay, « Transferts et semi-transferts linguistiques au Québec d'après le recensement de 1981 », Cahiers québécois de démographie, vol. 14, n° 1, 1985, pp. 59-84, et « L'évolution des transferts linguistiques au Québec, selon les recensements de 1971 et 1981 », dans L'état de la langue française au Québec. Bilan et prospective, Québec, Conseil de la langue française, « Notes et documents », n° 58, 1986, t. 1, pp. 229 et 231; Jacques Henripin, loc. cit. [retour au texte]




Tableau B.2 Types de réponses aux questions linguistiques, selon l'âge des répondants, Québec, 1981


Tableau B.3 Types de déclarations de langue maternelle et connaissance du français et de l'anglais, parmi la population âgée de 0-14 ans
et pour l'ensemble des âges, Québec, 1981


Loin d'épuiser les possibilités d'analyse concernant des phénomènes aussi complexes, les résultats précédents n'en suggèrent pas moins que les « erreurs » traitées par Statistique Canada ne sont pas qu'aléatoires, puisqu'elles affectent des sous-groupes particuliers. Elles ont vraisemblablement un sens qu'il faudrait s'attacher à cerner. Espérant que Statistique Canada saura en tenir compte dans un avenir rapproché, il nous reste à composer avec les limites des données actuelles pour tenter d'en faire l'analyse la plus adéquate possible. À cet égard, le traitement des réponses erronées par Statistique Canada, variable d'un recensement à l'autre, doit surtout faire l'objet d'un examen attentif, parce qu'il peut affecter considérablement la comparabilité des données dans le temps.

Au recensement de 1971, les non-réponses ont été réparties selon une méthode complexe qui correspond approximativement à une répartition au prorata12; elles n'ont pas été réparties en 1976, mais plutôt publiées comme telles, tandis qu'en 1981, elles font l'objet d'une attribution sur la base d'un « dossier donneur » présentant des caractéristiques familiales similaires13. Quant aux réponses multiples, elles sont résolues dans une seconde étape sur la base de probabilités favorisant en 1971 les langues autres que le français et l'anglais, puis favorisant au contraire ces dernières langues en 1976, et enfin à partir d'autres algorithmes complexes en 1981 (tableau B.4).

Lachapelle14 en particulier a déjà mis en évidence les problèmes de comparabilité des données linguistiques des recensements de 1971 et 1976, essentiellement tributaires des changements intervenus dans le mode de répartition des réponses multiples impliquant une langue « autre ». Devant l'impossibilité de « corriger » les chiffres du recensement de 1971 pour les rendre cohérents avec ceux de 1976, il retient plutôt l'idée d'effectuer la correction en sens inverse. La nouvelle répartition des groupes linguistiques ainsi obtenue pour le recensement de 1976 est celle qu'il utilise par la suite15.

Des études ultérieures, portant cette fois sur la comparabilité des résultats du recensement de 1981 par rapport aux recensements antérieurs, indiquent que le choix précédent — bien que forcé — était des plus heureux, puisque les résultats du traitement appliqué en 1981 s'apparentent bien davantage aux probabilités retenues en 1971 qu'à celles de 1976 (tableau B.4)16. Comme l'attestent diverses répartitions (tableau B.5), il ne parait pas nécessaire ici d'appliquer de correctif particulier aux données provenant du recensement de 1981, même si les non-réponses n'ont pas été traitées exactement de la même manière17. Le même raisonnement s'appliquerait aux données relatives à la langue parlée à la maison. Par ailleurs, nous utilisons pour le recensement de 1976 la répartition corrigée par Lachapelle pour la langue maternelle.




12 Réjean Lachapelle, loc. cit. [retour au texte]

13 Statistique Canada, Recensement du Canada 1981, Population. Langue maternelle, langue officielle et langue parlée à la maison, Ottawa, catalogue n° 92-910. [retour au texte]

14 Réjean Lachapelle, loc. cit. [retour au texte]

15 Réjean Lachapelle et Jacques Henripin, La situation démolinguistique au Canada, évolution passée et prospective, Montréal, L'Institut de recherches politiques, 1980, xxxii - 391 p. [retour au texte]

16 Linda Demers et John Kraft, De la comparabilité des données du recensement sur la langue maternelle, 1976-1981, Ottawa, Statistique Canada, Division des caractéristiques sociales, du logement et des familles, 1984, 29 p. (miméo). [retour au texte]

17 Au recensement de 1981, les non-réponses à la question portant sur la langue maternelle ont été réparties dans les faits de la façon suivante : français, 65 %; anglais, 12 % et « autre », 23 %. [retour au texte]




Tableau B.4 Résumé des règles d'attribution (1971 et 1976) et répartition effective (1981) des déclarations multiples de langue maternelle, Québec, recensements de 1971 à 1981


Cette analyse et les corrections auxquelles elle nous amène valent pour l'étude historique de la composition linguistique de la population québécoise, étude qui ne paraît pas affectée par ces problèmes. Un examen plus approfondi de la situation s'impose cependant lorsqu'il s'agit de l'impact de ces problèmes sur la mesure de la mobilité linguistique. Nous y consacrons une partie du chapitre portant sur cette question.

Le traitement de l'information par Statistique Canada ne se limite pas aux seules réponses « erronées ». Il consiste aussi en une correction des réponses à la question sur la connaissance du français et de l'anglais, de façon à en assurer la cohérence avec les informations relatives à la langue maternelle et à la langue parlée à la maison. Cette correction ne paraît pas avoir de conséquences importantes pour l'analyse, même si l'on tient compte des changements intervenus en 198118.

De manière plus générale, Statistique Canada traite également les données qu'il publie afin d'assurer la confidentialité des résultats. Le processus d'arrondissement aléatoire qui en résulte modifie évidemment certains résultats; son effet sur les analyses est généralement considéré comme mineur, mais peut être important lorsque le nombre de personnes touchées est peu élevé (par exemple, lorsqu'il s'agit de caractéristiques plutôt rares, dans des aires géographiques restreintes).




18 En 1971 et aux recensements précédents, une personne de langue maternelle ou de langue parlée française ou anglaise devait nécessairement affirmer pouvoir soutenir une conversation dans cette langue. En 1981 ce raisonnement a été appliqué à la seule langue parlée à la maison. L'effet de cette différence sur les compositions linguistiques observées est négligeable. [retour au texte]




Tableau B.5 Composition linguistique de la population selon la langue maternelle d'après quatre hypothèses de répartition des non-réponses et des réponses multiples, Québec, 1981


Les non-réponses ou les déclarations multiples ne constituent pas les seuls problèmes de déclaration. D'autres erreurs, moins visibles, affectent sûrement les réponses uniques, pour des raisons variées telles qu'une mauvaise compréhension de la question ou la tendance qu'aurait une personne ou un groupe à y répondre, par intérêt, dans un sens différent de celui demandé. Le nombre ainsi que le sens de ces « mauvaises » déclarations varient probablement avec le contexte politique et linguistique19. Ainsi, on a récemment émis l'hypothèse que la proportion de personnes bilingues observée parmi les Québécois du groupe anglais au recensement de 1981 serait surestimée à cause d'erreurs de déclaration20. D'autres erreurs de ce type sont possibles, et la cohérence (dans le temps, par exemple) des résultats enregistrés est souvent la seule indication qui permette de les détecter.

Les erreurs de couverture (sous-dénombrement ou surdénombrement, mesurés pour les recensements récents au moyen d'une enquête de contre-vérification des dossiers) sont un autre élément affectant la qualité des informations en provenance des recensements. Nettement plus fréquent, le phénomène de sous-dénombrement parait d'autant moins négligeable qu'il varie d'un recensement à l'autre et qu'il n'affecte pas tous les groupes de la même façon (tableau B.6). S'il a peu d'effet sur l'analyse de variables tirées d'un seul recensement et peut d'ailleurs difficilement faire l'objet de corrections appropriées dans ce cas, il n'en va plus de même lorsqu'il s'agit d'établir des tables de mortalité ou des bilans démographiques, comme on le constate dans la présente étude. Des corrections ont d'ailleurs été appliquées dans ce dernier cas.




19 Un exemple souvent cité de ce type d'erreur de déclaration est celui des Allemands, dont le nombre avait subitement considérablement diminué peu après la Seconde Guerre mondiale. Voir Norman B. Ryder, « The Interpretation of Origin Statistics », Canadian Journal of Economics and Political Science, vol. 21, n° 4, 1955, pp. 466-479. [retour au texte]

20 Une enquête réalisée en 1973 et utilisant une question analogue à celle du recensement de 1971 montre que les gens ont généralement tendance à surestimer leur connaissance de la langue seconde, et ce, davantage chez les anglophones que chez les francophones. Voir Paul Lamy, « The Validity of the 1971 Census Language Data », dans : Paul Lamy (ed.), Language Maintenance and Language Shift in Canada, Ottawa, Les Presses de l'Université d'Ottawa, 1977. Des opinions similaires concernant le recensement de 1981 ont été entendues à la Commission parlementaire qui siégeait en février 1985 sur la question d'une politique de population pour le Québec. Voir Michel Paillé, Aspects démolinguistiques de l'avenir de la population du Québec, Québec, Conseil de la langue française, « Notes et documents », n° 53, 1986, 71 p., pp. 37-40. [retour au texte]




Enfin, deux autres facteurs peuvent entacher la qualité de l'information obtenue à partir des recensements. Les lacunes dans le mode de saisie des données, bien qu'un peu théoriques, ont néanmoins paru importantes en 1976 alors que des codes, réels ou fictifs, ont été lus par erreur pour une partie des questionnaires21. La question de la représentativité de l'échantillon des ménages auxquels sont adressés les questionnaires longs apparaît également problématique, d'une part parce que les résultats qui en découlent n'ont pas la même valeur que ceux obtenus à partir de l'ensemble de la population, et d'autre part parce que le niveau de l'échantillonnage a varié d'un recensement à l'autre22. Ce problème est plus important encore lorsque le découpage est fin et le nombre de cas restreint.



Tableau B.6 Taux de sous-dénombrement
selon la langue, Québec, recensements
de 1971 à 1981


Plusieurs éléments viennent donc mettre en cause la qualité des informations recueillies au moment d'un recensement ainsi que leur comparabilité dans le temps. Si l'impact de certains d'entre eux peut être mesuré et atténué dans une certaine mesure, il n'en va pas de même pour tous il est difficile par exemple d'évaluer l'influence du contexte sociopolitique sur les réponses obtenues. Chaque recensement pris séparément souffre moins de ces différentes lacunes, ou du moins en est-il affecté de façon plus homogène. La prudence s'impose surtout lorsqu'on compare les résultats de plusieurs recensements successifs.




21 Réjean Lachapelle, loc. cit. [retour au texte]

22 En 1971, il s'agissait du tiers des ménages, tandis qu'en 1981 ce pourcentage a été abaissé à 20 %. [retour au texte]





haut