Accéder au contenu principal
 

 
Les jeunes et la langue - Tome I

Les jeunes
et la langue

tome I

Usages et attitudes
linguistiques des jeunes qui
étudient en français
(de la 4e année du secondaire
à la fin du collégial)






Annexe A


Construction des indices



Note technique au sujet des indices

Avantages de l'utilisation d'indices

On peut citer trois raisons principales pour l'utilisation d'indices composés dans une étude sociologique1. D'abord, les concepts complexes ne peuvent être saisis normalement par un seul indicateur. Parfois, il faut plusieurs variables ou questions pour couvrir l'ensemble d'une notion théorique (telle que l'identification linguistique), parfois une variable n'est pas également valide ou fiable pour l'ensemble des sous-échantillons (comme la question 139 de notre questionnaire).

Ensuite, il est souvent avantageux d'analyser des variables ordinales qui permettent de placer plusieurs points représentant des personnes sur un axe vertical allant d'une extrémité à l'autre. Un seul indicateur ne se prête pas nécessairement à cela, même s'il est valide et précieux en soi. Par exemple, la langue maternelle anglaise du meilleur ami indique un contact avec le monde anglophone, mais il serait préférable d'utiliser un indice comprenant plusieurs variables si l'on veut exprimer de façon plus précise l'importance des contacts.

Enfin, les indices sont des outils efficaces de présentation de données. Si nous voulions étudier, par exemple, la relation entre les contacts avec les anglophones et l'usage de l'anglais, nous pourrions présenter neuf tableaux de croisements entre trois mesures de contact et trois mesures de comportement langagier. Cette façon de faire alourdirait considérablement l'analyse sans en augmenter l'intérêt sur le plan théorique. Un seul croisement de deux indices serait plus efficace et permettrait d'explorer plus en profondeur leur relation, parce qu'il donnerait la possibilité d'introduire des variables de contrôle.

On perd du détail2 en se servant d'un indice, mais si l'indice est valide et fiable, l'analyse n'en souffrira que peu. En voici la preuve pour l'exemple du comportement langagier. Une analyse de régression des indices de contacts (IN18) et d'usage du français (IN15) montre une relation forte : IN18 explique 40,2 % de la variance de IN15. Si au lieu de l'indice 18 nous calculons l'apport des 18 variables de contacts, une par une, nous arrivons à expliquer 45,9 % de la variance de IN15. Ce dernier résultat est certes meilleur, mais il est, somme toute, peu différent du premier.




1 Cette présentation suit l'exposé de Babbie (1973 : 335-362) au sujet des indices et des échelles. [retour au texte]

2 Un indice est un instrument de « réduction des données ». Il est important de ne pas réduire ou effacer le détail là où il est essentiel. C'est pourquoi nous présentons toujours les variables individuelles avant de nous servir des indices aux fins d'une analyse multivariée. [retour au texte]




Problèmes de pondération

On peut manipuler l'importance relative des variables à l'intérieur d'un indice par une pondération selon certains critères d'ordre théorique ou statistique. Cela peut modifier les valeurs attribuées à certains répondants et, donc, les relations observées entre l'indice et d'autres variables.

Les arguments pour une pondération inégale des composantes peuvent renvoyer aux variables elles-mêmes ou à la structure de l'indice. Par exemple, on pourrait dire que la télévision absorbe plus de temps chez les jeunes que le théâtre; la variable Q17 pourrait alors recevoir deux ou trois ou même cinq fois le poids de la variable Q26, dans un indice comme IN15. En se référant à la structure d'un indice, on pourrait proposer que les contacts volontaires et involontaires méritent un poids identique, quel que soit leur nombre de composantes, et les pondérer selon ce principe.

Les arguments contre la pondération se résument ainsi :
  • Toute pondération inégale fait accroître la distance entre les données et la personne qui les lit. On peut facilement perdre de vue la « matière première » de la recherche si une même catégorie de l'indice peut être attribuée de trop de manières différentes.

  • L'information qui justifierait la pondération inégale n'est souvent pas disponible ou, du moins, n'est pas de qualité suffisante. Par exemple, le questionnaire de 1978 contenait des questions sur les heures passées à lire des livres ou des journaux, à écouter la radio et à regarder la télévision. Mais cette information s'est avérée de qualité très inégale et n'a pas permis la pondération de l'indice. Cette démarche n'a donc pas été retenue pour le questionnaire de 1990.

  • La pondération inégale est souvent plus arbitraire que la non-pondération (qui est par défaut égale). Par exemple, qui nous dit que c'est la durée plutôt que l'intensité d'une expérience qui compte le plus? Une heure de radio — de la musique en arrière-plan — vaut-elle vraiment une heure de théâtre ou une heure de lecture?

  • La pondération inégale est un outil très peu efficace. Elle occasionne un coût élevé (par la transformation des données et la dissimulation des variables originales) sans nécessairement offrir beaucoup de bénéfices. D'un côté, la fiabilité statistique (coefficient alpha) reste exactement la même, que l'indice soit pondéré ou non3. De l'autre côté, même un indice fortement « pondéré » produit souvent des résultats très similaires à ceux d'un indice « non pondéré ». Pour reprendre l'exemple de l'influence des contacts (IN18) sur le comportement langagier (IN15), on pourrait penser qu'à cause du caractère volontaire du comportement langagier, les contacts volontaires devraient être pondérés deux fois plus que les contacts involontaires à l'intérieur de l'indice 18. Nous avons suivi ce raisonnement et voici les résultats de la régression IN18-IN15 : la variance expliquée par les contacts passe de 40,2 % à 40,3 %. Les bénéfices analytiques de cette pondération n'en justifient pas les coûts.




3 Les calculs à la base de l'alpha de Cronbach prennent en considération l'ordre des cas (rank order) et non pas les valeurs absolues. [retour au texte]




Pour toutes ces raisons pratiques ainsi que pour d'autres, plus théoriques, la pondération inégale devrait être une exception. C'est une technique qu'on ne devrait adopter que pour des motifs vraiment impérieux. La pondération égale devrait être la norme. Nous avons renoncé à toute pondération inégale dans la présentation des résultats4.

Validité et fiabilité des indices

Nous mesurons la validité d'un indice en évaluant chaque variable selon ses aspects théoriques et empiriques. Mesure-t-elle vraiment ce qu'elle doit mesurer? Est-ce que les résultats donnent raison à l'argument théorique? Nous montrons dans le tableau B-14 que la validité ne pose aucun problème pour les indices 15 et 16. Par contre, elle est très marginale pour l'indice 27. Nous ne ferons donc pas un usage indépendant de cet indice, même si ses quatre variables ont une place légitime dans l'indice 28.

Une mesure valide n'est pas nécessairement fiable lorsqu'elle change de contexte. Si la validité doit être examinée avant tout de manière théorique et conceptuelle, la fiabilité tombe dans le domaine de la statistique. Le coefficient alpha nous indique la cohérence interne d'un indice. Un alpha d'au moins 0,70 est généralement accepté comme preuve de fiabilité, et des valeurs entre 0,60 et 0,70 peuvent être acceptées sous réserve. Un coefficient plus bas n'indique pas que le matériel est sans valeur, mais simplement qu'on devrait s'en servir sous forme de variable individuelle plutôt que comme indice.




4 Cela dit, nous admettons volontiers que le choix des variables représente, à lui seul, une sorte de pondération. Par exemple, nous avons donné un poids considérable à la relation avec les trois meilleurs amis (6 variables) à l'intérieur de nos indices de contacts (9 et 18 variables). Mais cette quasi-pondération n'a pas les effets négatifs de la pondération mathématique. [retour au texte]




Tous les indices utilisés s'appliquent à l'ensemble de l'échantillon. Dans la présente annexe, nous présentons donc toujours le matériel et les coefficients concernant tous les répondants. Mais l'interprétation de certaines questions d'attitudes peut changer d'un groupe linguistique à l'autre. C'est pour cette raison que, dans l'ouvrage, nous nous limitons aux seuls répondants francophones lorsque nous présentons les attitudes sous la forme des indices 16, 27 et 28.






Indices employés dans le présent ouvrage
sur la conscience linguistique

Indice 10 Connaissance de la situation linguistique (1978 et 1990)
Indice 13 Compétence en français (1978 et 1990)
Indice 14 Compétence en anglais (1978 et 1990)
Indice 15 Usage du français dans les activités culturelles (1978 et 1990)
Indice 16 Identification linguistique (1978 et 1990)
Indice 18 Contacts avec les anglophones (1990)
Indice 27 Convictions au sujet de la langue française (1978 et 1990)
Indice 28 Conscience linguistique (1978 et 1990)





INDICE 10 — Connaissance de la situation linguistique (1978)

10.1 Liste des questions et distribution des réponses correctes
(Q70, Q71 , Q72, Q75)


10.2. Construction de l'indice

Addition des quatre variables, en donnant un point pour chaque bonne réponse. Toute question laissée sans réponse compte pour une mauvaise réponse. Standardisation entre 0,0 (aucune bonne réponse) et 1,0 (quatre bonnes réponses).

10.3 Corrélations entre variables et indice


10.4. Distribution des fréquences de l'indice


INDICE 10 — Connaissance de la situation linguistique (1990)

10.1 Liste des questions et distribution des réponses correctes
(Q123, Q125, Q126, Q127)


10.2 Construction de l'indice

Addition des quatre variables, en donnant un point pour chaque bonne réponse. Toute question laissée sans réponse compte pour une mauvaise réponse. Standardisation entre 0,0 (aucune bonne réponse) et 1,0 (quatre bonnes réponses).

10.3 Corrélations entre variables et indice


10.4 Distribution des fréquences de l'indice


INDICE 13 — Compétence en français (1978)

13.1 Liste des questions et distribution des réponses (en pourcentage)
(Q32A, Q32B, Q32C, Q32D)


13.2 Construction de l'indice

Addition des quatre variables, en donnant un point pour « très mal » ou « pas du tout », deux points pour « mal », trois points pour « passablement », quatre points pour « bien », cinq points pour « très bien » et six points pour « parfaitement ». Standardisation de 0,0 (peu de compétence) à 1,0 (compétence excellente).

13.3 Corrélations entre variables et indice


13.4 Distribution des fréquences de l'indice


INDICE 13 — Compétence en français (1990)

13.1 Liste des questions et distribution des réponses correctes (en pourcentage)
(Q70, Q71, Q72, Q73)


13.2 Construction de l'indice

Addition des quatre variables, en donnant un point pour « très mal » ou « pas du tout », deux points pour « mal », trois points pour « passablement », quatre points pour « bien », cinq points pour « très bien » et six points pour « parfaitement ». Standardisation de 0,0 (peu de compétence) à 1,0 (compétence excellente).

13.3 Corrélations entre variables et indice


13.4 Distribution des fréquences de l'indice


INDICE 14 — Compétence en anglais (1978)

14.1 Liste des questions et distribution des réponses (en pourcentage)
(Q33A, Q33B, Q33C, Q33D)


14.2 Construction de l'indice

Addition des quatre variables, en donnant un point pour « très mal » ou « pas du tout », deux points pour « mal », trois points pour « passablement », quatre points pour « bien », cinq points pour « très bien » et six points pour « parfaitement ». Standardisation de 0,0 (peu de compétence) à 1,0 (compétence excellente).

14.3 Corrélations entre variables et indice


14.4 Distribution des fréquences de l'indice


INDICE 14 — Compétence en anglais (1990)

14.1 Liste des questions et distribution des réponses (en pourcentage)
(Q75, Q76, Q77, Q78)


14.2 Construction de l'indice

Addition des quatre variables, en donnant un point pour « très mal » ou « pas du tout », deux points pour « mal », trois points pour « passablement », quatre points pour « bien », cinq points pour « très bien » et six points pour « parfaitement ». Standardisation de 0,0 (peu de compétence) à 1,0 (compétence excellente).

14.3 Corrélations entre variables et indice


14.4 Distribution des fréquences de l'indice


INDICE 15 - Usage du français dans les activités culturelles (1978)

15.1 Liste des questions et distribution des réponses (en pourcentage)
(Q9A, Q13A1, Q13B1, Q13C1, Q13E1, Q13G1)


15.2. Construction de l'indice

Un cas est exclu de la construction de l'indice lorsqu'une ou plusieurs des réponses aux questions 9A, 13A1, 13B1 et 13C1 n'ont pas été obtenues. L'indice sera basé sur ces quatre dernières variables seulement quand une ou les deux réponses sont manquantes pour les questions 13E1 et 1361.

Addition des variables en donnant un point pour « uniquement en anglais », deux points pour « surtout en anglais », trois points pour « autant en français qu'en anglais », quatre points pour « surtout en français » et cinq points pour « uniquement en français ». Standardisation de 0,0 (anglais seulement) à 1,0 (français seulement).

15.3 Corrélations entre variables et indice


15.4 Distribution des fréquences de l'indice


INDICE 15 — Usage du français dans les activités culturelles (1990)

15.1 Liste des questions et distribution des réponses (en pourcentage)
(Q17, Q18, Q19, Q20, Q22, Q25)


15.2 Construction de l'indice

Un cas est exclu de 1a construction de l'indice lorsqu'une ou plusieurs des réponses aux questions 17, 18, 19 et 25 n'ont pas été obtenues. L'indice sera basé sur ces quatre variables seulement quand une ou les deux réponses sont manquantes pour les questions 20 et 22.

Addition des variables en donnant un point pour « uniquement en anglais », deux points pour « surtout en anglais », trois points pour « autant en français qu'en anglais », quatre points pour « surtout en français » et cinq points pour « uniquement en français ». Standardisation de 0,0 (anglais seulement) à 1.0 (français seulement).

15.3 Corrélations entre variables et indice


15.4 Distribution des fréquences de l'indice


INDICE 16 — Identification linguistique (1978)

16.1 Liste des questions et distribution des réponses (en pourcentage)
(Q25M, Q25D, Q25G, Q250, Q25F, Q25N)


16.2 Construction de l'indice

Lorsque la réponse à la question 25G est manquante, l'indice est calculé avec les cinq autres questions. Un cas est exclu de la construction de l'indice quand une ou plusieurs des réponses aux questions 25 M, 25D, 250, 25F et 25N n'ont pas été obtenues.

Addition des variables en donnant un point pour « désaccord complet », deux points pour « désaccord », trois points pour « accord », quatre points pour « accord complet » pour les variables 1, 3, 4 et un point pour « accord complet », deux points pour « accord », trois points pour « désaccord », quatre points pour « désaccord complet » pour la variable 2. Standardisation de 0,0 (identification faible) à 1,0 (identification forte).

16.3 Corrélations entre variables et indice


16.4 Distribution des fréquences de l'indice


INDICE 16 — Identification linguistique (1990)

16.1 Liste des questions et distribution des réponses (en pourcentage)
(Q137, Q59, Q62, Q139, Q61, Q138)


16.2 Construction de l'indice

Lorsque la réponse à la question 62 est manquante, l'indice est calculé avec les cinq autres questions. Un cas est exclu de la construction de l'indice quand une ou plusieurs des réponses aux questions 137, 59, 139, 61 et 138 n'ont pas été obtenues.

Addition des variables en donnant un point pour « désaccord complet », deux points pour « désaccord », trois points pour « accord », quatre points pour « accord complet » pour les variables 1, 3, 4 et un point pour « accord complet », deux points pour « accord », trois points pour « désaccord », quatre points pour « désaccord complet » pour les variables 2, 5 et 6. Standardisation de 0,0 (identification faible) à 1,0 (identification forte).

16.3 Corrélations entre variables et indice


16.4 Distribution des fréquences de l'indice


INDICE 18 — Contacts avec les anglophones (1990)

18.1 Liste des questions et distribution des réponses (en pourcentage)
(Q15, Q16, Q42, Q44, Q45, Q46B, Q47B, Q48, Q49, Q50, Q51, Q52, Q53, Q54, Q55, Q86, Q107, Q113)


18.2. Construction de l'indice

Chaque variable a été transformée de façon à donner un point lorsqu'il y avait contact avec le monde anglophone, et aucun point quand il n'y en avait pas. Ensuite, il y avait addition simple des variables et standardisation entre 0,0 (absence de contact) et 1,0 (contact fort). Un cas a été exclu de l'indice 18 lorsque l'information manquait pour plus de 6 variables sur 18 — ce qui s'est produit dans 0,5% des cas.

Deux autres indices ont été construits de la même manière: 18V pour les contacts volontaires et 18l pour les contacts involontaires. Les seuils d'exclusion sont toutefois différents dans ces indices. Un cas est exclu de l'indice 18V en raison de quatre réponses manquantes (sur neuf) et de l'indice 18I à cause de six réponses manquantes. Ces exclusions ne sont pas fréquentes; elles n'atteignent que 6,5 % pour IN18V et 0,1 % pour IN18l.

18.3 Corrélations entre variables et indice


18.4 Distribution des fréquences de l'indice


18.5 Corrélations entre variables et indice (contacts volontaires)


18.6 Distribution des fréquences de l'indice (contacts volontaires)


18.7 Corrélations entre variables et indice (contacts involontaires)


18.8 Distribution des fréquences de l'indice (contacts involontaires)


INDICE 27 — Convictions au sujet de la langue française (1978)

27.1 Liste des questions et distribution des réponses (en pourcentage)
(Q25B, Q25C, Q25E, Q25H)


27.2. Construction de l'indice

Addition des quatre variables en donnant quatre points pour « désaccord complet », trois points pour « désaccord », deux points pour « accord » et un point pour « accord complet » dans les variables 1 et 4, et un point pour « accord complet », en remontant, dans les variables 2 et 3. Exclusion des cas où il n'y avait pas de réponse ou lorsque celle-ci était « sans opinion » dans les variables 2, 3 ou 4. Quand cela arrivait dans la variable 1, le cas n'était pas exclu, mais l'indice était basé sur les trois autres variables seulement. Standardisation de 0,0 (conviction faible) à 1,0 (conviction forte).

27.3 Corrélations entre variables et indice


27.4 Distribution des fréquences de l'indice


INDICE 27 — Convictions au sujet de la langue française (1990)

27.1 Liste des questions et distribution des réponses
(Q57, Q58, Q60, Q63)


27.2 Construction de l'indice

Addition des quatre variables en donnant quatre points pour « désaccord complet », trois points pour « désaccord », deux points pour « accord » et un point pour « accord complet » dans les variables 1 et 4, et un point pour « accord complet », en remontant, dans les variables 2 et 3. Exclusion des cas où il n'y avait pas de réponse ou lorsque celle-ci était « sans opinion » dans les variables 2, 3 ou 4. Quand cela arrivait dans la variable 1, le cas n'était pas exclu, mais l'indice était basé sur les trois autres variables seulement. Standardisation de 0,0 (conviction faible) à 1,0 (conviction forte).

27.3 Corrélations entre variables et indice


27.4 Distribution des fréquences de l'indice


INDICE 28 — Conscience linguistique (1978)

28.1. Liste des questions
(Q9A, Q13A1, Q13C1, Q13E1, Q13G1, Q25M, Q25D, Q25G, Q250, Q25F, Q25N, Q25B, Q25C, Q25E, Q25H)

L'indice 28 étant composé des indices 15, 16 et 27, nous ne répétons pas ici les distributions des réponses. Il est toutefois utile de rappeler que les données de la présente annexe portent sur l'ensemble des répondants, tandis que, dans le texte, notre discussion de la conscience linguistique se limite aux élèves francophones.

28.2. Construction de l'indice

Addition des valeurs des indices 15,16 et 27, et standardisation du résultat entre 0,0 (conscience linguistique faible) et 1,0 (conscience linguistique forte). Le coefficient de fiabilité (alpha) peut tenir compte de ce traitement des indices 15, 16 et 27 comme éléments constituant l'indice 28. Il est cependant préférable de retourner aux variables distinctes de chacun des trois indices pour une analyse plus détaillée de la fiabilité de l'indice 28. Nous présentons le résultat des deux méthodes dans le tableau B-8 de l'annexe B. Nous nous limitons ici à l'analyse détaillée de l'indice 28, basée sur le traitement égal des 16 variables.

28.3 Corrélations entre variables et indice


28.4 Distribution des fréquences de l'indice


INDICE 28 — Conscience linguistique (1990)

28.1. Liste des questions
(Q17, Q18, Q19, Q20, Q22, Q25, Q137, Q59, Q62, Q139, Q61, Q138,
Q123, Q125, Q126, Q127)

L'indice 28 étant composé des indices 15, 16 et 27, nous ne répétons pas ici les distributions des réponses. Il est toutefois utile de rappeler que les données de la présente annexe portent sur l'ensemble des répondants, tandis que, dans le texte, notre discussion de la conscience linguistique se limite aux élèves francophones.

28.2. Construction de l'indice

Addition des valeurs des indices 15,16 et 27, et standardisation du résultat entre 0,0 (conscience linguistique faible) et 1,0 (conscience linguistique forte). Le coefficient de fiabilité (alpha) peut tenir compte de ce traitement des indices 15, 16 et 27 comme éléments constituant l'indice 28. Il est cependant préférable de retourner aux variables distinctes de chacun des trois indices pour une analyse plus détaillée de la fiabilité de l'indice 28. Nous présentons le résultat des deux méthodes dans le tableau B-8 de l'annexe B. Nous nous limitons ici à l'analyse détaillée de l'indice 28, basée sur le traitement égal des 16 variables.

28.3 Corrélations entre variables et indice


28.4 Distribution des fréquences de l'indice



haut