Analyse statistique du chiffre “100% des femmes harcelées”

Lors de la controverse sur le Raptor, on m’a reproché de citer une étude qui serait peu rigoureuse, celle du du Haut Conseil à l’Egalité des femmes et des hommes sur le harcèlement dans les transports en commun. Le HCEfh a publié une note sur le note harcèlement sexiste qu’il définit de la façon suivante:

Le harcèlement sexiste et les violences sexuelles dans l’espace public sont des manifestations du sexisme qui affectent le droit à la sécurité et limitent l’occupation de l’espace public par les femmes et leursdéplacements en son sein. Le harcèlement sexiste dans l’espace public se caractérise par le fait d’imposer tout propos ou comportement, à raison du sexe, de l’orientation ou de l’identité sexuelle supposée ou réelle d’une personne, qui a pour objet ou pour effet de créer une situation intimidante, humiliante, dégradante ou offensante portant ainsi atteinte à la dignité de la personne. Le harcèlement sexiste peut prendre des formes diverses comme par exemple des sifflements ou des commentaires sur le physique, non punis par la loi, ou des injures, punies par la loi.

L’étude du Haut Conseil à l’Egalité femme/homme a publié une étude avec un échantillon de 600 femmes [NDLR: et non 60 comme l’affirment les détracteurs] lors deux colloques en mars 2015. Chacune de ces femmes a affirmé avoir subi du harcèlement dans les transports en commun. Il leur a été demandé si elles ont été victime harcèlement sexiste au moins une fois dans leur vie dans les transports en commun (question sur un horizon temporel large et variable en fonction de l’âge des participantes). Ce qui a donné lieu au chiffre de 100% de femmes harcelées dans les transports en commun francilien:

deux consultations citoyennes menées dans le cadre d’événements qui se sont tenus début mars – les rencontres «Les femmes sont dans la place!» du Conseil général de l’Essonne et «Agir contre le harcèlement sexiste et sexuel dans les transports» de l’Observatoire des violences envers les femmes du Conseil général de la Seine-Saint-Denis, pendant lesquels il a été demandé aux 600 personnes participantes de témoigner du harcèlement dont elles ont pu être victimes, des stratégies d’évitement qu’elles ont mises en place, des
solutions à apporter et des écueils à éviter.

D’après la description des événements qu’on a ici, on apprend qu’un micro-trottoir a été réalisé à Evry lors du colloque «Les femmes sont dans la place!» tenu le 6 mars 2015.

Il a été reproché à cet échantillon d’être trop petit et non représentatif [NDLR: L’auteur du billet se trompe d’ailleurs en parlant de 60 personnes]. Pour comprendre le sujet de la discussion, nous devons nous interroger sur ce qui fait un bon sondage. Dans l’idéal, un bon sondage tire aléatoirement des individus. Plus l’échantillon est grand, plus la variance de notre estimateur sera réduite. Dans la réalité, il n’est pas toujours possible de tirer aléatoirement les gens. Les instituts de sondage n’ont pas une liste en temps réel de la population française où ils peuvent tirer au sort un individu et le forcer à répondre. C’est pour ça que les sondeurs essaient de recréer un échantillon représentatif qui correspond à la population française.

Néanmoins, il existe un cas simple où cela n’a pas d’importance de tirer au hasard un individu. Ce cas particulier est celui de l’équiprobabilité, c’est à dire si chaque femme a la même probabilité de se faire harceler dans les transports en commun (ce qui est évidemment une hypothèse simpliste).

Soit p la probabilité de se faire harceler pour une femme francilienne dans les transports en commun. On a \(p\in[0,1]\). p=1 si la femme déclare avoir été harcelée, 0 sinon. Pour ceux qui font un peu de mathématiques, vous aurez remarqué qu’il s’agit d’une loi de Bernoulli. On répète N fois le tirage. Soit X le nombre de réponses positives à la question «avez-vous été harcelée dans les transports en commun?». Si 100% des femmes de l’échantillon signalent avoir été harcelées, on obtient X = N. On a une loi binomiale de probabilité p pour une réponse positive et N personnes dans l’échantillon. On a une espérance E = Np et une variance V = Np(1-p).

Nous pouvons procéder à un test statistique pour vérifier notre estimation dans le sondage. On a le nombre de réponses obtenues au sein de notre échantillon \(\hat{N}\). Notre hypothèse nulle sera Dans notre cas, on va utiliser le t de student:

\(t=\frac{\hat{N}-E}{\sqrt{V}}\) \(\Leftrightarrow t(p) = \frac{\hat{N}-Np}{\sqrt{Np(1-p)}}\)

On peut se reporter ensuite à la la table de loi de Student. Soit \(\alpha\) le pourcentage de confiance et \(t_\alpha\) la valeur correspondante dans la table de loi. Si on a \(t>t_\alpha\), on rejette l’hypothèse nulle. Ce qui va nous intéresser, c’est pour quel valeur p, on va avoir \(t(p)=t_\alpha\). On a une fonction t qui dépend de p. Ce p correspond au cas où la surestimation a été la plus grande possible soit le plus gros biais positif possible dans le calcul de l’estimateur. Dans le cas où toutes les réponses sont positives, nous avons \(\hat{N}=N\) Procédons à un peu de calcul.

Nous avons la formule du t de student qui est:

\(t_\alpha = \frac{\hat{N}-Np}{\sqrt{Np(1-p)}}\)

Sachant que \(\hat{N}=N\), en réarrangeant, nous obtenons:

\(p=\frac{\hat{N}}{\hat{N}+t^{2}_{\alpha}}\)

Pour un niveau de confiance à 97,5% soit \(\alpha=0,975\), on a \(t_{0,975}=2\), ce qui nous donne p=0,9375 avec \(\hat{N}=60\) [NDLR: on garde l’hypothèse de 60 personnes correspondant au chiffre des opposants]. Si on a une hypothèse d’équiprobabilité, l’étude du HCEfh [NDLR: Si elle était réduite à un échantillon de 60 personnes comme le disaient ses détracteurs] nous permettrait de dire qu’au moins 93,75% des femmes ont été harcelées dans les transports en commun avec une probabilité de 97,5% de dire vrai.

Évidemment, il n’y a pas équiprobabilité. Par exemple, l’âge, le revenu et le fait d’être racisée peuvent être des facteurs pouvant influencer la probabilité pour les femmes de se faire harceler dans les transports en commun. Dans sa note de juillet 2016, l’ONDRP notait que l’âge et le revenu influençait la probabilité d’être victime d’une atteinte personnelle (vol ou violence).

Là où je veux en venir, c’est que dire “ce chiffre de 100% ne veut rien dire car l’échantillon est trop faible et non représentatif” est une conclusion trop rapide. Si vous pensez que ce chiffre est surévalué, cela signifie que vous pensez que les femmes interrogées par le HCEfh avaient une probabilité plus élevée de signaler qu’elles avaient été victime de harcèlement. C’est votre opinion mais vous devez avancer des liens de causalité et expliquer pourquoi. Le fait que les femmes de ce colloque répondraient plus facilement oui à la question que le reste des autres femmes franciliennes est loin d’être évident.

A la 18e page de sa note, le HCEfh appelle à la réalisation d’une enquête de victimisation menée à grande échelle:

La réalisation auprès des usager.ère.s des transports en commun d’enquêtes de victimation (qui
dénombrent des victimes et donc des personnes plutôt que des infractions seules), à la fois quantitative
et qualitative, semble indispensable pour :

  • Définir les manifestations du phénomène et mieux connaitre les profils des victimes comme des auteurs ;
  • Mesurer l’impact du harcèlement sexiste sur la mobilité des femmes, leur santé et leur vie
    professionnelle (qualifier notamment la « discrétion sociale » des femmes dans les transports et les
    stratégies d’évitement pratiquées pour « mettre à distance le regard des hommes ») ;
  • Interroger les non-client.e.s afin de saisir les raisons pour lesquel.le.s ils/elles évitent ces moyens de
    transports.

Ces études devraient être attentives :

  •  à ce que l’ensemble des personnes victimes soient bien représentées pour limiter l’invisibilité des
    violences commises à leur encontre, telles que les personnes en situation de vulnérabilité du fait de
    leur âge, de leur handicap ou encore de leur identité ou orientation sexuelle ;
  •  à ce que les termes employés pour nommer les violences soient explicites pour libérer la parole, plutôt
    que des euphémismes (ex : « préférer « mains aux fesses » ou « frottements » – qui sont des agressions
    sexuelles – à « gestes déplacés »).

À partir des données issues de l’enquête VIRAGE, et dans la continuité de celle-ci, la MIPROF, dans le
cadre de sa mission d’Observatoire national des violences faites aux femmes, l’Observatoire de la
Délinquance dans les Transports (ONDT), et le HCEfh pourraient être les instances de recueil et de suivi
des données et études sur cette question.

Je crois que c’est l’opinion que l’on devrait tous avoir. Plutôt que de débattre sur l’existence ou non du harcèlement sexiste, il faudrait que soit menée une grande enquête statistique avec une méthode rigoureuse pour avoir une image plus précise. Les indices inquiétants apportés par le HCEfh devraient interpeller les pouvoirs publics pour qu’ils mettent les moyens nécessaires à l’étude de ce problème de société. Ce qui est déjà en partie le cas puisque l’INED va fournir des statistiques sur cette question dans son enquête VIRAGE. La méthodologie de l’enquête inclue 25000 personnes avec autant d’hommes que de femmes, ce qui permet une comparaison entre les deux genres sur de grands échantillons. Les résultats seront publiés soit cette année soit l’année prochaine.

Comme vous pouvez le remarquer à la lecture de cet article, MathJax a été activé sur ce blog. Vous pouvez écrire des maths en commentaires avec du code latex. Vous avez juste à écrire votre code entre les balises latex entre crochets comme expliqué ici.
Pour ceux qui ont envie de creuser le sujet des violences spécifiques aux femmes, je vous renvoie à une vidéo de Licarion qui résume assez bien le sujet. Il en parle à partir de la sixième minute et vingt-troisième seconde.

EDIT:

Vu que certains sont intéressés par le calcul, voici les détails:

On a \(\hat{N}=N\). Cela donne pour le t de Student:
\(\frac{\hat{N}(1-p)}{\sqrt{\hat{N}p(1-p)}}=t_\alpha\)
On simplifie grâce aux racines carrées:
\(\frac{\sqrt{\hat{N}(1-p)}}{\sqrt{p}}=t_\alpha\)
On élève au carré:
\(\frac{\hat{N}(1-p)}{p}=t^{2}_{\alpha}\)
Cela nous donne:
\(\hat{N}(1-p)=t^{2}_{\alpha}p\)
Puis:
\(\hat{N}=(t^{2}_{\alpha}+\hat{N})p\)
Soit:
\(p=\frac{\hat{N}}{t^{2}_{\alpha}+\hat{N}}\)

9 comments
  1. Si j’interroge un échantillon d’individu sur leurs régimes alimentaires (omnivore, végétariens, végétaliens) pour établir la proportion de végétalien dans la population française, a priori, sous certaines conditions, mon inférence statistique sera bonne et j’aurais une proportion proche de la réalité.
    Si j’ai réalisé toutes mes interrogations à une manifestation pour l’abolition de la consommation de viande animale, il est évident que mon échantillon sera totalement biaisé et qu’il n’est donc pas possible de transposer le résultat de l’échantillon à la population française.
    Dans votre cas sur les femmes harcelées, c’est la même chose, si vous réalisez des sondages sur un lieu où le public privilégié sera des femmes qui se sont faits harcelées, alors il est évident que votre résultat ne peut être transposé à la population en général.
    Partant delà, il est inutile d’aller dans vos calculs mathématiques

    Vous écrivez “C’est votre opinion mais vous devez avancer des liens de causalité et expliquer pourquoi.”, en attendant, on devrait retourner le compliment au HCEfh. Il n’y a pas à supposer la véracité de leurs résultats, c’est à eux de prouver que leurs résultats sont corrects et ceux en employant des méthodes exempts de critiques.

    • “Dans votre cas sur les femmes harcelées, c’est la même chose, si vous réalisez des sondages sur un lieu où le public privilégié sera des femmes qui se sont faits harcelées, alors il est évident que votre résultat ne peut être transposé à la population en général.”

      Qu’est-ce qui vous permet d’affirmer ceci? Vous avez des preuves?

      Qu’on soit d’accord, il faudrait que des études de grande ampleur sur un échantillon représentatif soient menées. Ce que dit aussi le HCEfh:

      La réalisation auprès des usager.ère.s des transports en commun d’enquêtes de victimation (qui
      dénombrent des victimes et donc des personnes plutôt que des infractions seules), à la fois quantitative
      et qualitative, semble indispensable pour :
       Définir les manifestations du phénomène et mieux connaitre les profils des victimes comme des auteurs ;
       Mesurer l’impact du harcèlement sexiste sur la mobilité des femmes, leur santé et leur vie
      professionnelle (qualifier notamment la « discrétion sociale » des femmes dans les transports et les
      stratégies d’évitement pratiquées pour « mettre à distance le regard des hommes ») ;
       Interroger les non-client.e.s afin de saisir les raisons pour lesquel.le.s ils/elles évitent ces moyens de
      transports.
      Ces études devraient être attentives :
       à ce que l’ensemble des personnes victimes soient bien représentées pour limiter l’invisibilité des
      violences commises à leur encontre, telles que les personnes en situation de vulnérabilité du fait de
      leur âge, de leur handicap ou encore de leur identité ou orientation sexuelle ;
       à ce que les termes employés pour nommer les violences soient explicites pour libérer la parole, plutôt
      que des euphémismes (ex : « préférer « mains aux fesses » ou « frottements » – qui sont des agressions
      sexuelles – à « gestes déplacés »).
      À partir des données issues de l’enquête VIRAGE, et dans la continuité de celle-ci, la MIPROF, dans le
      cadre de sa mission d’Observatoire national des violences faites aux femmes, l’Observatoire de la
      Délinquance dans les Transports (ONDT), et le HCEfh pourraient être les instances de recueil et de suivi
      des données et études sur cette question.

      Merci pour tes remarques car cela m’oblige à modifier l’article pour plus de précisions. Certaines interviews ont été réalisé par micro-trottoir.

      • La charge de la preuve est à celui qui allègue, c’est donc à l’HCEfh de faire la preuve que l’exploitation des résultats de son micro-trottoir peuvent être généraliser.

        Mais bon, soit je cite : ” les 6 et 9 mars, le HCEfh organisera une consultation participative auprès des participant-e-s à ces évènements,” (http://www.haut-conseil-egalite.gouv.fr/violences-de-genre/actualites-69/article/8-mars-2015-participez-aux-3-temps-973). Il est donc clair que le public qui a fait l’objet de l’enquête est très spécifique car à ce type d’événement, ce sont les plus impactés qui se déplacent.

        Je n’ai pas le temps de chercher des études pour vous prouver qu’une enquête réalisé par micro-trottoir à ce type d’événement conduira à un public biaisé et encore moins de temps ou de moyens pour conduire une enquête contraire.

        • La preuve, ils l’ont puisqu’ils ont fait une étude. Le micro-trottoir concerne justement des femmes qui ne sont pas venues à l’événement. Le but du micro-trottoir est d’aller à la rencontre des gens dans la rue. Et elles ont quand même obtenu 100%.
          De deux, sachant que les colloques rassemblent avant tout des associatifs, des fonctionnaires ou des responsables de ces questions aux entreprises, tu n’expliques toujours pas en quoi elles auraient une plus grande chance d’être victime de harcèlement sexiste. En quoi leur probabilité de se faire harceler est plus élevée?

          On est d’accord que cette enquête n’est pas l’idéal. Mais les arguments des détracteurs pour disqualifier l’enjeu du harcèlement sexiste comme inexistant alors que documenté dans d’autres pays restent faibles. Je peux déjà t’assurer que l’enquête VIRAGE montrera que le harcèlement sexiste est un phénomène non négligeable (contrairement à ce qu’affirme les détracteurs de l’étude aujourd’hui). Le chiffre du HCEfh est dans la fourchette haute sans aucun doute mais dire que l’étude du HCEfh n’arrive pas à montrer que le harcèlement sexiste est un phénomène massif est faux.

          • C’est clairement marqué “auprès des participants aux colloques”, c’est assez clair, c’est marqué où qu’il y a eu un micro-trottoir?
            Par ailleurs, je relis et relis vos démonstrations mathématiques mais pour l’instant c’est le flou artistiques, ce qui m’étonnes car d’habitude je n’ai pas de mal à comprendre.

          • Le HCE avait annoncé un micro-trottoir sur son site, j’ai mis le lien dans l’article.

            Pour les calculs, on a [latex]\hat{N}=N[/latex]. Cela donne pour le t de Student:
            [latex]\frac{\hat{N}(1-p)}{\sqrt{\hat{N}p(1-p)}}=t_\alpha[/latex]
            On simplifie grâce aux racines carrées:
            [latex]\frac{\sqrt{\hat{N}(1-p)}}{\sqrt{p}}=t_\alpha[/latex]
            On élève au carré:
            [latex]\frac{\hat{N}(1-p)}{p}=t^{2}_{\alpha}[/latex]
            Cela nous donne:
            [latex]\hat{N}(1-p)=t^{2}_{\alpha}p[/latex]
            Puis:
            [latex]\hat{N}=(t^{2}_{\alpha}+\hat{N})p[/latex]
            Soit:
            [latex]p=\frac{\hat{N}}{t^{2}_{\alpha}+\hat{N}}[/latex]

            Manifestement, le latex ne marche pas en commentaire. Je suis déçu. Les calculs mis en forme sont sous la vidéo dans l’article.

            Je ne pense pas que l’on ait un gros désaccord de fond. Je pense que l’on sera tous les deux satisfaits lors de la publication des résultats de VIRAGE.
            Je pense ne pas avoir tort en m’avançant sur ce point.

  2. “Néanmoins, il existe un cas simple où cela n’a pas d’importance de tirer au hasard un individu. Ce cas particulier est celui de l’équiprobabilité, c’est à dire si chaque femme a la même probabilité de se faire harceler dans les transports en commun (ce qui est évidemment une hypothèse simpliste).”

    Plus qu’une hypothèse simpliste c’est une hypothèse erronée. L’âge, le revenu, le jour de la semaine, influencent la probabilité d’être victime d’une atteinte personnelle (vol ou violence) il en est certainement de même pour le harcèlement donc l’hypothèse d’équiprobabilité est à rejeter (ce qui est admis dans l’article), il faut avoir recours obligatoirement à un tirage aléatoire. Problème ici, le HCE reconnait, via cette courte enquête, vouloir obtenir « un chiffre d’appel » (de surcroit égal à 100%) donc le tirage n’est pas fait aléatoirement.

    Quant à la vidéo de licarion et l’utilisation des chiffres sur les violences je suis retourné sur la page de l’INSEE ( http://www.insee.fr/fr/themes/document.asp?ref_id=ip1473 ), d’où sont tirés les screens que l’on voit vers 6 min 33. Voilà ce qu’en dit l’INSEE : “La part de victimes de violences physiques est comparable chez les femmes (4,7 %) et chez les hommes (4,3 %). ” les chiffres sont comparables donc le coup du “les femmes galèrent plus” …

    • Vous avez fait exprès de ne pas comprendre les propos de Licarion puisque celui ci dit explicitement que les femmes subissent le harcèlement sexiste en plus des délits crapuleux.
      De plus, vous n’avancez pas de cause expliquant que les femmes du panel du HCEfh sont plus nombreuses en proportion à déclarer être victime de harcèlement sexiste que le reste de la population féminine. Vous tombez pile dans tous les écueils que j’ai décrit 🙂 .

      Au passage, ce sont 600 et non 60 questionnaires qui ont été recueilli.

Add Comment

Required fields are marked *. Your email address will not be published.