Les statistiques .
Les statistiques sont la meilleure et la pire des choses .
La meilleure des choses si elles sont dans les mains de quelqu’un d’honnête et qui sait :
- Prendre un échantillon représentatif (et écarter les autres).
- Bien définir les paramètres .
- Bien reprendre les paramètres exacts avec les enqueteurs.
- Bien rappeler aux personnes interrogées les paramètres .
- Elaborer les questions à se poser .
- Les poser de façon claire
- Les poser de façon « appropriée »
- Eviter les biais d’interview .
Tout ceci nécessite un « pré-travail » rigoureux et une solide expérience .
La pire des choses si ces statistiques sont dans les mains d’une personne "honnête"
mais qui n’a strictement rien compris à tous les biais qu’il est susceptible de rencontrer
et qui vont lui faire dire tout et son contraire …
A un degré « moindre » il y a enfin les statistiques faites par un bandit …
mais au moins si vous le savez… vous saurez aussi dans quels sens le résultat a été biaisé …
Quelques exemples de grosses erreurs …
Il y en a bien d’autres …
Population non homogène .
Vous poser exactement la même question de la même façon au même endroit ,amis sur un laps de temps étendu par exemple de 8 à 10 heures,à la gare du Nord de Bruxelles.
A 08 heure… vous aurez les navetteurs.
A 09 heure….vous aurez les gens du quartier
A 10 heure …vous aurez les « dames » qui viennent prendre position …
Mauvaise technique de sondage (biais d’interview) .
"La" question type à ne pas faire poser « de visu » et surtout pas par des gamines sublimes .
Combien avez-vous de relations sexuelles par semaine ?
- De visu : …………………………………………...............Ce sera : tous les jours, 3 fois par jour .
- Autrement que « de visu » et par des « gamines » ….. Ce sera sensiblement différent …
Question trop floue qui aurait nécessité des précisions données au « sondé » :
Vous sentez-vous en « bonne santé » ?
Ca veut dire quoi exactement « être en bonne santé » ?
Des choses sensiblement différentes pour l’un ou l’autre ..
Question trop floue qui aurait nécessité des précisions données au « sondeur » :
Exemple type ; vous êtes chargés de dire pourquoi la personne est en arrêt de travail .
Il y a des réponses très simple : il a un bras cassé .
Il y a des réponses qui dépendent du sondeur : il a des lombalgies et une dépression .
Il est en arrêt de travail pour ses lombalgies ou pour sa dépression ?
Biais de l’item le plus fréquent .
C’est très simple à concevoir :
vous devez mettre non pas un mot (par ex le nom de la maladie) mais un N° de code .
si le programme a été fait convenablement à chaque maladie il y a un N° de code .
si le programme n’a pas été fait concenablement,il y aura des maladies même fréquentes où retrouver le N° de code va vous prendre un temps fou …
la solution la plus simple est donc de reprendre l’item le plus fréquent (dans ce cas çi la dépression par exemple) et de dire : il est dépressif (N° que vous retrouvez tout de suite)…sous entendu et à la place de « parce qu’il a une insuffisance rénale chronique »
(N° que vous retrouverez près 10 minutes de recherches …).
Quelques exemples de manipulation par des bandits .
Ca a l’air « gros »…mais d’expérience je sais que ça marche … je l’ai vu faire …
On ne fait pas le tri des sous populations « significatives » .
Exemple combien sait soulever de poids en moyenne une personne ?
Si on pose la question ainsi, sans avoir défini la personne réellement testée,
Vous allez avoir :
- des hommes et des femmes .
- des tout jeunes,des jeunes et des vieux …
QQ le résultat voudra dire ?
On ne tient aucun compte de la notion de « moyenne » et d’ « écart type ».
Ce sont 2 choses totalement différentes mais liées l’une à l’autre .
La moyenne c’est la moyenne de toutes les données .
L’écart type c’est la variation des données autour de la moyenne .
Il faut avoir toujours en tête ,
que »en moyenne »,
la Suisse est un pays plat de 500 m d’altitude !
On additionne des pommes et des poires et on obtient des bananes .
Autre gros classique : on additionne les passagers des voitures,bus et vélos ,et on obtient une très curieuse moyenne …
On additionne les % sans tenir compte du dénominateur .
Encore un gros classique : exemple :
On veut supprimer un contrôle .
Ce contrôle est très efficace puisqu’il rejette 50 % des produits testés …
Bon … c’est pas « comme ça » qu’on va le virer …
Oui mais…il ne contrôle que 1 % des objets manufacturés !
Voila où on va l’avoir …
Et on pourra dire maintenant que ce testne sert à rien puisque :
au lieu de rejeter 50 % des produits testés ,
il n’en sort uniquement 0.05 % des produits fabriqués ….
Et l’affaire est « dans le sac » !!!
Un peu de sauce,et tout ça passe …
Je l’ai VU faire !!!!
Et enfin … le soir des élections…. tout le monde a toujours gagné :
- A a doublé son score ………………..il est en effet passé de 1 à 2 voix …
- B a plus de voix que la x dernière …..oui mais il s’est écroulé en %
- C a plus de voix que la x dernière …..oui mais maintenant il est en coalition…