Datalyzer grid icon variant 1

50+ pays

Utilisation mondiale, impact local

Datalyzer grid icon variant 3

47 ans d’activité

Créé en 1979

Datalyzer grid icon variant 2

50+ employés

Europe, États-Unis et Asie

Datalyzer grid icon variant 4

plus de 2000 clients

Plus de 20 000 utilisateurs

Blog : Le mythe de la distribution normale et la maîtrise statistique des processus

Introduction

Toutes les données ne sont pas distribuées normalement. Il existe de nombreuses distributions possibles. Dans le monde de l’ingénierie de la qualité, il est communément admis que si les données ne sont pas normalement distribuées, vous ne pouvez pas appliquer les cartes de contrôle, car la normalité est une condition préalable à l’application des cartes de contrôle. Il s’avère que cette croyance ne tient pas la route – et dans ce blog, nous vous expliquons pourquoi.

Qu’est-ce que la courbe de distribution normale ?

Une distribution normale – également appelée courbe en cloche, distribution gaussienne ou distribution de Gauss – est une distribution de probabilité continue en forme de cloche et symétrique autour de la moyenne. Il s’agit de la distribution de probabilité la plus utilisée en statistique.

Dans une distribution normale, environ 68,27 % des données se situent à l’intérieur d’un écart-type de la moyenne, 95,45 % des données se situent à l’intérieur de deux écarts-types et 99,73 % des données se situent à l’intérieur de trois écarts-types.

Normal Distribution Graphic

Distribution normale dans la maîtrise statistique des processus

L’utilisation de la distribution normale remonte à près d’un siècle. Lorsque le contrôle statistique des processus a été introduit pour la première fois dans les années 1920 par Walter Shewhart, bon nombre des outils que nous utilisons encore aujourd’hui, comme les diagrammes X̄ et R, reposaient sur des hypothèses liées à la distribution normale (gaussienne).

Une statistique souvent utilisée dans le cadre du contrôle de la qualité est la moyenne de plusieurs échantillons. Le théorème de la limite centrale est un concept connu de la théorie des probabilités. Ce théorème stipule que la distribution d’échantillonnage des moyennes se rapproche d’une distribution normale à mesure que la taille de l’échantillon augmente, quelle que soit la forme de la distribution de la population d’origine. Le théorème de la limite centrale a été établi pour la première fois dans un cas spécifique par Abraham de Moivre en 1733, puis généralisé et prouvé sous une forme plus générale par Pierre-Simon Laplace en 1810, à qui l’on attribue souvent la découverte globale et la démonstration de son importance dans la théorie des probabilités.

Shewhart a utilisé ce théorème et a établi que le fait de placer les limites de contrôle à trois écarts types de la moyenne du processus – dans les deux sens – offrait un équilibre pratique entre le risque de réagir à une fausse alarme et le risque de ne pas réagir à un vrai signal. (Contrôle économique de la qualité des produits manufacturés, 1931)

La CPS utilise des cartes de contrôle pour surveiller les points de données et identifier les cas où un processus s’écarte du comportement normal attendu, ce qui indique des problèmes potentiels. Lorsqu’une statistique suit une distribution normale, environ 99,7 % des points de données devraient se situer dans les trois écarts types de la moyenne. Lorsqu’une mesure se trouve en dehors des limites de 3 sigma, nous supposons qu’il y a une cause spéciale de variation. Cela signifie qu’il n’y a que 0,3 % de chances (ou 1 sur 370) qu’une valeur mesurée dépasse les 3 écarts types et qu’il n’y a pas de cause particulière de variation.

Bien que le théorème de la limite centrale soit applicable, il n’est pas nécessaire d’utiliser des cartes de contrôle. Dans certains domaines de la statistique, la normalité est requise. Par exemple, dans l’application des tests d’hypothèse, des tests spécifiques exigent la normalité. Par exemple, les tests F et t exigent que les données soient normalement distribuées.

En outre, pour les rapports de capacité, 99,7 % de la variation est incluse dans le calcul. Si les données ne sont pas normalement distribuées, de légères déviations peuvent se produire si vous supposez que les données sont normalement distribuées. En cas de queues lourdes dans la distribution, il est conseillé d’indiquer que le calcul de la capacité n’est pas normal.

Au fil des ans, cette exigence de normalité dans les tests d’hypothèse et la capacité a donné lieu à l’idée erronée que la normalité est nécessaire pour l’application de la MSP et l’utilisation des cartes de contrôle.

Pourquoi la normalité n’est-elle pas exigée ?

La règle des trois sigmas fonctionne (même pour les données non normales)

Si la normalité était vraiment requise, les diagrammes de gamme ne fonctionneraient pas car ils ne sont jamais distribués normalement – pourtant, ils sont utilisés depuis des décennies et restent très efficaces.

Bien que les tests statistiques tels que le test t et le test F requièrent une distribution normale, la CPS dans l’atelier n’a rien à voir avec les tests d’hypothèse. Il s’agit de répondre à une question plus pratique : Mon processus est-il stable ou non ? Et la bonne nouvelle, c’est que la MSP peut vous fournir des informations précieuses même si vos données ne sont pas distribuées normalement.

Des experts comme Donald Wheeler (Advanced Topics in Statistical Process Control) démontrent depuis des décennies que le fait que les cartes de contrôle fonctionnent grâce au théorème de la limite centrale est un mythe. La CPS est conçue pour gérer des scénarios du monde réel. En fait, les conclusions de Wheeler – étayées par les travaux antérieurs d’Irving Burr, qui a analysé 27 distributions non normales différentes – démontrent que les cartes de contrôle restent fiables même avec des données présentant une asymétrie extrême (supérieure à 1,9) ou un aplatissement (supérieur à 12), car dans chaque distribution, plus de 99 % des mesures se situent entre les limites de 3 sigma. Le principe de base reste valable : lorsque l’on utilise des limites de trois sigmas, le risque de fausse alarme (un point se situant en dehors des limites en raison d’une variation de cause commune) reste faible – moins de 1 % – quelle que soit la distribution sous-jacente. C’est une bonne nouvelle pour ceux d’entre nous qui ne vivent pas dans des conditions dignes d’un manuel.

Datalyzer Image Distribution normale Mythe

Travailler avec des données non normales : Des conseils pratiques qui marchent

Dans les tests d’hypothèse, il est recommandé de transformer les données pour qu’elles répondent à l’hypothèse de normalité. Si votre objectif est d’utiliser des cartes de contrôle pour surveiller la stabilité du processus, la transformation de vos données peut faire plus de mal que de bien. Les opérateurs peuvent avoir du mal à comprendre la variation des valeurs transformées et, par conséquent, les cartes de contrôle peuvent perdre toute signification pratique. À moins que vous n’effectuiez des tests statistiques formels, nous vous recommandons vivement de conserver les données dans leur forme originale.

Dans la plupart des cas, il n’est pas nécessaire de transformer vos données ou de rechercher une distribution parfaite. Voici comment gérer la non-normalité dans la pratique :

Carte de contrôle individuelle : C’est souvent l’option la plus simple. Toutefois, soyez prudent avec les tests de zone lorsque vos données sont fortement asymétriques ou non normales. Ces tests peuvent produire de fausses alertes. Néanmoins, l’utilisation des limites traditionnelles de ±3σ donne de bons résultats. Les quelques points qui se situent en dehors de ces limites sont souvent dus à des causes spéciales réelles.
Utilisez les graphiques X̄ et R : Vous devez disposer d’une méthode rationnelle pour sous-grouper les données, mais il s’agit d’un moyen de réduire les faux signaux potentiels provenant de données non normales. Le théorème de la limite centrale permet de normaliser la distribution des moyennes, même lorsque les points de données individuels ne sont pas normaux.
Pour l’analyse de capabilité, vous pouvez utiliser la méthode Non-normal Capability NCpk : Cette méthode nécessite un logiciel SPC. Le logiciel appliquera l’ajustement à toutes sortes de distributions différentes et établira le meilleur ajustement. En fonction de la distribution, la capacité sera calculée sur la base du percentile 99,85 % – percentile 0,15 %.
Travailler avec des données distribuées de façon non normale
Toutes les options de capacité, y compris NCpk

Dans Qualis SPC 4.0, vous pouvez utiliser les options « skewed bounded distributions » et NCpk pour utiliser les modèles de distribution spécifiques à utiliser pour déterminer la meilleure courbe d’ajustement et calculer la capacité non normale.

Conclusion : Concentrez-vous sur les signaux de processus et non sur les distributions

Ceci étant dit et démontré, nous pouvons être sûrs qu’il n’est pas nécessaire que les données suivent une distribution normale pour que votre processus reste sous contrôle. Les idées de Donald Wheeler montrent qu’une SPC efficace consiste à comprendre le comportement du processus. En passant des hypothèses strictes à la reconnaissance des causes spéciales de variation, vous obtenez :

Un meilleur contrôle ;
Moins de fausses alarmes ;
Une image plus claire de ce qui se passe réellement.

Au lieu de vous préoccuper de la normalité, investissez votre énergie dans.. :

Identifier les signaux réels du processus ;
Former les équipes à comprendre les variations ;
Se concentrer sur ce que les données essaient de vous dire.

Comme le dit M. Wheeler : « La forme de l’histogramme ne détermine pas le contrôle du processus, ce sont les signaux qui le déterminent

En adoptant les principes de Wheeler, vous disposez d’un moyen plus pratique et intuitif de maintenir les processus stables et de les améliorer en permanence.

Vos données ne sont pas parfaites ? Ne vous inquiétez pas. Les cartes de contrôle n’ont pas été conçues pour les manuels scolaires, mais pour l’atelier. Et c’est pour cela qu’elles fonctionnent…

9%

Réduction des coûts réalisée par les clients

Datalyzer grid image go live

3 semaines avant la mise en ligne

En savoir plus sur la maîtrise statistique des processus. Ses principaux thèmes et applications.

3x plus rapide

Intervention rapide en cas de problèmes de qualité

Ce que disent les clients

« Datalyzer nous a permis de relier automatiquement les données de qualité de tous les processus en vue d’une analyse avancée

Dave Beeren

Ingénieur de rendement, Philips

Industries que nous servons

Pharma
Alimentation et boissons
Aérospatiale
Haute technologie
Dispositif médical
Automobile
Défense
Emballage
Semi-conducteurs
Aérospatiale
Automobile
Électronique
Pharma
Haute technologie
Dispositif médical
Défense
Emballage
Alimentation et boissons
Semi-conducteurs
La mesure dans la production

Certifié ISO

ISO 27001 & SOC2

Prêt à simplifier votre processus de qualité ?

En seulement 60 minutes, l’un de nos experts vous expliquera comment notre plateforme modulaire aide les équipes de production à améliorer la qualité, à réduire les variations et à simplifier les audits