Datalyzer grid icon variant 1

50+ landen

Wereldwijd actief, lokaal support

Datalyzer grid icon variant 3

47 jaar actief

opgericht in 1979

Datalyzer grid icon variant 2

50+ werknemers

Europa, VS en Azië

Datalyzer grid icon variant 4

2000+ klanten

Meer dan 20.000 gebruikers

Blog: De mythe van de Normaalverdeling als voorwaarde voor Statistical Process Control

Introductie

Niet alle productiedata is normaal verdeeld. Er zijn veel verschillende verdelingen mogelijk. Binnen kwaliteitsmanagement wordt vaak gedacht dat Regelkaarten (Control Charts) niet kunnen worden toegepast als data niet normaal verdeeld is, en wordt normaliteit gezien als een vereiste voor het toepassen van SPC. Deze aanname is incorrect, en in deze blog zullen we uitleggen waarom.

Wat is de Normaalverdeling

Een normaalverdeling – ook wel bell curve, Gaussiaanse verdeling of Gauss verdeling genoemd – is een continue data verdeling die klokvormig en symmetrisch rond het gemiddelde loopt. Het is de meest gebruikte data verdeling in de statistiek.

Bij een normaalverdeling valt ongeveer 68,27% van de gegevens binnen één standaardafwijking van het gemiddelde, 95,45% van de gegevens valt binnen twee standaardafwijkingen en 99,73% van de gegevens valt binnen drie standaardafwijkingen.

Normal Distribution Graphic

Normaalverdeling en Statistical Process Control

Het gebruik van de normaalverdeling gaat bijna een eeuw terug. Toen Statistical Process Control in de jaren 1920 voor het eerst werd geïntroduceerd door Walter Shewhart, waren veel van de tools die we vandaag de dag nog steeds gebruiken, zoals X̄- en R-diagrammen, gebaseerd op aannames die gekoppeld zijn aan de normale (Gaussische) verdeling.

Een statistiek die vaak gebruikt wordt binnen kwaliteitsmanagement is het gemiddelde van meerdere samples. Een bekend concept in de waarschijnlijkheidstheorie is de stelling van de Centrale Limiet. De stelling van de Centrale Limiet stelt dat de steekproefverdeling van de gemiddelden een normale verdeling benadert naarmate de grootte van de steekproef toeneemt, ongeacht de vorm van de oorspronkelijke populatieverdeling. De stelling van de centrale limiet werd voor het eerst vastgesteld in een specifiek geval door Abraham de Moivre in 1733, en vervolgens veralgemeend en in een algemenere vorm bewezen door Pierre-Simon Laplace in 1810, die vaak de eer krijgt voor de algemene ontdekking en het aantonen van het belang ervan in de waarschijnlijkheidstheorie.

Shewhart gebruikte deze stelling en stelde vast dat het plaatsen van regelgrenzen op drie standaardafwijkingen van het procesgemiddelde – in beide richtingen – een praktisch evenwicht bood tussen het risico van reageren op een vals alarm en het risico van niet reageren op een echt signaal. (Economische controle van de kwaliteit van het geproduceerde product, 1931)

SPC gebruikt Control Charts om datapunten te controleren en te identificeren wanneer een proces afwijkt van het verwachte normale gedrag, wat wijst op potentiële problemen. Wanneer een statistiek een normale verdeling volgt, wordt verwacht dat ongeveer 99,7% van de gegevenspunten binnen drie standaardafwijkingen van het gemiddelde vallen. Als een meting buiten de 3 sigma-limieten valt, nemen we aan dat er een speciale variatieoorzaak is. Dat betekent dat er slechts 0,3% kans (of 1 op 370) is dat een meetwaarde buiten de 3 standaarddeviaties valt en dat er geen speciale variatieoorzaak is.

Hoewel het Central Limit Theorem van toepassing is, is het geen vereiste voor het gebruik van Regelkaarten. Er zijn gebieden in de statistiek waar normaliteit vereist is. Bijvoorbeeld bij het toepassen van Hypothese Tests, vereisen specifieke tests normaliteit. De F- en t-test vereisen bijvoorbeeld dat de gegevens normaal verdeeld zijn.

Bovendien wordt voor capability rapportage 99,7% van de variatie meegenomen in de berekening. Als de gegevens niet normaal verdeeld zijn, kunnen er kleine afwijkingen optreden als u aanneemt dat de gegevens normaal verdeeld zijn. In het geval van extreme waarden in de verdeling wordt geadviseerd om de niet-normale capability te rapporteren .

De normaliteitseis in Hypothese Tests en Capability heeft in de loop der jaren geleid tot de misvatting dat normaliteit vereist is voor het toepassen van SPC en het gebruik van Regelkaarten.

Waarom is normaliteit dan niet vereist?

De drie-sigma regel werkt (zelfs voor niet-normaalverdeelde data)

Als normaliteit echt vereist zou zijn, zouden Range Charts niet werken omdat ze nooit normaal verdeeld zijn – toch worden ze al tientallen jaren gebruikt en zijn ze nog steeds zeer effectief.

Hoewel statistische tests zoals de t-test en F-test een normale verdeling vereisen, gaat SPC op de werkvloer niet over hypothese toetsing. Het gaat om het beantwoorden van een meer praktische vraag: Is mijn proces stabiel of niet? SPC kan waardevolle inzichten geven, zelfs als uw data niet normaal verdeeld is.

Deskundigen zoals Donald Wheeler (Advanced Topics in Statistical Process Control) hebben al tientallen jaren aangetoond dat het een mythe is omdat Control Charts werken vanwege het Central Limit Theorem. SPC is ontwikkeld voor praktische toepassing. In feite tonen de bevindingen van Wheeler – ondersteund door eerder werk van Irving Burr, die 27 verschillende niet-normale verdelingen analyseerde – aan dat Regelkaarten betrouwbaar blijven, zelfs met gegevens die extreme scheefheid (meer dan 1,9) of kurtosis (meer dan 12) vertonen, omdat in elke verdeling meer dan 99% van de metingen tussen de 3 sigma grenzen liggen. Het basisprincipe geldt nog steeds: bij gebruik van drie-sigma grenzen blijft de kans op vals alarm (een punt dat buiten de grenzen valt door variatie met een algemene oorzaak) laag – minder dan 1% – ongeacht de onderliggende verdeling. Dat is goed nieuws voor degene van ons die niet in schoolboeken leven.

Datalyzer Afbeelding Normale Verdelingsmythe

Werken met niet-normaalverdeelde data: Praktische tips die werken

Bij hypothesetests wordt aanbevolen om data te transformeren zodat ze voldoen aan de aanname van normaliteit. Als het uw doel is om Regelkaarten te gebruiken om de processtabiliteit te bewaken, kan het transformeren van uw data meer kwaad dan goed doen. Operators kunnen moeite hebben om de variatie in getransformeerde data te begrijpen, en als gevolg daarvan kunnen Regelkaarten hun praktische betekenis verliezen. Tenzij u formele statistische tests uitvoert, raden wij u sterk aan data in zijn oorspronkelijke vorm te bewaren.

In de meeste gevallen hoeft u uw data niet te transformeren of naar een perfecte verdeling te zoeken. Hier leest u hoe u in de praktijk met niet-normaliteit omgaat:

Individuele regelkaarten: Dit is vaak de eenvoudigste optie. Wees echter voorzichtig met zone regels als uw data erg scheef of niet-normaal is. Deze tests kunnen valse alarmen opleveren. Toch werkt het gebruik van de traditionele ±3σ grenzen goed. De paar punten die buiten deze grenzen vallen, zijn vaak het gevolg van echte speciale oorzaken.
Gebruik X̄ & R-regelkaarten: U hebt een rationele methode nodig om de gegevens te subgroeperen, maar het is één manier om potentiële valse signalen van niet-normale gegevens te verminderen. De Central Limit Theorem helpt om de verdeling van gemiddelden te normaliseren, zelfs als individuele gegevenspunten niet normaal zijn.
Voor capability analyse kunt u de Non-normal Capability NCpk gebruiken: Hiervoor is SPC software nodig, zoals Datalyzer SPC. De software past de verdelingen aan en bepaalt de beste fit. Op basis van de verdeling wordt de capability berekend op basis van het 99,85% percentiel – 0,15% percentiel.
Werken met niet-normaal verdeelde gegevens
Alle vermogensopties, inclusief NCpk

In Qualis SPC 4.0 kunt u de opties “Skewed Bounded Distributions” en NCpk gebruiken om de specifieke distributiemodellen te gebruiken om de best passende curve te bepalen en de non-normal capability te berekenen.

Conclusie: Focus op processignalen, niet op verdelingen

Dit alles gezegd en gedemonstreerd hebbende, kunnen we er zeker van zijn dat het niet nodig is dat data een normaalverdeling volgt om uw proces beheerst te houden. De inzichten van Donald Wheeler laten zien dat effectieve SPC draait om het begrijpen van procesgedrag. Door de focus te verleggen van strikte aannames naar het herkennen van speciale oorzaken van variatie, krijgt u:

Betere controle;
Minder valse alarmen;
Een duidelijker beeld van wat er echt gebeurt.

In plaats van u zorgen te maken over normaliteit, kunt u uw energie erin steken:

Echte processignalen identificeren;
Teams trainen om variatie te begrijpen;

Door de principes van Wheeler over te nemen, krijgt u een meer praktische, intuïtieve manier om processen stabiel te houden en continu te verbeteren. Dus als uw gegevens niet perfect zijn? Maakt u zich dan geen zorgen. Regelkaarten zijn niet gemaakt voor schoolboeken, maar voor de werkvloer. En daarom werkt het…

9%

Kostenreductie bereikt door klanten

3 weken om live te gaan SPC software

3 weken tot Go Live

Snelle actie bij kwaliteitsproblemen

3x Sneller

Snelle actie bij kwaliteitsproblemen

Wat klanten zeggen

“Datalyzer hielp ons kwaliteitsgegevens van alle processen automatisch te koppelen voor geavanceerde analyse”

Dave Beeren

Yield engineer, Philips

Branches die wij bedienen

Pharma
Food & Beverage
Ruimtevaart
High Tech
Medical Devices
Automotive
Defensie
Verpakking
Semiconductor
Ruimtevaart
Automotive
Elektronica
Pharma
High Tech
Medical Devices
Defensie
Verpakking
Food & Beverage
Semiconductor
Meten in Productie

ISO-gecertificeerd

ISO 27001 & SOC2

Klaar om uw kwaliteitsproces te verbeteren?

In slechts 60 minuten zal een van onze experts u uitleggen hoe ons modulaire platform productieteams helpt om de kwaliteit te verbeteren, variatie te verminderen en audits te vereenvoudigen