Datalyzer grid icon variant 1

mais de 50 países

Uso global, impacto local

Datalyzer grid icon variant 3

47 anos de atividade

Originada em 1979

Datalyzer grid icon variant 2

mais de 50 funcionários

Europa, EUA e Ásia

Datalyzer grid icon variant 4

mais de 2000 clientes

Mais de 20.000 usuários

Blog: O mito da distribuição normal e o controle estatístico de processos

Introdução

Nem todos os dados são distribuídos normalmente. Há muitas distribuições possíveis diferentes. É uma crença comum no mundo da engenharia de qualidade que, se os dados não forem distribuídos normalmente, o senhor não poderá aplicar gráficos de controle porque a normalidade é um requisito para aplicar gráficos de controle. Acontece que essa crença não se sustenta e, neste blog, explicaremos por quê.

O que é a curva de distribuição normal?

A distribuição normal – também conhecida como curva de sino, distribuição gaussiana ou distribuição de Gauss – é uma distribuição de probabilidade contínua em forma de sino e simétrica em torno da média. É a distribuição de probabilidade mais amplamente usada em estatística.

Em uma distribuição normal, aproximadamente 68,27% dos dados estão dentro de um desvio padrão da média, 95,45% dos dados estão dentro de dois desvios padrão e 99,73% dos dados estão dentro de três desvios padrão.

Normal Distribution Graphic

Distribuição normal no controle estatístico de processos

O uso da distribuição normal tem raízes que remontam a quase um século. Quando o Controle Estatístico de Processos foi introduzido pela primeira vez, na década de 1920, por Walter Shewhart, muitas das ferramentas que ainda usamos hoje, como os gráficos X̄ e R, foram construídas com base em suposições ligadas à distribuição normal (gaussiana).

Uma estatística usada com frequência no controle de qualidade é a média de várias amostras. Um conceito conhecido na teoria da probabilidade é o Teorema do Limite Central. O Teorema do Limite Central afirma que a distribuição amostral das médias se aproxima de uma distribuição normal à medida que o tamanho da amostra aumenta, independentemente da forma da distribuição da população original. O teorema do limite central foi estabelecido pela primeira vez em um caso específico por Abraham de Moivre em 1733 e, em seguida, generalizado e comprovado em uma forma mais geral por Pierre-Simon Laplace em 1810, a quem se atribui a descoberta geral e a demonstração de sua importância na teoria da probabilidade.

Shewhart usou esse teorema e estabeleceu que a colocação de limites de controle em três desvios padrão da média do processo – em ambas as direções – oferecia um equilíbrio prático entre o risco de reagir a um alarme falso e o risco de não reagir a um sinal verdadeiro. (Economic Control of Quality of Manufactured Product, 1931)

O SPC usa Gráficos de Controle para monitorar pontos de dados e identificar quando um processo se desvia do comportamento normal esperado, indicando possíveis problemas. Quando uma estatística segue uma distribuição normal, espera-se que cerca de 99,7% dos pontos de dados estejam dentro de três desvios padrão da média. Quando uma medição é encontrada fora dos limites de 3 sigma, presumimos que há uma causa especial de variação. Isso significa que há apenas 0,3% de chance (ou 1 em 370) de um valor de medição além dos 3 desvios padrão e que não há uma causa especial de variação.

Embora o teorema do limite central seja aplicável, ele não é um requisito para o uso de gráficos de controle. Há áreas na estatística em que a normalidade é necessária. Por exemplo, na aplicação de testes de hipóteses, testes específicos exigem normalidade. Por exemplo, o teste F e o teste t exigem que os dados sejam distribuídos normalmente.

Além disso, para relatórios de capacidade, 99,7% da variação é incluída no cálculo. Se os dados não forem distribuídos normalmente, podem ocorrer pequenos desvios se o senhor presumir que os dados são distribuídos normalmente. No caso de caudas pesadas na distribuição, é aconselhável informar o cálculo de capacidade não normal.

De alguma forma, ao longo dos anos, essa exigência de normalidade no Teste de Hipótese e Capacidade resultou na concepção errônea de que a normalidade é necessária para a aplicação do CEP e o uso de Gráficos de Controle.

Então, por que a normalidade não é necessária?

A regra dos três sigmas funciona (mesmo para dados não normais)

Se a normalidade fosse realmente necessária, os gráficos de intervalo não funcionariam porque nunca são distribuídos normalmente – no entanto, eles têm sido usados há décadas e continuam a ser altamente eficazes.

Embora os testes estatísticos, como o teste t e o teste F, exijam uma distribuição normal, o SPC no chão de fábrica não se trata de testes de hipóteses. Trata-se de responder a uma pergunta mais prática: Meu processo é estável ou não? E a boa notícia é que o CEP ainda pode lhe fornecer insights valiosos mesmo quando os dados não são distribuídos normalmente.

Especialistas como Donald Wheeler (Advanced Topics in Statistical Process Control) têm demonstrado há décadas que é um mito que os gráficos de controle funcionam devido ao Teorema do Limite Central. O CEP foi criado para lidar com cenários do mundo real. Na verdade, as descobertas de Wheeler – apoiadas por um trabalho anterior de Irving Burr, que analisou 27 distribuições não normais diferentes – demonstram que os gráficos de controle permanecem confiáveis mesmo com dados que apresentam extrema assimetria (acima de 1,9) ou curtose (acima de 12) porque, em todas as distribuições, mais de 99% das medições estão entre os limites de 3 sigmas. O princípio básico ainda se mantém: ao usar limites de três sigmas, a chance de um alarme falso (um ponto fora dos limites devido à variação de causa comum) permanece baixa – menos de 1% – independentemente da distribuição subjacente. Essa é uma boa notícia para aqueles que não vivem em condições de livro-texto.

Imagem do Datalyzer Mito da distribuição normal

Trabalhando com dados não normais: Dicas práticas que funcionam

No teste de hipóteses, é recomendável transformar os dados para que eles atendam à suposição de normalidade. Se o objetivo for usar Gráficos de Controle para monitorar a estabilidade do processo, a transformação dos dados pode ser mais prejudicial do que benéfica. Os operadores podem ter dificuldade para entender a variação dos valores transformados e, como resultado, as cartas de controle podem perder o significado prático. A menos que o senhor esteja realizando testes estatísticos formais, é altamente recomendável manter os dados em sua forma original.

Na maioria dos casos, não é necessário transformar os dados ou procurar uma correspondência perfeita de distribuição. Veja a seguir como lidar com a não normalidade na prática:

Gráfico de controle individual: Essa costuma ser a opção mais simples. No entanto, tenha cuidado com os testes de zona quando os dados forem muito distorcidos ou não normais. Esses testes podem produzir alarmes falsos. Ainda assim, o uso dos limites tradicionais de ±3σ funciona bem. Os poucos pontos que ficam fora desses limites geralmente se devem a causas especiais reais.
Use os gráficos X̄ e R: O senhor precisa ter um método racional de subagrupar os dados, mas essa é uma forma de reduzir possíveis sinais falsos de dados não normais. O Teorema do Limite Central ajuda a normalizar a distribuição das médias, mesmo quando os pontos de dados individuais não são normais.
Para a análise de capacidade, o senhor pode usar o Non-normal Capability NCpk: Isso requer um software SPC. O software aplicará o ajuste a todos os tipos de distribuições diferentes e estabelecerá o melhor ajuste. Com base na distribuição, a capacidade será calculada com base no percentil 99,85% – percentil 0,15%.
Trabalho com dados distribuídos de forma não normal
Todas as opções de recursos, inclusive NCpk

No Qualis SPC 4.0, o senhor pode usar as opções “skewed bounded distributions” e NCpk para usar os modelos de distribuição específicos a serem usados para determinar a curva de melhor ajuste e calcular a capacidade não normal.

Conclusão: Foco nos sinais do processo, não nas distribuições

Dito e demonstrado tudo isso, podemos ter certeza de que não é necessário que os dados sigam uma distribuição normal para manter o processo sob controle. Os insights de Donald Wheeler mostram que um SPC eficaz tem a ver com a compreensão do comportamento do processo. Ao mudar o foco de suposições rígidas para o reconhecimento de causas especiais de variação, o senhor obtém:

Melhor controle;
Menos alarmes falsos;
Uma imagem mais clara do que realmente está acontecendo.

Em vez de se preocupar com a normalidade, invista sua energia nela:

Identificação de sinais reais do processo;
Treinamento de equipes para entender a variação;
Concentrar-se no que os dados estão tentando lhe dizer.

Como diz o Dr. Wheeler: “A forma do histograma não determina o controle do processo, mas sim os sinais”

Ao adotar os princípios de Wheeler, o senhor obtém uma maneira mais prática e intuitiva de manter os processos estáveis e melhorar continuamente.

Então, se seus dados não forem perfeitos como nos livros didáticos? Não se preocupe. Os gráficos de controle não foram feitos para livros didáticos, mas para o chão de fábrica. E é por isso que eles funcionam…

9%

Redução de custos alcançada pelos clientes

Datalyzer grid image go live

3 semanas para entrar em operação

Saiba mais sobre o Controle Estatístico de Processos. Seus principais tópicos e aplicações.

3x mais rápido

Ação rápida sobre problemas de qualidade

O que os clientes dizem

“O Datalyzer nos ajudou a vincular automaticamente dados de qualidade de todos os processos para análise avançada”

Dave Beeren

Engenheiro de rendimento, Philips

Setores que atendemos

Farmacêutica
Alimentos e bebidas
Aeroespacial
Alta tecnologia
Dispositivos médicos
Automotivo
Defesa
Embalagem
Semicondutores
Aeroespacial
Automotivo
Eletrônicos
Farmacêutica
Alta tecnologia
Dispositivos médicos
Defesa
Embalagem
Alimentos e bebidas
Semicondutores
Medição na produção

Certificação ISO

ISO 27001 E SOC2

Pronto para simplificar seu processo de qualidade?

Em apenas 60 minutos, um de nossos especialistas mostrará aos senhores como nossa plataforma modular ajuda as equipes de produção a melhorar a qualidade, reduzir a variação e simplificar as auditorias