mais de 50 países
Uso global, impacto local
47 anos de atividade
Originada em 1979
mais de 50 funcionários
Europa, EUA e Ásia
mais de 2000 clientes
Mais de 20.000 usuários
Blog: O mito da distribuição normal e o controle estatístico de processos
Introdução
Nem todos os dados são distribuídos normalmente. Há muitas distribuições possíveis diferentes. É uma crença comum no mundo da engenharia de qualidade que, se os dados não forem distribuídos normalmente, o senhor não poderá aplicar gráficos de controle porque a normalidade é um requisito para aplicar gráficos de controle. Acontece que essa crença não se sustenta e, neste blog, explicaremos por quê.
O que é a curva de distribuição normal?
A distribuição normal – também conhecida como curva de sino, distribuição gaussiana ou distribuição de Gauss – é uma distribuição de probabilidade contínua em forma de sino e simétrica em torno da média. É a distribuição de probabilidade mais amplamente usada em estatística.
Em uma distribuição normal, aproximadamente 68,27% dos dados estão dentro de um desvio padrão da média, 95,45% dos dados estão dentro de dois desvios padrão e 99,73% dos dados estão dentro de três desvios padrão.

Distribuição normal no controle estatístico de processos
O uso da distribuição normal tem raízes que remontam a quase um século. Quando o Controle Estatístico de Processos foi introduzido pela primeira vez, na década de 1920, por Walter Shewhart, muitas das ferramentas que ainda usamos hoje, como os gráficos X̄ e R, foram construídas com base em suposições ligadas à distribuição normal (gaussiana).
Uma estatística usada com frequência no controle de qualidade é a média de várias amostras. Um conceito conhecido na teoria da probabilidade é o Teorema do Limite Central. O Teorema do Limite Central afirma que a distribuição amostral das médias se aproxima de uma distribuição normal à medida que o tamanho da amostra aumenta, independentemente da forma da distribuição da população original. O teorema do limite central foi estabelecido pela primeira vez em um caso específico por Abraham de Moivre em 1733 e, em seguida, generalizado e comprovado em uma forma mais geral por Pierre-Simon Laplace em 1810, a quem se atribui a descoberta geral e a demonstração de sua importância na teoria da probabilidade.
Shewhart usou esse teorema e estabeleceu que a colocação de limites de controle em três desvios padrão da média do processo – em ambas as direções – oferecia um equilíbrio prático entre o risco de reagir a um alarme falso e o risco de não reagir a um sinal verdadeiro. (Economic Control of Quality of Manufactured Product, 1931)
O SPC usa Gráficos de Controle para monitorar pontos de dados e identificar quando um processo se desvia do comportamento normal esperado, indicando possíveis problemas. Quando uma estatística segue uma distribuição normal, espera-se que cerca de 99,7% dos pontos de dados estejam dentro de três desvios padrão da média. Quando uma medição é encontrada fora dos limites de 3 sigma, presumimos que há uma causa especial de variação. Isso significa que há apenas 0,3% de chance (ou 1 em 370) de um valor de medição além dos 3 desvios padrão e que não há uma causa especial de variação.
Embora o teorema do limite central seja aplicável, ele não é um requisito para o uso de gráficos de controle. Há áreas na estatística em que a normalidade é necessária. Por exemplo, na aplicação de testes de hipóteses, testes específicos exigem normalidade. Por exemplo, o teste F e o teste t exigem que os dados sejam distribuídos normalmente.
Além disso, para relatórios de capacidade, 99,7% da variação é incluída no cálculo. Se os dados não forem distribuídos normalmente, podem ocorrer pequenos desvios se o senhor presumir que os dados são distribuídos normalmente. No caso de caudas pesadas na distribuição, é aconselhável informar o cálculo de capacidade não normal.
De alguma forma, ao longo dos anos, essa exigência de normalidade no Teste de Hipótese e Capacidade resultou na concepção errônea de que a normalidade é necessária para a aplicação do CEP e o uso de Gráficos de Controle.
Então, por que a normalidade não é necessária?
A regra dos três sigmas funciona (mesmo para dados não normais)
Se a normalidade fosse realmente necessária, os gráficos de intervalo não funcionariam porque nunca são distribuídos normalmente – no entanto, eles têm sido usados há décadas e continuam a ser altamente eficazes.
Embora os testes estatísticos, como o teste t e o teste F, exijam uma distribuição normal, o SPC no chão de fábrica não se trata de testes de hipóteses. Trata-se de responder a uma pergunta mais prática: Meu processo é estável ou não? E a boa notícia é que o CEP ainda pode lhe fornecer insights valiosos mesmo quando os dados não são distribuídos normalmente.
Especialistas como Donald Wheeler (Advanced Topics in Statistical Process Control) têm demonstrado há décadas que é um mito que os gráficos de controle funcionam devido ao Teorema do Limite Central. O CEP foi criado para lidar com cenários do mundo real. Na verdade, as descobertas de Wheeler – apoiadas por um trabalho anterior de Irving Burr, que analisou 27 distribuições não normais diferentes – demonstram que os gráficos de controle permanecem confiáveis mesmo com dados que apresentam extrema assimetria (acima de 1,9) ou curtose (acima de 12) porque, em todas as distribuições, mais de 99% das medições estão entre os limites de 3 sigmas. O princípio básico ainda se mantém: ao usar limites de três sigmas, a chance de um alarme falso (um ponto fora dos limites devido à variação de causa comum) permanece baixa – menos de 1% – independentemente da distribuição subjacente. Essa é uma boa notícia para aqueles que não vivem em condições de livro-texto.

Trabalhando com dados não normais: Dicas práticas que funcionam
No teste de hipóteses, é recomendável transformar os dados para que eles atendam à suposição de normalidade. Se o objetivo for usar Gráficos de Controle para monitorar a estabilidade do processo, a transformação dos dados pode ser mais prejudicial do que benéfica. Os operadores podem ter dificuldade para entender a variação dos valores transformados e, como resultado, as cartas de controle podem perder o significado prático. A menos que o senhor esteja realizando testes estatísticos formais, é altamente recomendável manter os dados em sua forma original.
Na maioria dos casos, não é necessário transformar os dados ou procurar uma correspondência perfeita de distribuição. Veja a seguir como lidar com a não normalidade na prática:


No Qualis SPC 4.0, o senhor pode usar as opções “skewed bounded distributions” e NCpk para usar os modelos de distribuição específicos a serem usados para determinar a curva de melhor ajuste e calcular a capacidade não normal.
Conclusão: Foco nos sinais do processo, não nas distribuições
Dito e demonstrado tudo isso, podemos ter certeza de que não é necessário que os dados sigam uma distribuição normal para manter o processo sob controle. Os insights de Donald Wheeler mostram que um SPC eficaz tem a ver com a compreensão do comportamento do processo. Ao mudar o foco de suposições rígidas para o reconhecimento de causas especiais de variação, o senhor obtém:
Em vez de se preocupar com a normalidade, invista sua energia nela:
Como diz o Dr. Wheeler: “A forma do histograma não determina o controle do processo, mas sim os sinais”
Ao adotar os princípios de Wheeler, o senhor obtém uma maneira mais prática e intuitiva de manter os processos estáveis e melhorar continuamente.
Então, se seus dados não forem perfeitos como nos livros didáticos? Não se preocupe. Os gráficos de controle não foram feitos para livros didáticos, mas para o chão de fábrica. E é por isso que eles funcionam…
9%
Redução de custos alcançada pelos clientes


O que os clientes dizem
“O Datalyzer nos ajudou a vincular automaticamente dados de qualidade de todos os processos para análise avançada”
Dave Beeren
Engenheiro de rendimento, Philips
Setores que atendemos

Certificação ISO
ISO 27001 E SOC2
Pronto para simplificar seu processo de qualidade?
Em apenas 60 minutos, um de nossos especialistas mostrará aos senhores como nossa plataforma modular ajuda as equipes de produção a melhorar a qualidade, reduzir a variação e simplificar as auditorias