sales@datalyzer.com

Quando se pretende reduzir ou eliminar um problema, teremos de apresentar ideias ou teorias sobre o que está a causar o problema. Uma forma de verificar se uma teoria deve ser levada a sério é utilizar um Gráfico de Dispersão, também chamado Análise de Regressão.

Para utilizar um gráfico de dispersão, temos primeiro de tomar uma série de medidas de duas coisas ao longo de um período de tempo. As duas coisas que mediríamos são o próprio problema, e a coisa que pensamos que pode estar a causar o problema. Depois traçamos as medidas numa tabela de dispersão. O gráfico de dispersão irá ajudar-nos a ver se existe uma relação matemática entre dois conjuntos de medições.

Analisaremos como utilizar um gráfico de dispersão utilizando um exemplo:

Fichas em Flocos:

Uma empresa fabrica grandes invólucros cilíndricos conhecidos como ” cápsulas ” para um processo químico.
A análise utilizando um gráfico de Pareto mostrou que o problema da descamação superficial das tampas estava a custar muito dinheiro à empresa.
Foi criada uma equipa de melhoria do processo para tentar reduzir o número de “flocos”. A equipa descobriu rapidamente que todos tinham uma opinião diferente sobre o que era OK e o que era um ” floco”. O primeiro trabalho, portanto, foi chegar a uma boa definição de um ” floco” que todos pudessem usar. Foi mostrado aos operadores do processo como utilizar cartas de controlo e eles começaram a manter uma tabela do número de ” flocos ” produzidos em cada lote. Este gráfico mostrava que o processo era instável, pelo que sabiam que tinham de procurar causas especiais de variação. Mary, uma das operadoras de processo da equipa, disse que sentia sempre frio nos dias em que tinham muitos flocos.
Os operadores de processo começaram a manter registos da temperatura do ar na altura em que as fichas foram feitas. Numa das reuniões da equipa, Jack salientou que em pelo menos duas ocasiões em que o número de flocos estava fora dos limites de controlo, estava a chover.
A equipa pediu ajuda ao laboratório para testar a teoria de que a chuva era um fator. Um dos engenheiros salientou que estava realmente a chover nesse mesmo dia, mas que havia muito poucos flocos. No entanto, ele ainda sugeriu que poderia ser uma boa ideia medir o teor de humidade do ingrediente principal.

Primeiro, vamos dar uma vista de olhos ao gráfico de controlo. Como cada ficha ou é uma flocagem ou não é uma flocagem, a tabela que devemos utilizar é uma tabela binomial.

Os dados estão fora de controlo porque alguns pontos estão fora dos limites de controlo. Há também intervalos de 10 pontos consecutivos acima e abaixo da linha média – estes também indicam instabilidade. Agora vejamos um gráfico de dispersão.

Neste gráfico, o número de flocos está no eixo vertical e a temperatura do ar está no eixo horizontal. Para cada linha da tabela de dados, é colocado um ponto onde os dois valores se encontram.

Num gráfico de dispersão, se as medições no eixo horizontal não estiverem de modo algum relacionadas com as medições no eixo vertical, então os pontos aparecerão ao acaso, sem qualquer padrão visível. Se houver uma relação matemática entre eles, então os pontos tenderão a agrupar-se numa linha ou curva.

Neste caso, não parece haver qualquer padrão para os pontos do gráfico de dispersão. Podemos concluir, portanto, que não há correlação entre a temperatura do ar e o número de escamações produzidas. Isto significa que podemos dizer que a temperatura do ar não é um fator de produção de flocos. Vejamos agora se a humidade tem influência;

Neste gráfico de dispersão vemos flocos no eixo vertical e conteúdo de humidade no eixo horizontal. Parece haver uma correlação entre os dois conjuntos de números porque podemos ver os pontos formados numa linha difusa. Este gráfico mostra que os flocos aumentam quando o teor de humidade aumenta. Isto ainda não prova que um cause o outro. Pode haver um terceiro fator que faz com que AMBOS mude ao mesmo tempo. Ainda assim, parece que temos aqui uma pista.
Acrescentámos uma linha de “melhor ajuste” através dos pontos. A equação para esta linha é mostrada na parte superior direita do gráfico. A figura do R-quadrado é uma medida de quão bem os dados se ajustam à linha.
– Se R-quadrado = 1, então todos os pontos se encontram na linha.
– Se R-quadrado for 0 ou próximo de 0, então não há correlação entre os dados dos dois eixos, pelo que a linha e a equação não têm qualquer relevância.

Agora olhe novamente para a dispersão da temperatura. Agora é possível ver a linha que melhor se adapta através destes pontos. O valor R-quadrado é baixo, mostrando que não há correlação entre os dois conjuntos de dados.

Algumas observações são importantes quando se utilizam os gráficos de dispersão: Ao olhar para os gráficos de dispersão pode ser importante incluir todas as outras informações relevantes. Pode ser importante olhar simultaneamente para gráficos de controlo, gráficos de dispersão e tabela de dados para compreender melhor o que se está exatamente a passar. Esta análise está para além do âmbito desta formação.

Outro aspecto importante de uma análise de dispersão é que os resultados são fortemente influenciados por um outlier. Se olharmos para o gráfico de dispersão com a temperatura e adicionarmos um outlier (18 flocos com 35 graus), obtemos o seguinte resultado:

Vê-se que um outlier está a alterar drasticamente o valor de R-quadrado. Por isso, olhe sempre para o gráfico e pergunte-se o que está a acontecer exactamente.

Sumário Lição 8:

  1. Um gráfico de dispersão ajuda-nos a ver se existe uma relação matemática (correlação) entre duas coisas que medimos. Isto pode ajudar-nos a encontrar as causas dos problemas.
  2. Mesmo que encontremos uma relação matemática, isto não significa necessariamente que uma delas cause a outra.