Um histograma é uma forma de mostrar um conjunto de medições como um visual. Vamos disparar algumas bolas da simulação da bola de ténis e depois olhar para um histograma das posições de aterragem.
Neste histograma, as medidas são as posições de aterragem das bolas a partir da simulação do lançador. As possíveis posições de aterragem são estabelecidas na escala horizontal e esta é dividida em várias secções. Para cada secção, é desenhada uma coluna e a altura da coluna representa o número de bolas que caíram dentro dessa secção de posições de aterragem. Por exemplo, a coluna entre “300” e “350” na escala horizontal tem uma altura de 2 unidades, o que significa que 2 bolas aterraram entre 300 e 350.
Vamos verificar se o histograma foi desenhado correctamente para os nossos dados.
Agora vamos disparar mais bolas e olhar para o histograma que contém mais resultados.
É assim que o histograma se parece após 60 tiros.
Vamos colocar um pouco mais de resultados no histograma.
Aqui vê o histograma após 510 disparos
Deve tornar-se claro depois de dispararmos estes vários tiros que as colunas mais altas estão perto do meio do histograma. Isto significa que a maioria das bolas aterram perto do meio do alcance dos resultados possíveis.
A forma do histograma é chamada a “distribuição“. Mostra como as medições são “distribuídas” entre a gama de medidas possíveis.
Um padrão particular de histograma em forma de sino é conhecido como a distribuição ‘normal’. Ocorre frequentemente na natureza e é comum em processos industriais. Sabemos muito sobre distribuições normais e isto ajuda-nos a fazer algumas afirmações gerais sobre o resultado dos processos.
Vamos agora produzir uma distribuição normal começando com um novo conjunto de imagens:
Note-se que a forma do histograma parece um sino com um meio alto e caudas em cada extremidade.
Esta caixa mostra alguns números para os dados que são utilizados para fazer o histograma. Vamos descrever as duas primeiras figuras na secção “Estatísticas”.
Média:
A Média é calculada de forma normal a partir dos resultados individuais: Os resultados individuais são somados e depois divididos pelo número total de resultados.
Desvio Padrão:
St dev’ significa Desvio Padrão. O Desvio Padrão dá-nos um valor para o quanto os valores individuais num conjunto de medições estão espalhados em torno da Média. Um conjunto de medições em que a maioria dos valores está próxima da Média tem um Desvio Padrão baixo, um conjunto de medições em que a maioria dos valores está longe da Média tem um Desvio Padrão alto.
Pode-se criar e utilizar cartas de controlo sem saber como calcular o Desvio Padrão. Para aqueles que querem saber, eis como calcular um Desvio Padrão:
Primeiro, encontrar a Média de todos os valores
Para cada valor individual, encontrar a distância em relação à Média.
Multiplique este número (multiplicá-lo por si mesmo).
Acrescentar todos os quadrados
Dividir pelo número de medidas menos uma.
Encontrar a raiz quadrada deste número.
Repito que não é preciso lembrar como calcular o Desvio Padrão para desenhar cartas de controlo ou utilizar as cartas para melhorar os processos. Tudo o que precisa de saber é que o Desvio Padrão é uma medida de dispersão.
Para distribuições normais, podemos utilizar o Desvio Padrão para fazer algumas afirmações úteis sobre um conjunto de medições. Também podemos fazer algumas previsões sobre futuras medições do mesmo processo se for razoável supor que o processo não mudará (só será razoável fazer esta suposição se o processo for estável).
Se as medições passadas mostrarem uma distribuição normal, e se o processo for estável, então podemos dizer:
Desde que o processo permaneça estável:
– Cerca de 68% dos resultados situar-se-ão entre um Desvio Padrão abaixo da Média e um Desvio Padrão acima da Média,
– Cerca de 27% situar-se-ão entre um Desvio Padrão e dois Desvios Padrão da Média,
– Cerca de 4,5% situar-se-ão entre dois Desvios Padrão e três Desvios Padrão da Média,
– Apenas uma proporção muito pequena (cerca de 0,3%) será superior a três Desvios Padrão da Média.
Vamos ver se isto é verdade, verificando uma destas afirmações
– A zona verde tem até 1 Desvio Padrão de cada lado da Média.
– A zona amarela é superior a 1 mas inferior a 2 Desvios Padrão da Média.
– A zona roxa é superior a 2 mas inferior a 3 Desvios Padrão da Média.
– A zona vermelha é mais de 3 Desvios Padrão da Média.
As linhas azuis mostram os limites de especificação para a simulação do lançador. Na secção “Conformidade” da caixa de informação verá números para o número de resultados que estão fora da especificação (OOS) e a percentagem dos resultados que estão dentro da especificação. Se arrastarmos as especificações para as colocarmos na margem de amarelo e roxo, a percentagem OK é recalculada.
O valor percentual OK mostra agora quantos dos resultados estão dentro de 2 Desvios Padrão da Média. Vê-se que é 95,1%, o que está próximo do que se esperava da informação acima.
Portanto, sabemos agora que para uma distribuição normal, a maioria dos resultados será inferior a um Desvio Padrão da Média. No entanto, também sabemos que haverá um pequeno número de resultados mais de 3 vezes o Desvio Padrão da Média. Não podemos dizer QUANDO estes resultados extremos irão acontecer, mas sabemos que irão acontecer em algum momento.
Utilizar estatísticas para prever o futuro:
Estas percentagens dizem-nos aproximadamente o que aconteceu no passado. mas perguntam-nos frequentemente que tipo de resultados iremos obter no futuro de um processo.
Podemos prever que o processo continuará a produzir aproximadamente a mesma proporção de resultados nas zonas de desvio padrão 1, 2 e 3, SE O PROCESSO NÃO MUDAR DE QUALQUER FORMA.
Além disso, as percentagens dadas acima para a distribuição normal só são verdadeiras a muito longo prazo. Seria errado sugerir que podemos dizer com confiança quais serão as medidas em qualquer lote de mercadorias em particular.
Sumário Lição 3:
- Um histograma é uma forma de mostrar um conjunto de medidas como uma imagem.
- A forma do histograma é conhecida como a distribuição.
- O Desvio Padrão dá um valor para a quantidade de dispersão que existe num conjunto de medidas.
- Se as medições anteriores mostrarem uma distribuição “normal”, e o processo for estável, então enquanto o processo se mantiver estável, podemos prever o número aproximado de resultados que estarão a diferentes distâncias da Média.