sales@datalyzer.com

Un histograma es una forma de mostrar un conjunto de medidas en forma de imagen.
Disparemos algunas pelotas de la simulación de pelotas de tenis y luego veamos un histograma de las posiciones de aterrizaje.

En este histograma, las medidas son las posiciones de aterrizaje de las bolas de la simulación del lanzador. Las posibles posiciones de aterrizaje se establecen en la escala horizontal y ésta se divide en varias secciones. Para cada sección, se dibuja una columna y la altura de la columna representa el número de bolas que han caído dentro de esa sección de posiciones de aterrizaje. Por ejemplo, la columna entre “300” y “350” en la escala horizontal tiene una altura de 2 unidades, lo que significa que 2 bolas han caído entre 300 y 350.

Comprobemos que el histograma se ha dibujado correctamente para nuestros datos.

Ahora dispararemos más bolas y miraremos el histograma que contiene más resultados.
Este es el aspecto del histograma después de 60 disparos.

Pongamos un poco más de resultados en el histograma.
Aquí puedes ver el histograma después de 510 disparos

 

Una vez que hayamos realizado esta cantidad de disparos, debería quedar claro que las columnas más altas se encuentran cerca del centro del histograma. Esto significa que la mayoría de las bolas caen cerca de la mitad del rango de resultados posibles.

La forma del histograma se llama “distribución”. Muestra cómo se “distribuyen” las medidas entre el rango de medidas posibles.

Un patrón particular de histograma en forma de campana se conoce como distribución “normal”. Se da con frecuencia en la naturaleza y es común en los procesos industriales. Sabemos mucho sobre las distribuciones normales y esto nos ayuda a hacer algunas afirmaciones generales sobre el resultado de los procesos.

Ahora vamos a producir una distribución normal partiendo de un nuevo conjunto de disparos:

 

Observe que la forma del histograma se parece a una campana con un centro alto y colas en cada extremo.
Este cuadro muestra algunas cifras de los datos que se utilizan para hacer el histograma. Vamos a describir las dos primeras cifras en la sección “Estadísticas”.

Promedio:
El promedio se calcula de manera normal a partir de los resultados individuales: Se suman los resultados individuales y se dividen por el número de resultados.

Desviación estándar:
‘St dev’ significa Desviación Estándar. La desviación estándar nos da una cifra de cuánto se dispersan los valores individuales de un conjunto de mediciones en torno a la media. Un conjunto de mediciones en el que la mayoría de los valores están cerca de la media tiene una desviación estándar baja, mientras que un conjunto de mediciones en el que la mayoría de los valores están lejos de la media tiene una desviación estándar alta.

Se pueden crear y utilizar gráficos de control sin saber cómo calcular la Desviación Estándar. Para aquellos que quieran saberlo, aquí se explica cómo calcular una Desviación Estándar:

En primer lugar, encuentre la Media de todos los valores
Para cada valor individual, encuentre la distancia de la Media.
Eleva al cuadrado este número (multiplícalo por sí mismo).
Suma todos los cuadrados
Dividir por el número de mediciones menos uno.
Encuentra la raíz cuadrada de este número.

Repito que no es necesario recordar cómo se calcula la Desviación Estándar para dibujar gráficos de control o para utilizar los gráficos para mejorar los procesos. Todo lo que necesitas saber es que la Desviación Estándar es una medida de la dispersión.
En el caso de las distribuciones normales, podemos utilizar la desviación típica para hacer algunas afirmaciones útiles sobre un conjunto de medidas. También podemos hacer algunas predicciones sobre futuras mediciones del mismo proceso si es razonable suponer que el proceso no cambiará (sólo será razonable hacer esta suposición si el proceso es estable).

Si las mediciones pasadas muestran una distribución normal, y el proceso es estable, entonces podemos decir:
Mientras el proceso se mantenga estable:

– Alrededor del 68% de los resultados estarán entre una desviación estándar por debajo de la media y una desviación estándar por encima de la media,
– Alrededor del 27% se situará entre una desviación estándar y dos desviaciones estándar de la media,
– Alrededor del 4,5% se situará entre dos desviaciones estándar y tres desviaciones estándar de la media,
– Sólo una proporción muy pequeña (alrededor del 0,3%) estará a más de tres desviaciones estándar de la media.

Veamos si esto es cierto comprobando una de estas afirmaciones

– La zona verde es hasta 1 desviación estándar a cada lado de la media.
– La zona amarilla es más de 1 pero menos de 2 desviaciones estándar de la media.
– La zona púrpura es más de 2 pero menos de 3 desviaciones estándar de la media.
– La zona roja es más de 3 desviaciones estándar de la media.

Las líneas azules muestran los límites de las especificaciones para la simulación del lanzador. En la sección “Conformidad” del cuadro de información, se muestran las cifras del número de resultados que están fuera de la especificación (OOS) y el porcentaje de los resultados que están dentro de la especificación. Si arrastramos las especificaciones para situarlas en el límite del amarillo y el púrpura, se recalcula el porcentaje OK.

La cifra del porcentaje OK muestra ahora cuántos de los resultados están dentro de las 2 desviaciones estándar de la media. Se ve que es el 95,1%, lo que se acerca a lo que esperábamos de la información anterior.
Por lo tanto, ahora sabemos que para una distribución normal, la mayoría de los resultados serán menos de una desviación estándar de la media. Sin embargo, también sabemos que habrá un pequeño número de resultados más de 3 veces la desviación estándar de la media. No podemos saber CUÁNDO se producirán estos resultados extremos, pero sabemos que ocurrirán en algún momento.

Utilizar la estadística para predecir el futuro:
Estos porcentajes nos dicen aproximadamente lo que ha ocurrido en el pasado. pero a menudo nos preguntan qué tipo de resultados obtendremos en el futuro de un proceso.

Podemos predecir que el proceso seguirá produciendo aproximadamente la misma proporción de resultados en las zonas de 1, 2 y 3 desviaciones estándar SI EL PROCESO NO CAMBIA DE NINGUNA MANERA.

Además, los porcentajes indicados anteriormente para la distribución normal sólo son válidos a muy largo plazo. Sería un error sugerir que podemos decir con confianza cuáles serán las mediciones en un lote concreto de productos.

Resumen de la lección 3:

1. Un histograma es una forma de mostrar un conjunto de medidas en forma de imagen.
2. La forma del histograma se conoce como distribución.
3. La desviación estándar indica el grado de dispersión de un conjunto de mediciones.
4. Si las mediciones pasadas muestran una distribución “normal”, y el proceso es estable, entonces mientras el proceso permanezca estable, podemos predecir el número aproximado de resultados que estarán a diferentes distancias de la Media.