Datalyzer grid icon variant 1

más de 50 países

Uso global, impacto local

Datalyzer grid icon variant 3

47 años en el negocio

Creado en 1979

Datalyzer grid icon variant 2

más de 50 empleados

Europa, EE.UU. y Asia

Datalyzer grid icon variant 4

más de 2000 clientes

Más de 20.000 usuarios

Blog: El mito de la distribución normal y el control estadístico de procesos

Introducción

No todos los datos tienen una distribución normal. Existen muchas distribuciones posibles. Es una creencia común en el mundo de la ingeniería de calidad que si los datos no están distribuidos normalmente, no se pueden aplicar gráficos de control porque la normalidad es un requisito para aplicar gráficos de control. Resulta que esta creencia no se sostiene, y en este blog le explicaremos por qué.

¿Qué es la curva de distribución normal?

Una distribución normal -también conocida como curva de campana, distribución gaussiana o distribución de Gauss- es una distribución de probabilidad continua que tiene forma de campana y es simétrica en torno a la media. Es la distribución de probabilidad más utilizada en estadística.

En una distribución normal, aproximadamente el 68,27% de los datos caen dentro de una desviación estándar de la media, el 95,45% de los datos caen dentro de dos desviaciones estándar y el 99,73% de los datos caen dentro de tres desviaciones estándar.

Normal Distribution Graphic

La distribución normal en el control estadístico de procesos

El uso de la distribución normal tiene raíces que se remontan a casi un siglo. Cuando el control estadístico de procesos fue introducido por primera vez en la década de 1920 por Walter Shewhart, muchas de las herramientas que aún utilizamos hoy en día, como los gráficos X̄ y R, se construyeron sobre supuestos ligados a la distribución normal (gaussiana).

Una estadística utilizada a menudo en el control de calidad es la media de varias muestras. Un concepto conocido en la teoría de la probabilidad es el Teorema del Límite Central. El teorema del límite central afirma que la distribución muestral de las medias se aproxima a una distribución normal a medida que aumenta el tamaño de la muestra, independientemente de la forma de la distribución original de la población. El teorema del límite central fue establecido por primera vez en un caso específico por Abraham de Moivre en 1733, y luego generalizado y demostrado de forma más general por Pierre-Simon Laplace en 1810, a quien a menudo se atribuye su descubrimiento general y la demostración de su importancia en la teoría de la probabilidad.

Shewhart utilizó este teorema y estableció que situar los límites de control a tres desviaciones estándar de la media del proceso -en ambas direcciones- ofrecía un equilibrio práctico entre el riesgo de reaccionar ante una falsa alarma y el riesgo de no reaccionar ante una señal verdadera. (Control económico de la calidad del producto manufacturado, 1931)

El SPC utiliza gráficos de control para supervisar los puntos de datos e identificar cuándo un proceso se desvía de su comportamiento normal esperado, lo que indica posibles problemas. Cuando una estadística sigue una distribución normal, se espera que alrededor del 99,7% de los puntos de datos se sitúen dentro de las tres desviaciones estándar de la media. Cuando una medición se encuentra fuera de los límites de 3 sigmas, suponemos que existe una causa especial de variación. Eso significa que sólo hay un 0,3% de posibilidades (o 1 de cada 370) de que un valor de medición se sitúe más allá de las 3 desviaciones típicas y no exista una causa especial de variación.

Aunque el teorema del límite central es aplicable, no es un requisito para utilizar gráficos de control. Hay áreas de la estadística en las que se requiere normalidad. Por ejemplo, al aplicar la prueba de hipótesis, pruebas específicas requieren normalidad. Por ejemplo, las pruebas F y t requieren que los datos estén distribuidos normalmente.

Además, para los informes de capacidad se incluye en el cálculo el 99,7 % de la variación. Si los datos no están distribuidos normalmente pueden producirse ligeras desviaciones si se supone que los datos están distribuidos normalmente. En caso de colas pesadas en la distribución se aconseja informar del cálculo de capacidad no normal.

De alguna manera, a lo largo de los años, este requisito de normalidad en las Pruebas de Hipótesis y Capacidad dio lugar a la idea errónea de que la normalidad es necesaria para aplicar el SPC y el uso de Gráficos de Control.

Entonces, ¿por qué no es necesaria la normalidad?

La regla de los tres sigmas funciona (incluso para datos no normales)

Si realmente se exigiera normalidad, los gráficos de rangos no funcionarían porque nunca se distribuyen normalmente; sin embargo, se han utilizado durante décadas y siguen siendo muy eficaces.

Aunque las pruebas estadísticas como la prueba t y la prueba F requieren una distribución normal, el SPC en el taller no trata sobre la comprobación de hipótesis. Se trata de responder a una pregunta más práctica: ¿Mi proceso es estable o no? Y la buena noticia es que el SPC puede proporcionarle información valiosa incluso cuando sus datos no se distribuyen normalmente.

Expertos como Donald Wheeler (Advanced Topics in Statistical Process Control) han demostrado durante décadas que es un mito que los gráficos de control funcionen debido al teorema del límite central. El SPC está construido para manejar escenarios del mundo real. De hecho, los hallazgos de Wheeler -apoyados por trabajos anteriores de Irving Burr, que analizó 27 distribuciones no normales diferentes- demuestran que los gráficos de control siguen siendo fiables incluso con datos que muestran una asimetría extrema (superior a 1,9) o una curtosis (superior a 12) porque en todas las distribuciones más del 99% de las mediciones se sitúan entre los 3 límites sigma. El principio básico sigue siendo válido: cuando se utilizan límites de tres sigmas, la probabilidad de una falsa alarma (un punto que queda fuera de los límites debido a una variación de causa común) sigue siendo baja -menos del 1%- independientemente de la distribución subyacente. Son buenas noticias para los que no vivimos en condiciones de libro de texto.

Datalyzer Imagen Mito de la distribución normal

Trabajar con datos no normales: Consejos prácticos que funcionan

En las pruebas de hipótesis, se recomienda transformar los datos para que cumplan el supuesto de normalidad. Si su objetivo es utilizar los gráficos de control para supervisar la estabilidad del proceso, transformar los datos puede hacer más mal que bien. Los operarios pueden tener dificultades para comprender la variación de los valores transformados y, como resultado, los gráficos de control pueden perder significado práctico. A menos que vaya a realizar pruebas estadísticas formales, le recomendamos encarecidamente que mantenga los datos en su forma original.

En la mayoría de los casos no necesita transformar sus datos ni buscar una coincidencia de distribución perfecta. He aquí cómo manejar la no normalidad en la práctica:

Gráfico de control individual: Esta suele ser la opción más sencilla. Sin embargo, tenga cuidado con las pruebas de zonas cuando sus datos estén muy sesgados o no sean normales. Estas pruebas pueden producir falsas alarmas. Aun así, utilizar los límites tradicionales de ±3σ funciona bien. Los pocos puntos que caen fuera de esos límites suelen deberse a causas especiales reales.
Utilice gráficos X̄ y R: Es necesario disponer de un método racional para subagrupar los datos, pero es una forma de reducir las posibles señales falsas de los datos no normales. El Teorema Central del Límite ayuda a normalizar la distribución de los promedios, incluso cuando los puntos de datos individuales no son normales.
Para el análisis de capacidad puede utilizar el NCpk de capacidad no normal: Esto requiere un software SPC. El software aplicará el ajuste a todo tipo de distribuciones diferentes y establecerá el mejor ajuste. Basándose en la distribución, la capacidad se calculará en función del percentil 99,85% – percentil 0,15%.
Trabajar con datos distribuidos de forma no normal
Todas las opciones de capacidad, incluido NCpk

En Qualis SPC 4.0, puede utilizar las opciones «distribuciones acotadas sesgadas» y NCpk para utilizar los modelos de distribución específicos que se utilizarán para determinar la curva de mejor ajuste y calcular la capacidad no normal.

Conclusión: Céntrese en las señales del proceso, no en las distribuciones

Dicho y demostrado todo esto, podemos estar seguros de que no necesitamos que los datos sigan una distribución normal para mantener su proceso bajo control. Las ideas de Donald Wheeler demuestran que un SPC eficaz consiste en comprender el comportamiento del proceso. Al cambiar el enfoque de las suposiciones estrictas al reconocimiento de las causas especiales de variación, se obtiene:

Mejor control;
Menos falsas alarmas;
Una imagen más clara de lo que realmente está ocurriendo.

En lugar de preocuparse por la normalidad, invierta su energía en:

Identificación de señales de proceso reales;
Formar a los equipos para que comprendan la variación;
Centrarse en lo que los datos intentan decirle.

Como dice el Dr. Wheeler «La forma del histograma no determina el control de su proceso, sino sus señales»

Al adoptar los principios de Wheeler, obtendrá una forma más práctica e intuitiva de mantener los procesos estables y mejorarlos continuamente.

¿Y si sus datos no son perfectos como los de los libros de texto? No se preocupe. Los gráficos de control no se hicieron para los libros de texto, sino para el taller. Y por eso funcionan..

9%

Reducción de costes conseguida por los clientes

Datalyzer grid image go live

3 semanas para entrar en funcionamiento

Más información sobre el control estadístico de procesos. Sus temas centrales y aplicaciones.

3 veces más rápido

Actuación rápida en cuestiones de calidad

Lo que dicen los clientes

«Datalyzer nos ayudó a vincular automáticamente los datos de calidad de todos los procesos para realizar análisis avanzados»

Dave Beeren

Ingeniero de producción, Philips

Industrias a las que servimos

Farmacia
Alimentación y bebidas
Aeroespacial
Alta tecnología
Productos sanitarios
Automoción
Defensa
Embalaje
Semiconductor
Aeroespacial
Automoción
Electrónica
Farmacia
Alta tecnología
Productos sanitarios
Defensa
Embalaje
Alimentación y bebidas
Semiconductor
Medición en la producción

Certificado ISO

ISO 27001 Y SOC2

¿Listo para simplificar su proceso de calidad?

En sólo 60 minutos, uno de nuestros expertos le explicará cómo nuestra plataforma modular ayuda a los equipos de fabricación a mejorar la calidad, reducir la variación y simplificar las auditorías