¿Por qué las ventas cero se presentan en (al menos) dos tipos?

Blog

¿Por qué las ventas cero se presentan en (al menos) dos tipos?

En la previsión de ventas minoristas, los eventos de ventas cero requieren especial atención al capacitar y aplicar modelos de demanda. Es difícil determinar a posteriori si un evento de ventas cero realmente evidencia una demanda que desaparece en un día determinado (como en “nadie tomó ese producto del estante”), o si el producto previsto simplemente no estaba disponible (como en “el producto ni siquiera se colocó en el estante”). Afortunadamente, la coherencia de los datos con el modelo de predicción se puede comprobar comparando la probabilidad prevista de observar cero con la frecuencia observada de eventos de ventas cero. Cuando esos datos no coinciden bien, es decir, cuando se observan ventas cero con mucha más o mucha menos frecuencia de la prevista, se diagnosticó un problema de datos importante pero bien definido.

¿Existe el cero y, de ser así, de cuántas maneras?

El número “cero” eludió la capacidad humana de abstracción durante un tiempo sorprendentemente largo. Las distintas culturas antiguas trataron la “ausencia total de algo” de diferentes maneras, y los historiadores de la ciencia aún debaten cuándo y cómo se inventó el cero como símbolo y se convirtió en parte de la corriente principal de las matemáticas. Por ejemplo, los números romanos ni siquiera contienen un símbolo para el cero, probablemente porque los romanos usaban los números para la contabilidad, no para la aritmética. Aristóteles incluso rechazó la idea misma de que el cero fuera un número: si no se puede dividir por él, ¿para qué sirve? En el siglo VII d.C., el matemático y astrónomo indio Brahmagupta comenzó a emplear y analizar un cero escrito, que luego se extendió al chino y al árabe, y, a través de este último, a la cultura europea.

Por supuesto, conoces el concepto de cero y te sientes cómodo empleándolo. Avancemos rápidamente algunos siglos de discusiones matemáticas hasta la predicción de la demanda minorista empleando aplicaciones de inteligencia artificial (IA) y aprendizaje automático (ML). Sostengo aquí que un solo tipo de cero no es suficiente. Para una correcta descripción de las ventas minoristas, son necesarios al menos dos conceptos diferentes de cero. Uno debe mantener en un conjunto de datos de entrenamiento, el otro debe eliminar.

Por un lado, un producto puede estar disponible y ofrecer al público: la tienda está abierta, la caja registradora y todo lo demás funciona, ¡pero sencillamente ningún cliente quiere comprarlo! En ese caso, el hecho de que no se vendieron productos refleja la falta real de demanda y la falta de interés de los consumidores en ese producto. Idealmente, nuestro modelo de predicción de la demanda no se “sorprende” por ese cero en el sentido de que predijo una probabilidad no microscópica pero finita de observar cero.

La verdadera falta de demanda conduce a una demanda cero, que me gustaría distinguir de la disponibilidad cero. Este último tipo de cero se produce simplemente por la falta de disponibilidad del producto. Al cliente ni siquiera se le ofrece el producto, no tiene ninguna posibilidad de comprarlo, aunque quisiera (nunca lo sabremos). Ayer no vendí ningún iPhone por 99 dólares, pero eso es irrelevante, porque ni siquiera le ofrecí ningún iPhone a nadie. Si lo ofreció, mi precio moderado generó bastante demanda y probablemente encontró un comprador. Tampoco vendí el cochecito usado que ofrecí en línea; eso es más informativo, la demanda es cero. Si bien la demanda cero refleja que el artículo no es particularmente popular (por decirlo suavemente), la falta de disponibilidad cero no tiene nada que ver con la demanda real de un artículo.

La falta de disponibilidad puede tener muchas causas diferentes: la más importante es que las existencias se agotaron; en ese caso, simplemente no queda nada para vender. Por lo tanto, es estupendo tener el valor de las acciones matutinas en una columna bien organizada de nuestros datos. Luego, podemos recurrir a los métodos descritos en esta entrada del blog. Sin embargo, a menudo no nos encontramos con ese paraíso de calidad de datos: la información bursátil no está disponible o, al menos, no es del todo fiable. Pero incluso si se integraran valores de existencias fiables, no podemos estar completamente seguros de que el producto se ofrezca realmente en el estante; podría estar almacenado en la trastienda, el gerente de la tienda podría decidir que es demasiado pronto o demasiado tarde en el año para ofrecerlo.

La falta de disponibilidad oculta la demanda real: Para conocer la demanda de un artículo, necesitamos ofrecerlo. No tengo ni idea de cuánta demanda generará un impermeable verde con motitas rosas, a menos que lo ponga en el estante, le ponga una etiqueta de precio y se lo ofrezca a los clientes. Si un producto no se ofrece, solo puedo formular hipótesis sobre la demanda, pero no puedo medirla.

En resumen, mis conceptos de cero son estos dos: La demanda cero bien gestionada transmite honestamente la información (quizás engañosa) de que el producto en el estante simplemente no es muy popular (por cierto: ¿alguien necesita un cochecito de bebé usado?). y la disponibilidad cero, que oculta toda la información posible sobre la demanda real; esa demanda podría ser cero, uno, 14 o 2766. Es evidente que hay que incluir los valores de demanda cero en el entrenamiento del modelo, pero se sufrirían enormes consecuencias si se confundiera un valor de disponibilidad cero con una falta de demanda.

Trazando un camino claro para su cadena de suministro

Tendencias globales y perspectivas del sector, entregadas mensualmente con el boletín informativo Supply Chain Compass. 

¿Qué probabilidades hay de que se produzca una venta con demanda cero?

En el sector minorista, a menudo trabajamos con la distribución de Poisson (puedes leer más sobre ello en las entradas del blog " Pronóstico: pocas cosas son diferentes, parte 1 y parte 2"). Para un proceso de Poisson, la probabilidad de observar 0 disminuye exponencialmente con una tasa media creciente. Es decir, para una predicción de Poisson con una tasa media de 1 (es decir, esperamos vender una pieza en promedio), esperamos observar cero en aproximadamente el 37% de los casos; por lo tanto, es bastante probable y nada sorprendente. Para una tasa de 4, esa probabilidad se convierte en un 2%; esperamos que eso ocurra cada siete semanas aproximadamente. Para una tasa de 10, esa probabilidad baja al 0,005%; para una predicción de 20, estamos hablando de eventos extremadamente raros, que nos sorprenderían bastante si ocurrieran. La predicción de Poisson es, sin duda, una idealización: una predicción de la demanda realista será “más amplia” en el sentido de que es más probable en la práctica que los valores de ventas que se alejan de la media se den de forma diferente a como lo predice la distribución de Poisson. Es decir, esperamos más ventas nulas de las que indican las cifras anteriores.

Si solo consideramos los productos de alta venta, que se compran unas 20 veces o más al día, cualquier cero que aparezca puede interpretar con seguridad como disponibilidad cero. Observe el siguiente patrón de unidades vendidas a lo largo del tiempo:

why-zero-sales-come-in-at-least-two-kinds-body-01

 

Resulta evidente que ocurre algo excepcional en esa semana de mediados de enero, cuando no se producen ventas durante tres días consecutivos. Es improbable que la demanda real se desplomó tan significativamente durante tres días para luego volver al nivel inicial. Claramente, tenemos disponibilidad cero, que debería eliminar del entrenamiento.

Sin embargo, cuando las tasas de venta generales no son tan altas, no es fácil decidir si un cero determinado es un cero de demanda o un cero de disponibilidad:

why-zero-sales-come-in-at-least-two-kinds-body-02

En este caso, es mucho más difícil determinar si un evento de cero ventas refleja una demanda nula o una disponibilidad nula. ¿Cuáles de esos ceros deben mantener en el entrenamiento y cuáles deben eliminar? Esa pregunta es fundamental para una formación imparcial: las ventas medias, incluyendo o excluyendo los ceros, difieren sustancialmente.

El ejemplo de bajas ventas muestra la necesidad de incluir información sobre la asignación o el listado que nos indique, a priori, si cabe esperar ventas en un día determinado. Cuando el producto no estaba disponible, el evento de ventas cero, previsible y poco informativo, se considera una disponibilidad cero. Cuando el producto estaba disponible, el evento de ventas cero representaba una demanda cero, lo que reflejaba una baja demanda.

Evaluación de la consistencia mediante la probabilidad de recuento cero prevista

Supongamos que disponemos de datos integrados, incluyendo información sobre listados y disponibilidad. Capacitamos un modelo con la demanda observada (incluyendo los valores de demanda cero pero excluyendo los valores de disponibilidad cero) y generado predicciones. ¿Cómo podemos averiguar si la información sobre el tipo de ceros es correcta? Para un evento de ventas determinado de un producto de baja rotación (que se comporta como en el segundo gráfico de seriales temporales), es imposible determinar a posteriori si un cero es un cero de disponibilidad o un cero de demanda. Sin embargo, podemos emitir un juicio sobre un conjunto de muchas predicciones y observaciones correspondientes: podemos comparar la frecuencia observada de supuestos ceros de demanda con la frecuencia prevista. Para ello, representamos gráficamente la tasa esperada de ceros frente a la predicción (que no es más que una curva exponencialmente decreciente):

why-zero-sales-come-in-at-least-two-kinds-body-03

Observe el eje x logarítmico, que abarca cuatro órdenes de magnitud desde 0,01 hasta 100.

Agrupemos ahora todas las predicciones y resultados en categorías caracterizadas por la predicción, por ejemplo, todas las predicciones entre 0,8 y 1,2, todas entre 1,2 y 1,5, y así sucesivamente. ¿Te preguntas por qué agrupamos por predicción y no por resultado? La respuesta se encuentra oculta en la entrada del blog "No siempre debiste haberlo sabido todo". Para cada uno de estos grupos, representamos la fracción observada de ceros en el gráfico como un círculo, cuyo tamaño refleja el número de observaciones. Aquí lo hicimos para tres conjuntos diferentes de predicciones y resultados, que tienen distinta calidad de datos:

why-zero-sales-come-in-at-least-two-kinds-body-04

Primero, fíjate en los círculos rojos. Para cada grupo de predicciones, el número de ceros observados en los datos coincide muy bien con la fracción prevista de ceros de demanda. En este caso, los datos están limpios (al menos en lo que respecta a los ceros): los ceros de disponibilidad se eliminaron correctamente, podemos confiar, en promedio, en que los ceros en los datos son realmente ceros de demanda. Nunca sabremos si los ceros que aparecen son realmente ceros de demanda, pero no hay pruebas que pongan en duda esa suposición.

Ahora observemos el conjunto de datos verde: la fracción observada de ceros siempre es demasiado grande. Esto apunta a un problema sistemático en los datos: cuando el modelo predice 30, no se esperan ceros, pero se observa un 30% de ceros en los datos. Incluso si esa predicción de 30 fuera muy errónea y sesgada, nunca esperaríamos tantos ceros. Por lo tanto, bastantes casos de disponibilidad cero se trataron incorrectamente como casos de demanda cero genuinos. La “meseta” en la que convergen los círculos indica que existe un nivel constante de ceros de disponibilidad que contaminan los datos. Se deben revisar los datos e incluir la información de la lista para cerciorar de que solo los productos ofrecidos estén incluidos en los datos de ventas. En los seriales temporales individuales de productos, esperamos ver artefactos como el que se muestra en la figura anterior.

El conjunto de datos naranja es un ejemplo del tipo de error opuesto: para predicciones muy pequeñas, como 0,1, esperamos ver muchos ceros en los datos, pero observamos muchos menos. Al parecer, algunos valores de demanda cero se interpretaron erróneamente como valores de disponibilidad cero y se eliminaron del conjunto de datos. Una vez más, analizar en detalle cada producto puede ayudar a identificar la causa exacta de este comportamiento.

En resumen, una imagen como la de los datos rojos nos ayuda a confiar en los datos, mientras que las formas verdes y naranjas nos permiten identificar rápidamente un manejo incorrecto de los ceros de demanda y disponibilidad. Según nuestra experiencia, una vez resueltos los problemas con los ceros, muchos otros indicadores clave de rendimiento (KPI), como el sesgo, también pasan a estar dentro del rango de valores aceptables.

Haz que tu expectativa sea cuantificable y explícita, y compárala con la observación.

Aquí no hicimos nada muy complicado, ¡disculpen si generé expectativas erróneas! Simplemente le hicimos a nuestro modelo una pregunta sencilla (“¿con qué frecuencia espera ver un resultado cero para esa predicción, en promedio?”) y comparamos la observación empírica con la respuesta teórica. Con frecuencia, un sesgo en el modelo se debe a un manejo inadecuado de los eventos de ventas cero. Comprobar el estado de los ceros con un gráfico como el que se muestra aquí debería ser un paso estándar en el diagnóstico de problemas de datos en proyectos de previsión de la demanda.

De hecho, el número cero todavía se emplea con frecuencia de forma incorrecta en las aplicaciones de aprendizaje automático. Por lo tanto, la ausencia de evidencia (una disponibilidad cero) no debe interpretar como evidencia de ausencia (una demanda cero). Hacer explícita esta distinción nos ayuda a decidir con fundamentos estables qué punto de datos incluir en el entrenamiento de un modelo y cuál debe eliminar.