Gracias a la inteligencia artificial, podemos analizar miles de imágenes de góndolas para saber qué productos están presentes, su posición, y detectar quiebres de stock con un nivel de detalle nunca antes visto.
Lectura de góndolas con IA
Hoy en día, gracias a la inteligencia artificial, podemos analizar miles de imágenes de góndolas para:
- Saber qué productos están presentes.
- Conocer su posición exacta.
- Detectar quiebres de stock.
- Verificar flejes (separadores de categorías).
- Leer precios en etiquetas.
- Auditar la implementación de promociones.
…Todo con un nivel de detalle nunca antes visto en la industria.
En este artículo queremos comparar dos tipos de enfoques que ayudan a lograrlo:
1. Los modelos de detección de objetos en tiempo real.
2. Los modelos de clasificación por similitud.

1. Modelos de detección en tiempo real
Estos modelos analizan la imagen completa y localizan productos, flejes, precios y otros elementos clave de la góndola con recuadros, al mismo tiempo que identifican su categoría.
Es decir, te dicen qué aparece y dónde está en la foto.
Ejemplos de esta familia de modelos:
- YOLO
- RT-R (Real Time Recognition)
- Faster R-CNN (aunque menos rápido)
Este tipo de modelos requiere entrenamiento supervisado, lo que significa etiquetar imágenes con precisión. Por ejemplo, marcar la posición de cada producto en la góndola con un recuadro y decir qué producto es. Te mostramos un ejemplo:
2. Modelos de clasificación por similitud
Estos modelos funcionan de forma distinta: no dibujan recuadros, sino que aprenden “prototipos” de cada producto con pocas fotos de referencia. Luego comparan los productos detectados con esos prototipos para clasificarlos.
Esto permite añadir productos nuevos rápidamente sin recopilar miles de imágenes.
Ejemplos de esta familia de modelos:
- Redes prototípicas tradicionales.
- DINO (basado en visión auto-supervisada).
- SAM (Segment Anything Model, más reciente para segmentación rápida).
¿Qué conviene para tu negocio?
Si tu prioridad es monitorear el stock y la correcta exhibición en tiempo real, los modelos de detección de objetos en tiempo real son clave.
Si tu desafío son surtidos que cambian con mucha frecuencia, como promociones, lanzamientos o ediciones limitadas, los modelos de clasificación por similitud pueden ayudarte a reaccionar rápido y con menos datos.
| Modelo | Ventajas | Desventajas |
| Detección en tiempo real | ✔ Permite monitorear en tiempo real. ✔ Localiza precios, flejes, promociones y productos. ✔ Ayuda a auditar planogramas y quiebres de stock. |
⚠️ Requiere muchísimas imágenes de cada producto para aprender. ⚠️ Si el surtido cambia seguido, hay que volver a recopilar y etiquetar imágenes. ⚠️ El entrenamiento puede ser costoso y largo |
| Clasificación por similitud | ✔ Muy flexibles ante cambios de surtido o lanzamientos. ✔ Requieren pocas imágenes para nuevos productos. ✔ Bajan los costos de actualización. |
⚠️ No dibujan recuadros ni localizan productos por sí solos. ⚠️ Se necesitan combinar con otro modelo de detección para saber la posición. ⚠️ Si hay productos muy parecidos entre sí, pueden confundirse si no se ajustan bien. |
¿Lo mejor? Combinar ambos:
- Primero un modelo de detección que ubique los productos y elementos de la góndola.
- Luego un modelo de clasificación por similitud que identifique con precisión productos nuevos o de baja rotación.
Así logras:
✔ Velocidad
✔ Precisión
✔ Flexibilidad
Impacto en tu operación
- Velocidad de monitoreo: La detección en tiempo real permite actuar casi al instante.
- Flexibilidad: La clasificación por similitud hace fácil incorporar cambios.
- Control del gasto: La combinación permite equilibrar precisión y costos de entrenamiento.
- Implementación de promociones y precios: Puedes auditar flejes, etiquetas y ofertas con visión artificial.
