Lorsque l’on a beaucoup de clients à desservir, il est rare de le faire depuis un seul centre de distribution. Généralement, on définit des zones géographiques, auxquelles on affecte les clients les plus proches. La méthode du clustering permet de définir ces zones de manière optimale.
Pourquoi faire un clustering logistique ?
Lorsque l’on définit un schéma directeur logistique, l’objectif est généralement de minimiser le coût de transport annuel total. On cherche alors à réduire les distances entre l’entrepôt central et la localisation des clients ou fournisseurs. On place l’entrepôt au plus près de leur centre de gravité ; c’est le principe du barycentrage.
Cependant, il est encore plus efficace (du point de vue du coût de transport et du service client) de disposer de plusieurs centres de distribution régionaux. On est ainsi encore plus près du client final, et on peut l’atteindre plus rapidement. Cependant, trouver le nombre optimal d’entrepôts n’est pas une tâche facile : il dépend de nombreux facteurs, notamment de la capacité à massifier les flux et les stocks (et donc à bénéficier d’économies d’échelle).
Une fois le nombre d’entrepôts (ou “clusters”) défini, la méthode du clustering permet de déterminer la localisation de ces entrepôts ainsi que les zones géographiques desservies.
Le principe du clustering logistique
Le clustering logistique est un problème d’optimisation combinatoire qui consiste à définir des zones regroupant des points géographiquement proches. L’objectif du problème est la minimisation des distances entre les points du cluster (clients/fournisseurs) et le centre du cluster (entrepôt). Ceci présente un avantage évident en logistique puisque cette fonction est plus ou moins proportionnelle au coût de transport. Combiné à des calculs de barycentre, cette méthode permet donc de définir à la fois le lieu de l’entrepôt (au centre de gravité du cluster) et les points qu’il dessert : chaque client ou fournisseur est affecté à l’entrepôt le plus proche.
Les data-scientists développent depuis longtemps des algorithmes d’apprentissage non supervisé capables de résoudre le problème du clustering. Il s’agit d’ailleurs d’un problème que l’on retrouve dans de nombreuses situations où l’objectif est de partitionner un ensemble de données en sous-groupes similaires, comme la classification automatique d’objets selon leur apparence. Une heuristique simple, appelée méthode des k-moyennes, a été utilisée en ce sens depuis la seconde moitié du XXe siècle.
Limites de la méthode du clustering logistique
On l’a vu, le calcul du clustering ne peut être fait qu’après avoir décidé du nombre de clusters souhaité. Une approche intéressante consiste à recommencer le calcul avec un nombre variable de clusters et à comparer les coûts totaux. Généralement, au-delà d’un certain nombre de clusters, le gain marginal en coût de transport et en délai de livraison ne compense plus les coûts fixes que représentent l’ouverture d’un nouveau centre de distribution. C’est la raison pour laquelle un clustering vient toujours en complément d’un schéma directeur logistique plus complet, qui inclut ces considérations.
Enfin, les méthodes heuristiques utilisées pour résoudre le problème débouchent généralement sur un optimum local et non global, ce qui signifie que l’organisation trouvée par l’algorithme n’est pas nécessairement la plus efficace possible. En pratique, le résultat est néanmoins toujours bien meilleur que toute organisation qui pourrait être trouvée “à la main”. Pour s’assurer d’une qualité encore supérieure, on peut relancer l’algorithme plusieurs fois avec des conditions initiales légèrement différentes. C’est ce que fait Barylog.