Capire la quantità giusta di imballaggio per spedire un articolo può essere impegnativo – e per Amazon, che ha un catalogo dinamico con centinaia di milioni di prodotti, costituisce una sfida continua. Inoltre, considerati i volumi, sarebbe impossibile per Amazon scegliere l’imballaggio opportuno per ogni singolo articolo avvalendosi delle ispezioni manuali. Ciò che serve è un meccanismo smart automatizzato e all’avanguardia, che sia in grado di adattarsi in tempo reale alle mutevoli circostanze.
Fortunatamente gli approcci basati sul machine learning (ML) – in particolare il deep learning – producono ottimi risultati in presenza dei big data e di realtà di grandi dimensioni, e un mix pionieristico di elaborazione del linguaggio naturale e computer vision sta mettendo Amazon nella condizione di determinare in modo sempre più puntuale la quantità giusta di imballaggi da usare. Negli ultimi sei anni questi strumenti hanno aiutato Amazon a farsi promotrice del cambiamento, riducendo del 36% il peso degli imballaggi per singola spedizione ed eliminando oltre 1 milione di tonnellate di materiali da imballaggio, pari a oltre 2 miliardi di contenitori per le spedizioni.
“Quando ho iniziato a lavorare in Amazon, nel 2017, svolgevamo molte attività di collaudo fisico di prodotti, ma non avevamo un meccanismo scalabile in grado di valutare centinaia di milioni di prodotti per determinare il tipo di packaging ottimale per ciascuno” dice il direttore della ricerca scientifica Matthew Bales. Bales, che è anche fisico, è responsabile del machine learning nell’ambito del team di Amazon che si occupa dell’Esperienza del Cliente in relazione agli Imballaggi.
“I test statistici sono stati la prima tessera del puzzle, ma sostanzialmente sono utili solo quando i prodotti sono già stati spediti in più di un tipo di imballaggio. Noi volevamo essere in grado di prevedere la performance di un prodotto in un tipo di packaging meno protettivo, più leggero e sostenibile. E quando entri in quella sfera predittiva hai bisogno del machine learning” spiega Bales.
La potenza del feedback dei clienti
Per prevedere se un determinato prodotto avrebbe potuto essere spedito senza problemi in un determinato tipo di imballaggio, Bales e colleghi hanno sviluppato un modello di machine learning basato principalmente sugli stessi dati testuali che i clienti vedono sul negozio di Amazon, cioè il nome dell’articolo, la descrizione, il prezzo, le dimensioni dell’imballaggio e così via.
Il modello è stato addestrato sulla base di milioni di esempi di prodotti consegnati con successo nei diversi tipi di imballaggio, nonché di prodotti che sono arrivati danneggiati in determinati tipi di imballaggio. Quando un prodotto non è protetto a sufficienza da suo imballaggio Amazon ha accesso al feedback relativo in tempo quasi reale, perché il cliente lo segnala attraverso il Centro Resi Online e altre forme di feedback, comprese le recensioni dei prodotti.
“Il feedback dei clienti è fondamentale”, spiega Bales. “Alimenta tutte le nostre attività di testing basate sui dati statistici.”
Il modello ha appreso che certe parole chiave erano particolarmente importanti per prendere le decisioni sugli imballaggi. Per esempio, le parole chiave che indicano che una busta imbottita non sarebbe stata l’imballaggio giusto comprendevano “ceramica”, “alimento”, “tazza” e “vetro”. È meglio spedire quei prodotti in una scatola. Le parole chiave in base alle quali le buste imbottite rappresentano la scelta giusta comprendono “confezione multipla” e “sacchetto”. Questi termini indicano la possibilità che il prodotto abbia già un qualche tipo di imballaggio protettivo.
“La parte del modello che sta apprendendo dal negozio Amazon ha imparato a capire benissimo di che prodotto si tratta e quali sono le sue dimensioni”, dice Bales.
Capire automaticamente di che prodotto si tratta costituisce uno step importante in questo percorso ma rappresenta solo metà dell’opera. È altrettanto importante il modo in cui il fornitore ha imballato il prodotto prima di spedirlo a un centro di distribuzione. Una tazza di ceramica, per esempio, può essere imballata in un sacchetto di plastica trasparente o in una confezione rigida.
Per identificare gli imballaggi dei prodotti su larga scala è stato necessario ricorrere alla computer vision, l’elaborazione informatica delle informazioni visuali. Il team di ML sapeva già che le immagini dei prodotti nel negozio Amazon non erano utili ai fini della selezione del packaging. Per esempio, una confezione con più lampadine LED può essere illustrata mediante l’immagine di un’unica lampadina non confezionata, che comunica fragilità, malgrado il multipack in realtà sia confezionato in modo sicuro dal fornitore e non richieda ulteriori imballaggi. Nel tal caso sarebbe preferibile spedire direttamente i prodotti nella loro confezione.
Il team di Bales ha affrontato questa sfida avvalendosi delle immagini in possesso di Amazon. Quando i prodotti vengono consegnati ai centri di distribuzione molti vengono fatti passare su un nastro trasportatore attraverso appositi tunnel dotati di computer vision, con telecamere che acquisiscono immagini dei prodotti da diverse angolature. Questi tunnel vengono impiegati per molti scopi, tra cui l’identificazione delle dimensioni dei prodotti e di eventuali difetti.
Prasanth Meiyappan, esperto di scienza applicata che lavora per Amazon, ha ampliato le capacità di apprendimento del modello di machine learning realizzato dal team in modo da inserire tali immagini standardizzate dei prodotti in aggiunta alla classificazione testuale basata sul catalogo, seguendo un approccio multimodale.
“Il nostro modello rileva i bordi degli imballaggi per determinarne la forma, identifica eventuali perforazioni, i sacchetti che contengono i prodotti o la luce che passa attraverso una bottiglia di vetro”, spiega Meiyappan. Ma in una certa misura, il modo in cui il modello formula il suo giudizio su ciò che rileva dalle immagini è difficile da capire per un essere umano, perché le caratteristiche identificate nei prodotti e valutate dal modello tendono ad avere un altissimo livello di complessità.
“Quello che conta - sottolinea Bales - è che le decisioni sul packaging prese dal modello siano empiricamente corrette”.
L’incorporazione di dati sia testuali sia visuali ha migliorato le prestazioni del modello del 30% in confronto al solo impiego di dati testuali.
“Quando il modello è sicuro di aver identificato il tipo di imballaggio migliore per un determinato prodotto gli consentiamo di procedere all’autocertificazione per quel tipo di imballaggio”, spiega Bales. “Quando il modello è meno sicuro, contrassegna il prodotto e il relativo imballaggio affinché siano controllati da un essere umano”. Questa tecnologia è attualmente in via di applicazione per varie linee di prodotti nel Nord America e in Europa, e sta contribuendo alla riduzione di una quantità crescente di rifiuti.
“È una tripla vittoria”, osserva Bales. “Riduzione dei rifiuti, incremento della customer satisfaction e riduzione dei costi.”
Il giusto equilibrio
Per arrivare a questa tripla vittoria, il team ha però dovuto superare uno scoglio che si presenta di frequente nell’ambito del machine learning: lo squilibrio di classe. In sintesi, il problema è questo: se si vuole che un modello di machine learning apprenda in modo efficace, idealmente bisogna fornirgli tanti esempi di fallimento quanti sono quelli di successo, in modo che possa imparare a differenziare efficacemente tra le due cose.
I dati che venivano impiegati per addestrare il modello offrivano molti milioni di esempi di abbinamento fra prodotto e imballaggio ma, a seconda del tipo di imballaggio, solo l’1% di tali esempi rappresentava imballaggi che per un motivo o per l’altro si erano dimostrati inadatti al prodotto in essi contenuto.
“Prima di introdurre il machine learning avevamo spedito alcuni prodotti in buste normali e imbottite per un certo periodo di tempo”, spiega Bales. “Così avevamo moltissimi esempi di cose che potevano essere spedite in buste imbottite, ma non ne avevamo molti di cose che non erano adatte a quel tipo di imballaggio. I modelli di machine learning hanno dei problemi con questo genere di squilibri molto significativi”.
“La letteratura sul machine learning riferita al packaging è piuttosto scarsa”, dice Meiyappan. “Non molte persone hanno a che fare con il tipo di set di dati con cui abbiamo a che fare noi nell’area degli imballaggi. L’efficacia di una tecnica nel far fronte allo squilibrio tra i dati dipende sia dall’ambito, sia dal set di dati.”
Pertanto, l’approccio del team nei confronti del problema dello squilibrio di classe è stato perlopiù sperimentale. E sui sei approcci seguiti – quattro basati sui dati e due sugli algoritmi – quello che si è dimostrato inequivocabilmente il migliore ha migliorato nettamente l’accuratezza del modello. Si tratta di un approccio basato sui dati, chiamato “apprendimento a due fasi con sotto-campionamento randomizzato”, che incentra il modello sulla classe minoritaria nella prima fase dell’addestramento e poi su tutti i dati nella seconda. “Abbiamo realizzato uno studio per condividere queste informazioni con la comunità del machine learning”, spiega Bales, “in modo che chiunque si trovi ad avere un problema simile possa scegliere di sperimentare questo approccio in prima persona, per verificare se funziona anche per il suo tipo di problema”.
Piani per il futuro
Il team si è detto ansioso di ampliare l’uso di questo strumento, addestrando il modello a capire tutte le lingue usate dai clienti di Amazon e incorporando al tempo stesso gli aspetti specifici della distribuzione in ogni Paese.
Mentre i ricercatori di Amazon continuano a sperimentare altri utilizzi del machine learning per eliminare gli sprechi, l’azienda si impegna a ridurre i rifiuti legati agli imballaggi anche nella sua filiera. Ad esempio, sta incentivando sempre più i suoi partner a creare imballaggi ottimizzati da usare per l’e-commerce, in modo da risparmiare spazio e materiali senza compromettere la protezione dei prodotti.
Amazon si è data un obiettivo col programma Shipment Zero: consegnare entro il 2030 il 50% delle spedizioni con zero emissioni nette di CO2 – il che, dal punto di vista del packaging, significa spedire i prodotti senza l’aggiunta di ulteriori imballaggi da parte di Amazon oppure in imballaggi carbon-neutral. Questo obiettivo rientra nel Climate Pledge, l’impegno di Amazon a raggiungere zero emissioni nette di CO2 entro il 2040, dieci anni prima di quanto previsto dall’accordo di Parigi sulle emissioni.