Catalogazione e naming prodotti con AI

Come usare l'AI per strutturare un catalogo con migliaia di SKU

Guida pratica all'uso dell'intelligenza artificiale per riclassificare, normalizzare e strutturare cataloghi prodotto con molti SKU. Workflow, strumenti e limiti reali per PMI manifatturiere e distributori.

Risposta diretta

L'AI può riclassificare automaticamente il 70–85% degli articoli di un catalogo disorganizzato in modo affidabile. Il restante 15–30% richiede revisione umana. La pipeline corretta è: embedding per clustering, LLM per naming, human review per i casi ambigui.

Un catalogo da 2.000 SKU con dati inconsistenti era, fino a qualche anno fa, un progetto da 4–6 mesi a pieno regime. Oggi, con AI applicata correttamente, lo stesso lavoro si completa in 3–6 settimane. Non perché l'AI faccia tutto da sola — non lo fa — ma perché automatizza le fasi più ripetitive e permette agli umani di concentrarsi sulle decisioni che richiedono giudizio.

Step 1: clustering per identificare famiglie e duplicati

Il primo passaggio è capire cosa c'è nel catalogo. Un modello di embedding (come text-embedding-3 di OpenAI o sentence-transformers open source) converte ogni descrizione articolo in un vettore numerico. Gli articoli simili hanno vettori vicini nello spazio vettoriale: questo permette di identificare automaticamente cluster di prodotti simili e, all'interno di ogni cluster, potenziali duplicati.

Questo step è puramente esplorativo: il risultato è una mappa del catalogo che mostra la struttura reale dei dati, indipendentemente da come sono stati categorizzati storicamente. Spesso rivela sorprese: famiglie di prodotti che nessuno aveva mai pensato di accorpare, duplicati inseriti mesi o anni prima, varianti mal classificate.

Step 2: normalizzazione degli attributi

Gli attributi tecnici nei cataloghi disorganizzati sono tipicamente un mix di sinonimi, abbreviazioni non standardizzate e valori in unità diverse. Un LLM (Language Model) con un prompt ben costruito può normalizzare questi valori a scala: prende ogni valore non standard e lo mappa al valore canonico del glossario aziendale.

Questo step ha un'accuratezza tipica del 90–95% su cataloghi industriali. Il 5–10% di errori si concentra sui casi ambigui — valori che dipendono da contesto aziendale specifico che il modello non conosce — e richiede revisione umana.

Step 3: generazione dei nomi sistematici

Una volta che gli attributi sono normalizzati, il nome sistematico può essere generato automaticamente applicando le regole del sistema di naming. Questa è la fase più veloce: con un template e un LLM, si generano migliaia di nomi in minuti. La qualità dipende interamente dalla qualità del template e degli attributi di input.

Step 4: human review dei casi ambigui

Il workflow AI non funziona senza una fase di revisione umana strutturata. I casi ambigui — quelli che il modello ha marcato come incerti — vanno revisionati da qualcuno con competenza tecnica del prodotto. Non da un data entry operator: da un tecnico che conosce il prodotto e può disambiguare i casi che richiedono giudizio di dominio. Questa fase è il bottleneck reale del progetto: la velocità dell'intero processo è limitata dalla disponibilità di questo revisore.

Domande frequenti

Quali compiti specifici l'AI svolge bene nella catalogazione di prodotti?

L'AI è particolarmente efficace per: (1) clustering automatico di articoli simili basato su descrizioni testuali, per identificare duplicati e famiglie; (2) normalizzazione dei valori degli attributi (riconoscere che 'acciaio inox', 'SS', 'AISI 316' sono lo stesso materiale); (3) generazione di nomi sistematici a partire da attributi strutturati; (4) estrazione di attributi tecnici da descrizioni non strutturate. Non è efficace per definire la tassonomia: quella richiede decisione umana.

Quanti dati servono per addestrare un modello di classificazione per un catalogo?

Per un modello di classificazione custom, servono almeno 50–100 esempi per categoria per ottenere buone prestazioni. Ma per la maggior parte delle attività di catalogazione, non serve addestrare un modello: i modelli fondazionali (GPT-4, Claude, Gemini) con prompt engineering ben costruito raggiungono prestazioni eccellenti su cataloghi industriali senza training aggiuntivo.

Quanto tempo ci vuole per strutturare un catalogo da 2.000 SKU con AI?

Con un workflow AI assistito ben costruito: 3–6 settimane per un catalogo da 2.000 SKU, rispetto a 4–6 mesi con approccio manuale. La maggior parte del tempo non è nel processing AI — che si completa in ore — ma nella fase di validazione umana dei risultati e nella definizione della tassonomia di partenza.

Vuoi capire se ha senso per la tua azienda?

Parliamo di contesto, non di soluzioni preconfezionate.

Contattaci →