← Report
LAVORO · ORGANIZZAZIONE19 maggio 2026

Quando l'AI diventa una metrica, non uno strumento

Pressione sull'adozione e lavoro inventato: come le organizzazioni stanno misurando la cosa sbagliata

Due segnali emersi questa settimana, apparentemente distanti, puntano allo stesso problema strutturale nel modo in cui le organizzazioni stanno gestendo l'integrazione dell'AI nel lavoro.

Il primo viene da Amazon. Secondo un'inchiesta di Fast Company, lavoratori dell'azienda sotto pressione per aumentare il proprio utilizzo dichiarato di AI starebbero inventando task - compiti artificiali, interazioni fittizie con i tool, uso performativo degli strumenti - pur di soddisfare metriche di adozione interne. Il comportamento non è irrazionale: è la risposta prevedibile a un sistema di valutazione che misura la frequenza d'uso piuttosto che il valore prodotto. Quando una metrica diventa un obiettivo, cessa di misurare ciò per cui era stata costruita. Goodhart's Law, applicata all'AI adoption.

Il secondo segnale viene dalla ricerca di Sinan Aral, professore all'MIT Sloan e tra i principali studiosi di collaborazione uomo-macchina. Aral usa la metafora del Liverpool F.C.: acquistare tutti i migliori giocatori disponibili e finire sesti in classifica. Il problema non è il talento individuale dei componenti, ma il modo in cui vengono integrati nel sistema. Le organizzazioni che deployano AI ad alto budget senza riprogettare i flussi di lavoro, i ruoli, le interfacce decisionali ottengono risultati sotto le aspettative - o peggio, ottengono risultati che sembrano soddisfacenti a breve termine ma erodono capacità organizzative nel medio periodo.

I due fenomeni sono facce della stessa dinamica. Da un lato, la pressione dall'alto a mostrare adozione genera comportamenti di compliance superficiale che non producono valore reale. Dall'altro, anche dove l'adozione è genuina, l'assenza di una riprogettazione del lavoro intorno agli strumenti produce sistemi mal calibrati: l'AI riempie spazi che non erano stati pensati per lei, sostituisce giudizio dove servirebbe amplificarlo, o viene usata per velocizzare processi che andrebbero invece ripensati.

Il contesto di sfondo aggiunge un terzo elemento. Stack di tool come quello documentato da Garry Tan - dove un singolo operatore orchestra agenti AI che ricoprono ruoli da CEO, designer, engineering manager, QA - mostrano una direzione di viaggio in cui la struttura organizzativa stessa viene compressa e ridefinita. Non si tratta di automazione di task singoli, ma di sostituzione funzionale di layer interi dell'organizzazione. La logica non è più "questo strumento mi aiuta in questo compito" ma "questo stack sostituisce questa funzione".

L'implicazione per le organizzazioni è scomoda: i framework attuali di governance dell'AI adoption - basati su metriche di utilizzo, ROI di breve periodo, adozione per ruolo - non sono attrezzati per distinguere tra integrazione reale e integrazione performativa. E non sono attrezzati per gestire la compressione funzionale che arriva con gli stack agentici.

Le domande che rimangono aperte sono precise. Come si misura l'integrazione effettiva dell'AI nel lavoro senza generare gli incentivi distorti che produce qualsiasi metrica di utilizzo? Come si ridisegna la struttura organizzativa quando alcuni layer funzionali vengono compressi dagli agenti, senza semplicemente tagliarli? E soprattutto: chi nelle organizzazioni ha oggi la capacità e il mandato di fare questa riprogettazione, piuttosto che limitarsi a misurare l'adozione?

EXXODUS