L’economia dei token e il vero prezzo dell’intelligenza artificiale di Andrea Daniele Signorelli
https://sinistrainrete.info/teoria/33228-andrea-daniele-signorelli-l-economia-dei-token-e-il-vero-prezzo-dell-intelligenza-artificiale.html
- Details
CLAUDE 24-6-26
Nessun problema! Procedo con il trattamento.
Scheda
- Autore: Andrea Daniele Signorelli
- Titolo: L'economia dei token e il vero prezzo dell'intelligenza artificiale
- Fonte: Sinistrainrete, sezione "Teoria" — Pubblicato: 24 giugno 2026; ripreso da Guerre di rete, creato il 24 giugno 2026
- URL: https://sinistrainrete.info/teoria/33228-andrea-daniele-signorelli-l-economia-dei-token-e-il-vero-prezzo-dell-intelligenza-artificiale.html
1. Occhiello/KW
Economia dei token, tariffazione a consumo, bolla dell'IA, modelli cinesi (DeepSeek, MiniMax), OpenAI/Anthropic in perdita, infrastrutture data center, costo reale vs prezzo sussidiato dell'IA
2. Abstract
Signorelli ricostruisce, con taglio giornalistico-economico, il passaggio nel 2026 da tariffe fisse a tariffazione a consumo (basata sui "token") nei contratti aziendali di OpenAI e Anthropic, che ha fatto esplodere i costi per molte imprese (Uber, Walmart, Meta, Amazon e altre), rivelando quanto fosse stato finora artificialmente compresso il prezzo reale dell'IA generativa. Dopo una spiegazione tecnica di cosa siano i token (unità minime di elaborazione testuale/visiva/audio dei modelli linguistici), l'articolo mostra il paradosso per cui, nonostante il crollo del costo unitario per token (fino a 600 volte dal 2020 al 2026), la spesa aggregata delle aziende è esplosa per l'aumento combinato di modelli "ragionanti" (che consumano più token) e di un utilizzo intensivo e non mirato. Questo mette OpenAI e Anthropic in un vicolo cieco: tagliare i prezzi per non perdere clienti aggrava le perdite già enormi; non tagliarli riduce l'uso e quindi la domanda di potenza computazionale già pianificata (190 GW di data center, investimenti McKinsey stimati fino a 7mila miliardi di dollari entro il 2030). L'articolo si chiude segnalando il vantaggio competitivo cinese: i modelli più usati a livello globale per volume di token sono oggi cinesi (DeepSeek, MiniMax, MiMo di Xiaomi), grazie a energia più economica, infrastrutture statali e architetture progettate per consumare meno — ma anche la Cina rischia una guerra dei prezzi che comprime i margini. La conclusione aperta è che l'attuale corsa alle infrastrutture IA potrebbe risultare un azzardo finanziario, con rischio di scoppio della "bolla dell'intelligenza artificiale".
3. Analisi sintetica per punti
-
Il caso scatenante: aziende (Uber, Walmart, un'azienda anonima con 500 milioni di dollari spesi in un mese su Claude, Meta, Amazon, AT&T, Brex) che bruciano i budget IA dopo il passaggio da tariffa fissa a tariffa a consumo da parte di OpenAI e Anthropic nella prima metà del 2026.
-
Spiegazione tecnica dei token: unità minime di elaborazione (circa 4 caratteri in media in inglese), meccanismo di "next token prediction"; il consumo dipende non solo dalla lunghezza della richiesta ma dal contesto complessivo da elaborare; vale anche per immagini, audio, video.
-
Il paradosso centrale: il prezzo unitario dei token è crollato (esempio GPT-4 2023: 30$/60$ per milione di token input/output → GPT-5.5: 5$/30$; calo di 600 volte 2020-2026) ma la spesa aggregata esplode per due fattori concorrenti — modelli "ragionanti" che consumano molti più token, e diffusione/intensità d'uso (Google: da 10 a 16 miliardi di token/minuto in un trimestre; OpenAI API: da 6 a 15+ miliardi di token/minuto).
-
Effetto mascherato dalle tariffe fisse: il vero consumo era invisibile prima del passaggio a fatturazione a consumo; report Deloitte: l'IA è la voce di spesa aziendale in crescita più rapida, fino a metà della spesa IT in alcune aziende.
-
Impatto sui ricavi di Anthropic: salto da 4,8 miliardi di dollari (Q1 2026) a 10,9 miliardi attesi (Q2 2026), attribuito proprio al passaggio a fatturazione a consumo — con incertezza su come reagiranno i clienti aziendali nei trimestri successivi.
-
Testimonianze aziendali: Workato (aumento di spesa di 7 volte), Cisco (Jeetu Patel: "il costo dei token è molto più elevato del valore effettivo generato su larga scala").
-
Il vicolo cieco di OpenAI/Anthropic: dilemma fra tagliare i prezzi (riducendo ricavi già in perdita per decine di miliardi annui) o non tagliarli (rischiando riduzione dell'uso aziendale) — citazione di Ed Zitron sul rischio di "fatturato in crollo mentre i costi aumentano".
-
Il secondo vicolo cieco — le infrastrutture: 190 GW di capacità data center già pianificati, investimenti McKinsey stimati fino a 7mila miliardi di dollari entro il 2030; contratti pluriennali con Microsoft, Amazon, Google, CoreWeave da centinaia di miliardi — tensione strutturale fra riduzione dell'uso e impegni infrastrutturali già presi.
-
Trasferimento del problema sugli utenti finali: caso GitHub Copilot (passaggio da abbonamento fisso a consumo, bollette fino a 750-3.000 dollari/mese), riferimento al "vibe-coding" come fattore di consumo aggravato; simulazione SemiAnalysis sul "vero prezzo": ChatGPT da 20$ potrebbe valere fino a 700$, il piano Pro da 200$ fino a 14.000$ se fatturato a consumo reale.
-
Il vantaggio competitivo cinese: secondo OpenRouter, i tre modelli più usati per volume di token a giugno 2026 sono tutti cinesi (MiMo Xiaomi, MiniMax, DeepSeek); fattori di vantaggio — energia più economica, data center meno costosi, sostegno statale, concorrenza interna aggressiva, architetture progettate per consumare meno (anche per le restrizioni sui chip avanzati).
-
Limite della metrica "costo per token": citazione del ricercatore Wong Qi Han — il risparmio iniziale può essere illusorio se il modello richiede più tentativi, ha più latenza, problemi di sicurezza/compliance; la metrica corretta sarebbe il costo per risultato soddisfacente o il ROI, entrambi difficili da misurare.
-
Scenario di chiusura: possibile segmentazione del mercato (modelli USA per compiti complessi, modelli cinesi per uso quotidiano di massa); rischio doppio — per la Cina, compressione dei margini da guerra dei prezzi; per gli USA, esclusione dai casi d'uso di massa con conseguente sovracapacità infrastrutturale e rischio di scoppio della bolla IA.
4. Elenco concetti-soggetti chiave
- Token e "next token prediction" (meccanismo tecnico di base)
- Tariffazione a consumo vs tariffa fissa
- Paradosso costo unitario in calo / spesa aggregata in crescita (analogo strutturale al paradosso di Jevons, già trattato nel testo di Munzi)
- Modelli "ragionanti" e consumo di token
- Vicolo cieco finanziario di OpenAI/Anthropic (perdite, contratti infrastrutturali, IPO incombenti)
- Bolla dell'intelligenza artificiale e sovracapacità dei data center
- Vantaggio competitivo cinese (DeepSeek, MiniMax, MiMo)
- "Vero prezzo" dell'IA (simulazione SemiAnalysis)
- Metrica costo-per-token vs costo-per-risultato/ROI
5. Conclusione critica
Il testo di Signorelli si distingue nettamente dagli altri analizzati nella Sua rassegna per genere e metodo: non è un saggio di teoria critica né un intervento militante, ma un pezzo di giornalismo economico-tecnologico di taglio analitico, sostanzialmente neutro sul piano ideologico e fondato su dati di mercato verificabili (report Deloitte, dichiarazioni aziendali, stime SemiAnalysis, dati OpenRouter). È utile però per la Sua mappatura proprio per il suo valore documentario: offre la base empirica concreta che la critica più teorica — penso al testo di Munzi sul paradosso di Jevons applicato ai dati — può utilizzare come riscontro fattuale.
Il punto di maggiore interesse, in questa prospettiva comparata, è che l'articolo di Signorelli descrive empiricamente esattamente la dinamica che Munzi teorizza in chiave marxista-ecologica: l'efficienza crescente (crollo del costo unitario per token, fino a 600 volte) non riduce ma espande il consumo aggregato (token elaborati al minuto moltiplicati per 20-30 volte in pochi mesi) — è il paradosso di Jevons applicato non più al dato di addestramento ma al consumo computazionale in fase di inferenza. I due testi, letti insieme, offrono quindi due piani complementari della stessa "autofagia": Munzi sul versante dell'esaurimento del dato umano come materia prima; Signorelli sul versante del costo economico e infrastrutturale insostenibile generato dalla stessa logica di accumulazione (capacità computazionale, GPU, data center).
Alcuni nodi da segnalare per un eventuale uso critico del testo:
-
L'assenza di una lettura di classe o di rapporti di potere: a differenza dei testi di teoria critica da Lei trattati, qui il conflitto descritto è interamente intra-capitalistico (Stati Uniti vs Cina, fornitori vs clienti aziendali, margini vs ricavi) — non emerge alcuna analisi del lavoro, della precarizzazione, o degli effetti sociali dell'automazione legata all'IA. È un testo che descrive bene la crisi di redditività del settore ma resta entro l'orizzonte di un'analisi di mercato, senza il salto verso una critica strutturale dei rapporti di produzione (il salto che invece compiono sia Munzi sia Demichelis, pur da prospettive opposte sul ruolo del general intellect).
-
Il "vantaggio cinese" è presentato in modo descrittivo, non geopolitico: a differenza del testo di Visalli/Formenti su Tianxia e cosmotecnica, qui il successo dei modelli cinesi (DeepSeek, MiniMax) viene spiegato con fattori puramente economico-industriali (energia, sussidi statali, architetture efficienti) senza alcun aggancio alla cornice geopolitica più ampia di "multipolarità" o "sovranità tecnologica" che innerva gli altri testi della Sua rassegna — un'integrazione che potrebbe essere fatta in un eventuale commento di raccordo, leggendo questo articolo come riscontro empirico-fattuale della tesi di Visalli sulla "piattaforma geo-tecnologica" alternativa cinese.
-
La domanda implicita ma non esplicitata sulla sostenibilità del modello di business IA: l'articolo lascia in sospeso, correttamente, se l'attuale corsa agli investimenti infrastrutturali (7mila miliardi di dollari stimati da McKinsey entro il 2030) rappresenti una bolla speculativa classica o un investimento strutturale necessario — una domanda che si presterebbe bene a una lettura ulteriore in chiave di critica della finanziarizzazione (Brancaccio, Fazi) se Lei volesse costruire un commento che colleghi questo pezzo tecnico-giornalistico alla cornice teorica più ampia della Sua rassegna su financialization e crisi del capitalismo contemporaneo.
In sintesi: un testo di alta qualità informativa, utile come base fattuale da incrociare con l'apparato teorico-critico già raccolto (specialmente con Munzi), ma che di per sé non compie — né si propone di compiere — il salto verso l'analisi di classe o di potere che caratterizza il resto del Suo corpus.

Negli ultimi mesi, molte delle aziende che avevano sottoscritto contratti con OpenAI o Anthropic hanno avuto una brutta sorpresa. Lo scorso aprile, la società di noleggio auto con conducente Uber ha per esempio scoperto di aver già
Commenti
Posta un commento