Una sola famiglia di GPU IA richiederà tante memorie quanto il 10% del mercato smartphone globale

NVIDIA
Crediti: TheStreet

L’ascesa inarrestabile dell’intelligenza artificiale sta iniziando a presentare il conto, e non si tratta solo di consumo energetico, ma di una vera e propria crisi di risorse hardware che rischia di ridisegnare l’economia dell’elettronica di consumo.

Secondo una recente nota degli analisti di KeyBanc, le modifiche architettoniche implementate da NVIDIA nelle sue nuove GPU della serie Vera Rubin sono destinate a consumare una porzione significativa delle risorse di memoria globali quest’anno.

In un mercato già caratterizzato da un’offerta limitata, questa “fame” di memoria da parte del gigante dei chip AI sta creando un effetto a catena che colpirà duramente i produttori di smartphone, inclusi colossi come Apple e Samsung, costringendo il mercato verso inevitabili rincari.

Le GPU AI NVIDIA Vera Rubin non si accontenteranno della memoria che “avanza”

NVIDIA
Crediti: NVIDIA

Al centro di questa turbolenza di mercato vi è una specifica scelta tecnica adottata da NVIDIA. L’elaborazione delle query di intelligenza artificiale richiede la creazione di un enorme registro temporaneo di memoria per la costruzione del contesto, noto tecnicamente come “KV Cache“.

Fino ad oggi, nei sistemi NVIDIA, questo registro veniva archiviato all’interno dei moduli di memoria HBM. Tuttavia, con l’architettura Vera Rubin, l’azienda ha introdotto una nuova soluzione denominata Inference Memory Context Storage (ICMS), che funge da risorsa di memoria dedicata esclusivamente a tale scopo.

Questa novità, seppur tecnicamente brillante, ha conseguenze massicce sulla catena di approvvigionamento. Le stime indicano che NVIDIA potrebbe integrare circa 16 TB di memoria NAND per ogni GPU in un rack, il che si traduce in un totale sbalorditivo di 1.152 TB in una singola configurazione NVL72.

KeyBanc ha fornito un contesto preoccupante a questi numeri: la nuova CPU Vera utilizza 1,5 TB di memoria, un salto notevole rispetto ai 512 GB della precedente architettura Grace. Ciò implica che NVIDIA richiederà circa 20 miliardi di Gb di memoria quest’anno. Per mettere questo dato in prospettiva, tale consumo equivale alla memoria necessaria per produrre tra i 100 e i 150 milioni di smartphone, ovvero poco meno del 10% dell’intero mercato globale della telefonia mobile.

Apple e Samsung nell’occhio del ciclone

Le ripercussioni di questa massiccia allocazione di risorse verso l’IA stanno mettendo sotto pressione anche i giganti della tecnologia che tradizionalmente dominano le catene di fornitura.

Apple, ad esempio, si trova a fronteggiare una situazione complessa. Secondo le valutazioni di Morgan Stanley, sebbene l’azienda di Cupertino si sia assicurata l’accesso a risorse NAND sufficienti fino al primo trimestre del 2026, si prevede che il fornitore KIOXIA aumenterà i prezzi una volta firmato il nuovo accordo di fornitura a lungo termine.

Ancora più critica è la situazione relativa alla memoria DRAM, che costituisce un collo di bottiglia significativo. Nonostante Apple avesse precedentemente stipulato contratti a lungo termine molto vantaggiosi, le attuali condizioni di mercato suggeriscono che l’azienda riuscirà a garantire l’accesso alle risorse DRAM fino all’inizio del 2026 solo accettando un rincaro sequenziale superiore al 50%.

Paradossalmente, nemmeno Samsung, che è uno dei principali produttori mondiali di memorie, è immune a questa dinamica di “distruzione della domanda” guidata dai prezzi.

Rapporti interni suggeriscono tensioni tra le divisioni del conglomerato coreano: la divisione DS, che produce i chip di memoria, ha accettato di fornire componenti alla divisione mobile MX solo a fronte di aumenti di prezzo compresi tra il 60% e il 70%.

Questa inflazione interna ha spinto Samsung a pianificare un aumento del prezzo della prossima serie Galaxy S26, stimato tra i 30 e i 60 dollari in regioni selezionate, inclusa la Corea del Sud.