Google ha presentato un chip di nome Trillium, che nella famiglia dei chip per data center di intelligenza artificiale che si dice sia quasi cinque volte più veloce della versione precedente.
«La domanda dell’industria per computer per l’apprendimento automatico è cresciuta di un milione di volte negli ultimi sei anni, aumentando all’incirca di 10 volte ogni anno – ha affermato il Ceo di Alphabet Sundar Pichai – Penso che Google sia stato creato per questo momento, siamo pionieri dei chip AI da più di un decennio».
L’impegno di Alphabet nel costruire chip personalizzati per data center AI rappresenta una delle poche alternative praticabili a quelle di Nvidia processori top di gamma che dominano il mercato. Insieme al software strettamente legato alle unità di elaborazione tensore (TPU) di Google, i chip hanno consentito all’azienda di conquistare una quota significativa del mercato. Nvidia controlla circa l’80% del mercato dei chip per data center AI e la stragrande maggioranza del restante 20% è costituita da varie versioni dei TPU di Google. L’azienda non vende direttamente il chip, ma affitta l’accesso tramite la sua piattaforma di cloud computing.
Secondo Google, il chip Trillium di sesta generazione raggiungerà prestazioni di calcolo 4,7 volte migliori rispetto al TPU v5e, un chip progettato per alimentare la tecnologia che genera testo e altri media da modelli di grandi dimensioni. Il processore Trillium è il 67% più efficiente dal punto di vista energetico rispetto al v5e. Il nuovo chip sarà disponibile per i clienti cloud alla fine del 2024, ha affermato la società.
Gli ingegneri di Google hanno ottenuto ulteriori miglioramenti delle prestazioni aumentando la quantità di capacità di memoria a larghezza di banda elevata e la larghezza di banda complessiva. I modelli di intelligenza artificiale richiedono enormi quantità di memoria avanzata, che ha rappresentato un collo di bottiglia per aumentare ulteriormente le prestazioni.
L’azienda ha progettato i chip per essere distribuiti in pod da 256 chip che possono essere scalati fino a centinaia di pod.