Attraverso un investimento di 110 milioni di euro nel programma Build on Trainium, scienziati e studenti di UC Berkeley, MIT e Carnegie Mellon creano software open source capaci di sbloccare il massimo potenziale dell'hardware dedicato.
Scrivere codice che riesca a sfruttare appieno l'architettura computazionale dei chip dedicati all'intelligenza artificiale rappresenta una delle sfide ingegneristiche più complesse e persistenti dell'intera infrastruttura tecnologica moderna. Fino ad oggi, la stragrande maggioranza degli sviluppatori ha maturato esperienza quasi esclusivamente sulle tradizionali GPU, un limite strutturale che rallenta la capacità di adattare i software ai microprocessori nati specificamente per gestire i carichi di lavoro legati ai modelli linguistici e predittivi. Per scardinare questo monopolio e plasmare il futuro del settore, Amazon ha stanziato un fondo da 110 milioni di dollari destinato al programma Build on Trainium, offrendo a docenti e studenti l'accesso diretto a Trainium, il chip proprietario ad alte prestazioni progettato da AWS per l'addestramento e il deployment dei modelli di frontiera. L'iniziativa non si limita a fornire potenza di calcolo tramite cluster dedicati, ma mette a disposizione della comunità accademica gli scienziati dei dati e gli esperti di Neuron dell'azienda, raccogliendo già oltre diecimila studenti attorno a proposte di ricerca che spaziano dalle scienze computazionali alla medicina e al calcolo quantistico.
Tra le istituzioni in prima linea in questa transizione spicca la UC Berkeley, i cui team di ricerca stanno sviluppando kernel ottimizzati, ovvero le routine di calcolo fondamentali a basso livello che determinano l'efficienza con cui un chip esegue le operazioni logiche. Il gruppo guidato dal professor Christopher Fletcher ha sviluppato TeAAL, un framework di programmazione innovativo che permette agli sviluppatori di descrivere semplicemente l'obiettivo del calcolo, lasciando al software il compito di tradurlo e generare in automatico il codice ottimizzato per la macchina. Durante le fasi di test, questo approccio ha dimostrato un'accelerazione tangibile, muovendosi da 1,4 a 1,6 volte più velocemente rispetto ai metodi standard quando applicato a LoRA, una delle tecniche di ottimizzazione fine più diffuse al mondo per i grandi modelli IA.
Un approccio complementare ma opposto è quello intrapreso dai professori Sophia Shao e Alvin Cheung con il loro sistema automatizzato denominato Autocomp. Questo progetto utilizza gli stessi modelli linguistici avanzati per generare e ottimizzare autonomamente il codice a basso livello destinato a Trainium, sfruttando l'intelligenza artificiale stessa per mappare e correggere i colli di bottiglia dell'hardware sulla base dei feedback prestazionali in tempo reale, eliminando la necessità di qualsiasi intervento manuale. La prossima fase dello sviluppo estenderà l'automazione di Autocomp dalle singole operazioni fino all'intera pipeline di esecuzione per modelli complessi come Llama e Qwen. L'aspetto più rivoluzionario dell'intero programma risiede nella sua filosofia di condivisione: tutta la ricerca scientifica prodotta è rilasciata in modalità open source, garantendo che ogni singolo miglioramento del codice o dell'efficienza dei chip ritorni immediatamente a disposizione dell'intera comunità globale degli sviluppatori.
Esplora altri articoli su questi argomenti
Se questo articolo ti è piaciuto e vuoi rimanere sempre informato
Presentati al Politecnico di Milano i primi dati della JRP Nucleare: il piano prevede fino a 16 GWe di potenza entro il 2040 per abbattere i costi del sistema elettrico e alimentare i Data Center e l'intelligenza artificiale.
18-05-2026
Attraverso un investimento di 110 milioni di euro nel programma Build on Trainium, scienziati e studenti di UC Berkeley, MIT e Carnegie Mellon creano software open source capaci di sbloccare il massimo potenziale dell'hardware dedicato.
18-05-2026
Il nuovo sistema di robot AI-powered sviluppato da GFT consente ai produttori automotive di rilevare i componenti difettosi e rimuoverli dalle linee di produzione.
18-05-2026
La divisione Smart Infrastructure fa il punto sull’evoluzione verso gli Autonomous Building. “Il 66% delle aziende in Italia aumenterà gli investimenti in efficienza energetica degli edifici”
15-05-2026
Per circa 2.000 ore, uno dei motori della nave da crociera MSC Opera è stato alimentato esclusivamente dal biocarburante HVO, di origine biogenica al 100%, dimostrando che la decarbonizzazione delle grandi navi da crociera è una realtà immediatamente applicabile senza necessità di interventi strutturali o aggiornamenti tecnologici ai propulsori esistenti.
Uno studio IWG delinea i prossimi 25 anni: addio ai pendolari e alla giornata 9-18 in favore di ambienti intelligenti e connessioni cerebrali.
Cleveland Clinic, RIKEN e IBM aprono una nuova era per la farmacologia digitale grazie al "quantum-centric supercomputing".
Aptiv PLC (NYSE: APTV), un leader globale nella tecnologia industriale, oggi ha annunciato che Volvo Cars ha scelto la piattaforma Gen 8 di Aptiv per l'installazione di radar sulle automobili di pross...