▾ G11 Media Network: | ChannelCity | ImpresaCity | SecurityOpenLab | Italian Channel Awards | Italian Project Awards | Italian Security Awards | ...
InnovationCity

: "I rischi del lock-in" La sovranità secondo Aruba.it

AI: perché le performance di una startup cinese riguardano tutti noi

I bassi costi di sviluppo e gestione di DeepSeek mettono in dubbio l’idea stessa di mercato AI che si è imposta finora: il dibattito è aperto

Intelligenza Artificiale

Dal 30 novembre 2022, data del lancio di ChatGPT, l’intelligenza artificiale generativa (GenAI) ha invaso le prime pagine dei siti di informazione praticamente tutti i giorni, con una escalation impressionante di numeri di utenti, risultati di performance, dimensioni del mercato, e soprattutto investimenti e round di finanziamenti. L’articolo del Wall Street Journal di sabato 25 gennaio su DeepSeek, una startup cinese con modelli AI con performance paragonabili ai più recenti modelli di OpenAI, poteva quindi sembrare l’ennesima “notizia di AI” di questi anni. Invece ha scatenato un terremoto, abbattendo le quotazioni di borsa di tutto il settore tech: l’indice Nasdaq lunedì ha perso il 3%, Nvidia addirittura il 17%, ovvero quasi 600 miliardi di dollari di capitalizzazione in un solo giorno. Anche Broadcom ha perso il 17%, Oracle il 14%, Alphabet il 4% e Microsoft il 2%. Perdite recuperate martedì, ma solo parzialmente: Nvidia ha riguadagnato il 9%, Oracle il 3,6%, solo Microsoft è tornata ai livelli precedenti. E intanto DeepSeek è salita al primo posto tra le app gratuite più scaricate sull’App Store di Apple in tutto il mondo.

Perché è successo tutto questo?

Diciamo per una serie di motivi, DeepSeek ha messo in dubbio il modello di sviluppo delle tecnologie AI che la narrativa, in grandissima parte statunitense, ha imposto in questi due anni. Che in estrema sintesi è questa: l’AI promette opportunità impressionanti, ma costa. Tantissimo. E costerà sempre di più, sia per sviluppare i modelli AI, sia per farli funzionare.

OpenAI e Anthropic hanno riferito che l’addestramento dei loro attuali modelli AI è costato circa 100 milioni di dollari, ma la prossima generazione supererà il miliardo. Quanto alla gestione, secondo stime di The Information, nel 2024 OpenAI ha speso 8,5 miliardi di dollari, di cui 4 di infrastrutture (uso di cluster di server in cloud, e soprattutto energia per farli funzionare), 3 di addestramento dei modelli e 1,5 di personale.

I colossi tech più impegnati in questo campo, da Microsoft a Meta, hanno stanziato decine di miliardi di dollari ciascuno per la ricerca e sviluppo AI nei prossimi anni. Le principali startup del settore hanno raccolto round di finanziamenti per oltre 30 miliardi, di cui 17 la sola OpenAI. Mentre quello che è considerato il principale fornitore di tecnologie per l’AI, Nvidia, in soli due anni ha praticamente quintuplicato il fatturato: da 27 miliardi di dollari (fiscal year 2023), a 129 attesi per il fiscal year 2025, che si chiude in questi giorni.

Rispetto a questo scenario, DeepSeek e i suoi più recenti modelli – V3, un classico chatbot di GenAI come ChatGPT, e R1, lanciato una settimana fa e specializzato come o1 di OpenAI in problemi complessi di logica e matematica - hanno secondo molti caratteristiche dirompenti. Prima di tutto i costi di addestramento: DeepSeek dichiara che il training di ciascun modello è costato solo 5,6 milioni di dollari, contro centinaia di milioni, come abbiamo visto, per i modelli occidentali. Inoltre V3 in particolare è stato addestrato su un cluster di circa 2mila chip Nvidia, contro le decine di migliaia usati per il training dei modelli “occidentali”. Per di più DeepSeek non dispone di chip di ultima generazione, perché l’export in Cina delle tecnologie informatiche USA più avanzate è vietato. Insomma rispetto ai rivali ha usato chip obsoleti, e ne ha usati molti meno.

Ai di là dei costi di training, anche quelli operativi sono molto più bassi, grazie a diverse innovazioni nel design architetturale dei modelli che esaltano l’efficienza e la scalabilità delle risorse usate. Come se non bastasse, i modelli della startup cinese sono open source, cioè i codici sorgente sono a disposizione di tutti su GitHub. E le loro funzioni (chatbot, ricerca su internet, e deepthink, cioè le capacità di ragionamento di R1) sono disponibili gratuitamente, mentre quasi tutti i modelli occidentali sono a pagamento. DeepSeek guadagna solo sull’integrazione delle sue tecnologie nelle soluzioni dei clienti, e anche in questo caso le tariffe sono molto più basse di quelle dei modelli occidentali.

Quanto alle prestazioni, DeepSeek dichiara per R1 performance simili o migliori di quelle dei principali modelli AI in diversi benchmark su performance matematiche, cultura generale, e performance di domanda e risposta. Inoltre sia R1 sia V3 sono nella top 10 della LLM Leaderboard di Chatbot Arena, una piattaforma di benchmarking sviluppata dai ricercatori dell’Università di Berkeley e basata su oltre un milione di voti di utenti di modelli LLM di tutto il mondo.

Fin qui i fatti. Parliamo di fatti perché da sabato i modelli, i white paper e i codici sorgenti di DeepSeek sono stati studiati da molti esperti e tecnici AI occidentali, con diverse conferme e qualche dubbio di cui parleremo tra poco. Su questi fatti, però il dibattito è in pieno svolgimento. Alcuni parlano di scoppio della bolla dell’AI americana, gonfiata in questi anni dai numeri e dalle crescite impressionanti che abbiamo visto all’inizio.

Altri sostengono l’inutilità di dazi e proibizioni nell’export di tecnologie, visto che la startup cinese, industriandosi con le tecnologie non di ultima frontiera che ha a disposizione, ha raggiunto con innovazioni e creatività delle performance simili ai modelli occidentali, ma con costi drasticamente minori.

Altri ancora sottolineano che se i risultati di DeepSeek fossero generalizzabili, sarebbero comunque positivi per tutto il settore AI, visto che porterebbero in teoria a uno sviluppo meno costoso del settore, sia in termini di risorse finanziarie che di consumo energetico. Altri infine definiscono DeepSeek un’abile copiatrice, e le sue innovazioni tutte da verificare, e comunque rapidamente imitabili.

Posizione quest’ultima per il momento piuttosto minoritaria, visto che anche esponenti di primo piano del settore AI statunitense, compresa la stessa Nvidia, hanno riconosciuto l’importanza dei risultati di DeepSeek. Alcuni addirittura con ammirazione, per esempio Marc Andreessen, venture capitalist e noto fondatore di Netscape, e Yann Le Cun, Chief AI Scientist di Meta.

Qualche dubbio affiora

Va detto comunque che gli scettici hanno qualche elemento innegabile da cui partire.

Primo: sull’infrastruttura cloud di DeepSeek e sulla sua robustezza si sa pochissimo.

Secondo: la privacy dei molti dati che la startup cinese accumula mentre persone di tutto il mondo utilizzano i suoi modelli (email, computer, browser, posizione geografica, ecc.) è un grandissimo punto interrogativo: non per niente alla notizia di prossimi approfondimenti proprio da parte del Garante della Privacy italiano, DeepSeek si è autosospesa nel nostro paese, dove la sua app è diventata inaccessibile sugli app store e il suo sito web è praticamente bloccato.

Terzo: diversi addetti ai lavori hanno sottolineato che gli ormai famosi 5,6 milioni di costi di addestramento non tengono conto di diverse componenti che di solito si considerano in questi calcoli, per esempio il costo del personale. E che DeepSeek potrebbe aver avuto accesso ad altre risorse (chip di ultima generazione, risorse di calcolo) senza dichiararlo. Anche se comunque difficilmente questa componente potrebbe annullare il risparmio di risorse rispetto ai modelli occidentali.

Un dibattito quindi che al momento si arricchisce di novità ogni giorno, e che è comunque da seguire, vista la posta in gioco, in particolare in Italia. Dove il mercato AI cresce del 50-60% all’anno, e l’uso dell’IA Generativa può generare, a parità di ore lavorate, fino a 312 miliardi di euro di valore aggiunto annuo, pari al 18% del PIL.

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato
Iscriviti alla nostra Newsletter Gratuita. Iscriviti
Rimani sempre aggiornato, seguici su Google News! Seguici

Related news

Ultime Notizie

Riduzione del personale con l'AI? Confindustria dice no

Giovanna Labartino, Senior Economist del Centro studi di Confindustria, presentando il rapporto "IA e lavoro: nel cuore della trasformazione" sottolinea alcune questioni oggi al centro del dibattito sul tema intelligenza artificiale-occupazione.

09-12-2025

Estra avvia il primo impianto italiano di biometano con tecnologia grid reverse flow

Ad Asciano (Siena) il progetto TWIST segna una svolta per la rete gas nazionale: per la prima volta il biometano fluisce dalla rete di distribuzione a quella di trasporto.

09-12-2025

L'antitrust multa sei call center per 'teleselling ingannevole'

Le società in questione sono Titanium S.r.l., Fire S.r.l. e J.Wolf Consulting S.r.l. per l'energia. Nova Group S.r.l., Communicate S.r.l., Entiende S.r.l. per la telefonia. La multa totale supera le 500mila euro.

09-12-2025

In Italia i rifiuti speciali ammontano a 164,5 milioni di tonnellate: come le imprese possono gestirli in modo sostenibile

Come la digitalizzazione e la consapevolezza sulla produzione dei propri rifiuti aziendali e la tracciabilità degli stessi aiuta l’economia circolare sul territorio nazionale può trasformare i rifiuti in risorse, riducendo costi e impatti ambientali. Come le aziende possono fare la differenza.

09-12-2025

Notizie più lette

1 Parte il progetto SUSTAIN, debutta l'approccio innovativo alle colture fuori suolo

Il progetto, che vede collaborare il Politecnico di Milano, l’Università degli Studi di Milano e Agricola Moderna, si propone di migliorare i sistemi di coltivazione e di rendere ancora più sostenibili le coltivazioni in ambiente controllato.

2 Aruba e Politecnico di Torino rinnovano la partnership per spingere sull'innovazione

Prosegue la collaborazione triennale per la ricerca, la formazione e l’innovazione nei settori cyber security, AI, ICT e networking, dalla crittografia al quantum computing.

3 Ecco H.E.R.O, il primo umanoide brevettato per operare nei cantieri stradali

H.E.R.O., Humanoid for Enhanced Road Operations, è il primo umanoide brevettato specificamente per operare in sicurezza all’interno dei cantieri stradali. Con un investimento iniziale di 600.000 euro rappresenta una soluzione tecnologica pensata per ridurre l’esposizione al rischio degli operatori nelle fasi più delicate dell’allestimento e della gestione dei cantieri.

4 ICity Rank 2025: sono 16 le città italiane all'avanguardia nell'innovazione digitale

Le città “full digital” sono Bergamo, Bologna, Brescia, Cagliari, Firenze, Genova, Milano, Modena, Parma, Prato, Rimini, Roma Capitale, Siena, Torino, Trento e Venezia.

Iscriviti alla nostra newsletter

Join our mailing list to get weekly updates delivered to your inbox.

Iscriviti alla newsletter

www.innovationcity.it - 8.3.23 - 4.6.3