“L’anno scorso, il mondo stava solo iniziando a immaginare come l‘IA generativa avrebbe potuto trasformare le aziende. Oggi, questa trasformazione è ormai ampiamente avviata. Per Google, la missione ultima rimane sempre la stessa: rendere l’IA utile a tutti, per migliorare la vita del maggior numero possibile di persone. E anche se non tutti i carichi di lavoro riguardano l’IA, ogni carico eseguito in cloud necessita di ottimizzazione e ogni applicazione presenta esigenze tecniche specifiche. Ecco perché stiamo introducendo nuove opzioni di calcolo generiche che aiutano i clienti a massimizzare le prestazioni, abilitare l’interoperabilità tra le applicazioni e raggiungere gli obiettivi di sostenibilità, il tutto riducendo i costi”.

Sono le parole con cui Thomas Kurian, ceo di Google Cloud, ha introdotto il suo intervento a Google Cloud Next ’24, occasione per annunciare importanti novità di Google Cloud legate alla genAI.

Nuove frontiere per aziende, developer e creator

Dall’infrastruttura ottimizzata per l’IA alle nuove funzionalità di Vertex AI, Google Cloud mette sul piatto soluzioni che mirano a “rendere più facile che mai sfruttare la potenza dell’IA generativa aprendo nuove frontiere per aziende, sviluppatori e creator“. Ecco il nuovo scenario.

Infrastruttura ottimizzata per l’IA

Al centro c’è Google Axion, la prima Cpu personalizzata di Google Cloud basata su Arm e progettata per i data center, che offre prestazioni fino al 50% superiori e un’efficienza energetica fino al 60% migliore rispetto alle attuali istanze basate su x86 di pari livello.

Ma in arrivo vi sono anche nuove offerte come A3 mega, i chip Nvidia Hgx B200 e Nvidia GB200 NVL72 in arrivo su Google Cloud, la disponibilità generale di Tpu v5p e le opzioni di storage ottimizzate per l’IA, che forniscono la solida base necessaria per i carichi di lavoro IA più impegnativi.

Un “mondo” di agenti IA connessi al cloud

“Con la nostra offerta IA complessiva che comprende infrastruttura, Gemini, modelli e Vertex AI – ha spiegato Kurian -, clienti e partner stanno creando agenti IA sempre più sofisticati al servizio dei loro clienti e a supporto dei dipendenti, per aiutarli a creare contenuti e molto altro ancora”.

I Customer Agent possono aiutare i clienti a interagire con le aziende in modo più fluido lavorando su diversi canali (web, mobile, call center e punto vendita) e in più modalità, come testo, voce e altro. Gli Employee Agent aiutano i dipendenti a essere più produttivi e a lavorare meglio insieme. I Creative Agent possono affiancare designer e team di produzione, lavorando su immagini e presentazioni, e fornendo nuovi spunti.

Portare l’IA ovunque con il cloud

Google Cloud consente di utilizzare l’IA ovunque, portandola più vicino al luogo in cui vengono generati e utilizzati i dati: all’Edge, agli ambienti air-gapped, a Google Sovereign Cloud. Google Cloud estende inoltre le opzioni di residenza dei dati archiviati a riposo per l’IA generativa sui servizi Vertex AI a 11 nuovi Paesi, tra cui l’Italia.

Ampliati l’accesso ai modelli e le funzionalità di grounding

Vertex AI offre ora una scelta ancora più ampia con Gemini 1.5 Pro (con un’enorme finestra contestuale da 1 milione di token), Claude 3, CodeGemma e Imagen 2. Inoltre Vertex AI ora include funzionalità di grounding in Google Search e nei dati provenienti da applicazioni aziendali come Workday e Salesforce.

Più produttività per gli sviluppatori

Gemini Code Assist e Gemini Cloud Assist aumentano la produttività degli sviluppatori, abilitando un coding più rapido e una gestione semplificata delle applicazioni.

IA per i dati

L’integrazione di Gemini in BigQuery, Database e Looker apre nuove possibilità per l’analisi, la migrazione e la governance dei dati.

Sicurezza potenziata dall’IA

Nuove funzionalità di sicurezza basate su Gemini per migliorare l’intelligence sulle minacce e la risposta agli incidenti.

Google Workspace diventa più smart

Introduzione di Google Vids, un’applicazione alimentata dall’IA per la creazione di video in ambito professionale, oltre a nuovi componenti aggiuntivi di intelligenza artificiale per riunioni, messaggistica e sicurezza.

