l'analisi

L’intelligenza artificiale cambia le reti: la sfida ora corre sulle Wan

Report “AI Impact on Wide Area Networks 2026″ di Cisco: entro il 2035 l’inferenza AI potrà pesare per il 25% del traffico totale. Per operatori e imprese si apre una nuova partita su capacità upstream, sicurezza e osservabilità

Pubblicato il 1 giu 2026

Aggiungi tra i preferiti su Google

Veronica Balocco

Chiedi all'AI

Riassumi questo articolo

Approfondisci con altre fonti

Il traffico AI e di inferenza è più persistente, simmetrico e critico per la WAN; richiede osservabilità, classificazione e gestione differenziata oltre alla sola capacità.
Crescita rapida: Cisco stima fino al 25% del traffico totale nel 2035; consumer +6,6× e enterprise fino a +9×, con agenti che possono generare fino al +450% di traffico.
Implicazioni operative: più upstream, uso diffuso di Quic cifrato, maggiore superficie per sicurezza e governance; la latency pesa meno oggi ma diventerà critica.

Riassunto generato con AI

Il traffico AI non è ancora il peso massimo di Internet. Ma sta già cambiando le regole con cui le reti vengono progettate. Dopo anni dominati da video, streaming e download, la crescita dell’intelligenza artificiale introduce un profilo diverso. Meno esplosivo nel singolo flusso, più persistente, più simmetrico e sempre più critico per applicazioni e servizi.

È il punto centrale del report “AI Impact on Wide Area Networks” di Cisco, dedicato all’impatto dell’intelligenza artificiale sulle reti Wan. Lo studio combina analisi di traffico reale, dati di mercato e test di laboratorio sugli agenti AI. L’obiettivo è misurare come l’inferenza e l’AI agentica stiano modificando volumi, durata dei flussi, capacità upstream e requisiti di qualità.

La previsione più rilevante riguarda il 2035. Secondo il modello Cisco, il traffico di inferenza AI potrebbe arrivare a rappresentare il 25% del traffico totale di rete. Nei servizi consumer, l’adozione di AI e agenti autonomi potrebbe portare il traffico a crescere di 6,6 volte rispetto ai livelli attuali. Il dato equivale a un incremento aggiuntivo del 63% rispetto a uno scenario senza impatto AI.

Indice degli argomenti

Il nuovo baricentro delle reti

La trasformazione non riguarda solo la quantità di dati. Il traffico AI ha caratteristiche diverse dal traffico web tradizionale. Le richieste di inferenza non assomigliano alla navigazione classica. Sono generate da applicazioni che dialogano con modelli remoti, inviano contesto e ricevono risposte token dopo token.

Per questo i flussi durano più a lungo. Cisco rileva che i flussi di inferenza AI hanno una durata mediana circa doppia rispetto alle transazioni web ordinarie. Il motivo è strutturale. Il modello non restituisce sempre un contenuto già pronto. Lo produce progressivamente, generando una risposta in sequenza.

Il risultato è un traffico meno “a raffica” e più continuo. La velocità mediana dei flussi web tradizionali risulta dieci volte superiore a quella dei flussi AI. Ma questo non rende l’AI meno impattante. Al contrario, la sua persistenza può aumentare il numero di stati da gestire nei sistemi di rete e sicurezza. Per gli operatori, il tema diventa quindi architetturale. Firewall, sistemi di ispezione, piattaforme Dpi e strumenti di assurance dovranno seguire flussi più lunghi e distribuiti. La capacità non basterà. Serviranno osservabilità, classificazione e gestione differenziata.

L’inferenza oggi pesa poco, ma cresce in fretta

Il report chiarisce un punto importante. Oggi il traffico di inferenza AI resta marginale rispetto a categorie come il video streaming. Tuttavia, la dinamica di crescita è molto rapida. I dati sul consumo di token mostrano un aumento vicino a dieci volte su base annua. Nelle misurazioni condotte presso alcuni service provider, Cisco indica una crescita di circa quattro volte in otto mesi.

È questa traiettoria a preoccupare e interessare gli operatori. Il traffico AI parte da una base ridotta, ma cresce dentro applicazioni già molto diffuse. Assistenti, chatbot, strumenti di produttività, servizi di shopping, applicazioni enterprise e funzioni integrate nei software stanno trasformando l’inferenza in una componente ordinaria dell’esperienza digitale.

A differenza del traffico generato dall’addestramento dei modelli, quello di inferenza attraversa le reti geografiche. Il training resta in larga parte confinato nei data center. L’inferenza, invece, collega dispositivi, applicazioni, cloud, data center privati e modelli remoti. È qui che la Wan diventa il terreno decisivo.

Il report segnala anche l’uso di trasporti sia Tcp sia Quic. In termini di volume, Quic arriva al 57% nei dati analizzati. Questo introduce ulteriori sfide per i sistemi di riconoscimento applicativo, perché la cifratura rende più complessa l’identificazione del traffico a livello applicativo.

Gli agenti AI diventano power user

La discontinuità più forte arriva però dagli agenti autonomi. Nel modello Cisco, gli agenti AI non sono semplici interfacce conversazionali. Sono processi software che usano un modello come motore decisionale e attivano strumenti esterni per completare compiti. Questo cambia la scala dell’utilizzo. Un essere umano naviga, legge, sceglie e attende. Un agente opera a velocità software. Interroga fonti, invia prompt, aggiorna il contesto, richiama strumenti e ritorna al modello. Ogni passaggio genera traffico.

Nei test Cisco, un’attività svolta da un agente ha prodotto fino al 450% di traffico totale in più rispetto alla stessa attività eseguita manualmente. Circa il 70% del traffico generato era legato all’inferenza AI. Questo rende il collegamento tra codice dell’agente e modello una dipendenza critica.

Cisco definisce questo collegamento come la spina dorsale dell’agente. La metafora è efficace, perché mostra la nuova centralità della rete. Se il percorso verso il modello degrada, l’agente non rallenta soltanto. Può perdere capacità operativa, affidabilità e qualità della risposta.

Più upstream, meno certezze per il capacity planning

Uno degli effetti più rilevanti riguarda la simmetria del traffico. Le reti fisse sono state storicamente progettate intorno a una prevalenza downstream. Gli utenti scaricavano più dati di quanti ne caricassero. Il video ha rafforzato questa logica.

L’inferenza AI introduce un equilibrio diverso. I prompt diventano più ricchi, includono contesto, documenti, cronologia e informazioni operative. Nel caso degli agenti, questo contesto può crescere durante l’esecuzione del compito.

Secondo Cisco, circa il 9% dei flussi di inferenza AI trasporta più dati in upstream che in downstream. Per il traffico web tipico, la quota è circa lo 0,5%. È una differenza significativa, soprattutto per le reti di accesso.

Il tema è particolarmente sensibile per la pianificazione radio e per le reti broadband con capacità upstream storicamente più limitata. Le architetture in fibra partono avvantaggiate sul piano della simmetria. Altre tecnologie dovranno accelerare gli upgrade già avviati.

La questione non riguarda solo la velocità nominale. Riguarda la qualità della sessione AI. Un agente che deve inviare grandi quantità di contesto può essere penalizzato da congestione upstream, jitter o perdita di pacchetti. In questo scenario, la capacità di upload diventa un fattore competitivo.

La latenza non è ancora il collo di bottiglia

Il report ridimensiona, almeno nel breve periodo, il tema della latenza di rete. Oggi il tempo complessivo di risposta dell’AI dipende soprattutto dall’elaborazione del modello. La latenza di inferenza può variare da centinaia di millisecondi a diversi secondi.

Il traffico di rete pesa ancora poco nel tempo percepito dall’utente. Per questo Cisco non vede, al momento, una giustificazione generalizzata per spostare l’inferenza all’edge solo per ragioni di latenza. Il quadro, però, è destinato a cambiare. Con hardware di inferenza più efficiente, la quota di ritardo attribuibile alla rete diventerà più visibile. Quando i modelli risponderanno più velocemente, anche decine di millisecondi potranno incidere sull’esperienza. A quel punto, la distribuzione dell’inferenza dovrà combinare latenza, scala, sicurezza e sovranità dei dati.

È un passaggio strategico per gli operatori. La misurazione della qualità non potrà fermarsi ai Kpi tradizionali. Serviranno indicatori specifici per l’esperienza AI, capaci di distinguere tra ritardo del modello, problemi di rete e prestazioni applicative.

Enterprise, il traffico può crescere di nove volte

Nel mondo enterprise, l’impatto dell’AI agentica si lega alla trasformazione dei processi. Il report cita previsioni secondo cui il 40% delle applicazioni aziendali integrerà agenti AI specifici entro il 2026. Nel 2025 la quota era inferiore al 5%. L’accelerazione è sostenuta dalla spinta su produttività, automazione e riduzione dei costi. Sempre secondo i dati richiamati da Cisco, entro il 2027 l’80% dei manager considera l’AI agentica cruciale per la sopravvivenza competitiva dell’impresa.

La conseguenza sulle reti aziendali è rilevante. Senza agenti AI, il traffico enterprise crescerebbe di circa 2,5 volte nel periodo 2026-2035. Con l’adozione dell’AI agentica, la crescita potrebbe arrivare a nove volte. Questo scenario modifica anche il ruolo delle infrastrutture interne. Le imprese dovranno gestire connessioni tra sedi, cloud pubblici, data center privati, ambienti on premise e modelli esterni. Il traffico AI diventerà parte integrante dei flussi applicativi aziendali.

Ne deriva una nuova priorità per architetture Sd-Wan, sicurezza distribuita e osservabilità end-to-end. Non si tratterà soltanto di collegare utenti e applicazioni. Bisognerà garantire percorsi affidabili tra agenti, modelli e strumenti operativi.

Consumer AI, la scala che cambia Internet

Se l’enterprise porta complessità, il consumer porta scala. Cisco prevede che l’adozione dell’AI tra gli utenti finali diventi quasi universale entro la metà degli anni Trenta. L’AI entrerà in smartphone, wearable, automobili, applicazioni finanziarie, shopping, gaming, entertainment e realtà aumentata. Il passaggio sarà graduale, ma profondo. Molti utenti non percepiranno più l’AI come un servizio separato. La troveranno incorporata in applicazioni e dispositivi. Questo renderà l’inferenza una funzione di base della connettività.

L’AI agentica consumer aggiunge un ulteriore livello. Assistenti personali, agenti per gli acquisti, strumenti di pianificazione, servizi finanziari automatizzati e funzioni domestiche lavoreranno in background. Ogni attività genererà richieste, contesto e scambi con modelli remoti.

Per gli operatori, questo significa che il traffico AI potrebbe diventare uno dei principali motori della crescita complessiva. Il video resterà rilevante, ma non sarà più l’unico riferimento per pianificare capacità e qualità. La rete dovrà sostenere servizi più interattivi, persistenti e sensibili alla continuità.

Sicurezza e policy entrano nella progettazione

La crescita del traffico AI apre anche un fronte di cybersecurity e governance. Flussi più lunghi, cifrati e distribuiti rendono più complessa l’ispezione. L’uso di Quic può ridurre la visibilità applicativa dei sistemi tradizionali. Gli agenti, inoltre, interagiscono con fonti, strumenti e servizi esterni. Questo aumenta la superficie di rischio. Un agente compromesso o mal configurato può generare traffico anomalo, accedere a dati sensibili o amplificare errori operativi. La rete dovrà quindi integrare controlli più granulari, senza penalizzare l’esperienza.

Anche la regolazione potrà incidere. Sovranità del dato, localizzazione dell’inferenza, sicurezza delle infrastrutture critiche e responsabilità degli agenti autonomi entreranno nelle scelte di deployment. La distribuzione tra cloud, edge, data center privati e dispositivi non sarà solo tecnica. In Europa, questi temi si collegano alla strategia su cloud, dati, AI e infrastrutture digitali. La capacità di sostenere traffico AI affidabile potrà diventare un indicatore di competitività industriale. Non solo per gli operatori, ma per l’intero ecosistema digitale.

@RIPRODUZIONE RISERVATA