Di Lori MacVittie, Distinguished Engineer and Chief Evangelist di F5
L’application delivery ha sempre avuto come obiettivo quello di garantire tre elementi fondamentali: prestazioni, disponibilità e affidabilità. Questi principi hanno definito il successo delle diverse generazioni di architetture applicative, dal modello client-server al web fino al cloud. Ma l’intelligenza artificiale, in particolare l’inferenza, cambia completamente le carte in tavola.
Secondo la ricerca SOAS (State of Application Strategy) 2026 di F5, il 78% delle aziende utilizza l’inferenza AI come funzione operativa core. Dunque, l’inferenza non è più in una fase sperimentale, ma è un asset software ormai consolidato con un impatto concreto sul business. Tuttavia, molte organizzazioni continuano a considerare gli endpoint di inferenza come “una API come tante: si tratta di un presupposto rischioso. A differenza delle API tradizionali, le richieste di inferenza sono probabilistiche, computazionalmente intensive e sensibili al contesto. Trattarle come carichi di lavoro tradizionali mette a rischio gli stessi obiettivi dell’application delivery ed espone le organizzazioni a nuove categorie di rischi operativi e di sicurezza.
In questo articolo esploreremo come l’inferenza ridefinisce la triade di PAR (performance, availability e reliability) nell’application delivery, analizzeremo le differenze algoritmiche di cui le aziende devono tenere conto ed evidenzieremo le implicazioni per le tecnologie come il monitoraggio dello stato di salute, il bilanciamento del carico, l’ottimizzazione del traffico e la sicurezza.
La triade PAR: il fondamento dell’application delivery
Così come la sicurezza si basa sulla triade CIA (confidentiality, integrity, availability), l’application delivery si fonda su una propria triade: performance, disponibilità e affidabilità.
- Performance: l’applicazione risponde abbastanza rapidamente in modo da soddisfare le aspettative degli utenti?
- Disponibilità: l’applicazione è raggiungibile e restituisce risultati validi anche sotto stress?
- Affidabilità: l’applicazione è in grado di comportarsi in modo coerente e affidabile nel tempo?
Per decenni, questa triade si è applicata ai carichi di lavoro deterministici. Le risposte erano prevedibili, la correttezza era implicita e i costi stabili. I carichi di lavoro di inferenza mettono in discussione questi presupposti. Poiché l’inferenza è probabilistica e variabile dal punto di vista computazionale, le definizioni di prestazioni, disponibilità e affidabilità devono evolversi.










