Implementazione di un Sistema di Protezione GMPLS Condiviso per Reti Ethernet Ottiche

A cost-effective implementation of GMPLS shared protection is successfully demonstrated in an IP over Gigabit Ethernet testbed. Experimental results show that recovery times in the millisecond range are achieved. 1. Introduzione Le architetture di rete basate sul protocollo Ethernet per il trasporto di pacchetti IP/MPLS direttamente su fibra ottica (1 e 10 Gigabit Ethernet, (GbE)) rappresentano una soluzione semplice ed efficiente per superare il collo di bottiglia che storicamente limita la velocità di trasmissione dati fra reti locali e reti geografiche. Negli ultimi anni infatti, sistemi basati su connessioni GbE ottiche trovano impiego non solo per il collegamento fra switch di livello 2 in reti locali, ma anche per il collegamento diretto fra router che operano a livello 3 in reti metropolitane. Il principale fattore limitante alla completa diffusione di GbE è però rappresentato dalla mancanza di alcune importanti funzioni per la gestione e manutenzione della rete (OA&M), come la protezione delle connessioni in caso di guasto. Spesso viene quindi impiegato uno schema di protezione di tipo 1+1, estremamente semplice e veloce, ma che richiede la duplicazione delle risorse quali costose interfacce sui router e fibre ottiche. Soluzioni più avanzate basate su tecnologia WDM riducono le necessità di fibre ma aumentano sensibilmente il costo complessivo dell’infrastruttura di rete. In questo studio vengono dapprima sperimentalmente valutate le principali limitazioni che caratterizzano la protezione di connessione punto-punto GbE su fibra ottica fra attuali router commerciali destinati ad un utilizzo in ambito metropolitano. In particolare si evidenzia il tempo impiegato dai router per rilevare e gestire il guasto della connessione e viene valutata la tempistica richiesta dal protocollo di instradamento Open Shortest Path First (OSPF) per ripristinare il corretto scambio di pacchetti una volta riattivata fisicamente la connessione. Vengono quindi proposte le linee guida per migliorare il comportamento dei router nelle due situazioni analizzate. Lo studio presenta infine l’implementazione di uno schema di protezione condiviso veloce ed a costo contenuto che evita i problemi e le inefficienze evidenziate sperimentalmente dai router. Lo schema è basato sull’impiego di economici dispositivi di commutazione ottica (PXC) controllati da segnalazione fuori-banda basata sul protocollo Generalized Multi-Protocol Label Switching (GMPLS). L’implementazione mostra come sia possibile sfruttare le potenzialità del protocollo GMPLS per ridurre l’impiego di risorse pregiate dell’infrastruttura di rete (interfacce sui router e fibre ottiche) pur garantendo tempi di ripristino della connessione di pochi millisecondi. 2. Analisi del tempo di rilevazione di guasti su connessioni GbE punto-punto Il testbed di rete considerato consiste in due router IP/MPLS connessi tramite un collegamento GbE (1000BaseLX) punto-punto su fibra ottica monomodale. Obiettivo delle prove sperimentali è l’analisi del comportamento dei router nel caso in cui si verifichi una rottura del collegamento (es. taglio della fibra). La rottura viene realizzata agendo su un dispositivo di commutazione ottica trasparente (PXC) inserito lungo la fibra che connette i due router. Inizialmente il PXC risulta configurato in modo tale da consentire la comunicazione fra i due router, le cui interfacce risultano quindi attive (up). La commutazione del PXC (comandata attraverso un PC di controllo) provoca l’interruzione del collegamento (down). Il PXC è caratterizzato da tempi di commutazione di circa 3ms. Al fine di rilevare i tempi di reazione del router, lo stesso PC di controllo viene connesso anche all’interfaccia di gestione dei router e viene attivata la continua interrogazione dello stato dell’interfaccia. Il router infatti, è in grado di gestire una comunicazione client-server basata sullo scambio di messaggi Extended Markup Language (XML) attraverso la quale può fornire lo stato operativo delle proprie interfacce (up o down). La potenza ottica del segnale in linea viene inoltre continuamente monitorata dal PC di controllo attraverso un meccanismo di rilevazione di guasti basato sull’assenza di potenza ottica in fibra (Fig. 1, [1]). Parte del segnale ottico ricevuto da ogni router viene infatti spillato e inviato ad un circuito di controllo. Il circuito provvede a convertire il livello di potenza ottica in un valore di tensione che giunge ad un comparatore a soglia. In caso di guasto, il livello di tensione scende sotto soglia ed il circuito notifica al PC, attraverso la porta parallela, l’avvenuta rottura del collegamento. Confrontando quindi le informazioni sullo stato operativo delle interfacce dei router con gli eventi legati alla commutazione del PXC e conseguente assenza di potenza ottica in fibra è possibile misurare il ritardo introdotto dal router per la rilevazione del guasto. Fig. 2 mostra i risultati ottenuti in termini di distribuzione dei tempi di rilevazione del guasto da parte del router. Il tempo medio misurato è di 0.573 s, la deviazione standard 0.275 s, il minimo 92 ms, il massimo 1.091 s. Si nota quindi che la distribuzione dei valori risulta piuttosto uniforme fra 0.1 s e 1 s, tale quindi da far presupporre una verifica dello stato delle interfacce da parte del router solo di una volta al secondo. Ciò quindi determina tempi di ripristino del guasto estremamente elevati se confrontati con i 50 ms che caratterizzano le reti basate sul protocollo SDH. Infatti qualsiasi metodo di ripristino della connettività attivato dal router, ad esempio MPLS Fast Reroute su un percorso alternativo, risulta pesantemente influenzato dal tempo di rilevazione del guasto. L’evoluzione dei router commerciali dovrà quindi necessariamente tenere conto di questi aspetti e integrare meccanismi più efficienti per la rilevazione del guasto. 3. Analisi del tempo di attivazione di adiacenza tra router Una volta rilevato il guasto, ciascun router rimuove immediatamente dalle proprie tabelle di instradamento la presenza del router adiacente e delle reti annunciate attraverso quest’ultimo. Pertanto, una volta ripristinato fisicamente lo stato della connessione, risulta necessario attendere una nuova instaurazione dell’adiacenza tra i router e la sincronizzazione delle tabelle di instradamento prima che la trasmissione del traffico dati possa riprendere. L’analisi sperimentale della procedura di attivazione dell’adiacenza è risultata la seguente: • Appena rilevato lo stato attivo dell’interfaccia ciascun router inizia a trasmettere periodicamente messaggi di Hello verso l’indirizzo di destinazione multicast AllSPFRouter (224.0.0.5). Tipicamente, al quinto messaggio di Hello complessivamente scambiato (dopo circa 1.5 s dall’attivazione) ciascun router indica nel campo neighbours PXC Fig. 2: Distribuzione del ritardo (in secondi) introdotto dal router per rilevare il guasto su connessioni GbE. Fig. 1: Dispositivo di commutazione ottica (PXC) con circuito di rilevazione di guasti del messaggio Hello la presenza del router connesso (stato 2-way). • Le interfacce Ethernet sono considerate dal protocollo OSPF di tipo Broadcast. Quindi un lungo scambio di messaggi di Hello, tutti identici tra loro, consentono ai router di procedere all’elezione del Designated Router (DR) e Backup DR (BDR). Questa fase termina dopo circa 40 s dall’attivazione della connessione. • La fase successiva (stato Database Exchange e Loading) prevede lo scambio delle informazioni contenute nelle proprie tabelle di instradamento. • I primi pacchetti di traffico dati vengono scambiati mediamente dopo 45 s dall’attivazione fisica della connessione. La stessa indagine sperimentale è inoltre stata condotta analizzando il comportamento di una connessione fra interfacce ATM in modalità punto-punto (potrebbero esser configurate anche in modalità NBMA, Non Broadcast Multi Access). In questo caso la tempistica misurata risulta tale da non superare i 5 secondi fra l’attivazione fisica della linea ed il transito dei primi pacchetti di traffico dati. Infatti, per interfacce di tipo punto-punto, il protocollo OSPF non procede all’elezione del DR e del BDR, riducendo notevolmente i tempi di attivazione dell’adiacenza. Il confronto fra le due procedure consente di individuare un miglioramento parziale ma significativo da applicare nel caso di reti Ethernet. Tali reti, tipicamente di tipo Broadcast, possono infatti consentire la presenza di più di due interfacce e router connessi direttamente. Per questo motivo l’adiacenza del protocollo OSPF per ciascun router viene instaurata solo con il DR (ed il BDR). Come indicato dalle misure riportate precedentemente anche nel caso di connessioni punto-punto questa fase viene attivata, ma con l’ovvio risultato che uno dei due router viene eletto DR e l’altro BDR, con l’adiacenza instaurata direttamente fra loro. Questa fase introduce un ritardo di quasi 40 secondi. Per ottenere una riduzione di tale ritardo nel caso di connessioni Ethernet punto-punto fra router si propone di imporre al router l’interpretazione della connessione come punto-punto in modo tale da evitare la fase di elezione del DR e del BDR. Una connessione punto-punto è identificabile in modo implicito a livello di configurazione dell’indirizzo IP dalla presenza di una sottorete a 30 bit o in modo esplicito introducendo un semplice comando di configurazione, esempio point-to-point come per le connessioni di tipo ATM. Ciò non richiede modifiche al protocollo OSPF. 4. Implementazione di uno schema di protezione condiviso GMPLS Per evitare i problemi causati dalla lenta rilevazione del guasto da parte dei router IP/MPLS e dalla lenta riattivazione delle adiacenze perse, viene proposto in questa sezione un sistema di protezione condiviso GMPLS. Il sistema proposto, implementato nel testbed mostrato in Fig. 3, prevede la presenza di connessioni punto-punto fra interfacce GbE ottiche dei router e la presenza di PXC trasparenti al