Esquemas de Recuperação em Redes MPLS Luísa Jorge (ljorge@inescc.pt) 1,3 Teresa Gomes (teresa@inescc.pt) 2,3 (1) ESTIG IPB (2) DEEC-UC (3) INESC Coimbra
Plano da apresentação Breve introdução ao MPLS Conceitos básicos sobre recuperação em redes MPLS Alguns esquemas de recuperação propostos na literatura Protecção por comutação (10) Reencaminhamento (3) Pré-qualificado (1) Conclusões e Trabalho Futuro Coimbra, 2005-9-16 AIORT'05 2/26
BreveintroduçãoaoMPLS Os routers de uma rede MPLS são designados por Label Switching Routers (LSRs). Quando um pacote de dados entra na rede MPLS é classificado, e de acordo com essa classificação é atribuído a uma Forwarding Equivalence Class (FEC). Cada FEC é identificada, em cada LSR, através de uma etiqueta. As redes MPLS usam a técnica conhecida por comutação de etiquetas (label switching) para encaminhar os dados através da rede. Coimbra, 2005-9-16 AIORT'05 3/26
BreveintroduçãoaoMPLS Num dado LSR todos os pacotes de uma FEC são encaminhados do mesmo modo. O caminho seguido pelos pacotes de uma FEC é designado por Label Switched Path (LSP). Considerando que os LSRs Ru e Rd concordaram em associar a etiqueta L à FEC F, para pacotes enviados de Ru para Rd Ru éo LSR a montante (upstream), Rd éo LSR a jusante (downstream). Coimbra, 2005-9-16 AIORT'05 4/26
BreveintroduçãoaoMPLS Túneis Considerando várias FECs que utilizam múltiplos LSPs, entre dois LSRs esses LSPs percorrem os mesmos LSRs. Então os pacotes das múltiplas FECs podem ser encaminhados através de um mesmo caminho (de mais alto nível), entre esses dois LSRs, designado por túnel. Os pacotes são encaminhados nos túneis através de etiquetas adicionais, num processo conhecido como empilhamento de etiquetas. Coimbra, 2005-9-16 AIORT'05 5/26
Recuperação em redes MPLS Quando ocorre uma avaria no caminho activo (CA), o esquema de recuperação deve redireccionar o tráfego para um caminho de backup (CB) Os dois modelos de recuperação básicos usados para redireccionar o tráfego, após uma falha, são Protecção por comutação a recuperação é rápida, porque o CB é pré-estabelecido antes da falha ocorrer é incapaz de tratar falhas simultâneas no CA e no CB Recuperação por reencaminhamento a recuperação é geralmente mais lenta, porque o CB só é estabelecido quando a falha ocorre o CB pode ser pré-calculado ou calculado apenas quando a falha ocorre pode utilizar os recursos de uma forma mais eficiente Um fornecedor de serviços de rede deve poder aplicar esquemas de recuperação diferentes de acordo com as características de Qualidade de Serviço dos fluxos de tráfego (classes de serviço) que transporta Coimbra, 2005-9-16 AIORT'05 6/26
Aspectos da recuperação 1. LSRs entre os quais é estabelecido o CB 2. Instante em que se determina/actualiza o CB 3. Algoritmos para determinação do CA e CB 4. Partilha de carga (load sharing) 5. Detecção e notificação da falha 6. Túneis para recuperação de recursos Coimbra, 2005-9-16 AIORT'05 7/26
LSRs entre os quais é estabelecido o caminho de recuperação Hong et al. (2004) propõem um esquema de recuperação por reencaminhamento Para minimizar o tempo gasto na recuperação, o esquema tenta inicialmente encontrar um CB utilizando apenas um número reduzido de LSRs se não for possível calcular um CB, dentro do âmbito anteriormente determinado, o âmbito da recuperação é expandido (podendo chegar a abranger toda a rede) O processo de determinação de um CB é um processo iterativo: Determinação do âmbito da recuperação, dinamicamente, em termos topológicos Tentar encontrar um CB óptimo, do PSL (LSR responsável pela recuperação) até ao LSR de saída do CA Este processo iterativo não foi formulado directamente através de problemas PL Coimbra, 2005-9-16 AIORT'05 8/26
Instante em que se determina/actualiza o caminho de recuperação O esquema de recuperação proposto por Yoon et al. (2001) segue também o modelo de recuperação por reencaminhamento com recuperação local calcula o CB antes da falha ocorrer (tipo pré-calculado) o CB é recalculado sempre que há actualização da informação de estado da rede (por ex. utilização dos ramos) Vantagens do esquema: o tempo de recuperação é reduzido e o CB éóptimode acordo com a última actualização da informação Quando a avaria no ramo for reparada, o CB é libertado e o tráfego é reposto no CA original Coimbra, 2005-9-16 AIORT'05 9/26
Determinação Off-line dos caminhos - I Yetginer e Karasan (2002) apresentam algoritmos para quatro abordagens possíveis para esta questão, formulados como problemas PLI Características comuns das quatro abordagens: Determina um conjunto inicial de caminhos (CIC) Para cada par origem-destino, tem o objectivo de: Maximizar o número de caminhos, disjuntos nos ramos Minimizar a capacidade total usada Maximiza a capacidade residual total considerada como sendo a soma das capacidades residuais em todos os ramos - minimiza a largura de banda (LB) total utilizada Possibilidade de partilha de recursos nos CBs, de CA disjuntos Caminhos determinados off-line, recuperação extremo a extremo, protecção por comutação, reserva de recursos Coimbra, 2005-9-16 AIORT'05 10/26
Determinação Off-line dos caminhos II Caminhos de trabalho e de recuperação determinados separadamente: Dois algoritmos: 1º algoritmo: selecção, a partir do CIC, em dois passos primeiro seleccionam (de uma só vez) os CA e depois seleccionam os CB Maximizar a capacidade residual total O 2º algoritmo adiciona o objectivo de distribuir a carga uniformemente pela rede Maximizar o mínimo das capacidades residuais individuais Integração do cálculo dos caminhos de trabalho e do cálculo dos caminhos de recuperação: Dois algoritmos: O 3º algoritmo tem os mesmos objectivos que o 2º O 4º algoritmo adiciona o objectivo de manter os ramos que se supõe que serão muito utilizados com maior capacidade residual, atribuindo-lhes pesos adequados Coimbra, 2005-9-16 AIORT'05 11/26
Determinação On-line dos caminhos I Definições Kodialam e Lakshman (2002) propõe algoritmos de encaminhamento dinâmicos para a determinação do CA e do CB com largura de banda garantida no CB Explora a possibilidade de partilha de LB dos CB Diversos algoritmos Recuperação do caminho Recuperação local Partilha tanto maior quanto mais informação, relativa à utilização dos ramos, estiver disponível Consideram dois tipos de partilha Partilha intrapedido (intrademand) partilha que pode ocorrer na recuperação local a partilha entre os vários CB de um mesmo CA Partilha interpedido (interdemand) partilha de CB entre pedidos cujos CA não partilham o mesmo ramo Coimbra, 2005-9-16 AIORT'05 12/26
Determinação On-line dos caminhos II Modelos de informação Consideram três situações distintas de informação disponível Nenhuma informação (NI) Apenas é conhecida a LB reservada em cada ramo Apenas é possível fazer partilha intrapedido Pior partilha Informação completa (IC) São conhecidos os percursos de todos os CAs e CBs Informação centralizada Grande quantidade de informação que precisa de ser enviada Não aplicável em situações práticas Melhor partilha Coimbra, 2005-9-16 AIORT'05 13/26
Determinação On-line dos caminhos III Modelos de informação Modelo com Informação parcial (IP) Apenas é conhecida a LB total utilizada pelos CAs e pelos CBs Informação agregada, que não depende do número de LSPs estabelecidos Informação distribuída (LB agregada) Usa pouca mais informação que no modelo com NI Podem ser obtidos grandes ganhos no desempenho Próximos do modelo com IC Métrica: número de pedidos rejeitados e LB usada O modelo com interesse prático é o modelo com IP São possíveis reservas exactas de LB de protecção desde que ao sinalizar o CB seja enviado o percurso do CA correspondente Coimbra, 2005-9-16 AIORT'05 14/26
Determinação On-line dos caminhos IV Recuperação do caminho Algoritmos para selecção do CA e do CB Caminhos disjuntos nos ramos O objectivo é seleccionar o CA e o CB que minimizem a LB total usada Caso de Nenhuma informação (NI) Não há partilha de LB Objectivo Escolher o par de caminhos disjuntos nos ramos com o menor número de ramos Problema formalizado como um problema standard de fluxo em redes Considerando cada ramo com custo e capacidade unitária Resolvido por qualquer algoritmo de fluxo de custo mínimo Por exemplo através do algoritmo de Suurballe Caso de Informação completa (IC) Partilha interpedido Formalizado como um problema PI com restrições quadráticas Função objectivo - minimizar a soma das duas parcelas seguintes: A soma dos custos dos ramos no CA (= soma das LB usadas por CA) A soma dos custos nos ramos no CB (determinados como sendo a LB adicional que é necessária reservar em cada ramos para backup) Coimbra, 2005-9-16 AIORT'05 15/26
Determinação On-line dos caminhos V Recuperação do caminho Informação parcial (IP) Alguma partilha interpedido 1ª Solução (PI com restrições quadráticas) Função objectivo e restrições iguais ao NI Os custos dos ramos do CB são superiores ou iguais aos do IC Problema: a obtenção da solução é demasiado lenta 2ª Solução (Heurística) Selecção dos caminhos usando um processo iterativo Em cada iteração Determinação dos dois custos a associar a cada ramo Resolução do problema de encontrar dois caminhos óptimos disjuntos nos ramos para os custos anteriores Deve minimizar a soma dos custos dos ramos no CA mais a soma dos custos nos ramos no CB problema NP-hard (solução heurística) A solução do processo iterativo será a melhor solução obtida em todas as iterações Coimbra, 2005-9-16 AIORT'05 16/26
Túneis para recuperação de recursos Mellah e Mohamed (2003) estudam a utilização de túneis para recuperação (bypass tunnel) Os bypass tunnel são pré-estabelecidos, localmente, por cada LSR, para contornar a avaria de um ramo Para todos os pacotes que chegam a um LSR, este: efectua a operação normal na etiqueta do pacote e testa o estado do ramo de saída: Se não existir falha desse ramo o pacote é encaminhado nesse ramo (e sem empilhamento de etiquetas) Caso contrário acrescenta uma nova etiqueta à pilha de etiquetas do pacote (a etiqueta de recuperação), e o pacote segue o bypass tunnel correspondente Coimbra, 2005-9-16 AIORT'05 17/26
p-cycles para recuperação - I Kang e Reed (2003) propuseram a utilização do conceito p-cycles no encaminhamento dos túneis para recuperação (bypass tunnel) a b c d e f g h i j Coimbra, 2005-9-16 AIORT'05 18/26
p-cycles para recuperação - II Kang e Reed (2003) apresentam a formulação para o projecto dos p-cycles óptimos com LB garantida O objectivo é minimizar uma soma ponderada da LB para protecção O problema apresentado é um problema de PLIM Problema NP-hard Propuseram uma relaxação do mesmo para fazer uma pré-selecção de ciclos No entanto, utilizam uma heurística simples para fazer essa pré-selecção Coimbra, 2005-9-16 AIORT'05 19/26
p-cycles para recuperação - III Shen e Grover (2003) extenderam o conceito de p-cycle para suportar a recuperação de nós e ramos (flow p-pcycle) Pertencentes a segmentos de caminhos que intersectem pelo menos dois pontos do p-cycle Coimbra, 2005-9-16 AIORT'05 20/26
p-cycles para recuperação - IV Uma vez definidos os flow p-cycles formularam o problema para a reserva de LB nesses p-cycles, em geral como um problema de PLI Objectivos (em problemas diferentes): minimizar as LB a atribuir aos p-cycles maximizar a protecção contra falhas (assumindo uma certa LB) Foi possível chegar a soluções na vizinhança de 1% do óptimo em tempo útil (máx. 1 dia) Coimbra, 2005-9-16 AIORT'05 21/26
Esquema pré-qualificado No esquema proposto por Park et al. (2004), quando um LSR detecta uma falha, selecciona um caminho de recuperação apropriado de entre os caminhos de trabalho já estabelecidos um caminho que tenha o mesmo destino que o caminho que falhou Se este caminho de recuperação falhar, o esquema de protecção selecciona outro caminho de recuperação seguindo o mesmo procedimento utilizado anteriormente Problema de decisão: Qual o caminhos de trabalho a utilizar para caminho de recuperação Coimbra, 2005-9-16 AIORT'05 22/26
Fast ReRoute Características Normalizado (RFC 4090) Recuperação Local CB pré-estabelecidos Recuperação Rápida Dois esquemas One-to-one Backup Cálculo de detours, on-line Facility Backup Cálculo de túneis de backup, off-line Coimbra, 2005-9-16 AIORT'05 23/26
Tabelas comparativas - I 1º Autor do esquema LSR que faz a recuperação Orientação Falhas consideradas Reserva Aspecto essencial Haskin LSR que detecta a falha Caminho Isoladas de ramos ou nós Sim/Não Forma de construção do caminho de recuperação (constituído por 2 segmentos) Pan LSR que detecta a falha Caminho/ Recurso Isolada de nós ou ramos Sim/Não Recuperação rápida Mellah LSR que detecta a falha Recurso Isoladas de ramos (a) Utilização de túneis de recuperação Kang LSR que detecta a falha Recurso Isoladas de ramos Sim Encaminhamento dos túneis Bartos LSR de entrada, mas inicialmente é o LSR que detecta a falha Recurso Isoladas de ramos Não Algoritmo de cálculo do caminho de recuperação Yetginer LSR de entrada Caminho Isoladas de ramos Sim Algoritmos de cálculo dos caminhos de trabalho e de recuperação Dana LSR de entrada Caminho Isoladas de ramos Não Partilha de carga (load sharing) Kim LSR de entrada Caminho Caminhos Sim Partilha de carga (load sharing) Kodialam LSR de entrada ou LSR que detecta a falha Caminho Isoladas de ramos ou nós Sim Algoritmos de cálculo dos caminhos de trabalho e de recuperação Coimbra, 2005-9-16 AIORT'05 24/26
Tabelas comparativas - II 1º Autor do esquema Modelo de recuperação LSR que faz a recuperação Orientação Falhas consideradas Aspecto essencial Yoon Manter o caminho de recuperação óptimo précalculado Reencaminhamento Um LSR entre o LSR que detecta a falha e o LSR de entrada Caminho Isoladas de ramos Ahn Reencaminhamento LSR que detecta a falha Caminho Isoladas de ramos ou nós Forma de determinar o caminho de recuperação Hong Reencaminhamento Um LSR entre o LSR que detecta a falha e o LSR de entrada Caminho Isoladas de ramos ou nós Forma de determinar o caminho de recuperação e algoritmo de encaminhamento Park Préqualificado LSR que detecta a falha Caminho Ramos e/ou nós Como escolher o caminho a utilizar na recuperação Coimbra, 2005-9-16 AIORT'05 25/26
Conclusões gerais acerca dos esquemas anteriores A grande maioria dos esquemas de recuperação propostos utilizam o modelo de protecção por comutação A grande maioria esquemas de recuperação apenas se propõem recuperar de falhas isoladas Relativamente ao LSR que faz a recuperação Em 7 esquemas é o LSR a montante que detecta a falha Em 2 esquemas é um LSR entre o LSR a montante que detecta a falha e o LSR de entrada Em 4 esquemas é o LSR de entrada A recuperação: Em 4 esquemas é orientada ao recurso (ramo) tenta a recuperação de cada recurso da rede, independentemente dos caminhos de trabalho estabelecidos Em 10 esquemas é orientada ao caminho tenta explicitamente recuperar o caminho de trabalho Sinalização Coimbra, 2005-9-16 AIORT'05 26/26
Trabalho Futuro Estudo da possibilidade de utilização de diversos esquemas de recuperação simultaneamente utilizando critérios de escolha do esquema em cada instante por exemplo os tipos de serviços pedidos e o estado da rede tendo em vista a conjugação das suas melhores características Criar uma nova proposta de recuperação Minizando a LB de protecção utilizada Tendo em consideração diferentes serviços (DiffServ) Coimbra, 2005-9-16 AIORT'05 27/26
Obrigada Referências D.-K. Hong, C. S. Hong, e Dongsik-Yun, (2004). A hierarchical restoration scheme with dynamic adjustment of restoration scope in an MPLS network. In Network Operations and Management Symposium, pp. 191 204. J. Kang e M.J. Reed, (2003). Bandwidth Protection in MPLS networks using p-cycles structure. In Proceedings of the Design of Reliable Communication Networks (DRCN) 2003, pp. 356-362. M. Kodialam e T. V. Lakshman, (2002). Restorable Dynamic Quality of Service Routing. IEEE Communications Magazine, pp. 72-81. S.-Y. Kim, (2003). Effect of load distribution in path protection of MPLS. International Journal of Communication Systems, 16(4), pp. 321 335. H. Mellah e A. F. Mohamed, (2003). Local path protection/restoration in MPLS-based networks. In The 9th Asia-Pacific Conference on Communications - APCC 2003, volume 2, pp. 620 622. P.-K. Park, H.-S. Yoon, S. C. Kim, J. Park, e S. Yang, (2004). Design of a dynamic path protection mechanism in MPLS networks. In The 6th International Conference on Advanced Communication Technology, volume 2, pp. 857 861. G. Shen e W. D. Grover, (2003). Extending the p-cycle concept to path segment protection for span and node failure recovery. IEEE Journal on Selected Areas in Communications, 21(8), pp. 1306-1319. E. Yetginer e E. Karasan, (2002). Robust path design algorithms for traffic engineering with restoration in MPLS networks. In Proceedings of the 7th International Symposium on Computer and Communications - ISCC 2002, pp. 933 938. S. Yoon, H. Lee, D. Choi, Y. Kim, G. Lee, e M. Lee, (2001). An efficient recovery mechanism for MPLS based protection LSP. In Joint 4th IEEE International Conference on ATM (ICATM 2001), pp. 75 79, Seoul, Korea. Coimbra, 2005-9-16 AIORT'05 28/26