Qualidade de Serviço (QoS) I: Dependabilidade Este tutorial trata, no contexto de dependabilidade, da avaliação da indisponibilidade aplicadas às redes de telecomunicações. Jorge Moreira de Souza Doutor em Informática (81) pelo Instituto Nacional Politécnico de Toulouse, França, Mestre (75) e Bacharel (71) em Engenharia Elétrica na PUC-RIO. As principais áreas de interesse são Engenharia de Tráfego e Análise de Confiabilidade de Sistemas. Trabalha atualmente na FITec onde desenvolve trabalhos de análise/avaliação e revisões de projeto. Participou com membro da Comissão do I Concurso Teleco de Trabalhos de Conclusão de Curso (TCC), realizado em 2005, e do II Concurso Teleco de Trabalhos de Conclusão de Curso (TCC), realizado em 2006. Email: jmdsouza@fitec.org.br Categoria: Banda Larga Nível: Introdutório Enfoque: Técnico Duração: 15 minutos Publicado em: 12/12/2005 1
QoS: Introdução As redes de telecomunicações, principalmente a rede telefônica, são conhecidas pela sua qualidade. São redes que operam 24 horas, com alta disponibilidade e que oferecem qualidade nos serviços oferecidos de voz ou dados (principalmente o serviço de voz da rede telefônica). Para oferecer essa qualidade de serviço a União Internacional de Telecomunicações (UIT ou ITU em inglês) [UIT www] e o European Telecommunications Standard Intitute [ETSI www] definiram os conceitos de Qualidade de Serviço (QoS, Quality of Service) e de Desempenho de Rede (NP, Network Performance). O mercado americano tem características próprias e as recomendações de QoS não seguem diretamente as da UIT e sim as da Telcordia [TEL www]. A seguir apresentamos os conceitos da UIT. Qualidade de Serviço (QoS): na recomendação E.800 do ITU [E800 94], a QoS é definida como o efeito conjunto do desempenho do serviço que determina o grau de satisfação de um usuário desse serviço. Desempenho da Rede (NP): na recomendação I.350 do ITU [I350 93] o desempenho da rede, NP, é medido por meio de parâmetros que são importantes para o operador da rede e são usados para o planejamento, configuração, operação e manutenção. O desempenho da rede é definido independentemente do desempenho dos terminais e ações do usuário. A tabela abaixo resume os objetivos das recomendações de QoS e NP: Qualidade de Serviço (QoS) focar nos efeitos percebidos pelo usuário; ser independente de configurações de rede; ser independente de como o serviço é provido; permitir a comparação de serviços de diferentes fornecedores. Objetivos Desempenho de Rede (NP) medir a eficiência das soluções de rede, adotadas para provisão de serviços aos usuários. Uma rede de telecomunicação deve ser planejada (o conceito de QoS se aplica também à equipamentos de rede) tendo em vista as especificações de QoS e NP. O ITU tem uma série de recomendações que visam especificar os parâmetros pertinentes para diversas redes e equipamentos: rede de circuitos (voz), canal comum, RI, ATM, IP, centrais digitais, etc. O conceito de Qualidade de Serviço (QoS) é definido como o efeito coletivo do desempenho do serviço que determina o grau de satisfação do usuário. Os fatores de desempenho considerados são: Suporte ao serviço: mede a capacidade de uma organização em oferecer um serviço e assisti-lo durante a sua utilização; Operabilidade do serviço: mede o sucesso doserviço junto ao usuário quanto à facilidade de operação, interfaces amigáveis, inteligibilidade, etc; 2
Servibilidade: mede a capacidade operacional do serviço que deve estar disponível quando requerido, ser mantido pelo tempo necessário à operação e respeitar as tolerâncias especificadas, satisfeitas as condições estabelecidas de operação; Integridade do serviço: mede a robustez do serviço quanto ao nível de reprodução, na recepção, da informação transmitida. Dos fatores acima vamos abordar apenas a servibilidade, que destaca os aspectos operacionais do serviço e onde a aplicação de métodos estatísticos é fundamental na avaliação da QoS da rede (ou equipamento). No contexto de servibilidade, o desempenho da capacidade operacional do serviço pode ser classificado em: Desempenho de Tráfego: traduz a capacidade de escoamento de tráfego de um equipamento ou de uma rede de telecomunicações: tempos de resposta, bloqueio, controle de congestionamento, etc. Esse conjunto de indicadores é geralmente dividido em indicadores de Grau de Serviço (GoS), de Sobrecarga de Tráfego (supõem a rede sem falhas) e de Degradação (supõe a rede com falhas em um ou mais de seus elementos); Dependabilidade: é um termo coletivo que expressa o grau de confiança que o usuário pode ter no provimento do serviço. A dependabilidade é estimada usando-se um ou mais atributos como: a indisponibilidade, a confiabilidade, a mantenabilidade, perda de informação, serviços incorretos ou incompletos, etc; Desempenho de Propagação: traduz a capacidade de um meio de propagação em transmitir a informação dentro de uma tolerância especificada. No presente tutorial trataremos no contexto de dependabilidade a avaliação da indisponibilidade. 3
QoS: Dependabilidade Podemos dizer que o principal requisito no contexto de dependabilidade é o de indisponibilidade que é estimado em minutos parados por ano. Outra forma é especificar a disponibilidade que é estimada pela porcentagem de tempo que o sistema está em operação. Um sistema com disponibilidade de 99.99% é dito um sistema com quatro 9s de disponibilidade. Note que trata-se de uma métrica adimensional. Abaixo uma tabela com exemplos de aplicações de quatro a seis 9 s de disponibilidade. Número de 9s Aplicação Indisponibilidade 99.9999% Controle de tráfego aéreo ~30 segundos / ano 99.999% Centrais telefônicas ~5 minutos / ano 99.99% Roteadores ~50 minutos / ano O cálculo da indisponibilidade é feito conforme apresentado a seguir: Disponibilidade = 0,99999 Indisponibilidade = 1 0,99999 = 1 * 10-5 Indisponibilidade em minutos por ano = (1-0,99999) * 365 dias * 24h * 60 min = 5,26 minutos/ano ~5 minutos/ano A indisponibilidade pode ser causada por falha ou congestionamento. Vamos considerar apenas a indisponibilidade causada por falha em recursos de rede. Dois requisitos fazem geralmente parte de Licitação e do Service Level Agreement (SLA) de operadoras: Indisponibilidade do usuário (ou do terminal): trata-se de paradas do sistema (falha, reiniciação do sistema, novos releases, etc) que afetam um ou um grupo de usuários mas NÃO afetam TODOS os usuários; Indisponibilidade do sistema (ou total): trata-se de paradas do sistema que afetam TODOS os usuários. As recomendações da UIT que tratam do assunto para redes de telefonia são: [Q543 93, Q541 93]. Existem outros requisitos de dependabilidade, e que podem ser encontrados nessas recomendações, e alguns exemplos são apresentados a seguir. Desligamento Prematuro A probabilidade de que um mau funcionamento ocasione uma interrupção da conexão estabelecida em qualquer intervalo de um minuto deve ser: P 2 * 10 5. Erro de Tarifação A probabilidade de que um mau funcionamento cause um erro na tarifação deve ser: P 1 * 10 4. 4
Roteamento Incorreto A probabilidade de que um mau funcionamento cause um erro de roteamento sendo válido o endereço de destino deve ser: : P 1 * 10 4. 5
QoS: Indisponibilidade O requisito de indisponibilidade de uma rede de comutação é especificado entre dois pontos de acesso. O modelo de rede para cálculo da indisponibilidade é representado por um grafo com nós e arcos. O nós representam os elementos de rede e os arcos os enlaces de interconexão. Figura 1: Exemplo de modelo de rede. A interconexão básica dos enlaces é do tipo série ou paralela. Toda rede malhada pode ser reduzida a expressões envolvendo conexões série/paralela por meio de manipulações nos arcos. Neste tutorial será apresentado um exemplo simples de rede e cálculo. Modelo Estrutural Na avaliação da indisponibilidade da rede, assume-se que: Os nós e enlaces poderão assumir dois estados: operacional e fora de serviço. A disponibilidade d é a probabilidade que o elemento esteja no estado operacional; A topologia da rede é conhecida, indicando como estão interligados os elementos de rede; Os elementos de rede são independentes do ponto de vista de funcionamento. O modelo supõe que a disponibilidade d é conhecida. A avaliação de d depende da taxa de falha dos componentes dos nós e enlaces de rede envolvidos, da sua configuração, se utiliza redundância, do esquema de manutenção, etc. A avaliação de d não é objetivo desse tutorial. Veja [Puki 98]. Para aumentar a disponibilidade entre dois quaisquer nós da rede vários esquemas de redundância são propostos: Redundância dos Nós: para aumentar a disponibilidade dos nós geralmente se usa redundância nos pontos centrais de funcionamento dos nós. É o caso de centrais telefônicas onde se duplicam elementos fundamentais ou se usa partição de carga permitindo a degradação suave do sistema; Redundância de Caminhos: no caso de redes de pacotes, para reduzir custo, geralmente os servidores não são redundantes. A solução é prover alternativas de conexão entre dois nós por meio de caminhos disjuntos, ou seja, sem elementos comuns. Assim, numa rede o elo fraco do ponto de vista de falha é o enlace porque geralmente não tem redundância. 6
Configuração Série Na configuração série a operação correta da rede depende da operação correta de todos os seus enlaces. O diagrama de bloco da configuração séria é mostrado na figura 2. Figura 2: Configuração série. Sejam di e ui respectivamente a disponibilidade e indisponibilidade do enlace i. A disponibilidade D dessa estrutura é dada pela expressão D = d1 * d2 * d3, onde di é a disponibilidade do enlace i. Se di = d=1 u,então para todo i: D = d³ = (1 u)³ U = 1 D = 1 (1 u)³ Configuração Paralela Na configuração paralela, vários enlaces conectam dois nós. O funcionamento correto do sistema será assegurado se pelo menos um enlace estiver funcionando corretamente. O diagrama de bloco da configuração paralela é mostrado na figura 3. Figura 3: Configuração paralela. A indisponibilidade U da configuração paralela é dada pela expressão: U = u1*u2*u3, onde ui é a indisponibilidade do enlace i. Se ui = u =1-d, então para todo i: U = u³ = (1 d)³ D = 1 U = 1 (1 d)³ Indisponibilidade de uma rede Como dito anteriormente, podemos representar uma rede por um grafo com nós (equipamentos de rede) e arcos (enlaces de comunicação). A disponibilidade dos equipamentos é geralmente bem maior que a dos enlaces e, portanto, a análise geralmente é feita considerando apenas o efeito da disponibilidade dos enlaces na disponibilidade pontoa-ponto da rede. Considere a rede representada pelo grafo abaixo, figura 4. 7
Figura 4: Exemplo de rede. Na rede apresentada, a disponibilidade do enlace é d, e u = 1 d é a sua indisponibilidade. Trata-se de uma rede malhada, cuja solução exige a decomposição de modo a se chegar a grafos na forma série / paralelo, como mostra a solução abaixo. Será usado o artifício de probabilidade condicional para chegar à expressão da indisponibilidade [Mont 99]: Sejam P(a) e P(b) as probabilidades dos eventos a e b, e b e b eventos mutuamente exclusivos. Então: P(a) = P(a b) * P(b) + P(a b ) * P(b ). Considerando como primeira escolha o enlace c. Esse enlace tem dois estados possíveis que são mutuamente independentes: disponível com probabilidade d ou indisponível com probabilidade u. Então: U(rede) = U(rede enlace c disponível) * d + U(rede enlace c indisponível) * u Se as redes resultantes da aplicação da condição do enlace c já são do tipo série / paralelo o processo termina. Caso contrário um novo enlace é escolhido e o procedimento reaplicado. No caso de redes complexas é necessário auxílio computacional. Para resolver a rede proposta vamos escolher o enlace que liga os nós intermediários 2 e 3, indicado na figura 5, como primeira escolha. Estado: enlace disponível. Figura 5: Primeira escolha. Nesse caso a conexão entre os nós 2 e 3 está sempre operacional e o grafo resultante é: 8
Figura 6: Enlace disponível. A expressão da indisponibilidade do grafo resultante é: U(rede enlace disponível) = 1 (1 (1 d)²)². Estado: enlace indisponível. Nesse caso a conexão entre os nós 2 e 3 está sempre aberta e o grafo resultante é um grafo série/paralelo. Figura 7: Enlace indisponível. A expressão da indisponibilidade do grafo resultante é: U(rede enlace indisponível) = (1-d²)². A expressão final da indisponibilidade da rede fica: U(rede) = {1 [1 (1 d)²]²} * d + (1 d²)² * (1 d). 9
QoS: Considerações Finais O conceito de Qualidade de Serviço, QoS, se traduz numa série de indicadores perceptíveis para o usuário que exigem a avaliação durante o planejamento de uma rede ou desenvolvimento de um equipamento. Nesse contexto os indicadores de dependabilidade traduzem o comportamento do sistema na presença de falhas. Ferramentas estatísticas e modelos matemáticos são necessários na avaliação dos indicadores de dependabilidade. Nesse tutorial apresentou-se uma forma de abordar o problema de avaliação da indisponibilidade pontoa-ponto em redes de telecomunicações. Referências [UIT www] http://www.itu.int/home/index.html [E800 94] E.800, Quality of Service and Dependability Vocabulary, ITU-TS, Ago. 94 [I350 93] I.350, General Aspects of QOS and NP in Digital Networks, including ISDNs, ITU-TS, Mar 93. [MORE 94] Moreira de Souza, J., Como especificar a qualidade de um produto de telecomunicações, 11o Congresso da SBT, Natal, Set. 94. [TEL www] http://www.telcordia.com/pssindex.html [ETSI www] http://www.etsi.org/ [Q543 93] Q.543, Digital Exchange Performance Design Objectives, ITU-TS, Mar 93. [Q541 93] Q.541, Digital Exchange Design Objectives General, ITU-TS,1993 [Puki 98] Pukite, Modeling for Reliability Analysis, IEEE Press, 1998. [Mont 99] Montgomery D.C., Runger G.C, Applied Statistics and Probability for Engineers, J. Wiley, 1999. 10
QoS: Teste seu Entendimento 1. Um sistema com disponibilidade de 99.9% tem uma indisponibilidade de: ~ 5 min por ano. ~9 min por ano. ~9 horas por ano. ~1 dia por ano. 2. O requisito de desligamento prematuro especifica uma probabilidade inferior ou igual a 2 x 10-5. Isso significa: Que a indiponibilidade deve ser de 2 min por ano. Que o número de chamadas com desligamento prematuro deve ser menor ou igual a 2 em 10000 chamadas. Que o número de chamadas com desligamento prematuro deve ser menor ou igual a 2 x 10-5 por ano. Que a indisponibilidade devido à chamadas com desligamento prematuro deve ser menor ou igual 2 x 10-5. 3. A dependabilidade: É uma medida de confiabilidade. Expressa a indisponibilidade do sistema. Expressa a Qualidade de Serviço associada ao sistema. Expressa, por meio de indicadores, o grau de confiança que o usuário pode ter no provimento do serviço. 4. A configuração em série está disponível: Se todos os elementos da configuração estão disponíveis. Se pelo menos um dos elementos da configuração está disponível. Dependendo da probabilidade condicional associada ao elemento. Se a disponibilidade "d" do elemento for menor que um determinado valor. 5. A indisponibilidade entre dois nós de uma rede: Depende apenas da topologia. Depende da redundância associado ao nós. Depende da topologia e da indisponibilidade dos nós e enlaces. Depende do interesse de tráfego entre os nós. 6. As recomendações de QoS tem por objetivo: Focar nos efeitos percebidos pelo usuário independentemente da configuração de rede. Ajudar nas soluções de rede. Focar nos efeitos percebidos pelo usuário em função da configuração de rede. Medir os indicadores de rede que afetam o usuário. 11
12