UNIVERSIDADE FEDERAL DE PERNAMBUCO Mestrado em Ciência da Computação CENTRO DE INFORMÁTICA Análise comparativa entre os diferentes tipos De protocolos para transmissão de dados Grupo: Professora: Disciplina: Daniel Brito Oliveira Carvalho Igor Marcel Leal de Morais José Ivson Soares da Silva Thyago Neves Porpino Renata Cardoso Princípios e Técnicas da Análise Estatística Experimental
1. Introdução Na era da internet das coisas, tudo precisa estar conectado o tempo todo. Essa necessidade pelo conteúdo sempre presente demanda que as informações sejam trocadas na velocidade mais rápida possível [1]. O usuário não quer esperar para saber sobre o trânsito, jogo ou notícia. Nesse contexto, em que a troca de dados torna-se uma questão essencial é necessário que haja protocolos para atender aos mais diversos tipos de tráfegos. Para tal, existem alguns protocolos que se fazem mais presentes e que podem atender ao requisito de realizar o envio da informação. Alguns exemplos desses protocolos são: FTP (File Transfer Protocol), TFTP (Trivial File Transfer Protocol), HTTP (Hypertext Transfer Protocol) e o SCP (Secure Copy). O FTP, como o próprio nome diz, foi desenvolvido para que fosse usado em transferências de arquivo [2]. Juntamente com o HTTP são os protocolos mais conhecidos entre os usuários da internet. Diferentemente dos descritos anteriormente, o SCP utiliza-se do SSH (Secure Shell) para realizar o envio de informação. Já o TFTP, semelhante ao FTP, é muito utilizado para realizar transferência de pequenos ficheiros entre os usuários de uma rede [3]. Com uma variedade grande de possibilidades para a transferência de arquivos é importante que se tenha conhecimento sobre o comportamento dos protocolos para que a melhor escolha seja feita. No caso do tráfego em uma rede local, seja para fins de backup, controle de versão ou compartilhamento de arquivos, torna-se bastante necessária. Quanto menor o tempo de utilização da rede, menor o tráfego e consequentemente maior é a banda disponível [4]. A rapidez no envio alia-se à urgência que os arquivos têm que estar para os destinatários. 1.1 Objetivos O principal objetivo deste trabalho é realizar análises acerca do tempo que os protocolos FTP, TFTP, SCP e HTTP demandam para realizar a transferência de arquivo em uma rede local. Através da informação do tempo podem ser feitas algumas elucidações sobre o protocolo que é mais indicado de acordo com o tamanho do arquivo a ser enviado. Podem ocorrer situações em que não haverá diferença na utilização de certos protocolos em detrimento de outros.
Os resultados do experimento serão interessantes para que uma rede possa ser mais bem gerenciada e eficiente quanto possível. 1.2 Metodologia Para a realização dos testes, foram definidos três tamanhos de arquivos, sendo esses: pequeno (1 MB), médio (256 MB) e grande (512 MB). Um nó da rede foi configurado como servidor em ambiente Ubuntu Linux 10.04 com o kernel 2.6.32-33, possuindo desta forma as respectivas configurações para os protocolos FTP, TFTP, SCP e HTTP. Outro nó da rede, desta vez como cliente em ambiente Ubuntu Linux 12.10 com o kernel 3.5.0.18, faz a requisição para o servidor em cada um dos quatro protocolos. Para cada protocolo, é realizado o experimento 40 vezes com o tamanho de arquivo fixado. O experimento é realizado em uma rede local, onde todo o tráfego tem que obrigatoriamente passar por um roteador. O ambiente é controlado permitindo que cada teste seja realizado dentro do mesmo contexto. Com os dados coletados, foram desenhados gráficos boxplot e histograma para verificar o comportamento de cada um dos protocolos. Após isso, foram realizados os testes de hipótese em pares de amostra de arquivos com mesmo tamanho, mas com protocolos distintos. Com isso, pôde ser verificado se o tempo médio das amostras mostrava diferença significativa entre os protocolos testados. 2. Avaliação da normalidade dos dados Logo após os dados dos experimentos serem coletados é interessante que haja verificação quanto à normalidade dos dados, ou seja, se a amostra apresenta um comportamento semelhante à distribuição normal. A partir dessa constatação, os testes de hipóteses podem ser realizados. Para a verificação quanto à normalidade das amostras, foi utilizada a ferramenta R Project [5]. Inicialmente, foram desenhados alguns gráficos, como o histograma, Q-Q plot e boxplot, para que pudesse haver uma melhor análise em relação aos dados. A partir disso, pode-se ter uma ideia mais clara sobre a normalidade dos dados. Como o experimento possui muitas amostras é importante que a verificação da normalidade seja feita em cada uma dessas amostras. Para cada protocolo têm-se três
tamanhos de arquivo e todos eles passarão pelo teste de normalidade. Assim que todas as verificações forem feitas pode-se começar a próxima etapa. 2.1 Arquivos de 1 MB Na Figura 1 estão presentes os gráficos relativos ao protocolo FTP com tamanho de arquivo de 1 MB. Existem evidências que essa amostra não segue uma distribuição normal. Primeiramente, na Figura 1a, os dados não seguem nem se aproximam da linha diagonal teórica que deveria cruzar todo o gráfico, mostrando que os dados divergem muito da normalidade. Logo depois, na Figura 1b, os dados não acompanham o formato de sino, que é característica da distribuição normal. Por fim, na Figura 1c, não existe simetria ao redor da média.
Figura 1 - Gráficos indicadores da distribuição dos dados para o procolo FTP com tamanho de arquivo de 1 MB. Q-Q plot. Histograma. Boxplot. A Figura 2 mostra os gráficos relativos ao protocolo SCP com tamanho de arquivo de 1 MB. Assim como ocorreu na Figura 1, existem evidências que essa amostra não segue uma distribuição normal. Primeiramente, na Figura 2a os dados não seguem nem se aproximam da linha diagonal teórica que deveria cruzar todo o gráfico, mostrando que os dados divergem muito da normalidade. Logo depois, na Figura 2b, os dados não acompanham o formato de sino, que é característica da distribuição normal. Por fim, na Figura 2c, não existe simetria ao redor da média. Figura 2 - Gráficos indicadores da distribuição dos dados para o procolo SCP com tamanho de arquivo de 1 MB. Q-Q plot. Histograma. Boxplot. A Figura 3 mostra os gráficos relativos ao protocolo TFTP com tamanho de arquivo de 1 MB. Assim como apresentado nas figuras anteriores, há evidências que
essa amostra não segue uma distribuição normal. Na Figura 3a, os dados não seguem nem se aproximam da linha diagonal teórica que deveria cruzar todo o gráfico, mostrando que os dados divergem muito da normalidade. Além disso, na Figura 3b, os dados não possuem a simetria em relação ao ponto central. Por fim, na Figura 3c, não existe a simetria esperada ao redor da média. Figura 3 - Gráficos indicadores da distribuição dos dados para o procolo TFTP com tamanho de arquivo de 1 MB. Q-Q plot. Histograma. Boxplot. A Figura 4 mostra os gráficos relativos ao protocolo HTTP com tamanho de arquivo de 1 MB. Assim como apresentado nas figuras anteriores, há evidências que essa amostra não segue uma distribuição normal. Na Figura 4a os dados não seguem nem se aproximam da linha diagonal teórica que deveria cruzar todo o gráfico, mostrando que os dados divergem muito da normalidade. Além disso, na Figura 4b, os
dados não possuem a simetria em relação ao ponto central. Por fim, na Figura 4c, não existe a simetria esperada ao redor da média. Figura 4 - Gráficos indicadores da distribuição dos dados para o procolo HTTP com tamanho de arquivo de 1 MB. Q-Q plot. Histograma. Boxplot. 2.2 Arquivos de 256 e 512 MB Os arquivos de 256 e 512 MB possuem muita similaridade com o que foi apresentado em relação aos arquivos de 1 MB. Os gráficos presentes em ambos demonstram a não normalidade dos dados do experimento. Para uma melhor visualização os gráficos foram agrupados pelos tipos.
2.2.1 Histogramas Os histogramas de todos os protocolos, conforme mostrados nas (d) Figura 5 e Figura 6, apresentam comportamento que destoa de amostras que seguem uma distribuição normal, por não apresentar a forma de sino. (d) Figura 5 Histogramas dos protocolos de transferências de dados de 256 MB. FTP. HTTP. TFTP. (d) SCP.
(d) Figura 6 Histogramas dos protocolos de transferências de dados de 512 MB. FTP. HTTP. TFTP. (d) SCP. 2.2.2 Q-Q Plot Os gráficos referentes ao Q-Q plot, presentes nas Figura 7 e Figura 8, possuem a distribuição de seus pontos não muito próximos a linha imaginária diagonal que deveria cobrir grande parte dos pontos. Apenas a Figura 8c, protocolo TFTP com arquivos de tamanho 512 MB, apresenta um comportamento que se assemelha a uma distribuição normal.
(d) Figura 7 - Q-Q Plot dos protocolos de transferências de dados de 256 MB. FTP. HTTP. TFTP. (d) SCP.
(d) Figura 8 - Q-Q Plot dos protocolos de transferências de dados de 512 MB. FTP. HTTP. TFTP. (d) SCP. 2.2.3 Boxplot Os gráficos Boxplot, mostrados nas Figura 9 e Figura 10, possuem assimetria em relação à media na maior parte deles, inclusive, com vários outliers. Apenas a Figura 10c, referente ao TFTP com arquivos de tamanho 512 MB, apresenta característica a simetria apresentado por distribuições normais.
(d) Figura 9 - Boxplot dos protocolos de transferências de dados de 256 MB. FTP. HTTP. TFTP. (d) SCP. (d) Figura 10 - Boxplot dos protocolos de transferências de dados de 512 MB. FTP. HTTP. TFTP. (d) SCP.
Ao realizar o teste de kolmogorov no TFTP com arquivo de tamanho 512 MB foi constatado que apresentava uma distribuição normal. No entanto, como grande parte das amostras não são normais, optou-se pela utilização de testes não paramétricos. 3. Comparação entre os protocolos Para comparar a média dos tempos de transmissão de cada protocolo, realizamos testes de Wilcoxon Mann-Whitney, comparando os protocolos dois a dois. A hipótese nula usada em todos os testes foi a seguinte: onde representa a média do tempo de transmissão de um dos protocolos analisados. Já a hipótese alternativa, foi escolhida da forma que para qualquer teste onde não se avalie o protocolo TFTP, utiliza-se caso contrário, utiliza-se O motivo para isto, é que enquanto os outros protocolos possuem resultados parecidos, o TFTP parece possuir tempos maiores que os demais, vide Tabela 1. Desta forma, queremos avaliar se existem indícios que os outros protocolos sejam mais rápidos que ele na transferência dos arquivos. Tabela 1 Tempo médio de transmissão dos protocolos em relação ao tamanho do arquivo. Tempo médio de transmissão 1MB 256MB 512MB HTTP 0,089 23,876 47,668 FTP 0,101 23,983 47,958 SCP 0,200 23,125 48,250 TFTP 1,168 298,870 632,245 Os testes foram realizados tomando por base o nível de significância igual a 0,05. As Tabela 2, Tabela 3 e Tabela 4 apresentam os resultados relacionados aos arquivos de tamanho 1 MB, 256 MB e 512 MB com seus respectivos p-values.
Tabela 2 - Resultados do teste de Wilcoxon para transferência de arquivo com 1 MB. HTTP x FTP HTTP X SCP FTP x SCP HTTP x TFTP FTP x TFTP SCPxTFTP p-value 2.847e-08 1.094e-06 1.828e-06 9.315e-16 3.345e-15 3.719e-16 Hipótese nula rejeição rejeição rejeição rejeição rejeição rejeição Tabela 3 - Resultados do teste de Wilcoxon para transferência de arquivo com 256 MB. HTTP x FTP HTTP X SCP FTP x SCP HTTP x TFTP FTP x TFTP SCPxTFTP p-value 0.02531 2.021e-09 1.247e-09 3.285e-15 7.143e-15 5.849e-16 Hipótese nula rejeição rejeição rejeição rejeição rejeição rejeição Tabela 4 - Resultados do teste de Wilcoxon para transferência de arquivo com 512 MB. HTTP x FTP HTTP X SCP FTP x SCP HTTP x TFTP FTP x TFTP SCPxTFTP p-value 0.9191 0.2047 0.04088 5.271e-15 2.2e-16 5.406e-15 Hipótese nula Falha na rejeição Falha na rejeição rejeição rejeição rejeição rejeição Como pôde ser visto nos resultados apresentados anteriormente, para arquivos com tamanhos menores que 512 MB, os protocolos para transferência de arquivos apresentam uma diferença significativa. Desta forma, não se pode dizer que eles possuem tempos de transferência iguais. Uma das possíveis causas para essa discrepância, é que o teste de Wilcoxon é influenciado também pelo formato das distribuições, e não só pelas suas posições. Já para arquivos de tamanho de 512 MB, existem indícios para dizer que o HTTP e o FTP apresentam comportamentos muito semelhantes, ou seja, possuem tempos de transferência bastante parecidos. Isso se comprova na falha em rejeitar a hipótese nula. Além dessa relação, o HTTP e o SCP também possuem tempos de transferência parecidos, como pode ser visto pela falha em rejeitar a hipótese nula. As demais relações mostraram possuir diferenças no tempo de transmissão dos dados. Todas as conclusões puderam ser obtidas com um nível de confiança de 95%. Referências [1] Y. Huang e G. Liu, Descriptive models for Internet of Things, International Conference on Intelligent Control and Information Processing (ICICIP), pp. 483-486,
2010. [2] L. Xia, F. Chao-sheng, Y. Ding e W. Can, Design of secure FTP system, International Conference on Communications Circuits and Systems (ICCCAS), pp. 270-273, 2010. [3] M. A. M. Isa, N. N. Mohamed, H. Hashim, S. F. S. Adnan, J. A. Manan e R. Mahmod, A lightweight and secure TFTP protocol for smart environment, IEEE Symposium on Computer Applications and Industrial Electronics (ISCAIE), pp. 302-306, 2012. [4] T. Shan e O. W. W. Yang, Bandwidth Management for Supporting Differentiated Service Aware Traffic Engineering, IEEE Transactions on Parallel and Distributed Systems, pp. 1320-1331, 2007. [5] R Project. http://www.r-project.org/.