Política de Recursos Computacionais no Depto de Estatística da UFPR Paulo Justiniano Ribeiro Junior LEG - Laboratório de Estatística e Geoinformação Departamento de Estatística Universidade Federal do Paraná mailto:paulojus@est.ufpr.br http://www.est.ufpr.br/~paulojus Fiocruz, Rio de Janeiro, RJ, 03 Novembro 2004 1
Onde estávamos e Onde estamos Fiocruz, Rio de Janeiro, RJ, 03 Novembro 2004 2
1 Recursos em 2002 1.1 Onde estávamos - Hardware Micros de professores (+/- 20) LABEST: 13 PC s 100MHz, 32 RAM, HD 500 MB 13 PC s 500 MHz, 64 RAM, HD 10 GB 08 PC s de conf. variável (+/- 350 MHz, 64 RAM, HD 500 MB-2 GB) 1 servidora recursos internet (páginas web, email) 5 PC s administração Fiocruz, Rio de Janeiro, RJ, 03 Novembro 2004 3
2 Recursos em 2002 2.1 Onde estávamos - Software OS: Windows (98, NT) MS-Office Diversos programas estatísticos: SAS, EPI-Info, Statistica, SPSS, MatLab, S-PLUS, R, Minitab, Statgraphics, etc Fiocruz, Rio de Janeiro, RJ, 03 Novembro 2004 4
3 Recursos em 2004 3.1 Onde estamos - Hardware Micros de professores (+/- 20) LABEST: 16 PC s + 16 PC s + 16 PC s, todos transformados em terminais hardware obsoleto e variado a partir de 100Mhz, 16 RAM, sem HD (boot remoto) 1 servidora recursos internet (páginas web, email) 1+1 servidoras de boot, processamento, disco 5 PC s administração LEG: 10 PC s (conf. variadas) + 1 servidora (processamento,... ) Fiocruz, Rio de Janeiro, RJ, 03 Novembro 2004 5
4 Recursos em 2004 4.1 Onde estamos - Software Sistema Operacional Professores: Linux (local ou remoto) Professores: Windows (partição ou segundo HD, opcional, sem manutenção ) LABEST: somente Linux Administrativo: Windows + Linux LEG : somente Linux Aplicativos Linux: a princípio tudo disponível no Linux (Debian) Linux: Principais: OpenOffice, L A TEX, R + auxiliares (acrobat, gv, xemacs, compiladores, etc) Fiocruz, Rio de Janeiro, RJ, 03 Novembro 2004 6
5 Impacto em custos Para termos o recursos atuais: No modelo antigo: mais de R$60.000, 00 No modelo atual: +/- R$12.000, 00 comparação exclui valores de software Fiocruz, Rio de Janeiro, RJ, 03 Novembro 2004 7
6 Transição 2 anos Comissão de recursos computacionais - proposta Discussão, revisão e aprovação no Depto LABEST: Windows + pacote básico (6 meses) seguido de Linux total parceria com C3SL + suporte local + dicas Professores: Pacote básico mais Linux gradual LEG: só Linux Fiocruz, Rio de Janeiro, RJ, 03 Novembro 2004 8
Computação Estatística e O Projeto R Fiocruz, Rio de Janeiro, RJ, 03 Novembro 2004 9
7 Para que o R é usado? Impossível dizer pois é livremente disponível Listas e páginas-web dão dicas Palavras de um influente membro do R core team One of my main motivations for being involved is a (perhaps the) major use, to provide a first-class statistical system to students and researchers in the third world. Atualmente usado para análises estatísticas de larga escala Aplicações em micro-arrays - THE BIOCONDUCTOR PROJECT Pesquisadores em várias companhias estão desenvolvendo seus sistemas a partir do R. Fiocruz, Rio de Janeiro, RJ, 03 Novembro 2004 10
8 Alguns recursos - I Uso típico - linha de comando Mas há muito além disto... Rcgi, Rweb interfaces TCL/TK Rsciview, Rcmdr... projetos RGUI s em franca atividade Fiocruz, Rio de Janeiro, RJ, 03 Novembro 2004 11
9 Alguns recursos - II Pacotes : + de 300, atualizações frequentes Metodologias recentes/em pesquisa Patch diário Disponível como uma biblioteca compartilhada Interfaces com programas e linguagens, possibilidades diversas via integração com outros recursos Embedding reserva ao R o que ele tem de melhor: capacidade de produzir análises estatiticas e gráficos Fiocruz, Rio de Janeiro, RJ, 03 Novembro 2004 12
10 R é um projeto atípico R não tem um líder e se baseia no consenso entre o R core team Há áreas de expertise dentre estes Deferência especial com os fundadores Core team: modus operandi e diretrizes, encontros regulares (DSC meetings) e aparentemente excelente relacionamento Fiocruz, Rio de Janeiro, RJ, 03 Novembro 2004 13
11 Pontos fortes do projeto R é largamente usado por grupos em países onde um sistema comercial é proibitivo e roda bem em hardware quase obsoleto Desenvolve senso de apreciação pelo desenho de software e suporte Listas Quase todo contato por internet Fácil adição de novos aspectos pelo usuário Possibilidades didáticas Encontrou um bug: arrume a prossiga! Mais aspects de orientação a objetos nas novas versões Sinergia com DBMS s & mais uso/integração via XML Ênfase em compatibilidade com várias plataformas Fiocruz, Rio de Janeiro, RJ, 03 Novembro 2004 14
12 Uso do R no DEST/UFPR Como parte de Projeto De Recursos Computacionais no Apoio ao Ensino e Pesquisa. Concepção: projeto de baixíssimo custo com aproveitamente de hardware obsoleto, modelo cliente servidor, com uso exclusivo de programas gratuitos (e de preferência com código aberto), administração facilitada Básico: Linux + Openoffice + R + L A TEX Vantagens: distribuição livre, integração, multi-plataforma, arquivos de comandos Fiocruz, Rio de Janeiro, RJ, 03 Novembro 2004 15
13 R - resumindo Mercado de trabalho Multi-plataforma Qualidade do projeto Velocidade de assimilação de novas metodologias Reprodutibilidade Usuários transformam-se em programadores Cientista ou piloto de mouse? Olho no futuro - imediatismo vs políticas estratégicas Mentalidade irreversível Fiocruz, Rio de Janeiro, RJ, 03 Novembro 2004 16
14 Ciência Medieval Ciência e software livre Instituições públicas e software livre Implementação de Cultura local Resistência dos usuários: o mito é maior que o fato! Fiocruz, Rio de Janeiro, RJ, 03 Novembro 2004 17