Relatório 2 para a reunião 04 do grupo de otimização do mach2d

Tamanho: px
Começar a partir da página:

Download "Relatório 2 para a reunião 04 do grupo de otimização do mach2d"

Transcrição

1 Relatório 2 para a reunião 04 do grupo de otimização do mach2d Nome: Diego Fernando Moro Data: 15 a 16/10/12 Índice: A Avaliação do efeito de dt usando diferentes dt s e solvers : Pág.1 B OTIMIZAÇÃO DAS SUBROTINAS DO MACH2D USANDO O PROGRAMA Intel(R) VTune(TM) Performance Analyzer 9.1 : Pág. 9 C - RESUMO DAS modificações : Pág. 22 D - REFINO PG : Pág. 23 E - CONCLUSÕES : Pág. 26 A Avaliação do efeito de dt usando diferentes dt s e solvers. Microcomputador utilizado: Intel Core i5-2450m 2,5 GHz 4 GB de memória RAM HD de 750 GB PARAMETROS 1 Utilizou-se nas tabelas a seguir os seguintes parâmetros: - imax = 1 - nitm_u = nitm_p = 4 - tolu = tolp = 1d-2 - num = 1 - kg = coord = 1 - modvis = modtur = cctw = 0 - beta = 0.d0 - Solver variável: MSI puro (0), TDMAXY (1), TDMAX (2), MSI e TDMAX (3), MSI e GS(4) - Critério de parada: Erro de máquina para a variação de Fd* - MALHA DE 56 x 20 NÓS Tabela 1 Malha de 56x20 nós, Tempo TEMPO por ESQUEMA (s) 5.00E-05 NC NC NC NC NC Back.01_X_ E NC NC Back.01_X_ E NC NC Back.01_X_ E NC Back.01_X_ E NC Tabela 2 Malha de 56x20 nós, It it por ESQUEMA 5.00E-05 NC NC NC NC NC Back.01_X_ E NC NC Back.01_X_ E NC NC Back.01_X_ E NC Back.01_X_ E NC

2 Tabela 3 Malha de 56x20 nós, Cd Cd por ESQUEMA 5.00E-05 NC NC NC NC NC Back.01_X_ E E+00 NC NC E E+00 Back.01_X_ E E+00 NC NC E E+00 Back.01_X_ E E E+00 NC E E+00 Back.01_X_ E E E+00 NC E E+00 Tabela 4 Malha de 56x20 nós, Fd* Fd* por ESQUEMA 5.00E-05 NC NC NC NC NC Back.01_X_ E E-01 NC NC E E-01 Back.01_X_ E E-01 NC NC E E-01 Back.01_X_ E E E-01 NC E E-01 Back.01_X_ E E E-01 NC E E-01 Tabela 5 Malha de 56x20 nós, d(fd*) d(fd*) por ESQUEMA 5.00E-05 NC NC NC NC NC Back.01_X_ E E+00 NC NC E E+00 Back.01_X_ E E+00 NC NC E E+00 Back.01_X_ E E E+00 NC E E+00 Back.01_X_ E E E+00 NC E E+00 - MALHA DE 112 x 40 NÓS Tabela 6 Malha de 112x40 nós, Tempo TEMPO por ESQUEMA (s) 3.00E-05 NC NC NC NC NC Back.02_X_ E NC NC Back.02_X_ E NC NC Back.02_X_ E NC NC Back.02_X_ E NC NC Tabela 7 Malha de 112x40 nós, It it por ESQUEMA 3.00E-05 NC NC NC NC NC Back.02_X_ E NC NC Back.02_X_ E NC NC Back.02_X_ E NC NC Back.02_X_ E NC NC Tabela 8 Malha de 112x40 nós, Cd Cd por ESQUEMA 3.00E-05 NC NC NC NC NC Back.02_X_ E E+00 NC NC E E+00 Back.02_X_ E E+00 NC NC E E+00 Back.02_X_ E E+00 NC NC E E+00 Back.02_X_ E E+00 NC NC E E+00 2

3 Tabela 9 Malha de 112x40 nós, Fd* Fd* por ESQUEMA 3.00E-05 NC NC NC NC NC Back.02_X_ E E-01 NC NC E E-01 Back.02_X_ E E-01 NC NC E E-01 Back.02_X_ E E-01 NC NC E E-01 Back.02_X_ E E-01 NC NC E E-01 Tabela 10 Malha de 112x40 nós, d(fd*) d(fd*) por ESQUEMA 3.00E-05 NC NC NC NC NC Back.02_X_ E E+00 NC NC E E+00 Back.02_X_ E E+00 NC NC E E+00 Back.02_X_ E E+00 NC NC E E+00 Back.02_X_ E E+00 NC NC E E+00 - MALHA DE 224 x 80 NÓS Tabela 11 Malha de 224x80 nós, Tempo TEMPO por ESQUEMA (s) 2.00E-05 NC NC NC NC NC Back.03_X_ E NC NC Back.03_X_ E NC NC Back.03_X_ E NC NC Back.03_X_ E NC NC Tabela 12 Malha de 224x80 nós, It it por ESQUEMA 2.00E-05 NC NC NC NC NC Back.03_X_ E NC NC Back.03_X_ E NC NC Back.03_X_ E NC NC Back.03_X_ E NC NC Tabela 13 Malha de 224x80 nós, Cd Cd por ESQUEMA 2.00E-05 NC NC NC NC NC Back.03_X_ E E+00 NC NC E E+00 Back.03_X_ E E+00 NC NC E E+00 Back.03_X_ E E+00 NC NC E E+00 Back.03_X_ E E+00 NC NC E E+00 Tabela 14 Malha de 224x80 nós, Fd* Fd* por ESQUEMA 2.00E-05 NC NC NC NC NC Back.03_X_ E E-01 NC NC E E-01 Back.03_X_ E E-01 NC NC E E-01 Back.03_X_ E E-01 NC NC E E-01 Back.03_X_ E E-01 NC NC E E-01 3

4 Tabela 15 Malha de 224x80 nós, d(fd*) d(fd*) por ESQUEMA 2.00E-05 NC NC NC NC NC Back.03_X_ E E+00 NC NC E E+00 Back.03_X_ E E+00 NC NC E E-16 Back.03_X_ E E+00 NC NC E E+00 Back.03_X_ E E+00 NC NC E E+00 - MALHA DE 448 x 160 NÓS Tabela 16 Malha de 448x160 nós, Tempo TEMPO por ESQUEMA (s) 6.00E-06 NC NC NC NC NC Back.04_X_ E NC NC Tabela 17 Malha de 448x160 nós, It it por ESQUEMA 6.00E-06 NC NC NC NC NC Back.04_X_ E NC NC Tabela 18 Malha de 448x16nós, Cd Cd por ESQUEMA 6.00E-06 NC NC NC NC NC Back.04_X_ E E+00 NC NC E E+00 Tabela 19 Malha de 448x160 nós, Fd* Fd* por ESQUEMA 6.00E-06 NC NC NC NC NC Back.04_X_ E E-01 NC NC E E-01 Tabela 20 Malha de 448x160 nós, d(fd*) d(fd*) por ESQUEMA 6.00E-06 NC NC NC NC NC Back.04_X_ E E+00 NC NC E E+00 PARAMETROS 2 Utilizou-se nas tabelas a seguir os seguintes parâmetros: - imax = 2 - nitm_u = nitm_p = 4 - tolu = 1d-1 - tolp = 1d-2 - num = 1 4

5 - kg = coord = 1 - modvis = modtur = cctw = 0 - beta = 0.d0 Critério de parada: Erro de máquina para a variação de Fd* - MALHA DE 56 x 20 NÓS Tabela 21 Malha de 56x20 nós, Tempo TEMPO por ESQUEMA (s) 5.00E-05 NC NC NC NC NC Back2.01_X_ E NC Back2.01_X_ E NC Back2.01_X_ E NC Back2.01_X_ E Tabela 22 Malha de 56x20 nós, It it por ESQUEMA 5.00E-05 NC NC NC NC NC Back2.01_X_ E NC Back2.01_X_ E NC Back2.01_X_ E NC Back2.01_X_ E Tabela 23 Malha de 56x20 nós, Cd Cd por ESQUEMA 5E-05 NC NC NC NC NC Back2.01_X_01 4E E E+00 NC E E+00 Back2.01_X_02 3E E E+00 NC E E+00 Back2.01_X_03 2E E E+00 NC E E+00 Back2.01_X_04 1E E E E E E+00 Tabela 24 Malha de 56x20 nós, Fd* Fd* por ESQUEMA 5.00E-05 NC NC NC NC NC Back2.01_X_ E E E-01 NC E E-01 Back2.01_X_ E E E-01 NC E E-01 Back2.01_X_ E E E-01 NC E E-01 Back2.01_X_ E E E E E E-01 Tabela 25 Malha de 56x20 nós, d(fd*) d(fd*) por ESQUEMA 5.00E-05 NC NC NC NC NC Back2.01_X_ E E E+00 NC E E+00 Back2.01_X_ E E E+00 NC E E+00 Back2.01_X_ E E E+00 NC E E+00 Back2.01_X_ E E E E E E+00 5

6 - MALHA DE 112 x 40 NÓS Tabela 26 Malha de 112x40 nós, Tempo TEMPO por ESQUEMA (s) 3.00E-05 NC NC NC NC NC Back2.02_X_ E NC NC Back2.02_X_ E NC Back2.02_X_ E NC Back2.02_X_ E NC Tabela 27 Malha de 112x40 nós, It it por ESQUEMA 3.00E-05 NC NC NC NC NC Back2.02_X_ E NC NC Back2.02_X_ E NC Back2.02_X_ E NC Back2.02_X_ E NC Tabela 28 Malha de 112x40 nós, Cd Cd por ESQUEMA 3.00E-05 NC NC NC NC NC Back2.02_X_ E E+00 NC NC E E+00 Back2.02_X_ E E E+00 NC E E+00 Back2.02_X_ E E E+00 NC E E+00 Back2.02_X_ E E E+00 NC E E+00 Tabela 29 Malha de 112x40 nós, Fd* Fd* por ESQUEMA 3.00E-05 NC NC NC NC NC Back2.02_X_ E E-01 NC NC E E-01 Back2.02_X_ E E E-01 NC E E-01 Back2.02_X_ E E E-01 NC E E-01 Back2.02_X_ E E E-01 NC E E-01 Tabela 30 Malha de 112x40 nós, d(fd*) d(fd*) por ESQUEMA 3.00E-05 NC NC NC NC NC Back2.02_X_ E E+00 NC NC E E+00 Back2.02_X_ E E+00 NC NC E E+00 Back2.02_X_ E E+00 NC NC E E+00 Back2.02_X_ E E+00 NC NC E E+00 - MALHA DE 224 x 80 NÓS Tabela 31 Malha de 224x80 nós, Tempo TEMPO por ESQUEMA (s) 2.00E-05 NC NC NC NC NC Back2.03_X_ E NC NC Back2.03_X_ E NC NC Back2.03_X_ E NC NC Back2.03_X_ E NC NC

7 Tabela 32 Malha de 224x80 nós, It it por ESQUEMA 2.00E-05 NC NC NC NC NC Back2.03_X_ E NC NC Back2.03_X_ E NC NC Back2.03_X_ E NC NC Back2.03_X_ E NC NC Tabela 33 Malha de 224x80 nós, Cd Cd por ESQUEMA 2.00E-05 NC NC NC NC NC Back2.03_X_ E E+00 NC NC E E+00 Back2.03_X_ E E+00 NC NC E E+00 Back2.03_X_ E E+00 NC NC E E+00 Back2.03_X_ E E+00 NC NC E E+00 Tabela 34 Malha de 224x80 nós, Fd* Fd* por ESQUEMA 2.00E-05 NC NC NC NC NC Back2.03_X_ E E-01 NC NC E E-01 Back2.03_X_ E E-01 NC NC E E-01 Back2.03_X_ E E-01 NC NC E E-01 Back2.03_X_ E E-01 NC NC E E-01 Tabela 35 Malha de 224x80 nós, d(fd*) d(fd*) por ESQUEMA 2.00E-05 NC NC NC NC NC Back2.03_X_ E E+00 NC NC E E+00 Back2.03_X_ E E+00 NC NC E E+00 Back2.03_X_ E E+00 NC NC E E+00 Back2.03_X_ E E+00 NC NC E E+00 - MALHA DE 448 x 160 NÓS Tabela 36 Malha de 448x160 nós, Tempo TEMPO por ESQUEMA (s) 6.00E-06 NC NC NC NC NC Back2.04_X_ E NC NC Back2.04_X_ E NC NC Tabela 37 Malha de 448x160 nós, It it por ESQUEMA 6.00E-06 NC NC NC NC NC Back2.04_X_ E NC NC Back2.04_X_ E NC NC

8 Tabela 38 Malha de 448x16nós, Cd Cd por ESQUEMA 6.00E-06 NC NC NC NC NC Back2.04_X_ E E-01 NC NC E E-01 Back2.04_X_ E E-01 NC NC E E-01 Tabela 39 Malha de 448x160 nós, Fd* Fd* por ESQUEMA 6.00E-06 NC NC NC NC NC Back2.04_X_ E E-01 NC NC E E-01 Back2.04_X_ E E-01 NC NC E E-01 Tabela 40 Malha de 448x160 nós, d(fd*) d(fd*) por ESQUEMA 6.00E-06 NC NC NC NC NC Back2.04_X_ E E+00 NC NC E E+00 Back2.04_X_ E E+00 NC NC E E+00 8

9 B - OTIMIZAÇÃO DAS SUBROTINAS DO MACH2D USANDO O PROGRAMA Intel(R) VTune(TM) Performance Analyzer 9.1 Microcomputador utilizado: CFD-6 Intel Core 2 Duo E6700-2,66 GHz 8 GB de memória RAM HD de 160 GB A variável que é analisada aqui é o CPU_CLK_UNHALTED events. Ela significa o número de ciclos de clock que a subrotina utiliza, no total. Se este valor for alto, isto significa que a subrotina leva muitos ciclos de clock, ou seja, ela pode ser otimizada, não necessáriamente lenta. - Para este estudo utilizou-se uma malha de 224x80 nós, dt=1d-5, itmax=1000, imax=2, nitm_u=nitm_p=4, tolu=1d-1, tolp=1d-2, solver = MSI 1)Versão GB_2012_10_01, simulação: SEN03_0001 Figura 1 Versão original *** Efficiency: numerical solution 2D / analytic Q1D (dimensionless) *** E+00 = discharge coefficient E-01 = dynamic thrust E-01 = pressure thrust at sea level (p = Pa) E+00 = pressure thrust in the vacuum E-01 = total thrust at sea level E-01 = total thrust in the vacuum E-01 = thrust coefficient at sea level E-01 = thrust coefficient in the vacuum E-01 = characterist velocity E-01 = velocity of efective ejection at sea level E-01 = velocity of efective ejection in the vacuum E-01 = specific impulse at sea level E-01 = specific impulse at vacuum = tcpuo: acumulated CPU time (s) (before interuption) 9

10 = dtcpu: CPU time (s) (after interuption) = tcpu: total CPU time (s) 2)Versão com algumas modificações no 'main.f90' : SEN03_0002 Figura 2 Versão modificada *** Efficiency: numerical solution 2D / analytic Q1D (dimensionless) *** E+00 = discharge coefficient E-01 = dynamic thrust E-01 = pressure thrust at sea level (p = Pa) E+00 = pressure thrust in the vacuum E-01 = total thrust at sea level E-01 = total thrust in the vacuum E-01 = thrust coefficient at sea level E-01 = thrust coefficient in the vacuum E-01 = characterist velocity E-01 = velocity of efective ejection at sea level E-01 = velocity of efective ejection in the vacuum E-01 = specific impulse at sea level E-01 = specific impulse at vacuum = tcpuo: acumulated CPU time (s) (before interuption) = dtcpu: CPU time (s) (after interuption) = tcpu: total CPU time (s) 3)Versão com multiplicação por número constante nas subrotinas, ao invés de divisão e variáveis auxiliares para armazenamento do índice: SEN03_

11 Figura 3 Versão modificada *** Efficiency: numerical solution 2D / analytic Q1D (dimensionless) *** E+00 = discharge coefficient E-01 = dynamic thrust E-01 = pressure thrust at sea level (p = Pa) E+00 = pressure thrust in the vacuum E-01 = total thrust at sea level E-01 = total thrust in the vacuum E-01 = thrust coefficient at sea level E-01 = thrust coefficient in the vacuum E-01 = characterist velocity E-01 = velocity of efective ejection at sea level E-01 = velocity of efective ejection in the vacuum E-01 = specific impulse at sea level E-01 = specific impulse at vacuum = tcpuo: acumulated CPU time (s) (before interuption) = dtcpu: CPU time (s) (after interuption) = tcpu: total CPU time (s) 4)SUBROTINA: COEFFICIENTS_mp_GET_T_COEFFICIENTS_AND_SOURCE: SEN03_0004 Utilizando-se uma variável auxiliar chamada inv_dt, que é a inversa de dt. Utilizou-se assim, a multiplicação por inv_dt ao invés de divisão (que consome mais tempo computacional). Houve uma redução de 7,544,780,000 ciclos de clock para 6,963,592,000. A rotina que utilizava 4,79% do tempo total, agora utiliza 4,43%. 11

12 Figura 4 Antes da Otimização Figura 5 Depois da otimização *** Efficiency: numerical solution 2D / analytic Q1D (dimensionless) *** E+00 = discharge coefficient E-01 = dynamic thrust E-01 = pressure thrust at sea level (p = Pa) E+00 = pressure thrust in the vacuum E-01 = total thrust at sea level E-01 = total thrust in the vacuum 12

13 E-01 = thrust coefficient at sea level E-01 = thrust coefficient in the vacuum E-01 = characterist velocity E-01 = velocity of efective ejection at sea level E-01 = velocity of efective ejection in the vacuum E-01 = specific impulse at sea level E-01 = specific impulse at vacuum = tcpuo: acumulated CPU time (s) (before interuption) = dtcpu: CPU time (s) (after interuption) = tcpu: total CPU time (s) 5)SUBROTINA: COEFFICIENTS_mp_GET_INTERNAL_SIMPLEC_COEFFICIENTS: SEN03_0005 Dividiu-se o cálculo em 2: um ciclo para encontrar a soma dos coeficientes au e av e outros dois ciclos para o cálculo. Foi criado 2 vetores, soma_au e soma_av, que são utilizados nos cálculos. Houve uma redução de 6,291,760,000 ciclos de clock para 4,668,166,000. A rotina que utilizava 4,00% do tempo total, agora utiliza 2,99%. Figura 6 Antes da Otimização 13

14 Figura 7 Depois da otimização *** Efficiency: numerical solution 2D / analytic Q1D (dimensionless) *** E+00 = discharge coefficient E-01 = dynamic thrust E-01 = pressure thrust at sea level (p = Pa) E+00 = pressure thrust in the vacuum E-01 = total thrust at sea level E-01 = total thrust in the vacuum E-01 = thrust coefficient at sea level E-01 = thrust coefficient in the vacuum E-01 = characterist velocity E-01 = velocity of efective ejection at sea level E-01 = velocity of efective ejection in the vacuum E-01 = specific impulse at sea level E-01 = specific impulse at vacuum = tcpuo: acumulated CPU time (s) (before interuption) = dtcpu: CPU time (s) (after interuption) = tcpu: total CPU time (s) 6)SUBROTINA: COEFFICIENTS_mp_GET_VELOCITIES_AT_FACES: SEN03_0006 Utilizando-se uma variável auxiliar chamada inv_dt, que é a inversa de dt. Utilizou-se assim, a multiplicação por inv_dt ao invés de divisão (que consome mais tempo computacional). Houve uma redução de 26,308,088,000 ciclos de clock para 24,695,158,000. A rotina que utilizava 16,73% do tempo total, agora utiliza 16,00%. 14

15 Figura 8 Antes da Otimização Figura 9 Depois da otimização *** Efficiency: numerical solution 2D / analytic Q1D (dimensionless) *** E+00 = discharge coefficient E-01 = dynamic thrust E-01 = pressure thrust at sea level (p = Pa) 15

16 E+00 = pressure thrust in the vacuum E-01 = total thrust at sea level E-01 = total thrust in the vacuum E-01 = thrust coefficient at sea level E-01 = thrust coefficient in the vacuum E-01 = characterist velocity E-01 = velocity of efective ejection at sea level E-01 = velocity of efective ejection in the vacuum E-01 = specific impulse at sea level E-01 = specific impulse at vacuum = tcpuo: acumulated CPU time (s) (before interuption) = dtcpu: CPU time (s) (after interuption) = tcpu: total CPU time (s) 7)SUBROTINA: COEFFICIENTS_mp_GET_VELOCITIES_AT_FACES: SEN03_0007 Foi indexado a variável mp, agora usa-se apenas mpa(np), mpa(npe) e mpa(npn). Houve uma redução de 24,695,158,000 ciclos de clock para 24,100,640. A rotina que utilizava 16,00% do tempo total, agora utiliza 15,68%. Figura 10 Antes da Otimização 16

17 Figura 11 Depois da otimização *** Efficiency: numerical solution 2D / analytic Q1D (dimensionless) *** E+00 = discharge coefficient E-01 = dynamic thrust E-01 = pressure thrust at sea level (p = Pa) E+00 = pressure thrust in the vacuum E-01 = total thrust at sea level E-01 = total thrust in the vacuum E-01 = thrust coefficient at sea level E-01 = thrust coefficient in the vacuum E-01 = characterist velocity E-01 = velocity of efective ejection at sea level E-01 = velocity of efective ejection in the vacuum E-01 = specific impulse at sea level E-01 = specific impulse at vacuum = tcpuo: acumulated CPU time (s) (before interuption) = dtcpu: CPU time (s) (after interuption) = tcpu: total CPU time (s) 8)SUBROTINA: COEFFICIENTS_mp_GET_VELOCITIES_AT_FACES: SEN03_0008 Foi utilizado apenas 1 único ciclo para cálculo das velocidades, com casos especiais para i = nx - 1 e j = ny - 1. Houve uma redução de 24,100,640,000 ciclos de clock para 22,085,144,000. A rotina que utilizava 15,68% do tempo total, agora utiliza 14,55%. 17

18 Figura 12 Antes da Otimização Figura 13 Depois da otimização *** Efficiency: numerical solution 2D / analytic Q1D (dimensionless) *** E+00 = discharge coefficient E-01 = dynamic thrust E-01 = pressure thrust at sea level (p = Pa) 18

19 E+00 = pressure thrust in the vacuum E-01 = total thrust at sea level E-01 = total thrust in the vacuum E-01 = thrust coefficient at sea level E-01 = thrust coefficient in the vacuum E-01 = characterist velocity E-01 = velocity of efective ejection at sea level E-01 = velocity of efective ejection in the vacuum E-01 = specific impulse at sea level E-01 = specific impulse at vacuum = tcpuo: acumulated CPU time (s) (before interuption) = dtcpu: CPU time (s) (after interuption) = tcpu: total CPU time (s) 9)SUBROTINA: COEFFICIENTS_mp_GET_VELOCITIES_AT_FACES: SEN03_0009 Foi indexado sumup e sumvp. Houve uma redução de 22,085,144,000 ciclos de clock para 14,447,054,000. A rotina que utilizava 14,55%.do tempo total, agora utiliza 10,00%. Figura 14 Antes da Otimização 19

20 Figura 15 Depois da otimização *** Efficiency: numerical solution 2D / analytic Q1D (dimensionless) *** E+00 = discharge coefficient E-01 = dynamic thrust E-01 = pressure thrust at sea level (p = Pa) E+00 = pressure thrust in the vacuum E-01 = total thrust at sea level E-01 = total thrust in the vacuum E-01 = thrust coefficient at sea level E-01 = thrust coefficient in the vacuum E-01 = characterist velocity E-01 = velocity of efective ejection at sea level E-01 = velocity of efective ejection in the vacuum E-01 = specific impulse at sea level E-01 = specific impulse at vacuum = tcpuo: acumulated CPU time (s) (before interuption) = dtcpu: CPU time (s) (after interuption) = tcpu: total CPU time (s) COMPARACAO com uso do esquema de MSI no ciclo da massa e TDMAX nos outros sem paralelização (uso da biblioteca -qopenmp no command line) e MSI PURO: 20

21 Figura 16 MSI no ciclo da massa e TDMAX nos outros : mach2d-sen03_0011 *** Efficiency: numerical solution 2D / analytic Q1D (dimensionless) *** E+00 = discharge coefficient E-01 = dynamic thrust E-01 = pressure thrust at sea level (p = Pa) E+00 = pressure thrust in the vacuum E-01 = total thrust at sea level E-01 = total thrust in the vacuum E-01 = thrust coefficient at sea level E-01 = thrust coefficient in the vacuum E-01 = characterist velocity E-01 = velocity of efective ejection at sea level E-01 = velocity of efective ejection in the vacuum E-01 = specific impulse at sea level E-01 = specific impulse at vacuum = tcpuo: acumulated CPU time (s) (before interuption) = dtcpu: CPU time (s) (after interuption) = tcpu: total CPU time (s) 21

22 Figura 17 MSI puro : mach2d-sen03_0012 *** Efficiency: numerical solution 2D / analytic Q1D (dimensionless) *** E+00 = discharge coefficient E-01 = dynamic thrust E-01 = pressure thrust at sea level (p = Pa) E+00 = pressure thrust in the vacuum E-01 = total thrust at sea level E-01 = total thrust in the vacuum E-01 = thrust coefficient at sea level E-01 = thrust coefficient in the vacuum E-01 = characterist velocity E-01 = velocity of efective ejection at sea level E-01 = velocity of efective ejection in the vacuum E-01 = specific impulse at sea level E-01 = specific impulse at vacuum = tcpuo: acumulated CPU time (s) (before interuption) = dtcpu: CPU time (s) (after interuption) = tcpu: total CPU time (s) C - RESUMO DAS MODIFICAÇÕES em relação a versão do mach2d recebida pelo Guilherme Bertoldo: 1) Foi retirada a linha de declaração da variável g no main.f90, senão o programa nem rodava. 2) Criou-se uma pasta com os arquivos do gnuplot na raiz do mach2d, assim a subrotina postp.f90 usa a variável character gnuplot =.\gnuplot\gnuplot. 3) Em todas as subrotinas que utilizavam um ciclo em j e outro em i, foi criado uma variável auxiliar aux_i para receber parte do índice: aux_i = (j-1) * nx índice = aux_i + i 4) Em todas as subrotinas que faziam a divisão de um número constante, foi feito uma multiplicação por um número constante, por exemplo: 22

23 - ao invés de 1/4, utilizou-se 0.25d0. - Fez-se ao invés de 1/3, d-1, mas o professor Manoel de Computação de Alto Desempenho não aprovou esta mudança, diz ele que pode acrescentar erros de arredondamento á solução numérica. Pelas otimizações acima, notou-se que a divisão por dt também consome muito tempo computacional, então criar uma variável auxiliar inv_dt é uma recomendação minha que pode economizar um tempo computacional considerável. 5) Adicionou-se a opção de 5 esquemas de solver: 0) Msi puro; 1)TDMA-XY; 2) TDMA-X; 3) MSI em p e TDMAX em u, v e T ; 4) MSI em p e Gauss-Siedel em u, v e T. Bastando apenas alterar uma variável no arquivo de entrada de dados (utilizou-se select case para escolher entre elas. 6) Alterou-se a posição de algumas linhas de código do main.f90, como a escrita do cabeçalho para fora do ciclo externo do programa. 7) As rotinas do solver TDMA foram otimizadas para tirar os if s do programa, tendo casos especiais, ao invés de if s 8) Na subrotina get_t_coefficients_and_source, foi criado uma variável inv_dt para armazenar a inversa de dt 9) Na subrotina get_internal_simplec_coefficients, foi indexado soma_au e soma_av 10) Na subrotina get_velocities_at_faces foi criado uma variável para armazenar a inversa de dt, foi indexado mpa, sumup e sumvp além de agrupar os dois ciclos em apenas um com casos especiais. D REFINO PG - Fazer refino PG no mach2d é mais fácil do que se pensava, basta fazer o seguinte: Por exemplo num refino 2 nas duas direções, o primeiro volume será dividido por 2 (na direção transversal), ou seja, na malha refinada basta utilizar um a1 grosso dividido por 2, que obter-se-á o refino PG 23

24 Figura 18 Malha base do refino PG de 19/12/11 Figura 19 Malha base do refino PG NOVO 24

25 Figura 20 Malha - base * 2 do refino PG de 21/12/11 Figura 21 Malha - base * 2 do refino PG NOVO 25

26 Figura 22 Malha - base * 4 do refino PG de 19/12/11 Figura 23 Malha - base * 4 do refino PG NOVO E - CONCLUSÕES - Nesta versão do mach2d, realmente não há efeito dt na solução, utilizando-se um dt maior ou menor. O mesmo foi verificado para o uso de diferentes solvers. - O uso do fator E não funciona para u e v, apenas para p e T. Tendo como base um dt fixo para todas as variáveis, é possível encontrar um fator E para p e T que diminua o tempo computacional, mantendo-se fixo um dt para u e v. 26

27 - O Esquema com MSI em p e TDMAX em u, v e T é o melhor esquema de solver para o mach2d-euler, mas ao simular-se mach2d-navier_stokes notou-se que MSI puro é o melhor esquema. Anteriormente, concluiu-se que o esquema com MSI em p e Gauss-Seidel em u, v e T era mais rápido, mas na versão atual retirou-se o cálculo do resíduo do solver TDMAX, o que diminuiu o tempo computacional o suficiente para tornar o esquema com MSI e TDMAX o mais rápido. - Com o Vtune é possível analisar o tempo computacional subrotina por subrotina, o que é muito importante no mach2d que possui muitas subrotinas. Algumas delas consomem pouquíssimo tempo computacional e outras, surpreendentemente, consumiam maior tempo computacional que o próprio solver. Isto é importantíssimo para a otimização, pois uma pequena alteração na rotina que mais consome tempo de CPU pode melhorar muito o programa. Basta ver a idéia de utilizar uma variável auxiliar para armazenar a inversa de dt (strength reduction), o que diminuiu em quase 1 bilhão e 700 milhões de ciclos de clock da subrotina get_velocities_at_faces. - Otimizou-se várias subrotinas com o Vtune, sendo a mais importante a subrotina get_velocities_at_faces. Foi possível partir de um tempo computacional de 61,329 s para 56,281 s (MSI puro com a biblioteca -Qopenmp habilitada) Isto numa malha de 224x80 nós, numa malha mais fina, será possível observar melhor o ganho computacional. Também, num computador melhor, o programa será mais rápido, no Intel i5, a mesma malha com os mesmos parâmetros consumia 22,887 s (antes das otimizações), agora utilizou 20,200 s (após as otimizações). - Para fazer refino PG, basta utilizar um a1 refinado = a1 grosso / 2 27

Relatório 3 para a reunião 04 do grupo de otimização do mach2d

Relatório 3 para a reunião 04 do grupo de otimização do mach2d Relatório 3 para a reunião 04 do grupo de otimização do mach2d Nome: Diego Fernando Moro Data: 17 a 18/10/12 Índice: A OTIMIZAÇÃO DAS SUBROTINAS DO MACH2D USANDO O PROGRAMA Intel(R) VTune(TM) Performance

Leia mais

1) Utilizar respostas de malhas mais grossas como chute inicial para malhas mais finas.

1) Utilizar respostas de malhas mais grossas como chute inicial para malhas mais finas. Relatório para a reunião 3 da otimização do Mach2D. Nome: Diego Fernando Moro Data: 19 a 20/09/12 Estudo: 1) Utilizar respostas de malhas mais grossas como chute inicial para malhas mais finas. 2) Modificar

Leia mais

OBSERVAÇÕES GERAIS: Para um dado conjunto de simulações (na mesma malha), os resultados com menor tempo de processamento são destacados em vermelho.

OBSERVAÇÕES GERAIS: Para um dado conjunto de simulações (na mesma malha), os resultados com menor tempo de processamento são destacados em vermelho. TESTES REALIZADOS UTILIZANDO-SE DOIS COMPUTADORES: CFD-11, PROCESSADOR: 2x( XEON X5355, 2.66 GHz - 4 NÚCLEOS ), 32 GB RAM, SO: WINDOWS XP PROFESSIONAL x64 EDITION LAPTOP SAMSUNG RF511, PROCESSADOR: INTEL

Leia mais

Solver: MSI COMPILADOR: INTEL VISUAL FORTRAN 11.1 PARÂMETROS UTILIZADOS E MANTIDOS CONSTANTES EM TODAS AS SIMULAÇÕES:

Solver: MSI COMPILADOR: INTEL VISUAL FORTRAN 11.1 PARÂMETROS UTILIZADOS E MANTIDOS CONSTANTES EM TODAS AS SIMULAÇÕES: CONFIGURAÇÕES DO COMPUTADOR UTILIZADO: LAPTOP SAMSUNG RF511 PROCESSADOR: INTEL CORE I5-2410 M, 2.30 GHz, 2 NÚCLEOS (4 PROCESSADORES LÓGICOS) MEMÓRIA: 6 GB RAM SO: WINDOWS 7 HOME PREMIUM x64-based PC COMPILADOR:

Leia mais

Código da pasta: Mach2D Marchi 7 0 7

Código da pasta: Mach2D Marchi 7 0 7 Código da pasta: Mach2D Marchi 7 0 7 Objetivo da nova versão: resolver apenas as equações de Euler com TDMA e MSI Bertoldo no Fortran Intel 11.1 com o uso de real(16) Executor das simulações: Marchi Datas:

Leia mais

Relatório técnico do projeto CFD-14/UFPR: solução de escoamentos invíscidos, laminares e turbulentos com o código Mach2D 5.8

Relatório técnico do projeto CFD-14/UFPR: solução de escoamentos invíscidos, laminares e turbulentos com o código Mach2D 5.8 Simulação numérica de escoamento reativo, transferência de calor e termoelasticidade em motor-foguete - parte 2 Projeto CFD-14/AEB-3 apoiado financeiramente pela Agência Espacial Brasileira (AEB) Anúncio

Leia mais

Código da pasta: Mach2D Marchi 7 0 4

Código da pasta: Mach2D Marchi 7 0 4 Código da pasta: Mach2D Marchi 7 0 4 Objetivo da nova versão: resolver apenas as equações de Euler com TDMA-Bertoldo no Fortran Intel 11.1 Executor das simulações: Marchi Datas: 3, 4, 5 Set 2012 Características:

Leia mais

Estudo da variação dos parâmetros numéricos sobre o desempenho computacional do código Mach2D-7.0. Parte B: código otimizado para o modelo de Euler.

Estudo da variação dos parâmetros numéricos sobre o desempenho computacional do código Mach2D-7.0. Parte B: código otimizado para o modelo de Euler. Estudo da variação dos parâmetros numéricos sobre o desempenho computacional do código Mach2D-7.0. Parte B: código otimizado para o modelo de Euler. Guilherme Bertoldo 18 de Agosto de 2012 Conteúdo 1 Introdução

Leia mais

2 Caracterização do Computador e do Compilador

2 Caracterização do Computador e do Compilador Relatório 4c: Otimização do Código Mach2D - Verificação Jonas Joacir Radtke 9 de dezembro de 2012 1 Objetivo Geral Verificação da solução numérica obtida pelo código Mach2D com esquema CDS-2. Para tanto,

Leia mais

RELATÓRIO ATIVIDADE #3

RELATÓRIO ATIVIDADE #3 RELATÓRIO ATIVIDADE #3 Autor: Eduardo Germer Objetivos: Nova abordagem de estimativa inicial Valores de Δt ótimos com uso de MSI Critérios de convergência Data: 18.Out.2012 Objetivo 1: Além das opções

Leia mais

Relatório 4b - versão 2: Otimização do Código Mach2D -

Relatório 4b - versão 2: Otimização do Código Mach2D - Relatório 4b - versão 2: Otimização do Código Mach2D - Verificação Jonas Joacir Radtke 4 de dezembro de 2012 1 Objetivo Geral Verificação da solução numérica obtida pelo código Mach2D. Para tanto, foi

Leia mais

Otimização do Código Mach2D: Relatório 2a

Otimização do Código Mach2D: Relatório 2a Otimização do Código Mach2D: Relatório 2a Jonas Joacir Radtke 21 de setembro de 2012 Tabela 1: Configuração dos computadores utilizados nas simulações numéricas. Hardware Processador Intel(R) Core(TM)

Leia mais

RELATÓRIO ATIVIDADE #4B. Análise dos resultados com programa Richardson3p2

RELATÓRIO ATIVIDADE #4B. Análise dos resultados com programa Richardson3p2 Autor: Eduardo Germer Objetivos: Simulações em bocal de perfil parabólico RELATÓRIO ATIVIDADE #B Análise dos resultados com programa Richardson3p Data: 9.Dez. Para a realização desta atividade foi definida

Leia mais

RELATÓRIO ATIVIDADE #2

RELATÓRIO ATIVIDADE #2 RELATÓRIO ATIVIDADE #2 Autor: Eduardo Germer Objetivo: Sugestões de estimativa inicial Data: 21.Set.2012 Resumo: O objetivo deste trabalho foi buscar uma forma de reduzir o tempo computacional do programa

Leia mais

RELATÓRIO ATIVIDADE #4C. Análise dos resultados com programa Richardson3p2

RELATÓRIO ATIVIDADE #4C. Análise dos resultados com programa Richardson3p2 Autor: Eduardo Germer Objetivos: Simulações em bocal de perfil parabólico RELATÓRIO ATIVIDADE #4C Análise dos resultados com programa Richardson3p2 Data: 29.Dez.2012 Para a realização desta atividade foi

Leia mais

Estudos diversos com o código Mach2D

Estudos diversos com o código Mach2D Estudos diversos com o código Mach2D-5.8.2.1. Guilherme Bertoldo 21 de Setembro de 2012 Conteúdo 1 Introdução 1 2 Efeito do dt sobre Cd e u, v, T, p sobre a superfície do cone 1 3 Mais de uma iteração

Leia mais

RELATÓRIO ATIVIDADE #4A. Análise dos resultados com programa Richardson3p2

RELATÓRIO ATIVIDADE #4A. Análise dos resultados com programa Richardson3p2 Autor: Eduardo Germer Objetivos: Simulações em bocal de perfil parabólico RELATÓRIO ATIVIDADE #A Análise dos resultados com programa Richardson3p Data:.Nov.1 Para a realização desta atividade foi definida

Leia mais

Validação da solução numérica do escoamento de ar a 17,25 bar e 833 K em tubeira com razão de expansão 6,6

Validação da solução numérica do escoamento de ar a 17,25 bar e 833 K em tubeira com razão de expansão 6,6 Validação da solução numérica do escoamento de ar a 17,25 bar e 833 K em tubeira com razão de expansão 6,6 Diego F. Moro PG-Mec, Universidade Federal do Paraná (UFPR), Curitiba, PR E-mail: difmoro@ufpr.br

Leia mais

Diego Fernando Moro. Iniciação Científica / (PIBIC/CNPq) / Simulação numérica de escoamento em motor-foguete

Diego Fernando Moro. Iniciação Científica / (PIBIC/CNPq) / Simulação numérica de escoamento em motor-foguete Diego Fernando Moro Iniciação Científica / (PIBIC/CNPq) / 2011-2012 Simulação numérica de escoamento em motor-foguete Relatório apresentado à Coordenadoria de Iniciação Científica e Integração Acadêmica

Leia mais

VALIDAÇÃO DA SOLUÇÃO NUMÉRICA DO ESCOAMENTO DE AR A 300 K EM TUBEIRA PLANA NA CONDIÇÃO DE PROJETO E RAZÃO DE EXPANSÃO 1,8. Tobias Pinheiro Queluz

VALIDAÇÃO DA SOLUÇÃO NUMÉRICA DO ESCOAMENTO DE AR A 300 K EM TUBEIRA PLANA NA CONDIÇÃO DE PROJETO E RAZÃO DE EXPANSÃO 1,8. Tobias Pinheiro Queluz VALIDAÇÃO DA SOLUÇÃO NUMÉRICA DO ESCOAMENTO DE AR A 300 K EM TUBEIRA PLANA NA CONDIÇÃO DE PROJETO E RAZÃO DE EXPANSÃO 1,8 Tobias Pinheiro Queluz Universidade Federal do Paraná (UFPR) Curso de Engenharia

Leia mais

Efeito de hardware e software sobre o erro de arredondamento em CFD

Efeito de hardware e software sobre o erro de arredondamento em CFD Proceeding Series of the Brazilian Society of Computational and Applied Mathematics Efeito de hardware e software sobre o erro de arredondamento em CFD Diego Fernando Moro 1 Programa de Pós Graduação em

Leia mais

PARÂMETROS UTILIZADOS E MANTIDOS CONSTANTES EM TODAS AS SIMULAÇÕES:

PARÂMETROS UTILIZADOS E MANTIDOS CONSTANTES EM TODAS AS SIMULAÇÕES: SIMULAÇÕES COM FUNÇÃO DE INTERPOLAÇÃO UDS Malas utilizadas: 56x20, 112x40, 224x80, 448x160, 896x320, 1792x640. PARÂMETROS UTILIZADOS E MANTIDOS CONSTANTES EM TODAS AS SIMULAÇÕES: kg = 1 Tipo de mala -

Leia mais

Benchmarks. 1. Introdução

Benchmarks. 1. Introdução Benchmarks 1. Introdução Um Benchmark é um programa de teste de desempenho que analisa as características de processamento e de movimentação de dados de um sistema de computação com o objetivo de medir

Leia mais

Introdução à Informática. Aula 1

Introdução à Informática. Aula 1 Introdução à Informática Aula 1 Site da disciplina sites.google.com/site/ifbagustavo/ Ementa Introdução ao HARDWARE; Conceitos e operacionais; utilização de sistemas Utilização de Processador de texto;

Leia mais

Diego Fernando Moro. Iniciação Científica / (PIBIC/CNPq) / Simulação numérica de escoamento em motor-foguete

Diego Fernando Moro. Iniciação Científica / (PIBIC/CNPq) / Simulação numérica de escoamento em motor-foguete Diego Fernando Moro Iniciação Científica / (PIBIC/CNPq) / 2011-2012 Simulação numérica de escoamento em motor-foguete Relatório apresentado à Coordenadoria de Iniciação Científica e Integração Acadêmica

Leia mais

Relatório técnico do projeto CFD-14/UFPR: testes de paralelização do código Mach2D

Relatório técnico do projeto CFD-14/UFPR: testes de paralelização do código Mach2D Simulação numérica de escoamento reativo, transferência de calor e termoelasticidade em motor-foguete - parte 2 Projeto CFD-14/AEB-3 apoiado financeiramente pela Agência Espacial Brasileira (AEB) Anuncio

Leia mais

Organização de Sistemas Computacionais Processadores: Organização da CPU

Organização de Sistemas Computacionais Processadores: Organização da CPU Universidade Paulista UNIP Curso: Ciências da Computação Turma: CCP30 Turno: Noturno Disciplina: Arquitetura de Computadores Professor: Ricardo Loiola Alunos: Thiago Gomes dos Santos Matrícula: C63873-0

Leia mais

Introdução à Informática

Introdução à Informática Introdução à Informática Aula 10 http://www.ic.uff.br/~bianca/introinfo/ Aula 10-05/10/2007 1 Ementa Conceitos Básicos de Computação (Hardware, Software e Internet) Softwares Aplicativos Tutorial: Word

Leia mais

Conceitos sobre Computadores

Conceitos sobre Computadores Conceitos sobre Computadores Prof. UNESP - São José do Rio Preto Linguagem Computacional Neste tópico veremos: Os Componentes físicos dos computadores O hardware: principais partes dos computadores atuais.

Leia mais

Sistemas de Computação. O Computador. Eng. Jorge Munguambe. Lic. em Engenharia Informática

Sistemas de Computação. O Computador. Eng. Jorge Munguambe. Lic. em Engenharia Informática O Computador Eng. Jorge Munguambe O que é um computador? É uma unidade Funcional programável, composta por uma ou mais unidades de processamento associadas e por equipamentos periférico, que é controlado

Leia mais

Exemplo Amdahl. O speedup total é dado por:

Exemplo Amdahl. O speedup total é dado por: Í Revisão da prova Questão 20: A exploração do paralelismo em nível de instruções em uma arquitetura superescalar é realizada identificando no fluxo de instruções aquelas que são independentes a fim de

Leia mais

Desempenho. Na otimização do projeto, as métricas mais importantes são custo e desempenho. Arquiteturas de Alto Desempenho - Prof a Luiza Mourelle 1

Desempenho. Na otimização do projeto, as métricas mais importantes são custo e desempenho. Arquiteturas de Alto Desempenho - Prof a Luiza Mourelle 1 A rápida taxa de melhoria na tecnologia de computadores veio em decorrência de dois fatores: avanços na tecnologia utilizada na construção de computadores e inovação no projeto de computadores. O projeto

Leia mais

Modelos de Computadores

Modelos de Computadores Modelos de Computadores Computadores para uso mais básico: Office, editores de texto, etc. INSPIRON SMALL DESKTOP (FABRICANTE DELL) Componentes Configuração de R$2.854,00 Configuração de R$2.626,00 Processador

Leia mais

AVALIAÇÃO DOS PARÂMETROS DE PROJETO DE MEDIDORES DE VAZÃO TIPO VENTURI UTILIZANDO FLUIDODINÂMICA COMPUTACIONAL

AVALIAÇÃO DOS PARÂMETROS DE PROJETO DE MEDIDORES DE VAZÃO TIPO VENTURI UTILIZANDO FLUIDODINÂMICA COMPUTACIONAL AVALIAÇÃO DOS PARÂMETROS DE PROJETO DE MEDIDORES DE VAZÃO TIPO VENTURI UTILIZANDO FLUIDODINÂMICA COMPUTACIONAL M. G. de PAULA SANTOS 1, R. BÉTTEGA 1 1 Universidade Federal de São Carlos, Departamento de

Leia mais

Arquitetura de Computadores

Arquitetura de Computadores Arquitetura de Computadores 2018.1 Computador O computador é uma máquina que realiza processamento de dados automaticamente. Ela é formada por um hardware e um software. O Engenho Analítico é o primeiro

Leia mais

Simulação numérica de escoamento reativo, transferência de calor e termoelasticidade em motor-foguete parte 2

Simulação numérica de escoamento reativo, transferência de calor e termoelasticidade em motor-foguete parte 2 Simulação numérica de escoamento reativo, transferência de calor e termoelasticidade em motor-foguete parte 2 AEB-3 / CFD-14 Período de execução previsto: 2 anos (Junho/2010 a Maio/2012) Palavras-chave:

Leia mais

Arquitectura interna de um computador. Organização de um computador. Organização de um computador. Organização de um computador

Arquitectura interna de um computador. Organização de um computador. Organização de um computador. Organização de um computador Arquitectura interna de um computador Descrição de uma tarefa Fases de execução de uma tarefa Unidades de execução de uma tarefa Computador como um conjunto de unidades de execução de tarefas Trabalho

Leia mais

UNIDADE CENTRAL DE PROCESSAMENTO FELIPE G. TORRES

UNIDADE CENTRAL DE PROCESSAMENTO FELIPE G. TORRES Tecnologia da informação e comunicação UNIDADE CENTRAL DE PROCESSAMENTO FELIPE G. TORRES CICLO DE INSTRUÇÕES OU DE EXECUÇÃO Arquitetura de computadores 2 CICLO DE EXECUÇÃO No inicio de cada ciclo de instrução,

Leia mais

Manutenção de Microcomputadores I

Manutenção de Microcomputadores I Manutenção de Microcomputadores I Aula03 Memórias Introdução Hardware que auxilia no processamento dos dadospelaucp. Hierarquia dos diferentes tipos de Memórias Tipos Registradores: pequenos dispositivos

Leia mais

Processador. Processador

Processador. Processador Departamento de Ciência da Computação - UFF Processador Processador Prof. Prof.Marcos MarcosGuerine Guerine mguerine@ic.uff.br mguerine@ic.uff.br 1 Processador Organização básica de um computador: 2 Processador

Leia mais

Complexidade de Tempo e Espaço

Complexidade de Tempo e Espaço Complexidade de Tempo e Espaço Profa. Sheila Morais de Almeida DAINF-UTFPR-PG junho - 2018 Sheila Almeida (DAINF-UTFPR-PG) Complexidade de Tempo e Espaço junho - 2018 1 / 43 Este material é preparado usando

Leia mais

DD3IMP (FINITE ELEMENT SOLVER) THE CHALLENGE OF COMPUTATIONAL PERFORMANCE IMPROVEMENT THROUGH HPC

DD3IMP (FINITE ELEMENT SOLVER) THE CHALLENGE OF COMPUTATIONAL PERFORMANCE IMPROVEMENT THROUGH HPC DD3IMP (FINITE ELEMENT SOLVER) THE CHALLENGE OF COMPUTATIONAL PERFORMANCE IMPROVEMENT THROUGH HPC J.L. ALVES CT2M, UNIVERSIDADE DO MINHO CEMUC, UNIVERSIDADE DE COIMBRA MEI, 19 NOVEMBRO DE 2013 VAMOS POR

Leia mais

O Que Veremos. Introdução. Introdução. Definindo Desempenho. Definindo Desempenho. Avaliando e Compreendendo o Desempenho

O Que Veremos. Introdução. Introdução. Definindo Desempenho. Definindo Desempenho. Avaliando e Compreendendo o Desempenho Ciência da Computação Arq. e Org. de Computadores Avaliando e Compreendendo o Desempenho O Que Veremos Avaliando e compreendendo o desempenho: Introdução Definindo desempenho Medindo o desempenho e seus

Leia mais

Curso Técnico em Informática

Curso Técnico em Informática COLÉGIO EST. JOÃO MANOEL MONDRONE - ENS. FUNDAMENTAL, MÉDIO, PROFISSIONAL E NORMAL Rua Mato Grosso n.2233 - Fone/Fax (045) 3264-1749-3264-1507 Curso Técnico em Informática Disciplina: Fundamentos e Suporte

Leia mais

Hardware e Manutenção de Micros

Hardware e Manutenção de Micros Hardware e Manutenção de Micros Cooler de CPU Memórias Tipos Tecnologias de construção Características Produzido por Márcio Jusilho Cooler de CPU É um conjunto do dissipação térmica do processador. O cooler

Leia mais

Conceitos Básicos Processador

Conceitos Básicos Processador Infra-Estrutura de Hardware Conceitos Básicos Processador Prof. Edilberto Silva www.edilms.eti.br edilms@yahoo.com Sumário Conceitos básicos Organização da CPU Execução das Instruções RISC x CISC Paralelismo

Leia mais

Componentes de um Computador Típico

Componentes de um Computador Típico Componentes de um Computador Típico Assim como em um aparelho de dvd, no qual é necessário ter o aparelho de dvd e um dvd contendo o filme que será reproduzido, o computador possui a parte física, chamada

Leia mais

Professores: Bruno Fontana da Silva e Maria Cláudia de Almeida Castro Data: 22/08/2014

Professores: Bruno Fontana da Silva e Maria Cláudia de Almeida Castro Data: 22/08/2014 Secretaria de Educação Profissional e Tecnológica Instituto Federal de Santa Catarina Campus São José Área de Telecomunicações ICO60801 Introdução à Computação Avaliação Teórica Hardware, bits e bytes

Leia mais

Este tutorial apresenta uma análise para uso adequado e otimizado de seus parâmetros nos processos de ETL, e sua aplicação em situações distintas.

Este tutorial apresenta uma análise para uso adequado e otimizado de seus parâmetros nos processos de ETL, e sua aplicação em situações distintas. O Pentaho Data Integration ( PDI ) ou Kettle tem um step responsável pela ordenação ou classificação de dados chamado Sort Rows, este step permite ordenar dados através de campos informados em sua lista.

Leia mais

Faculdade de Computação

Faculdade de Computação Faculdade de Computação Arquitetura e Organização de Computadores 2 1 a Lista de Exercícios entrega em 25/09/2018 Prof. Cláudio C. Rodrigues Problemas: P1) A Tabela abaixo apresenta o mix de instruções

Leia mais

6 Resultados Análise de Desempenho

6 Resultados Análise de Desempenho Resultados 6 Resultados Com base em todas as técnicas e teorias estudadas nessa dissertação mais a arquitetura e detalhes de implementação utilizados para gerar a solução do módulo de renderização da pele

Leia mais

O que é um microprocessador?

O que é um microprocessador? MICROPROCESSADORES O que é um microprocessador? É um circuito integrado com milhares, ou mesmo milhões, de transistores, que estão interligados por superfinos traços de alumínio. Os transistores trabalham

Leia mais

Principais Componentes do Gabinete. Componentes Básicos de um Computador. CPU ou UCP (Processador) 17/02/2017

Principais Componentes do Gabinete. Componentes Básicos de um Computador. CPU ou UCP (Processador) 17/02/2017 Professora: Janaide Nogueira E-mail: nogueirajanaide@gmail.com Materiais: https://janaide.wordpress.com Componentes Básicos de um Computador Principais Componentes do Gabinete 3 4 CPU ou UCP (Processador)

Leia mais

Arquitetura de computadores

Arquitetura de computadores Arquitetura de computadores Arquitetura de Microprocessadores Curso Profissional de Técnico de Gestão e Programação de Sistemas Memória Cache Volátil; Memória RAM Volátil; Memória ROM Não volátil. Articulação

Leia mais

Organização de Computadores Processadores, Placa Mãe e Memória RAM. Professor: Francisco Ary Alves de Souza

Organização de Computadores Processadores, Placa Mãe e Memória RAM. Professor: Francisco Ary Alves de Souza Organização de Computadores Processadores, Placa Mãe e Memória RAM Professor: Francisco Ary Alves de Souza Processadores Processadores: Microprocessador: 2 Processadores Processadores: Trabalha em altas

Leia mais

Estudo de Desempenho Sobre a Biblioteca Int-Haar

Estudo de Desempenho Sobre a Biblioteca Int-Haar Estudo de Desempenho Sobre a Biblioteca Int-Haar Autores: Vinícius Santos Maurício Pilla Renata Reiser Alice Kozakevicius Apresentador: Lucas Agostini Universidade Federal de Pelotas Ciência da Computação

Leia mais

AULA 2. Prof.: Jadiel Mestre. Introdução à Informática. Introdução à Informática Componentes de um Sistema de Informação

AULA 2. Prof.: Jadiel Mestre. Introdução à Informática. Introdução à Informática Componentes de um Sistema de Informação AULA 2 Prof.: Jadiel Mestre. Componentes de um Sistema de Informação Os componentes de um sistema de informação são divididos em três partes 2 1 Componentes físicos do computador Dispositivos de Entrada/Saída

Leia mais

XXIX CILAMCE November 4 th to 7 th, 2008 Maceió - Brazil

XXIX CILAMCE November 4 th to 7 th, 2008 Maceió - Brazil XXIX CILAMCE November 4 th to 7 th, 008 Maceió - Brazil EFEITO DA ANISOTROPIA FÍSICA SOBRE O MÉTODO MULTIGRID NA SOLUÇÃO DA EQUAÇÃO DE ADVECÇÃO-DIFUSÃO D Roberta Suero robertasuero@demec.ufpr.br Programa

Leia mais

MEGATAREFAS AO EXTREMO

MEGATAREFAS AO EXTREMO MEGATAREFAS AO EXTREMO Edite vídeos em 4K, aplique acabamento 3D e componha trilhas sonoras simultaneamente, sem comprometer o desempenho do sistema Edição de vídeos 4K até rápida¹ - Adobe* Premiere* Pro

Leia mais

LISTA DE EQUIPAMENTOS DO GRUPO CFD/UFPR (29 Mai 2008) Nome CFD-1 CFD-2 CFD-3 CFD-4 CFD-5

LISTA DE EQUIPAMENTOS DO GRUPO CFD/UFPR (29 Mai 2008) Nome CFD-1 CFD-2 CFD-3 CFD-4 CFD-5 LISTA DE EQUIPAMENTOS DO GRUPO CFD/UFPR (29 Mai 2008) MICROCOMPUTADORES - 1 Nome CFD-1 CFD-2 CFD-3 CFD-4 CFD-5 Data compra 06 Ago 2001 24 Mar 2003 26 Nov 2003 20 Jun 2005 05 Out 2005 Fonte pagadora OCCUC

Leia mais

ARQUITETURA E ORGANIZAÇÃO DE COMPUTADORES PARALELISMO: SMP E PROCESSAMENTO VETORIAL. Prof. Dr. Daniel Caetano

ARQUITETURA E ORGANIZAÇÃO DE COMPUTADORES PARALELISMO: SMP E PROCESSAMENTO VETORIAL. Prof. Dr. Daniel Caetano ARQUITETURA E ORGANIZAÇÃO DE COMPUTADORES PARALELISMO: SMP E PROCESSAMENTO VETORIAL Prof. Dr. Daniel Caetano 2012-2 Objetivos Compreender a Arquitetura SMP Conhecer a Organização SMP Apresentar o Conceito

Leia mais

Conceitos Básicos de Informática. Profª Patricia Schiavon

Conceitos Básicos de Informática. Profª Patricia Schiavon Conceitos Básicos de Informática Profª Patricia Schiavon O QUE É INFORMÁTICA? Informática pode ser considerada como significando informação automática, ou seja, a utilização de métodos e técnicas no tratamento

Leia mais

AULA 01: APRESENTAÇÃO

AULA 01: APRESENTAÇÃO ORGANIZAÇÃO E ARQUITETURA DE COMPUTADORES I AULA 01: APRESENTAÇÃO Prof. Max Santana Rolemberg Farias max.santana@univasf.edu.br Colegiado de Engenharia de Computação QUAIS OS OBJETIVOS DESSA DISCIPLINA?

Leia mais

Informática Aplicada. Introdução

Informática Aplicada. Introdução Informática Aplicada Introdução Breve histórico da computação moderna Principais eventos 1000ac - Ábaco 1614 - Logaritmos (John Napier) 1623 - Sistema Binário (Francis Bacon) 1642 - Máquina de Turing 1946

Leia mais

ANÁLISE DE DESEMPENHO COM A PARALELIZAÇÃO DO CÁLCULO DE NÚMEROS PERFEITOS 1

ANÁLISE DE DESEMPENHO COM A PARALELIZAÇÃO DO CÁLCULO DE NÚMEROS PERFEITOS 1 ANÁLISE DE DESEMPENHO COM A PARALELIZAÇÃO DO CÁLCULO DE NÚMEROS PERFEITOS 1 Éder Paulo Pereira 2, Gilberto Przygoda Marmitt 3, Emilio Hoffmann De Oliveira 4, Edson Luiz Padoin 5, Carlos Eduardo Das Chagas

Leia mais

Computação L. Apresentação da Disciplina e Conceitos Básicos de Computadores

Computação L. Apresentação da Disciplina e Conceitos Básicos de Computadores Computação L Apresentação da Disciplina e Conceitos Básicos de Computadores Tópicos da Aula Conceitos básicos de computação Componentes de um computador Como os diferentes componentes interagem Representação

Leia mais

MEU SISTEMA ESTÁ LENTO! ENTENDA AS POSSÍVEIS CAUSAS DESTE PROBLEMA

MEU SISTEMA ESTÁ LENTO! ENTENDA AS POSSÍVEIS CAUSAS DESTE PROBLEMA MEU SISTEMA ESTÁ LENTO! ENTENDA AS POSSÍVEIS CAUSAS DESTE PROBLEMA VOCÊ SABIA? Algumas vezes temos uma lentidão ao utilizar o Shop Control 9 e o primeiro culpado é sempre o sistema. Mas ao tratarmos dessa

Leia mais

MEMÓRIA PRINCIPAL QUESTÕES DISCURSIVAS. QUESTÃO 01. O que significa memória RAM? QUESTÃO 02. O que é memória volátil?

MEMÓRIA PRINCIPAL QUESTÕES DISCURSIVAS. QUESTÃO 01. O que significa memória RAM? QUESTÃO 02. O que é memória volátil? MEMÓRIA PRINCIPAL QUESTÕES DISCURSIVAS QUESTÃO 01. O que significa memória RAM? QUESTÃO 02. O que é memória volátil? QUESTÃO 03. Diferencie memória de armazenagem. QUESTÃO 04. Porque a memória RAM é denominada

Leia mais

Computadores e Programação (DCC/UFRJ)

Computadores e Programação (DCC/UFRJ) Computadores e Programação (DCC/UFRJ) Aula 3: 1 2 3 Abstrações do Sistema Operacional Memória virtual Abstração que dá a cada processo a ilusão de que ele possui uso exclusivo da memória principal Todo

Leia mais

Embora seja brutalmente mais rápida que o HD e outros periféricos, a memória RAM continua sendo muito mais lenta que o processador.

Embora seja brutalmente mais rápida que o HD e outros periféricos, a memória RAM continua sendo muito mais lenta que o processador. Memória RAM Embora seja brutalmente mais rápida que o HD e outros periféricos, a memória RAM continua sendo muito mais lenta que o processador. O uso de caches diminui a perda de desempenho, reduzindo

Leia mais

Introdução à Programação Aula 02. Prof. Max Santana Rolemberg Farias Colegiado de Engenharia de Computação

Introdução à Programação Aula 02. Prof. Max Santana Rolemberg Farias Colegiado de Engenharia de Computação Introdução à Programação Aula 02 Prof. Max Santana Rolemberg Farias max.santana@univasf.edu.br Colegiado de Engenharia de Computação QUAIS SÃO OS COMPONENTES BÁSICOS DO HW DE UM SISTEMA COMPUTACIONAL?

Leia mais

História dos Computadores

História dos Computadores História dos Computadores Tudo começou com o Sr. Charles Babbage no início do século XIX. Charles Babbage dedicou sua vida a construção de duas máquinas calculadoras. Ambas as tentativas foram fracassadas.

Leia mais

Noções de Informática INSS. Novo Curso. Aula 01

Noções de Informática INSS. Novo Curso. Aula 01 127767 Noções de Informática INSS Novo Curso Aula 01 http://facebook.com/profricardobeck contato@profricardobeck.com.br Mensurando Dados Sistema de numeração Binário (0 e 1) Fax/Modem 56 Kbps Placa de

Leia mais

Relatório final do projeto

Relatório final do projeto Relatório final do projeto Simulação numérica de escoamento reativo, transferência de calor e termoelasticidade em motor-foguete CFD-10 Período: Jul/2007 a Set/2009 Palavras-chave: propulsão líquida, CFD,

Leia mais

Introdução. Aula 02. Estrutura de Dados II. UFS - DComp Adaptados a partir do material da Profa. Kenia Kodel Cox

Introdução. Aula 02. Estrutura de Dados II. UFS - DComp Adaptados a partir do material da Profa. Kenia Kodel Cox Introdução Estrutura de Dados II Aula 02 UFS - DComp Adaptados a partir do material da Profa. Kenia Kodel Cox 1 Estrutura de Dados estuda o que? 2 A programação habilita os computadores a cumprirem imensa

Leia mais

ENIAC Primeiro computador de Propósito Geral. William Stallings Computer Organization and Architecture 6 th Edition (2003)

ENIAC Primeiro computador de Propósito Geral. William Stallings Computer Organization and Architecture 6 th Edition (2003) William Stallings Computer Organization and Architecture 6 th Edition (2003) ENIAC Primeiro computador de Propósito Geral Electronic Numerical Integrator And Computer Chapter 2 Computer Evolution and Performance

Leia mais

Para otimização de segurança de sua maquina, recomendo esta opção. Depois de selecionada clique em Avançar.

Para otimização de segurança de sua maquina, recomendo esta opção. Depois de selecionada clique em Avançar. Como Instalar? Para instalar o Antivírus Microsoft Security Essentials, é necessário o download do instalador, disponível no site http://windows.microsoft.com/pt-br/windows/securityessentials-download.

Leia mais

1. Conceitos Básicos de Computação

1. Conceitos Básicos de Computação Introdução à Computação I IBM1006 1. Conceitos Básicos de Computação Prof. Renato Tinós Local: Depto. de Computação e Matemática (FFCLRP/USP) 1 Principais Tópicos 1.Conceitos Básicos de Computação 1.1.

Leia mais

Minha carreira acadêmica na UFPR Carlos Henrique Marchi

Minha carreira acadêmica na UFPR Carlos Henrique Marchi Minha carreira acadêmica na UFPR 1994-2017 Carlos Henrique Marchi 18 Dez 2017 1 Tópicos da apresentação Atividades de Ensino grad e pós Orientação grad e pós Extensão Pesquisa Administração Produção tecnológica

Leia mais

ORGANIZAÇÃO E ARQUITETURA DE COMPUTADORES II AULA 02: PROCESSAMENTO PARALELO: PROCESSADORES VETORIAIS

ORGANIZAÇÃO E ARQUITETURA DE COMPUTADORES II AULA 02: PROCESSAMENTO PARALELO: PROCESSADORES VETORIAIS ORGANIZAÇÃO E ARQUITETURA DE COMPUTADORES II AULA 02: PROCESSAMENTO PARALELO: PROCESSADORES VETORIAIS Prof. Max Santana Rolemberg Farias max.santana@univasf.edu.br Colegiado de Engenharia de Computação

Leia mais

PROGRAMAÇÃO DA PRODUÇÃO EM SISTEMAS POR BATELADAS: UM ESTUDO PARA A OTIMIZAÇÃO DO MAKESPAN

PROGRAMAÇÃO DA PRODUÇÃO EM SISTEMAS POR BATELADAS: UM ESTUDO PARA A OTIMIZAÇÃO DO MAKESPAN PROGRAMAÇÃO DA PRODUÇÃO EM SISTEMAS POR BATELADAS: UM ESTUDO PARA A OTIMIZAÇÃO DO MAKESPAN R. P. da ROCHA 1, M. de F. MORAIS 1, M. A. da S. S. RAVAGNANI 2, C. M. G. ANDRADE 2, C. M. P. R. PARAÍSO 2 1 Universidade

Leia mais

Introdução aos Sistemas Operacionais

Introdução aos Sistemas Operacionais 1 Introdução aos Sistemas Operacionais 1.1 O que é um sistema operacional 1.2 História dos sistemas operacionais 1.3 O zoológico de sistemas operacionais 1.4 Conceitos sobre sistemas operacionais 1.5 Chamadas

Leia mais

Computadores podem ser úteis em problemas que envolvem: Grande número de dados. Grande número de cálculos. Complexidade. Precisão.

Computadores podem ser úteis em problemas que envolvem: Grande número de dados. Grande número de cálculos. Complexidade. Precisão. O uso do computador Computadores podem ser úteis em problemas que envolvem: Grande número de dados. Grande número de cálculos. Complexidade. Precisão. Exemplos: Modelos meteorológicos. Cálculo estrutural.

Leia mais

História da Computação

História da Computação História da Computação Aula #3.1 EBS 111 ICC Prof. Luiz Fernando S. Coletta luizfsc@tupa.unesp.br Campus de Tupã Processo de Downsizing Downsizing: migração de sistemas corporativos de mainframes para

Leia mais

Aplicativo RockSim Tutorial 2b

Aplicativo RockSim Tutorial 2b Aplicativo RockSim 7.0 - Tutorial 2b Objetivos: Aprender a usar o aplicativo RockSim 7.0 para cálculo do coeficiente de arrasto (C D ) Calcular o C D do minifoguete Sondinha II Analisar o efeito sobre

Leia mais

Aula 06. Slots para Memórias

Aula 06. Slots para Memórias Aula 06 Slots para Memórias Slot para as memórias 2 Slot para as memórias Os soquetes de memória são numerados: 1, 2 e 3. Instale memória primeiro no 1, depois no 2, depois no 3. Normalmente não é permitido

Leia mais

Estrutura de um computador digital. Gustavo Queiroz Fernandes

Estrutura de um computador digital. Gustavo Queiroz Fernandes Gustavo Queiroz Fernandes Atualizado em: 18/02/2019 Sumário Objetivos... 1 Pré-requisitos... 1 Recursos e Materiais... 1 Última Atualização... 1 1. Memória primária... 1 2. Memória secundária... 2 3. Unidade

Leia mais

Cálculo Numérico BCC760

Cálculo Numérico BCC760 Cálculo Numérico BCC760 Resolução de Sistemas de Equações Lineares Simultâneas Departamento de Computação Página da disciplina http://www.decom.ufop.br/bcc760/ 1 Introdução! Definição Uma equação é dita

Leia mais

é a saida do melhor individuo. A configuração de parâmetros da

é a saida do melhor individuo. A configuração de parâmetros da 61 4 4.1. Configuração Neste capítulo, comparam-se os resultados e o desempenho obtidos pela PGLIQ com a extensão do modelo proposto GPU-PGLIQ-I que foi desenvolvido nesta dissertação. Apresentam-se dois

Leia mais

Relatório final do projeto

Relatório final do projeto Relatório final do projeto Simulação numérica de escoamento reativo, transferência de calor e termoelasticidade em motor-foguete parte 2 CFD-14 / AEB-3 Período: Out/2009 a Dez/2012 Palavras-chave: propulsão

Leia mais

UNIVERSIDADE ESTADUAL DO PARÁ UEPA LISTA DE EXERCÍCIOS DE INTRODUÇÃO A COMPUTAÇÃO. 2. O que diferencia os computadores de 1ª geração dos da 2ª.

UNIVERSIDADE ESTADUAL DO PARÁ UEPA LISTA DE EXERCÍCIOS DE INTRODUÇÃO A COMPUTAÇÃO. 2. O que diferencia os computadores de 1ª geração dos da 2ª. UNIVERSIDADE ESTADUAL DO PARÁ UEPA LISTA DE EXERCÍCIOS DE INTRODUÇÃO A COMPUTAÇÃO 1. Cite alguns problemas que o uso de válvulas provocava nos computadores de 1ª geração. 2. O que diferencia os computadores

Leia mais

NOÇÕES DE INFORMÁTICA

NOÇÕES DE INFORMÁTICA NOÇÕES DE INFORMÁTICA ALISSON CLEITON MÓDULO I 1. A placa-mãe (motherboard) de um computador é o hardware responsável por conectar e interligar todos os componentes. Um componente que já vem instalado

Leia mais

O que é um computador. Segundo o Dicionário Escolar da Língua Portuguesa, computador é avaliador, calculador.

O que é um computador. Segundo o Dicionário Escolar da Língua Portuguesa, computador é avaliador, calculador. O que é um computador Segundo o Dicionário Escolar da Língua Portuguesa, computador é avaliador, calculador. Primeiras Máquinas de Calcular O ábaco foi criado há aproximadamente 4.000 a.c., um aparelho

Leia mais

Sistemas Computacionais e Hardware. Disciplina: Informática Prof. Higor Morais

Sistemas Computacionais e Hardware. Disciplina: Informática Prof. Higor Morais Sistemas Computacionais e Hardware Disciplina: Informática Prof. Higor Morais 1 Agenda Sistema Computacional O Computador e seus componentes Hardware 2 Unidade de entrada Unidade de saída Unidade de Processamento

Leia mais

AVALIAÇÃO DE DESEMPENHO DE PROCESSAMENTO DISTRIBUÍDO EM LARGA ESCALA COM HADOOP

AVALIAÇÃO DE DESEMPENHO DE PROCESSAMENTO DISTRIBUÍDO EM LARGA ESCALA COM HADOOP AVALIAÇÃO DE DESEMPENHO DE PROCESSAMENTO DISTRIBUÍDO EM LARGA ESCALA COM HADOOP Débora Stefani Lima de Souza dsls@cin.ufpe.br Orientador: Dr. Paulo Romero Martins Maciel INTRODUÇÃO Nem sempre os dados

Leia mais

AEDI Introdução Revisão 2

AEDI Introdução Revisão 2 exatasfepi.com.br AEDI Introdução Revisão 2 André Luís Duarte...mas os que esperam no Senhor renovarão as suas forças; subirão com asas como águias; correrão, e não se cansarão; andarão, e não se fatigarão.is

Leia mais

Conjunto de fios paralelos que permitem a transmissão de dados, endereços e sinais de controle entre a UCP, memória e dispositivos de entrada e

Conjunto de fios paralelos que permitem a transmissão de dados, endereços e sinais de controle entre a UCP, memória e dispositivos de entrada e Conjunto de fios paralelos que permitem a transmissão de dados, endereços e sinais de controle entre a UCP, memória e dispositivos de entrada e saída. Conjunto de fios paralelos que permitem a transmissão

Leia mais

Introdução à Computação

Introdução à Computação Slide 02 22/05/2017 Introdução à Computação Prof. Cleziel Franzoni da Costa @Cleziel 1 /Cleziel cleziel@hotmail.com cleziel.wordpress.com 42 3 Hardware x Software 4 Hardware x Software 5 Hardware Todo

Leia mais

AULA1 Introdução a Microprocessadores gerais. Disciplina: Aplicações Avançadas de Microprocessadores (AAM)

AULA1 Introdução a Microprocessadores gerais. Disciplina: Aplicações Avançadas de Microprocessadores (AAM) AULA1 Introdução a Microprocessadores gerais Disciplina: Aplicações Avançadas de Microprocessadores (AAM) Tópicos: Conceitos gerais Evolução dos Microprocessadores Arquiteturas Principais características

Leia mais