Controle Ótimo - Aula 2 (Exemplos 2, 3 e 4)
|
|
|
- Luiz Felipe Taveira
- 6 Há anos
- Visualizações:
Transcrição
1 Controle Ótimo - Aula 2 (Exemplos 2, 3 e 4) Adriano A. G. Siqueira e Marco H. Terra Departamento de Engenharia Elétrica Universidade de São Paulo - São Carlos
2 Sistemas dinâmicos discretos no tempo O Problema Básico x k+1 = f k (x k, u k, w k ), k = 0, 1,..., N 1 com x k S k, u k U k (x k ) C k e w k variável aleatória Dado um estado inicial x 0, encontrar uma política admissível ótima π = {µ 0, µ 1,..., µ N 1 } que minimize o custo esperado N 1 J = J π (x 0 ) = min π Π {E wk {g N (x N )+ k=0 g k (x k, µ k (x k ), w k )}}
3 Algoritmo da Programação Dinâmica Para cada condição inicial x 0, o custo ótimo J (x 0 ) do problema básico é igual a J 0 (x 0 ), o último passo do seguinte algoritmo que evolui de modo reverso no tempo de N 1 até 0 : Passo N: J N (x N ) := g N (x N ) para todo x N S k Passo k: J k (x k ) = min uk U k (x k ){E wk {g k (x k, u k, w k ) +J k+1 (f k (x k, u k, w k ))}}, k = N 1,..., 0 Se u k = µ k (x k) minimiza o lado direito da equação do passo k, a política π = {µ 0, µ 1,..., µ N 1 } é ótima
4 Exemplo 2: Controle de Estoque Exemplo 1.1, p.3 + exemplo 3.2, p.23 [Bertsekas, 95] Considere o problema de se ordenar uma quantidade de um determinado item a cada período de um horizonte de N = 3 períodos (meses). Denota-se: x k o estoque disponível no início do k-ésimo período u k o estoque ordenado (e imediatamente enviado) no início do k-ésimo período w k demanda no késimo período.
5 Exemplo 2: Controle de Estoque Restrições e considerações: O estoque a cada instante é positivo e limitado, 0 x k 2 Ordena-se a cada instante quantidades positivas e limitadas, 0 u k 2 Demanda positiva e limitada, 0 w k 2, com distribuição de probabilidade conhecida: p(w k = 0) = 0.1, p(w k = 1) = 0.7, p(w k = 2) = 0.2, para k = 0,..., N 1 (a mesma distribuição de probabilidade para todos os períodos). As variáveis aleatórias w 0, w 1, w 2 são independentes.
6 Exemplo 2: Controle de Estoque Existe um limite máximo de 2 unidades que podem ser estocadas a cada período: x k + u k 2 Custo do estoque de material: r (s k ) = (x k + u k w k ) 2 Custo de se ordenar u k itens é c k u k com c k = 1 (c k é o custo por unidade) Custo terminal zero: g N (x N ) = g 3 (x 3 ) = 0. Qual melhor política de pedidos (ordem de compra)?
7 Exemplo 2: Controle de Estoque Solução: Vamos colocar o problema de otimização na forma padrão: Custo a ser minimizado em um horizonte de N = 3 min (u0,u 1,u 2 )E (w0,w 1,w 2 ){g 3 (x 3 ) + 2 [u k + (x k + u k w k ) 2 ]} k=0 Sequência {x 1, x 2, x 3 } é gerada segundo a lei dinâmica: x k+1 = f k (x k, u k, w k ) = max{0, x k + u k w k }
8 Exemplo 2: Controle de Estoque Custo a cada período g k (x k, u k, w k ) = u k + (x k + u k w k ) 2, k = 0, 1, 2 g N (x N ) = g 3 (x 3 ) = 0. Restrições: S k = {0, 1, 2}, k = 0, 1, 2 C k = {0, 1, 2} U k (x k ) = {u k C k : x k + u k 2} (para cada x k S k ) x k U k (x k ) 0 {0, 1, 2} 1 {0, 1} 2 {0}
9 Exemplo 2: Controle de Estoque Algoritmo da Programação Dinâmica. Passo k = N = 3: J 3 (x 3 ) = g 3 (x 3 ) = 0, para todo x 3 S 3. x 3 J 3 (x 3 )
10 Exemplo 2: Controle de Estoque Passo k = N 1 = 2: J 2 (x 2 ) =min u2 U 2 (x 2 )E w2 {g 2 (x 2, u 2, w 2 ) + J 3 (f 2 (x 2, u 2, w 2 ))} =min u2 U 2 (x 2 )E w2 {u 2 + (x 2 + u 2 w 2 ) 2 } Note que o domínio de J 2 é dado por S 2 = {0, 1, 2}.
11 Exemplo 2: Controle de Estoque Para x 2 = 0. J 2 (x 2 = 0) = min u2 U 2 (x 2 =0)E w2 {u 2 + (u 2 w 2 ) 2 } = min u2 {0,1,2}E w2 {u 2 + (u 2 w 2 ) 2 } = min u2 {0,1,2}[(u 2 + u 2 2)p(w 2 = 0) + (u 2 + (u 2 1) 2 )p(w 2 = 1) + (u 2 + (u 2 2) 2 )p(w 2 = 2)] = min u2 {0,1,2}[0.1(u 2 +u 2 2)+0.7(u 2 +(u 2 1) 2 )+0.2(u 2 +(u 2 2) 2 )] = min u2 {0,1,2}, [u u (u 2 1) (u 2 2) 2 ] = min{1.5, 1.3, 3.1} = 1.3 A ação ótima de controle para x 2 = 0 é dada por µ 2 (x 2 = 0) = 1.
12 Exemplo 2: Controle de Estoque Para x 2 = 1 J 2 (x 2 = 1) = min u2 U 2 (x 2 =1)E w2 {u 2 + (1 + u 2 w 2 ) 2 } = min u2 {0,1}E w2 {u 2 + (1 + u 2 w 2 ) 2 } = min u2 {0,1}[u 2 + (1 + u 2 ) 2 p(w 2 = 0) + u 2 2p(w 2 = 1) + (u 2 1) 2 p(w 2 = 2)] = min u2 {0,1}[u (1 + u 2 ) u (u 2 1) 2 ] = min{0.3, 2.1} = 0.3 A ação ótima de controle para x 2 = 1 é dada por µ 2 (x 2 = 1) = 0.
13 Exemplo 2: Controle de Estoque Para x 2 = 2. J 2 (x 2 = 2) = min u2 U 2 (x 2 =2)E w2 {u 2 + (2 + u 2 w 2 ) 2 } = min u2 {0}E w2 {u 2 + (2 + u 2 w 2 ) 2 } = E w2 {(2 w 2 ) 2 } = [2 2 p(w 2 = 0) + (1) 2 p(w 2 = 1) + (0) 2 p(w 2 = 2)] = [ ] = 1.1 A ação ótima de controle para x 2 = 2 é dada por µ 2 (x 2 = 2) = 0. Assim, obtemos a função J 2 e a função µ 2 : x 2 J 2 (x 2 ) µ 2 (x 2 )
14 Exemplo 2: Controle de Estoque Passo k = 1 J 1 (x 1 ) = min u1 U 1 (x 1 )E w1 {g 1 (x 1, u 1, w 1 ) + J 2 (f 1 (x 1, u 1, w 1 ))} J 1 (x 1 ) = min u1 U 1 (x 1 )E w1 {u 1 + (x 1 + u 1 w 1 ) 2 + J 2 (max{0, x 1 + u 1 w 1 })} Note que o domínio de J 1 é dado por S 1 = {0, 1, 2}.
15 Exemplo 2: Controle de Estoque Para x 1 = 0 J 1 (x 1 = 0) = min u1 U 1 (x 1 =0)E w1 {u 1 + (u 1 w 1 ) 2 + J 2 (max{0, u 1 w 1 })} J 1 (x 1 = 0) = min u1 {0,1,2}E w1 {u 1 + (u 1 w 1 ) 2 + J 2 (max{0, u 1 w 1 })} J 1 (x 1 = 0) = min{e w1 {w J 2 (max{0, w 1 })}, E w1 {1 + (1 w 1 ) 2 + J 2 (max{0, 1 w 1 })}, E w1 {2 + (2 w 1 ) 2 + J 2 (max{0, 2 w 1 })}}
16 Exemplo 2: Controle de Estoque (u 1 = 0) E w1 {w1 2 + J 2 (max{0, w 1 })} = [0 2 + J 2 (0)]p(w 1 = 0) + [1 2 + J 2 (max{0, 1})]p(w 1 = 1) +[2 2 + J 2 (max{0, 2})]p(w 1 = 2) = J 2 (0) p(w 1 = 0) + [1 + J 2 (0)]p(w 1 = 1) + [4 + J 2 (0)]p(w 1 = 2) = J 2 (0) + p(w 1 = 1) + 4p(w 1 = 2) = = 2.8
17 Exemplo 2: Controle de Estoque (u 1 = 1) E w1 {1 + (1 w 1 ) 2 + J 2 (max{0, 1 w 1 }) = [ J 2 (1)]p(w 1 = 0) + [ J 2 (0)]p(w 1 = 1) +[1 + ( 1) 2 + J 2 (max{0, 1})]p(w 1 = 2) = J 2 (1) p(w 1 = 0) + J 2 (0) [p(w 1 = 1) + p(w 1 = 2)] p(w 1 = 0) + p(w 1 = 2) = [ ] = 2.5
18 Exemplo 2: Controle de Estoque (u 1 = 2) E w1 {2 + (2 w 1 ) 2 + J 2 (max{0, 2 w 1 })} = 2 + E w1 {(2 w 1 ) 2 + J 2 (max{0, 2 w 1 })} = 2 + [4 + J 2 (2)]p(w 1 = 0) + [1 + J 2 (1)]p(w 1 = 1) + J 2 (0) p(w 1 = 2) = 2 + [ ] [ ] = 3.68 Portanto J 1 (x 1 = 0) = min{2.8, 2.5, 3.68} = 2.5 e o valor da lei ótima para x 1 = 0 é dada por µ 1 (x 1 = 0) = 1.
19 Exemplo 2: Controle de Estoque Para x 1 = 1 J 1 (x 1 = 1) = min u1 U 1 (x 1 =1)E w1 {u 1 + (1 + u 1 w 1 ) 2 + J 2 (f 1 (x 1, u 1, w 1 ))} J 1 (x 1 = 1) = min u1 {0,1}E w1 {u 1 + (1 + u 1 w 1 ) 2 + J 2 (max{0, 1 + u 1 w 1 })} = min{e w1 {(1 w 1 ) 2 + J 2 (max{0, 1 w 1 })}, E w1 {1 + (2 w 1 ) 2 + J 2 (max{0, 2 w 1 })}}
20 Exemplo 2: Controle de Estoque (u 1 = 0) E w1 {(1 w 1 ) 2 + J 2 (max{0, 1 w 1 })} = [1 + J 2 (1)]p(w 1 = 0) + J 2 (0) p(w 1 = 1) + [1 + J 2 (0)]p(w 1 = 2) = [ ] [ ] 0.2 = 1.2 (u 1 = 1) E w1 {1 + (2 w 1 ) 2 + J 2 (max{0, 2 w 1 })} = 2.68 Portanto J 1 (x 1 = 1) = min{1.2, 2.68} = 1.2 e o valor da lei ótima para x 1 = 1 é dada por µ 1 (x 1 = 1) = 0.
21 Exemplo 2: Controle de Estoque Para x 1 = 2 J 1 (x 1 = 2) = min u1 U 1 (x 1 =2)E w1 {u 1 + (2 + u 1 w 1 ) 2 + J 2 (max{0, 2 + u 1 w 1 })} J 1 (x 1 = 2) = E w1 {(2 w 1 ) 2 + J 2 (max{0, 2 w 1 })} = 1.68 e o valor da lei ótima para x 1 = 2 é dada por µ 1 (x 1 = 2) = 0. Assim, obtemos a função J 1 e a função µ 1 : x 1 J 1 (x 1 ) µ 1 (x 1 )
22 Exemplo 2: Controle de Estoque Passo k = 0 J 0 (x 0 ) = min u0 U 0 (x 0 )E w0 {g 0 (x 0, u 0, w 0 ) + J 1 (f 0 (x 0, u 0, w 0 ))} J 0 (x 0 ) = min u0 {0,1,2}E w0 {u 0 +(x 0 + u 0 w 0 ) 2 +J 1 (max{0, x 0 + u 0 w 0 })} Procedendo da mesma forma que nos casos anteriores obtemos x 0 J 0 (x 0 ) µ 0 (x 0 ) A política ótima de ordem de compra para cada período é pedir uma unidade se o corrente estoque é zero e não fazer pedido de compra caso haja algum estoque.
23 Exemplo 3: Custo quadrático Exemplo 3 (Adaptado do exemplo 4.2.1, p.298 [Lewis86]) Considere a planta x k+1 = x k + u k, k = 0, 1 (N = 2) na qual o estado pode assumir apenas os valores 0, a, 2a, 3a sendo a > 0 (o estado é positivo, limitado e assume apenas valores discretos) e podemos escolher o valor do sinal de controle u k a cada etapa dentre os seguintes valores (desde que não viole as restrições do estado) 2a, a, 0, a, 2a.
24 Exemplo 3: Custo quadrático Determinar a sequência de controle ótima (u 0, u 1) que minimiza o índice de desempenho quadrático x (u2 0 + u 2 1) para cada valor de x 0 e o respectivo custo ótimo. Solução: Vamos colocar o problema na forma padrão: O sistema dinâmico x k+1 = f k (x k, u k ) = x k + u k, k = 0, 1 (N = 2). Espaço de estados para cada instante k é dado por S 0 = S 1 = S 2 = {0, a, 2a, 3a}
25 Exemplo 3: Custo quadrático A variável de decisão (controle) u k a ser selecionada no instante k pertence ao espaço C k = { 2a, a, 0, a, 2a}, k = 0, 1, 2 Note que o controle u k é restringido a tomar valores em um sub-conjunto U k (x k ) C k que depende apenas do valor corrente do estado x k x k U k (x k ) 0 {0, a, 2a} a { a, 0, a, 2a} 2a { 2a, a, 0, a} 3a { 2a, a, 0}
26 Exemplo 3: Custo quadrático O custo a cada instante g k (x k, u k ) está indicado no funcional desempenho. g N (x N ) = g 2 (x 2 ) = x 2 2 g 1 (x 1, u 1 ) = 1 2 u2 1 g 0 (x 0, u 0 ) = 1 2 u2 0
27 Exemplo 3: Custo quadrático Algorítmo da Programação Dinâmica. Comece com k = N = 2. J 2 (x 2 ) = g 2 (x 2 ) = x 2 2, x 2 S 2 = {0, a, 2a, 3a}. x J 2 (x) 0 0 a a 2 2a 4a 2 3a 9a 2
28 Exemplo 3: Custo quadrático k = N 1 = 1 J 1 (x 1 ) = min u1 U 1 (x 1 ){g 1 (x 1, u 1 ) + J 2 (f 1 (x 1, u 1 ))} = min u1 U 1 (x 1 ){ 1 2 u2 1 + (x 1 + u 1 ) 2 } O espaço de estados é S 1 = {0, a, 2a, 3a}. Se x 1 = 0, o custo ótimo é J 1 (x 1 = 0) = min u1 {0,a,2a}{ 3 2 u2 1} = 0 e a lei de controle ótimo é tal que µ 1 (x 1 = 0) = 0.
29 Exemplo 3: Custo quadrático Se x 1 = a, o custo ótimo é J 1 (a) = min u1 U 1 (a){ 1 2 u2 1 + (a + u 1 ) 2 } = min u1 { a,0,a,2a}{ 1 2 u2 1 + (a + u 1 ) 2 } = min{ 1 2 a2, a 2, 9 2 a2, 11a 2 } = 1 2 a2 e a lei de controle ótimo é tal que µ 1 (x 1 = a) = a. Se x 1 = 2a, o custo ótimo é J 1 (2a) = min u1 { 2a, a,0,a}{ 1 2 u2 1 + (2a + u 1 ) 2 } = min{2a 2, 3 2 a2, 4a 2, 19 2 a2 } = 3 2 a2 e a lei de controle ótimo é tal que µ 1 (2a) = a.
30 Exemplo 3: Custo quadrático Se x 1 = 3a, o custo ótimo é J 1 (3a) = min u1 { 2a, a,0}{ 1 2 u2 1 + (3a + u 1 ) 2 } = min{3a 2, 9 2 a2, 9a 2 } = 3a 2 e a lei de controle ótimo é tal que µ 1 (3a) = 2a. Assim, a função J 1 : S 1 R + e a lei de controle admissível µ 1 : S 1 C 1 são dados pela tabela x 1 J 1 (x 1 ) µ 1 (x 1 ) a 2 a2 a 3 2a 2 a2 a 3a 3a 2 2a
31 Exemplo 3: Custo quadrático k = 0 O custo ótimo é J 0 (x 0 ) = min u0 U 0 (x 0 ){g 0 (x 0, u 0 ) + J 1 (f 0 (x 0, u 0 ))} = min u0 U 0 (x 0 ){ 1 2 u2 0 + J 1 (x 0 + u 0 )} O espaço de estados é S 0 = {0, a, 2a, 3a}. Se x 0 = 0, o custo ótimo é J 0 (x 0 = 0) = min u0 U 0 (x 0 =0){ 1 2 u2 0 + J 1 (x 0 + u 0 )} = min u0 {0,a,2a}{ 1 2 u2 0 + J 1 (u 0 )} = min{0, a 2, 7 2 a2 } = 0 e a lei de controle ótimo é tal que µ 0 (x 0 = 0) = 0.
32 Exemplo 3: Custo quadrático Se x 0 = a, o custo ótimo é J 0 (a) = min u0 { a,0,a,2a}{ 1 2 u2 0 + J 1 (a + u 0 )} = min{ 1 2 a2, 1 2 a2, 2a 2, 5a 2 } = 1 2 a2 e a lei de controle ótimo não é única e podemos fazer µ 1 0 (x 0 = a) = a ou µ 2 0 (x 0 = a) = 0. Se x 0 = 2a, o custo ótimo é J 0 (2a) = min u0 { 2a, a,0,a}{ 1 2 u2 0 + J 1 (2a + u 0 )} = min{2a 2 + J 1 (0), 1 2 a2 + J 1 (a), J 1 (2a), 1 2 a2 + J 1 (3a)} = min{2a 2, a 2, 3 2 a2, 7 2 a2 } = a 2 e a lei de controle ótimo é tal que µ 0 (x 0 = 2a) = a.
33 Exemplo 3: Custo quadrático Se x 0 = 3a, o custo ótimo é J 0 (3a) = min u0 { 2a, a,0}{ 1 2 u2 0 + J 1 (3a + u 0 )} = min{ 5 2 a2, 2a 2, 3a 2 } = 2a 2 e a lei de controle ótimo é µ 0 (x 0 = 3a) = a. Assim, a função J 0 : S 0 R + e a lei de controle admissível µ 0 : S 0 C 0 são dados pela tabela x 0 J 0 (x 0 ) µ 0 (x 0 ) a 1 2 a2 a ou 0 2a a 2 a 3a 2a 2 a
34 Exemplo 3: Custo quadrático A sequência de controle ótima (u 0, u 1) e o respectivo custo ótimo para cada valor possível de x 0 são facilmente determinados conforme a tabela abaixo. x 0 (u 0, u 1) J 0 (x 0 ) 0 (0, 0) 0 a (0, a) ou ( a, 0) 1 2 a2 2a ( a, a) a 2 3a ( a, a) 2a 2
35 Exemplo 3: Custo quadrático
36 Exercício (software) Faça um programa em Matlab para resolver o problema acima para um valor genérico de N e com o índice de desempenho x 2 N + r N 1 k=0 u 2 k, r > 0 para cada valor de x 0 e o respectivo custo ótimo. 1) Teste o programa com o resultado do exemplo acima. 2) O que acontece com os valores de x N quando se aumenta N? 3) Para x 0 e N fixos, o que acontece com o sinal {u k } quando se aumenta r? 4) Existe algum r 0 para qual o problema de otimização ainda tem solução?
37 Exemplo 4: Problema do forno Exemplo 3.1, p.20 [Bertsekas 95]) Certo material atravessa um seqüência de dois fornos x 0 temperatura inicial do material x k temperatura do material na saída do forno k u k temperatura média do forno k Modelo x k+1 = (1 a)x k + au k, k = 0, 1 (N = 2) com 0 < a < 1
38 Exemplo 4: Problema do forno Objetivo: aproximar x 2 de um valor desejado T, gastando menos energia Índice de desempenho quadrático r(x 2 T ) 2 + u u 2 1 com r > 0. O custo a cada instante: g k (x k, u k ) g N (x N ) = g 2 (x 2 ) = r(x 2 T ) 2 g 1 (x 1, u 1 ) = u 2 1 g 0 (x 0, u 0 ) = u 2 0
39 Exemplo 4: Problema do forno Algorítmo da Programação Dinâmica. Comece com k = N = 2. J 2 (x 2 ) = g 2 (x 2 ) = r(x 2 T ) 2 k = N 1 = 1 J 1 (x 1 ) = min u1 {u J 2 (x 2 )} = min u1 {u J 2 ((1 a)x 1 + au 1 )} = min u1 {u r ((1 a)x 1 + au 1 T ) 2 }
40 Exemplo 4: Problema do forno Derivando com relação a u 1 e igualando a zero 0 = 2u 1 + 2ra ((1 a)x 1 + au 1 T ) Portanto µ 1 (x 1 ) = ra(t (1 a)x 1) 1+ra 2 Custo ótimo J 1 (x 1 ) = r((1 a)x 1 T ) 1+ra 2
41 Exemplo 4: Problema do forno k = 0 J 0 (x 0 ) = min u0 {u J 1 (x 1 )} = min u0 {u J 1 ((1 a)x 0 + au 0 )} = min u0 {u r ((1 a) 2 x 0 +(1 a)au 0 T) 2 1+ra 2 } Derivando com relação a u 0 e igualando a zero, temos µ 0 (x 0 ) = r(1 a)a (T (1 a) 2 x 0) 1+ra 2 (1+(1 a) 2 ) Custo ótimo J 0 (x 0 ) = r ((1 a) 2 x 0 T) 2 1+ra 2 (1+(1 a) 2 )
42 Exemplo 4: Problema do forno Considere agora x k+1 = (1 a)x k + au k + w k sendo w 0,w 1 variáveis aleatórias com dada distribuição, média zero (E{w 0 } = E{w 1 } = 0) e variância finita J 1 (x 1 ) = min u1 E w1 {u r ((1 a)x 1 + au 1 + w 1 T ) 2 } = min u1 [u r ((1 a)x 1 + au 1 T ) 2 +2rE{w 1 } ((1 a)x 1 + au 1 T ) + re{w 2 1}] min u1 [u r ((1 a)x 1 + au 1 T ) 2 ] + re{w 2 1} Princípio da Equivalência Certeza
43 O problema linear quadrático Problema do Regulador Linear Quadrático (LQR) de horizonte finito: Dado o sistema linear x k+1 = A k x k + B k u k, k = 0, 1,..., N 1 com as restrições x k S k, u k U k (x k ) C k para cada k, minimizar o índice de desempenho quadrático x T N Q Nx N + N 1 ( k=0 x T k Q k x k + u T k R ) ku k.
44 O problema linear quadrático Problema do Regulador Linear Quadrático Gaussiano (LQG) de horizonte finito: Dado o sistema linear x k+1 = A k x k + B k u k + w k, k = 0, 1,..., N 1 com as restrições x k S k para cada k, u k U k (x k ) C k para cada k, {w 0,..., w N 1 } é uma sequência de vetores aleatórios independentes de média zero, variância finita e distribuição de probabilidade independente de x k e u k,
45 O problema linear quadrático Problema: minimizar em {u k } o índice de desempenho quadrático { E {w0,...,w N 1 } x T N Q Nx N + N 1 ( k=0 x T k Q k x k + u T k R ) } ku k
46 Exercícios, Prazo: 2 semanas Exercício: 1.1 (pág. 37) [Bertsekas 95] Considere o sistema x k+1 = x k + u k + w k, k = 0, 1, 2, 3 com estado inicial x 0 = 5, e função custo N 1 k=0 (x2 k + u2 k ) Aplique o algoritmo da Programação Dinâmica para os seguintes casos: a) O conjunto de restrições do controle U k (x k ) é {u 0 x k + u 5, u inteiro } para todo x k e k, e o distúrbio w k é igual a zero para todo k. b) A restrição do controle e o distúrbio são como em (a), mas existe uma restrição adicional, x 4 = 5 no estado final. Dica: Defina um espaço de estados para x 4 que consiste apenas do valor x 4 = 5, e redefine U 3 (x 3 ). De forma alternativa, você pode usar um custo final g 4 (x 4 ) igual a um valor muito alto para x 4 5.
47 Exercícios, Prazo: 2 semanas c) A restrição do controle é como em (a) e o distúrbio w k assume valores 1 e 1 com probabilidade 1/2 para todo x k e u k, exceto se x k + u k é igual a 0 ou 5 neste caso w k = 0 com probabilidade 1. Exercício: 1.6 (pág. 40) [Bertsekas 95] Seja o problema básico, e considere a seguinte função custo E wk {α N g N (x N ) + N 1 k=0 αk g k (x k, µ k (x k ), w k )} sendo α um fator de desconto com 0 < α < 1. Mostre que uma forma alternativa do algortimo da Programção Dinâmica é V N (x N ) := g N (x N ), V k (x k ) = min uk U k (x k ){E wk {g k (x k, u k, w k ) +αv k+1 (f k (x k, u k, w k ))}}, k = N 1,..., 0
Controle Ótimo - Aula 8 Equação de Hamilton-Jacobi
Controle Ótimo - Aula 8 Equação de Hamilton-Jacobi Adriano A. G. Siqueira e Marco H. Terra Departamento de Engenharia Elétrica Universidade de São Paulo - São Carlos O problema de controle ótimo Considere
Controle Ótimo - Aula 1 (Prova do Algoritmo da PD e Exemplo 1)
1 Controle Ótimo - Aula 1 (Prova do Algoritmo da PD e Exemplo 1) Adriano Almeida Gonçalves Siqueira e Marco H. Terra Algoritmo da Programação Dinâmica: Para cada condição inicial x 0, o custo ótimo J (x
Controle Ótimo - Aula 10 Princípio do Mínimo de Pontryagin
Controle Ótimo - Aula 10 Princípio do Mínimo de Pontryagin Adriano A. G. Siqueira e Marco H. Terra Departamento de Engenharia Elétrica Universidade de São Paulo - São Carlos O problema de controle ótimo
Sexta Lista: Geração de Números Pseudo-Aleatórios e Método de Monte Carlo
Sexta Lista: Geração de Números Pseudo-Aleatórios e Método de Monte Carlo Antônio Carlos Roque da Silva Filho e Cristiano R. F. Granzotti 26 de junho de 2017 Os exercícios desta lista devem ser resolvidos
3. Otimização sob Incerteza
3. Otimização sob Incerteza Os problemas de otimização tentam resolver, de forma eficiente, situações do mundo real por meio de modelos matemáticos que utilizam parâmetros incertos. Pode-se encontrar na
Otimização Aplicada à Engenharia de Processos
Otimização Aplicada à Engenharia de Processos Aula 4: Programação Linear Felipe Campelo http://www.cpdee.ufmg.br/~fcampelo Programa de Pós-Graduação em Engenharia Elétrica Belo Horizonte Março de 2013
lnteligência Artificial Introdução ao Processo Decisório de Markov
lnteligência Artificial Introdução ao Processo Decisório de Markov Aprendizado - paradigmas Aprendizado supervisionado O crítico comunica a EA o erro relativo entre a ação que deve ser tomada idealmente
Otimização Linear. Profª : Adriana Departamento de Matemática. wwwp.fc.unesp.br/~adriana
Otimização Linear Profª : Adriana Departamento de Matemática [email protected] wwwp.fc.unesp.br/~adriana Forma geral de um problema Em vários problemas que formulamos, obtivemos: Um objetivo de otimização
Jogos de soma zero com dois jogadores
Jogos de soma zero com dois jogadores Problema: Dada uma matriz A m n, encontrar um equilíbrio de Nash (de estratégias mistas). Jogador 1 quer encontrar p que maximize v sujeito a i p i = 1 sujeito a (pa)
Aula 22: Formulações com número exponencial de variáveis
Aula 22: Formulações com número exponencial de variáveis Otimização Linear e Inteira Túlio Toffolo http://www.toffolo.com.br BCC464 / PCC174 2018/2 Departamento de Computação UFOP Aula de Hoje 1 Correção
Métodos de Pesquisa Operacional
Métodos de Pesquisa Operacional Programação Linear é a parte da Pesquisa Operacional que trata da modelagem e resolução de problemas formulados com funções lineares. Programação Linear } Métodos de Resolução
Estatística e Modelos Probabilísticos - COE241
Estatística e Modelos Probabilísticos - COE241 Aula passada Somas aleatórias Aula de hoje Introdução à simulação Geração de números aleatórios Lei dos Grandes Números Simulação de Sistemas Discretos É
BCC465 - TÉCNICAS DE MULTI-OBJETIVO. Gladston Juliano Prates Moreira 22 de novembro de 2017
BCC465 - TÉCNICAS DE OTIMIZAÇÃO MULTI-OBJETIVO Aula 04 - Otimização Não-linear Gladston Juliano Prates Moreira email: [email protected] CSILab, Departamento de Computação Universidade Federal de Ouro
Redes Neurais e Sistemas Fuzzy
Redes Neurais e Sistemas Fuzzy O ADALINE e o algoritmo LMS O ADALINE No contexto de classificação, o ADALINE [B. Widrow 1960] pode ser visto como um perceptron com algoritmo de treinamento baseado em minimização
LISTA DE EXERCÍCIOS - AJUSTE DE MÍNIMOS QUADRADOS Cálculo Numérico para Geociências Prof. Eduardo Colli
LISA DE EXERCÍCIOS - AJUSE DE MÍNIMOS QUADRADOS Cálculo Numérico para Geociências - 009 - Prof. Eduardo Colli Em todos os casos, convencionamos ter um conjunto de dados (, ), com i = 1,..., N. Faça o gráfico
MAT2457 ÁLGEBRA LINEAR PARA ENGENHARIA I Gabarito da 2 a Prova - 1 o semestre de 2015
MAT27 ÁLGEBRA LINEAR PARA ENGENHARIA I Gabarito da 2 a Prova - 1 o semestre de 201 Nesta prova considera-se fixada uma orientação do espaço e um sistema de coordenadas Σ (O, E) em E 3, em que E é uma base
Considere a função f(x). Para algum x a f (x) pode não existir. Suponha que. Max f(x) s. a a x b
Considere a função f(x). Para algum x a f (x) pode não existir. Suponha que se queira resolver o seguinte PPNL: Max f(x) s. a a x b Pode ser que f (x) não exista ou que seja difícil resolver a equação
UNIVERSIDADE FEDERAL DO ABC. 1 Existência e unicidade de zeros; Métodos da bissecção e falsa posição
UNIVERSIDADE FEDERAL DO ABC BC1419 Cálculo Numérico - LISTA 1 - Zeros de Funções (Profs. André Camargo, Feodor Pisnitchenko, Marijana Brtka, Rodrigo Fresneda) 1 Existência e unicidade de zeros; Métodos
Codificação de Huffman
Codificação de Huffman Bruna Gregory Palm 11 de setembro de 2017 A codificação de Huffman é um método de compressão que considera as probabilidades de ocorrência de cada símbolo no conjunto de dados a
Renato Martins Assunção
Análise Numérica Renato Martins Assunção DCC - UFMG 2012 Renato Martins Assunção (DCC - UFMG) Análise Numérica 2012 1 / 84 Equação linear Sistemas de equações lineares A equação 2x + 3y = 6 é chamada linear
Modelagem Computacional. Parte 8 2
Mestrado em Modelagem e Otimização - RC/UFG Modelagem Computacional Parte 8 2 Prof. Thiago Alves de Queiroz 2/2016 2 [Cap. 10 e 11] BURDEN, R. L.; FAIRES, J. D. Numerical Analysis (9th ed). Cengage Learning,
Representação de poliedros
Representação de poliedros Marina Andretta ICMC-USP 8 de novembro de 2016 Baseado no livro Introduction to Linear Optimization, de D. Bertsimas e J. N. Tsitsiklis. Marina Andretta (ICMC-USP) sme0211 -
Estatística e Modelos Probabilísticos - COE241
Estatística e Modelos Probabilísticos - COE241 Aula passada Análise da dados através de gráficos Introdução a Simulação Aula de hoje Introdução à simulação Geração de números aleatórios Lei dos Grandes
Pesquisa Operacional
Pesquisa Operacional Teoria da Dualidade Profa. Sheila Morais de Almeida DAINF-UTFPR-PG outubro - 2015 Problema Dual Cada problema de Programa de Programação Linear está associado a um outro problema de
Primeiro Exercício programa: Como o Google ordena páginas. MAP-2121 para EPUSP
Primeiro Exercício programa: Como o Google ordena páginas MAP-2121 para EPUSP 1 Instruções gerais Os exercícios computacionais pedidos na disciplina Cálculo Numérico têm por objetivo fundamental familiarizar
Resolução de sistemas de equações lineares: Método do Gradiente
Resolução de sistemas de equações lineares: Método do Gradiente Marina Andretta ICMC-USP 24 de março de 2015 Marina Andretta (ICMC-USP) sme0301 - Métodos Numéricos para Engenharia I 24 de março de 2015
3 Aprendizado por reforço
3 Aprendizado por reforço Aprendizado por reforço é um ramo estudado em estatística, psicologia, neurociência e ciência da computação. Atraiu o interesse de pesquisadores ligados a aprendizado de máquina
OTIMIZAÇÃO. O processo de otimização normalmente involve a procura de pontos de máximos e mínimos de uma função.
OTIMIZAÇÃO O processo de otimização normalmente involve a procura de pontos de máximos e mínimos de uma função. Pontos de máximos e mínimos de uma função são pontos onde a derivada da função é nula. A
Capítulo 5 - Optimização Não-Linear
Capítulo 5 - Optimização Não-Linear [email protected] Departamento de Matemática Escola Superior de Tecnologia e Gestão de Bragança Mestrados em Engenharia da Construção Métodos de Aproximação em Engenharia
Fundamentos de Lógica e Algoritmos Aula 2.5 Conceitos Básicos de Algoritmos. Prof. Dr. Bruno Moreno
Fundamentos de Lógica e Algoritmos Aula 2.5 Conceitos Básicos de Algoritmos Prof. Dr. Bruno Moreno [email protected] Introdução Um algoritmo pode ser definido como uma sequência finita de passos
x exp( t 2 )dt f(x) =
INTERPOLAÇÃO POLINOMIAL 1 As notas de aula que se seguem são uma compilação dos textos relacionados na bibliografia e não têm a intenção de substituir o livro-texto, nem qualquer outra bibliografia Aproximação
CEFET/RJ Inteligência Artificial (2017.2) Professor: Eduardo Bezerra Lista de exercícios 03
. CEFET/RJ Inteligência Artificial (2017.2) Professor: Eduardo Bezerra ([email protected]) Lista de exercícios 03 Créditos: essa lista de exercícios contém a tradução dos exercícios disponibilizados
PROPOSTA DE RESOLUÇÃO DA PROVA DE MATEMÁTICA A DO ENSINO SECUNDÁRIO (CÓDIGO DA PROVA 635) 2ª FASE 20 DE JULHO 2018 CADERNO 1
PROPOSTA DE RESOLUÇÃO DA PROVA DE MATEMÁTICA A DO ENSINO SECUNDÁRIO (CÓDIGO DA PROVA 635) ª FASE 0 DE JULHO 08 CADERNO... P00/00 Como se trata de uma distribuição normal temos que: ( ) 0,9545. P µ σ
Otimização Combinatória - Parte 4
Graduação em Matemática Industrial Otimização Combinatória - Parte 4 Prof. Thiago Alves de Queiroz Departamento de Matemática - CAC/UFG 2/2014 Thiago Queiroz (DM) Parte 4 2/2014 1 / 33 Complexidade Computacional
4 Implementação Computacional
4 Implementação Computacional 4.1. Introdução Neste capítulo é apresentada a formulação matemática do problema de otimização da disposição das linhas de ancoragem para minimizar os deslocamentos (offsets)
Algoritmos de ordenação: Inserção e Shellsort
CENTRO FEDERAL DE EDUCAÇÃO TECNOLÓGICA DE MINAS GERAIS Algoritmos de ordenação: Inserção e Shellsort Algoritmos e Estruturas de Dados I Slides adaptados dos slides do livro texto (Ziviani) e dos slides
Teoremas de dualidade
Teoremas de dualidade Marina Andretta ICMC-USP 19 de outubro de 2016 Baseado no livro Introduction to Linear Optimization, de D. Bertsimas e J. N. Tsitsiklis. Marina Andretta (ICMC-USP) sme0211 - Otimização
Método do Lagrangiano aumentado
Método do Lagrangiano aumentado Marina Andretta ICMC-USP 23 de novembro de 2010 Marina Andretta (ICMC-USP) sme0212 - Otimização não-linear 23 de novembro de 2010 1 / 17 Problema com restrições gerais Vamos
Álgebra Linear I - Aula 10. Roteiro
Álgebra Linear I - Aula 10 1. Distância entre duas retas. 2. A perpendicular comum a duas retas. 3. Posições relativas. Roteiro 1 Distância entre duas retas r e s Calcularemos a distância entre duas retas
Aula 19: Lifting e matrizes ideais
Aula 19: Lifting e matrizes ideais Otimização Linear e Inteira Túlio A. M. Toffolo http://www.toffolo.com.br BCC464/PCC174 2018/2 Departamento de Computação UFOP Previously... Branch-and-bound Formulações
Álgebra Linear e Geometria Analítica
Instituto Politécnico de Viseu Escola Superior de Tecnologia Departamento: Matemática Álgebra Linear e Geometria Analítica Curso: Engenharia Electrotécnica Ano: 1 o Semestre: 1 o Ano Lectivo: 007/008 Ficha
Método Simplex. Marina Andretta ICMC-USP. 19 de outubro de 2016
Método Simplex Marina Andretta ICMC-USP 19 de outubro de 2016 Baseado no livro Introduction to Linear Optimization, de D. Bertsimas e J. N. Tsitsiklis. Marina Andretta (ICMC-USP) sme0211 - Otimização linear
Programação Linear. (2ª parte) Informática de Gestão Maria do Rosário Matos Bernardo 2016
Programação Linear (2ª parte) Informática de Gestão 61020 Maria do Rosário Matos Bernardo 2016 Conteúdos Representação e resolução gráfica dos problemas de programação linear Problema de minimização Problema
PESQUISA OPERACIONAL. Fabiano F. T. dos Santos. Instituto de Matemática e Estatística
PESQUISA OPERACIONAL Fabiano F. T. dos Santos Instituto de Matemática e Estatística Dualidade em Programação Linear Todo problema de programação linear, que chamaremos de primal, traz consigo um segundo
Otimização Linear. Profª : Adriana Departamento de Matemática. wwwp.fc.unesp.br/~adriana
Otimização Linear Profª : Adriana Departamento de Matemática [email protected] wwwp.fc.unesp.br/~adriana Revisão Método Simplex Solução básica factível: xˆ xˆ, xˆ N em que xˆ N 0 1 xˆ b 0 Solução geral
Existência e otimalidade de pontos extremos
Existência e otimalidade de pontos extremos Marina Andretta ICMC-USP 19 de outubro de 2016 Baseado no livro Introduction to Linear Optimization, de D. Bertsimas e J. N. Tsitsiklis. Marina Andretta (ICMC-USP)
PROPOSTA DE RESOLUÇÃO DA PROVA DE MATEMÁTICA A DO ENSINO SECUNDÁRIO (CÓDIGO DA PROVA 635) 2ª FASE 20 DE JULHO 2018 CADERNO 1
Associação de Professores de Matemática Contactos: Rua Dr. João Couto, n.º 7-A 500-36 Lisboa Tel.: +35 76 36 90 / 7 03 77 Fax: +35 76 64 4 http://www.apm.pt email: [email protected] PROPOSTA DE RESOLUÇÃO DA
Curso Profissional de Nível Secundário
Curso Profissional de Nível Secundário Técnico Auxiliar de Saúde 2 TAS Ano Letivo: 2014/2015 Matemática (200 horas) 11º Ano PLANIFICAÇÃO A LONGO PRAZO A7 Probabilidades Fenómenos aleatórios. 2 aulas Argumento
Programação Linear M É T O D O S : E S T A T Í S T I C A E M A T E M Á T I C A A P L I C A D A S D e 1 1 d e m a r ç o a 2 9 d e a b r i l d e
Programação Linear A otimização é o processo de encontrar a melhor solução (ou solução ótima) para um problema. Existe um conjunto particular de problemas nos quais é decisivo a aplicação de um procedimento
Álgebra Linear I - Aula 9. Roteiro
Álgebra Linear I - Aula 9 1. Distância entre duas retas. 2. A perpendicular comum a duas retas. 3. Posições relativas. Roteiro 1 Distância entre duas retas r e s Calcularemos a distância entre duas retas
Espaços Euclidianos. Espaços R n. O conjunto R n é definido como o conjunto de todas as n-uplas ordenadas de números reais:
Espaços Euclidianos Espaços R n O conjunto R n é definido como o conjunto de todas as n-uplas ordenadas de números reais: R n = {(x 1,..., x n ) : x 1,..., x n R}. R 1 é simplesmente o conjunto R dos números
DEPARTAMENTO DE ENGENHARIA MECÂNICA
DEPARTAMENTO DE ENGENHARIA MECÂNICA Otimização: Algoritmos e Aplicações na Engenharia Mecânica ENG1786 & MEC2403 Ivan Menezes 2018-2 1 EMENTA 1. Introdução 1.1 Definições Básicas 1.2 Classificação dos
NOTAS DE AULA 1 METAHEURÍSTICA 13/10/2016
NOTAS DE AULA 1 METAHEURÍSTICA 13/10/2016 Metaheurística: São técnicas de soluções que gerenciam uma interação entre técnicas de busca local e as estratégias de nível superior para criar um processo de
Análise Multivariada Aplicada à Contabilidade
Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com [email protected] Turma: 2º / 2016 1 Agenda
PCC104 - Projeto e Análise de Algoritmos
PCC104 - Projeto e Análise de Algoritmos Marco Antonio M. Carvalho Departamento de Computação Instituto de Ciências Exatas e Biológicas Universidade Federal de Ouro Preto 1 de novembro de 2018 Marco Antonio
Estratégias Evolutivas EEs. Prof. Juan Moisés Mauricio Villanueva
Estratégias Evolutivas EEs Prof. Juan Moisés Mauricio Villanueva [email protected] www.cear.ufpb.br/juan Estratégias Evolutivas Desenvolvidas por Rechenberg e Schwefel, e estendida por Herdy, Kursawe
Método Simplex dual. Marina Andretta ICMC-USP. 24 de outubro de 2016
Método Simplex dual Marina Andretta ICMC-USP 24 de outubro de 2016 Baseado no livro Introduction to Linear Optimization, de D. Bertsimas e J. N. Tsitsiklis. Marina Andretta (ICMC-USP) sme0211 - Otimização
Marina Andretta. 10 de outubro de Baseado no livro Introduction to Linear Optimization, de D. Bertsimas e J. N. Tsitsiklis.
Solução básica viável inicial Marina Andretta ICMC-USP 10 de outubro de 2016 Baseado no livro Introduction to Linear Optimization, de D. Bertsimas e J. N. Tsitsiklis. Marina Andretta (ICMC-USP) sme0211
Programação Linear - Parte 5
Matemática Industrial - RC/UFG Programação Linear - Parte 5 Prof. Thiago Alves de Queiroz 1/2016 Thiago Queiroz (IMTec) Parte 5 1/2016 1 / 29 Dualidade Os parâmetros de entrada são dados de acordo com
Física Geral - Laboratório. Aula 2: Organização e descrição de dados e parâmetros de dispersão e correlação
Física Geral - Laboratório Aula 2: Organização e descrição de dados e parâmetros de dispersão e correlação 1 Física Geral - Objetivos Ao final do período, o aluno deverá ser capaz de compreender as principais
Cálculo das Probabilidades I
Cálculo das Probabilidades I Departamento de Estatística Universidade Federal da Paraíba Prof. Tarciana Liberal (UFPB) Aula Função Geradora de Momentos 10/13 1 / 19 Calculamos algumas características da
Planejamento da Operação de Sistemas Hidrotérmicos. Parte III
Universidade Federal de Paraná Setor de Tecnologia Departamento de Engenharia Elétrica Planejamento da Operação de Sistemas Hidrotérmicos Parte III Prof. Dr. Clodomiro Unsihua-Vila SISTEMA TERMELÉTRICO
Metodologias e Critérios para o planejamento de Sistemas de Energia Elétrica Dr. Eng. Clodomiro Unsihuay Vila
Universidade Federal de Paraná Setor de Tecnologia Departamento de Engenharia Elétrica Metodologias e Critérios para o planejamento de Sistemas de Energia Elétrica Dr. Eng. Clodomiro Unsihuay Vila Curitiba-Brasil,
Lista 4 com respostas
Lista 4 com respostas Professora Nataliia Goloshchapova MAT0 - semestre de 05 Exercício. Estude a posição relativa das retas r e s. (a) r : X = (,, ) + λ(,, ), s : (b) r : x y z = x y = 5 x + y z = 0,
c PAVF 2 Otimizac~ao 'Aurelio' Otimizac~ao.[De otimizar+-c~ao] S.f. 1. Estat. Processo pelo qual se determina o valor otimo de uma grandeza. Otimo.[Do
c PAVF 1 Introduc~ao Otimizac~ao Modelos de otimizac~ao Aplicac~oes Descric~ao do curso c PAVF 2 Otimizac~ao 'Aurelio' Otimizac~ao.[De otimizar+-c~ao] S.f. 1. Estat. Processo pelo qual se determina o valor
PRE29006 LISTA DE EXERCÍCIOS #
INSTITUTO FEDERAL DE SANTA CATARINA CAMPUS SÃO JOSÉ COORDENADORIA DE ÁREA DE TELECOMUNICAÇÕES ENGENHARIA DE TELECOMUNICAÇÕES PRE9006 LISTA DE EXERCÍCIOS #3 06. Exercícios. [, Exercício 7.] Seja A uma variável
Teoria de dualidade. Marina Andretta ICMC-USP. 19 de outubro de 2016
Teoria de dualidade Marina Andretta ICMC-USP 19 de outubro de 2016 Baseado no livro Introduction to Linear Optimization, de D. Bertsimas e J. N. Tsitsiklis. Marina Andretta (ICMC-USP) sme0211 - Otimização
Análise de Dados e Simulação
Universidade de São Paulo Instituto de Matemática e Estatística http:www.ime.usp.br/ mbranco Simulação de Variáveis Aleatórias Contínuas. O método da Transformada Inversa Teorema Seja U U (0,1). Para qualquer
Árvores. SCC-214 Projeto de Algoritmos. Thiago A. S. Pardo. Um nó após o outro, adjacentes Sem relações hierárquicas entre os nós, em geral
SCC-214 Projeto de Algoritmos Thiago A. S. Pardo Listas e árvores Listas lineares Um nó após o outro, adjacentes Sem relações hierárquicas entre os nós, em geral Diversas aplicações necessitam de estruturas
Um modelo estocástico para o fluxo de caixa de um plano de previdência de um indivíduo 15
2 Simulação estocástica A simulação computacional consiste em empregar técnicas matemáticas em computadores com o propósito de gerar ensaios que tentam reproduzir de maneira análoga um processo ou operação
Método dos Mínimos Quadrados
Método dos Mínimos Quadrados Laura Goulart UESB 4 de Abril de 2019 Laura Goulart (UESB) Método dos Mínimos Quadrados 4 de Abril de 2019 1 / 22 Objetivos O Método dos Mínimos Quadrados (MMQ) é uma técnica
Programação Hidrotérmica com Restrição de Energia Hidráulica
Programação Hidrotérmica com Restrição de Energia Hidráulica Prof. Antonio Simões Costa Universidade Federal de Santa Catarina A. Simões Costa (GSP - Labspot) Programação H-T com Restrição de Energia 1
3. Tem-se: Como não pode ser, então. ( não pode ser porque se assim fosse a probabilidade de sair a face numerada com o número
EXAME NACIONAL DO ENSINO SECUNDÁRIO MATEMÁTICA A PROVA MODELO N.º 1 PROPOSTA DE RESOLUÇÃO 12.º ANO DE ESCOLARIDADE Site: http://recursos-para-matematica.webnode.pt/ Facebook: https://www.facebook.com/recursos.para.matematica
Anexo 1 - Revisões de Teoria das Probabilidades e Processos Estocásticos
1 Anexo 1 - Revisões de Teoria das Probabilidades e Processos Estocásticos Documento auxiliar à disciplina de Modelação, Identificação e Controlo Digital Alexandre Bernardino 003/005 IST-Secção de Sistemas
