Optimização e Algoritmos (2004/2005)



Documentos relacionados
MAT CÁLCULO 2 PARA ECONOMIA. Geometria Analítica

UNIVERSIDADE FEDERAL DO ABC. 1 Existência e unicidade de zeros; Métodos da bissecção e falsa posição

Análise I Solução da 1ª Lista de Exercícios

Aulas 6 / 05 de setembro

Método dos gradientes (ou método de máxima descida)

Testes de Hipóteses Estatísticas

2.1 Sucessões. Convergência de sucessões

Códigos Reed-Solomon CAPÍTULO 9

Regras para evitar ciclagem

Exercícios e questões de Álgebra Linear

Quinta lista de Exercícios - Análise Funcional, período Professor: João Marcos do Ó. { 0 se j = 1 y j = (j 1) 1 x j 1 se j 2.

Pontos extremos, vértices e soluções básicas viáveis

UNIVERSIDADE FEDERAL DO ABC

Departamento de Matemática da Universidade de Coimbra. Licenciatura em Matemática. e B =

Humberto José Bortolossi [01] (a) (1.0) Escreva infinitos números racionais que pertençam ao intervalo

Matemática I. 1 Propriedades dos números reais

Processos Estocásticos

Neste capítulo estamos interessados em resolver numericamente a equação

Questão 4 (2,0 pontos). Defina função convexa (0,5 pontos). Seja f : I R uma função convexa no intervalo aberto I. Dado c I (qualquer)

1 Limites e Conjuntos Abertos

Representação de poliedros

Análise Matemática III - Turma especial

Optimização e Algoritmos (2004/2005) Série de Problemas 1 Programação Linear, Método Simplex

Seu pé direito nas melhores Faculdades

Técnicas de. Integração

UNIVERSIDADE FEDERAL DE PERNAMBUCO DEPARTAMENTO DE ESTATÍSTICA. Medida e Probabilidade

Aula 5. Uma partícula evolui na reta. A trajetória é uma função que dá a sua posição em função do tempo:

1 a Lista de Exercícios de MAT3458 Escola Politécnica 2 o semestre de 2016

FLAVIA MESCKO FERNANDES VELOCIDADE DE CONVERGÊNCIA DE MÉTODOS DE OTIMIZAÇÃO IRRESTRITA

Método de Newton truncado

Duas aplicações da Topologia à Álgebra Linear. 1 Quando são duas matrizes semelhantes?

Sequências e Séries Infinitas. Copyright Cengage Learning. Todos os direitos reservados.

Prova de Admissão para o Mestrado em Matemática IME-USP

Exercícios de MATEMÁTICA COMPUTACIONAL. 1 0 Semestre de 2009/2010 Resolução Numérica de Equações Não-Lineares

Professor João Soares 20 de Setembro de 2004

SISTEMAS LINEARES PROF. EDÉZIO

Lista de Exercícios da Primeira Semana Análise Real

Recorrendo à nossa imaginação podemos tentar escrever números racionais de modo semelhante: 1 2 =

LIMITES E CONTINUIDADE

Considere a função f(x). Para algum x a f (x) pode não existir. Suponha que. Max f(x) s. a a x b

Primeira Lista de Álgebra Linear

Lista 4. Esta lista, de entrega facultativa, tem três partes e seus exercícios versam sobre séries, funções contínuas e funções diferenciáveis em R.

Gabarito e Pauta de Correção ENQ

1.3 Conjuntos de medida nula

GEOMETRIA DESCRITIVA A

Métodos Numéricos. A. Ismael F. Vaz. Departamento de Produção e Sistemas Escola de Engenharia Universidade do Minho aivaz@dps.uminho.

Programação Linear M É T O D O S : E S T A T Í S T I C A E M A T E M Á T I C A A P L I C A D A S D e 1 1 d e m a r ç o a 2 9 d e a b r i l d e

Módulo de Equações do Segundo Grau. Equações do Segundo Grau: Resultados Básicos. Nono Ano

PESQUISA OPERACIONAL -PROGRAMAÇÃO LINEAR. Prof. Angelo Augusto Frozza, M.Sc.

Universidade Federal de Viçosa Centro de Ciências Exatas - CCE Departamento de Matemática Primeira Lista de MAT641 - Análise no R n

Topologia. Fernando Silva. (Licenciatura em Matemática, 2007/2008) 13-agosto-2018

Análise Convexa. 1. Conjuntos convexos 1.1. Casca convexa, ponto extremo, cone. 2. Hiperplanos: suporte, separador, teorema da separação

Teoria da Medida e Integração (MAT505)

MEDIDAS COM SINAL.. Uma medida com sinal σ-aditiva (ou, simplesmente, uma medida com sinal) µ(a n ) def = lim

CÁLCULO DIFERENCIAL E INTEGRAL I LMAC, MEBIOM, MEFT 1 o SEM. 2014/15 2 a FICHA DE EXERCÍCIOS. k + e 1 x, x > 0 f(x) = x cos 1, x > 0

1 A Equação Fundamental Áreas Primeiras definições Uma questão importante... 7

LISTA 3 DE INTRODUÇÃO À TOPOLOGIA 2011

O Cálculo λ sem Tipos

INSTITUTO SUPERIOR TÉCNICO Mestrado Integrado em Engenharia Física Tecnológica Ano Lectivo: 2007/2008 Semestre: 1 o

Otimização Combinatória - Parte 4

Noções de Álgebra Linear

Propriedades das Linguagens Livres do Contexto

étodos uméricos SISTEMAS DE EQUAÇÕES LINEARES (Continuação) Prof. Erivelton Geraldo Nepomuceno PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA

GABRIEL BUJOKAS

Exercícios Extra de Computação. Secção de Matemática Departamento de Engenharia Civil FEUP

MAT Topologia Bacharelado em Matemática 2 a Prova - 27 de maio de 2004

A = B, isto é, todo elemento de A é também um elemento de B e todo elemento de B é também um elemento de A, ou usando o item anterior, A B e B A.

Métodos iterativos dão-nos uma valor aproximado para s. Sequência de valores de x que convergem para s.

O PRINCÍPIO DAS GAVETAS Paulo Cezar Pinto Carvalho - IMPA

ÁLGEBRA LINEAR I - MAT0032

ÁLGEBRA LINEAR I - MAT Determinar se os seguintes conjuntos são linearmente dependente ou linearmente independente (R).

36 a Olimpíada Brasileira de Matemática Nível Universitário Primeira Fase

Programação Linear. MÉTODOS QUANTITATIVOS: ESTATÍSTICA E MATEMÁTICA APLICADAS De 30 de setembro a 13 de novembro de 2011 prof. Lori Viali, Dr.

Espaços Euclidianos. Espaços R n. O conjunto R n é definido como o conjunto de todas as n-uplas ordenadas de números reais:

{ 1 se x é racional, 0 se x é irracional. cos(k!πx) = cos(mπ) = ±1. { 1 se x Ak

EXERCÍCIOS DE ÁLGEBRA LINEAR E GEOMETRIA ANALÍTICA (sistemas de equações lineares e outros exercícios)

x B A x X B B A τ x B 3 B 1 B 2

EXERCÍCIOS DE MATEMÁTICA COMPUTACIONAL: PRIMEIRO BIMESTRE: EDGARD JAMHOUR. QUESTÃO 1: Indique as afirmativas verdadeiras.

Convergência, séries de potência e funções analíticas

Capítulo 2. Conjuntos Infinitos. 2.1 Existem diferentes tipos de infinito

Questão (a) 4.(b) 5.(a) 5.(b) 6.(a) 6.(b) 6.(c) 7 Cotação

Análise Complexa e Equações Diferenciais 1 ō Semestre 2016/2017

Equações não lineares

ACH2043 INTRODUÇÃO À TEORIA DA COMPUTAÇÃO. Aula 25

Cálculo Diferencial e Integral 2 Formas Quadráticas

Método de Newton modificado

Transcrição:

Optimização e Algoritmos (2004/2005) Instituto Superior Técnico Engenharia Electrotécnica e de Computadores Série de Problemas 3 Regras de Armijo e Wolfe, Introdução às funções convexas Problema 1.[Regras de Armijo e Wolfe] Considere o problema de optimização φ(t) (1) min t>0 onde φ : [0, + ) R é uma função de classe C 1 (ou seja, diferenciável e com derivada contínua). Aqui, assume-se que φ (0) < 0 (ou seja, φ é inicialmente decrescente). Este programa de optimização surge como subproblema nos algoritmos de optimização que operam por pesquisa em linhas. Nesse contexto, dado que o objectivo primordial é minimizar uma função objectivo f em R n (da qual φ é apenas uma fatia unidimensional), não se torna importante resolver exactamente o problema (1). É suficiente resolver (1) aproximadamente, ou seja, basta encontrar em R + =(0, + ) umpontot que seja aceitável. O critério de aceitabilidade depende da regra adoptada. Neste problema, introduzem-se 2 regras: a regra de Armijo e a regra de Wolfe. Ambas as regras estabelecem uma partição de R + em 3 conjuntos disjuntos: A, D, E. Esses conjuntos têm o seguinte significado: o conjunto A é o conjunto dos pontos aceitáveis ; D é o conjunto dos pontos demasiado à direita ; o conjunto E é o conjunto dos pontos demasiado à esquerda. (Atenção: esta terminologia não significa forçosamente que, por exemplo, todos os pontos em D sejam estritamente maiores que os pontos em A; veja os exemplos adiante). Mais especificamente, temos Armijo: Wolfe: A = { t>0:φ(t) φ(0) + σφ (0)t } D = { t>0:φ(t) >φ(0) + σφ (0)t } E = A = { t>0:φ(t) φ(0) + σφ (0)t e φ (t) λφ (0) } D = { t>0:φ(t) >φ(0) + σφ (0)t } E = { t>0:φ(t) φ(0) + σφ (0)t e φ (t) <λφ (0) } (2) (3) As constantes σ e λ são escolhidas pelo utilizador, mas devem satisfazer 0 <σ<λ<1. (Note que, para a regra de Armijo, nunca existem pontos demasiado à esquerda ). (a) [Regra de Armijo: exemplo 1] Considere a função φ(t) =8t 5 98 3 t4 +42t 3 95 6 t2 3t cujo gráfico se apresenta na figura 1. Usando a regra de Armijo, determine (aproximadamente) os conjuntos A, E e D e represente-os em R + para (i) 1

σ =0.4 (ii) σ =0.6 e(iii) σ =0.8. Sugere-se a utilização do MATLAB 2 1 0 1 2 3 4 0 0.5 1 1.5 2 2.5 Figura 1: φ(t) [Problema 1(a)] para uma determinação numérica mais precisa de A, D, E. Em qualquer dos casos, éútil neste tipo de problemas começar por desenhar as rectas φ(0) + σφ (0)t sobrepostas ao gráfico da função φ(t). A título de exemplo, exibe-se na figura 2 o caso referente a σ =0.4. (b) [Regra de Armijo: exemplo 2] Repita a alínea anterior para a função φ(t) =t 2 2t cujo gráfico se apresenta na figura 3. (c) [Regra de Wolfe: exemplo 1] Considere de novo a função φ(t) =8t 5 98 3 t4 +42t 3 95 6 t2 3t cujo gráfico se apresenta na figura 1. Usando a regra de Wolfe, determine os conjuntos A, E e D e represente-os em R + para (i) (σ, λ) =(0.4, 0.6) (ii) (σ, λ) =(0.6, 0.8) e (iii) (σ, λ) =(0.8, 0.9). (d) [Regra de Wolfe: exemplo 2] Considere de novo a função φ(t) =t 2 2t cujo gráfico se apresenta na figura 3. Usando a regra de Wolfe, determine os conjuntos A, E e D e represente-os em R + para (i) (σ, λ) =(0.4, 0.6) (ii) (σ, λ) =(0.6, 0.8) e (iii) (σ, λ) =(0.8, 0.9). Problema 2.[Regra de Armijo: propriedade básica] Considere a regra de Armijo descrita no problema 1 e uma função φ :[0, + ) R de classe 2

2 1 0 1 2 3 4 0 0.5 1 1.5 2 2.5 Figura 2: φ(t) eφ(0) + 0.4φ (0)t [Problema 1(a)] C 1 ecomφ (0) < 0. Mostre que, para qualquer d D, existe um ponto aceitável no intervalo (0,d). [Pista: note que φ (0) <σφ (0). Agora, dado que φ écontínua, existe t > 0 tal que φ (t) <σφ (0)paratodoo t [0,t ]. Explorando a identidade conclua que t é aceitável ] φ(t )=φ(0) + t 0 φ (t)dt Problema 3.[Regra de Wolfe: propriedade básica] Considere a regra de Wolfe descrita no problema 1 e uma função φ :[0, + ) R de classe C 1 ecomφ (0) < 0. O objectivo deste problema é mostrar que, para quaisquer e Ee d Dsatisfazendo e<d, existe um ponto aceitável no intervalo (e, d). (a) Defina o conjunto S =(e, + ) D esejam =infs. Mostre que m>e.[pista: assuma que m = e. Então, mostre que épossível sintetizar uma sequência t k >e, que converge para e e satisfaz φ(t k ) φ(e) σφ (0). t k e Tomando o limite k + na expressão acima, conclua que φ (e) σφ (0) e que esta última desigualdade contradiz e E.] (b) Note que, pela alínea anterior, já sabemos que φ(t) φ(0) + σφ (0)t para todo o t (0,m). Agora, mostre que φ(m) φ(0) + σφ (0)m. 3

0.4 0.2 0 0.2 0.4 0.6 0.8 1 0 0.5 1 1.5 2 2.5 Figura 3: φ(t) [Problema 1(b)] [Pista: considere uma sequência t k Dque converge para m.] (c) Use o resultado da alínea anterior para mostrar a existência de um ponto t (e, m) (e, d) que satisfaz φ (t ) >λφ (0). [Pista: aplique o teorema do valor intermédio à função φ no intervalo [e, m]. Recorde que este teorema garante a existência de um ponto t (e, m) que satisfaz φ (t )= φ(m) φ(e). m e Mostre que a expressão acima implica φ (t ) σφ (0) e note que 0 <σ< λ<1.] (d) Mostre que t é um ponto aceitável. Problema 4.[Localização de pontos aceitáveis: parte I] Considere o contexto do problema 1 que visa a resolução aproximada do problema de optimização min φ(t) t>0 onde φ : [0, + ) R é uma função de classe C 1 com φ (0) < 0. Mais precisamente, pretende-se localizar um ponto aceitável usando a regra de Armijo ou de Wolfe. Para localizar um ponto aceitável pode-se utilizar o algoritmo na tabela 1. Comentários ao algoritmo da tabela 1: o algoritmo testa sucessivamente pontos até aprovar um (termina quando encontra um ponto aceitável ); 4

1. inicialização escolher t 0 > 0 2. inicializar e =0, d =+, k =0 3. ciclo testar t k : 4. se t k A: terminar 5. se t k D: d = t k 6. se t k E: e = t k 7. testar d: 8. se d =+ : escolher t k+1 >t k 9. se d<+ : escolher t k+1 (e, d) 10. k k +1 e retornar ao ciclo Tabela 1: Algoritmo para localização de um ponto aceitável na linha 8 do algoritmo assuma (para simplificar) que se escolhe t k+1 > t k fazendo t k+1 = αt k (onde α > 1é uma constante previamente escolhida); na linha 9 do algoritmo assuma (para simplificar) que se escolhe t k+1 (e, d) fazendo t k+1 =(e + d)/2; as variáveis internas e e d definem um intervalo (e, d) que,à luz dos problemas 2 e 3, sabemos que contém um ponto aceitável ; cada modificação em d (linha 5), resulta na diminuição de d e cada modificação em e (linha 6), resulta no aumento de e; portanto, cada modificação em e ou d, aperta o intervalo (e, d); em cada iteração k, é executada apenas uma das linhas 4, 5 ou 6; em cada iteração k, é executada apenas uma das linhas 8 ou 9. O objectivo deste problema é provar que este algoritmo localiza um ponto aceitável num número finito de iterações, independentemente da regra (Armijo ou Wolfe) adoptada. Note que esta propriedade de terminação finita é crucial: no contexto dos algoritmos de optimização que operam por pesquisas em linha, este algoritmo de localização de pontos aceitáveis é invocadoemcadaiteração; se entrar em ciclo infinito, o algoritmo primário fica bloqueado. 5

Neste problema, assuma que φ é limitada inferiormente, ou seja, existe m tal que φ(t) m para todo o t 0. (a) Comece por provar que a linha 8 não pode ser executada infinitamente. [Pista: suponha que a linha 8 é executada infinitamente. Observe que, necessariamente, a linha 5 nunca é executada. Logo, os pontos t k gerados pelo algoritmo são sempre considerados demasiado à esquerda. Mostre então que t k pertence a E e verifica t k +. Conclua que φ(t mk ), contradizendo assim o facto de φ ser limitada inferiormente.] (b) Pela alínea anterior, sabemos que a linha 8 deixa de ser executada pelo algoritmo após um número K de iterações. Isto implica que é a linha 9 que passa a ser executada em cada iteração k>k. Suponha que o algoritmo corre infinitamente. Seja e k e d k o valor de e e d ao final da iteração k. Mostre que e k é uma sucessão crescente, d k é uma sucessão decrescente e ambas convergem para um mesmo ponto t. [Pista: cada alteração em e ou d aperta o intervalo (e, d) para metade do comprimento.] Mostre que φ(d k ) φ(t ) d k t σφ (0) e, passando ao limite, conclua que φ (t ) σφ (0) >λφ (0). Por outro lado, observe que φ (e k ) λφ (0) o que, passando ao limite, resulta φ (t ) λφ (0) e gera uma contradição. Problema 5.[Localização de pontos aceitáveis: parte II] Considere o algoritmo descrito na tabela 1. (a) [Regra de Armijo] Considere a função φ(t) =8t 5 98 3 t4 +42t 3 95 6 t2 3t cujo gráfico se apresenta na figura 1. Faça uma implementação em MATLAB do algoritmo na tabela 1, para a regra de Armijo. Nota: não se pretende aqui que utilize os resultados obtidos no problema 1 para a função φ; o seu programa em MATLAB deve testar cada ponto t k usando as definições em (2). Mostre a sequência de pontos t k gerados pelo algoritmo quando usa (i) σ =0.4 (ii) σ =0.6 e(iii) σ =0.8. Para qualquer dos casos, faça t 0 =1.5 e α =3. (b) [Regra de Wolfe] Para a mesma função φ da alínea anterior, faça uma implementação em MATLAB do algoritmo na tabela 1, utilizando agora a regra de Wolfe. Mostre a sequência de pontos t k gerados pelo algoritmo quando usa (i) (σ, λ) =(0.4, 0.6) e t 0 =2(ii) (σ, λ) =(0.4, 0.6) e t 0 =1.5 (iii) (σ, λ) = 6

(0.6, 0.8) e t 0 =1.5. Para qualquer dos casos, faça α =3. Problema 6.[Conjuntos convexos: propriedades gerais] Um conjunto S R n diz-se convexo se (1 λ)x 1 + λx 2 S para quaisquer x 1,x 2 S e λ [0, 1]. Ou seja, S é convexo se para quaisquer x 1,x 2 S osegmentode recta que une x 1 a x 2 também pertence a S. (a) Mostre que a intersecção de conjuntos convexos é um conjunto convexo. (b) Prove ou exiba um contra-exemplo: a união de conjuntos convexos é um conjunto convexo. (c) Suponha que S é um conjunto convexo, limitado e aberto em R. Mostre que S é um intervalo (a, b). [Pista: mostre que S =(m, M) onde m =infs e M =sups] (d) Mostre que S R n é convexo se e só se λ 1 x 1 + λ 2 x 2 + + λ k x k S, para quaisquer x 1,x 2,...,x k S e λ 1,λ 2,...,λ k 0, λ 1 +λ 2 + +λ k =1. [Pista: para provar a necessidade da condição, use indução em k.] Problema 7.[Conjuntos convexos elementares] Usando a definição, mostre que os seguintes conjuntos são convexos em R n : (a) [Semi-espaço] onde a R n (a 0)eb R (b) [Hiperplano] S = { x R n : a T x b }, S = { x R n : a T x = b }, onde a R n (a 0)eb R (c) [Bola] S = {x R n : x x 0 <R}, onde x 0 R n e R>0 (d) [Cone] S = {a 1 µ 1 + a 2 µ 2 + + a k µ k : µ 1,µ 2,...,µ k 0} R n, onde a 1,a 2,...,a k R n.esboçe o conjunto S = {a 1 µ 1 + a 2 µ 2 : µ 1,µ 2 0} em R 2, onde a 1 =(1, 1) e a 2 =(0, 1). Problema 8.[Conjuntos convexos] Usando a definição, mostre que os seguintes conjuntos são convexos em R n n : 7

(a) [Matrizes triangulares inferiores com diagonal positiva] S = { X R n n : X ij =0, para 1 i<j n, e X ii > 0 para i =1,...,n }. Osímbolo X ij representa a entrada na linha i, coluna j da matriz X. (b) [Matrizes simétricas] S = { X R n n : X = X T } (c) [Matrizes definidas positivas] S = { X R n n : X 0 }. A notação X 0significaqueX ésimétrica e y T Xy > 0paratodoo y R n, y 0. (d) [Matrizes com entradas não-negativas e traço unitário] S = { X R n n : X ij 0etr(X) =1 }. Problema 9.[Funções convexas: propriedades gerais] Seja S R n um conjunto convexo. Uma função f : S R diz-se convexa se f ((1 λ)x 1 + λx 2 ) (1 λ)f(x 1 )+λf(x 2 ), para quaisquer x 1,x 2 S e λ [0, 1]. (a) Seja S R n um conjunto convexo. Para x 0 R n e d R n defina-se o conjunto I x0,d = {t R : x 0 + td S}. Mostre que I x0,d é um conjunto convexo em R. (b) Seja S R n um conjunto convexo e f : S R. Mostre que f é convexa se e só seφ x0,d : I x0,d R, φ x0,d(t) =f(x 0 + td) é uma função convexa (para qualquer x 0 R n e d R n ). [Nota: este resultado permite reduzir o teste de convexidade de funções em R n ao teste de convexidade de funções em R] (c) Seja S R n um conjunto convexo e f : S R. Mostre que f é convexa se e só se f(λ 1 x 1 + λ 2 x 2 + + λ k x k ) λ 1 f(x 1 )+λ 2 f(x 2 )+ + λ k f(x k ), para quaisquer x 1,x 2,...,x k S e λ 1,λ 2,...,λ k 0, λ 1 +λ 2 + +λ k =1. (d) Seja S R n um conjunto convexo e f : S R. Mostre: se f é convexa, então S α = {x S : f(x) α} é um conjunto convexo, para qualquer α R. O reverso é verdadeiro? (e) Seja g : A R n R uma função definida num conjunto A. O epígrafo de g é o conjunto epi(g) = { (x, t) R n+1 : x A,g(x) t }. 8

Seja S R n um conjunto convexo e f : S R. Mostre que f é convexa seesóseepi(f) é um conjunto convexo em R n+1. (f) Use a alínea anterior para determinar se as seguintes funções são convexas: (i) f : R R, f(x) =sin(x); (ii) f : R R, f(x) =x 2 ; (iii) f : R + R, f(x) =log(x); (iv) f : R + R, f(x) =e x. 9