Avaliação de Algoritmos de Estimativa de Pose para Reconstrução 3D e Realidade Aumentada

Tamanho: px
Começar a partir da página:

Download "Avaliação de Algoritmos de Estimativa de Pose para Reconstrução 3D e Realidade Aumentada"

Transcrição

1 Avaliação de Algoritmos de Estimativa de Pose para Reconstrução 3D e Realidade Aumentada Vinícius Miranda César 1, Thiago Farias 1, Samuel Macedo 1, Judith Kelner 1, Ismael Santos 2 1 Centro de Informática da UFPE: {vinicius,mouse,svmm,jk}@gprtufpebr 2 CENPES-Petrobras: ismaelh@petrobrascombr Resumo Estimativa de poses de câmera é uma área amplamente estudada em visão computacional e fotogrametria pela comunidade científica, possuindo diversas aplicações, principalmente em reconstrução 3D e realidade aumentada Devido à grande quantidade de algoritmos existentes na literatura e à ausência de estudos comparativos destes algoritmos em reconstrução 3D, a proposta deste artigo é avaliar os algoritmos de estimativa de pose de câmera (DLT, PNP, POSIT e EPnP) no contexto de reconstrução 3D offline por vídeo Dentro deste contexto, este trabalho fará uma análise standalone para algoritmos robustos utilizando algumas métricas propostas pelos autores Resultados preliminares e as conclusões obtidas nesta pesquisa também serão apresentadas Index Terms visão computacional; avaliação; estimativa; pose; reconstrução 3D; I INTRODUÇÃO O cálculo de estimativas de pose é um problema de visão computacional que consiste em descobrir uma transformação P que projeta um conjunto de pontos tridimensionais X i em suas respectivas coordenadas bidimensionais x i A matriz P é uma transformação composta de parâmetros intrínsecos (distância focal, skew, ponto principal, etc) e extrínsecos (a pose) da câmera A pose, por sua vez, é composta por uma rotação e uma translação Esse problema também é conhecido por PnP [3] (Perspective-n-Point) Este problema é recorrente na área de visão computacional, fotogrametria e reconstrução 3D Ele é utilizado em diversas aplicações no campo da robótica e do rastreamento de objetos Uma instância direta da aplicação em rastreamento de objetos e reconstrução 3D é a subárea de realidade aumentada sem marcadores, uma vez que essa estimativa permite saber de qual ponto de vista está sendo capturado o mundo real, permitindo a adição de novos objetos à cena Reconstrução 3D a partir de imagens (conjunto de fotos ou um vídeo) demanda um conhecimento multidisciplinar que engloba diversas áreas como: processamento de imagem, visão computacional, geometria, álgebra linear, otimização de sistemas não lineares, entre outras O pipeline de reconstrução 3D por vídeo pode ser dividido em três fases: a primeira fase consiste no processamento do vídeo para a detecção de pontos de interesse (features) no rastreamento destes pontos nos frames subsequentes O conjunto das features rastreadas em todos os frames será utilizado como entrada para a próxima etapa do pipeline Na etapa seguinte, as features são processadas e a partir deste processamento são selecionados dois frames, chamados keyframes Estes keyframes são utilizados como base para a reconstrução 3D inicial, composta de um conjunto de pontos 3D e duas poses, dentre as quais a primeira é tida como identidade - nenhuma rotação em nenhum dos eixos e translação na origem Essas poses são obtidas através do cálculo da matriz fundamental e não são produzidas por algoritmos de estimativa de pose Na terceira e última etapa, são avaliados os frames restantes para se obter a pose da câmera em cada instante do vídeo utilizando um algoritmo de estimativa de pose O cálculo de pose desta etapa, através de um algoritmo de estimativa de pose específico, recebe como entrada a correlação entre as features (pontos 2D) e seus pontos 3D respectivos calculados na segunda fase Dessa forma é possível reconstruir toda a cena ao longo do vídeo Isto faz a estimativa de pose um dos principais subprodutos da reconstrução 3D No pipelilne de reconstrução 3D, ao se utilizar dados de cenas reais, ocorre normalmente uma introdução acumulativa de erros a cada etapa executada, principalmente na aquisição das features, em que pode haver muito ruído causado por condições de iluminação e pelo sensor da câmera Tais fatores podem gerar imprecisão e falso casamento das features, sendo necessário que as estimativas de poses sejam robustas a erros como os comentados previamente, e que assim possam evitar seu acúmulo à medida que os frames são reconstruídos Existe na literatura uma gama de algoritmos que se propõem a resolver esse problema através de diversas abordagens Algumas buscam a solução algébrica através de um sistema linear, como o DLT[5], outros utilizam um argumento geométrico para descobrir a pose, como o POSIT[2], PNP[16] e EPNP[10] Diante dos desafios expostos e da grande variedade de algoritmos, constatou-se que as avaliações existentes não são adequadas para reconstrução 3D, como também não exploram a maioria dos algoritmos existentes, além de não realizarem análises estatísticas robustas Uma prática comum, bastante adotada em reconstrução 3D através de vídeo para lidar com o problema do acúmulo de erros é a utilização de um técnica conhecida como SBA (Sparse Bundle Adjustment) Portanto, foi adicionada uma quarta etapa ao final do pipeline de reconstrução com o objetivo de realizar uma minimização do erro global O SBA recebe como entrada pontos 2D, pontos 3D e poses geradas na reconstrução e realizará a minimização iterativamente Essa técnica produz resultados muito bons e consegue geralmente

2 tornar as poses mais precisas Porém, a adição desta etapa traz consigo dois fatores negativos: alto custo computacional da ordem de O(N 3 ) e a impossibilidade de se utilizar a reconstrução em tempo real devido a necessidade da obtenção de um resultado preciso Mais detalhes podem ser encontrados em [11] Este trabalho foca na avaliação estatística robusta dos principais algoritmos de estimativa de pose, utilizando métricas de precisão inerentes ao pipeline de reconstrução 3D offline por vídeo Desta forma, o tempo não será considerado, mas sim a proximidade da pose estimada em relação à pose real sem a contribuição do SBA Os algoritmos selecionados foram o DLT[5], PNP[16], POSIT[2] e EPnP[10] A análise será baseada numa metodologia estatística proposta em [13] Este artigo é estruturado como descrito a seguir Na Seção II são apresentados os principais algoritmos de estimativa de pose presentes na literatura e algumas análises prévias Em seguida, na Seção III será descrita a avaliação dos algoritmos e as métricas utilizadas Os resultados da aplicação de tal metodologia aos algoritmos serão descritos na Seção IV Por fim, na Seção V será apresentado um breve fechamento e comentários sobre trabalhos futuros II ESTADO DA ARTE As primeiras tentativas de resolução do problema de estimativa de pose de câmeras datam do ano de 1841, como citado em [7] Uma das primeiras soluções para o problema utilizava um conjunto de 3 correspondências de pontos 2D e 3D Em 1981, Fischler e Bolles[4] introduziram o termo P3P para descrever este problema e provou a existência de mais de uma solução possível, além de propor outra forma de resolvêlo utilizando as raízes de um polinômio de quarto grau Sendo conhecido os parâmetros intrínsecos da câmera, é possível saber o ângulo θ dos raios disparados do centro de projeção em direção aos pontos 2D na imagem [8], x i e x j Estes raios interceptam os respectivos pontos 3D, X i e X j, sendo possível assim aplicar a lei dos cossenos para cada par de correspondências, onde C é o centro da câmera: X i X j = l 2 i + l 2 j 2l i l j cos θ (1) tal que l i = C X i e l j = C X j Aplicando este raciocínio a cada par de pontos 3D, são obtidas três equações Fischler reduziu essas três equações a um polinômio do quarto grau na forma a 1 x 4 + a 2 x 3 + a 3 x 2 + a 4 x + a 5 = 0 (2) cuja solução permite que se encontre quatro possíveis centros de câmera Em [16] foi proposta uma solução para 4 (P4P), 5(P5P) e n(pnp) pontos, gerando então uma solução única, eliminando a redundância de poses A idéia consiste em obter um conjunto de polinômios da forma da Equação (2) formando o sistema linear a (1) 1 a (1) 2 a (1) 3 a (1) 4 a (1) 5 a (n) 1 a (n) 2 a (n) 3 a (n) 4 a (n) 5 x 4 x 3 x 2 x 1 = At = 0 (3) Se n 5 o sistema será sobredeterminado e pode ser resolvido através de qualquer método de solução de sistemas lineares Os algoritmos até agora descritos utilizam o tetraedro formado entre o centro de projeção da câmera e três pontos 3D da cena para definir restrições e calcular os parâmetros da câmera Outra abordagem geométrica para resolver o problema de estimativa de pose foi elaborada por DeMenthon em [2] Sua estratégia, conhecida por perspectiva fraca (weak perspective), considera que a imagem formada pelos pontos 2D é uma projeção ortográfica dos pontos 3D a menos de um fator de escala (SOP - scaled orthographic projection) e assim é possível obter uma translação e rotação inicial para a pose Em seguida, iterativamente, é minimizada a distância entre a projeção dos pontos 3D pela pose da iteração atual e os pontos 2D observados Outro algoritmo é o EPnP proposto em [10] por Lepetit em 2009 Sua abordagem consiste na transformação das coordenadas dos n pontos 3D como uma média ponderada de quatro pontos representativos Assim, o problema é reduzido, estimando então a câmera em relação a esses quatro pontos, o que pode ser feito com custo linear expressando essas coordenadas como média ponderada dos autovalores de uma matriz e resolvendo um número fixo de polinômios de quarto grau O DLT (Direct Linear Transformation), também muito utilizado na literatura, foi proposto inicialmente em [5] e aperfeiçoado em [8] Ele é um dos algoritmos mais simples e consiste em resolver um sistema linear cuja solução é a matriz de projeção da câmera Dado um conjunto de correspondências 2D-3D xi Xi em coordenadas homogêneas, busca-se uma matriz P 3 4 que satisfaça x i = P X i Expandindo as equações, é obtido um sistema Ap = 0, no qual A é uma matriz 2n 12, em que n é o número de correspondências e p é um vetor coluna obtido pela concatenação transposta das linhas da matriz P A solução pode ser calculada por meio do método SVD (Decomposição de Valores Singulares) e é independente de escala Encontrada a matriz de projeção, esta é decomposta no produto de três matrizes: matriz de calibração com os parâmetros intrínsecos, matriz de rotação e a matriz 3 4 [I C], na qual I é a matriz identidade 3 3 concatenado com o centro da câmera C em coordenadas euclidianas Uma estratégia que permite um melhor resultado para esse algoritmo é a normalização dos pontos na entrada afim de obter uma estabilidade numérica para aplicar o SVD [8] Além desses algoritmos, existem outros que necessitam uma pose inicial e se propõem a refinar o resultado, como descrito em [6] e pelo método CPC proposto em [1] Diante dessa variedade de algoritmos na literatura, surgiram trabalhos

3 objetivando uma análise comparativa entre eles Daniel Grest em [6] fez um estudo avaliando os algoritmos DLT, POSIT e CPC Os algoritmos foram submetidos a testes, variando o número de pontos, a quantidade de ruído, a forma dos pontos e a proximidade dos pontos em relação à câmera Foram discutidas também nesse trabalho as diferentes implementações do POSIT e estimativas iniciais para o CPC Na conclusão, os autores relataram que o algoritmo mais eficiente foi o CPC e o pior resultado foi obtido pelo DLT A métrica utilizada para a comparação entre os algoritmos foi o erro de reprojeção Maiores detalhes sobre o erro de reprojeção encontram-se em [8] III METODOLOGIA DE AVALIAÇÃO Para utilização da metodologia de avaliação standalone de algoritmos robustos, dois requisitos básicos são o gabarito (ground truth) e o conjunto de vetores produzidos pelo algoritmo o qual se deseja avaliar, nesse caso, as poses Como as poses são compostas por um vetor de translação e uma matriz de rotação, pode-se formar um vetor de doze elementos Mas devido à matriz de rotação ter apenas 3 graus de liberdade, é possível trabalhar com apenas um vetor de 6 elementos Entretanto, ainda é possível associar a rotação a uma única medida, considerando que uma forma de expressar rotações é por meio de um eixo e um ângulo (notação eixo-ângulo) Então, pode-se adotar como uma medida que representa o quanto a pose se desviou do gabarito o ângulo relativo à rotação mínima em relação a um eixo arbitrário que transforma a pose estimada no ground truth Calcular uma medida de erro para a translação não é tão simples, pois a reconstrução 3D é obtida com uma escala arbitrária, o que impede a comparação direta através de uma medida de erro entre o ground truth e as poses-produto da reconstrução Para realizar essa comparação, foi utilizado o coeficiente linear de Pearson (CLP) [9], também conhecido como Normalized Cross Correlation (NCC), que é uma medida de correlação entre vetores independentes de escala Dado um par de vetores X 1,, X n e Y 1,, Y n independentes e independentes entre si, o CLP é calculado como n k=1 r = (X k X)(Y k Y ) ( n k=1 (X k X) 2 )( n k=1 (Y k Y ) 2 ) n k=1 X k n k=1 X k em que X = n e Y = n O CLP é um estimador bastante conhecido na literatura, eficaz, de fácil implementação e interpretação, porém possui algumas limitações A principal delas é que a relação entre os vetores tem que ser linear - o que para esta metodologia é irrelevante, pois como o objetivo é comparar soluções que sejam semelhantes ao ground truth, o gráfico formado por abscissas e ordenadas a partir dos dois vetores em questão deverá resultar o mais próximo de uma reta com 45 o de angulação Outra limitação é que o CLP leva em conta as médias dos vetores Neste caso se a distribuição dos vetores foi assimétrica ou com caudas muito pesadas, a média pode ser inconsistente e por isso o valor de r pode não ser adequado Mais uma (4) desvantagem é que tornando as coordenadas de translação independentes, é possível a existência de casos em que mesmo a correlação sendo boa, os caminhos serão diferentes, como no caso em que os caminhos são retas, porém uma é mais inclinada que a outra Devido a limitação imposta na avaliação da translação da pose, será proposta outra métrica para ser usada em conjunto com as demais durante a análise O que impede as translações sejam comparadas através de uma distância euclidiana é o fator de escala que diferencia o ground truth das poses reconstruídas Para corrigir tal fator, todas as poses reconstruídas serão transformadas em uma escala aproximada do ground truth de forma que a soma das distâncias das poses seja mínima, ou seja, sendo k o fator de escala aplicado às poses reconstruídas, {t i } o conjunto de translações das poses do ground truth e { t i } o conjunto de translações das n poses reconstruídas, temos que k = arg min α n t i α t i (5) i=1 A solução para k não é trivial, mas pode ser encontrada de forma aproximada considerando a equação 6 n k = arg min t i α t i 2 (6) α i=1 e aplicando um algoritmo de minimização não linear para obter um k mínimo Descoberto o valor da escala, a medida de erro para a translação é computada como a média das distâncias entre as poses correspondentes do ground truth e da reconstrução Essa medida de erro só é válida para comparar poses originadas pelo mesmo ground truth, já que ela é dependente da escala do ground truth Uma vantagem de se calcular o erro através do ângulo de rotação e da distância euclidiana sobre o CLP é que podem ser analisados erros no decorrer dos frames do vídeo, possibilitando uma visualização detalhada dos erros através de gráficos Para cada coordenada de translação (x i, y i, z i ) são formados vetores (x 1,, x n ), (y 1,, y n ), (z 1,, z n ), em que n é o total de poses, para o ground truth e para as poses-produto da reconstrução Calculando o CLP de cada coordenada de translação entre o ground truth e as poses-produtos, é possível obter três medidas que caracterizam a correlação entre os dois caminhos de câmera Após escolhidas as métricas (ângulo para rotação, coeficiente de Pearson e distância média para a translação), foi gerado um ground truth das poses de câmera, onde a câmera sintética considerada tem como distância focal 1400 pixels As imagens geradas possuem uma resolução de e um ponto central (400, 300) em pixels Uma vez definida a câmera sintética que gera o cenário de testes, foram calculadas 60 poses de câmera com variação aleatória na distância entre poses, mas todas a uma distância fixa do modelo 3D A rotação foi estipulada de forma que a câmera apontasse sempre para o centro do objeto A trajetória

4 da câmera foi direcionada para se movimentar como apresentado na Figura 1, obtendo-se assim um cenário adequado para o rastreamento das features Figura 1 Gabarito (ground truth) utilizado nos experimetos O modelo presente no cenário foi obtido sinteticamente a partir da nuvem de pontos 3D do modelo Bunny disponível no repositório de Stanford [17] Cada matriz de câmera gerada foi aplicada ao modelo, e assim, calculada a projeção 2D referente a cada pose de câmera, gerando 60 imagens respectivas As correspondências das features entre essas imagens foram computadas a partir de um processo de reconstrução 3D similar ao descrito em [15] Considerando que esse conjunto de dados é sintético, não são capturados os ruídos inerentes às imagens reais, como imprecisões no cálculo de pontos 2D e erro na computação das correspondências entre os pontos em diferentes imagens Para simular um ambiente real, foi inserido um ruído gaussiano nas coordenadas dos pontos 2D e foram gerados dois conjuntos de dados nos quais os erros seguem uma distribuição normal com desvio padrão de 1 e 2 pixels Também foram adicionados aleatoriamente no conjunto de dados 20% de pontos caracterizados como outliers No processo de reconstrução, quando é iniciada a etapa do cálculo de pose, o conjunto de correspondências contém um ruído associado, além da presença de outliers, que devem ser filtrados antes do início do cálculo da pose A idéia consiste em um algoritmo de avaliação de hipótese afim de se obter uma pose que seja coerente com a maior parte dos pontos Nesta avaliação de hipóteses são identificados os outliers do conjunto e estes podem ser descartados no cálculo da pose que será realizado apenas com inliers O primeiro algoritmo com essa proposta foi o RANSAC e foi idealizado juntamente com o P3P por Fischler em [3] Nos testes realizados neste trabalho foi utilizada uma variação do RANSAC chamada LMedS (Least Median of Squares) [18] IV SIMULAÇÃO E RESULTADOS Após a geração do ground truth, cada entrada é submetida a um framework de reconstrução 3D para que as poses sejam geradas e avaliadas Em algumas entradas sintéticas, os erros gerados de acordo com a distribuição gaussiana são grandes o suficiente para invalidar a reconstrução em sua fase inicial ou durante as estimativas de pose, caso o algoritmo utilizado cause grande acúmulo de erros Nos experimentos realizados, utilizou-se a biblioteca OpenCV para implementar o PNP e o POSIT O EPnP utilizado neste trabalho foi a implementação de referência disponibilizada pelo autor O resultado dos experimentos é mostrado na Tabela I Dentre as mil entradas utilizadas, 40% não foram reconstruídas quando considerou-se o ruído de 10 pixel e metade não foram reconstruídas com o ruído de 20 pixels Grande parte das entradas não reconstruídas ocorreu devido ao acúmulo de erros das etapas da estimativa da matriz epipolar e da estimativa de pose O algoritmo DLT apresentou os piores resultados gerando menos reconstruções Para avaliar as poses com CLP, foi estabelecido um limiar de 95%, ou seja, foram contabilizadas apenas a porcentagem de poses em que houve 95% ou mais de correlação nos três eixos de translação Como observado na Tabela I, o EPnP obteve melhor resultado, porém muito próximo do POSIT O PNP obteve a menor correlação Em relação à distância média aproximada e o ângulo das poses entre as amostras e o ground truth, mais uma vez o EPnP conseguiu maior precisão que o POSIT, além de possuir menor desvio padrão, apresentando um comportamento estável O PNP e o DLT se mostraram mais uma vez os menos eficientes, com o PNP apresentando os piores resultados O DLT é o algoritmo mais simples dentre todos os demais e consiste apenas na resolução de um sistema linear sobredeterminado Mesmo assim o DLT foi mais preciso que o PNP, mesmo sendo este último mais complexo Na Figura 3, é possível perceber que o caminho criado pelo PNP em grande parte é mais suave que o DLT e aparenta ser mais coerente Em contrapartida o PNP errou poses de forma que elas ficassem com a translação simetricamente oposta ao centróide dos pontos 3D, como ilustrado na Figura 2 Então, é possível que a imprecisão do PNP seja devido a poucas poses inválidas, mas que atingiram muito o cálculo da média ao invés do que ocorre com as poses sinuosas do DLT O EPnP obteve o melhor resultado em todas as métricas avaliadas aparentando ser o mais preciso dentre os quatro algoritmos avaliados Entretanto, vale ressaltar que sua diferença com o POSIT é muito pequena, a ponto de ser considerada desprezível se analisados os intervalos de confiança Se considerarmos um intervalo de confiança de 95% para ambos os algoritmos, verifica-se que o POSIT tem sua média do erro de translação entre 409 e 438, enquanto o EPnP obtém intervalo entre 405 e 422, utilizando em ambos os casos um ruído de 1 pixel É perceptível uma grande intersecção entre os intervalos de ambos os algoritmos e podemos considerálos como equivalentes Tal comportamento se mantém para o intervalo de rotação (note-se que os exemplos anteriores foram para a translação) e mesmo quando considerado um ruído de 2 pixels, pois o desvio padrão é maior Grande parte dos caminhos de câmera reconstruídos por ambos os algoritmos se mostraram similares ao ground truth, mostrado na Figura

5 Figura 2 Caminho de câmera reconstruído pelo PNP pose Figura 3 Caminho de câmera reconstruído pelo DLT 1 Embora os testes não acentuem diferenças significativas de precisão entre o POSIT e EPnP, existe outro fator que deve ser levado em consideração: o EPnP é um algoritmo de custo linear e oferece precisão tão boa quanto o POSIT que é iterativo Isto é uma vantagem do EPnP em diversas aplicações e com o custo computacional reduzido para uma etapa adicional de refinamento, por exemplo realizando uma minimização do erro de reprojeção com o algoritmo Levenberg-Marquardt[14] Na Figura 4 é possível observar a distância média aproximada da translação e na Figura 5 o ângulo médio da rotação entre as poses reconstruídas e o ground truth em cada frame Na primeira pose, o erro é sempre nulo porque esta será sempre a pose canônica (translação na origem e sem rotação) por convenção No oitavo frame, o erro se torna igual para todos os algoritmos, pois esta pose é estimada no cálculo da matriz epipolar na segunda fase do pipeline de reconstrução Por isso, esta pose é igual em todos os caminhos de câmera reconstruídos Nos gráficos, é perceptível a proximidade entre o POSIT e o EPnP Apenas a partir do frame 40 o EPnP obtém uma diferença mais significativa O PNP mantém seu erro sempre alto e muito irregular caracterizando uma má estimativa de V CONCLUSÕES E TRABALHOS FUTUROS No contexto de reconstrução 3D, a estimativa de pose é indispensável e exige uma grande precisão e robustez, devido principalmente ao acúmulo de erros por se tratar de um processo iterativo Tal aspecto estimulou a elaboração de um conjunto de experimentos para que fosse possível avaliar alguns dos algoritmos presentes na literatura: DLT, PNP, POSIT e EPnPPortando, três métricas foram escolhidas: o coeficiente linear de Pearson aplicado aos três eixos da translação, a distância mínima média das poses e o ângulo entre as poses Após os experimentos, todas as métricas apontaram o PNP como o algoritmo menos preciso, mostrando baixas taxas de acerto e, apesar da estimativa de pose ser visualmente coerente, a translação se apresenta simetricamente oposta ao centroide dos pontos 3D O DLT obteve os caminhos de câmera mais sinuosos e incoerentes além de causar acúmulo de erros de forma que menos amostras foram reconstruídas Os algoritmos com melhores resultados foram o EPnP e o POSIT, sendo o segundo menos preciso do que o primeiro Tal diferença se mostra irrelevante quando analisado o intervalo de confiança do experimento, o que os tornam estatisticamente equivalentes O EPnP oferece ainda uma vantagem em relação ao POSIT por ser um algoritmo de custo linear ao passo que o POSIT é iterativo É interessante estender essa pesquisa para obter conclusões mais detalhadas sobre estes algoritmos de estimativa de pose de câmera e outros não abordados neste texto A geração de novos ground truths explorando outras dificuldades desses algoritmos como cenas com pontos muito próximos ou distantes da câmera Outra avaliação consideraria a combinação destes algoritmos com outros, utilizando os algoritmos avaliados com outros que fazem uso de uma estimativa inicial, como [12] e o CPC [1], e também considerando os algoritmos de minimização de erro como Levenberg-Marquardt [14] Finalmente seria interessante avaliar o impacto do SBA na precisão dos algoritmos Esta pesquisa foi desenvolvida no projeto TechPetro, financiado pela Petrobras e pela FINEP, na rede RPCMod A pesquisa aperfeiçoou a estimativa de pose no módulo do projeto destinado a reconstrução 3D de objetos e estruturas pertencentes a Petrobrás Os experimentos realizados mostraram o aumento na qualidade das reconstruções REFERÊNCIAS [1] Helder Araújo, Rodrigo L Carceroni, and Christopher M Brown A fully projective formulation to improve the accuracy of lowe s poseestimation algorithm Computer Vision and Image Understanding, 70(2): , 1998 [2] Daniel DeMenthon and Larry S Davis Model-based object pose in 25 lines of code In Proceedings of the Second European Conference on Computer Vision, ECCV 92, pages , London, UK, 1992 Springer-Verlag [3] Martin A Fischler and Robert C Bolles Random sample consensus: a paradigm for model fitting with applications to image analysis and automated cartography, pages Morgan Kaufmann Publishers Inc, 1987

6 Tabela I RESULTADOS OBTIDOS DOS EXPERIMENTOS DLT PNP POSIT EPnP Ruído(pixel) Avaliados(%) CLC (95%) Translação 1008± ± ± ± ± ± ± ±32 Rotação 595± ± ± ± ± ± ± ±245 (a) Ruído de 1 pixel (b) Ruído de 2 pixels Figura 4 Distância média entre as poses recontruídas e do ground truth a cada frame (a) Ruído de 1 pixel (b) Ruído de 2 pixels Figura 5 Erro em ângulo entre as poses recontruídas e do ground truth a cada frame [4] Martin A Fischler and Robert C Bolles Readings in computer vision: issues, problems, principles, and paradigms chapter Random sample consensus: a paradigm for model fitting with applications to image analysis and automated cartography, pages Morgan Kaufmann Publishers Inc, San Francisco, CA, USA, 1987 [5] S Ganapathy Decomposition of transformation matrices for robot vision In Robotics and Automation Proceedings 1984 IEEE International Conference on, volume 1, pages , mar 1984 [6] Daniel Grest, Thomas Petersen, and Volker Krüger A comparison of iterative 2d-3d pose estimation methods for real-time applications In Proceedings of the 16th Scandinavian Conference on Image Analysis, SCIA 09, pages , Berlin, Heidelberg, 2009 Springer-Verlag [7] RM Haralick, D Lee, K Ottenburg, and M Nolle Analysis and solutions of the three point perspective pose estimation problem In Computer Vision and Pattern Recognition, 1991 Proceedings CVPR 91, IEEE Computer Society Conference on, pages , jun 1991 [8] R I Hartley and A Zisserman Multiple View Geometry in Computer Vision Cambridge University Press, ISBN: , second edition, 2004 [9] M Hollander and DA Wolfe Nonparametric Statistical Methods Wiley Series in Probability and Statistics, 1999 [10] Vincent Lepetit, Francesc Moreno-Noguer, and Pascal Fua Epnp: An accurate o(n) solution to the pnp problem Int J Comput Vision, 81: , February 2009 [11] MI A Lourakis and AA Argyros SBA: A Software Package for Generic Sparse Bundle Adjustment ACM Trans Math Software, 36(1):1 30, 2009 [12] Chien-Ping Lu, Gregory D Hager, and Eric Mjolsness Fast and globally convergent pose estimation from video images IEEE Trans Pattern Anal Mach Intell, 22: , June 2000 [13] S V M Macedo, T S M C Farias, J C B O Lima, J Kelner, and E Albuquerque Towards a standalone methodology for robust algorithms evaluation: A case study in 3d reconstruction In Proceedings of Conference on Graphics, Patterns and Images (SIBGRAPI 11), Sep 2011 [14] Donald W Marquardt An algorithm for Least-Squares estimation of nonlinear parameters SIAM Journal on Applied Mathematics, 11(2): , 1963 [15] Marc Pollefeys Self-calibration and metric 3D reconstruction from uncalibrated image sequences PhD thesis, ESAT-PSI, 1999 [16] Long Quan and Zhongdan Lan Linear n-point camera pose determination IEEE Trans Pattern Anal Mach Intell, 21: , August 1999 [17] Repositório The stanford 3d scanning repository preprint (2003), available at [18] P J Rousseeuw and A M Leroy Robust regression and outlier detection John Wiley & Sons, Inc, New York, NY, USA, 1987

Calibração Robusta de Vídeo Para Realidade Aumentada

Calibração Robusta de Vídeo Para Realidade Aumentada Calibração Robusta de Vídeo Para Realidade Aumentada Bruno Madeira 1,2, Luiz Velho 1, Paulo Cezar Carvalho 1 1 Instituto Nacional de Matemática Pura e Aplicada (IMPA) Estrada Dona Castorina, 110, Jardim

Leia mais

Processamento de Imagens CPS755

Processamento de Imagens CPS755 Processamento de Imagens CPS755 aula 05 - sistemas lineares - parte 2 Antonio Oliveira Ricardo Marroquim 1 / 27 laboratório de processamento de imagens tópicos métodos lineares mínimos quadrados equações

Leia mais

Trabalho Final de Processamento de Imagens: Panografia

Trabalho Final de Processamento de Imagens: Panografia Trabalho Final de Processamento de Imagens: Panografia 1. Introdução Vítor Silva Sousa 1 1 Escola Politécnica Universidade Federal do Rio de Janeiro (UFRJ) Rio de Janeiro RJ Brasil vitor.silva.sousa@gmail.com

Leia mais

Sistema de Reconhecimento de Logotipos

Sistema de Reconhecimento de Logotipos Sistema de Reconhecimento de Logotipos Fellipe Duarte, Saulo T. Oliveira {duartefellipe,sto}@cos.ufrj.br Relatório Técnico, Introdução ao Processamento de Imagens Programa de Engenharia de Sistemas e Computação

Leia mais

Reconstrução Geométrica a Partir de Imagens TIC

Reconstrução Geométrica a Partir de Imagens TIC Reconstrução Geométrica a Partir de Imagens TIC-10.073 Aula 1 Conteúdo Apresentação da Disciplina Professor Leandro Augusto Frata Fernandes laffernandes@ic.uff.br Material disponível em http://www.ic.uff.br/~laffernandes/teaching/2016.1/tic-10.073

Leia mais

RECONHECIMENTO FACIAL UTILIZANDO EIGENFACES

RECONHECIMENTO FACIAL UTILIZANDO EIGENFACES Universidade Federal do Rio de Janeiro Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia Programa de Engenharia de Sistemas e Computação Rio de Janeiro, RJ Brasil RECONHECIMENTO

Leia mais

Reconstrução Geométrica a Partir de Imagens TIC /TCC

Reconstrução Geométrica a Partir de Imagens TIC /TCC Reconstrução Geométrica a Partir de Imagens TIC-00.243/TCC-00.241 Aula 1 Conteúdo Apresentação da Disciplina Professor Leandro Augusto Frata Fernandes laffernandes@ic.uff.br Material disponível em http://www.ic.uff.br/~laffernandes/teaching/2014.2/tic-00.243

Leia mais

Um Sistema de Calibração de Câmera

Um Sistema de Calibração de Câmera Um impa Instituto Nacional de Matemática Pura e Aplicada Sistemas Gráficos 3D Um Sistema de Clarissa Codá dos Santos Cavalcanti Marques Rio de Janeiro, 05 de julho de 2007 Um EditCalib/ExecCalib Correspondência

Leia mais

Processamento de Imagens CPS755

Processamento de Imagens CPS755 Processamento de Imagens CPS755 aula 06 - sistemas não lineares Antonio Oliveira Ricardo Marroquim 1 / 38 laboratório de processamento de imagens tópicos RANSAC métodos iterativos (não-lineares) gradientes

Leia mais

Mapeamento de ambientes e processamento visual utilizando Kinect

Mapeamento de ambientes e processamento visual utilizando Kinect Mapeamento de ambientes e processamento visual utilizando Kinect Mário Alberto Cecchi Raduan Bolsista PIBIC/UFRJ Orientador: Adriano Joaquim de Oliveira Cruz, PhD Laboratório de Inteligência Computacional

Leia mais

Reconstrução Geométrica a Partir de Imagens TIC /TCC

Reconstrução Geométrica a Partir de Imagens TIC /TCC Reconstrução Geométrica a Partir de Imagens TIC-00.243/TCC-00.24 Aula 7 Conteúdo Cálculo da Matriz Fundamental Professor Leandro Augusto Frata Fernandes laffernandes@ic.uff.br Material disponível em http://www.ic.uff.br/~laffernandes/teaching/204.2/tic-00.243

Leia mais

Detecção de falsas correspondências em pares de imagens estereoscópicas utilizando a transformação projetiva no plano e o algoritmo RANSAC

Detecção de falsas correspondências em pares de imagens estereoscópicas utilizando a transformação projetiva no plano e o algoritmo RANSAC Detecção de falsas correspondências em pares de imagens estereoscópicas utilizando a transformação projetiva no plano e o algoritmo RANSAC André Caceres Carrilho Mauricio Galo Renato César dos Santos Curitiba,

Leia mais

MouseCam: aplicação de controle do mouse via câmera

MouseCam: aplicação de controle do mouse via câmera MouseCam: aplicação de controle do mouse via câmera Introdução ao Processamento de Imagens COS756 PESC/COPPE/UFRJ 2013 1 Renan Garrot garrot@cos.ufrj.br 1. Introdução O processo de tracking por vídeo consiste

Leia mais

Reconhecimento de Instâncias (parte 2)

Reconhecimento de Instâncias (parte 2) Reconhecimento de Instâncias (parte 2) Rafael Galvão de Mesquita rgm@cin.ufpe.br Carlos Alexandre Mello cabm@cin.ufpe.br SURF Speeded-Up Robust Features [3] Computer Vision and Image Understanding, 2004

Leia mais

Visão Computacional CPS754

Visão Computacional CPS754 Visão Computacional CPS754 aula 11 - reconstrução 3D de câmeras Antonio Oliveira Ricardo Marroquim 1 / 1 visão computacional tópicos conhecido: conjunto de correspondências x i x não conhecido: os respectivos

Leia mais

Reconstrução Geométrica a Partir de Imagens TIC /TCC

Reconstrução Geométrica a Partir de Imagens TIC /TCC Reconstrução Geométrica a Partir de Imagens TIC-00.243/TCC-00.241 Aula 6 Conteúdo Estimativa de Parâmetros Professor Leandro Augusto Frata Fernandes laffernandes@ic.uff.br Material disponível em http://www.ic.uff.br/~laffernandes/teaching/2014.2/tic-00.243

Leia mais

Universidade de Aveiro Departamento de Electrónica, Telecomunicações e Informática. Transformações 2D

Universidade de Aveiro Departamento de Electrónica, Telecomunicações e Informática. Transformações 2D Universidade de Aveiro Departamento de Electrónica, Telecomunicações e Informática Transformações 2D Computação Visual Beatriz Sousa Santos, Joaquim Madeira Transformações 2D Posicionar, orientar e escalar

Leia mais

Descritores de Imagens

Descritores de Imagens Descritores de Imagens André Tavares da Silva PPGCA/UDESC Outubro de 2017 André Tavares da Silva (PPGCA/UDESC) Descritores de Imagens Outubro de 2017 1 / 18 Descritores Locais e Frameworks SIFT SURF Viola-Jones

Leia mais

Visão Computacional CPS754

Visão Computacional CPS754 Visão Computacional CPS754 aula 13 - reconstrução Antonio Oliveira Ricardo Marroquim 1 / 26 visão computacional tópicos reprojetando pontos para 3D triangulação simples solução ótima definição do último

Leia mais

Processamento de Imagens CPS755

Processamento de Imagens CPS755 Processamento de Imagens CPS755 aula 04 - sistemas lineares Antonio Oliveira Ricardo Marroquim 1 / 32 laboratório de processamento de imagens tópicos decomposições (álgebra linear) decomposição QR decomposição

Leia mais

Sketch to Photo Matching: A Feature-based Approach (Klare and Jain [2010])

Sketch to Photo Matching: A Feature-based Approach (Klare and Jain [2010]) Sketch to Photo Matching: A Feature-based Approach (Klare and Jain [2010]) Marco Antonio de A. Silva Programa de Pós-Graduação em Ciência da Computação - PPGCC Departamento de Computação - DECOM Universidade

Leia mais

Implementação dos Algoritmos e Resultados

Implementação dos Algoritmos e Resultados Capítulo 6 Implementação dos Algoritmos e Resultados 6.1 Considerações Iniciais Diversas situações foram exploradas neste trabalho visando analisar qual seria a wavelet mais adequada para sistemas de extração

Leia mais

IDENTIFICAÇÃO DE MARCADORES DE PAVIMENTAÇÃO NA ORIENTAÇÃO DE CEGOS. André Zuconelli 1 ; Manassés Ribeiro 2

IDENTIFICAÇÃO DE MARCADORES DE PAVIMENTAÇÃO NA ORIENTAÇÃO DE CEGOS. André Zuconelli 1 ; Manassés Ribeiro 2 IDENTIFICAÇÃO DE MARCADORES DE PAVIMENTAÇÃO NA ORIENTAÇÃO DE CEGOS André Zuconelli 1 ; Manassés Ribeiro 2 INTRODUÇÃO As tecnologias assistivas têm a finalidade de auxiliar pessoas com deficiência a alcançar

Leia mais

Um Novo Algoritmo de Calibração de um Conjunto Binocular com um Gabarito 1D que Realiza Deslocamentos Irrestritos

Um Novo Algoritmo de Calibração de um Conjunto Binocular com um Gabarito 1D que Realiza Deslocamentos Irrestritos Um Novo Algoritmo de Calibração de um Conjunto Binocular com um Gabarito 1D que Realiza Deslocamentos Irrestritos José Alexandre de França Universidade Estadual de Londrina Caixa Postal 6025, Londrina-PR,

Leia mais

ESTUDO SOBRE RASTREAMENTO BASEADO EM CARACTERÍSTICAS NATURAIS PARA APLICAÇÕES DE REALIDADE AUMENTADA EM DISPOSITIVOS MÓVEIS

ESTUDO SOBRE RASTREAMENTO BASEADO EM CARACTERÍSTICAS NATURAIS PARA APLICAÇÕES DE REALIDADE AUMENTADA EM DISPOSITIVOS MÓVEIS UNIVERSIDADE FEDERAL DE PERNAMBUCO GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA ESTUDO SOBRE RASTREAMENTO BASEADO EM CARACTERÍSTICAS NATURAIS PARA APLICAÇÕES DE REALIDADE AUMENTADA EM DISPOSITIVOS

Leia mais

INTERPOLAÇÃO LINEAR E BILINEAR: APLICAÇÃO EM TRANSFORMAÇÕES GEOMÉTRICAS DE IMAGEM INTRODUÇÃO

INTERPOLAÇÃO LINEAR E BILINEAR: APLICAÇÃO EM TRANSFORMAÇÕES GEOMÉTRICAS DE IMAGEM INTRODUÇÃO INTERPOLAÇÃO LINEAR E BILINEAR: APLICAÇÃO EM TRANSFORMAÇÕES GEOMÉTRICAS DE IMAGEM Autores: Giulia Denise Kujat VIEIRA; Milene Karine GUBETTI. Identificação autores: Estudantes do Curso Técnico em Informática

Leia mais

Realidade Aumentada sem Marcadores Baseada na Amostragem de Pontos em Arestas

Realidade Aumentada sem Marcadores Baseada na Amostragem de Pontos em Arestas Realidade Aumentada sem Marcadores Baseada na Amostragem de Pontos em Arestas Francisco Paulo Magalhães Simões, João Paulo Silva do Monte Lima, Veronica Teichrieb, Judith Kelner Grupo de Pesquisa em Realidade

Leia mais

Orientação de Bordas em Imagens Digitais: Abordagem por Análise de Vizinhança Local

Orientação de Bordas em Imagens Digitais: Abordagem por Análise de Vizinhança Local Orientação de Bordas em Imagens Digitais: Abordagem por Análise de Vizinhança Local Inês Aparecida Gasparotto Boaventura DCCE-IBILCE-UNESP Rua Cristovão Colombo, 2265 15054-000, São José do Rio Preto,

Leia mais

Apresentação de uma Plataforma Computacional para a Reconstrução e Caracterização da Forma 3D de Objectos

Apresentação de uma Plataforma Computacional para a Reconstrução e Caracterização da Forma 3D de Objectos Apresentação de uma Plataforma Computacional para a Reconstrução e Caracterização da Forma 3D de Objectos Teresa Azevedo 1, João Manuel R. S. Tavares 1,2, Mário A. Vaz 1,2 1 Instituto de Engenharia Mecânica

Leia mais

Descritores de Imagens

Descritores de Imagens Descritores de Imagens André Tavares da Silva PPGCA/UDESC Outubro de 2017 André Tavares da Silva (PPGCA/UDESC) Descritores de Imagens Outubro de 2017 1 / 17 Introdução Excelentes pesquisas sobre descritores

Leia mais

étodos uméricos SISTEMAS DE EQUAÇÕES LINEARES (Continuação) Prof. Erivelton Geraldo Nepomuceno PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA

étodos uméricos SISTEMAS DE EQUAÇÕES LINEARES (Continuação) Prof. Erivelton Geraldo Nepomuceno PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA étodos uméricos SISTEMAS DE EQUAÇÕES LINEARES (Continuação) Prof. Erivelton Geraldo Nepomuceno PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA UNIVERSIDADE DE JOÃO DEL-REI PRÓ-REITORIA DE PESQUISA CENTRO

Leia mais

Relatório sobre os Resultados obtidos através do uso dos algoritmos SIFT e RANSAC para Reconstrução de um Objeto a partir de uma Nuvem de Pontos

Relatório sobre os Resultados obtidos através do uso dos algoritmos SIFT e RANSAC para Reconstrução de um Objeto a partir de uma Nuvem de Pontos Relatório sobre os Resultados obtidos através do uso dos algoritmos SIFT e RANSAC para Reconstrução de um Objeto a partir de uma Nuvem de Pontos Gustavo Moreira PUC-Rio, Departamento de Informática Rua

Leia mais

4 Implementação Computacional

4 Implementação Computacional 4 Implementação Computacional 4.1. Introdução Neste capítulo é apresentada a formulação matemática do problema de otimização da disposição das linhas de ancoragem para minimizar os deslocamentos (offsets)

Leia mais

Um sistema para extração automática de keyframes a partir de fluxos de vídeo direcionado à reconstrução tridimensional de cenários virtuais

Um sistema para extração automática de keyframes a partir de fluxos de vídeo direcionado à reconstrução tridimensional de cenários virtuais Um sistema para extração automática de keyframes a partir de fluxos de vídeo direcionado à reconstrução tridimensional de cenários virtuais Sérgio Carlos Portari Júnior Orientador: Prof. Dr. Antonio Carlos

Leia mais

étodos uméricos ZEROS DE FUNÇÕES Prof. Erivelton Geraldo Nepomuceno PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA

étodos uméricos ZEROS DE FUNÇÕES Prof. Erivelton Geraldo Nepomuceno PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA étodos uméricos ZEROS DE FUNÇÕES Prof. Erivelton Geraldo Nepomuceno PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA UNIVERSIDADE DE JOÃO DEL-REI PRÓ-REITORIA DE PESQUISA CENTRO FEDERAL DE EDUCAÇÃO TECNOLÓGICA

Leia mais

Processamento de Imagens CPS755

Processamento de Imagens CPS755 Processamento de Imagens CPS755 aula 08 - calibração de câmera Antonio Oliveira Ricardo Marroquim 1 / 40 laboratório de processamento de imagens tópicos homografia 3D 2D distorção propriedades do centro

Leia mais

Um Estudo das Técnicas de Obtenção de Forma a partir de Estéreo e Luz Estruturada para Engenharia

Um Estudo das Técnicas de Obtenção de Forma a partir de Estéreo e Luz Estruturada para Engenharia Um Estudo das Técnicas de Obtenção de Forma a partir de Estéreo e Luz Estruturada para Engenharia Aluno: Gabriel Malizia Orientador: Professor Marcelo Gattass Co-Orientador: Professor Paulo Cezar Carvalho

Leia mais

3 Técnicas de medição do escoamento

3 Técnicas de medição do escoamento Técnicas de medição do escoamento 28 3 Técnicas de medição do escoamento O conhecimento do campo de velocidade de fluidos em movimento é fundamental para o entendimento dos mecanismos básicos que governam

Leia mais

5 Resultados Introdução

5 Resultados Introdução 5 Resultados 5.1. Introdução O objetivo deste capítulo é apresentar os resultados de diversas simulações feitas no decorrer do projeto. Tais simulações têm o objetivo de testar os algoritmos presentes

Leia mais

Modelo Cinemático Inverso. Prof. Walter Fetter Lages 16 de setembro de 2007

Modelo Cinemático Inverso. Prof. Walter Fetter Lages 16 de setembro de 2007 Universidade Federal do Rio Grande do Sul Escola de Engenharia Departamento de Engenharia Elétrica Programa de Pós-Graduação em Engenharia Elétrica ELE00070-Tópicos Especiais em Controle e Automação I

Leia mais

RECONHECIMENTO IDENTIFICAÇÃO BASEADA EM APARÊNCIA

RECONHECIMENTO IDENTIFICAÇÃO BASEADA EM APARÊNCIA RECONHECIMENTO IDENTIFICAÇÃO BASEADA EM APARÊNCIA Envolve a pergunta: É esta parte da imagem uma parte do objeto X? (modelo dado, região da imagem dada) Utiliza imagens ao invés de características como

Leia mais

SME Cálculo Numérico. Lista de Exercícios: Gabarito

SME Cálculo Numérico. Lista de Exercícios: Gabarito Exercícios de prova SME0300 - Cálculo Numérico Segundo semestre de 2012 Lista de Exercícios: Gabarito 1. Dentre os métodos que você estudou no curso para resolver sistemas lineares, qual é o mais adequado

Leia mais

3 Estimação e Compensação de movimento na codificação de vídeo

3 Estimação e Compensação de movimento na codificação de vídeo Estimação e Compensação de movimento na codificação de vídeo 36 3 Estimação e Compensação de movimento na codificação de vídeo O objetivo do modelo temporal (que engloba as fases de estimação e compensação

Leia mais

Análise do desempenho de técnicas de rastreamento 3D: Algoritmos recursivos baseados em aresta e textura

Análise do desempenho de técnicas de rastreamento 3D: Algoritmos recursivos baseados em aresta e textura Análise do desempenho de técnicas de rastreamento 3D: Algoritmos recursivos baseados em aresta e textura Rodrigo J. B. C. Santos, Bernardo Reis, Márcio Bueno, Judith Kelner Centro de Informática (CIn)

Leia mais

Perspectivas Cap 2 (do livro texto) Aula 7 UFF

Perspectivas Cap 2 (do livro texto) Aula 7 UFF Perspectivas Cap 2 (do livro texto) Aula 7 UFF - 2014 Ponto de fuga Características Projeções Planas: Classificação básica: b Considerando P ( x, y, z ) Qual sua relação com sua projeção no plano z=0

Leia mais

Processamento de Imagens CPS755

Processamento de Imagens CPS755 Processamento de Imagens CPS755 aula 09 - single-view final Antonio Oliveira Ricardo Marroquim 1 / 25 laboratório de processamento de imagens tópicos pontos e retas de fuga métricas afim em uma foto calibrando

Leia mais

Cálculo Numérico BCC760 Raízes de equações algébricas e transcendentes

Cálculo Numérico BCC760 Raízes de equações algébricas e transcendentes Cálculo Numérico BCC760 Raízes de equações algébricas e transcendentes Departamento de Computação Página da disciplina http://www.decom.ufop.br/bcc760/ Introdução Dada uma função y = f(x), o objetivo deste

Leia mais

Métodos de Segmentação de Imagem para Análise da Marcha

Métodos de Segmentação de Imagem para Análise da Marcha Métodos de Segmentação de Imagem para Análise da Marcha Maria João M. Vasconcelos, João Manuel R. S. Tavares maria.vasconcelos@fe.up.pt, tavares@fe.up.pt 3º Congresso Nacional de Biomecânica 11-12 Fevereiro

Leia mais

Precondicionadores baseados na aproximação da inversa da matriz de coeficientes

Precondicionadores baseados na aproximação da inversa da matriz de coeficientes Precondicionadores baseados na aproximação da inversa da matriz de coeficientes João Paulo K. Zanardi, Italo C. N. Lima, Programa de Pós Graduação em Eneganharia Mecânica, FEN, UERJ 20940-903, Rio de Janeiro,

Leia mais

Juliane Cristina Botelho de Oliveira Lima

Juliane Cristina Botelho de Oliveira Lima Pós-Graduação em Ciência da Computação Avaliação de Algoritmos de Alinhamento em Reconstrução 3D utilizando várias Imagens Por Juliane Cristina Botelho de Oliveira Lima Dissertação de Mestrado Universidade

Leia mais

Análise de Componentes Principais (PCA)

Análise de Componentes Principais (PCA) Análise de Componentes Principais (PCA) Lailson B. Moraes, George D. C. Cavalcanti {lbm4,gdcc}@cin.ufpe.br Roteiro Introdução Características Definição Algoritmo Exemplo Aplicações Vantagens e Desvantagens

Leia mais

Computação Gráfica. Engenharia de Computação. CEFET/RJ campus Petrópolis. Prof. Luis Retondaro. Aula 3. Transformações Geométricas

Computação Gráfica. Engenharia de Computação. CEFET/RJ campus Petrópolis. Prof. Luis Retondaro. Aula 3. Transformações Geométricas Computação Gráfica Engenharia de Computação CEFET/RJ campus Petrópolis Prof. Luis Retondaro Aula 3 Transformações Geométricas no plano e no espaço Introdução (Geometria) 2 Pontos, Vetores e Matrizes Dado

Leia mais

Cálculo Numérico BCC760

Cálculo Numérico BCC760 Cálculo Numérico BCC760 Resolução de Sistemas de Equações Lineares Simultâneas Departamento de Computação Página da disciplina http://www.decom.ufop.br/bcc760/ 1 Introdução! Definição Uma equação é dita

Leia mais

2 SIFT (Scale Invariant Feature Transform)

2 SIFT (Scale Invariant Feature Transform) SIFT (Scale Invariant Feature Transform) O SIFT é um algoritmo de visão computacional proposto e publicado pelo pesquisador David Lowe (Lowe, 1999), professor do departamento de Ciência da Computação na

Leia mais

Face Detection. Image Processing scc moacir ICMC/USP São Carlos, SP, Brazil

Face Detection. Image Processing scc moacir ICMC/USP São Carlos, SP, Brazil Face Detection Image Processing scc0251 www.icmc.usp.br/ moacir moacir@icmc.usp.br ICMC/USP São Carlos, SP, Brazil 2011 Moacir Ponti Jr. (ICMCUSP) Face Detection 2011 1 / 24 Agenda 1 Detectando faces 2

Leia mais

Rastreamento de Marcadores Naturais em Sistemas de Realidade Aumentada

Rastreamento de Marcadores Naturais em Sistemas de Realidade Aumentada Rastreamento de Marcadores Naturais em Sistemas de Realidade Aumentada Vanessa Avelino Xavier de Camargo 1, Clarissa Avelino Xavier de Camargo 1, Alexandre Cardoso 1, Flávio Ferreira Borges 2, Italo Tiago

Leia mais

Reconhecimento de Faces com PCA e Redes Neurais

Reconhecimento de Faces com PCA e Redes Neurais Reconhecimento de Faces com Sandro Santos Andrade Programa de Pós-graduação em Mecatrônica Setembro / 2003 Visão Computacional Computacional Computação Computação Visual Computação Computação Gráfica Introdução

Leia mais

PMR2560 Visão Computacional Visão estéreo. Prof. Eduardo L. L. Cabral

PMR2560 Visão Computacional Visão estéreo. Prof. Eduardo L. L. Cabral PMR2560 Visão Computacional Visão estéreo Prof. Eduardo L. L. Cabral Objetivos Introdução Equações básicas Processo de correspondência Geometria epipolar Retificação de imagens Reconstrução 3D Visão estéreo

Leia mais

4 Método Proposto Visão geral do Método

4 Método Proposto Visão geral do Método 52 4 Método Proposto Neste trabalho é sugerida uma nova metodologia para compressão de dados sísmicos volumétricos. O método proposto é baseado no uso da transformada wavelet 3D. Também será apresentado

Leia mais

Visão Computacional CPS754

Visão Computacional CPS754 Visão Computacional CPS754 aula 12 - matriz fundamental Antonio Oliveira Ricardo Marroquim 1 / 1 visão computacional tópicos métodos numéricos para computar F 2 / 1 básico equação básica lembrando da condição

Leia mais

DEFINING METRIC THRESHOLDS FOR SOFTWARE PRODUCT LINES: A COMPARATIVE STUDY

DEFINING METRIC THRESHOLDS FOR SOFTWARE PRODUCT LINES: A COMPARATIVE STUDY DEFINING METRIC THRESHOLDS FOR SOFTWARE PRODUCT LINES: A COMPARATIVE STUDY APRESENTADO POR: BRUNO LUAN DE SOUSA QUA L I DA DE E MEDIÇÃO DE SOFTWA R E U N I V E R S I DA D E F E D E R A L D E MINAS G E

Leia mais

RELATÓRIO TÉCNICO - CIENTÍFICO

RELATÓRIO TÉCNICO - CIENTÍFICO UNIVERSIDADE FEDERAL DO PARÁ PRÓ-REITORIA DE PESQUISA E PÓS-GRADUAÇÃO DIRETORIA DE PESQUISA PROGRAMA INSTITUCIONAL DE BOLSAS DE INICIAÇÃO CIENTÍFICA PIBIC : CNPq, CNPq/AF, UFPA, UFPA/AF, PIBIC/INTERIOR,

Leia mais

Computação Gráfica - 09

Computação Gráfica - 09 Universidade Federal do Vale do São Francisco Curso de Engenharia da Computação Computação Gráfica - 9 jorge.cavalcanti@univasf.edu.br www.univasf.edu.br/~jorge.cavalcanti www.twitter.com/jorgecav Objetos

Leia mais

UNIVERSIDADE FEDERAL DE UBERLÂNDIA UFU

UNIVERSIDADE FEDERAL DE UBERLÂNDIA UFU UNIVERSIDADE FEDERAL DE UBERLÂNDIA UFU PLANO DE TRABALHO EM INICIAÇÃO CIENTÍFICA Desenvolvimento e aplicação de um modelo gravitacional simplificado para análise de texturas coloridas. Uberlândia 30/04/2014

Leia mais

6 Aplicação do Modelo de Geração de Cenários

6 Aplicação do Modelo de Geração de Cenários 6 Aplicação do Modelo de Geração de Cenários 6.. Considerações Iniciais Os cenários de energia natural afluente, que são utilizados durante as simulações forward e backward do processo de definição da

Leia mais

Rastreamento de Objetos Baseado em Grafos. Casamento Inexato entre Grafos Relacionais com Atributos

Rastreamento de Objetos Baseado em Grafos. Casamento Inexato entre Grafos Relacionais com Atributos Rastreamento de Objetos Baseado em Casamento Inexato entre Grafos Relacionais com Atributos Exame de Qualificação de Mestrado Ana Beatriz Vicentim Graciano Orientador: Roberto M. Cesar Jr. Colaboradora:

Leia mais

Calibração de múltiplas câmeras baseada em um padrão invariante. (Multiple camera calibration based on invariant pattern)

Calibração de múltiplas câmeras baseada em um padrão invariante. (Multiple camera calibration based on invariant pattern) Calibração de múltiplas câmeras baseada em um padrão invariante (Multiple camera calibration based on invariant pattern) Manuel Eduardo Loaiza Fernandez Marcelo Gattass (orientador) Alberto B. Raposo (co-orientador)

Leia mais

2 Trabalhos Relacionados

2 Trabalhos Relacionados 2 Trabalhos Relacionados Nesta seção são expostos os principais trabalhos utilizados como base para esta pesquisa. O objetivo é introduzir os conceitos que foram desenvolvidos nesses trabalhos, usados

Leia mais

ALGEMIRO A. S. NETO.

ALGEMIRO A. S. NETO. Calibração de Câmeras 1 ALGEMIRO A. S. NETO Pontifícia Universidade Católica do Rio de Janeiro aneto@inf.puc-rio.br Abstract Este trabalho aborda o problema de calibração de câmeras apresentando uma breve

Leia mais

MAPEAMENTO DE PONTOS CARACTERÍSTICOS POR COERÊNCIA DE

MAPEAMENTO DE PONTOS CARACTERÍSTICOS POR COERÊNCIA DE MAPEAMENTO DE PONTOS CARACTERÍSTICOS POR COERÊNCIA DE TRIÂNGULOS Rogério Yugo Takimoto, Edson Kenji Ueda, Marcos de Sales Guerra Tsuzuki, Emiliano Gonçalves de Castro, Thiago de Castro Martins, Fábio Kawaoka

Leia mais

Computação Gráfica - 09

Computação Gráfica - 09 Universidade Federal do Vale do São Francisco Curso de Engenharia da Computação Computação Gráfica - 9 jorge.cavalcanti@univasf.edu.br www.univasf.edu.br/~jorge.cavalcanti www.twitter.com/jorgecav Objetos

Leia mais

aula 10 Projeções Planas IC/UFF tela de um museu de Montreal

aula 10 Projeções Planas IC/UFF tela de um museu de Montreal aula 10 Projeções Planas IC/UFF - 2016 tela de um museu de Montreal Projeções PLANAS: Classificação BÁSICA: B Características: Um objeto no espaço o 3D A forma mais simples de representar um objeto 3D

Leia mais

PRECISÃO NO CÁLCULO DE ÁREAS PLANAS POR PERFILAMENTO A LASER 2: AVALIAÇÃO DA PRECISÃO PLANIMÉTRICA E ALTIMÉTRICA DE CADA PONTO

PRECISÃO NO CÁLCULO DE ÁREAS PLANAS POR PERFILAMENTO A LASER 2: AVALIAÇÃO DA PRECISÃO PLANIMÉTRICA E ALTIMÉTRICA DE CADA PONTO PRECISÃO NO CÁLCULO DE ÁREAS PLANAS POR PERFILAMENTO A LASER 2: AVALIAÇÃO DA PRECISÃO PLANIMÉTRICA E ALTIMÉTRICA DE CADA PONTO Fabricio Muller 1, Anderson Roberto da Silva 2, Roberto Eugenio Bertol 3,

Leia mais

REVISITANDO CONJUNTOS E DISTÂNCIAS PARA ENCONTRAR PONTOS VIZINHOS

REVISITANDO CONJUNTOS E DISTÂNCIAS PARA ENCONTRAR PONTOS VIZINHOS REVISITANDO CONJUNTOS E DISTÂNCIAS PARA ENCONTRAR PONTOS VIZINHOS Eduardo Braun - eduardotbraun@gmail.com Universidade Federal de Santa Maria, Campus Camobi, 97105-900 - Santa Maria, RS, Brasil Alice de

Leia mais

SLAM Visual. Fernando Zuher Mohamad Said Cavalcante Orientadora: Profª. Drª. Roseli Romero Mestrado em Computação, ICMC-USP

SLAM Visual. Fernando Zuher Mohamad Said Cavalcante Orientadora: Profª. Drª. Roseli Romero Mestrado em Computação, ICMC-USP SLAM Visual Fernando Zuher Mohamad Said Cavalcante Orientadora: Profª. Drª. Roseli Romero Mestrado em Computação, ICMC-USP Divisão da apresentação 1. Introdução O que é SLAM? Classificação adotada 2. Principais

Leia mais

Estimativa de Posição 3D de Obstáculos para VANTs

Estimativa de Posição 3D de Obstáculos para VANTs Estimativa de Posição 3D de Obstáculos para VANTs Rodolfo Barros Chiaramonte, Kalinka Regina Lucas Jaquie Castelo Branco Institute of Mathematics and Computing Sciences (ICMC) University of São Paulo (USP),

Leia mais

4 Estado da Arte do Kernel PCA

4 Estado da Arte do Kernel PCA 4 Estado da Arte do Kernel PCA Conforme apresentado no Capítulo 1, o Kernel PCA é uma técnica promissora para auxiliar no processo de ajuste de histórico, devido a sua capacidade de extrair parte da estatística

Leia mais

Face Recognition using RGB-D Images

Face Recognition using RGB-D Images Face Recognition using RGB-D Images Helder C. R. de Oliveira N.USP: 7122065 Polyana Nunes N.USP: 9043220 Sobre o Artigo Publication: 2013 IEEE Sixth International Conference Author(s) Goswami, G. (Índia

Leia mais

Stereo Calibration with a Free-Moving Stick

Stereo Calibration with a Free-Moving Stick Stereo Calibration with a Free-Moving Stick José A. de França Universidade Estadual de Londrina Departamento de Engenharia Elétrica Caixa Postal 6025 8605-990, Londrina - PR, Brazil http://research.eeol.org/

Leia mais

Aprendizado de Máquina. Combinando Classificadores

Aprendizado de Máquina. Combinando Classificadores Universidade Federal do Paraná (UFPR) Departamento de Informática (DInf) Aprendizado de Máquina Combinando Classificadores David Menotti, Ph.D. web.inf.ufpr.br/menotti Introdução O uso de vários classificadores

Leia mais

Projeções. Cap 2 (do livro texto) Aula 6 UFF

Projeções. Cap 2 (do livro texto) Aula 6 UFF Projeções Cap 2 (do livro texto) Aula 6 UFF - 2014 Projeções PLANAS: Classificação BÁSICA: B Características: Um objeto no espaço o 3D A forma mais simples de representar um objeto 3D em 2D é simplesmente

Leia mais

4 Algoritmo de reconstrução de curvas

4 Algoritmo de reconstrução de curvas 4 Algoritmo de reconstrução de curvas Como visto na introdução, o algoritmo proposto neste trabalho é constituído pelas seguintes etapas: 1. Agrupamento espacial dos pontos de amostragem 2. Processamento

Leia mais

Desenvolvimento de um aplicativo computacional para mosaicagem de imagens digitais utilizando Matlab

Desenvolvimento de um aplicativo computacional para mosaicagem de imagens digitais utilizando Matlab https://periodicos.utfpr.edu.br/rbgeo Desenvolvimento de um aplicativo computacional para mosaicagem de imagens digitais utilizando Matlab RESUMO Leonardo Carlos Barbosa leonardo.carlos@ufpe.br orcid.org/0000-0002-0377-1527

Leia mais

2 Trabalhos Relacionados

2 Trabalhos Relacionados 2 Trabalhos Relacionados Este capítulo apresenta os algoritmos já existentes que são utilizados nesta dissertação para obter pontos homólogos entre duas imagens de um par estéreo. Pode-se classificar essas

Leia mais

Cinemática Inversa de Manipuladores

Cinemática Inversa de Manipuladores Cinemática Inversa de Manipuladores 1998Mario Campos 1 Introdução Cinemática Inversa Como calcular os valores das variáveis de junta que produzirão a posição e orientação desejadas do órgão terminal? 1998Mario

Leia mais

IMPLEMENTAÇÃO DO RANSAC COM ALGORITMO DE

IMPLEMENTAÇÃO DO RANSAC COM ALGORITMO DE Universidade Federal de Pernambuco Graduação em Ciência da Computação Centro de Informática 2009.1 IMPLEMENTAÇÃO DO RANSAC COM ALGORITMO DE EIGHT-POINT EM GPU Trabalho de Graduação ANDRÉ VITOR DE ALMEIDA

Leia mais

ANÁLISE DO MÉTODO DE CALIBRAÇÃO DE CÂMARAS PROPOSTO POR ZHANG

ANÁLISE DO MÉTODO DE CALIBRAÇÃO DE CÂMARAS PROPOSTO POR ZHANG RESUMO ANÁLISE DO MÉTODO DE CALIBRAÇÃO DE CÂMARAS PROPOSTO POR ZHANG Teresa C. S. Azevedo*, João Manuel R. S. Tavares. e Mário A. P. Vaz. INEGI Instituto de Engenharia Mecânica e Gestão Industrial - Porto,

Leia mais

SEMINÁRIO DOS ARTIGOS:

SEMINÁRIO DOS ARTIGOS: SEMINÁRIO DOS ARTIGOS: Text Detection and Character Recognition in Scene Images with Unsupervised Feature Learning End-to-End Text Recognition with Convolutional Neural Networks Fernanda Maria Sirlene

Leia mais

EXTRAÇÃO SEMI - AUTOMÁTICA DE FEIÇÕES LINEARES E A CALIBRAÇÃO DOS PARÂMETROS INTRÍNSECOS DE CÂMERAS Projeto de Pesquisa PIBIC/CNPq ( )

EXTRAÇÃO SEMI - AUTOMÁTICA DE FEIÇÕES LINEARES E A CALIBRAÇÃO DOS PARÂMETROS INTRÍNSECOS DE CÂMERAS Projeto de Pesquisa PIBIC/CNPq ( ) USP UNIVERSIDADE DE SÃO PAULO EP ESCOLA POLITÉCNICA EXTRAÇÃO SEMI - AUTOMÁTICA DE FEIÇÕES LINEARES E A CALIBRAÇÃO DOS PARÂMETROS INTRÍNSECOS DE CÂMERAS Projeto de Pesquisa PIBIC/CNPq (2000-2001) LEONARDO

Leia mais

Ficha de Exercícios nº 3

Ficha de Exercícios nº 3 Nova School of Business and Economics Álgebra Linear Ficha de Exercícios nº 3 Transformações Lineares, Valores e Vectores Próprios e Formas Quadráticas 1 Qual das seguintes aplicações não é uma transformação

Leia mais

Exemplo de aplicação

Exemplo de aplicação Exemplo de aplicação Paralaxe O conceito de paralaxe está relacionado com o deslocamento relativo ou aparente dos objetos estacionários, quando um observador em movimento os olha de pontos diferentes.

Leia mais

Parte 3 - Produto Interno e Diagonalização

Parte 3 - Produto Interno e Diagonalização Parte 3 - Produto Interno e Diagonalização Produto Escalar: Sejam u = (u 1,..., u n ) e v = (v 1,..., v n ) dois vetores no R n. O produto escalar, ou produto interno euclidiano, entre esses vetores é

Leia mais

Detecção Robusta de Movimento de Câmera em Vídeos por Análise de Fluxo Ótico Ponderado

Detecção Robusta de Movimento de Câmera em Vídeos por Análise de Fluxo Ótico Ponderado Detecção Robusta de Movimento de Câmera em Vídeos por Análise de Fluxo Ótico Ponderado Rodrigo Minetto Prof. Dr. Neucimar Jerônimo Leite (Orientador) Prof. Dr. Jorge Stolfi (Co-orientador) Instituto de

Leia mais

Processamento de Imagens CPS755

Processamento de Imagens CPS755 Processamento de Imagens CPS755 aula 03 - visualizando a planar Antonio Oliveira Ricardo Marroquim 1 / 40 laboratório de processamento de imagens tópicos visualizando a planar discussão dos primeiros 2

Leia mais

aula9 Coordenadas homogêneas e projeções 2016/2 IC / UFF

aula9 Coordenadas homogêneas e projeções 2016/2 IC / UFF http://computacaografica.ic.uff.br/conteudocap2.html aula9 P p O Coordenadas homogêneas e projeções 2016/2 IC / UFF 2D TODAS AS Transformações Lineares Bidimensionais São representadas por matrizes 2 x

Leia mais

Processamento de Imagens CPS755

Processamento de Imagens CPS755 Processamento de Imagens CPS755 aula 07 - modelos de câmera Antonio Oliveira Ricardo Marroquim 1 / 32 laboratório de processamento de imagens tópicos matriz de calibração câmera finita câmera projetiva

Leia mais

Aula9 e 10. Projeções Planas. Como representar objetos 3D em dispositivos 2D? 2019/1 IC / UFF. Paginas 91 a 101 livro texto de computacao grafica

Aula9 e 10. Projeções Planas. Como representar objetos 3D em dispositivos 2D? 2019/1 IC / UFF. Paginas 91 a 101 livro texto de computacao grafica Aula9 e 10 Como representar objetos 3D em dispositivos 2D? Projeções Planas 2019/1 IC / UFF P p O Paginas 91 a 101 livro texto de computacao grafica Como desenhar o mundo 3D no planos? Fazendo as projeções

Leia mais

14/05/2014. Tratamento de Incertezas TIC Aula 12. Conteúdo Propagação de Incertezas. Incerteza Propagação de incertezas de primeira ordem

14/05/2014. Tratamento de Incertezas TIC Aula 12. Conteúdo Propagação de Incertezas. Incerteza Propagação de incertezas de primeira ordem Tratamento de Incertezas TIC-00.76 Aula 2 Conteúdo Professor Leandro Augusto Frata Fernandes laffernandes@ic.uff.br Material disponível em http://www.ic.uff.br/~laffernandes/teaching/204./tic-00.76 Tópicos

Leia mais