Sistema Computacional para Contagem Automática de Pessoas Baseado em Análise de Seqüências de Imagens

Documentos relacionados
Processamento Digital de Imagens

Aula 5 - Classificação

Estudo de técnicas de rastreamento de objetos aplicadas à detecção de múltiplas larvas

Processamento digital de imagens. introdução

Ferramenta para detecção de fadiga em motoristas baseada no monitoramento dos olhos

Classificação da imagem (ou reconhecimento de padrões): objectivos Métodos de reconhecimento de padrões

Processos de gerenciamento de projetos em um projeto

PrinciPais FUnciOnaLiDaDEs DO robô

Vigilância e Monitoramento em Tempo Real de Veículos em Rodovias com Câmeras Não-Calibradas

Encontrando a Linha Divisória: Detecção de Bordas

Metadados. 1. Introdução. 2. O que são Metadados? 3. O Valor dos Metadados

Ponte rolante: como escolher

Interseções. Lastran/Ufrgs

2 Texturas com Relevo e Equações de Pré Warping

Infra estrutura precária Máquinas e Equipamentos

Disciplina: Técnicas de Racionalização de Processos Líder da Disciplina: Rosely Gaeta NOTA DE AULA 04 O PROJETO DE MELHORIA DOS PROCESSOS

SEGEMENTAÇÃO DE IMAGENS. Nielsen Castelo Damasceno

Segmentação de Imagens

Classificação de Imagens

Campus Capivari Análise e Desenvolvimento de Sistemas (ADS) Prof. André Luís Belini prof.andre.luis.belini@gmail.com /

MODELAGEM E SIMULAÇÃO

3.1 Definições Uma classe é a descrição de um tipo de objeto.

Universidade Católica Dom Bosco

Plano de Continuidade de Negócios

CRONÔMETRO MICROPROCESSADO

Agenda. Detecção e Análise de Movimento em Vídeos. Detecção e Análise de Movimentos: Introdução. Detecção e Análise de Movimentos: Introdução

4 Experimentos Computacionais

Segmentação de Imagens de Placas Automotivas

Introdução. Capítulo. 1.1 Considerações Iniciais

ADMINISTRAÇÃO GERAL GESTÃO DE PROCESSOS

Análise e Projeto de Software

SISTEMAS DE INFORMAÇÃO GERENCIAIS

ESTRUTURA DE GERENCIAMENTO DO RISCO OPERACIONAL DO BANCO COOPERATIVO SICREDI E EMPRESAS CONTROLADAS

UNIVERSIDADE FEDERAL RURAL DE PERNAMBUCO DEPARTAMENTO DE ESTATÍSTICA E INFORMÁTICA BACHARELADO EM SISTEMAS DE INFORMAÇÃO RAPID APPLICATION DEVELOPMENT

Especificação Operacional.

Respostas do Estudo Dirigido do Capítulo 14 Classical pattern recognition and image matching"

Nota Técnica 113/2007 SRD/SRE/ANEEL Metodologia para Projeção de Investimentos para o Cálculo do Fator X Contribuição da Audiência Publica 052/2007

ESTEREOSCOPIA INTRODUÇÃO. Conversão de um par de imagens (a)-(b) em um mapa de profundidade (c)

c. Técnica de Estrutura de Controle Teste do Caminho Básico

A limiarização é uma das abordagens mais importantes de segmentação de imagens. A limiarização é um caso específico de segmentação.

Implementadas por Computador

Descritores de textura na análise de imagens de microtomografia computadorizada

1 Introdução simulação numérica termoacumulação

Sistemas Operacionais. Curso Técnico Integrado Profa: Michelle Nery

SEGMENTAÇÃO DE IMAGENS EM PLACAS AUTOMOTIVAS

Capítulo 4 Gerenciamento de Memória

Fundamentos de Imagens Digitais. Aquisição e Digitalização de Imagens. Aquisição e Digitalização de Imagens. Aquisição e Digitalização de Imagens

Gerenciamento de Projetos Modulo III Grupo de Processos

Gerenciamento de Projetos Modulo IX Qualidade

VÃOS DESNIVELADOS, UTILIZANDO PERFIL DE PROJETO DIGITAL, SOFTWARE EM AMBIENTE VISUAL E BASE DE DADOS RELACIONAL

4 Avaliação Experimental

Modelagem Digital do Terreno

Figura 5.1.Modelo não linear de um neurônio j da camada k+1. Fonte: HAYKIN, 2001

POLÍTICA DE GESTÃO DE RISCO - PGR

A NECESSIDADE DE UMA NOVA VISÃO DO PROJETO NOS CURSOS DE ENGENHARIA CIVIL, FRENTE À NOVA REALIDADE DO SETOR EM BUSCA DA QUALIDADE

Profa. Dra. Soraia Raupp Musse Thanks to Prof. Dr. Cláudio Rosito Jung

Cinco restrições de desenvolvimento/teste que afetam a velocidade, o custo e a qualidade dos seus aplicativos

PROJETO DE REDES

RECONHECIMENTO DE PLACAS DE AUTOMÓVEIS ATRAVÉS DE CÂMERAS IP

Análise de Percolação em Barragem de Terra Utilizando o Programa SEEP/W

ITIL. Conteúdo. 1. Introdução. 2. Suporte de Serviços. 3. Entrega de Serviços. 4. CobIT X ITIL. 5. Considerações Finais

2 INSTRUMENTAÇÃO E SEGURANÇA DE BARRAGENS

ANEXO VI ESPECIFICAÇÃO DO SISTEMA DE MONITORAMENTO E CONTROLE OPERACIONAL

Prof. Msc. Fernando Oliveira Boechat

Aula 2 Revisão 1. Ciclo de Vida. Processo de Desenvolvimento de SW. Processo de Desenvolvimento de SW. Processo de Desenvolvimento de SW

ELABORAÇÃO DE PROJETOS

Sistemas Operacionais. Prof. André Y. Kusumoto

Avaliação de Desempenho de Sistemas

Diretrizes para determinação de intervalos de comprovação para equipamentos de medição.

Gerenciamento de Projetos Modulo II Clico de Vida e Organização

LISTA DE VERIFICAÇAO DO SISTEMA DE GESTAO DA QUALIDADE

ESPECIFICAÇÕES TÉCNICAS SENSOR MATRIX

1 Introdução. 2 Exemplo de aplicação

Universidade Federal do Rio de Janeiro - IM/DCC & NCE

Curva ROC. George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE

Requisitos de Software

Tecnologia de faixa para falha

COBERTURA EM UMA REDE DE SENSORES SEM FIO

3 Estratégia para o enriquecimento de informações

Gerenciamento Total da Informação

Gestão dos Prazos e Custos do Projeto

Iluminação LED de nível alto

Princípios do teste de software

Transformação de um Modelo de Empresa em Requisitos de Software

Programa Integrado de Monitoria Remota de Fragmentos Florestais e Crescimento Urbano no Rio de Janeiro

Capítulo 4 Gerenciamento de Memória

Técnicas de Computação Paralela Capítulo III Design de Algoritmos Paralelos

Memória cache. Prof. Francisco Adelton

Porta cortafogo faz parte da. compartimentação contra incêndio

6 A coleta de dados: métodos e técnicas utilizadas na pesquisa

PROGRAMA DE PROTEÇÃO AO PEDESTRE

Gerenciamento de memória

Minirrotatória. Um projeto simples e eficiente para redução de acidentes

2 Fundamentação Conceitual

Formador: Carlos Maia

DEFINIÇÃO DE ÁREAS POTENCIAIS AO RISCO DE DESLIGAMENTO DE LINHAS DE TRANSMISSÃO DEVIDO A INCÊNDIOS - PLANEJAMENTO E CRITÉRIOS DE MANUTENÇÃO

1 CIRCUITOS COMBINACIONAIS

SARESTA SISTEMA DE RESTABELECIMENTO INTEGRADO AO SISTEMA DE SUPERVISÃO E CONTROLE DISTRIBUÍDO DA CEMIG

Transcrição:

LEILA SILVIA DA SILVA Sistema Computacional para Contagem Automática de Pessoas Baseado em Análise de Seqüências de Imagens Dissertação de mestrado apresentada ao Curso de Mestrado em Modelagem Matemática e Computacional do Centro Federal de Educação Tecnológica de Minas Gerais, como requisito para obtenção do título de Mestre em Modelagem Matemática e Computacional. Orientador: Prof. Dr. Flávio Luis Cardeal Pádua MESTRADO EM MODELAGEM MATEMÁTICA E COMPUTACIONAL CENTRO FEDERAL DE EDUCAÇÃO TECNOLÓGICA DE MINAS GERAIS DIRETORIA DE PESQUISA E PÓS-GRADUAÇÃO Belo Horizonte Outubro/2008

S586s Silva, Leila Sílvia Sistema computacional para contagem automática de pessoas baseado em análise de seqüências de imagens. 2008. 136 f. Orientador: Flávio Luis Cardeal Pádua Dissertação (mestrado) Centro Federal de Educação Tecnológica de Minas Gerais. 1. Pessoas Teses. 2. Cálculos numéricos. 3. Imagens ópticas. 4. Processamento de imagens. 5. Computação aplicada. I. Pádua, Flávio Luis Cardeal. II. Centro Federal de Educação Tecnológica de Minas Gerais. III. Título. CDD 004 Elaboração da ficha catalográfica por Biblioteca-Campus II / CEFET-MG

Aos meus pais José Domingos e Maria Eliza e Aos meus filhos Marcio Genei e Marcos Hiroshi

Agradecimentos Primeiramente agradeço a Deus e a todos os amigos espirituais que me auxiliaram no desenvolvimento deste projeto. Ao coordenador do curso Prof. Dr. Sérgio Ricardo de Souza, aos professores e em especial ao meu orientador, Prof. Dr. Flávio Luis Cardeal Pádua, que acreditou em mim e me ajudou a vencer muitas dificuldades na vida pessoal, obrigada pela paciência, pela inestimável atenção durante todo o desenvolvimento deste trabalho, pelo conhecimento compartilhado principalmente nas correções e na realização dos experimentos. Aos meus pais, tios, tias e primas que sempre me apoiaram e me incentivaram na realização deste trabalho, e dispensaram toda a atenção possível aos meus filhos para que eu pudesse me dedicar aos estudos. Obrigado pelas suas orações. Aos meus filhos pela compreensão, pelo apoio incondicional nas horas difíceis e pelo incentivo. Desculpem-me pelos dias em que estive ausente. Ao Marco Aurélio Buono Carone que com muita dedicação me ajudou no desenvolvimento do software e na realização dos experimentos. Aos amigos do Laboratório de Sistemas Inteligentes do CEFET-MG, em especial a Suelen Mapa, Anderson Fortunato, Jefferson, Magela, Gabriel e as amigas Maria Amélia e Cristiane pela força para a realização do mestrado e pelo conhecimento compartilhado. A todos os meus alunos, amigos e familiares que de uma forma ou de outra me estimularam e contribuíram para esta conquista.

Resumo Este trabalho propõe o desenvolvimento de um sistema computacional para contagem automática de pessoas, em ambientes internos ou externos, baseado em análise de seqüências de imagens. Diferentemente da grande maioria dos sistemas encontrados na literatura e em aplicações comerciais, os quais freqüentemente se baseiam no uso de sensores fotoelétricos ou sensores de pressão, que restringem o fluxo de pessoas por um determinado caminho, o presente trabalho propõe uma técnica baseada exclusivamente na análise de imagens da cena de interesse. A abordagem desenvolvida consiste na detecção de objetos móveis na imagem capturada por uma câmera de vídeo fixa, aplicando-se uma técnica de subtração do plano de fundo da imagem do quadro corrente da cena, aliada a técnicas de remoção de sombras e ruídos, que possibilitam a identificação e a localização de pessoas. Utilizando o filtro preditivo de Kalman, as pessoas são rastreadas e contadas ao deixarem a cena. Experimentos mostraram que o sistema proposto é robusto e eficiente em 96% dos casos, o que viabiliza o desenvolvimento do protótipo de um produto com alto valor agregado para aplicações em automação comercial, reestruturação de ambientes, controle de tráfego urbano e segurança patrimonial. Palavras-Chave: Análise de Seqüência de Imagens, Contagem de Pessoas, Filtro Preditivo, Rastreamento de Pessoas, Remoção de Sombras.

Abstract This work addresses the problem of counting people in indoor and outdoor scenes, by using image sequence analysis. Unlike most existing methods, which are frequently based on the use of sensor sets, such as photoelectric and pressure sensors, this work proposes a new technique based on the application of an intelligent system for analyzing images captured by a single steady camera of the monitored scene. Therefore, our solution does not need to be used in conjunction with physical structures, which may constrain the space where people flow and force them to move through specified paths. Specifically, the proposed system is based on a background subtraction technique, shadow and noise removal methods, and a predictive filter (Kalman Filter) for people tracking. Experiments showed that the proposed system is robust achieving a counting accuracy of 96%. That kind of accuracy allows the counting system application in many scenarios, such as commercial automation, urban traffic monitoring, surveillance systems and adjustment of store layouts. Keywords: Computer Vision, Image Sequence Analysis, Object Tracking, People Counting, Predictive Filter, Shadow Removal.

Lista de Figuras Figura 1.1: Exemplos de cenários desafiadores para utilização do sistema de contagem automática de pessoas.... 20 Figura 1.2 : Visão geral do sistema para contagem automática de pessoas.... 21 Figura 2.1: Grupos de sistemas pesquisados para contagem de pessoas..27 Figura 2.2: Estrutura do histograma, composta de múltiplas células definidas sobre a área da imagem. Fonte: Figura adaptada de Teixeira e Savvides, 2007.... 29 Figura 2.3: Posições detectadas da imagem em movimento. Cada pixel da imagem é mapeado em uma ou mais células do histograma. Fonte: Figura adaptada de Teixeira e Savvides, 2007... 29 Figura 2.4: (a) e (b) Trajetórias de pedestres obtidas com scanner laser projetadas em imagem de vídeo. Fonte: Figura adaptada de Zhao e Shibasaki, 2005.... 30 Figura 2.5: (a) Imagem original; (b) Imagem com objetos detectados; ( c) Mapa com contornos do plano de fundo; (d) Mapa com contornos dos objetos detectados. Fonte: Kong, Gray e Tao, 2005... 31 Figura 2.6: (a) Imagem binária com sombra; (b) Imagem binária com remoção de sombra; (c) Pedestres detectados; (d) Histograma com projeção vertical da imagem. Fonte: Figura adaptada de Bhuvaneshwar e Mirchandani, 2004.... 32 Figura 2.7: Seqüência de imagens contendo múltiplos objetos em movimento, com oclusões parciais dos objetos. Fonte: Ramanan e Forsyth, 2003.... 33 Figura 2.8: Estrutura do sistema de detecção e rastreamento de pessoas. Fonte: Figura adaptada de Siebel, 2003... 34 Figura 2.9: Seqüência de quadros com rastreamento em uma estação de metrô. Fonte: Siebel, 2003... 34

Figura 2.10: Imagem capturada por câmera colocada ortogonalmente ao piso. Fonte: Kim et al., 2002.... 35 Figura 2.11: Seqüência de rastreamento de pedestres em diferentes situações de oclusões. Fonte: Masoud e Papanikolopoulos, 2001... 36 Figura 2.12: (a) e (b) Esquema de rastreamento em uma situação com 4 câmeras. Fonte: Kettnaker e Zabih,1999... 38 Figura 2.13: Exemplos de modelos de silhueta usados para localizar partes do corpo em diferentes ações. Fonte: Haritaoglu,1998.... 39 Figura 2.14: Modelos de sensores e características funcionais de cada modelo. Fonte: www.digesan.com.br... 40 Figura 3.1: Ilustração do operador T sobre a vizinhança de um ponto da imagem. Fonte: Gonzalez and Woods, 2008... 45 Figura 3.2: Típicos arranjos de operadores para processamento espacial..45 Figura 3.3: Operador 3x3 aplicado sobre a vizinhança de um ponto da imagem.... 46 Figura 3.4: Máscara para detecção de pontos isolados em fundo constante.... 47 Figura 3.5: Segmentação baseada em pontos (a) Imagem original; (b) Imagem por detecção de pontos isolados; Fonte: Neves, S. C. M, 2001.... 47 Figura 3.6: Máscaras para linhas. Fonte: Gonzalez e Woods, 2008... 48 Figura 3.7: Segmentação baseada em linhas. (a) Imagem por detecção de retas verticais; (b) Imagem por detecção de retas horizontais; Fonte: Neves, S. C. M, 2001... 48 Figura 3.8: Operadores 3x3 de Sobel utilizados para estimar a amplitude do gradiente através de uma borda. Fonte: Gonzalez e Woods, 2008.... 50 Figura 3.9 : Máscara utilizada para o Laplaciano. Fonte: Gonzalez e Woods, 2008... 51 Figura 3.10: Detecção de Bordas; (a) Soma do módulo do gradiente vertical e horizontal de Sobel; (b) Imagem segmentada utilizando Laplaciano. Fonte: Neves, S. C. M, 2001... 51 Figura 3.11: Resultados da aplicação do método de limiariazação. (a) Imagem binária Limiar 111; (b) Imagem binária - Limiar 187. Fonte: Neves, S. C. M, 2001... 52

Figura 3.12: Exemplos de particionamento de histogramas de intensidade. (a) Histograma particionado por um limiar; (b) Histograma particionado por dois limiares. Fonte: (Gonzalez e Woods, 2008).... 53 Figura 3.13: Representação de resolução de 5 bits para o nível de intensidade luminosa de uma imagem monocromática. Fonte: Orth, A., 2001... 54 Figura 3.14: (a)técnica de divisão de feixes luminosos em 3 componentes coloridos; (b) Gráfico das componentes RGB. Fonte: Erhardt-Ferron, A., 2000... 55 Figura 3.15: Processo de segmentação por crescimento de regiões. (a) Imagem original; (b) Imagem segmentada. Fonte: Stemmer et al., 2005.... 56 Figura 3.16 : Processo de segmentação por divisão e agrupamento. (a) Processo de Divisão da Imagem ; (b) Estrutura de Armazenamento do Quadrante. Fonte: (Gonzalez e Woods, 2008).... 57 Figura 3.17: Resultado da segmentação por divisão e agrupamento. (a) Lena imagem original; (b) Imagem segmentada. Fonte: Neves, S. C. M, 2001.... 58 Figura 3.18: Processo de segmentação por divisores de águas. (a) Imagem Original; (b) Imagem binária; (c) Imagem segmentada. Fonte: Stemmer et al., 2005.... 59 Figura 3.19: Máscaras para filtros de suavização. Fonte: Gonzalez e Woods, 2008... 61 Figura 3.20: Exemplos de suavização com máscara nxn. (a) Imagem original; (b) Resultado com máscara 3x3; (c) Resultado com máscara 5x5; (d) Resultado com máscara 7x7. Fonte: Gonzalez e Woods, 1992.... 61 Figura 3.21: Exemplo de mediana para matriz 3x3... 62 Figura 3.22: Resultado da aplicação do filtro de realce dos detalhes da imagem. (a) Imagem original; (b) Imagem realçada. Fonte: Albuquerque et al., 2005.... 62 Figura 3.23: Principais formas de elementos estruturantes na morfologia matemática. (a) Vizinhança 4 (N 4 ); (b) Vizinhança 8 (N 8 ). Fonte:Gonzalez e Woods,1992... 63 Figura 3.24: Princípio de funcionamento de operadores morfológicos. Fonte: Gonzalez e Woods, 2008... 64

Figura 3.25: (a) imagem original; (b) Transformada Discreta de Fourier (DFT) da imagem; (c) Aplicação do filtro Passa-Baixa; (d) Aplicação do Filtro Passa-Alta. Fonte: Paciornik, S. (2007), disponível em: www.dcmm.pucrio.br/cursos/ipdi... 66 Figura 3.26: Exemplos de detecção com sombra e detecção com remoção de sombra. (a) Imagem segmentada; (b) Detecção de veículos envolvendo sombra; (c) Detecção de veículos com supressão de sombras. Fonte: Prati et al., 2001.... 68 Figura 3.27: Remoção de sombra baseada no NCC. (a) Imagem original; (b) Imagem segmentada; (c) Imagem com sombra removida. Fonte: Grest et al.,2003.... 70 Figura 3.28: Detecção inicial de pessoas e sombras. (a) Plano de fundo; (b) Uma imagem da seqüência de vídeo; (c) Pontos detectados que não pertencem ao fundo. Fonte: (Jacques et al., 2005)... 73 Figura 3.29: Resultados do refinamento de sombra. (a) Imagem com pixels de sombra representado por cinza claro; (b) Imagem com objetos detectados depois da remoção de sombra; (c) Imagem depois da eliminação de buracos e pontos isolados por meio de operadores morfológicos. Fonte: (Jacques et al., 2005)... 73 Figura 3.30: (a) Posição inicial; (b) Predição; (c) Identificação; (d) Ajuste. Fonte: Thrun, S., 2006.... 76 Figura 3.31: Esquema representativo da utilização do Filtro de Kalman.... 77 Figura 3.32: Vista superior de uma pessoa em pé. A figura ilustra uma elipse envolvnedo o corpo de uma pessoa, métricas corporais de acordo com North-American Highway Capacity Manual. Fonte: HCM, 2000....79 Figura 4.1: Regiões de fronteira da área monitorada pela câmera de vídeo.... 82 Figura 4.2: Esquema do sistema de contagem de pessoas: caixas sólidas representam processos, caixas pontilhadas representam interfaces, setas sólidas representam o fluxo de informação, setas pontilhadas representam a passagem de parâmetros e elipses pontilhadas representam armazenamento de informação.... 83 Figura 4.3: Visão da área monitorada pela câmera de vídeo... 84 Figura 4.4: Objeto de calibração de 1,0 metro de comprimento (medida real) corresponde a 80 pixels na imagem, sendo a altura da câmera 5,6 m. 86 Figura 4.5: Relação entre a altura de instalação da câmera e distância focal.... 86

Figura 4.6: Projeção em perspectiva do corpo com dimensão W1 (distância entre ombros) e W2 (profundidade do tórax); w1 e w2 são as projeções de W1 e W2, respectivamente, na imagem plana; H1 é altura de uma pessoa, H2 é a diferença entre H3 e H1, H3 é a altura da câmera em relação ao solo. Fonte: Pádua, 2003.... 87 Figura 4.7: Plano de fundo com variação de luminosidade; (a) Alta iluminação; (b) Média iluminação; (c) Baixa iluminação.... 89 Figura 4.8: Região para análise dos pixels candidatos a sombra.... 90 Figura 4.9: (a) Imagem com sombra; (b) Imagem com sombras removidas.91 Figura 4.10: (a) Imagem capturada pela câmera de vídeo; (b) Imagem com buracos... 92 Figura 4.11: (a) Imagem do plano de fundo; (b) Imagem do quadro corrente; (c) imagem resultante da subtração entre (b) e (a)... 93 Figura 4.12: Elemento estruturante na morfologia matemática com vizinhança 4 (N4). Fonte:Gonzalez e Woods,1992... 94 Figura 4.13: (a) Imagem do quadro corrente; (b)imagem-diferença binarizada com ruídos; (c) Imagem com aplicação de filtro de erosão;( d) Imagem com aplicação de filtro de dilatação, após aplicação do filtro de erosão.... 94 Figura 4.14: Regiões de fronteira da cena com disposição em catavento. 95 Figura 4.15: Determinação de função unidimensional de pulso para uma região horizontal hipotética de 16x3 pixels.... 96 Figura 4.16: Pulso relativo a uma pessoa passando pela região de fronteira.... 97 Figura 4.17: Pulsos relativos a várias pessoas passando pela região de fronteira... 97 Figura 4.18: Distribuição de probabilidades de número de pessoas contidas em um elemento de pulso, de acordo com o seu tamanho.... 98 Figura 4.19: Ponto médio do pulso de uma pessoa.... 99 Figura 4.20: Ponto médio do pulso de uma pessoa e do pulso de duas pessoas juntas.... 99 Figura 4.21: Representação dos pulsos gerados nas regiões de fronteira pela passagem das pessoas... 100

Figura 4.22: Técnica para estimação de movimento. (a) Imagem no instante ti - 1 ; (b) Imagem no instante ti ; Fonte: Figura adaptada de Nesi, 1997.... 101 Figura 4.23: Seqüência de rastreamento de pessoas utilizando o filtro de Kalman... 105 Figura 4.24: Amostragem hipotética realizada nas redondezas de uma pessoa..... 106 Figura 4.25: Representação do local monitorado por uma câmera de vídeo com quatro regiões de fronteira.... 106 Figura 5. 1: Foto do suporte com a câmera; (a) visão lateral do suporte; (b) visão da parte de baixo do suporte.... 109 Figura 5.2: Esquema das regiões de fronteira tipo catavento... 110 Figura 5.3: Cena 1 - vídeo 1; (a) (d) imagens com duas pessoas caminhando da região 3 para região 4 e uma pessoa caminhando pela fronteira 2 da direita para esquerda; (e) interface do sistema com resultados da contagem... 112 Figura 5.4: Cena 1 - Vídeo 2; (a) (d) imagens com duas pessoas caminhando abraçadas da região 3 para a região 4; (e) interface do sistema com resultados.... 113 Figura 5.5: Cena 1 - vídeo 3; (a) (d) pessoas caminhando em grupo; (e) interface do sistema com resultados da contagem.... 114 Figura 5.6: Cena 1 - vídeo 4; (a) pessoa acenando; (b) localização e velocidades das pessoas; (c) e (d) pessoa correndo; (e) e (f) pessoas carregando mochilas e bolsas.... 115 Figura 5.7 Cena 2 - Vídeo 4, seqüência de imagens com oito pessoas caminhando da esquerda para direita; (a) (c) e (d) - (f) pessoas caminhando e se agrupando na região de fronteira; (g) interface do sistema com resultado da contagem.... 117 Figura 5.8: Cena 2 - Vídeo 5, seqüência de imagens com seis pessoas caminhando da direita para a esquerda e duas saindo pela região 1; (a) (c) e (d) - (f) pessoas caminhando e se agrupando na região de fronteira; (g) interface do sistema com resultado da contagem. Circulo vermelho indica uma nova pessoa na cena... 118 Figura 5.9: Cena 2 - Vídeo 6, (a) (c) seqüência de imagens com quatro pessoas caminhando da direita para a esquerda; (d) (f) seqüência de imagens com quatro pessoas caminhando da esquerda para direita. (g) interface da contagem.... 119

Figura 5.10: Cena 3 - Vídeo 7, (a) (d) seqüência de imagens de pessoas carregando mochilas e caminhando em grupo; (e) interface do sistema com o resultado da contagem... 121 Figura 5.11: Cena 3 - Vídeo 8, (a) (d) seqüência de imagens em que a cor da roupa da pessoa é semelhante ao plano de fundo ; (e) interface do sistema com o resultado da contagem.... 122 Figura 5.12: Cena 3 Vídeo 9, (a) e (b) pessoas caminhando muito próximas ; (c) e (d) pessoas caminhando pela diagonal ; (e) interface do sistema com resultados.... 123 Figura 5.13: Cena 3, situações especiais. (a) (f) imagens com uma pessoa caminhando com braços abertos, carregando pacote, entrando e saindo pelas 4 regiões de fronteira... 124 Figura 5.14: Cena 4 Vídeo 10; (a) (f) pessoas saindo da escada rolante; (g) interface do sistema com resultados da contagem... 126 Figura 5.15: Cena 4 Vídeo 11; (a) (f) pessoas saindo da escada rolante; (g) interface do sistema com resultados da contagem... 127 Figura 5.16: Cena 4 Vídeo 12; (a) (f) pessoas saindo da escada rolante; (g) interface do sistema com resultados da contagem... 128

Lista de Tabelas Tabela 3. 1: Medidas antropométricas de trabalhadores no Rio de Janeiro. Fonte: Adaptado de Ferreira, 1988.... 79 Tabela 5.1: Resultados obtidos com os vídeos da cena 1.... 116 Tabela 5.2: Resultados obtidos com os vídeos da cena 1.... 120 Tabela 5.3: Resultados obtidos com os vídeos da cena 3 e erros ocorridos.... 125 Tabela 5. 4: Resultados obtidos com os vídeos da cena 4 e erros ocorridos.... 129

Sumário 1 Introdução... 18 1.1 Caracterização do Problema de Pesquisa... 20 1.2 Justificativa... 23 1.3 Objetivos: geral e específicos... 24 1.4 Contribuições... 25 1.5 Organização do Texto... 25 2 Trabalhos Relacionados... 27 2.1 Sistemas com Câmera de Vídeo... 28 2.2 Sistemas com Sensor Fotoelétrico... 40 2.3 Sistemas com Sensor de Pressão... 41 2.4 Considerações Finais... 42 3 Fundamentação Teórica... 43 3.1 Segmentação de Imagem... 44 3.1.1 Segmentação Baseada em Pontos, Linhas e Bordas... 44 3.1.2 Limiarização... 51 3.1.3 Segmentação Orientada a Regiões... 56

3.1.4 Segmentação por Divisores de Águas... 58 3.2 Filtragem de Ruídos... 60 3.2.1 Filtros Espaciais... 60 3.2.2 Filtros no Domínio da Freqüência... 65 3.3 Remoção de Sombra... 66 3.4 Segmentação de Movimento... 73 3.4.1 Subtração de Imagens... 74 3.4.2 Abordagens Estatísticas... 74 3.5 Rastreamento... 75 3.5.1 Filtro de Kalman... 76 3.6 Movimento Humano... 78 3.6.1 Dimensões Corporais Humanas... 78 3.6.2 Velocidade dos Humanos... 79 3.7 Considerações Finais... 80 4 Sistema de Contagem Automática de Pessoas... 81 4.1 Detecção de Objetos em Movimento... 84 4.1.1 Aquisição de Imagens... 84 4.1.2 Calibração do Sistema... 85 4.1.3 Modelo de Plano de Fundo... 89 4.1.4 Remoção de Sombras... 89

4.1.5 Subtração de Imagens... 92 4.1.6 Operações Morfológicas... 93 4.2 Análise de Fronteiras... 95 4.2.1 Regiões de Fronteira... 95 4.2.2 Identificação de Pessoas... 96 4.2.3 Localização de Pessoas... 99 4.3 Rastreamento e Contagem de Pessoas... 101 4.3.1 Filtro de Kalman... 102 4.3.2 Verificação de Colisões... 105 4.3.3 Contagem de Pessoas... 106 4.4 Considerações Finais... 107 5 Resultados Experimentais... 108 5.1 Planejamento dos Experimentos... 109 5.2 Experimentos e Análise dos Resultados... 111 5.3 Considerações Finais... 129 Conclusões e Sugestões para Trabalhos Futuros... 131 Referências Bibliográficas... 133

Capítulo 1 Introdução A necessidade de contar objetos faz parte do cotidiano da vida das pessoas. Em particular, a quantificação do fluxo de pessoas que passam por um local constitui uma informação importante para diversos setores da sociedade. Em estabelecimentos comerciais, o monitoramento de pessoas em áreas estratégicas fornece informações valiosas para se otimizar o atendimento e aumentar as vendas, possibilitando adequar o esquema físico das lojas para atender melhor os clientes. Nos estabelecimentos bancários, informações sobre o número de pessoas nas filas e o tempo de espera para o atendimento possibilitam projetar mudanças para tornar os serviços mais eficientes. Nas empresas, é interessante monitorar o acesso a áreas restritas, verificar a quantidade de pessoas que passaram nesses locais e os horários de entrada ou saída, e acionar dispositivos de alerta da segurança. Em ambientes externos, como no cruzamento de avenidas, informações sobre o fluxo de pessoas e de veículos permitem o desenvolvimento de projetos mais eficientes no controle do tráfego dos grandes centros urbanos, minimizando o transtorno causado pelos congestionamentos. A utilização de métodos automáticos de contagem de pessoas por um longo período permite a obtenção de dados estatísticos, indispensáveis ao planejamento e desenvolvimento de sistemas específicos para cada tipo de aplicação. O problema abordado neste trabalho consiste em estimar fluxos multidirecionais de pessoas em ambientes internos ou externos, utilizando técnicas de processamento e análise de seqüências de imagens. Os trabalhos pesquisados na literatura se baseiam em técnicas de subtração do

Capítulo 1 - Introdução 19 plano de fundo para detecção de movimento de pessoas presentes na área monitorada, utilizando limiarização e binarização da imagem (Bhuvaneshwar e Mirchandani, 2004, Kim et al., 2002, Masoud e Papanikolopoulos, 2001; Kettnaker e Zabih, 1999); metodologias estatísticas que possibilitam a classificação dos pixels em movimento e dos pixels estacionários em uma seqüência de imagens, para segmentação da cena de fundo e dos objetos em movimento (Teixeira e Savvides, 2007; Jeon e Rybski, 2006; Lu e Tan, 2001; Haritaoglu, 1998); rastreamento de pessoas utilizando o filtro prediditvo de Kalman para estimar novas posições das pessoas (Beymer e Konolige,1999), monitoramento de pedestres utilizando scanners a laser (Zhao e Shibasaki, 2005). Estimação do movimento de pedestres por meio do Fluxo Óptico (Pádua et al., 2003) e também em classificadores neurais artificiais para identificação das pessoas presentes na cena a partir do uso de modelos de suas formas ou análise de seus movimentos (Kong, Gray e Tao, 2005; Schofield et al.,1997). O presente trabalho se baseia na técnica de subtração do plano de fundo da cena para detecção de objetos móveis em seqüências de imagens; no conhecimento a-priori sobre métricas corporais, comumente empregadas por engenheiros de transporte (Ferreira, D. M. P.,1998), de forma a auxiliar no processo de identificação dos objetos móveis considerados como potenciais representações de pessoas na cena, e no rastreamento das mesmas utilizando o filtro de Kalman. A abordagem pesquisada representa uma extensão e aprimoramento da técnica para contagem de pessoas desenvolvida por Pádua (Pádua et al., 2003) e constitui um tópico de estudo de grande relevância no âmbito das atividades de pesquisa do Laboratório de Sistemas Inteligentes do CEFET-MG. O sistema desenvolvido tem aplicabilidade em diversos cenários, como os ilustrados na Figura 1.1, os quais são caracterizados por problemas bastante desafiadores, tais como oclusão e aglomeração de pessoas.

Capítulo 1 - Introdução 20 Figura 1.1: Exemplos de cenários desafiadores para utilização do sistema de contagem automática de pessoas. 1.1 Caracterização do Problema de Pesquisa O problema de pesquisa abordado neste trabalho consiste em estimar fluxos multidirecionais de pessoas em ambientes internos ou externos, utilizando técnicas de processamento e análise de seqüências de imagens de uma área de interesse, monitorada por uma câmera de vídeo. Na área considerada, as pessoas entram e saem todo o tempo da área capturada pela câmera de vídeo, podendo entrar em grupo e, em seguida se separarem, ou entrar separadas e depois se agruparem. Oclusões

Capítulo 1 - Introdução 21 provocadas pelo movimento em grupo dificultam a identificação do objeto detectado na cena, podendo corresponder a duas ou mais pessoas. Sombras das pessoas e de outros objetos podem dificultar o processo de identificação, sendo necessário retirar as sombras de cada imagem a ser analisada. A iluminação de ambientes apresenta flutuações no decorrer do período, tanto em ambientes internos como externos, influenciando no processo de análise de imagens. É importante considerar que as pessoas se movimentam livremente, podendo abaixar e esticar os braços, carregar mochilas, bolsas e outros objetos, o que implica em imagens diferentes da mesma pessoa durante todo o percurso na área monitorada. Neste cenário, deseja-se identificar uma pessoa, rastreá-la e contabilizá-la apenas uma vez ao deixar a cena. O sistema desenvolvido é composto por uma câmera de vídeo, responsável pelo monitoramento da cena, e por um computador, que executa um software baseado em técnicas de análise de seqüências de imagens. A técnica adotada consiste na aquisição de seqüências de imagens da cena, detecção de objetos em movimento, identificação de pessoas que se locomovem isoladamente ou em grupo, localização das pessoas na imagem, rastreamento de cada pessoa identificada e contagem após atravessar a região monitorada. A Figura 1.2 fornece uma visão geral do sistema de contagem automática de pessoas. Câmera t1 t2 t3 t4 Imagens Técnicas de Análise de Seqüências de Imagens Resultados da aplicação das técnicas Análise dos resultados Contagem Figura 1.2 : Visão geral do sistema para contagem automática de pessoas.

Capítulo 1 - Introdução 22 Para minimizar os efeitos de oclusão entre as pessoas que se locomovem na cena, sobretudo em locais com grande número de pessoas, o sistema de contagem desenvolvido neste trabalho considera que a câmera de vídeo está instalada em posição ortogonal ao solo. O sistema desenvolvido tem as seguintes características: Alta confiabilidade no processo de detecção de vários objetos móveis, sendo capaz de contabilizar apenas pessoas e desprezar outros objetos que estejam em movimento no campo de visão da câmera; Alta confiabilidade em relação ao número de pessoas presentes na cena, sendo capaz de contabilizar pessoas isoladas ou em grupos. Alta confiabilidade na identificação de pessoas carregando mochila, bolsa ou pacote, utilizando chapéu, boné ou outro acessório; Alta confiabilidade diante dos comportamentos imprevisíveis de pessoas, evitando influência negativa no processo de contagem, como abrir os braços, eventuais paradas no campo de visão da câmera ou passagens rápidas de pessoas na cena; Robusto a pequenas variações na iluminação, sendo capaz de operar em locais com luminosidade reduzida, sem variações bruscas na iluminação; Baixo custo computacional, o qual foi alcançado limitando-se a complexidade do algoritmo desenvolvido para se contar pessoas, o que caracteriza ampla aplicabilidade em diversos setores comerciais e industriais.

Capítulo 1 - Introdução 23 1.2 Justificativa Avanços tecnológicos recentes no estudo e monitoramento do tráfego de pedestres em áreas urbanas evidenciaram a necessidade de se conceber sistemas confiáveis capazes de contabilizar o número de pessoas circulando em uma determinada região, bem como suas correspondentes direções de movimento. Estas informações são bastante úteis para o projeto e controle do fluxo de trânsito, bem como para o estabelecimento do crescimento ordenado dos centros urbanos. Além disso, o problema de contagem de pessoas em uma determinada região é de grande importância em aplicações como planejamento dos serviços fornecidos por cinemas, shoppings e companhias de ônibus. Em muitas situações, principalmente aquelas nas quais o fluxo de pessoas se faz em regiões limitadas, a contagem de pessoas é realizada por meio de sensores fotoelétricos, placas sensíveis ao peso, sensores por infravermelho ou mesmo roletas mecânicas. Entretanto, estes métodos apresentam uma série de limitações (Pádua, F., 2002), no caso dos sensores fotoelétricos, duas ou mais pessoas que atravessam o feixe simultaneamente poderão ser contabilizadas como sendo somente uma pessoa. Além disso, outros objetos móveis que eventualmente atravessarem o feixe poderão ser contabilizados como pessoas. Estes métodos não são capazes de determinar a direção em que as pessoas se movimentam, o que muitas vezes é importante para o monitoramento do fluxo de entrada versus o fluxo de saída de indivíduos no local de interesse. Neste contexto, a análise de seqüências de imagens surge como uma alternativa interessante na correta discriminação e contabilização de indivíduos que estejam caminhando em uma determinada área. Características como diferenciar pessoas de outros objetos, verificar a direção em que as pessoas se deslocam na cena, identificar o número pessoas que se locomovem em grupo e rastreá-las individualmente, justificam o interesse dos pesquisadores pelos sistemas que utilizam câmera de vídeo.

Capítulo 1 - Introdução 24 1.3 Objetivos: geral e específicos O objetivo geral deste trabalho consiste no desenvolvimento de um sistema computacional para contagem automática de pessoas, baseado na análise de seqüências de imagens capturadas por uma câmera de vídeo, instalada em uma região de interesse. Além de publicações relevantes, espera-se que este trabalho possibilite o desenvolvimento de um produto com alto valor agregado que possa ser aplicado em problemas de automação comercial, controle de tráfego urbano e segurança patrimonial. Para tanto, este trabalho perseguiu os seguintes objetivos específicos: Implementação preliminar em Matlab do protótipo do sistema de contagem de pessoas. Nesta fase foram feitas de maneira ágil as implementações necessárias de cada etapa do software, tais como: detecção de objetos em movimento; identificação e localização de pessoas; implementação do filtro preditivo de Kalman (Kalman, E.,1960), que possibilitou o rastreamento e a contagem das pessoas ao deixaram a cena. Realização de uma ampla bateria de experimentos com cenas reais buscando-se avaliar a exatidão e a escalabilidade da técnica; Desenvolvimento do software na linguagem de programação C#, de forma que o sistema de contagem implementado seja utilizado em aplicações em tempo real; Realização de experimentos com cenas internas e externas, utilizando-se o sistema implementado na linguagem C# em situações críticas simuladas de forma a avaliar a escalabilidade e a eficiência do sistema.

Capítulo 1 - Introdução 25 1.4 Contribuições A principal contribuição deste trabalho consiste no desenvolvimento e implementação de uma técnica com baixo custo computacional e baixo custo financeiro para a estimação do fluxo multidirecional de pessoas em ambientes internos ou externos, baseada em diversas ferramentas para processamento e análise de imagens. As características do sistema de contagem desenvolvido fazem com que o mesmo seja o protótipo de um produto tecnológico com alto valor agregado para aplicação em diversos problemas de automação comercial, controle de tráfego urbano e segurança patrimonial. 1.5 Organização do Texto Esta dissertação está organizada em 6 capítulos, os quais são descritos a seguir: No capítulo 1 é feita a introdução ao assunto com a caracterização do problema, justificativa e objetivos deste trabalho, destacando sua importância e contribuições no campo tecnológico e comercial. No capítulo 2 são mostrados os trabalhos relacionados encontrados na literatura para identificação de pessoas em análise de seqüências de imagens e contagem de pessoas, os quais são apresentados em ordem cronológica. No capítulo 3 é descrita a fundamentação teórica com os principais métodos de segmentação de imagens e rastreamento de pessoas que possibilitaram o desenvolvimento do sistema proposto.

Capítulo 1 - Introdução 26 No capítulo 4 é apresentada a técnica de contagem automática de pessoas utilizada, com a descrição de cada etapa do sistema. No capítulo 5 são relatados os experimentos realizados com o sistema desenvolvido na linguagem C# e analisados os resultados. No capítulo 6 é apresentada a conclusão do trabalho, mostrando as vantagens, a aplicabilidade comercial do sistema e sugestões para trabalhos futuros.

Capítulo 2 Trabalhos Relacionados Este capítulo apresenta uma revisão bibliográfica sobre os principais trabalhos relacionados com o problema de contagem de pessoas. A literatura sobre técnicas de contagem de pessoas abrange diversos tipos de técnicas, de acordo com o método utilizado para se estimar fluxos de pessoas, tais como aquelas baseadas no uso de câmera de vídeo, sensor fotoelétrico e sensor de pressão (Pádua, et al., 2003), como ilustrado na Figura 2.1. Entretanto, tem-se observado a crescente proposição de novas abordagens, baseadas em técnicas de análise de seqüências de imagens da cena onde se deseja estimar o fluxo de pessoas. Tais abordagens fazem uso de conceitos e ferramentas computacionais comumente associadas à área de pesquisa conhecida como Visão Computacional. O presente trabalho de pesquisa propõe uma abordagem para contagem de pessoas que se enquadra no conjunto que utiliza câmera de vídeo para capturar as imagens da área que se deseja estimar o fluxo de pessoas. Para melhor organização os trabalhos pesquisados foram separados em três grupos principais: baseados em câmera de vídeo, sensor fotoelétrico e sensor de pressão. SISTEMAS PESQUISADOS PARA CONTAGEM DE PESSOAS Grupo 1 Baseado em Câmera de Vídeo Grupo 2 Baseado em Sensor Fotoelétrico Grupo 3 Baseado em Sensor de Pressão Figura 2.1: Grupos de sistemas pesquisados para contagem de pessoas.

Capítulo 2 - Trabalhos Relacionados 28 2.1 Sistemas com Câmera de Vídeo No Grupo 1 os sistemas utilizam técnicas baseadas em análise de seqüências de imagens, o que representa a tendência nas pesquisas para estimar o fluxo de pessoas, devido às vantagens apresentadas em relação aos outros métodos. Os sistemas desse grupo são constituídos por uma ou várias câmeras, um computador e um software que analisa as seqüências de imagens capturadas. É importante ressaltar que os sistemas deste grupo não requerem a instalação de uma infra-estrutura física no local de passagem das pessoas, requerem apenas a instalação adequada da câmera para obter um bom campo de visão da área de interesse. O presente trabalho se enquadra no Grupo 1, um sistema de contagem robusto, capaz de diferenciar pessoas de outros objetos, identificar o número pessoas que se locomovem em grupo, rastreá-las separadamente e contabilizá-las ao deixar a cena monitorada por uma câmera de vídeo. Em (Teixeira e Savvides, 2007) é proposto um sistema para localização e contagem de pessoas em áreas internas, baseado no movimento e dimensões das pessoas. Um histograma mostra o movimento de objetos que foram detectados utilizando o método da diferença de quadros da cena. O sistema é robusto a flutuações de intensidade dos pixels, a variações graduais de iluminação e ao reposicionamento de objetos na cena. O sistema de contagem de pessoas foi implementado com múltiplas de câmeras ligadas em rede e calibradas de acordo com a área de captura de cada câmera. Alterações abruptas de iluminação podem causar detecções falsas, mas que desaparecem nos quadros seguintes. As Figuras 2.2 e 2.3 ilustram a área monitorada e a estrutura do histograma.

Capítulo 2 - Trabalhos Relacionados 29 célula b - célula b + 1 Células como localização discreta na imagem. Células no histograma. Figura 2.2: Estrutura do histograma, composta de múltiplas células definidas sobre a área da imagem. Fonte: Figura adaptada de Teixeira e Savvides, 2007. Pessoa detectada Posição de pico Histograma Mapeamento de pixel por célula Imagem Figura 2.3: Posições detectadas da imagem em movimento. Cada pixel da imagem é mapeado em uma ou mais células do histograma. Fonte: Figura adaptada de Teixeira e Savvides, 2007. Em (Jeon e Rybski, 2006) é proposto um sistema que determina o número de pessoas presentes em uma sala. Em um dado intervalo de tempo as posições das faces de pessoas são localizadas, por um detector de face, que baseado em estatísticas determina o número de pessoas presentes num encontro. Experimentos mostraram que a presença de ruído na detecção das faces resulta em falsas faces, e mesmo uma imagem de face real com características diferentes pode ser confundida com um ruído, o que torna as análises das imagens muito difíceis.

Capítulo 2 - Trabalhos Relacionados 30 Em (Zhao e Shibasaki, 2005) é proposto um sistema de monitoramento e rastreamento de pedestres, que utiliza câmeras de vídeo e uma rede de sensores composta por scanners a laser. Um modelo de pedestre caminhando na seção horizontal ao nível do solo é definido para um algoritmo de rastreamento, desenvolvido para detectar e traçar o ritmo do movimento dos pés capturados pelo scanner laser, como mostrado na Figura 2.4. Os dados das trajetórias dos pedestres são projetadas em vídeos e atributos como altura, cor de roupa, faces dos pedestres podem ser extraídas da imagem. Experimentos mostram que o sistema é eficiente no rastreamento mesmo com aglomerações de pessoas, mas não contabiliza o número de pessoas na cena. Pés agrupados Pontos de laser Trajetória Campo de visão Scanners Contador de trajetórias Trajetória (a) Dados do plano de fundo (b) Figura 2.4: (a) e (b) Trajetórias de pedestres obtidas com scanner laser projetadas em imagem de vídeo. Fonte: Figura adaptada de Zhao e Shibasaki, 2005. Em (Kong, Gray e Tao, 2005) é apresentado um sistema, utilizando redes neurais artificiais, para contar pedestres na multidão utilizando uma única câmera. O método é baseado na subtração do plano de fundo, em seguida detecção do contorno dos objetos e histogramas com o tamanho dos blobs (contorno ao redor cada objeto detectado). O sistema é treinado antes de entrar em operação num campo de visão fixa, para detectar e estimar o número de pedestres, na área delimitada pelo campo de visão da câmera. Experimentos preparados em diferentes locais e com câmeras diferentes demonstraram resultados corretos compatíveis com a realidade do treinamento do sistema, como ilustrado na Figura 2.5. A relação entre o que é mostrado no histograma e o número de pedestres na multidão é obtida através dos dados

Capítulo 2 - Trabalhos Relacionados 31 armazenados no treinamento da rede neural, restringindo a sua aplicação a áreas em que foram previamente realizados os treinamentos. (a) (b) ( c) (d) Figura 2.5: (a) Imagem original; (b) Imagem com objetos detectados; ( c) Mapa com contornos do plano de fundo; (d) Mapa com contornos dos objetos detectados. Fonte: Kong, Gray e Tao, 2005. Em (Bhuvaneshwar e Mirchandani, 2004) é proposto um sistema de detecção de pedestres num cruzamento, em tempo real, para controle adaptativo do sinal de trânsito, usando uma câmera fixa. Primeiramente são detectados os objetos móveis na imagem, utilizando a técnica de subtração do plano de fundo com limiarização, binarização da imagem e aplicação de filtros para suprimir ruídos. Para retirar as sombras dos objetos é utilizado um histograma com a projeção de cada objeto. Em seguida, veículos e outros objetos são diferenciados de pedestres comparando a altura e área de cada retângulo gerado envolvendo um objeto detectado, como mostra a Figura

Capítulo 2 - Trabalhos Relacionados 32 2.6(c). Informações sobre tamanho e coordenadas de cada componente são utilizadas para computar o número de pessoas na cena. O sistema mostrou eficiência no monitoramento do fluxo de pedestres e veículos em cruzamentos e aplicações em prevenção de acidentes de trânsito. (a) (b) (c) PEDESTRES LIMIAR SOMBRA (d) Figura 2.6: (a)imagem binária com sombra; (b) Imagem binária com remoção de sombra; (c) Pedestres detectados; (d) Histograma com projeção vertical da imagem. Fonte: Figura adaptada de Bhuvaneshwar e Mirchandani, 2004. Em (Pádua et al., 2003) é proposto um sistema de visão baseado no cálculo de campos de Fluxo Ótico para se estimar os movimentos de pedestres presentes na cena monitorada e pela comparação de suas dimensões corporais, tais como distância entre ombros e profundidade do tórax, com os correspondentes valores médios usados por engenheiros de transporte. O sistema proposto é bastante susceptível às variações de luminosidade da cena, é incapaz de rastrear os movimentos das pessoas e possui sua aplicação restrita a fluxos unidirecionais.

Capítulo 2 - Trabalhos Relacionados 33 Em (Ramanan e Forsyth, 2003) é apresentada uma técnica para rastrear pessoas em longas seqüências de imagens. O sistema procura encontrar pessoas e definir sua trajetória de forma independente do fundo, podendo inclusive conter outros objetos que se movimentem na região monitorada, e que não são confundidos com as pessoas que foram detectadas. O método é baseado em um modelo gráfico probabilístico para identificar a configuração de corpos nos primeiros quadros da seqüência de imagens, como ilustrado na Figura 2.7. O método procura prováveis segmentos do corpo e os agrupa, de forma a encontrar configurações que representem o corpo de uma pessoa e pareçam similares com o passar do tempo. Grupos que tenham dinâmica improvável são excluídos. O sistema consegue detectar uma pessoa mesmo que parte do corpo esteja em oclusão com outro objeto, sendo muito eficiente, mas não realiza a contagem de pessoas na cena. Figura 2.7: Seqüência de imagens contendo múltiplos objetos em movimento, com oclusões parciais dos objetos. Fonte: Ramanan e Forsyth, 2003. Em (Siebel, 2003) é apresentado o desenvolvimento de um sistema visual de segurança para uma estação de metrô, com rastreamento automático de pessoas, utilizando uma câmera para capturar as imagens em tempo real. A aplicação Reading People Tracker, que faz parte do projeto ADVISOR, consiste na combinação de quatro módulos operando em conjunto para detecção e rastreamento de pessoas. Os módulos Detector de Movimento, Rastreador de Regiões, Detector de Cabeças e Rastreador de Formas Ativas são interligados de modo a reduzir a complexidade para detecção e rastreamento das pessoas,

Capítulo 2 - Trabalhos Relacionados 34 como mostrado na Figura 2.8. Experimentos mostraram que o sistema de rastreamento individual é robusto em situações de oclusão, como ilustrado na Figura 2.9. Não contabiliza o número de pessoas no local. Imagem de Vídeo Detector de Movimento Rastreador de Regiões Saída Rastreada Detector de Rastreador de Cabeças Formas Ativas Figura 2.8: Estrutura do sistema de detecção e rastreamento de pessoas. Fonte: Figura adaptada de Siebel, 2003. (a) (b) Figura 2.9: Seqüência de quadros com rastreamento em uma estação de metrô. Fonte: Siebel, 2003. Em (Kim et al., 2002) é descrito um método de implementação para um sistema de contagem de pessoas que detecta e rastreia pessoas em movimento, usando uma única câmera fixa a uma porta de um edifício. A câmera de vídeo é colocada ortogonalmente ao piso para minimizar o problema

Capítulo 2 - Trabalhos Relacionados 35 de oclusão, como mostrado na Figura 2.10. O método consiste em detectar objetos na área monitorada pela subtração do plano de fundo da cena, binarização da imagem-diferença e aplicação de filtros de erosão e dilatação, para eliminar ruído. Utiliza a técnica de estimação (Convex Hull Approximation) que analisa uma área de fronteira retangular, em torno da imagem de cada pessoa na cena atual. Estima a imagem na área do retângulo na próxima cena e verifica se a pessoa está na área analisada, permitindo rastrear pessoas mesmo quando suas imagens são parcialmente sobrepostas. A atualização dinâmica do plano de fundo, quando não há objeto movendo-se na cena, minimiza problemas de variação de iluminação. Experimentos mostram que o sistema é eficiente no rastreamento e na contagem de pessoas, obtendo acerto de 96% operando com 10 quadros por segundo, operando apenas em fluxo unidirecional. Figura 2.10: Imagem capturada por câmera colocada ortogonalmente ao piso. Fonte: Kim et al., 2002. Em (Masoud e Papanikolopoulos, 2001) é apresentado um sistema para rastrear pedestres em tempo real, utilizando uma câmera de vídeo. O sistema foi desenvolvido para uma aplicação de controle de tráfego de pedestres em cruzamentos, para melhorar a segurança e eficiência no trânsito. A técnica utilizada baseia-se na subtração do plano de fundo da cena. Na imagem resultante são gerados retângulos envolvendo os objetos detectados, que são associados a cada objeto que se move na cena. Para cada objeto no campo de visão da câmera o sistema informa a localização e a velocidade ao longo da

Capítulo 2 - Trabalhos Relacionados 36 trajetória. O sistema assume que todos os objetos na cena são pedestres, o que significa que um objeto pode também ser rastreado como pedestre, e não realiza a contagem dos pedestres. Resultados experimentais demonstraram que o sistema é capaz de manter o rastreamento em diferentes situações difíceis como oclusões parciais ou totais de pedestres, como mostrado na Figura 2.11. O sistema apresentou em média 95% de eficiência. Figura 2.11 : Seqüência de rastreamento de pedestres em diferentes situações de oclusões. Fonte: Masoud e Papanikolopoulos, 2001.

Capítulo 2 - Trabalhos Relacionados 37 Em (Lu e Tan, 2001) é proposto um sistema para rastreamento de pessoas baseado em histograma da imagem, com análise do comportamento dos pixels, efetuada através da diferença do movimento ou da similaridade entre eles. O processo se baseia nos pixels que se modificaram da imagem anterior para a imagem atual, verificado no histograma relativo a cada uma das imagens. É gerado um retângulo envolvendo cada objeto móvel. Se uma determinada pessoa já foi previamente localizada o novo retângulo definido para ela é eliminado, e o antigo é mantido. Resultados experimentais mostram eficácia do sistema para localizar e rastrear pessoas em movimento, mesmo em situações de oclusões, determinando o número de pessoas no grupo e mantendo o rastreamento individual das pessoas. Em (Garcia et al., 2000) é apresentado um sistema com câmera de vídeo e sensores de pressão, utilizando um arranjo bidimensional de células independentes, sensíveis à pressão. Através desse arranjo são obtidas imagens digitais das pegadas inteiras ou parciais, das pessoas que caminham sobre essa superfície. O número de pessoas é estimado fazendo a análise das imagens, incluindo a verificação nas variações na forma das pegadas, os tamanhos de pés, o peso da pessoa, a direção e a velocidade, o que torna o sistema complexo com alto custo computacional. Em (Beymer e Konolige,1999) é apresentada uma abordagem baseada em visão estéreo para rastrear e contar pessoas, podendo determinar o volume de objetos no primeiro plano da cena. A técnica se baseia em detectar, na imagem, volumes que correspondam à cabeça e tronco de uma pessoa adulta e rastreá-los através da região monitorada, utilizando um modelo de filtro de Gauss e filtro de Kalman. A utilização de chapéu, mochila, ou qualquer outro acessório pode afetar a determinação do volume da cabeça ou do tronco das pessoas, provocando erros na contagem de pessoas. O sistema apresentou em média 98,6% de exatidão na contagem. A utilização de imagem estéreo eleva o custo computacional do sistema.

Capítulo 2 - Trabalhos Relacionados 38 Em (Kettnaker e Zabih, 1999) é apresentado um sistema que utiliza múltiplas câmeras de vídeo para contar pessoas que passam por corredores em ambientes fechados. As câmeras de vídeo são colocadas em pontos estratégicos nos corredores, para dar seqüência ao campo de visão, sem sobrepor as imagens das câmeras, como mostrado na Figura 2.12. A técnica se baseia na subtração do plano de fundo da cena de interesse para detecção dos objetos que se movem na cena. Para evitar que uma pessoa seja contabilizada duas ou mais vezes é utilizada a informação da cor das roupas das pessoas, que determina quando uma mesma pessoa saiu do campo de visão de uma câmera de vídeo e entrou no campo de visão de outra câmera, o que torna o sistema muito sensível à variação da iluminação dos corredores. O sistema demonstrou eficiência em aplicações em diferentes locais, mas a utilização de várias câmeras de vídeo dificulta o processo e gera alto custo computacional. (a) (b) Figura 2.12: (a) e (b) Esquema de rastreamento em uma situação com 4 câmeras. Fonte: Kettnaker e Zabih,1999. Em (Haritaoglu, 1998) é implementado um sistema para estimação da postura do corpo humano e de partes do corpo utilizando imagens monocromáticas. Constrói-se a silhueta do corpo baseado em um modelo de corpo humano com postura genérica, que possibilita localizar partes do corpo, como mostrado na Figura 2.13. Analisa-se a postura do corpo da pessoa para computar as similaridades entre os histogramas de projeção horizontal e vertical da silhueta e posturas principais pré-determinadas. Será tomada como a postura estimada da pessoa a que tiver maior similaridade com a silhueta detectada na imagem. Em seguida, um algoritmo é aplicado para encontrar

Capítulo 2 - Trabalhos Relacionados 39 possíveis partes do corpo no contorno da silhueta. A localização da cabeça é estimada através do eixo principal, dos vértices da silhueta e também pela postura estimada. Figura 2.13: Exemplos de modelos de silhueta usados para localizar partes do corpo em diferentes ações. Fonte: Haritaoglu,1998. De posse desta localização, uma análise é realizada para eliminar vértices do contorno que não representam partes do corpo e para mapear aqueles que representam partes do corpo de acordo com uma ordem topológica específica. Para separação do primeiro plano da imagem do fundo utiliza a técnica de limiarização e filtro mediana que é aplicado aos valores dos pixels durante alguns segundos no vídeo. Analisa-se o número de vezes que um determinado pixel foi classificado como pertencente ao fundo e ao primeiro plano, e o número de quadros desde a última vez que um pixel recebeu a classificação de primeiro plano. Na medida em que um pixel for classificado muitas vezes como fundo ou primeiro plano, diferentemente de sua última classificação, esta será atualizada. Experimentos mostraram robustez do sistema para aplicações em tempo real, podendo obter melhores resultados se as sombras forem removidas da silhueta do corpo. Em (Schofield et al.,1997) é proposto um sistema de contagem automática de pessoas paradas à espera do elevador, com o objetivo de