César Palomo

INF 2064 - Visão Computacional e Realidade Aumentada
Professor Marcelo Gattass
2º semestre 2007

César Palomo
Departamento de Informática - PUC-Rio
cpalomo @ inf . puc-rio . br

Esta página será constantemente atualizada durante o curso. Última aualização: 12/12/07

Site do curso

http://www.tecgraf.puc-rio.br/~mgattass/ra/ra.html

Descrição

Neste site estão disponíveis os trabalhos realizados para a disciplina de Pós-Graduação de Visão Computacional e Realidade Aumentada, ministrada pelo professor Marcelo Gattass.

Abaixo pode ser visto um resumo do tema de cada trabalho. Para ter acesso ao código fonte, binários e maiores detalhes teóricos sobre cada um deles, utilize o menu ao lado.

Trabalho 1 - Segmentação de fundo estático de um vídeo

O intuito deste trabalho foi familiarizar-se com a biblioteca de visão computacional criada pela Intel chamada de OpenCV, que será usada ao longo do curso.

A partir de um stream de vídeo de entrada (vindo a partir de um arquivo ou de uma webcam), foi feita a segmentação do fundo em relação aos objetos dinâmicos da cena. Deste modo, o programa é capaz de detectar os objetos em movimento ao longo do vídeo.

Nesta segmentação, o fundo identificado pelo programa é mostrado em preto, enquanto os objetos dinâmicos da cena aparecem em branco.

Para diminuir o ruído, aplicaram-se filtros de ruído Erode e Dilate. Além disso, após a segmentação do fundo, houve uma tentativa de identificação de contornos ativos com o uso de funções disponíveis no OpenCV. Apesar do resultado desta tentativa não ter sido bom devido ao alto ruído dos vídeos de entrada, exercitou-se o uso da biblioteca.

Trabalho 2 - Calibração de câmera

O intuito deste trabalho foi realizar a calibração de uma câmera a partir de um padrão colocado na cena capturada.

A partir de um stream de vídeo de entrada (vindo a partir de um arquivo ou de uma webcam), inicialmente são encontrados os cantos internos de um tabuleiro de xadrez de dimensões conhecidas.

Depois disso, utilizando o método de Tsai de calibração de câmeras, foram encontrados os parâmetros intrínsecos e extrínsecos da câmera.

Com posse destes dados, foi feita a inserção de objetos virtuais na cena em cima do tabuleiro de xadrez original.

Trabalho 3 - Foto 3D

O intuito deste trabalho foi aplicar a técnica de Fotografia 3D para reconstrução de um modelo de um objeto, utilizando-se de fotos 2D obtidas de diversas orientações do objeto desejado.

O setup utilizado, composto de 2 câmeras para obtenção de um par estéreo de fotos, e de um projetor responsável pela projeção da codificação de cores BCSL, proposto por Asla Medeiros Sá em sua tese de doutorado, permitiu a identificação de faixas de transição de cores.

Depois, a partir de correspondência de pontos de transições horizontais e verticais, foi usada geometria epipolar para encontrar informação de profundidade a partir do par estéreo.

Por fim, usou-se o algoritmo ICP para alinhamento das nuvens de pontos das várias vistas do objeto, e obteve-se uma malha de triângulos para finalizar a reconstrução do objeto desejado.