Antonio Scuri
scuri@tecgraf.puc-rio.br
Tecgraf / PUC-Rio
2512-5984 ram 116
3as e 5as de 16:00h às 18:00h na sala 214L.
Apresentar os conceitos básicos de processamento de imagem e vídeo digitais. Desenvolver e prototipar rotinas de processamento enfocando suas aplicações na área de sistemas.
Em outras palavras, o foco central do curso é em implementação com embasamento teórico de processamento de imagens.
O curso qualifica o aluno de Sistemas de Informação na especificação e implementação de sistemas de processamento de imagens.
Conceitos Básicos: Imagem, Vídeo e Som Digitais.
Captura e Reprodução
Armazenamento e Representação.
---------------------------------------------------------------
Classes de Operações, Análise Quantitativa versus Qualitativa.
Técnicas de Implementação.
---------------------------------------------------------------
Transformações Geométricas.
Quantização, Dithering.
Histograma e Estatísticas
---------------------------------------------------------------
Operações Pontuais Unárias e Binárias:
Op Unárias como Gráfico de Entrada e Saída
Binarização, Negativo, Brilho, Contraste
Op Aritméticas, Op. Lógicas,
Op. Adaptativas,
Fusão, Composição, Subtração e Remoção de Fundo,
Equalização do Histograma,
Processamento de Cor HSI.
---------------------------------------------------------------
Introdução à Transformada de Fourier.
Filtragem Espacial e na Freqüência:
Não Lineares
Suavização, Detecção de Bordas, Realce de Bordas
Operações Morfológicas.
---------------------------------------------------------------
Outras Transformadas de Domínio:
Hough, DCT, Wavelets.
Compressão:
RLE, Huffman, JPEG.
---------------------------------------------------------------
Restauração. Extração de Atributos.
INF1338 - TÓP. ESP. EM INFORMÁTICA - COMPUTAÇÃO GRÁFICA
Todos os trabalhos são programas em C/C++. Deve ser entregue o código fonte, o executável e um documento decrevendo a arquitetura interna com um resumo dos resultados. Veja em "Guia para Entrega dos Trabalhos" como proceder. Para cada dia de atraso 1 ponto é descontado. A data de entrega segue abaixo.
T = (T1 + T2 + T3 + T4 + 4*TF)/8
T >=5
Agosto | Setembro | Outubro | Novembro | ||||
---|---|---|---|---|---|---|---|
06 | Apresentação e Discussões | 03 | Transformações Geométricas | 01 | T. de Fourier - Entrega T3 | 05 | Compressão |
08 | Revisão de Conceitos Básicos | 05 | Quantização - Entrega T1 | 03 | Filtragem Espacial | 07 | Restauração. Ext. de Atributos |
13 | Revisão de Conceitos Básicos | 10 | Quantização | 08 | Análise T3 | 12 | Atendtimento TF |
15 | Resolução Temporal | 12 | Laboratório IMLAB | 10 | Estudos de Caso de Filtragem | 14 | Atendtimento TF |
20 | Captura e Reprodução | 17 | Análise do T1 | 15 | Feriado | 19 | Apresentação - TF |
22 | Armazenamento e Representação | 19 | Op. Pontuais - Entrega T2 | 17 | Discussões TF - Entrega T4 | 21 | Apresentação - TF |
27 | Classes de Operações | 24 | Op. Pontuais | 22 | Filtragem Fourier | ||
29 | Técnicas de Implementação | 26 | Dithering, Análise T2 | 24 | Op. Morfológicas | ||
29 | Outras Transformadas | ||||||
31 | Palestra prof Sidnei |
- Jonas Gomes e Luiz Velho; Computação Gráfica: Imagem; IMPA; 1994; ISBN 85-244-0088-9
- Raphael C. Gonzalez e Richard E. Woods; Processamento de Imagens Digitais; Edgar Blucher; 2000; ISBN 8521202644
- Hugo Vieira Neto e Oge Marques Filho; Processamento Digital de Imagens; BRASPORT; 1999; ISBN 8574520098
Painterly Rendering
Vídeo
Mosaics
High Dynamic Range
General Image Processing
(Obs: Os artigos aqui postados são para uso exclusivo dos alunos do curso. Para acesso à varios desses artigos é necessário uma conta válida na ACM. Internamente na PUC isso é possível atravéz do portal da ACM http://portal.acm.org.)
Todos os sistemas a seguir possuem código aberto e podem ser pegos pela rede. Selecionamos apenas os sistemas cujo desenvolvimento ainda permanece ativo (ou quase) e são ricos em funcionalidade.
Nome Última Atualização Status Image Comentários URL IMLab 1.2 2002/10 App Byte,Int,
Real,Cpx -
RGB, Grayem C/C++, primeira versão, Linux/Win/SGI/Sun/IBM http://www.tecgraf.puc-rio.br/~scuri/imlab ImageJ 1.2 2002/08 App+SDK Byte,Int, Real,RGB - Stacks em Java, vem do NIH Image, sistema completo para análise, aceita plugins http://rsb.info.nih.gov/ij/ ImageTool 3.0 2002/05 App+SDK Byte,Int,RGB - Stacks em Borland C++, sistema completo para análise, aceita plugins http://ddsdx.uthscsa.edu/dig/ GIMP 1.3 2002/08 App+SDK Byte -
RGBA, GrayAem gtk, mas originalmente para UNIX, sistema para edição de images, aceita plugins http://www.gimp.org/ MegaWave 2.10 2002/02 App+Lib Byte,Real -
RGB, Gray - MoviesFrancês, UNIX, bons recursos, bem escrito http://www.cmla.ens-cachan.fr/Cmla/Megawave/
ImageKitchen 0.3 2002/01 App Byte -
RGBA, GrayALinux/Win, organização confusa, Lua, inativo recentemente http://www.distantfocus.com/projects/imagekitchen/ Magic 4.0 2002/06 Lib Byte,Int,Real -
RGB, GrayWin/Mac/Linux/SGI, muito bem escrito, bem organizado, mais restrito http://www.magic-software.com/ XITE 3.4 2002/08 Lib Byte,Int, Real,Cpx -
RGB, GrayOSLO, X-Windows, muito rico em rotinas, código fácil de entender http://www.ifi.uio.no/~blab/Software/Xite/ OpenCV 2.1 2001/11 Lib Byte,Int,Real -
RGB, Grayda Intel, quase 1 ano sem atualizações, Linux/Win http://www.intel.com/research/mrl/research/opencv/
http://sourceforge.net/projects/opencvlibrary/Vision SDK 1.2 2000/05 Lib Byte,Int,Real -
RGB, Grayda Microsoft, apenas para constar, já não é atualizado a 2 anos http://research.microsoft.com/VisionSDK/
http://msdn.microsoft.com/library/en-us/dnvissdk/html/vissdk.asp
Nome | Última Atualização | Status | Image | Comentários | URL |
---|---|---|---|---|---|
VirtualDub 1.4 | 2002/08 | App+SDK | Byte - RGBA | em C++, Apenas Windows, muitos recursos, processa apenas vídeo, apenas monta o som | http://www.virtualdub.org/ |
Image Processing for Computer Graphics - Luiz Velho - http://www.visgraf.impa.br/Courses/ipcg.html - IMPA (voltado para problemas de Computação Gráfica)
Processamento Digital de Images - Sidnei Paciornik - http://www.dcmm.puc-rio.br/cursos/ipdi/ - DCMM/PUC-Rio (o objetivo final do curso é Análise de Imagens, voltado para Aplicações)
Visão Computacional - Raul Feitosa - http://www.ele.puc-rio.br/~visao/2002.2/ - ELE/PUC-Rio (voltado para Reconhecimento de Padrões)
última atualização - 01 de novembro de 2002 - scuri